




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人工智能之自然语言理解第1页,共15页,2023年,2月20日,星期日摘要自然语言理解现在己成为人工智能研究中最活跃的领域之一。在自然语言处理的研究中,最有希望的应用领域之一是自然语言接口。计算机对自然语言中的查询语言理解的正确程度是自然语言接口质量好坏的关键。本文基于建立通用模型的概念,设计了一个通用的数据库自然语言接口系统模型,深入地研究了实现该模型的原理,同时建立了一个具体的实现系统,并希望该系统很容易地移植到其他应用领域。第2页,共15页,2023年,2月20日,星期日绪论:研究情况和发展趋势;研究的目的和意义第一章:数据库汉语通用接口模型及其知识库的构造第二章:词语切分与词性标注软件系统的研究第三章:查询句语义自动分析与中间语言生成的研究第四章:产生程序语句及应答生成的研究人工智能目录总结与展望第3页,共15页,2023年,2月20日,星期日第一章第二章第三章第四章自然语言处理NLP(NaturalLanguageProeessing)是研究如何能让计算机理解和生成人们日常使用的语言(如汉语、英语等),使得计算机懂得自然语言的含义,并对人们给计算机提出的问题,通过对话的方式,用自然语言进行回答。在自然语言处理的研究中,最有希望的应用领域之一是自然语言接口。所谓自然语言接口就是允许人们用某种自然语言的子集在限制领域内同计算机进行通讯。数据库自然语言接口是人工智能与数据库技术相结合的产物,涉及到人工智能、自然语言处理、数据库技术、人机接口等方面的研究。随着计算机语音识别技术的逐步趋向实用,人们越来越希望通过自然语言直接与计算机进行沟通。因此,人们非常希望有一种方便的数据库人机界面,以便更好地查询数据库。绪论人工智能第4页,共15页,2023年,2月20日,星期日目的和意义【绪论】我们知道,目前所用的人机接口大多是以窗口、菜单为主的图形用户接口GUI。这种接口简洁、直观,用户只用鼠标点击以及少量的键盘操作就能从数据库中获取所需的信息。但我们会发现有些问题是无法或难以用这种方式表达的,例如“找出明年退休的所有教师”;再者,随着计算机语音识别技术的逐步趋向实用,人们越来越希望通过自然语言直接与计算机进行沟通。因此,人们非常希望有一种方便的数据库人机界面,以便更好地查询数据库。但通用的自然语言理解往往是低效的和难以实现的,而作为数据库人机接口的自然语言界面具有语用目的单一、用词范围有限等特点,在数据库查询意义上实现自然语言理解是完全可行的。第5页,共15页,2023年,2月20日,星期日优势【绪论】与数据库系统本身提供的形式化查询语言(如SQL)相比,用自然语言查询数据库的优势在:(l)用户只以应用领域的概念访问数据库,无需了解数据库的逻辑和存储结构;(2)用户不需要或者只需要很少的培训就能够直接查询数据库信息,大大减轻了用户的培训负担(3)用户可以简单明了地提出查询请求‘川,比如若要在人事信息库中查找年龄最大的人,用形式化查询语言就有些麻烦,不如“年龄最大”表述简洁。第6页,共15页,2023年,2月20日,星期日绪论第一章第二章第三章第四章数据库汉语通用接口模型及其知识库的构造:要使计算机理解汉语自然查询语言,先必须构造一个系统模型。本文的模型是将汉语自然查询语言的计算机理解与知识库分开各自独立进行设计。理解部分分为词法分析、句法分析与语义分析、自然语言转中间语言、中间语言转计算机语言、应答生成几个相对独立模块。知识库部分从一般到特殊又分为三个层面,即自然语言理解通用知识库、汉语查询句理解知识库和应用领域专用知识库。这样模型设计使系统抛开具体应用领域而独立设计,便于系统的移植和扩充。第一章人工智能第7页,共15页,2023年,2月20日,星期日第8页,共15页,2023年,2月20日,星期日绪论第一章第二章第三章第四章词语切分与词性标注软件系统的研究:基于统计和基于规则是自然语言理解的两大基本方法。本部分结合使用统计和规则设计并实现了一个对通用的汉语自然语言进行词语切分和词性标注子系统。重点研究了切分歧义的发现和消除、人名的识别等几个部分,提出了先用基于词典的最大匹配法匹配出最长词和次长词,然后用检测跨段的方法发现切分歧义,其次判断出切分歧义类型,最后根据切分歧义类型的不同分别进行切分歧义的消除一套有效方法。第二章人工智能第9页,共15页,2023年,2月20日,星期日第10页,共15页,2023年,2月20日,星期日绪论第一章第二章第三章第四章查询句语义自动分析与中间语言生成的研究:本部分对应模型中的句法分析与语义分析、自然语言转中间语言两个模块。在句法分析中研究了查询句指代消解和省略补充规律和程序实现算法;在语义分析中深入研究了汉语查询句语义形式,提出了查询目标的三层结构,查询条件的分类组合;同时给出了中间语言结构形式;在自然语言转中间语言模块给出了具体的转换算法。第三章人工智能第11页,共15页,2023年,2月20日,星期日绪论第一章第二章第三章第四章产生程序语句与应答生成的研究:本部分对应模型中的中间语言转程序语句、应答生成两个模块。三个层面的查询目标的中间语言结构是不同的,中间语言转程序语句模块给出了它们的实现算法,直接查询目标和查询条件的中间语言分别转换为SQL语句的SELECE子句和WHERE子句,该模块实现程序输出结果为回答用户目标。应答生成模块根据查询句和回答用户目标,模拟人回答问题的习惯,生成答句,完成一次人机问答的处理过程。第四章人工智能第12页,共15页,2023年,2月20日,星期日总结本文是基于建立通用模型的思想,构造了一个通用的数据库自然语言接口系统模型,研究了实现该模型的原理,建立了一个具体的实现系统,并希望该系统较容易地移植到其他应用领域。通过对汉语自然语言数据库接口系统的研究,本文设计并建立了一套汉语查询语言的理解和应答生成系统。创新如下:1.构造了一个程序设计与知识库相分离的通用的数据库自然语言接口系统模型。2.构造了一套即适合查询语言语义表示又利于转换计算机执行语句的中间语言,并给出了自然语言转中间语言的处理转换算法。人工智能第13页,共15页,2023年,2月20日,星期日展望1.将本系统与语音识别系统衔接,改进为口语对话系统
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 物业巡查风险识别与管理控制考核试卷
- 广州市车联网先导区建设总体技术规范
- 2005年全国出版专业资格考试理论与实务真题学习资料
- 西藏日喀则市南木林高级中学2017-2018学年高二第二学期期中考试历史试卷
- 四年级数学下册 5 三角形第6课时 多边形的内角和配套教学设计 新人教版
- 活动三《纸桥承重》(教学设计)-2023-2024学年五年级上册综合实践活动沪科黔科版
- 高中历史 第5单元 烽火连绵的局部战争 第3课 中东问题的由来与发展教学设计 新人教版选修3
- 银行案件警示教育课件
- 七年级数学上册 第1章 有理数1.2 数轴、相反数和绝对值第1课时 数轴教学设计 (新版)沪科版
- 感谢培训班老师
- 江苏省2024年中职职教高考文化统考烹饪专业综合理论真题试卷
- (2024年)知识产权全套课件(完整)
- 入团志愿书(2016版本)(可编辑打印标准A4) (1)
- 磁共振图像质量控制ppt课件
- SMI发展历史简介
- 路基防护喷播植草挂网客土喷播植草施工作业指导书ztzyzd06
- 钢笔字练习模板
- 柠檬茶项目财务数据分析(参考范文)
- 预制渡槽吊装施工方案_图文
- 国家开放大学《会计学概论》章节测试参考答案
- 小升初个人简历表
评论
0/150
提交评论