自然语言处理的现状与未来教学课件_第1页
自然语言处理的现状与未来教学课件_第2页
自然语言处理的现状与未来教学课件_第3页
自然语言处理的现状与未来教学课件_第4页
自然语言处理的现状与未来教学课件_第5页
已阅读5页,还剩98页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

自然语言处理的现状与未来李生哈尔滨工业大学2019.5.21信息与自然语言处理自然语言处理的主要研究方向下一代信息检索研究四.自然语言处理的未来思考信息与自然语言处理是信息的载体二)自然语言处理的概念及其研究方法三)中文信息处理的特殊问题及所做工作(四)当前研究的特点信息与自然语言处理(一)语言是信息的载体信息同能源、材料一起构成经济发展与社会进步的三大战略资源。信息技术正在推动和改变人类的生产、生活甚至是思维方式信息是无形的,但它可以用语言来表达。语言是信息的载体,语言是文化的支柱,语言是人类思维、沟通与交流的工具。语言技能是一种人力资本。语言与经济、文化、教育,与社会发展和人类进步有着紧密的关系信息与自然语言处理中国中文信息学会是一个学术性的群众组织学会的学术研究内容是利用计算机对中文的音、形、义等语言文字信息进行加工和操作,包括对字、词、短语、伺子、篇章进行输入、输岀、识别、转换、压缩、存储、检索、分析、理解和生成等。它是语言学、计算机科学、认知科学、数学等多学科交叉的边缘学科。自然语言处理是计算机应用的一个分支,是人工智能的一部分,但计算机技术和人工智能技术又都从属于信息技术。信息与自然语言处理)自然语言处理的概念及其研究方法概念自然语言处理通常是指用计算机对人类自然语进行的有意义的分析与操作编码(机内码、输入码)词—分词、词性标注、词义消岐自然语言句法分析处理句子语义分析语用分析段落与篇章—话语结构分析信息与自然语言处理2研究方法(1)基于规人工获取语言规则(2)基于统计通过对大规模语料库的统计分析,实现对自然语言的处理3.处理过程语言问题→形式化表示(模型)→算法转换→程序编制→机器运行→结果输出→系统评沨信息与自然语言处理三)中文信息处理的特殊问题及所做工作1.特殊问题(1)句子中单词的切分;(2)时态、语态、语气等没有严格的形式标记(3)句子成分的省缺及指示代词的频繁出现(4)语言资源的缺乏及其规范化问题信息与自然语言处理2所做工作(1)理论、方法与技术研究结合汉语特点,引进国外技术(2)实验和应用系统的研制开发包括汉字处理、中文文本处理、中文语音处理、少数民族语言处理等(3资源建设词典和语料库等4)评测国内:863国际:SIGHAN(分词)、NIST(机器翻译)、TREC(信息检索)信息与自然语言处理四)当前研究的特点1.使用语料库处理大规模真实文本使用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论