单元3:词性标注和实体命名识别2_第1页
单元3:词性标注和实体命名识别2_第2页
单元3:词性标注和实体命名识别2_第3页
单元3:词性标注和实体命名识别2_第4页
单元3:词性标注和实体命名识别2_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

3.3实战案例——基于LTP的词性标注和命名实体识别3.3.1案例目标3.33.3.1案例目标(1)安装LTP的Python封装包——pyltp,下载LTP的模型文件。(2)掌握使用LTP进行词性标注和命名实体识别。3.3.2案例分析3.33.3.2案例分析由哈工大研发的一个中文语言技术平台Python的封装包——pyltp从应用角度来看,LTP为用户提供了下列组件:针对单一自然语言处理任务,生成统计机器学习模型的工具;针对单一自然语言处理任务,调用模型进行分析的编程接口;使用流水线方式将各个分析工具结合起来,形成一套统一的中文自然语言处理系统;系统可调用的,用于中文语言处理的模型文件;针对单一的自然语言处理任务,基于云端的编程接口。(一)认识LTP3.3LTP主要模型SentenceSplitter:分句模型,将一个段落通过'。'、'?'、'!'等形式分开。Segmentor:分词模型,支持用户使用自定义词典。Postagger:词性标注模型。词性标注:指一句话分完词后,给每个词一个词性类别。NamedEntityRecognizer:实体命名模型。实体命名:指识别出一句话的或一段话或一篇文章中的命名实体。Parser:语法分析模型。SentenceSplitter、Segmentor、Postagger、NamedEntityRecognizer、Parser3.3.2案例分析(一)认识LTP3.3LTP模型加载LTP所需基本模型的加载及使用LTP基本模型下载地址:http://ltp.ai/download.html3.3.2案例分析(一)认识LTP3.3LTP模型加载LTP所需基本模型的加载及使用代码:

frompyltpimportSegmentor,Postagger,Parser,NamedEntityRecognizersegmentor=Segmentor()#初始化实例segmentor.load("cws.model")#加载分词模型recognizer=NamedEntityRecognizer()#加载命名实体识别模型recognizer.load("ner.model")

parser=Parser()#加载依存语法分析模型

parser.load("parser.model")

postagger=Postagger()#加载词性标注模

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论