NLP文本分类深度学习方法库建立研究获奖科研报告_第1页
NLP文本分类深度学习方法库建立研究获奖科研报告_第2页
NLP文本分类深度学习方法库建立研究获奖科研报告_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

NLP文本分类深度学习方法库建立研究获奖科研报告摘

要:人工智能技术的推动下,深度学习与NLP的联系更为紧密,并推动了NLP的进一步发展。本文就如何打造NLP文本分类深度学习方法库进行了回顾性的分析,对其建模原理及模型细分进行了总结,将为这一研究的深入提供一定的参考。

关键词:深度学习;NLP;方法库

随着NLP(神经语言程序学)研究的不断深入,其重要的应用价值开始在机器翻译、情感分析、智能问答、文摘生成、文本分类、舆论分析、知识图谱等领域有所体现[1]。与此同时,以深度学习技术为核心的人工智能得到了广泛的关注,成为一个新的研究热点。这一技术与PLB的耦合,推动了NLP的新发展。打造神经语言程序学文本分类深度学习数据库即NLP文本分类深度学习方法库作为其中的基础环节成为研究中的一个重点。NLP文本分类深度学习方法库建立的目的可为探索以深度学习为主要技术的NLP分类方法提供海量的研究资源,这一学习方法库还具有文本分类的各种基准模型。同时NLP文本分类深度学习库也支持多标签的分类,且这些标签与句子或文档可以形成一定的关联。这些模型的建立将使得后续的研究有了重要的支点。在实践中发现,打造NLP文本库的过程中,有一些较为经典的模型是比较适合作为学习库的基准模型。

在此次研究的过程中,采用两个seq2seq模型进行文本分类,每个模型之下都设置有一个函数予以测试。两个seq2seq模型也可以在文本分类的过程中生成序列或其它任务。在文本分类的过程中,若需完成的分类任务是多标签的分类工作,这时候就可以将工作以序列生成的方式来进行。在这一研究中基本达成了一个记忆网络的建设[2]。其中以recurrententitynetwork(循环实体网络)来追踪状态,以blocksofkey-valuepairs(它用键值对块)为记忆并进行运行,并在这一功能的支持下实现对新状态的获取。构建后的NLP文本分类深度学习模型可以实现使用历史或上下文来回答建模的问题。例如,在测试中可以让NLP文本分类深度学习模型来读取句子作为文本,并提出一个问题来查询,而后可实现NLP文本分类深度学习模式的答案预测。若这一过程转化为向NLP文本分类深度学习模型提供一些素材资源,这时NLP文本分类深度学习模型便能够完成研究意义上的分类工作[3]。

1NLP文本分类深度学习方法库模型

1.1模型

fastText(快速文本模型):这一模型主要用于高效文本分类技巧上的研究,在运行中使用bi-gram,具有较高的速度优势。

TextCNN(文本卷积神经网络):这一模型主要用于句子分类的卷积神经网络的实现,在结构上利用从降维到conv再到最大池化,最终到softmax。

TextRNN(文本循环神经网络):这一模型在结构上与文本卷积神经网络有一定的不同,是从降维到双向的lstm到concta输出,最终到softmax。

RCNN(循环卷积神经网络):这一模型在结构上与文本循环神经网络基本相同,在输入项上进行了特殊的设计,采用EOS将两个问题隔开。

HierarchicalAttentionNetwork(分层注意网络):这一墨香在结构上采用降维→词编辑器→词注意→句子编辑器→句子注意→FC+Softmax。

seq2seqwithattention(具有注意的Seq2seq模型):这一模型在结构上主要有三层,降维→bi-GRU→具有注意的解码器。

Transformer:这一模型主要有编码器和解码器两大部分组成,具有在多向自我注意等方面的突出优势。

RecurrentEntityNetwork(循环实体网络):这一模型在型号结构上也是分为三个层次,即输入编码,动态记忆,输出。

BiLstmTextRelation(双向长短期记忆网络文本关系):这一模型在结构上与文本循环神经网络基本相同,在输入项上进行了特殊的设计,采用EOS将两个问题隔开。

TwoCNNTextRelation(两个卷积神经网络文本关系):这一模型采用不同的卷积来实现对句子特征的提取,然后在通过函数使目标标签完成饮食,然后使用softmax。

BiLstmTextRelationTwoRNN(双长短期记忆文本关系双循环神经网络):这一模型在结构上采取不同句子的双向lstm获取,最终由softmax输出。

1.2性能

2NLP文本分类深度学习方法库的用途

2.1用途

此次研究中的NLP文本分類深度学习方法库建立在xxx_model.py之上。在训练阶段采用pythonxxx_train.py来进行,进入测试阶段之后,可使用pythonxxx_predict.py来进行。快速文本模型、文本卷积神经网络、循环卷积神经网络、分层注意网络等模型下都有测试方法,可通过此来实现对模型的检验[4]。

2.3环境

该项学习库建立之后的运行环境为python2.7+tensorflow1.1或tensorflow1.2。

3结束语

作为人工智能研究的一个重要分支

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论