下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、问题理解增强阅读理解方法研究论文设计 i 问题理解增强的理解方法 研究 machine reading comprehension based on question understanding enhancement 中 中 文 摘 要 机器理解是指基于给定上下文机器自动回答相应的问题1 ,不仅是人工智能及自然语言处理领域的一个研究热点,更是一个挑战。机器是否正确、充分地理解问题是研究理解任务的关键和基础。本文针对模型对问题理解不充分提出了相应的解决策略,主要工作如下: (1)提出一个基于多维度问题理解的理解方法。本文通过问题类型识别、问题重要词识别、添加外部知识等多个维度提高模型对问题的理
2、解。多维度问题理解的解答策略的主要思想是:a.人工标注部分数据训练一个初标注 textcnn 模型并得到所有数据的问题类型;b.通过句法分析树和人工制定的规则获得问题的重要词;c.针对问题重要词在模型中加入外部知识;d.将之前所有的信息融入到理解模型中。在 dureader2.0 数据集上进行方法检验,融入多维度问题理解的理解模型比基线模型的 rouge-l 值和 bleu-4 值分别提高了 8,2%、7%。 (2)针对隐式问题提出了相应的理解策略。我们将不包含疑问词的问句定义为隐式问题,处理此类问题的主要思想为:a.首先判断问句是否为隐式问题;b.对隐式问题进一步分为两类:一般隐式问题和复杂
3、隐式问题;c.针对一般隐式问题,基于规则的方法添加疑问词将其转换为显式问题;针对复杂隐式问题,依据问题答案使用textrnn 模型识别问题中缺失的疑问词并将其转换为显式问题。实验结果表明:融入隐式问题处理的理解模型比基线模型的 ii rouge-l 值和 bleu-4 值分别提高了 3.6%、2%,融入隐式问题处理和多维度问题理解方法的理解模型比基线模型的 rouge-l 值和bleu-4 值分别提高了 9.5%、7.8%。 (3)设计并实现了一个针对中文篇章片段抽取式的理解原型系统。本文依据上述研究方法设计并实现了一个针对中文篇章片段抽取式的理解系统。本系统解答的大致思路为:首先对问题和篇章进行预处理,并判断问题是否为隐式问题,如果是则先将其转换为显式问题,如果不是不做任何处理;然后对问题进行分类、识别问题中的重要词,针对问题中的重要词加入相应的外部知识,并将以上问题的特征一起输入到理解模型中;最后,通过 attention 机制对篇章和问题交互建模,从篇章中找到与问题句关系较大的句子作为答案句输出。 本文提出的融
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工地临边防护技术措施规范及应用
- 银行信贷业务风险防控流程解析
- 建筑工地现场安全管理操作手册
- 志愿者团队职责分工及管理办法
- 前帮机操作安全规程标准
- 工业设备巡检标准操作程序
- 初三模拟考试语文试题汇编
- 民族服饰文化与现代时装设计结合
- 2026年数字货币支付趋势报告
- 企业内部购房合同范文及注意事项
- IPC7711C7721C-2017(CN)电子组件的返工修改和维修(完整版)
- 氧气理化特性表
- 物资、百货、五金采购 投标技术方案技术标
- 区域地质调查及填图方法
- 安全生产投入台账(模板)
- 新能源的发展与城市能源转型与升级
- 《医务人员医德规范》课件
- 儿童吸入性肺炎护理查房课件
- 生理学期中考试试题及答案
- 吕国泰《电子技术》
- 哈萨克族主要部落及其历史
评论
0/150
提交评论