智能问答系统设计与开发-中国软件杯.doc_第1页
智能问答系统设计与开发-中国软件杯.doc_第2页
智能问答系统设计与开发-中国软件杯.doc_第3页
智能问答系统设计与开发-中国软件杯.doc_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第七届“中国软件杯”大学生软件设计大赛赛题名称 : 智能问答系统设计与开发组类: A 本科及以上赛题简介:介绍整个赛题的思路和整体要求赛题业务场景:描述赛题相关的真实企业业务背景。从真实场景中,适当简化或者提炼出适合比赛的赛题场景功能性需求智能客服系统是在大规模知识处理基础上发展起来的一项面向行业应用的,适用大规模知识处理、自然语言理解、知识管理、自动问答系统、推理等技术行业。针对自动问答系统,我们希望开发一套智能问答系统,该系统能够基于给定文档,提取知识并自动生成问答知识库,并能现问答系统(前、后台功能)基本能力。知识库是智能客服 / 智能问答系统的关键竞争力之一, 高质量的知识库构建是业界

2、难题之一。目前业界大部分智能客服的知识库( QA对 问答对) 构建都是通过人工构建, 一个完善的知识库构建,需要耗费大量的人力。迫切需要有一套自动化方案,能够根据给定的文档(如产品手册、案例文档、用户指南等)等自动构建知识库( QA对)。本次智能问答系统设计,分为前台、后台、知识库构建三个主要功能模块,其中前台是为问答操作提供界面,后台实现产品文档录入、知识库管理以及与前台通信、知识库构建根据录入文档实现“ QA对”自动化生成。1. 后台: 请设计一个程序从文档中提取尽可能多且质量高的问答对,问题可以是由主题、关键词、短语构成,答案可以直接一个段落活语句组成。1) 文档: 格式 html ,数

3、量大概是 5w 左右,所有文档类型都是用户指南、常见问题、产品手册2) 知识库 QA 对格式:Q: 弹性云服务器的价格怎么计算的?A: 我们有按需、 包年 /包月两种计费方式, 您可以根据您的实际情况选择不同的计费方式。Q:A:3) 知识库管理: 实现基本 QA 对删除、增加、查询等操作功能。2.前台: 请设计一个程序,实现QA 对话界面,该界面可以基于用户提问,自动连接 后台、 并从 知识库 寻找答案,并呈现给用户,前台问题可以是由主题、关键词、短语构成。3. 知识库构建: 请设计一个程序,实现根据录入文档自动化生成知识库 “QA对”,在尽可能多的提取问答对的前提下,使得问题的质量更高同时答

4、案更准确, 知识库内 QA对不允许出现两个相同的问题。本部分为本赛题核心考察点:核心考察知识库实现准确性(详见任务评价指标),实现方非功能性需求其他限制条件:开发环境、实验平台、开发语言、数据库、编译器等限制条件(请尽量明确)测试数据或平台:提供给参赛者的测试环境和测试数据。(可提供电子档)法不限,可选择使用以下三种方式:1) 基于规则的 QA对生成2) 基于 NLP方法的 QA对生成3) 基于机器学习 / 深度学习的 QA对生成注: 基于 NLP的 QA对生成,建议考虑一下技术点:1) 文档结构树,主题 / 段落 / 语句分割2) 实体提取、关键词提取、语义特征提取3) 语句结构分析:同位语

5、结构、动词修饰名词结构、句型分析4) 摘要提取、语句压缩和融合5) 问题模式分类6) 问题生成(语义模板法、 ML生成法、深度学习)7) 问句泛化:关键词替换8) 句法转化: WH移动、主谓倒置等将陈述句转换为问句9) 问题语义完成度分析10) 文本阅读理解模型1. 整个系统应该能比较快的响应, 前、后台应该可以流畅使用2. UI 的设计应该符合常规的使用习惯;3. 需要提供完善的文档说明, 如系统设计文档、 知识库构建核心规则或算法设计文档等1. 知识库构建使用机器学习、深度学习方法时,建议采用华为云机器学习、深度学习服务。为了方便选手参赛,华为企业云从 18 年 3 月起,将为参数选手提供云上高性能机器学习、深度学习云环境,先到先得。 2. 前、后台采用服务器端 +移动端模式,服务器端可为 Web服务器,移动端为 APP( Android 、 IOS 不限,一种即可)1. 测试数据和平台:1) 提供开发和测试所需的原始产品文档及验证所需配套QA对(测试数据于18 年 3 月初提供)2) 允许使用选手通过其他数据训练调优模型2. 任务评价指标1) 前台 +后台基本功能实现、文档: 50%2) 知识库构建效果: 50%赛题评价时,使用另一组 N 测试文档以及若干个备选的 QA 对,测试知识库构建情况,主要评价标准如下:a) 命中问答对数:给定问题答案集合,在完全匹配的情况下, 命

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论