《旅游领域问答系统设计12000字(论文)》_第1页
《旅游领域问答系统设计12000字(论文)》_第2页
《旅游领域问答系统设计12000字(论文)》_第3页
《旅游领域问答系统设计12000字(论文)》_第4页
《旅游领域问答系统设计12000字(论文)》_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

②相似度度量模型这里用到的是余弦相似度,别称也可以说是余弦相似性,用到的核心公式为所用的方式方法是,算出两向量之间的角度的余弦值,来对于两个向量的相似性进行一个大致评估。对于两个矢量,方法是这样的,从原点([0,0,...])出发,想象朝向不同方向的空间的两个线段。这时候会有一个角度形成在两个线段之间:如果所含角度显示为0度,则意味着方向相同,且线段是一致的;如果是90度的话,那就是形成直角,方向完全不同的意思;如果包含的角度是180度的话,那就是显示出方向是相反的。因此,可以根据角度区分,来确定向量的相似性。角度越小,相似度越高亦即越像。而用此法进行文本相似度计算,流程大致如下,图3.3为分词流程图:图3.3分词流程图可以进行如下情况的一个实例演算分析:图3.4实例图将其进行向量化:=(1,1,1,2,1,1,1,1,0,0,0,0,0,0,0,0,0,0)=(1,1,0,2,2,0,1,1,0,0,0,0,0,0,1,0,0,1)=(1,1,0,2,2,0,1,1,2,2,2,1,1,1,2,1,1,1)计算余弦:=0.8058229640253802=0.0=0.06299407883487121的夹角的余弦更趋近于1,所以相似度更高。3.朴素贝叶斯算法分类该部分主要是进行模型训练以及模型预测,这里用到的一个算法是朴素贝叶斯算法模型,以此进行分类的操作;该算法的主要思想是如下这样的:给出一个待分类的项目,需要知道的是该项出现的条件下某个类别出现的概率,出现概率最高的类别,即为该项目所属于的类别;接下来对于整体算法流程进行大概了解,图3.5为朴素贝叶斯分类流程图:图3.5朴素贝叶斯分类流程对于朴素贝叶斯分类,首先要知道的是,此项利用到的核心算法是:,可以对此做一个转换,更易于被理解:然后根据上述流程图可以进行大致分析:

阶段步骤一——前期准备,主要工作可以进行如下表述,根据不同的具体情况,可以对于特征属性有一个确定,适当地划分每个特征属性,并对于其中进行手动分类,得到一个训练样本集。该阶段的输入是仍需分类的数据,特征属性和训练样本作为得到的输出结果项目。

阶段步骤二——分类器的训练操作,这一阶段的主要任务是创建分类,主要任务是在训练样本中,对于每个类别在此其中出现的频率,以及针对每个特征属性划分来说,其对每个类别的条件进行概率估计,并记录得到相应的结果。

阶段步骤三——实际应用情况。此阶段的任务是通过分类,对要分类的项目进行分类。输入是分类和要分类的条目,输出是这些条目和类别之间的映射链接。4.答案匹配基于前面的语料库以及对于库中内容的预处理,将对用户输入的问句进行配置答案,调用的是fuzzywuzzy库,可称之为模糊匹配库,可以通过LevenshteinDistance算法,计算得出两个序列间的不同之处。依据的该算法,又可以又称为EditDistance算法,意思可以这样去理解,对于两个有差异情况的字符串来说,要是想要将其从一个转换成为另一个的话,需要进行编辑的最低操作次数。这些操作主要涵盖了以下几种,插入或者删除一个字符,将一个字符用另一个字符替代之类的操作。不难理解,编辑操作的次数越少,二者的相似度便越高。此项将会对于相似度阈值有一个具体的设定,相似度大于该阈值则说明匹配成功,比对后若匹配成功,则同等情况下将按照相似度的高低顺序反馈给用户问句答案,得到最终的结果映射。四系统实现基于前面内容已经阐述的设计分析,可以对系统基本功能进行实现,可视化界面如下所示,将会对与每个分类下的问答功能进行展示;旅游准备类首先,对于“你好”“再见”诸如此类的寒暄客套话,此前已经进行了该种问候语的集合,做成了一个小词库,会相应给予答复;出游之前需要对该地方气候、需要穿的衣物有一定的了解,输入相应问句可以对于该问题的类属有一个确定,并将答案进行反馈,可以得到回复如下,图4.1为可视化界面1:图4.1可视化界面1旅游景点类对于出游前相关信息进行了大致了解后,就可以对于要去的景点地方进行大致了解,如下可以进行具体展示,图4.2为可视化界面2;图4.2可视化界面2美食推荐类可以通过了解北京特色小吃,进行美食搜寻,游玩之余也可以满足自己的果腹之欲;图4.3为可视化界面3;图4.3可视化界面3住宿安排类出游过程中还需要对住宿的方面的安排有一个大致的规划,了解北京适合居住的地方是必要的;图4.4为可视化界面4;图4.4可视化界面4出游推荐类若是陪同老人小孩出游,还需要了解北京的一些公园,适合全家游玩;图4.5为可视化界面5;图4.5可视化界面5购物推荐类除了食宿问题,需要进行娱乐活动,故此可以对一些商场进行大致了解如下所示;图4.6为可视化界面6;图4.6可视化界面6五总结反思通过对于近几年问答系统分析设计等资料的搜查与了解,对相关问答知识领域的知识,了解程度上变得更加全面丰富,故此可以对问答系统做一些具体的解析。对于一个问答系统的以下若干方面:首先,分析提出的问题。使用者将需要的关键字或者句子进行输入,将相关内容进行提交系统,此时,根据系统内部的信息资料库,将会采用对用户提交的关键字进行分析的步骤,进行某些水平上的理解解析;其次,检索内部文字信息。对于关键字进行一定加工,通过加工,关键字导入后可以进行数据库的一个系统查询,呈现与关键字相关性较高的内容;然后,问题答案的提取与呈现。数据库查询之后,将返回的结果,依据特定的序列规则进行整合与排列,并突出关键字(用户输入的内容),之后会加以相关链接,反馈给用户。本次设计开发的系统的多数模块固然已经得到了实现,同时也符合以上几个所需要的特性。然而,一个可以正式使用运行的系统如果只凭借短时间的分析、设计来开发,还是未能达到理想状态的,因此着实应该花上更长的精力投入来测试并完善此设计系统。在此次研究实践的过程之中,现实情况下会出现某些问题,譬如,我们仅对某个分类的问答进行了研究开发,所以能回答的范畴是有限的,提问问题的答复只能回复我们事先设定的某一类问题,是属于事先分好的类别,而难以对我们的实际需求给出确切的回应。究其原因,在于我们目前使用的语料库中,对于其他分类下的信息储存量较小,因此在有限的范围之下,在某些程度上,比较难区找到,与使用者实际情况下,所提出的问题相似度较高的问题,故此会在一定程度上影响结果。整个程序设计过程中亦是存在着不少问题,譬如数据库语料库等的内容相对局限于某些范畴,若要在现实生活中进行使用还需要大幅度改进调整;开题报告中理想状态下的很多功能,依据本人目前的知识水平和技能能力,在实际程序的设计与调试中无法顺利实现,因此在实际操作中进行了一些简化与修改的操作,我们操作完成的相关程序的基本功能也得以顺利实现。综上所述,这个开发系统依然具有着部分需要修改的地方以及不够优化的问题。譬如,从开发系统的整体设计看来,不少细节之处需要进一步加以显得更为美观的效果,可读性的方面也应该需要加以强化,使得使用者在实际操作中更加便利,而论及系统的自适应性,不得不承认的是,亦存在着不少需要改进完善的地方,着实也应该进一步修改有关程序,我们所设计的系统,开发需要的部分代码内容着实应该改变一下,需要让它更为精细,也或者说需要加强程序的实现功能性。有理由相信,通过未来日子里的研究与学习,将会进一步完善自身本领,进一步深化个人知识层面,但必须承认的是,方方面面的问题应该也会伴随我左右,整个开发系统的深入完善以及修改,亟待我未来的学习领悟。参考文献[1]陈方正.中文旅游领域问答系统的研究与实现[D].西南交通大学,2015.[2]王文晶,李茹,宋小香.基于汉语框架知识库的旅游信息问答系统设计[A].中国中文信息学会.第四届全国学生计算语言学研讨会会议论文集[C].中国中文信息学会:中国中文信息学会,2008:9.[3]陈晓伟.基于中文知识图谱的问答系统的设计与实现[D].电子科技大学,2019.[4]任梦婷,王娟,阮佩姗,刘振盼.影响高质量网络问答系统建设的因素[J].物流科技,2016,39(12):38-41.[5]费建军.智能问答系统中命名实体识别问题研究[J].数字技术与应用,2017(07):93-96.[6]张积宾,徐志明,王恒,潘启树.面向大规模网络数据的社会化问答系统[J].哈尔滨工业大学学报,2008,40(12):2011-2015.[7]耿志红.中文问答系统的现代汉语疑问句类型分析研究概述[J].佳木斯职业学院学报,2016(12):365+367.[8]高勇,荀恩东,宋柔.构造自然语言问答系统平台[A].中国中文信息学会.第二届全国学生计算语言学研讨会论文集[C].中国中文信息学会:中国中文信息学会,2004:4.[9]张晓孪,王西锋,李乃乾.中文问答系统中问题理解的研究与实现[J].西华大学学报(自然科学版),2008(02):4-7+1.[10]张晓孪.中文问答系统中问题理解与信息检索的研究与实现[D].西北大学,2007.[11]李茹,王文晶,梁吉业,宋小香,刘海静,由丽萍.基于汉语框架网的旅游信息问答系统设计[A].中国中文信息学会信息检索与内容安全专业委员会.第四届全国信息检索与内容安全学术会议论文集(上)[C].中国中文信息学会信息检索与内容安全专业委员会:中国中文信息学会,2008:9.[12]杨凤.基于人工智能的课程答疑系统的研究[D].大连海事大学,2020.[13]张亮.面向开放域的中文问答系统问句处理相关技术研究[D].南京理工大学,2006.[14]JiangChuan,SuQianmin,ZhangLele,HuangBo.AutomaticQuestionAnsweringSystemBasedonConvolutionalNeuralNetworkandItsApplicationtoWasteCollectionSystem[J].JournalofCircuits,SystemsandComputers,2021,30(01).[15]ShiyaoZhao,ZhezhiJin.ResearchProgressofAutomaticQuestionAnsweringSystemBasedonDeepLearning[J].OpenAccessLibraryJournal,2020,07(06).[16]XiaohuiPan,TaoZhang.ResearchonE-CommerceAutomaticQuestionAnsweringSystemModelBasedonDataMining[J].JournalofPhysics:ConferenceSeries,2018,1069(1).[17]TrivediHari,MesterhazyJoseph,LagunaBenjamin,VuThienkhai,SohnJaeHo.AutomaticDeterminationoftheNeedforIntravenousContrastinMusculoskeletalMRIExaminationsUsingIBMWatson'sNaturalLanguageProcessingAlgorithm.[J].Journalofdigitalimaging,2018,31(2).[18]WidedBakari,PatriceBellot,MahmoudNeji.AlogicalrepresentationofArabicquestionstowardautomaticpassageextractionfromtheWeb[J].InternationalJournalofSpeechTechnology,2017,20(2).[19]JawadSadek,FaridMeziane.ADiscourse-BasedApproachforArabicQuestionAnswering[J].

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论