研究生开题报告-基于图神经网络的text-to-sql研究_第1页
研究生开题报告-基于图神经网络的text-to-sql研究_第2页
研究生开题报告-基于图神经网络的text-to-sql研究_第3页
研究生开题报告-基于图神经网络的text-to-sql研究_第4页
研究生开题报告-基于图神经网络的text-to-sql研究_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

硕士研究生学位论文选题报告学号:姓名:导师:论文题目:基于图神经网络的text-to-sql分析与研究学科专业:软件工程学院:软件学院填写时间:2020年06月24日

论文题目:基于relation-awareself-attention机制的text-to-sql分析与研究论文类型:(1)基础研究;(2)应用基础研究;(3)应用研究;(4)其它课题来源:(1)纵向课题;(2)横向课题;(3)自选课题;(4)其它一、选题的科学依据(1、选题背景;2、理论意义和应用价值;3、国内外研究现状及发展趋势。附主要参考文献)1、选题背景当前,大量信息存储在结构化和半结构化知识库中,如数据库。对于这类数据的分析和获取需要通过SQL等编程语言与数据库进行交互操作,SQL的使用难度限制了非技术用户,给数据分析和使用带来了较高的门槛。人们迫切需要技术或工具完成自然语言与数据库的交互,因此诞生了Text-to-SQL任务。。2、理论价值和应用价值在现实生活中,有许许多多的数据库,存储着各行各业的信息,比如学校的选课信息、成绩信息,公司的账务信息、人员流动。SQL是一种数据库查询语言,具有极大的灵活性和强大的功能,然而对于普通人来说,SQL学习门槛比较高。即使对于计算机从业者来说,想要针对不同的数据库和应用场景,编写大量的并保证正确率的SQL语句,也比较麻烦。如果我们能够有一个工具,自动地把我们的描述转化为SQL查询语句,再交给计算机去执行,就能方便地对数据库进行查询,那就大大提高了我们的生活和工作效率。Text-to-SQL就是这样一项转化自然语言描述为SQL查询语句的技术。举个例子:当我们询问智能助手“贾樟柯导演是在哪出生的啊?”,Text-to-SQL模型就会先根据问句解析出SQL语句“SELECTbirth_cityFROMdirectorWHEREname="贾樟柯"”,再对数据库执行该命令,最后向用户返回查询结果“山西省汾阳市”。目前这个研究问题引起了学术界和工业界的广泛关注,有着很多的比赛和标注数据集,其中比较有名的,包括有关机票订阅的ATIS数据集、有关地理信息查询的GeoQuery、基于维基百科的WikiSQL以及目前最复杂的多领域数据集Spider。在中文Text-to-SQL任务方面,西湖大学日前公布了CSpider数据集,追一科技在天池数据平台举行了第一届中文text2sql挑战赛。在这里,我们给出Text-to-SQL任务一个相对正式的定义:在给定关系型数据库(或表)的前提下,由用户的提问生成相应的SQL查询语句。下图是一个具体的实例,问题为:有哪些系的教员平均工资高于总体平均值,请返回这些系的名字以及他们的平均工资值。可以看到该问题对应的SQL语句是很复杂的,并且有嵌套关系。3、国内外研究现状及发展趋势SyntaxSQLNet(Yuetal.,2018):第一个针对Spider任务设计的模型。在decoder阶段,生成一棵对应SQL语言特点的语法树。RCSQL(Lee,2019):针对不同的SQL语句来创建decoder;使用seq2seq而不是seq2set的方法进行列名预测;使用循环递归的方法来生成子查询。GNN(Boginetal.,2019):将关系型数据库的数据结构用图神经网络表示,以此来提升数据库信息的利用效率。并将GNN结构用于辅助后续的编码和解码过程。IRNet(GuoandZhanetal.,2019):分三个阶段进行,首先,将所提问题和数据库的关系结构做schemalinking。然后,用基于语法规则的神经网络构造一个SemQLquery。最后,基于SemQL构造不同场景下的SQLquery。4、参考文献[1].BenBogin,JonathanBerant,andMattGardner.2019a.Representingschemastructurewithgraphneuralnetworksfortext-to-SQLparsing.InProceedingsofthe57thAnnualMeetingoftheAssociationforComputationalLinguistics,pages4560–4565.[2].GinoBrunner,YangLiu,DamianPascual,OliverRichter,MassimilianoCiaramita,andRogerWattenhofer.2020.OnidentifiabilityinTransformers.InInternationalConferenceonLearningRepresentations.[3].TianzeShi,KedarTatwawadi,KaushikChakrabarti,YiMao,OleksandrPolozov,andWeizhuChen.2018.IncSQL:TrainingIncrementalText-to-SQLParserswithNon-DeterministicOracles.arXiv:1809.05054[cs].[4].AshishVaswani,NoamShazeer,NikiParmar,JakobUszkoreit,LlionJones,AidanNGomez,ŁukaszKaiser,andIlliaPolosukhin.2017.AttentionisAllyouNeed.InAdvancesinNeuralInformationProcessingSystems30,pages5998–6008.[5].TaoYu,MichihiroYasunaga,KaiYang,RuiZhang,DongxuWang,ZifanLi,andDragomirRadev.2018a.SyntaxSQLNet:SyntaxTreeNetworksforComplexandCross-DomainText-to-SQLTask.InProceedingsofthe2018ConferenceonEmpiricalMethodsinNaturalLanguageProcessing,pages1653–1663.[6].TaoYu,RuiZhang,KaiYang,MichihiroYasunaga,DongxuWang,ZifanLi,JamesMa,IreneLi,QingningYao,ShanelleRoman,ZilinZhang,andDragomirRadev.2018b.Spider:ALarge-ScaleHuman-LabeledDatasetforComplexandCrossDomainSemanticParsingandText-to-SQLTask.InProceedingsofthe2018ConferenceonEmpiricalMethodsinNaturalLanguageProcessing,pages3911–3921.二、主要研究内容和方案1、图构建为了更好的利用关系型数据库的结构信息,使用图网络来建模表格名和列名。如下图所示:圆圈加粗的结点代表表格,不加粗的结点代表列名;双向边代表表格和列名的从属关系;红虚边和蓝虚边代表主外键关系。橙色节点代表与问题有关的结果,淡色为无关。2、全局信息重排例如:我们不知道name到底指向的是singer还是song,但是我们可以观察到nation只在singer中出现,所以应该是。这样做globalreasoning,就能减小歧义性。3、构建GNN模型三、研究计划及预期进展时间研究内容预期效果2020.7-2020.82020.8-2020.92020.9-2020.9.302020.10-2020.122021.1-2021.3阅读文献,初定想法设计实验,并完成实验撰写小论文,投稿优化算法,反复测试,观察实验结果整理工作,论文撰写了解相关技术,确定研究课题了解已实现算法,并思考优化方案论文投稿优化出性能较高的负载均衡算法完成毕业论文四、指导教师意见签名:日期:年月日五、选题报告会记录(着重记录评审专家的质疑问题与研究生的回答要点,以及专家对选题的具体修改意见)六、论文选题评价结果(请评审专家

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论