垂直知识图谱工具与应用10月16日课件_第1页
垂直知识图谱工具与应用10月16日课件_第2页
垂直知识图谱工具与应用10月16日课件_第3页
垂直知识图谱工具与应用10月16日课件_第4页
垂直知识图谱工具与应用10月16日课件_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

垂直知识图谱构造工具与行业主要内容为什么垂直行业需要知识图谱垂直知识图谱的特点垂直知识图谱工具——VKGBuilder介绍垂直知识图谱应用我们从通用知识图谱开始。。。。1.SSCO对不同的中文数据源进行合并,组成统一的知识库。共有621万实例,73万类别,上亿的事实。成果在ISWC以及SCI期刊上发表。使用机器学习获得的知识网络,包括260,345个概念,5,602,180个实例,526,219个同义关系,下图显示了网络的部分节点2.zhishi.me华东理工大学上海交大为什么行业需要知识图谱1.图书馆行业的故事——地方图书馆与内容供应商之争

内容供应商超星万方链接舟山图书馆门户数字图书馆资源属于内容供应商用户访问日志属于内容供应商!读者谁能够提供更好的服务?内容供应商!为什么行业需要知识图谱1.图书馆行业的故事——地方图书馆之争

内容供应商超星万方维普链接链接链接舟山图书馆门户数字图书馆谁拥有更多的资源?大图书馆!浙江图书馆门户国家图书馆门户地方图书馆利用知识图谱实现转型寻觅新的机会!为什么行业需要知识图谱2.证券行业的故事——购买数据VS自己处理数据大智慧万德同花顺交易所购买模式平台模式集成并分析数据同花顺大智慧新闻网站证券公司研报内部交易数据搜牛问财——知识库结构化查询2.证券行业的故事——语义技术的渗透为什么行业需要知识图谱3.医疗行业的例子——病历结构化的必要性

词汇二义性传统非结构化病历数据,只能通过文本匹配来进行查询无法理解相同文字但不同含义的词汇

关联查询无法精确切分查询词,理解查询意图为什么行业需要知识图谱行业需要数据(语义)集成能力文本

与结构化数据的集成不同来源、不同格式的大量数据自动/半自动的集成行业需要(语义)数据查询能力更丰富的表达更精准的结果

总结为什么行业需要知识图谱知识图谱的技术优势渐增式数据模式设计初始设计的时候,很难清楚所有的概念,而知识图谱的动态可扩充性以及“无模式”特性使得用户很容易增加或修改模式。数据集成更轻松本体的语义互操作特性以及“链接数据”原则,使得来自不同供应商的数据集成更为方便。现有标准支持有RDF(S),OWL,SPARQL等标准,可以逐渐要求内容供应商支持。语义搜索用户可以查询具有某类特征的某类实体,比起基于基于关键词的搜索,更为精准。主要内容为什么需要行业需要知识图谱垂直知识图谱的特点垂直知识图谱工具垂直知识图谱应用垂直知识图谱特点

领域对数据质量要求更高,例如药品名称处方当中,药品的克数企业名称企业股票价格领域数据字段与数据关联更丰富一个企业包含的信息字段可能有上百个字段ICD11当中,每个疾病有56个属性,而其中52个是用填实例的。(不是随意填写一个文本,而是这个填的值本身也是RDF的一个实例。只有满足了上述条件,才能用于商业分析与决策支持1.更为丰富与精确的领域数据VS姚明的身高?VS电影的字段垂直知识图谱特点普通的KG,使用一种自底向上的方法,更强调数据的宽度。如DBpedia在构造过程中,先有数据,后有本体。对于行业本体来说,由于数据质量以及行业本身的规范要求,将使用自顶向下的方式。2.自顶向下垂直知识图谱特点比起互联网企业,垂直行业客户相对投入低,能力弱。需要可配置、图形化界面。需要容易地面向不同行业做客户化。4.需要可扩充的第三方工具支持垂直知识图谱特点医疗:如果我构造了医学知识图谱,下一步就是,如何基于这个图谱做诊疗?证券:如何我构造了一个企业知识图谱,下一步就是,如何找到满足某一类条件的企业?5.与决策支持集成——语义搜索?RuleEngine?大数据挖掘?垂直知识图谱体系结构RDBLODUGCTextD2RImporterLODLinkerUGCWrapperInformationExtractorSchemaexpansionandalignmentDataEnrichmentSchemaEditorDataEditorRestfulAPISemanticSearchWithNatureLanguageInterfaceVisualExplorer(CardView,WheelView)IncrementalSchemaDesignandDataEnrichmentKnowledgeRepositoryModuleGraphDatabaseKnowledgeAccessModuleSchemaInconsistencyorDataConflictKowledgeConstructionModuleKGArchitecture以舟山海洋数字图书馆的例子,说明垂直知识图谱工具

构造海洋KG的例子——多种数据来源RelationalDatabaseOwnedByZhouShanFisheryAgency(2attributes)Marine-relatedknowledgebasepublishedontheWeb(10attributes)Encyclopedicwebsitesandfreetextascomplementarycontent构造KG从Web抽取数据BuildKG配置文件用于从HTML页面抽取结构化数据Web数据和知识图谱中,实体与属性的匹配规则。

3)将数据导入到图谱中.从百科网站抽取数据BuildKG选项1)当前实体学习/批处理学习2)三个百科:互动、维基与百度3)抽取部分:摘要,Infobox,类型标签2.PossibleIntentions1.Query3.Answer4.RelatedBooks5.KnowledgeCard6.RelatedContents语义检索BuildKGUserscansubmitanykeywordqueryornaturallanguagequestion.ThequeryisinterpretedintopossibleSPARQLquerieswithnaturallanguagedescriptions.OnceaSPARQLqueryisselected,thecorrespondinganswersarereturned.alongwithrelevantdocumentswhichcontainsemanticannotationsontheseanswers.浏览KG——卡片视图ExploreKG卡片视图将所有实体(这幅图是鱼)展现在一个3D空间。最终用户可以放大、缩小、左移动和右移动,或是点击特定实体,看到实体详情。浏览KG——轮子视图搜索一个概念或实体上一页同一个实体关系名称ExploreKG轮子视图使用两个轮子组织概念/实体。对于左边的轮子,感兴趣的节点被放在中央,当相关实体或属性被点击的时候,点击的实体/概念就会成为右边轮子的中心,右边相关节点就会发生变化未来产品框架1.大规模图数据支持2.自动探测数据来源3.多策略学习,提高数据抽取精度4.自动/半自动多源数据融合。5.基于规则与推理的决策支持主要内容为什么垂直行业需要知识图谱垂直知识图谱的特点垂直知识图谱工具垂直知识图谱应用知识图谱帮助图书馆模式变迁ExtractandIntegrateDataFrommultipleSourcesContinuouslyprovideup-to-datecontent内容供应商+平台运营商RoleofKGZhouShanECUSTZheJiangHeNan……ShangHaiFederatedThematicResourceLibrary……PortEconomyKnowledgeGraphTextileIndustryKnowledgeGraphAgro-ProductProcessingKnowledgeGraphMarineEconomyKnowledgeGraphChemicalEngineeringKnowledgeGraph未来互联与共享的图书馆资源库

Futurework证券行业基于知识图谱技术的医疗知识库——正在进行。。。。病历结构化表示——正在进行【主诉】两周内便血2次【现病史】患者2周前无明显诱因下出现大便带鲜红色液体2次,无肛门口异物感,肛门口无突出物,大便色黄,无粘胨脓液,无恶心呕吐,无胃寒发热,无尿频尿急尿痛血尿,无腹痛腹泻里急后重,至我院门诊查肠镜示“距肛9-12cm见一浸润性肿块,累及近2/3肠腔

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论