RDF中is-a关系补全方法评估_第1页
RDF中is-a关系补全方法评估_第2页
RDF中is-a关系补全方法评估_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、RDF中 is-a关系补全方法评估is-a 关系是 RDF知识库中最基本的知识单元, 在基于知识库的问答等应用中具有关键作用。 但是不论是人工还是自动构建的知识库中,is-a关系都是不完整的。针对 RDF数据集中 is-a关系的缺失问题 , 研究人员提出了多种基于统计的方法对 is-a关系进行补全。但是由于建模方式的不同, 这些方法在不同数据集上的补全效果具有一定的差异性。因此 , 针对一个特定的 RDF数据集 , 如何选择一个 is-a关系补全方法是一个值得研究的问题。现有的方法大致分为两种:(1) 人工选择:即人工分析每个方法和给定数据的特点, 选择一个最适合该数据特点的算法, 但是由于无

2、法量化每个算法的效果 , 存在主观因素干扰; (2) 自动化评估: 即用召回率、 准确率和F1 评估每个方法在数据集上的评估效果, 但是在数据量较大时 , 该方法的效率低下。针对以上问题 , 本文提出了一个基于矩阵分解的方法来评估大规模RDF数据中 is-a 关系的补全方法 , 为知识库工作者选取补全知识库中的 is-a 关系的合适方法提供了一种高效的方式。 具体而言 , 本文的主要贡献有如下三点内容: (1) 提出了三个测度来评估 RDF数据集上 is-a 关系补全的效果:加权准确率 , 加权召回率和加权 F 值。这三个测度分别描述了一个 is-a 关系补全方法在整个 RDF数据集上的补全正例的准确率、召回率以及准确率和召回率的调和平均值 , 方便知识库工作者选择一个适合其数据特点、达到其应用指标的补全算法。(2) 提出了一个基于矩阵分解的评估方法对多种 is-a 关系补全方法进行评估 , 其中评估效果用上述三个测度表现。该方法首先得到每个补全方法在少量抽样数据上的补全效果 , 然后利用矩阵分解预测这些补全方法在整个RDF数据集上的补全效果 , 解决了 RDF中数据量大带来的评估效率低下的问题。(3)通过大量的实验分析了 6 个 is-a关系补全方法在不同RDF数据集上的补全效果 , 实验结果表明 , 本文提出的评估方法的确能够高效、准确

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论