基于RDF的教育资源描述资料_第1页
基于RDF的教育资源描述资料_第2页
基于RDF的教育资源描述资料_第3页
基于RDF的教育资源描述资料_第4页
基于RDF的教育资源描述资料_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、姓 名导 师张书涵夏幼明教授基于RDF的教育资源描述目录1234元数据与教育资源建设技术规范XML语言与资源描述框架RDF基于RDF模型的半结构化知识表示教育资源特征提取与分类算法1元数据与教育资源技术规范 什么是元数据? 元数据可以出现在数据内部、独立于数据、伴随着数据、与数据包裹在一起等形式。 元数据,最常见的宽泛定义是关于数据的数据,具体讲的是关于数据的结构化数据。1元数据与教育资源技术规范 元数据的种类对于元数据的种类有不同的分类方法,一般分为描述性元数据、结构性元数据、存取控制性元数据、评价性元数据。1元数据与教育资源技术规范 元数据在教育领域中的应用1、用于教育信息资源的组织2、用

2、于教育信息资源的检索与导航3、用于教育信息资源数据库的设计与维护4、用于系统管理机制的描述1元数据与教育资源技术规范 现有的教育资源元数据标准1、都柏林核心元数据标准 英文名是“Dublin Core Metadata”,简称DC元数据。它于1995年3月,由美国联机图书馆中心与国家超级计算应用中心联合发起,目的是希望建立一套描述网络学习资源的方法,方便人们检索。1元数据与教育资源技术规范 现有的教育资源元数据标准1、都柏林核心元数据标准DC元数据为网络教育资源制定了一组通用核心集,该标准对网络教育资源相关的15个核心元素进行了规定,并分成了三类。一是教育资源内容描述类,主要包括Title,

3、Subject, Description,Source, Language, Relation等;二是知识产权类,包括Creator, Publisher等;三是外部属性描述类,包括Date, Type, Format等。1元数据与教育资源技术规范 现有的教育资源元数据标准1、都柏林核心元数据标准DC元数据比较简单,容易理解,规定的内容也较少,是一个良好的教育资源描述元数据集。但是,在描述较复杂的学习对象时,不能详细的对教育资源的属性进行描述,具有一定的局限性。1元数据与教育资源技术规范 现有的教育资源元数据标准2、学习对象元数据(Learning Object Metadata) 简称LOM

4、元数据,是与学习对象相关的一切信息。它于1996年IEEE的学习技术标准委员会研究产生,方便对学习对象进行检索、查询、定位和管理。1元数据与教育资源技术规范 现有的教育资源元数据标准2、学习对象元数据(Learning Object Metadata)IEEE LOM主要对学习对象的9个基础类别的特征进行规范和描述:通用类、生存周期类、元-元数据、技术类、教育类、权利类、关联类、注释类、分类类1元数据与教育资源技术规范 现有的教育资源元数据标准2、学习对象元数据(Learning Object Metadata)从元素构成上看,LOM较为复杂,分为9大类,每一类下面由有二级元素,一共47个左右

5、。但是其修饰词却不复杂,只有部分元素有修饰词。从资源描述能力上看,相比DC元数据,LOM的资源描述深度和广度要强的多,是更专业的教育资源描述工具。1元数据与教育资源技术规范 现有的教育资源元数据标准3、中国网络教育技术标准英文名称China E-Learning Technology Standards,简称CELTS。它于2001年由中国教育信息化技术标准委员会提出,是一个具有中国特色的网络技术标准。1元数据与教育资源技术规范 现有的教育资源元数据标准3、中国网络教育技术标准学习对象元数据规范CELTS-3教育资源建设技术规范CELTS-41基础教育教学资源元数据规范CELTS-422XML

6、语言与资源描述框架RDF 什么是资源描述框架RDF? RDF是一种元数据框架,它借助网络实现机器可识别应用程序之间的互操作性,使网络资源自动化处理。RDF的主要目标是为了解决互联网中信息的语义化,它支持对元数据语义的描述以及元数据之间的互操作性,在应用中也支持基于推理的知识发现而不是全文匹配检索。2XML语言与资源描述框架RDF RDF框架RDF数据模型、RDF模式和RDF语法 1、RDF数据模型RDF数据模型形成对资源的形式描述,通过使用标记图(或“节点和弧”图)表示,包括:资源、属性、属性值三部分。资源属性值属性资源可能是整个网页、网页的一部分或页面的全部集合,或者是不能通过Web直接访问

7、的对象属性是描述某个资源特定的方面、特征、性质或关系2XML语言与资源描述框架RDF2、RDF模式(RDF Schema)RDF模式定义了RDF描述资源时所用的词汇集,包括类和属性。3、RDF语法-基于XML的语法2XML语言与资源描述框架RDF xmlns:g=“grid:/schema#”LiMing2XML语言与资源描述框架RDF资源类型属性名称含义属性描述资源包含的基本属性(Resources)Name表示资源名称由资源创建者都提供者给出的资源名称。Address表示资源地址使用URI进行标识。Type表示资源类型从类型列表中选取。Provider表示资源的提供者提供资源的个人或机构r

8、egisterDate表示资源的注册日期使用YYYY MM-DD形式Validate表示资源的有效日期资源可利用到不可利用状态的日期下限Description表示资源的简略描述资源内容的文本描述网格中资源基本属性2XML语言与资源描述框架RDF!DOTYPE rdf:RDF” xmlns:rdf=“ /1999/02/22-rdf-syntax-ns#” xmlns:rdf=“ /2000/01/rdf-schema#” xml:base=“/schemas/allresource” 3基于RDF模型的半结构化知识表示设有目标域为D,D中所以数据源的集合为SD=Si,Si为二元组,E为Si中数

9、据元素的集合E=e ,R为Si 中数据元素之间关系的集合R=e ,e ,rik(e ,e Ei)则有:Si,f,sM,f(si)=f()=f() f(si)= f(e ) E,f(e ),f(e ),f(e ) R设目标域D上的元数据M,其描述能力为二元组,E为M支持的数据元素的集合,E=ei,R为M中数据元素之间的关系集合R=ei,ej,rk (ei ,ej) E) RDF形式化模型3基于RDF模型的半结构化知识表示LOM=General,Lifecycle,Metamedata,Technical,Educational,Rights,Relation,Annotation,Classif

10、icationGeneral=Identifier,Title,Catalogentry,Language,Description,Keywords,Coverage,Structure,Aggregationievel Lifecycle=Version,Status,ContributeMetamedata=Identifier,Catalogentry,Contribute,Metadata schema,LanguageTechnical=Format,Size,Requirment,Installatio_remarks,Other_latform,Requirements,Dura

11、tionEducational=Interactivity_type,Learning_resource_type, Interactivity_level,Semantic_density,Intend-ed_enduser_role,Context,Typical_agerange,Difficulty,Typica_larning_time,Description,LanguageRights=Cost,Copyright and restructions,DescriptionRelation=Kind,ResourceAnnotation=Person,Date,Descriptio

12、nClassification=Purpose,Taxopath,Description,Keyword RDF形式化描述-LOM基本命名空间的缩写3基于RDF模型的半结构化知识表示Base schema xmlns:rdf=“ /1999/02/22-rdf-syntax-ns#” xmlns:rdfs=“ /2000/01/rdf-schema#” xmlns:dc=“ /dc/elements/1.1/” xmlns:dcterms=“http:/dc/terms/” xml:base=“/2002/09/lom-base#” ISO8601 Instances of this clas

13、s are dates and times encoded with ISO8601. Entity Instances of this class are persons or organizations described by Cards RDF形式化描述-RDFS 词汇表 示例4教育资源特征提取与聚类算法 聚类框架混合XML文档文档约简约简文档WordNet&自定义词库计算结构相似度文档结构相似度结构相似度权重文档结构相似度聚类文档簇计算语义相似度文档语义 相似度语义相似度权重文档预处理,去除冗余结构4教育资源特征提取与聚类算法在XML文档树中,完全标签路径是从根节点到叶子节点的路径上

14、所有节点标签构成的序列。任意一条从根节点到叶子节点的路径不仅包含了根节点、叶子节点,还包括所有从根节点到达叶子节点所经历的中间节点。假设有N个待比较的文档,定义D=d1,d2,dN为N个文档所对应的N棵DOM树集合,di中的完全标签路径集合为Pi=p1,p2,pm。完全标签路径的个数对应了叶子节点的个数。 XML文档特征描述方法-完全标签路径XML文档片段树ProductsBookISBNAuthorTitle算法 完全标签路径的获取输入 DOM树集/树的个数为N输出 文档的路径集合P=p1,p2,pN, Pi=pi1,pi2,piMi/Mi表示文档i的路径数量Begin while(di i

15、n D) while(叶子节点jM) 先序遍历di并获得pij; add pij 到Pi END4教育资源特征提取与聚类算法 语义相似度计算算法 语义相似度计算输入 矢量特征模型Doc;输出 语义相似度矩阵Begin抽取XML文档中的全部元素; while(Doci在文档集D中) 创建扩展元素向量Doci; while(Doci在文档集D中) while(Docj在文档集D中) 计算Doci与Docj的相似度;END该算法比传统的仅考虑词频的相似度计算方法相比,元素匹配程度提高了50%-100%。但是该方法未考虑元素所在层次结构对相似度的影响。2001年美国Jung-Won Lee发表在IEEE上的文章Preparations for Semantics-Based XML Mining提出了一种计算XML文档语义相似度的方法,该算法抽取XML文档的元素节点,然后对每个元素节点建立扩展标记向量,通过扩展标记向量中的元素匹配程度进行语义相似度计算,时间复杂度为O(N2),其中N是文档数目。4教育资源特征提取与聚类算法在XML文档中,层次越高的元素往往比层次的的元素更能反映文档的信息,在描述文档的时候更具有意义,因此在计算语义相似度时,应把层次作为因子纳入计算。 层次影响因子层次影响因子(Layer Affecting Factor)是指在XML文档中,元素在文档树结构中所

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论