版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第5章:元数据与媒体数据交换MEDIAASSETMANAGEMENT第5章元数据与媒体数据交换元数据的基本概念1元数据编码语言
2媒体元数据主要标准
3媒体文件交换格式
4§5.1.1元数据的定义元数据(Metadata):是关于数据的数据(Dataaboutdata).前一个数据是:原始的媒体信息后一个数据是:该媒体信息的格式化的描述。元数据是关于媒体信息的格式化的描述信息。MEDIAASSETMANAGEMENT§5.1.1元数据的定义元数据——媒体信息的格式化的描述信息MEDIAASSETMANAGEMENT内部表示:MON§5.1.1元数据的定义一级二级三级记录
简单格式结构化格式复杂格式特征私有(非开放的)正形成的标准已成为国际标准全文索引结构化字段详细标识格式LycosDublinCoreICPSRAltavista
IAFATemplatesCIMIYahooetc.RFC1807EADSOIFTEI
LDIFMARCMEDIAASSETMANAGEMENT元数据的三个级别§5.1.2元数据的类型和特点用于描述一个文献资源的内容及其与其它资源的关系的元数据。例如资源的名称、主题、类型等描述性元数据用于定义一个复杂的资源对象的物理结构。例如描述各个组成部分是怎样组织到一起的元素。结构性元数据MEDIAASSETMANAGEMENT以保存资源对象为目的的元数据,例如与资源对象长期保存有关的属性元素。存取控制性元数据以管理资源对象为目的的属性元素,包括资源对象的显示、注解、使用、长期管理等方面的内容管理性元数据§5.1.2元数据的类型和特点元数据应用的一些共同点(1)元数据一经建立,便可共享;(2)元数据的结构和完整性依赖于信息资源的价值和使用环境;(3)元数据的开发与利用环境往往是一个变化的分布式环境;(4)元数据要求使用起来简单,不太可能一个标准可以涵盖多种数字对象的特征,因此一个元数据方案通常只用于描述一种或几种类似的数字对象上;(5)元数据是用来描述数字化信息资源的编码体系,这导致了元数据和传统的基于印刷型文献的编目体系根本区别,元数据的最为重要的特征和功能是为数字化信息资源建立一种机器可理解框架。MEDIAASSETMANAGEMENT§5.1.3元数据模式元数据模式(MetadataSchema)用于指明元数据之间的结构和语义关系。模式不仅应该能够定义数字资源的结构和语义等关系,而且还应该允许对其内容进行自动检查和对元数据进行有效性验证。一般来说,元数据集合仅定义了描述最基本的数据特征的元数据成分,这些元数据成分仅能描述比较简单的数据特征,想要得到结构上更加复杂、语义上更加丰富的元数据描述,就必须利用元数据模式来对元数据集合进行定义和组织。MEDIAASSETMANAGEMENT§5.1.3元数据模式元数据模式是数据交换的“数据字典”MEDIAASSETMANAGEMENT§5.1.3元数据模式定义元数据模式的工具应该满足如下7个条件:1)层次结构的定义:元数据模式应该能定义元素的层次结构关系;2)元素和属性的继承:为了重用与共享,应该支持元素和属性的继承;3)名称空间(Namespace):用来解决名字冲突的问题,尤其是语义的冲突;4)数据类型机制(DataTyping):不仅应该支持简单数据类型和复杂数据类型,还应该支持数据模式;MEDIAASSETMANAGEMENT§5.1.3元数据模式定义元数据模式的工具应该满足如下7个条件:5)时间和空间的表示:比如时间表示为开始时间、结束时间和持续时间;而空间可以用区域表示等;6)时间和空间的同步关系:同步是多媒体数据最重要的特征,例如,时间的同步关系可以表示为顺序关系和并行关系等。模式应该能够根据由时间和空间的同步关系所给定的完整性约束条件对元数据的值进行有效性验证,例如视频序列中的镜头的起始时间必须限定在它所属的场景的起止时间内;7)易读的和机器可理解的。MEDIAASSETMANAGEMENT§5.1.3元数据模式描述元数据特征的元素的集合。属性集确定这些元素的取值范围及规范。受控词集MEDIAASSETMANAGEMENT根据所确定的受控词集,规定一套分类编目方案。受控词分类方案确定记录和存储元数据的格式。表现形式元数据模式定义过程§5.1.1元数据的定义元数据结构实例元数据格式描述(对象方式):Product{Manufacturer:TEXT;
ProductList:LISTOF{Name:ANCHOR;Price:TEXT;}}MEDIAASSETMANAGEMENT§5.1.1元数据的定义元数据的语言:[Wrapper][contentpackage]description.title=“DaysofourLives”descriptionsubtitle=“Episode24”description.owner=“XYZ-TV”[contentitem]description.title=“firstprogramsegment”temporal.duration=00:00:10:05[contentitemelement]video.format=“5254:2:2”video.location=“server1\days24_1.vid”……MEDIAASSETMANAGEMENT§5.1.1元数据的定义元数据标准:网络资源:DublinCore、IAFATemplate、CDF、WebCollections文献资料:MARC(with856Field),DublinCore人文科学:TEIHeader社会科学数据集:ICPSRSGMLCodebook博物馆与艺术作品:CIMI、CDWA、RLGREACHElementSet、VRACore政府信息:GILS地理空间信息:FGDC/CSDGM数字图像:MOA2metadata、CDLmetadata、OpenArchivesFormat、VRACore、NISO/CLIR/RLGTechnicalMetadataforImages档案库与资源集合:EAD技术报告:RFC1807连续图像:MPEG-7MEDIAASSETMANAGEMENTMEDIAASSETMANAGEMENT第5章元数据与媒体数据交换元数据的基本概念1元数据编码语言
2媒体元数据主要标准
3媒体文件交换格式
4§5.2元数据编码语言XML语言简介XML,或称为可扩展标记语言(ExtensibleMarkupLanguage),是一种基于元数据的标记语言。它由万维网协会(W3C)创建,用来克服HTML(即超文本标记语言HypertextMarkupLanguage,它是所有网页的基础)的局限。和HTML一样,XML基于SGML
—
标准通用标记语言(StandardGeneralizedMarkupLanguage)。尽管SGML已在出版业使用了数十年,但其理解方面的复杂性使许多本打算使用它的人望而却步。XML是为Web设计的。MEDIAASSETMANAGEMENT§5.2元数据编码语言使用XML的优点1)保证了元数据的结构化,易于被计算机处理和交流,对人来说也有很好的可读性。2)标记语言采用了最简单的文本格式,使其具有很强的兼容性和不依赖于软硬件平台的独立性,同时这些特性也确保其具有很强的生命力。3)可以将元数据与资源内容的管理结合在一起,元数据描述与其被描述的对象整合在一起大大提高了内容管理与交换元数据的可用性。MEDIAASSETMANAGEMENTXML语言简介HTML始终是最成功的标记语言。您几乎可以在任何设备(从掌上电脑到大型机)上查看最简单的HTML标记,并且您甚至可以用合适的工具将HTML标记转换成语音和其它格式。既然HTML成功了,为什么W3C还要创建XML呢?为了回答这个问题,请查看下面这个文档:<p><b>Mrs.MaryMcGoon</b><br>
1401
MainStreet
<br>
Anytown,NC34829</p>HTML的问题在于它是为人设计的。即使不用浏览器查看上面的HTML文档,大家也会知道那是某个人的邮政地址。MEDIAASSETMANAGEMENTXML语言简介现在让我们来看一个样本XML文档。使用XML,您可以给文档中的标记赋予某种含意。更重要的是,机器也容易处理这样的信息。您只需通过找到<postal-code>
和</postal-code>
标记之间的内容(技术上称为<postal-code>
元素),就可以从该文档抽取邮政编码。MEDIAASSETMANAGEMENTXML语言简介
<address>
<name>
<title>Mrs.</title><first-name>Mary</first-name><last-name>McGoon</last-name></name><street>1401MainStreet</street><citystate="NC">Anytown</city><postal-code>34829</postal-code></address>
MEDIAASSETMANAGEMENTXML可说明每个属性的含义XML语言简介XML文档必须包含在一个单一元素中。这个单一元素称为根元素,它包含文档中所有文本和所有其它元素。在下面的示例中,XML文档包含在一个单一元素<greeting>
中。请注意文档有一行注释在根元素之外;那是完全合乎规则的。<?xmlversion="1.0"?><!--Awell-formeddocument--><greeting>
Hello,World!</greeting>而不包含单一根元素的文档不管该文档可能包含什么信息,XML解析器都会拒绝它。
MEDIAASSETMANAGEMENT§5.2.1
DTD文档定义用来表示数据的元素有两种方法。一种方法是使用文档类型定义(DocumentTypeDefinition),或简称DTD。DTD定义可以在XML文档中出现的元素、这些元素出现的次序、它们可以如何相互嵌套以及XML文档结构的其它详细信息。DTD是最初的XML规范的一部分,与SGMLDTD非常相似。另一种方法是使用XMLSchema。模式可以定义您能在DTD中使用的所有文档结构,它还可以定义数据类型和比DTD更复杂的规则。W3C在提出最初的XML规范的几年之后开发了XMLSchema规范。MEDIAASSETMANAGEMENT§5.2.1
DTD文档DTD允许您指定XML文档的基本结构。
<?xmlversion="1.0"encoding="GB2312"?><!ELEMENT联系人列表(联系人)><!ELEMENT联系人(姓名,编号,单位,职务,电话)><!ELEMENT编号(#PCDATA)><!ELEMENT姓名(#PCDATA)><!ELEMENT单位(#PCDATA)><!ELEMENT职务(#PCDATA)><!ELEMENT电话(#PCDATA)>MEDIAASSETMANAGEMENT§5.2.2
XSL样式单语言W3C正式推荐的样式单标准有两种:一种是层叠样式单(CascadingStyleSheet,CSS);另一种是可扩展样式单语言(eXtensibleStyleLanguage,XSL)。
下面是根据上述的DTD设计的一种XSL样式:<?xmlversion="1.0"encoding="gb2312"?><xsl:stylesheet
xmlns:xsl="/TR/WD-xsl"><xsl:templatematch="/"><html><head><title>XML示例</title></head><body><palign="center"><span>通讯录</span></p><div><xsl:apply-templatesselect="联系人列表"/></div></body></html></xsl:template>……MEDIAASSETMANAGEMENT§5.2.3XMLSchema
Schema意味着标记语言的规范。Schema可由DTD来描述,并得到了广泛的应用。但是,XML
Schema的表现力要远比DTD强得多。按照XMLSchema的规范,上面的DTD文件应该改写成如下形式:<?xmlversion="1.0"encoding="GB2312"?><xs:schema
xmlns:xs="/2001/XMLSchema"> <xs:elementname="ContactList"> <xs:annotation> <xs:documentation>联系人列表</xs:documentation> </xs:annotation> <xs:complexType> <xs:sequence> <xs:elementname="Contact"> <xs:annotation> <xs:documentation>联系人</xs:documentation> </xs:annotation>……MEDIAASSETMANAGEMENTMEDIAASSETMANAGEMENT第5章元数据与媒体数据交换元数据的基本概念1元数据编码语言
2媒体元数据主要标准
3媒体文件交换格式
4§5.3媒体元数据主要标准标准名称
制定机构特点简介应用领域MPEG-7
MPEG组织
描述多媒体内容数据的标准,可支持对多媒体信息在不同程度和层次上的解释和理解,从而根据用户需要进行传递和存取。
数字图书馆多媒体编辑多媒体服务广播媒体电子商务家庭娱乐
TV-AnytimeTV-AnytimeForum针对多媒体数字存储设备个人数字录像机(PDR)实现个性化节目指南的电视元数据,对用户已获取的和可获取的大量视/音频信息进行处理和管理的规范。个人电子节目指南交互式目标广告虚拟频道MEDIAASSETMANAGEMENT媒体元数据主要标准1§5.3媒体元数据主要标准标准名称
制定机构特点简介应用领域DVB-SIDVBConsortium目前应用最广泛的电视节目元数据标淮(主要在欧洲),一般情况下它只提供必需的最小的信息。
电子节目指南DublinCoreMetadata
DublinCoreMetadataInitiative通过对信息数字化及网络资源的描述、管理和定位及评估,为非专业用户提供易于掌握和使用的网络资源著录格式和更多的检索途径,从而提高网络资源的开发利用率。较全面地概括了电子资源的主要特征,简洁、规范、实用。数字图书馆MEDIAASSETMANAGEMENT媒体元数据主要标准2§5.3媒体元数据主要标准标准名称
制定机构特点简介应用领域SMPTE
SMPTE用于和格式无关的节目交换。是目前在影音工业中得到广泛应用的时间码概念。该码用于设备间驱动的时间同步和计数方式。电影电视节目交换SMEF英国国家广播公司(BBC)
媒体素材交换框架,覆盖媒体文件的制作、传送、分发、管理等过程,提供以内容为中心的数据定义的初始集合。广播媒体管理P/Meta
欧洲广播联盟(EBU)
一种通用方法,在音/视频素材的制作和分发期间嵌入元数据,使与节目有关的信息标准化并便于交换。
广播媒体管理MEDIAASSETMANAGEMENT媒体元数据主要标准3§5.3.1SMEF和P/META
SMEF标准媒体交换框架(StandardMediaExchangeFramework,SMEF)由BBC媒体数据组开发。SMEF最初仅是BBC使用的数据模型,后来发展成为一个媒体素材管理框架,即交换模型。SMEF元数据模型包含142个实体和500个属性,覆盖了整个内容生命周期,包括媒体文件的制作、传送、分发、管理等过程,它是目前各级电视台中应用比较广泛的数据模型。MEDIAASSETMANAGEMENT§5.3.1SMEF和P/META
P/METAP/META是欧洲广播联盟EBU的项目,其目标是开发一种通用方法,在音/视频素材的制作和分发期间嵌入元数据,使与节目有关的信息标准化并便于交换。该项目分析了广播机构、内容提供商、消费者之间的信息交换需求,以BBC的SMEF作为核心信息模型,开发出用于EBU成员之间进行媒体交换的商业处理框架(称为欧洲SMEF)。它在媒体生产和分发过程中应用SMPTE的新元数据标准,研究创建针对内容和元数据的统一交换格式的可行性,并在元数据中采用了唯一标识符,作为打包媒体文件和嵌入数据流间连接的关键工具。
MEDIAASSETMANAGEMENT§5.3.2SMPTE元数据字典
SMPTE美国电影电视工程师协会(SocietyofMotionPictureandTelevisionEngineers,SMPTE)开发了SMPTE元数据字典作为捕捉和交换元数据的标准。SMPTE元数据字典主要用于和格式无关的节目交换,其应用最广泛的概念是目前在影音工业中的时间码。SMPTE元数据字典是一个动态的文档,它支持新的定义,SMPTE扮演注册组织的角色。MEDIAASSETMANAGEMENT§5.3.2SMPTE元数据字典
SMPTE媒体元数据概念模型MEDIAASSETMANAGEMENT§5.3.2SMPTE元数据字典
1.活动(Activities)(1)前期制作(Pre-production)(2)素材的获取和产生(AcquisitionandProduction)(3)后期制作(Post-Production)(4)信号分配(Distribution)(5)存储(Storage)(6)传送和发射(Transmission&Emission)(7)归档(Archiving)MEDIAASSETMANAGEMENT§5.3.2SMPTE元数据字典
2.数据平面(Planes)(1)视频元素(VideoEssence)(2)音频元素(AudioEssense)(3)数据元素(DataEssense)(4)元数据(Medadata)MEDIAASSETMANAGEMENT§5.3.2SMPTE元数据字典
3.通信层(Layers)(1)物理层(Physical)(2)数据链路层(DataLink)(3)网络层(Network)(4)应用层(Applications)MEDIAASSETMANAGEMENT§5.3.3都伯林核心集元数据组织法实例介绍——DublinCoreDublinCore产生于1995年3月在美国俄亥俄州的都柏林召开的第一届元数据研讨会,后历经了7次研讨,逐步形成了稳定的元素集。目前DublinCore已得到了国际间的广泛承认,是世界上使用最广泛的元数据格式,具有最强的适应性和最大的弹性。DublinCore元数据元素集1.1版本已成为国际标准ISO15836、美国国家信息标准Z39.85以及其他多个国家标准。MEDIAASSETMANAGEMENTDublicCore的原则简单性原则易用性原则内在性(intrinsicality)原则可扩展性原则句法独立(syntaxindependence)原则可选择性可重复性可修改性§5.3.3都伯林核心集MEDIAASSETMANAGEMENTDC标准的15个核心元素:资源内容描述类元素:Title(题名)、Subject(主题词)、Description(描述)、Type(类型)、Source(来源)、Relation(关联)、Coverage(覆盖范围)知识产权描述类元素:Creator(创建者)、Publisher(出版者)、Contributor(合作者/其他贡献者)、Rights(权限)外部属性描述类元素:Date(日期)、Format(格式)、Identifier(标识符)、Language(语言)§5.3.3都伯林核心集MEDIAASSETMANAGEMENT在实际实用中,仅仅依靠上述15个基本元素是不够的,我们必须加以限定和进行若干子元素的规范描述。为了保证互操作性,在进行限定或子元素规范的时候,不能改变元素本身的定义,不能重新对基本元素作出新解释,而只能根据自己团体和行业需要对DC元素进行限定和规范。都柏林核心集目前已经扩展成一个世界性元数据标准,有五个国家(澳大利亚、芬兰、丹麦、英国、美国)把它确定为国家标准,各类推荐方案被翻译成33种语言。§5.3.3都伯林核心集MEDIAASSETMANAGEMENT节目专用信息(PSI)是在MPEG-2系统层定义的,控制与管理着编组不同音频、视频流成为节目的信息。PSI规定了解码所需的最基本的信息,它是在TS流中插入某些特殊的信息。这些信息占用某些特殊的包标识符PID及表标识符table_id,供解码器按PID提取这些信息。MPEG-2系统层指定的PSI包括节目关联表(PAT)、节目映射表(PMT)、网络信息表(NIT)、条件访问表(CAT)。其中,NIT是可选的,其主要内容属于私有性质,在MPEG-2TS系统中没有规定这个表的格式,而是DVB-SI规定的。§5.3.4DVB-SIMEDIAASSETMANAGEMENTTV-Anytime是由TV-AnytimeForum提出的,是针对多媒体数字存储设备PDR(个人数字录像机)实现个性化节目指南的电视元数据,是对用户已获取的和可获取的大量视、音频信息进行处理和管理的规范。
§5.3.5TV-anytimeMEDIAASSETMANAGEMENT
§5.3.5TV-anytimeMEDIAASSETMANAGEMENT多媒体内容描述接口:“多媒体内容描述接口”(MultimediaContentDescriptionInterface),是运动图像专家组(MPEG)提出的用来描述多媒体内容的标准,简称为MPEG-7。其目标是创建一种描述多媒体内容数据的标准,满足实时、非实时以及推-拉应用的需求。这种描述能对信息的内涵进行某种程度上的解释,而且能被计算机或其他信息设备传递或访问。§5.3.6MPEG-7MEDIAASSETMANAGEMENT多媒体内容描述接口:§5.3.6MPEG-7MEDIAASSETMANAGEMENT描述定义语言DDL描述模式DS描述符DMPEG-7编码的描述描述产生编码器MPEG-7描述多媒体内容过滤代理解码器搜索/查询引擎用户或数据处理系统
MPEG-7应用的一种抽象表示MEDIAASSETMANAGEMENT第5章元数据与媒体数据交换元数据的基本概念1元数据编码语言
2媒体元数据主要标准
3媒体文件交换格式
4
§5.4.1媒体文件交换格式
(1)MXF(Material
ExhangeFormat)格式
是Pro-MPEG组织制定和推广,目标是解决节目制作系统中不同环节的设备间节目素材交换,例如编码器、录像机、非线性编辑工作站、节目存储服务器等,也可以扩展到节目播出系统。MXF文件格式特点:文件具有流式特点,允许传送时浏览文件视音频内容;可用于存储含有Metadata的节目和素材;能把播出串联单打包成卷,并包含同步信息;能支持多种压缩格式(MPEG、DV、非压缩);可用于存储含有简单编辑(仅指剪切)信息的EDL及其工作的素材。MXF格式文件能用IP网络传输,能用SDTI作为传输接口,这可充分利用电视台现有的布线,有利于从信号流传输方式向文件传输方式平滑过渡。MEDIAASSETMANAGEMENTMXF媒体交换格式MXF是为专业视频与广播应用而设计的,用来载运连续的节目素材和元数据,满足通用文件交换格式的要求:1)文件必须在刚开始传输后即可被使用,而无需等待文件传输完成;2)应具有在传输中断后完善的恢复能力;3)格式应该是开放的,与压缩方式无关,与操作系统无关,与运行平台无关;4)标准必须简单。MEDIAASSETMANAGEMENTMXF媒体交换格式MEDIAASSETMANAGEMENTMXF媒体交换应用示例
MXF媒体交换格式1)简单类型MXF数据格式-简单类型如图所示,文件头包含文件的总体信息,说明文件内有什么内容及其安排方式,称为结构型元数据,还有可选的用户定义描述元数据。文件体里有一个内容容器,用于传输隔行扫描的视频/音频数据,以及部分元数据。MEDIAASSETMANAGEMENT文件头文件尾文件体头部包头部元数据内容容器尾部包MXF媒体交换格式2)复杂类型MXF数据格式的复杂类型可包括索引表,如图所示。索引部分包括部分元数据和文件参数,用于文件访问,指示文件体内包括的几个部分:用于流传输中断后再恢复的信息;用于区分场景或片段的信息;用于区分不同场景类型的信息。文件体部分超过整个文件的99%,MXF采用普通容器(GC—GenericContainer)作为文件本体的中间容器。所有视音频流和元数据都装入这个GC中。这个GC有以下项目组成:系统项目、图像项目、声音项目和辅助数据项目。最基本的项目是系统项目。系统项目内含有视音频流
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 房屋建筑合作合同范例
- 暗股合作合同范例
- 房屋银行退租合同范例
- 艺术品租赁与服装设计合作合同
- 工程机具改装合同范例
- 供销贸易合同范例
- 冷库地基合同模板
- 木工厂承揽合同范例
- 材料合同范例提建议
- 2024年鞍山客运从业资格证模拟考试练习题
- 农产品溯源体系构建
- 2024全新物业服务培训
- 装饰图案(第2版)课件 李健婷 模块7、8 装饰图案的组织形式装饰图案在现代设计中的应用
- 企业宣传视频拍摄制作方案
- 2024年初中信息科技测试题及答案1
- 脑出血课件完整版本
- 2024年杭州市房产交易产权登记管理中心招考高频难、易错点500题模拟试题附带答案详解
- 《深度学习入门-基于Python的实现》 课件全套 吴喜之 1-9 从最简单的神经网络说起- -TensorFlow 案例
- 年产80万件针织服饰技改项目可行性研究报告写作模板-申批备案
- 起重机械使用单位安全总监题库
- 液压传动智慧树知到答案2024年武汉科技大学
评论
0/150
提交评论