1、 多媒体信息处理( Multimedia Computing )张福炎2000/11/72022/9/221内 容0 Space of Multimedia Computing1 Media and Multimedia2 Media Processing2.1 Media Food(Value) Chain2.2 Digital Item Declaration2.3 Multimedia Content Representation(coding)2.4 Digital Item Identification and Description2.5 Content Management an
2、d Usage3 Networked Multimedia Applications2022/9/222以文本为主以音频为主以视(音)频为主离散媒体:text, image,连续媒体:audio, video, .0 多媒体信息处理空间媒体处理媒体类型单媒体复合媒体应用模式单机应用模式网络应用模式获取(创建)编 辑管 理 传 输检 索描 述展 现说 明编 码2022/9/223多媒体信息处理的总目标 To enable transparent and augmented use of multimedia resources across a wide range of networks an
3、d devices.使能跨越各种不同网络和设备, 透明地、强化地使用多媒体资源。2022/9/2241.1 计算机与媒体媒体又称媒介、媒质,指的是用于表示、存储、分发、传输和展现数据(信息) 的手段、方法、工具、设备或装置。 ( In general, one describes medium as a means for representation, storage, distribution, transmission and presentation of data. )2022/9/226计算机与媒体CPUOutputDeviceStorageInputDevice表示媒体存储媒体展
4、现媒体展现媒体感觉媒体感觉媒体表示媒体传输媒体2022/9/227 感觉媒体 表示媒体举例视觉媒体文字景象听觉媒体语言声音触觉媒体嗅觉媒体味觉媒体力,运动,温度气味滋味声音景象类 型 名 称 分类 时间属性/空间属性/生成属性 图象(image)图形(graphics)文本(text)视频(video)动画(animation)合成语音MIDI音乐(MIDI)MP3音乐波形声音(wave)2022/9/229表示媒体的时间属性time-independent ( discrete ) media(离散媒体,值不会随着时间而变化)text , graphics , static image, .
5、time-dependent ( continuous ) media (连续媒体,值随着时间而变化)speech , music , video , animation, .2022/9/2210表示媒体的空间属性1D媒体单声道speech , music , 2D媒体双声道music ; text , image , 2D graphics ,3D及多维媒体3D graphics , 全景图像 , 空间立体声music , 2022/9/2211表示媒体的生成属性自然媒体(使用数字化方法从现实世界获取的媒体)取样声音 , image , video合成媒体(使用计算机创建的媒体)合成语音,
6、 MIDI , graphics , animation2022/9/2212多媒体系统中听觉媒体的分类 来源 机外形式 空间属性 媒体名称 语言 1D 波形语音 语言 多维 多声道波形语音 非语言 1D 波形声音 非语言 多维 双声道/3D立体声 语言 1D 合成语音 语言 多维 多声道合成语音 音乐 1D 合成音乐(MIDI音乐) 音乐 多维 多声道合成音乐自然媒体合成媒体2022/9/2213多媒体系统中视觉媒体的分类 来源 机外形式 时间 空间属性 媒体名称 文字 静止 2D 取样文本 图画 静止 2D 取样图像(image) 图画 静止 3D 全景图像 图画 活动 2D 视频(vid
7、eo) 图画 活动 3D 临境视频 文字 静止 2D 编码文本(简称文本) 图画 静止 2D 二维图形 图画 静止 3D 三维图形 图画 活动 2D 二维动画 图画 活动 3D 三维动画自然媒体合成媒体2022/9/22141.3 多媒体 多媒体强调的是使用多种媒体、综合表达信息内容并进行交互式处理的技术。从本质上来说,它具有三种最重要的特性:1 媒体的多样性,其中至少有一种连续媒体;2 媒体的集成性(综合性),多种不同媒体综合地表现某个内容,取得更好的效果;3 处理的交互性,使人们获取和使用信息的过程中具有细粒度的控制和操纵能力。2022/9/2216多媒体是信息技术发展的必然趋势计算机通
8、信大众传媒数值计算数据处理图形、图象处理声音处理视频处理邮 政电 报电 话传 真数据通信综合业务(N-ISDN)多媒体书,刊,报纸广 播电 影电 视光盘出版物交互电视网络出版支持宽带综合业务的数据通信网络信息技术走向汇聚和融合2022/9/22172.1 媒体食物(价值)链2022/9/2219媒体处理内容对媒体进行的各种处理:媒体准备(media preparation)媒体获取/媒体创建媒体编辑(media editing)媒体集成/组合(media integration / composition)结构描述、特征描述、应用描述.媒体通信/发送(media communication /
9、 delivery)媒体消费(media consumption)媒体转换(码),展现, 浏览, 检索,.2022/9/2220媒体食物(价值)链多媒体作品(文档)媒体集成媒体编辑媒体准备媒体编辑媒体准备媒体编辑媒体准备媒体编辑媒体准备网络媒体通信媒体消费文本图像音频视频内容(content)媒体展现媒体消费媒体展现数字项 (digital item)2022/9/2221多媒体(内容)处理的7要素1 数字项目说明(Digital Item Declaration)2 内容表示(Content Representation)3 数字项目的标识与描述(Digital Item Identific
10、ation and Description)4 内容管理与使用(Content Management and Usage)5 知识产权管理与保护(Inte11ectual Property Management and Protection)6 内容发送与终端及网络(Terminals and Networks)7 事件报告(Event Reporting)。2022/9/22222.2 Digital Item Declaration2022/9/2223GoalEstablish a uniform and flexible abstraction and interoperable sc
11、hema for defining digital items.为定义数字项而建立一个统一、灵活的抽象表示和可互操作的模式。2022/9/2224Digital Item Declaration的需求An individual element may be referenced by multiple locations within a digital item. 一个元素可以被数字项中的多个地方引用.To enable applications to correctly manipulate and validate digital items.能使应用程序正确操纵和验证数字项.Ident
12、ification and revision of digital items and their components must be supportable in an open and extensible manner.对数字项及其组件的标识和修改必须以开放和可扩展的方式进行.2022/9/2226Digital Item Declaration的需求2Digital items explicitly define the relationships between elements and their corresponding descriptors.数字项对其元素与相应描述符之间
13、的关系显式地进行定义Descriptors may be simple statements or full media components.描述符可以是简单语句也可以是整个媒体组件Descriptors can be described by other descriptors.描述符也可以由其它描述符描述Anchors must be declarable within a component that allow:descriptors to be associated with a specific point or range within a media resource.lin
14、king back from within a media resource to the anchor.锚(anchor)必须在一个组件中予以说明,从而允许描述符与媒体资源中的一个指定点或指定范围相关联,也允许从媒体资源反向链接到锚。2022/9/2227举例: MPEG-4的场景说明MPEG-4 视听场景(audiovisual scenes) 是由若干媒体对象(media objects)以层次方式组合而成的,最低层的称为初级(primitive) 媒体对象, 如: still images (e.g. as a fixed background), video objects (e.g
15、. a talking person - without the background) audio objects (e.g. the voice associated with that person); text and graphics; talking synthetic heads and associated text used to synthesize the speech and animate the head;synthetic sound初级媒体对象既可以是自然媒体,也可以是合成媒体,既可以是 2维的,也可以是3维的。2022/9/2229MPEG-4的场景说明MPE
16、G-4视听场景的描述可以看作一棵树, 叶节点是初级媒体对象, 中间节点是复合媒体对象(compound media objects),根节点则为场景。使用这种方法, 内容提供商(作者)可以构造出相当复杂的场景, 例如: place media objects anywhere in a given coordinate system; apply transforms to change the geometrical or acoustical appearance of a media object; group primitive media objects in order to fo
17、rm compound media objects; apply streamed data to media objects, in order to modify their attributes (e.g. a sound, a moving texture belonging to an object; animation parameters driving a synthetic face); change, interactively, the users viewing and listening points anywhere in the scene. 2022/9/223
18、0视听场景的说明由4个复合媒体对象(人,背景,家具,音视演示)组成。系统定义了一个场景坐标系, 然后可以指定组成该场景的媒体对象在该坐标系中的位置,并可设定用户观察该场景时所在的坐标位置,这些位置信息都会包含在场景的描述中。2022/9/2231视听场景的说明2022/9/2232视听场景的说明1 对象是如何组合在一起的。MPEG-4的场景的组织呈树状结构,它是一个无回路的有向图,图中每个节点代表一个媒体对象。树的结构未必是不变的,当增加节点、删除节点或替换节点时,节点的属性(如位置参数)就会发生修改。2 对象的空间和时间定位。MPEG-4中,每一个视听对象都有其空间和时间范围, 有自己的局部
19、坐标系。局部坐标系是用作在空间和时间范围内操纵该媒体对象的手柄(handle) ,通过指定一个将对象从局部坐标系变换到全局坐标系的坐标变换,可以将媒体对象放置在场景中规定位置处。3属性值选择。单个的媒体对象和场景描述节点向组合层(composition layer)提供了一组参数,从而使它们的部分行为可以进行控制。例如: 声音的音调,合成对象的颜色,可分级编码的增强信息的起用和停止等。2022/9/2233多媒体内容的展现2022/9/22342.3 Multimedia Content Representation(coding)2022/9/2235 Rationale (基本原理)Con
20、tent 是多媒体技术框架中最重要的要素, 它需要进行编码、标识、描述、存储、分发、保护、交易、消费等等。它以满足一组需求的数字编码方式表示,数字内容的有效表示将会允许开展许多新的服务.2022/9/2236Requirements 1Data Types it shall be possible to represent a large range of data types, both with natural and synthetic origin, as well as any combination of these data types, e.g. still pictures,
21、 frame-based as well as arbitrarily shaped video, specific and generic 3D models, graphics, text, natural and synthetic audio, natural and synthetic speech, etc.数据类型:应能够表示各种不同的数据类型,包括自然的和合成的,也包括两者的组合。如:静止图像,其于帧的视频,任意形状的视频,专用的和通用的3D模型,图形,文本,自然声音和合成声音,自然语音和合成语音等。 2022/9/2237Requirements 2Content Varie
22、ty it shall be possible to represent any type of content for all the data types considered. 内容种类:上述所有数据类型应能表示任何种类的内容。 2022/9/2238Requirements 3Efficiency it shall be possible to represent content for each of the data types above mentioned in the most bit efficient way for different target qualities;
23、 for a multimedia scene composed as a combination of various elements of the data types mentioned above, it shall be possible to selectively choose the coding efficiency/quality for each one of them. 有效性:根据不同的目标质量,上述每一种数据类型都使用最有效的数据位来表示内容。对于由不同数据类型的多种元素组成的多媒体场景,应能对每个元素选择其编码的效率/质量。2022/9/2239Requirem
24、ents 4Scalability it shall be possible to represent all the elements in the multimedia scene in a scalable way and with a fine granularity in the dimensions considered relevant, e.g. spatial, temporal, quality.可分级性:应能以一种可分级的方法来表示多媒体场景中的所有元素,且在所考虑的相关维度如时间、空间、质量上是细粒度可分级的。2022/9/2240Requirements 5Rando
25、m Access it shall be possible to randomly access, within a limited time and with fine resolution, at all scalable layers, all elements in the multimedia scene; for a multimedia scene composed as a combination of various elements of the data types mentioned above, it shall be possible to randomly acc
26、ess each one of them.随机存取:在一定时间内,以比较精细的分辨率,在所有可分级的层次中,对多媒体场景中的所有元素可以进行随机存取;对于由不同数据类型元素组成的多媒体场景,应能随机存取场景中的每一个元素。2022/9/2241Requirements 6Error Resilience it shall be possible to selectively protect the various elements in a multimedia scene against channel errors with relevant error patterns, e.g. mo
27、bile networks, ATM networks or storage media.出错恢复:对多媒体场景中的各种元素,应能有选择地进行保护,以免受到通道错误的影响,如移动网络、 ATM网络或存储介质错误等。 2022/9/2242Requirements 7Interaction it shall be possible to interact with the various elements in the multimedia scene, with a fine granularity, both in space and time; for a multimedia scene
28、 composed as a combination of various elements of the data types mentioned above, it shall be possible to independently interact with each one of them.交互:无论是时间和空间,应能以细粒度方式与多媒体场景中的各种元素进行交互;对于由不同数据类型元素组成的多媒体场景,应能单独同其中的每个元素进行交互。2022/9/2243Requirements 8Synchronization it shall be possible to synchroniz
29、e all the elements in the multimedia scene as well as other relevant data.同步:应能对多媒体场景中所有元素以及其它相关数据进行同步。2022/9/2244Requirements 9Multiplexing it shall be possible to multiplex the coded data corresponding to the various elements in the multimedia scene as well as other relevant data. 复用:应能对多媒体场景中不同元素
30、的编码数据以及其它相关数据进行复用。2022/9/2245Current Situation编码问题已研究了很多年,已经有了很多有名的标准,涉及许多种媒体, 满足了不同类型的需求. 例如:still pictures: JPEG, JPEG-LS and JPEG2000frame-based video: H.261, H.263, MPEG-1 and MPEG-2 Video object-based pictures and video: MPEG-4 Visual. audio: MPEG-1, MPEG-2 and MPEG-4 Audio, speech: G.723, G.72
31、8 and MPEG-4 Audio.synthetic visual content, VRML and MPEG-4 synthetic audio content , MIDI and MPEG-4 Audio.尽管这些标准在满足相关需求方面已相当完整,但现有标准并不完全满足某些需求。2022/9/2246例1: 数字声音的编码标准ITU(CCITT): G.711,721,722,编码对象:自然语音应用领域:通信ISO/IEC:MPEG-1 audio (11172-3) : 1993MPEG-2 BC (13818-3) : 1995MPEG-2 AAC (13818-7) : 19
32、98MPEG-4 audio (14496-3) : 19992022/9/2247编码对象:自然声音(全频道) 取样频率(kHz) 声道数目MPEG-1 audio : 32, 44.1, 48 单,双MPEG-2 BC : 增加16, 22.05, 24 5.1, 7.1MPEG-2 AAC : 8-96 48个主声道, 16个LFE, MPEG-4 audio : 8-962022/9/2248编码对象:合成声音 MPEG-1 audio : 无MPEG-2 BC : 无MPEG-2 AAC : 无MPEG-4 audio : 合成语音, 合成音乐2022/9/2249输出码率 码率范围
33、(kbps) 全频道声音MPEG-1 audio : 32-384 384(I), 256-192(II), 128-112(III)MPEG-2 BC : 8-640 同MPEG-1MPEG-2 AAC : 8-160/CH 约 64/CHMPEG-4 audio : 2-64/CH 约 64/CH2022/9/2250功能(functionality)MPEG-1 audio :对错误的鲁棒性功能MPEG-2 BC : 对错误的鲁棒性功能MPEG-2 AAC :对错误的鲁棒性,可分级性功能MPEG-4 audio : 播放速度控制功能音调(pitch)变化功能对错误的鲁棒性功能可分级性(s
34、caleability)功能2022/9/2251可分级性(scaleability)功能MPEG-1 audio :无MPEG-2 BC : 无MPEG-2 AAC : 取样率可分级(SSR)MPEG-4 audio : Bit rate scalabilityBandwidth scalabilityEncoder complexity scalabilitydecoder complexity scalability2022/9/2252编码原理MPEG-1 audio ,MPEG-2 BC, MPEG-2 AAC : 基于心理声学的感知编码,特别是频率域的听觉掩蔽特性.MPEG-4 a
35、udio : 各种编码技术通用声音编码器对MPEG-2 AAC 作了改进和扩充;自然语音编码器对LPC, CELP等作了改进和扩充,增加了可分级性功能.2022/9/2253Scalabilities in MPEG-4/CELP2022/9/2254对“对象”的支持MPEG-1 audio ,MPEG-2 BC, MPEG-2 AAC : 不支持MPEG-4 audio:把声音对象定义为“可听见的语义实体”.若干声音对象可以组合或混合在一起成为一个复合对象, 称为Audio-Composition Objects:Natural audio,Synthetic audio,ControlOp
36、erations on objects:SynchronizeDecodeCompose into compound objectsPresentInteract2022/9/2255MPEG-4 声音的应用2022/9/2256例2: JPEG2000的目标1 Superior low bit-rate performance: 例如具有丰富细节的灰度图像在不牺牲其性能时压缩比低于0.25 bpp. 这是优先级最高的目标,网络图像传输和遥感需要此特性.2022/9/2257JPEG2000的目标2 Continuous-tone and bi-level compression: 使用相似的
37、系统资源,既能压缩连续色调图像又能压缩2值图像. 可处理各种动态范围的图像 (如每个颜色分量 1 bit to 16 bit). 此类应用有混合文档,带有注释的医学图像,图表及带有2值或近似2值区域、 alpha平面和透明面的计算机合成图像,传真图像等。2022/9/2258JPEG2000的目标3 Lossless and lossy compression: 提供无失真压缩累进式解码。此类应用有医学图像,图像存档,网络应用,印前图像处理。4 Progressive transmission by pixel accuracy and resolution: 以像素精度或分辨率作为单位的累进
38、式传输。此类应用有WWW,图像存档,打印机等。2022/9/2259JPEG2000的目标5 Fixed-rate, fixed-size, limited workspace memory: 固定速率指的是给定数目的连续像素编码后比特数应小于等于一定值,这就允许解码器在带宽有限的通道上进行实时解码,如遥感图像,运动编码等。 固定大小指的是一幅完整图像的码流的大小应为定值,这就允许存储空间有限的硬件能保存一个完整的码流(不管图像大小), 例如扫描仪,打印机等。2022/9/2260JPEG2000的目标6 Random codestream access and processing: 随机码
39、流存取指:允许用户定义图像中感兴趣的区域( Regions-Of-Interest, ROI) ,并能以较小的失真对它进行随机存取and/or 解码; 随机码流处理包括:rotation, translation, filtering, feature extraction, scaling, etc.2022/9/2261JPEG2000的目标7 Robustness to bit-errors: 这在无线通信时很重要。由于解码时码流中的某些部分在决定图像质量方面比其它部分更加重要, 码流的正确设计能帮助后继的错误改正系统以减轻解码错误。2022/9/2262JPEG2000的目标8 Ope
40、n architecture: 开放的体系结构能为不同类型的图像和应用优化系统性能。做法是开发高灵活性的编码工具或采用描述语言分发和集成新的压缩工具。允许用户选择适合其应用和将来发展的工具,解码器只要实现核心的一组工具和能理解码流的一个语法分析器,在需要时,解码器可以向“源”请求发送一个未知的工具。2022/9/2263JPEG2000的目标9 Sequential build-up capability (real time coding): 能顺序地一趟对图像进行编码和解码,对图像的分量可以交错地也可以顺序地进行处理。压缩和解压缩期间,使用的上下文应限定在合理的像素线数目内。2022/9/
41、2264JPEG2000的目标10 Backwards compatibility with JPEG: It is desirable to provide for backwards compatibility (or easy transcoding) with the current JPEG standards.2022/9/2265JPEG2000的目标11 Content-based description: Finding an image in a large database of images is an important problem in image proces
42、sing. For example, a doctor could request only images from a set that are recognized to have a certain type of tumor. This could have major applicability to the medical, law enforcement and environmental communities, and for image archival applications. Regardless of the techniques used, JPEG 2000 s
43、hould strive to provide the opportunity for solutions to this problem.2022/9/2266JPEG2000的目标12 Protective image security: 保护数字图像安全。方法如: watermarking, labeling, stamping, fingerprinting, encryption, scrambling, etc. Labeling is already implemented in SPIFF and must be easy to transfer back and forth
44、to JPEG 2000 image file. Stamping is a mark set on top of a displayed image that can only be removed by a specific process. Encryption, and scrambling can be applied on the whole image file or limited to part of it (header, directory, image data) to avoid unauthorized use of the image. (Note: The is
45、sue of whether JPEG2000 should cover specific solutions to encryption, watermarking, authentication algorithms should be revisited)2022/9/2267JPEG2000的目标13 Compatibility with ITU-T recommendations for image exchange: 传真也是JPEG 2000的应用, ITU-T关于图像交换的建议也将用来交换和发送JPEG 2000的编码图像 ,JPEG 2000编码图像也会符合 ITU-T Re
46、c关于灰度图像和彩色图像编码的需求。2022/9/2268JPEG2000的目标14 Interface with MPEG-4: JPEG2000所开发的压缩静止图像的编码工具应当以合适的接口提供给MPEG-4,从而允许交换和集成(与MPEG-4之类的面向语法的编码方案框架),特别是在向/从运动图像嵌入/抽取静止图像时,必须保持知识产权信息IPR。2022/9/2269JPEG2000的目标15 Side channel spatial information (transparency): alpha平面和透明平面之类的边通道空间信息,可用于传输有关图像处理(如显示、打印或编辑等)信息时有
47、用,例如透明平面可用于WWW应用。2022/9/2270JPEG2000的目标16 Object Based Functionality -Object based composition: 具有任意形状(或透明性)的多个对象将允许用户能非常灵活地复合出许多不同的静止图像。Object based information embedding: 附加在每个对象上的对象描述信息,为数字图像的索引和检索提供了一种有效的方法。2022/9/22712.4 Digital Item Identification and Description2022/9/2272Rationaledigital ite
48、m that is identified and described is more manageable and bears a higher value. A digital item that is identified and described enables a large number of possible applications including IPMP, search, filtering, cataloguing, 经过标识和描述的数据项更便于管理,因而具有更高的使用价值。经过标识和描述的数据项将会使大量的应用成为可能,例如: IPMP、搜索、滤波、分类 。 202
49、2/9/2273Expected impact A framework for common identification and description of digital items will enable efficient deployment of business models and applications requiring rights management, automated transaction and billing, monitoring, search, retrieval, cataloguing, 一个用于数字项的公用标识和描述框架,将会使得需要版权管理
50、、自动交易和支付、监控、搜索、检索、目录服务等功能的商业模型和应用得到更加有效的开展。2022/9/2274Requirements 1(标识什么?)Content: which could be a representation of the abstract work(内容的摘要表示)Transactions and/or Contracts: such as transaction number(内容交易和/或合同的标识)Physical and/or Legal Persons: Rights Holders, Licensees, Publishers, Providers, Dis
51、tributors, Retailers, Consumers(物理人和/或法人的标识)Usage rules: Copy, Pay per view, Pay per listen, (使用规则的标识)2022/9/2275Requirements 2 (对标识的使用)Access authorization(访问授权): read, change, write, 与标识符和描述符的交互应是灵活的、多种多样的。例如,根据不同的应用,对它们的存取可以采用简单的、加密的或者嵌入的方式,可以授权也可以不授权。2022/9/2276Requirements 3 (标识的操作模式)Systems an
52、d processes for identification should ensure persistency and consistency.标识系统和标识方法应保证持久性和一致性。 Systems for description should ensure consistency. Identification and description should be coherent with each other.描述系统应保证一致性。标识与描述应连贯一致。More over, they should also allow both static and dynamic identific
53、ation and description schemas e.g. the ID and description of a digital item could be changed when its right holder changes.应既允许静态的标识与描述方案也允许动态的方案,例如当数字项的版权持有者改变时, 其ID和描述也应随之改变。2022/9/2277Requirements 4 (标识的成本)Systems and processes for identification and description should allow a full range of appli
54、cations and business models from low cost and simple approaches to richer and more sophisticated ones. 用于标识与描述的系统和方法,应允许全范围的应用和商业模型, 从低成本、简单方法到高代价、复杂方法都能支持。2022/9/2278Current Situation 1所有权标识(辨认)是一项支离破碎的、无穷尽的、动态变化的工作,它涉及法律(legal)和契约(contractual)问题.目前,所有权标识系统与标准化的标识方法同时存在,一些标识符已成功地应用了多年,但只是针对单媒体类型, 如
55、ISBN(国际标准书号)、ISRC(International Standard Recording Code)、URN(Universal Resource Number全球资源号)、 URI(Universal Resource Identifier全球资源标识符)等。有些工作正在进行之中,如 ISAN(International Standard Audiovisual Number国际标准音视频号码)、 ISWC(Information System Work Code信息系统工作码)、 DOI(Digital Object Initiative数字对象创新计划)、 cIDf(cont
56、ent ID forum,内容 ID论坛)。2022/9/2279Current Situation 2Lack of integration between the different schemas of different sectors(不同部门不同方案之间缺少集成)Lack of standard dynamic identification schemas when entities related to the content (digital item) change(当与内容关联的实体变化时,缺乏标准的动态标识方法)Lack of standard methods to di
57、fferentiate between versions of a digital item when it is revised(缺乏区分不同版本数字项的标准方法)2022/9/2280Current Situation 3Lack of interoperability among identification schemas for the purpose of common applications e.g. automated transaction/billing systems.(在自动交易/支付系统之类的公共应用中,标识方案缺少互操作性)Lack of internationa
58、l standard identification schemas for some entities (i.e. text, images, speech, etc.)(某些实体缺少国际标准的标识方案)Lack of granularity definition/guideline for giving an ID to a digital item(为数字项赋于ID时,缺少粒度大小的定义/指导)2022/9/2281Current Situation 4Lack of scalability in the identification process accommodating from
59、self-publishing to large scale identification.(标识过程中缺少可分级性)Conflicting requirements to identify a digital item depending on the purpose of identification, such asCommerce (search, purchase, acquisition, etc) Rights management 由于标识的目的不同(如商业目的和版权管理目的),引起需求的冲突.Inconsistency of schemas between and withi
60、n media sectors(在媒体之间或媒体内部标识方案的不一致性)2022/9/2282举例: MPEG-7 (Multimedia Content Description Interface) Context(背景)世界各地的数字化视听信息越来越多. 人们在使用任何信息之前,首先要找到信息。然而,信息越来越多,检索越来越困难. 目前,检索文本信息有一些办法,WWW上就有许多text-based search engines . 然而,由于视听材料没有通用的可识别的描述,因此无法进行识别. 寻找内容的问题不仅在数据库检索应用中存在,在其它领域也存在,如数字广播的频道越来越多,如何找到感兴
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
- 2025-2030全球重组骨形态发生蛋白行业调研及趋势分析报告
- 2025-2030全球手术台专用管线固定器行业调研及趋势分析报告
- 2025年度厂房出租加工合同(含原材料供应)4篇
- 2025至2030年中国自动检测仪数据监测研究报告
- 2025至2030年中国电梯导轨部件数据监测研究报告
- 2025至2030年中国消防民用灯数据监测研究报告
- 2025至2030年中国微型光电开关数据监测研究报告
- 2025年度物流车辆承包租赁与维护合同4篇
- 专业离婚合同模板:无争议感情不和案例(2024年版)版
- 二零二五年度企业股权代持合作协议书3篇
- 2024至2030年中国膨润土行业投资战略分析及发展前景研究报告
- 【地理】地图的选择和应用(分层练) 2024-2025学年七年级地理上册同步备课系列(人教版)
- (正式版)CB∕T 4552-2024 船舶行业企业安全生产文件编制和管理规定
- JBT 14588-2023 激光加工镜头 (正式版)
- 2024年四川省成都市树德实验中学物理八年级下册期末质量检测试题含解析
- 九型人格与领导力讲义
- 廉洁应征承诺书
- 2023年四川省成都市中考物理试卷真题(含答案)
- 泵车述职报告
- 2024年山西文旅集团招聘笔试参考题库含答案解析
- 恢复中华人民共和国国籍申请表