




已阅读5页,还剩11页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
独独 创创 性性 声声 明明 本人声明所本人声明所呈交的学位论文是本人在导师指导下进行的研究工呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。 据我所知, 除了文中特别加以标注和致谢的地作及取得的研究成果。 据我所知, 除了文中特别加以标注和致谢的地 方外, 论文中不包含其他人已经发表或撰写过的研究成果, 也不包含方外, 论文中不包含其他人已经发表或撰写过的研究成果, 也不包含 为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。确的说明并表示谢意。 签名:签名: 陈陈 周周 国国 日期:日期: 2006 年年 5 月月 22 日日 关于论文使用授权的说明关于论文使用授权的说明 本学位论文作者完全了解电子科技大学有关保留、 使用学位论文本学位论文作者完全了解电子科技大学有关保留、 使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁和磁 盘, 允许论文被查阅和借阅。 本人授权电子科技大学可以将学位论文盘, 允许论文被查阅和借阅。 本人授权电子科技大学可以将学位论文 的全部或部分内容编入有关数据库进行检索, 可以采用影印、 缩印或的全部或部分内容编入有关数据库进行检索, 可以采用影印、 缩印或 扫描等复制手段保存、汇编学位论文。扫描等复制手段保存、汇编学位论文。 (保密的学位论文在解密后应遵守此规定)(保密的学位论文在解密后应遵守此规定) 签名:签名: 陈陈 周周 国国 导师签名:导师签名: 周周 正正 欧欧 日期:日期: 2006 年年 5 月月 22 日日 摘要 i 摘要 本论文讨论了一种基于以太网的多媒体通信终端机的设计方案,并给出了一 个采用嵌入式 x86+内核的嵌入式处理器加专用视频编解码芯片组成的终端机实 例, 为多媒体通信终端机提供了一种硬件平台的参考。 在 linux 环境下对该系统进 行了相应的软件编程,实现系统各参数的控制以及相应的网络功能。 以太网技术和音视频压缩技术在最近十年的迅速发展,使得在局域网内的多 媒体通信得以实现。近年视频多媒体技术得到了业界的普遍关注,被认为是最有 前景的领域。目前基于以太网的 h.323 多媒体通信系统已成为了研究和开发的热 点。 多媒体视频终端是 h.323 多媒体通信终端的组件之一。为保证系统的稳定性 和可扩展性并加快开发速度,采用模块化设计的方法。从硬件设计的角度,系统 硬件应尽可能采用集成度高的方案;从软件设计的角度,应该采用基于操作系统 的模块化软件开发方法。 经过论证和比较,权衡了开发难度和系统性能,在多媒体视频会议终端设计 中采用了基于 x86 内核片上系统芯片 stpc 的主控制器模块,基于 vw2010 芯片 的 mpeg-4 音视频编解码器模块,基于 rtl8139 芯片的 10m/100m 以太网适配器 模块的硬件架构, 主控制模块运行 linux 操作系统, 作为多媒体终端的软件运行环 境及软件开发环境。 本人的工作主要包括: 1.参与终端机系统方案的设计。 2.完成对 rtl8139 芯片功能的验证,完成原理图,pcb 图,实现网络功能的 集成。 3.调试终端机系统硬件及程序。 4.编写网络传输程序、osd 菜单程序、红外线控制程序、云台控制协议。 关键字:多媒体通信终端,mpeg-4,以太网,linux,osd 菜单 abstract ii abstract this dissertation discussed a solution of terminal in multimedia communication based on ethernet.and give a reference of constructing a platform of hardware,which consist of embeded cpu based on x86 core and chips of coding video. in linux os,we programmed to realize some functions,to control and change parameters of terminal on live. in lan,multimedia communication can be realized with largle development of ethernet and video data compression in recent years.multimedia have being designed widely,which is a hotspot in the field.to ensure the stability and expansibility of terminal,we adopt method of design based on module.hardware of terminal should be largely integrated;software of terminal should be designed on module based on os,also. with argumentation and comparing the difficulty of developing in different ways,in multimedia communication the terminal make up with mpeg-4 encoder and decoder based on vw2010 chip,main controller based on x86 core and pc compatible stpc soc chip, ethernet adapter based on rtl8139.and this hardware platform can run linux operation system. the following works are done by auther. 1.participate in designing the project of multimedia terminal. 2.individually designed ethernet adapter based on rtl8139 chip,finished schematic,pcb,debugging,and make it integrated in the terminal to work. 3.debug the hardware of the multimedia terminal to make it work. 4.programme procedure of translating data on net,osd menu displaying and communication on serial ports.finished debugging and realized these function. keywords:multimedia terminal, mpeg-4, ethernet, linux, osd menu displaying 目录 iii 目录 第一章 引言 . 1 1.1 视频数据压缩的意义 . 1 1.2 数据压缩标准的演进 . 1 1.3 h.323 标准概述 . 3 1.4 以太网技术的发展 . 4 1.5 课题概述 . 4 第二章 相关理论简述 . 6 2.1 视频编码机制 . 6 2.2 视频压缩国际标准 . 7 2.2.1 jpeg 标准和 h.26x 系列标准 . 7 2.2.2 mpeg 系列标准 . 8 2.3 mpeg-4 的主要技术 . 10 2.4 以太网技术 . 13 2.4.1 什么是以太网? . 13 2.4.2 以太网的组成 . 14 2.5 h.323 协议族 . 15 第三章 系统方案设计及实现 . 19 3.1 系统原理、功能模块及相关指标 . 19 3.1.1 系统概述 . 19 3.1.2 多媒体通信终端的主要关键技术 . 20 3.1.3 多媒体通信终端的类型 . 21 3.1.4 本多媒体终端的性能要求 . 22 3.2 基于 vw2010 芯片的视频编码解码模块的设计与实现 . 23 3.2.1vw2010 芯片的介绍 . 23 3.2.2 编解码模块的原理及实现 . 25 3.2.3 总结 . 30 3.3 系统网络模块的设计与实现 . 31 3.4 基于 stpc 芯片的系统主机模块的设计与实现 . 34 目录 iv 3.4.1 处理器 stpc 简介 . 35 3.4.2 电路设计要点 . 36 3.4.3 pci 接口的设计 . 41 3.5 系统调试 . 43 第四章 系统软件设计及实现 . 53 4.1 软件设计概述 . 53 4.1.1 linux 简介 . 53 4.1.2 gcc . 55 4.1.3 vi . 56 4.1.4 make . 57 4.2 网络传输程序设计实现 . 58 4.2.1 网络协议简述 . 58 4.2.2 网络传输函数的编写 . 59 4.2.3 传输函数的测试 . 65 4.3 osd 菜单显示实现 . 67 4.4 红外线、云台控制模块实现 . 70 第五章 总结 . 74 致谢 . 75 参考文献 . 76 个人简介 . 78 第一章 引言 1 第一章引言 1.1 视频数据压缩的意义1 随着现代通信技术和业务的发展,人们对通信的需求已经由最初的单一语音 需求转变为对视频和音频的通信需求,以传送语音、数据、视频为一体的视频通 信业务成为通信领域发展的热点,以点到点或多点视音频通信为主要形式的视频 会议、远程医疗、远程教育等多媒体通信服务得到越来越多的使用。 在多媒体系统中,要处理一幅全彩色的 640480 视频图像。要占用 1mb 的 存储空间,按电视信号每秒 30 幅图像计算,播放 1 秒需要 30mb,播放 1 小时就 需要 108gb 容量。一张 600mb 的光盘,只能存储 20 秒的视频图像。这样看来, 存储容量远远不能满足要求,高的传输速度也是通信系统所不能承受的。因此, 解决这一突出矛盾成为多媒体实用化的关键。其中,最重要的就是数据压缩技术。 把庞大的图像数据压缩到可以接受和能够处理及传输的地步,是非常必要的。 图像信息数据压缩是如何进行的呢?从信息论观点来看,图像作为一个信源, 描述信源的数据是信息量(信源熵)和信息冗余量之和。信息冗余量有许多种:如空 间冗余,时间冗余,结构冗余,知识冗余,视觉冗余等,数据压缩实质上是减少 这些冗余量。可见冗余量减少可以减少数据量而不减少信源的信息量。从数学上 讲,图像可以看作一个多维函数,压缩描述这个函数的数据量实质是减少其相关 性。另外在一些情况下允许图像有一定的失真,而并不妨碍图像的实际应用。 数据压缩就是利用这些冗余在传输和存储的时候,去除冗余信息达到对数据压缩 的目的。 由此可见,在“信息爆炸”时代对数据的压缩是至关重要的。数据压缩不仅 使技术得以实用,更给社会经济带来了积极的作用。可以说有了数据压缩技术, 多媒体通信以及各种多媒体业务才能得以实现。 1.2 数据压缩标准的演进146 自 1985 年以来,国际标准化组织(iso)和国际电信联盟(itu)标准化部门 就发布了全球统一的图像和视频编码算法的建议。在 1989 年,iso 推出了最初的 图像编码标准 jpeg(联合图像专家组) ,后来被 itut 作为静态图像压缩的标准 第一章 引言 2 所采用。在 1991 年 11 月,iso 发布了视频编码标准草案 mpeg-1,以 1.52mbps 的速率实现在 cd-rom 上的视音频数据存储。 1990 年, ccitt 提出了其第一部视 频编码标准,该标准在 1993 年由 itu-t h.261 发表,用 p64kbps 低速率实现在 isdn 网上通信。itu-t h.262,即于 1994 年发布的 mpeg-2,是适于 49mbps 传输 速率 hdtv 的编码算法标准。1996 年标准化组织开发的第一版新视频编码标准 itu-t h.263,适用于 pstn 网上 64kbps 以下的低速率通信。 1998 年 iso 的 mpeg (活 动图像专家组)提出了新的应用于移动视听业务的编码标准 mpeg-4,该算法首次 采用了基于对象的分层结构,而以前算法则是采用基于像块的帧结构。 mpeg-4 的编码理念是: mpeg-4 标准同以前标准的最显著的差别在于它是采 用基于对象的编码理念,即在编码时将一幅景物分成若干在时间和空间上相互联 系的视频音频对象,分别编码后,再经过复用传输到接收端,然后再对不同的对 象分别解码,从而组合成所需要的视频和音频。这样既方便我们对不同的对象采 用不同的编码方法和表示方法,又有利于不同数据类型间的融合,并且这样也可 以方便的实现对于各种对象的操作及编辑。例如,我们可以将一个卡通人物放在 真实的场景中,或者将真人置于一个虚拟的演播室里,还可以在互联网上方便的 实现交互,根据自己的需要有选择的组合各种视频音频以及图形文本对象。 mpeg-4 系统的一般框架是: 对自然或合成的视听内容的表示; 对视听内容数据流 的管理,如多点、同步、缓冲管理等;对灵活性的支持和对系统不同部分的配置。 其应用的主要领域有:因特网视音频广播、静止图像压缩、电子游戏、计算机图 形、动画与仿真、远程教育、远程医疗、视频会议等。 在 2000 年 12 月, iso 标准化部门出版了最新的用于静态动态图像压缩的标准 化版本 jpeg2000。jpeg2000 与传统 jpeg 最大的不同在于它放弃了 jpeg 所采用 的以离散余弦变换(discrete cosine transform)为主的区块编码方式,而改采以小波 转换(wavelet transform)为主的多解析编码方式。 在 2003 年 3 月,jvt(joint video team,视频联合工作组)发布了新的视频 压缩编码标准称为h.264标准, 该标准也被iso接纳, 称为 avc ( advanced video coding )标准,是 mpeg-4 的第 10 部分。h.264 不仅比 h.263 和 mpeg-4 节约了 50的码率,在小于 1m 带宽的条件下,h.264 标准可以达到 dvd 的成像质量, 而且对网络传输具有更好的支持功能。它引入了面向 ip 包的编码机制,有利于网 络中的分组传输,支持网络中视频的流媒体传输。h.264 具有较强的抗误码特性, 可适应丢包率高、干扰严重的无线信道中的视频传输。h.264 支持不同网络资源下 的分级编码传输,从而获得平稳的图像质量。h.264 能适应于不同网络中的视频传 第一章 引言 3 输,网络亲和性好。 可见在视频领域的研究一直不断,也是最活跃的,新的数据压缩算法层出不 穷。多媒体通信是人类最自然的通信方式,给人类的交流提供更好的平台。随着 视频压缩技术的不断进步,必将提供更好的多媒体通信。 1.3 h.323 标准概述4 h.323 是一套在分组网上提供实时音频、视频和数据通信的标准,是 itu-t 制 订的在各种网络上提供多媒体通信的系列协议 h.32x 的一部分。 h.323 协议被普遍 认为是目前在分组网上支持语音、图像和数据业务最成熟的协议。采用 h.323 协 议,各个不同厂商的多媒体产品和应用可以进行互相操作,用户不必考虑兼容性 问题。该协议为商业和个人用户基于 lan 和 wan 的多媒体产品协同开发奠定了 基础。 为了能在不保证 qos 的分组交换网络上展开多媒体通信,由 itu 的第 15 研 究组 sg-15 于 1996 年通过 h.323 建议的第一版,并在 1998 年提出了 h.323 的第 二版。h.323 制定了无 qos(服务质量)保证的分组网络 pbn(packet based networks)上的多媒体通信系统标准,这些分组网络主宰了当今的桌面网络系统, 包括基于 tcp/ip、ipx 分组交换的以太网、快速以太网、令牌网、fddi 技术。因 此,h.323 标准为 lan、wan、intarnet、因特网上的多媒体通信应用提供了技术 基础和保障。 h.323 是 itu 多媒体通信系列标准 h.32x 的一部份, 该系列标准使得在现有通 信网络上进行视频会议成为可能,其中,h.320 是在 n-isdn 上进行多媒体通信的 标准;h.321 是在 b-isdn 上进行多媒体通信的标准;h.322 是在有服务质量保证 的 lan 上进行多媒体通信的标准;h.324 是在 gstn 和无线网络上进行多媒体通 信的标准。h.323 为现有的分组网络 pbn(如 ip 网络)提供多媒体通信标准。若 和其它的 ip 技术如 ietf 的资源预留协议 rsvp 相结合,就可以实现 ip 网络的多 媒体通信。 基于 ip 的 lan 正变得越来越强大, 如 ip over sdh/sonet、 ip over atm 技术正在快速发展以及 lan 宽带正在不断的提高。由于能提供设备与设备、应用 与应用、供应商与供应商之间的互操作能力,因此,h.323 能够保证所有 h.323 兼 容设备的互操作性。更高速率的处理器、日益增强的图形器件和强大的多媒体加 速芯片使得 pc 成为一个越来越强大的多媒体平台。 h.323 可提供 pbn 与别的网络 之间进行多媒体通信的互连互通标准。许多计算机、网络通信公司,如 intel、 第一章 引言 4 microsoft 和 netscape 都支持 h.323 标准。h.323 标准包括在无 qos 保证的分组网 络中进行多媒体通信所需的技术要求。这些分组网络包括 lan、wan、intarnet/ 因特网以及使用 ppp 等分组协议通过 gstn 或 isdn 的拨号连接或点对点连接。 1.4 以太网技术的发展3 以太网技术作为一种局域网基本介质(媒体)接入技术,由于其高度灵活性 和实现的简单性,近年来得到了迅猛的发展。早期的以太网是在 20 世纪 70 年代 首先由 xerox 公司发明的,传输速率仅有 2.94mbit/s。接着,作为一种基带局域网 (lan)又规范了采用载波侦听多路访问/碰撞检测(csma/cd,carrier sense multiple access/collision detection)传输规范,并且其信号以 10mbit/s 速率在同轴 电缆上运行。到 1980 年基于原来以太网技术产生了 ieee 802.3 规范标准。并且由 数字设备公司、英特尔和 xerox 公司联合开发了与 ieee 802.3 标准兼容的以太网 2.0 方案,可以使用同轴电缆、双绞线对等各种线缆。 以太网技术的引入以及个人计算机和工作站的巨大利用率推动着局域网的增 长。新一代多媒体、群件(groupware) 、影像传输和数据库产品信息量猛增又使 速率为 10mbit/s 的以太网面临严重的挑战,从而迫使以太网向更高的速率发展。 为了提高以太网的工作速率组成了快速以太网联盟(feca,fast ethernet compatibility alliance) 。电气和电子工程师学会(ieee)相关组织起草了 802.3u 100base-t 标准规范。从而将以太网速率提升到 100mbit/s。1998 年光纤信道和 ieee802.3 协议栈相结合形成吉比特以太网协议草案,将以太网速率提高到 1000base-t,并成为 ieee802.3ab/ieee802.3z 标准。在 2000 年 1 月又拟定了 10 吉比特以太网。今天,以太网技术不但在网络中得到普遍推广,而且在因特网 (internet)上几乎所有来往信息均来自相连接的以太网。 以太网技术的发展,为在局域网内实现视频数据的传输提供了保证。满足视 频数据量大,码率高的特性。为多媒体通信技术的普及提供了条件。 1.5 课题概述 本论文设计了具有以太网接口的 mpeg-4 编解码器。通过以太网接口可以传 输 mpeg-4 标准的视频流及音频流,实现视音频数据的网络传输。该系统的硬件 由mpeg-4编解码模块、 以太网模块和嵌入式主机组成。 嵌入式主机预装redhat7.3 第一章 引言 5 操作系统,管理整个编解码器的硬件资源,在其上运行对应的软件,可实现视频 数据的实时传输,并可更改系统工作参数。 该项目与校外公司合作,完成视频数据的编码解码、网络传输功能。从摄像 头和麦克风(或是其他视音频输出设备)的视音频数据编码经过传输到解码端解 码,在解码端将视频图像恢复,并显示在电视、音响上。嵌入式主机提供对编码 解码模块、红外线控制、摄像头、云台等的控制接口以及提供系统软件的运行平 台。系统工作参数可以实时更改,通过 osd 菜单方式进行调整,方便直观。 该系统现已做成终端机形式交付给客户,可广泛应用在视频点播系统、监控 系统及视频会议等多媒体通信中。 第二章 相关理论简述 6 第二章相关理论简述 2.1 视频编码机制5 视频信号通常包含着一定的冗余,可以在数字压缩过程中去除。这些冗余可 能是统计的,与视频序列电平的近似程度有关;也可能是空间上的冗余,由同一 帧亮度和色度值的近似程度引起;甚至也可能是时间上的,这些冗余是连续视频 帧间的近似性带来的。视频压缩就是从视频内容中去除这些冗余的过程,从而减 少数字表示的含量。 图像和视频编码技术经历了一场变革。从第一代典型的基于像素编码器,到 第二代基于分割、基于分形和基于模型的编码器,到近年出现的第三代基于内容 的编码器。下图为视频编解码基本过程。 图 2.1 视频编解码基本过程结构图 每个输入帧在完成压缩处理之前要经过一些步骤。首先,抑制或改进输入帧 的一些不理想特征,编码器效率得到显著提高。例如,在编码前输入帧经过噪声 过滤,使运动估计过程得到更高的精度,从而产生显著的改进效果。类似地,如 果解码器端的重构图像再经过一些图像后处理增强技术,如边缘增强处理、噪声 过滤、基于像块压缩机制的抑制块效应,那么解码后的图像质量能得到显著的提 高。第二步,视频帧经过数学变换,将像素转换成不同的空间区域。离散余弦变 换(dct) 、小波变换的目标,是去除视频序列中的统计冗余,这种变换是视频压 缩系统的核心。第三步是量化,将每个变换过的像素用有限的输出信号集表示。 因此,变换过的像素可能值范围缩小,但也引入了不能恢复的质量损失。在解码 预处理变换量化编码缓存器 后处理逆变换逆量化解码缓存器 控制 信 道 第二章 相关理论简述 7 器端,逆量化过程将信号映射为相应的重构值。接下来的一步,编码过程再将码 字分配给量化和变换的视频数据。通常,无损编码技术,如 huffman 编码和算术 编码,是利用每个信号发生概率的不同来编码。由于视频信号的时域活动性,并 且视频压缩采用了变长编码,视频编码器产生的比特率变化很大,为了调整编码 器在实时传输中的输出比特率,在编码器和接收端的网络间实用了平滑缓存器来 控制流量。为了避免缓存器的溢出和流量不足,才用了反馈控制机制,根据缓存 器的占用率来调节编码过程。 2.2 视频压缩国际标准1246 目前视频流传输中最为重要的编解码标准有国际电联的 jpeg、 h.261、 h.263、 以及最近制定的 mpeg 和 h.264 系列标准,此外在互联网上被广泛应用的还有 real-networks 的 real video、 微软公司的 wmt 以及 apple 公司的 quick time 等。 在此只对 iso 和 ccitt 分别制定的 jpeg、h.261、h.263、h.264 和 mpeg 系列 进行介绍。 2.2.1 jpeg 标准和 h.26x 系列标准 jpeg 标准 jpeg(the joint photographic experts group)是静态图像压缩标准,它由国际 图像编码联合专家组于 1990 年最后确定的。该标准的基本编码方式是将图像分成 88 的子块,分别作 dct 变换,改变了信源的概率分布特征;并通过调整量化精 度,来控制图像重建质量和编码压缩率;为了获得视觉效果更好的图像,利用特 殊的量化表对各 dct 系数采取不同的量化步长;在熵编码前将各系数变为统一的 两字节符号格式;最后利用霍夫曼码表对 dct 系数进行差值编码,对 ac 系数进 行游程编码。此标准的优点是可以精确到帧的编辑、设备比较成熟,但是存在压缩 效率不高的缺点。 2h.261 标准 h.261 标准是 ccitt 第 15 研究组于 1984 年到 1989 年制定的针对可视电话和 电视会议的视频压缩标准,其建议的传输速率为 p64kb/s(p=130) ,因此又被称 为 p64 标准。h.261 标准以 dct 和具有运动补偿的帧间预测为基础,然后对预测 误差作 dct、量化和霍夫曼编码。h.261 在实时编码时比 mpeg 所占用的 cpu 运 算量少得多,此算法为了优化带宽占用量,引进了在图像质量与运动幅度之间的平 第二章 相关理论简述 8 衡折中机制,因此这种方法是属于恒定码流可变质量编码而非恒定质量可变码流编 码。 3h.263 标准 h.263 是为低码率通信而设计的。但实际上这个标准可用于很宽的码率范围, 而非只用于低码率范围,它在许多应用中可以被用来取代 h.261。 h.263 的编码算法 与 h.261 一样,但做了一些改善,以提高性能和纠错能力。h.263 标准在低码率下能 够提供比h.261更好的图像效果,例如在比特率低于30kb/s的应用中,同样的视频质 量前提下,h.263 的输出码率仅为 h.261 的一半甚至更少。h.263 支持 5 种分辨率, 即除了支持 h.261 中所支持的 qcif 和 cif 外,还支持 sqcif、4cif 和 16cif。 4h.264 标准 h.264 同样采用 dpcm 加变换编码的混合编码模式。但它采用“回归基本” 的简洁设计,不用众多的选项,获得比 h.263 好得多的压缩性能; 应用目标范围较宽, 以满足不同速率、不同分辨率以及不同传输(存储)场合的需求;它的基本系统是开 放的,使用无需版权。技术特点包括:帧间编码,可变块大小的运动补偿预测技术; 帧内编码,多方向的空间预测技术;环内滤波器,去除块效应;44 的整数正 交变换及相应的量化策略;改进的运动向量预测编码;更加高效的熵编码器; 基于率失真的编码优化技术。这些措施使得 h.264 算法具有很高的编码效率,在 相同的重建图像质量下,能够比 h.263 节约 50%左右的码率。h.264 的码流结构网 络适应性强,增加了差错恢复能力,能够很好地适应 ip 和无线网络的应用。 但从总体 上说,h.264 性能的改进是以增加复杂性为代价而获得的,其编码的计算复杂度大约 相当于 h.263 的 3 倍,解码复杂度大约相当于 h.263 的 2 倍。 2.2.2 mpeg 系列标准 mpeg 是运动图像专家组(moving picture experts group)的缩写,于 1988 年成立,是为数字视/音频制定压缩标准的专家组。mpeg 组织最初得到的授权是 制定用于“运动图像”编码的各种标准,随后扩充为“及其伴随的音频”及其组 合编码。后来针对不同的应用需求,解除了“用于数字存储媒体”的限制,成为 现在制定“运动图像和音频编码”标准的组织。mpeg 组织制定的各个标准都有 不同的目标和应用, 目前已提出 mpeg-1、 mpeg-2、 mpeg-4、 mpeg-7 和 mpeg-21 标准。 1mpeg-1 标准 第二章 相关理论简述 9 mpeg-1主要是针对1.5mb/s以下数据传输率的数字存储媒质运动图像及其伴 音编码的国际标准。采用 cif 视频格式,具有随机存取、快速正向/逆向搜索、逆向 重播、视听同步、容错性、编码/解码延迟等功能。mpeg-1 视频编码部分的基本 算法与 h.261/h.263 相似,但又引入了帧内帧(i)、预测帧(p)、双向预测帧(b)和直流 帧(d)等概念,进一步提高了编码效率,旨在达到vhs质量,对于动作不激烈的视频信 号能获得较好的图像质量,但如果图像对象动作激烈时,图像有可能产生马赛克现 象。 2mpeg-2 标准 mpeg-2 核心部分与 mpeg-1 基本相同,是在 mpeg-1 基础上的进一步扩展 和改进,克服并解决了 mpeg-1 不能满足日益增长的多媒体技术、数字电视技术 对分辨率和传输率等方面的技术要求的缺陷。最高图像分辨率:19201152;普通 pal 制式分辨率:720576;最高数据流量:80mb/s;一般数据流量: 6500kb/s(720576)。它是主要针对数字视频广播、高清晰度电视和数字视盘等制 定的编码标准,可以支持固定比特率传送、可变比特率传送、随机访问、信道跨越、 分级编码、比特流编辑等功能。mpeg-2 有不可分级和可分级两种编码方式。它还 定义了 5 个框架和 4 个级别,框架是标准中定义的语法子集,级别是一个特定框架 中参数取值的集合。框架和级别限定以后,解码器的设计和校验,就可以针对限 定的框架在限定的级别中进行,同时也为不同的应用领域之间的数据交换提供了 方便和可行性,其中的主框架应用最广,也是最为重要的一个。 3mpeg-4 标准 运动图像专家组 (mpeg) 于 1999 年 2 月正式公布了 mpeg-4 (iso/iec14496) 标准第一版本。同年年底 mpeg-4 第二版也确定,且于 2000 年年初正式成为国际 标准。关于此标准的具体描述及主要技术将在下一节介绍。 4mpeg-7 标准 mpeg-7 标准被称为“多媒体内容描述接口” ,为各类多媒体信息提供一种标 准化的描述,这种描述将与内容本身无关,允许快速和有效地查询用户感兴趣的 资料。它将扩展现有的内容识别专用解决方案的有限能力,换而言之,mpeg-7 规定一个用于描述各种不同内型多媒体信息描述符的标准集合。 5mpeg-21 标准 mpeg-21 标准的目的是: (1)将不同的协议、标准、技术等有机地结合在一 起; (2)制定新的标准; (3)将这些不同的标准集成在一起。mpeg-21 标准其实 是一些关键技术的集成,通过这种集成环境就对全球数字媒体资源进行透明和增 第二章 相关理论简述 10 强管理,实现内容的描述、创建、发布、使用、识别、收费管理、产权保护、用 户隐私权保护、终端和网络资源抽取、事件报告等功能。 2.3 mpeg-4 的主要技术142022 mpeg-4 与 mpeg-1 和 mpeg-2 有很大的不同。mpeg-4 不只是具体压缩算 法, 它是针对数字电视、 交互式绘图应用 (影音合成内容) 、 交互式多媒体 (www、 资料获得与分散) 等整合及压缩技术的需求而制定的国际标准。 mpeg-4 标准将众 多的多媒体应用集成于一个完整的框架内,旨在为多媒体通信及应用环境提供标 准算法及工具,从而建立起一种能被多媒体传输、存储、检索等应用领域普遍采 用的统一数据格式。 mpeg-4 提供更强的交互能力。 场景中的每个对象独立编码, 用户可以选择性 地与其中某(几)个对象交互,具有良好的重用性。重新组合音视对象 avo(audio visual object)构造新场景,可以集成各种对象,无缝地集成自然信息与合成信息,实 时信息与存储信息,avo 可以是单/双/多声道音频信息、 单/双/多镜头 2d/3d 视频信 息。可以透明地访问信息,通过各种网络传输的信息最终映射为本地信息,整个过程 给用户的感觉就如同访问本地信息。而且允许基于内容(比特率、分辨率、帧率、 防错保护和解码优先级)的可伸缩性和服务质量(qos)参数,更加灵活,可扩展,充分 考虑未来技术的发展及应用需求,将解码器可编程能力分为:不可编程的标准工具 集合(flex-0);由标准化工具及其接口灵活配置的算法(flex-1);多种工具构成可能 算法的标准化可扩展机制(flex-2)。 mpeg-4 系统由以下几部分构成 1多媒体传送整体框架(dmif) dmif(the delivery multimedia intergeration framework)主要解决交互网络中、 广 播环境下以及磁盘应用中多媒体应用的操作问题。通过传输多路合成比特信息来 建立客户端和服务器端的握手和传输。通过 dmif,mpeg-4 可以建立起具有特殊 品质服务(qos)的信道和面向每个基本流的带宽。dmif 允许每个点保持自己的网 络视域,所以减少信息的堆积。mpeg-4 码流中包含了许多 avo,这些 avo 都有自 己的缓冲器。 2数据平面 mpeg 中的数据平面可以分为传输关系和媒体关系两部分。为了使基本流和 avo 在同一场景中出现,mpeg-4 引用了对象描述(od)和流图桌面(smt)的概念。 第二章 相关理论简述 11 od 传输与特殊 avo 相关的基本流的信息流图。桌面把每一个流与一个 cat(channel assosiation tag)相连,cat 可实现该流的顺利传输。 3缓冲区管理和实时识别 mpeg-4 定义了一个系统解码模式(sdm),该解码模式描述了一种理想的处理 比特流句法语义的解码装置,它要求特殊的缓冲区和实时模式。通过有效地管理,可 以更好地利用有限的缓冲区空间。例如,如果接收端有足够的空间存储,该模式 (sdm)允许传送端提前传送非实时数据;当需要时,提前传送的数据被访问,从而使 用来处理实时数据的信道具有更大的容量。为了实现实时操作,mpeg-4 假定了一 种实时模
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论