




已阅读5页,还剩69页未读, 继续免费阅读
(通信与信息系统专业论文)视频播放系统的研究与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
武汉理工大学硕士学位论文 摘要 随着科学技术的发展和人民生活水平的提高,人们对娱乐方面的要求也越 来越高。由于传统的模拟有线电视传输技术的局限性。使得有线电视运营商很 难向广大的电视用户提供丰富多彩的增值业务。近些年来,随着数字压缩技术 和i n t e r n e t 的发展,广播电视数字化得到了飞速的发展。作为运动图像伴音信息 的通用编码,m p e g 2 得到了广泛的应用。 论文详细地研究了m p e g 2 标准中的系统部分( 包括程序流、传输流和p e s 分组) 和视频部分( 包括视频流结构和视频流特征等) ,分析了m p e g 2 编解码 过程中的关键技术,包括离散余弦变换( d c t ) 与反离散余弦变换( i d c t ) 、量 化与反量化、“之”字型扫描、行程长度编码、熵编码、哈夫曼编码、运动估计 和运动补偿,最后设计了一个视频播放系统,并对此系统的性能进行了定量的 分析。 论文设计出的视频播放系统具有以下功能:能够接收网络传输过来的t s 流; 能够实现t s 流的正常播放;能够同步的实现i 帧的播放;能够实现高效率地快 速播放;能够由用户自由地改变播放窗口的大小。可以对此视频播放系统的许 多功能进行扩展( 例如增加音频播放和多个节目的播放) ,从而可以应用于多种 场合。 关键词:m p e g 2 ,t s 流,p e s 分组,视频播放器 亟堡望三查堂堡主堂堡堕苎 a b s t r a c t w i t ht h ed e v e l o p m e n to fs c i e n c ea n dt e c h n o l o g ya n di m p r o v e m e n to ft h el i v i n g s t a n d a r d so f t h ep e o p l e ,p e o p l e sd e m a n do na m u s e m e n t i si n c r e a s i n g b e c a u s eo f t h e l i m i t a t i o no ft h et r a d i t i o n a la n a l o gc a b l et e l e v i s i o nt r a n s m i s s i o nt e c h n o l o g y , i ti s d i f f i c u l tf o rt h eo p e r a t o ro f t h ec a b l et v t oo f f e rr i c ha n dc o l o r f u lv a l u e a d d e ds e r v i c e t ol a r g en u m b e r so ft vs e tu s e r s i nt h el a s tf e w y e a r s ,w i t ht h ed e v e l o p m e n to f d a t a c o m p r e s s i n gt e c h n o l o g ya n di n t e r a c t ,b r o a d c a s tt e l e v i s i o nd i g i t i z a t i o n h a sg o tt h e d e v e l o p m e n ta t f u l l s p e e d a st h eg e n e r a lc o d i n go fm o v i n gp i c t u r e sa n da u d i o i n f o r m a t i o n ,m p e g - 2i su s e d i nw i d es c o p e i nt h et h e s i s ,r e s e a r c hh a sb e e nd o n eo nt h es y s t e mp a r t ( i n c l u d i n gt h ep r o c e d u r e s t r e a m ,t r a n s p o r ts t r e a ma n dp e sp a c k e t ) a n dv i d e op a r t ( i n c l u d i n gt h ev i d e os t r e a m s t r u c t u r ea n dv i d e os t r e a mc h a r a c t e d s t i c ,e t c ) o fm p e g - 2s t a n d a r di nd e t a i l ,a n a l y s e s t h ek e yt e c h n o l o g yi nt h em p e g - 2 e n c o d i n ga n dd e c o d i n gp r o c e s s e s ,w h i c hi n c l u d e s d i s c r e t ec o s i n et r a n s f o r m ( d c t ) a n di n v e r s ed i s c r e t ec o s i n et r a n s f o r m ( i d c t ) 、 q u a n t i z a t i o na n di n v e r s eq u a n t i z a t i o n 、z i g z a gp o s i t i o n i n g 、r u n - l e n g t hc o d i n g 、e n t r o p y c o d i n g 、h u f f m a nc o d i n g 、m o t i o ne s t i m a t i o na n dm o t i o nc o m p e n s a t i o n a tl a s t ,t h e d e s i g n c o u r s eo fav i d e op l a y e ri si n t r o d u c e d ,a n dq u a n t i t a t i v ea n a l y s i st ot h e p e r f o r m a n c eo f t h es y s t e mi sm a d e t h ev i d e op l a y e rd e s i g n e di nt h et h e s i sh a st h ef o l l o w i n gf u n c t i o n s :i tc a r t _ r e c e i v et ss t r e a mt h r o u g hn e t w o r k ;i tc a l lp l a yt ss t r e a mn o r m a l l y ;i tc a np l a yi f l a m es y n c h r o n o u s l y ;i tc a nr e a l i z ef a s tp l a yw i t hh i 出e f f i c i e n c y ;t h es i z eo fi t s w i n d o wc a nb e c h a n g e df r e e l yb yu s e r s w ec a n e x t e n dt h es y s t e ma n da d dm a n yn e w f u n c t i o n s ( s u c h a sa d d i n ga u d i op l a y , a n dm a n y p r o g r a m sp l a ya tt h es a l t l et i m e ,e t c ) , s o ,i tc a nb eu s e di nm a n yo c c a s i o n s k e yw o r d s :m p e g 一2 ,t r a n s p o r ts t r e a m ,p e sp a c k e t ,v i d e op l a y e r l l 武汉理工大学硕士学位论文 1 1 引言 第1 章绪论 科学技术的飞速发展使社会产生了日新月异的变化,特别是2 0 世纪9 0 年 代以来,随着多媒体技术的迅速发展。大量信息的音、视频数据被广泛使用, 如常见的v c d 、d v d 。音、视频相关技术在一些行业领域也得到了很好的应用, 如保安监控系统中对现场进行音、视频的录制,以便存档、查看、取证等。 由于音、视频数据量非常大,若未经处理,其存放、网络传送都存在很大 问题,为此,需要将它们进行压缩( 如v c d 盘的内容就是经过压缩处理的) ,待 用户使用时进行解压缩( 如v c d 播放机就是将光盘的内容解压缩后进行音、视 频播放) 。 为了压缩音、视频数据,出现了各种不同的压缩算法,并取得了一定成效, 但被普遍认可、最为权威的还得是m p e g 技术。本论文主要研究了m p e g 系列中 m p e g 一2 标准,并设计出相应的视频播放器。 1 2 视频压缩标准简介 自1 9 8 8 年以来,i s o i e c 和i t u 制订了一系列的适应不同应用场合的视频 压缩标准,极大的推动了视频压缩技术的商业化。下面对其中一些重要的标准 进行简单的介绍。 h 2 6 1 也称p 6 4 ,即“采用p * 6 4 k b s 声像业务的图像编解码”,是最早的 一个码率压缩标准,是1 9 8 4 年国际电报电话咨询委员会提出的第一个实用化的、 适用于会议电视和可视电话要求的标准,是自1 9 4 8 年以来电视图像压缩编码研 究成果的结晶。所用的电话网络为综合业务数字网络( i s d n ) ,目标是推荐一个 图像编码标准,因为图像必须和语音密切配合,所以推荐的图像编码算法必须 是实时处理的,并且要求最小的延时。由于h 2 6 1 标准是用于电视电话和电视 会议,所以推荐的图像编码算法也必须是实时处理的。当p 取l 或2 时,速率 只能达到1 2 8 k b s ,由于速率较低只能传清晰度不太高的图像,所以适合于面对 武汉理工大学硕士学位论文 面的电视电话。当p 6 时,速率 3 8 4 k b s 则速率较高,可以传输清晰度尚好 的图像,所以适用于电视会议。1 。 h 2 6 3 是国际电联i t u t 的一个标准草案。1 ,是为低码流通信而设计的。但 实际上这个标准可用在很宽的码流范围,而非只用于低码流应用,它在许多应 用中可以认为用于取代h 2 6 1 。h 2 6 3 的编码算法与h 2 6 1 一样,但做了一些改 善和改变,以提高性能和纠错能力。h 2 6 3 标准在低码率下能够提供比h 2 6 1 更 好的图像效果,两者的区别有:( 1 ) h 2 6 3 的运动补偿使用半象索精度,而h 2 6 1 则用全象素精度和循环滤波;( 2 ) 数据流层次结构的某些部分在h 2 6 3 中是可选 的,使得编解码可以配置成更低的数据率或更好的纠错能力;( 3 ) h 2 6 3 包含四 个可协商的选项以改善性能;( 4 ) h 2 6 3 采用无限制的运动向量以及基于语法的 算术编码;( 5 ) 采用事先预测和与m p e g 中的p b 帧一样的帧预测方法;( 6 ) h 2 6 3 支持5 种分辨率,即除了支持h 2 6 1 中所支持的q c i f 和c i f 外,还支持s q c i f 、 4 c i f 和1 6 c i f ,s q c i f 相当于q c i f 一半的分辨率,而4 c i f 和1 6 c i f 分别为c i f 的4 倍和1 6 倍。 1 9 9 8 年i u t t 推出的h 2 6 3 + 是h 2 6 3 建议的第2 版,它提供了1 2 个新的 可协商模式和其他特征,进一步提高了压缩编码性能。如h 2 6 3 只有5 种视频 源格式,h 2 6 3 + 允许使用更多的源格式,图像时钟频率也有多种选择,拓宽应 用范围;另一重要的改进是可扩展性,它允许多显示率、多速率及多分辨率, 增强了视频信息在易误码、易丢包异构网络环境下的传输。另外,h 2 6 3 + 对 h 2 6 3 中的不受限运动矢量模式进行了改进,加上1 2 个新增的可选模式,不仅 提高了编码性能,而且增强了应用的灵活性。h 2 6 3 已经基本上取代了h 2 6 1 。 j p e g ( j o i n tp h o t o g r a p h i ce x p e r t sg r o u p 联合图像专家组) 是数字图像 压缩的国际标准。它于1 9 8 6 年由国际标准化组织i s o 和国际电报电话咨询委员 会c c i t t 共同成立了联合图像专家组对静止图像压缩编码的标准进行了研究, j p e g 小组于1 9 8 8 年提出建议书,1 9 9 2 年成为静止图像压缩编码的国际标准。 j p e g 包含两种基本压缩方法,各有不同的操作模式0 1 。第一种是有损压缩,它 是以d c t ( d i s c r e t ec o s i n et r a n s f o r m ) 为基础的压缩方法。第二种为无损压缩, 又称预测压缩方法。但最常使用的是第一种,即d c t 压缩方法,也称为基线顺 序编解码( b a s e l i n es e q u e n t i a lc o d e c ) 方法,因为这种方法的优点是先进、有 效、简单、易于交流,因此应用广泛,是以d c t 为基础的最基本、最重要的方 法。j p e g 是一种不含帧间压缩的帧内压缩编码方法,其主要编码过程与h 2 6 1 武汉理工大学硕士学位论文 的桢内编码过程大致相同。输入信号经d c t 变换后,按固定的亮度与色度量化 矩阵进行非线性量化。对量化后的d c t 直流系数进行差分编码,交流系数进行 行游程编码。再按霍夫曼码表进行变长编码后,送缓存器输出。j p e g 不含帧问 压缩,压缩比较帧内帧间压缩低。但因为不含帧间压缩,使得各帧在压缩编码 后是各自独立的,这一点对于编辑来说是有利的,可以做到精确到逐帧的编辑。 所以对于活动画面只进行帧内压缩的m o t i o n j p e g ,目前仍然在一些数字电视编 录设备,如非线性编辑系统中得到应用。 但是,随着多媒体应用领域的快速增长,传统j p e g 压缩技术已无法满足人 们对数字化多媒体图像资料的要求:网上j p e g 图像只能一行一行地下载,直到 全部下载完毕,才可以看到整个图像,如果只对图像的局部感兴趣也只能将整 个图片载下来再处理;j p e g 格式的图像文件体积仍然嫌大;j p e g 格式属于有损 压缩,当被压缩的图像上有大片近似颜色时,会出现马赛克现象;同样由于有 损压缩的原因,许多对图像质量要求较高的应用j p e g 无法胜任”1 。针对这些问 题,从1 9 9 8 年开始,专家们开始为下一代j p e g 格式出谋划策,希望新标准能 具有更高压缩率以及更多新功能,而且更有利于用户对图像进行数字化处理。 但这几年间,由于在算法选取问题上耽误了不少时间,直到2 0 0 2 年3 月的东京 会议,彩色静态图像的新一代编码方式“j p e g 2 0 0 0 ”的编码算法才确定,其 最终标准于2 0 0 2 年1 2 月出台0 3 。j p e g 2 0 0 0 的编码算法一经确定,许多著名的 图形图像公司如c o r e l 、p e g a s u s ( 美国神马成像公司) 等就迫不及待地在新开 发的图像工具软件中集成了j p e g 2 0 0 0 图像压缩技术;而m i c r o s o f t 、n e t s c a p e 等在浏览器领域竞争的公司也开始将j p e g 2 0 0 0 的新技术集成到其下一个版本的 浏览器中因为相对于3 p e g 来说,j p e g 2 0 0 0 可以说具有革命性的改变”。 m p e g 是m o v i n gp i c t u r ee x p e r t sg r o u p ( 运动图像专家组) 的缩写。它成 立于1 9 8 8 年,是i s o 和i e c 联合技术委员会1 ( j t c l ) 的第2 9 分委员会( s c 2 9 ) 的第1 1 工作组( w g l l ) 。m p e g 标准是面向运动图像压缩的一个序列标准。到目 前为止,已经制定和正在制定的的m p e g 标准有:m p e g 一1 、m p e g 一2 、m p e g - 4 、 m p e g 一7 、m p e g 一2 1 。 m p e g - 1 称为“用于大约高于1 5 m b p s 速率的数字存储媒体的运动图像及伴 音编码”,作为i s o i e c1 1 1 7 2 号建议于1 9 9 2 年通过“。m p e g l 的目标是将压 缩后的视音频码流存入光盘( 如c d - r o m 、v c d 等) ,数据传输速率为1 4 1 6 m b i t s , 其中1 1 m b i t s 用于视频,1 2 8 k b i t s 用于音频,其余的用于系统开销。m p e g 一1 武汉理工大学硕士学位论文 标准采用了一系列的技术获褥高压缩比:( 1 ) 对色差信号进行亚取样以减少数 据量;( 2 ) 采用运动补偿技术减少时间冗余度;( 3 ) 做二维d c t 变换去除空间 相关性;( 4 ) 对d c t 分量进行量化,将量化后的d c t 分量按频率重新排序;( 5 ) 将d c t 分量进行变字长编码;( 6 ) 对每数据块的直流分量进行预测。m p e g l 是 一个开放的、统一的标准,尽管其图像质量仅相当于v h 8 视频的质量,但在商 业上获得了巨大的成功,它广泛的应用于v c d 等家庭视听产品中。 m p e g 一2 称为“运动图像及其伴音信息的通用编码”,作为i s o i e c1 3 8 1 8 号 建议于1 9 9 4 年发布3 。该标准是针对标准数字电视和高清晰度电视在各种应用 下的压缩方案的详细规定,编码速率从3 m b i t s l o o m b i t s “”。m p e g 一2 不是 i p e g l 的简单升级,它在系统和传送方面做了更加详细的规定和进一步的完善, 它克服并解决了m p e g 一1 不能满足的多媒体技术、数字电视技术对分辨率和传输 率等方面的技术要求的缺陷,保证与m p e g - 1 视频体系向下兼容“”,主要表现在 以下三个方面:( 1 ) 定义了“等级”和“类”的概念:m p e g 一2 定义了四个等级, 五个类;( 2 ) 有“按帧编码”和“按场编码”两种模式;( 3 ) 增加了可分级性: 空间可分级性,时问可分级性和信噪比可分级性。m p e g - 2 的应用更加广泛,包 括存储媒介中的d v d 、广播电视中的数字电视和h d t v 、以及交互式视频点播( v o d ) 和准视频点播( n v o d ) 。 m p e g - 4 称为“甚低速率视听编码”,1 9 9 8 年作为i s o i e c1 4 4 9 6 号标准草 案发布“。该标准将众多的多媒体应用集成于一个完整的框架内,旨在为多媒 体通信及应用环境提供标准的算法及工具,用于实现音视频数据的有效编码及 更为灵活的存取,提出基于内容( c o n t e n t b a s e d ) 的视频对象( v i d e oo b j e c t ) 的 编码标准。m p e g 一4 标准支持许多新的功能,可粗略的分为3 类:基于内容的交 互性、高压缩率和灵活多样的存取模式。m p e g - 4 的应用前景非常广阔,它的出 现将对数字电视、动态图像、因特网、实时多媒体监控、低比特率下的移动多 媒体通信、基于内容存储和检索的多媒体系统、基于计算机网络的可视化合作 实验室场景应用、演播电视等产生较大的推动作用“”“”。 m p e g - 7 称为“多媒体内容描述接口”,它的由来是l + 2 + 4 ,m p e g 一7 不是信 息压缩编码标准,而是一种多媒体内容描述的标准,其目的是制定一套描述符 标准,用来描述各种类型的多媒体信息及它们之闻的关系,以便更快更有效地 检索信息“”。人们可以检索和索引与m p e g 一7 数据相关的视听材料,如静态图片、 图形3 d 模型、声音、语言、视频和这些元素所组成的多媒体描述信息。m p e g 一7 4 武汉理工大学硕士学位论文 像m p e g 家族中的其他成员一样,是针对满足特定需要的音、视频信息的标准化 表述,而标准化的功能之一就是对其中相应部分提供参考。m p e g - 7 的描述符并 不依赖于它所描述的内容是编码或存储的方式,可以把m p e g - 7 的描述说明,附 加到模拟制的电影里或是用纸张打印出来的图片上。m p e g 一7 的应用领域很广, 如数字图书目录、音乐词典、无线电频道、t v 频道、个人电子新闻服务、多媒 体创作等“。 m p e g 一2 1 称为“多媒体框架”,它在1 9 9 9 年1 0 月m p e g 墨尔本会议上被提出, 在1 9 9 9 年1 2 月的毛伊岛会议上,这个新的工作方向被确定为m p e g 一2 1 。2 0 0 2 年7 月在北京召开的m p e g 第5 3 次会议上,该标准又取得了重大进展“。开展 m p e g 一2 1 标准研究的目的是:( 1 ) 确定是否需要将不同的协议、标准、技术等有 机地融合在一起:( 2 ) 讨论在技术、标准、协议融合中是否需要新的规范( 标准) ; ( 3 ) 如果需要融合和制定新的标准,那么如何将这些不同的标准集成在一起。 m p e g 一2 1 的范围可以描述成是一个关键技术的集成,这些技术可以通过访问全球 网络和设备实现对多媒体资源的透明和增强使用。实现内容创建、发布、小号 和使用、表示、识别和描述、知识产权管理和保护、财政管理、用户的隐私权 保护、终端和网络资源抽取、事件报告等功能1 。 1 3 研究课题的来源、目的及意义 本课题来源于企业合作项目,其目的就是通过对m p e g 一2 标准的研究,设计 出一个功能强大、效率高的m p e g 一2 视频播放系统。此播放器要求能正常播放 m p e g - 2 码流,能够实现快速播放功能,而且要求耗用的c p u 和内存少。 m p e g - 2 标准应用广泛,例如用于卫星转播服务( 家庭应用) 、c a t v 光纤网、 铜轴电缆等上的有线电视转播、有线数字音频转播、数字音频广播( 地面和卫星 广播) 、数字地面电视广播、电子影院、电子化新闻采集( 包括s n 哪星新闻采 集) 、固定卫星服务、家庭电视剧场、人际通信( 电视会议,视频电话等) 、交互 式存储媒体( 光盘等) 、多媒体邮件、新闻和快讯、网络数据库服务、遥控监视、 连续存储媒体等。因此,研究m p e g - 2 标准具有重要的意义。 同时,随着i t 业的发展,“三网合一”成为可能,于是在电脑上播放t s 流 成为一种需求,为了有效的提高电脑的利用率,设计一个高效的m p e g 一2 变得很 有意义,而且具有广阔的应用前景。 武汉理工大学硕士学位论文 1 4 本论文的主要工作与组织结构 1 4 1 主要工作 本文对m p e g 一2 标准进行了深入地研究,设计实现了性能良好的快速播放系 统。主要工作有: ( 1 ) 对d p e g 一2 标准的系统部分和视频部分进行了详细地分析研究: ( 2 ) 对设计快速播放系统的可行性进行了分析,提出了性能良好的快速播 放系统的解决方案; ( 3 ) 设计了基于w i n d o w s 平台的快速播放系统。 1 4 2 组织结构 本文分为五章,章节安排如下: 第一章简要介绍了图像编码技术的历史和现状,并说明了研究课题的来 源、目的及意思。 第二章首先介绍了m p e g 一2 标准的系统部分和视频部分,包括程序流、传 输流,p e s 分组,视频流结构、视频流特征等,然后分析研究了解码过程以及涉 及的主要算法。 第三章给出了视频播放系统的整体框架,对各分模块进行了详细地设计: 同时给出了设计框图和实现过程,对其中一些关键的程序和数据结构进行了说 明。 第四章说明了设计的视频播放系统运行的效果,对在不同性能的电脑上得 到的测试结果进行了分析,总结出了系统的性能。 第五章对整个论文进行了总结,说明了下一步的工作,并对未来进行了展 望。 6 武汉理工大学硕士学位论文 第2 章m p e g 一2 解码原理 2 1m p e g - 2 标准简介 m p e g 一2 标准是在m p e g l 标准的基础上产生的。m p e g - 2 标准是为了满足对 诸如数字存储媒体,电视传播以及通信等应用中对运动图像及相关音频一般的 编码方法的日益增长的需求而制定的,是针对大范围码率而定义的编码标准, 最高速率可至4 0 m b s ,压缩比已高达2 0 0 :l 。m p e g 一2 标准除了可以对音频和视 频进行高效的、低比特率的压缩以外,还具有随机访问、特技模式、多点传送、 多种音频和视频、3 d 图像等特性。 m p e g - 2 标准的正式名称为“i s o i e c1 3 8 1 8 信息技术一活动图象和相关声 音信息的一般编码方法”。这个标准由以下1 0 部分组成: 第一部分i s o i e c l 3 8 1 8 1 ,s y s t e m :系统。描述多个视频、音频和数据 原始流合成传输流和节目流的方式。 第二部分一i s o i e c l 3 8 1 8 2 ,v i d e o :视频。描述视频编码方法。 第三部分一i s o i e c l 3 8 1 8 3 ,a u d i o :音频。描述与m p e g 一1 音频标准反向 兼容的音频编码方法。 第四部分一i s o i e c l 3 8 1 8 4 ,c o m p l i a n c e :兼容测试。描述测试一个编码 码流是否符合m p e g 一2 码流的方法。 第五部分一i s o i e c l 3 8 1 8 5 ,s o f t w a r e :软件仿真。描述了m p e g 一2 标准 第一、二、三部分的软件实现方法。 第六部分i s o i e c l 3 8 1 8 6 ,d s m - c c :数字存储媒体一命令与控制。描述 交互式多媒体网络中服务器与用户间的会话信令集。 第七部分一i s 0 i e c l 3 8 1 8 7 ,n b c a u d i o :描述不与m p e g - i 音频反向兼容 的多通道音频编码。 第八部分一i s 0 i e c l 3 8 1 8 8 ,i 0b i t v i d e o :1 0b i t 视频扩展。 第九部分一i s 0 i e c l 3 8 1 8 9 ,r e a l t i m ei n t e r f a c e :传输流的实时接口。 第十部分一i s o i e c l 3 8 1 8 一i 0 :d s m - c cc o n f o r m a n c e ,d s m c c 的一致性扩 展。 武汉理工大学硕士学位论文 m p e g - 2 标准的核心内容是前三部分:系统、视频和音频。由于本文主要研 究视频编码方法,所以这里将主要研究介绍系统和视频部分。 2 2m p e g - 2 标准主要部分介绍 2 2 1m p e g - 2 系统部分说明 m p e g 一2 系统部分强调将一个或更多的音频、视频或其他的基本数据流合成 单个或多个数据流,以适应于存储和传输“。 单个的音频和视频原始数据流的基本多路复用方法如图2 1 所示,按照 i t u t r e c h 2 6 2ii s o i e c1 3 8 1 8 2 和i s o i e c1 3 8 1 8 3 标准对视频和音频信 号进行编码压缩后的原始流被组合形成p e s 分组。当p e s 分组形成的时候,使 用该分组所需的与传送流及程序流无关的信息是可被加入的。当p e s 分组加上 系统级信息形成传送流或程序流时信息则是不必要加入的。 图2 1 i t u tr e c h 2 2 2 0ii s o a e c1 3 8 1 8 1 简化的总体框图 m p e g - 2 的系统部分为了使编码码流能够在卫星、电缆和地面频道等信道中 传输以及兼容m p e g l 系统层码流,定义了两种码流结构:节目流( p r o g r a m s t r e a m ) 和传送流( t r a n s p o r ts t r e a m ) 结构。它们分别适用于不同的场合。 1 传送流 传送流( t s 流) 是根据i t u tr e c h 2 2 2 01 s 0 i e c1 3 8 1 8 - 2 和i s o i e c 1 3 8 1 8 3 协议而定义的一种数据流,其目的是为了在有可能发生严重错误的环境 下进行一道或多道程序的编码数据的传送和存储。这种错误表现为比特值错误 武汉理工大学硕士学位论文 或分组丢失“。 传送流的速率可以是变化的或固定不变的。在任何情况下组成的原始流可 以变化或固定,在这些情况下的语法和语义限制都是相同的。传送流速率由程 序参考时钟( ( p c r ) 字段的位置和数值所决定,通常对于每个程序都有自己的p c r 字段。 然而,当传送流有多道程序时,要构造一个所有的比特率都在变化的传送 流是很困难的,因为对每道程序来说传送流速率是分段常数,而且当有复合程 序时,那些被检测的拐点不会在同一地方。 传送流可以用很多方法产生有效的数据流:从原始的编码的数据流、从程序 流、从其它本身包含一个或多个程序的传送流都可以构成含有一道或多道程序 的传送流。 t s 流主要包括分组方法、程序特殊信息( p s i ) 表以及程序参考时钟( p c r ) 的提取。 ( 1 ) 分组方法 传送流分组长度固定为1 8 8 字节“”,分组由分组首部及有效负载组成,其 结构如图2 - 2 所示。 1 bl b i tl b i tl b i t1 3 b i t2 b i t2 b i t4 b i t 同步传输误码有教荷载单元传输传输加自适应连续 字节指示符起始指示符优先级 p i d 扰控制控制计数器 一 一 4 b最大1 8 4 b 自适应区 包头包数据 ( 可选) 1 bl b最大1 8 2 8 自适应 标志 信亲主薯霎拿的 填充敷据 区长 i b i ti b i ti b i ti b i ti b i ti b i t1 b i ti b i t 间断指随机存储基本码流 p c r 接点传输专用原始p c r自适应区 示符指示符优化指示符标志标志数据标志标志扩展标志 图2 2 传送流的结构 由上图可见,t s 包由包头、自适应区和包数据3 部分组成。每个包长度为 9 武汉理工大学硕士学位论文 固定的1 8 8b ,包头长度占4b ,自适应区和包数据长度占1 8 4b o 1 8 4b 为有 用信息空问,用于传送己编码的视音频数据流。当节目时钟基准( p c r p r o g r a m c l o c kr e f e r e n c e ) 存在时,包头还包括可变长度的自适应区,包头的长度就会 大于4b 。考虑到与通信的关系,整个传输包固定长度应相当于4 个a t m 包。考 虑到加密是按照8b 顺序加扰的,代表有用信息的自适应区和包数据的长度应 该是8b 的整数倍,即自适应区和包数据为2 3 8b = 1 8 4b 。 ( 2 ) 程序特殊信息( p s i ) p s i 被分成4 类表。如表2 一l 所示,每个表可被分成1 段或多段置于传送流 中。这4 类表是:程序关联表p a t ( p r o g r a ma s s o c i a t i o nt a b l e ) 、程序映射表 p m t ( p r o g r a mm a pt a b l e ) 、网络信表n i t ( n e t w o r ki n f o r m a t i o nt a b l e ) 、条 件访问表c a t ( c o n d i t i o n a la c c e s st a b l e ) 。这4 类表中包含进行多路解调和 显示程序的必要和足够的信息。 系统层解复用时,首先要获取p a t 表。p a t 表中包含了该传送流中所有程序 的一个清单。通过p a t 表,就可获取该传送中所包含每个程序的p m t 表。 在每个程序的p m t 表中,就有该程序中各个原始流的信息,包括p i d 、原始 流类型以及该程序中包含有效p c r 字段的传送流中p i d 。通过p a t 及p m t 表,就 可掌握传送流中每个程序以及每个程序中各原始之间的关系。 表2 - i 程序特殊信息 结构名流类型保留的p i d #描述 i t u _ tr e c h 2 2 2 0j 程序关联表0 x 0 0关联程序号与程序映射表p i d i s o i e c1 3 8 1 8 - 1 i t u tr e c h 2 2 2 0 1 说明1 个或多个程序组成部分的 程序映射表赋值的( 由p a t 指定) i s o i e c1 3 8 1 8 1p i d 值 物理网络参数:f d m 频率、发送 网络信息表私用赋值豹( 由p a t 指定) 器号码等等 i t u t r e c h 2 2 2 0 1建立1 个或多个( 私用) e m m 流 条件访问表 0 x 0 1 i s o i e c1 3 8 1 8 - 1 与每个独立的p i d 值的联系 网络信息表时可选的,其内容是私有的。 条件访问表提供一个或多个c a 系统。 l o 武汉理工大学硕士学位论文 ( 3 ) p c r 在传送流中,解码的同步实现是靠相应的程序参考时间p c r 值。p c r 是将比 特流本身的时序编码的时间标签,它可以由同一道程序的视频和音频的f f s 所 用的共同时间基点推出。由于每道程序都有自己的时间基点,所以含有多道程 序的传送流的每一道程序都有独立的p c r 字段。 2 程序流 程序流是一种数据流定义,用来传送和保存一道程序的编码数据或其它数 据。它主要是针对那些不容易发生错误的环境,同时也针对系统编码的处理为 主要关注对象,特别是软件处理的环境1 。 程序流可有固定的或变化的速率,在每一种情况下,组成的原始数据流可 以有固定的或变化的速率。语法和语义限制对每种情况来说都是相同的。程序 流速率由系统参考时钟( s c r ) 和m u xr a t e 字段的位置和数值所决定。 一个音频视频程序流解码系统的原型如图2 - 3 所示。它的结构不是唯一的, 它包括解码时钟控制在内的系统解码器功能可以通过平均分布在原始数据流解 码器和通道特殊解码器来完成一但这对讨论来说仍是有用的。这个原型的解码 器设计并未对程序解码器的设计提出任何正式的要求,事实上,非音频视频数 据也是允许的,但并没有画出。 ! 厂叫望竺竺竺兰h 监l 磊嗥 i l千i 骂匿野刊熏口母: i l+: il 一磊i 牌 l i 图2 3 程序流原型解码器 图2 3 所示的典型程序流解码器由系统、视频和音频解码器组成,它们分 别对应于国际标准f p e g 一2 的第1 ,2 ,3 部分。在此解码器中,一道或多道音频、 视频流的多路复用编码表示,假设以某种特殊通道格式在一些通道上被存储或 被传送,这种特殊通道格式不受国际标准的制约,也不属于原型解码器的通道 特殊解码部分。 武汉理工大学硕士学位论文 原型的解码器以程序流为输入,并依靠程序流解码器从输入流中提取时间 信息。程序流解码器对输入流进行多路解调,产生作为音频、视频解码器输入 的原始数据流,最后结果就是解码后的视频、音频信号。 在此图中并未画出的设计有:时间信息在程序流解码器、音频视频解码器 和通道特殊解码器中的流动。音频视频解码器相互之间以及和通道之间通过这 个时间信息保持同步。 程序流由两层构成:系统层和压缩层。程序流解码器的输入流有一个包含 压缩层的系统层。音频、视频解码器的输入流只有一个压缩层。 原型解码器的操作可以用于整个程序流( “多路复用宽操作”) ,或者用于 单个的原始数据流( “特定数据流操作”) 。传送流系统层又可分为两个子层, 一个相应于多路复用宽操作( 组合层) ,另一个相应于特殊流操作( p e s 分组层) 。 3 传送流和程序流之间的转换( p e s 分组) 通过p e s 分组,传送流和程序流之间的转换是可能的和合理的,只要满足 国际标准m p e g 一2 提出的关于传送流和程序流的规格化要求就可以了。在某些条 包开始 流i d p e s 分组可选p e s 分组 代码前缀长度 p e s 首部 数据字节 p e s 加p e sp e s 对准原版7 个p e s 首部可选填充 1 0版权 密控制优先级指示器或拷贝标志数据长度字段字节 p t s e s c re s 率 d 6 m附近拷前一个p e s 扩 d t s类型 贝信息 p e f ic r c 展域 5 个标志可选字段 p e s 私组首部程序分f - s t dp e s 扩展p e $ 扩展 用数据字段组控制缓冲区字段长度字段数据 图2 - 4 p e s 分组结构 件限制下p e s 分组可以直接从一个多路复用的比特流的有效负载映射为另一个 多路复用比特流的有效负载。有可能通过识别一道程序中p e s 分组的正确顺序 来支持上面的映射转换。”。转换所需的其它一些信息,例如原始流之问的关系 2 武汉理工大学硕士学位论文 都可以从两种流的表格和头部信息获得。所有流中的这些信息在转换前后都必 须有效和正确。p e s 分组的结构图如图2 4 所示。 将m p e g 一2 压缩编码的视频基本流( e s e l e m e n t a r ys t r e a m ) 数据分组为包 长度可变的数据包,称为打包基本流( p e s p a c k e t i z e de l e m e n t a r ys t r e a m ) 。 广而言之,p e s 为打包了的专用视频、音频、数据、同步、识别信息数据通道。 所谓e s ,是指只包含1 个信源编码器的数据流。即e s 是编码的视频数据流,或 编码的音频数据流,或其它编码数据流的统称。每个e s 都由若干个存取单元 ( a u - a c c e s su n i t ) 组成,每个视频a u 或音频a u 都是由头部和编码数据两部分组 成的。将帧顺序为1 1 p 4 8 2 8 3 p 7 b s b 6 的编码e s ,通过打包,就将e s 变成仅含有 1 种性质e s 的p e s 包,如仅含视频e s 的p e s 包,仅含音频e s 的p e s 包,仅含 其它e s 的p e s 包。p e s 包的组成见图2 5 所示。 3 b1 b2 3 包头起始码前缀数据流识别符p e s 包长 6 b l3 2 5 9 bj 可变长度( t ,q s 5 5 2 6 b ) 包头i 基本流特有信息l 包数据 、 2 b1 b0 4 6 b最多2 5 6 b p e s 包头识别标志p e s 包头长信息区填充字节 2 b i tl b i tl b i ti b i ti b i t2 b i t l1 b i t1 b i tl b i t2 b i ti b i tl b i t p e s 加p e s j cp e s 对准原版或e r s m 吲e s c r基本流速d 钳特技方附近的信p e sc r cp e s 扩 密控制先级指示符 版权 拷贝标志l 标志率标志式标志息拷贝标志展标志 图2 5p e s 包组成 由图2 5 可见,1 个p e s 包是由包头、e s 特有信息和包数据3 个部分组成。 由于包头和e s 特有信息二者可合成1 个数据头,所以可认为1 个p e s 包是由数 据头和包数据( 有效载荷) 两个部分组成的。 包头由起始码前缀、数据流识别及p e s 包长信息3 部分构成。包起始码前 缀是用2 3 个连续“0 ”和1 个“l ”构成的,用于表示有用信息种类的数据流识 别,是1 个8b i t 的整数。由二者合成1 个专用的包起始码,可用于识别数据 包所属数据流( 视频,音频,或其它) 的性质及序号。例如; 比特序11 0 是号码为的m p e g - 2 音频数据流; 武汉理工大学硕士学位论文 比特序1 110 是号码为的m p e g 一2 视频数据流。 p e s 包长用于包长识别,表明在此字段后的字节数。如,p e s 包长识别为2b , 即2 8 = 1 6b i t 字宽。包总长为2 “1 6 一i = 6 5 5 3 5b ,分给数据头9b ( 包头6b + e s 特有信息3b ) ,可变长度的包数据最大容量为6 5 5 2 6b 。尽管p e s 包最大 长度可达( 2 1 6 1 ) = 6 5 5 3 5b ( b y t e ) ,但在通常的情况下是组成e s 的若干 个a u 中的由头部和编码数据两部分组成的1 个a u 长度。1 个a u 相当于编码的 1 幅视频图像或1 个音频帧,可以说,每个a u 实际上是编码数据流的显示单元, 即相当于解码的1 幅视频图像或1 个音频帧的取样。 e s 特有信息是由p e s 包头识别标志、p e s 包头长信息、信息区和用于调整信 息区可变包长的填充字节4 部分组成的p e s 包控制信息。其中,p e s 包头识别标 志由1 2 个部分组成:p e s 加扰控制信息、p e s 优先级别指示、数据适配定位指 示符、有否版权指示、原版或拷贝指示、有否显示时间标记( p t s p r e s e n t a t i o n t i m es t a m p ) 解码
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 脑裂伤的护理措施
- body-language知识教学课件
- 2024年护理安全课件
- 新发展英语(第二版)综合教程2 课件 Unit 8 Food
- 2019培训课件教学课件
- 人教版数学六年级下册6.2图形与几何练习卷含答案
- 无锡市南长区重点达标名校2025年全国新初三下学期开学大联考试题英语试题含答案
- 云南水利水电职业学院《电视新闻节目制作》2023-2024学年第二学期期末试卷
- 2017安全生产课件
- 浙江省富阳市重点中学2025年初三中考冲刺预测卷(六)英语试题含答案
- 家禽委托屠宰合同协议书
- 2024年全国职业院校技能大赛高职组(法律实务赛项)考试题库(含答案)
- 酒店式公寓开发财务分析实例
- JJF 2122-2024机动车测速仪现场测速标准装置校准规范
- 企业所得税汇算清缴申报表电子表格版(带公式-自动计算)
- 高压电工证考试题库及答案(完整版)
- 施工项目环境保护管理组织机构
- 辽宁省沈阳市郊联体重点高中2023-2024学年高二下学期4月月考化学试题
- 高中学籍档案课程学分填写样式-历史化学政治
- 南京市旭东中学2023-2024学年中考语文全真模拟试卷含解析
- 工业机器人基础及应用高职全套教学课件
评论
0/150
提交评论