版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础一、预测编码四、压缩编码应用综述四、压缩编码应用综述二、变换编码三、统计编码信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础1、声音压缩国际标准2、静止图像压缩国际标准3、视频压缩国际标准信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础1 1、声音压缩国际标准、声音压缩国际标准2、静止图像压缩国际标准3、视频压缩国际标准信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础语音300 - 3400 Hz会议电视50 - 7000 Hz高保真20 - 20000 Hz波波形形编编码码参数编码
2、参数编码混混合合编编码码算法算法名名 称称数据率数据率标准标准应用应用质量质量PCM均匀量化u(A)u(A)64kb/sG.711APCM 自适应量化DPCM差值量化ADPCM自适应差值量化32kb/sG.721SB-ADPCM子带-自适应差值量化64kb/sG.722G.7235.3(6.3)公共网ISDN配音4.04.5LPC线性预测编码 2.4kb/s保密话声2.53.5CELPC13.2kb/s码激励LPC4.8kb/s移动通信VSELP矢量和激励LPC 8kb/s语音邮件RPE-LTP长时预测规则码激励ISDNLD-CELP低延时码激励LPC16kb/sG.728G.7294.03.
3、7MPEG多子带 感知编码128kb/sCD5.0AC-3感知编码音响5.0音频标准性能指标信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础国际声音标准比较国际声音标准比较音频信号 输入发送器SB-ADPCM编码器SB-ADPCM解码器接收器音频信号 输出数据内插装置数据分解装置输入0,8,16kb/s输出0,8,16kb/s64kb/s输出64kb/s输入音频编码音频译码信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础G.722发送QMF高子带ADPCM编码器低子带ADPCM编码器MUX48kb/s16kb/s64kb/s信息论与编码基础信息论与编码基础信源压
4、缩信源压缩编码基础编码基础子带编码子带编码利用M个带通滤波器把信号频带分解成若干子带,通过移频将各个子带信号转到基带后按奈奎斯特速率重新采样,再对采样值进行通常的数字编码并复合成一个统一的传输码流。语音的SBS ( Subband Coding)是R.E.Crochiere等人在1976年引入的;1985年S.D.ONeil的硕士论文将SBC推广用于图像编码;目前在典型的数字音频压缩实用方法中,SBC已经成为主体技术框架。把音频信号分成子带后进行编码的优点: 1、码位分配灵活 2、噪声限在带内 在多媒体中,音频有很多压缩编码标准:在多媒体中,音频有很多压缩编码标准:1. MP31. MP3音频
5、音频 MP3 MP3的全名是的全名是MPEG Audio Layer-3MPEG Audio Layer-3,简单地,简单地说就是一种声音文件的压缩格式。是目前最普说就是一种声音文件的压缩格式。是目前最普及的音频压缩格式,是典型的有损压缩。及的音频压缩格式,是典型的有损压缩。 MPEG-1MPEG-1音频压缩标准里包括了三个使用高性音频压缩标准里包括了三个使用高性能音频数据压缩方法的感知编码方案能音频数据压缩方法的感知编码方案 ,按照压,按照压缩质量缩质量( (每每BitBit的声音效果的声音效果) )和编码方案的复杂程和编码方案的复杂程度分别是度分别是Layer1Layer1、Layer2L
6、ayer2、Layer3Layer3。信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础nMPEG-1音频的层次与压缩比率 Layer1(相当于384kbps立体声信号)4:1Layer2(相当于192256kbps立体声信号)6:18:1Layer3 (相当于112154kbps立体声信号)10:112:1信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础 MP3MP3是利用是利用 MPEG Audio Layer 3 MPEG Audio Layer 3 的技术,将音乐的技术,将音乐以以1:10 1:10 甚至甚至 1:12 1:12 的压缩率,压缩成容量较小的
7、文的压缩率,压缩成容量较小的文件,换句话说,能够在音质丢失很小的情况下把文件件,换句话说,能够在音质丢失很小的情况下把文件压缩到更小的程度。而且还非常好的保持了原来的音压缩到更小的程度。而且还非常好的保持了原来的音质。正是因为质。正是因为MP3MP3体积小,音质高的特点使得体积小,音质高的特点使得MP3MP3格式格式几乎成为网上音乐的代名词。每分钟音乐的几乎成为网上音乐的代名词。每分钟音乐的MP3MP3格式格式只有只有1MB1MB左右大小,这样每首歌的大小只有左右大小,这样每首歌的大小只有3-43-4兆字节兆字节。使用。使用MP3MP3播放器对播放器对MP3MP3文件进行实时的解压缩文件进行实
8、时的解压缩( (解码解码) ),这样,高品质的,这样,高品质的MP3MP3音乐就播放出来了。音乐就播放出来了。信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础 2. MP3PRO2. MP3PRO MP3PROMP3PRO,它是,它是 Thomson MultimediaThomson Multimedia多媒体公司多媒体公司推出的一个推出的一个MP3MP3格式的升级版本,格式的升级版本,MP3PROMP3PRO可以把声音可以把声音文件压缩到原有文件压缩到原有MP3MP3格式的一半大小,但却可以保持格式的一半大小,但却可以保持相同的音质。相同的音质。 MP3Pro MP3Pro
9、制式是利用制式是利用低转送速率技术低转送速率技术(bit per bit per secsec),即平常一首),即平常一首MP3MP3的频率大多是的频率大多是128kbit128kbit,而,而MP3ProMP3Pro则固定于则固定于80kbit80kbit,降低码率就可以降低文件大,降低码率就可以降低文件大小小, ,把每首把每首MP3MP3所占空间减低到原有的所占空间减低到原有的5 5至至6 6成;但音质成;但音质却丝毫无损。却丝毫无损。 信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础 2. MP3PRO2. MP3PRO MP3PROMP3PRO文件在播放上完全与文件在播
10、放上完全与MP3MP3兼容,也就是说,兼容,也就是说,老的老的MP3MP3文件可以在新的文件可以在新的MP3PROMP3PRO播放器上进行播放,同播放器上进行播放,同时,新的时,新的MP3PROMP3PRO可以在标准的可以在标准的MP3MP3软件和设备上播放,软件和设备上播放,但效果可能较差,因为两者录制方式不同。但效果可能较差,因为两者录制方式不同。 信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础 3. OGG3. OGG OggOgg是一种先进的有损的音频压缩技术,正式名称是一种先进的有损的音频压缩技术,正式名称是是Ogg VorbisOgg Vorbis,是一种免费的开
11、源音频格式。,是一种免费的开源音频格式。OGGOGG编编码格式远比码格式远比9090年代开发成功的年代开发成功的MP3MP3先进,它可以在相先进,它可以在相对较低的数据速率下实现比对较低的数据速率下实现比MP3MP3更好的音质。更好的音质。 Ogg VorbisOgg Vorbis支持支持VBRVBR(可变比特率)和(可变比特率)和ABRABR(平均比(平均比特率)两种编码方式,特率)两种编码方式, OggOgg还具有比特率缩放功能,还具有比特率缩放功能,可以不用重新编码便可调节文件的比特率。可以不用重新编码便可调节文件的比特率。信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础
12、 3. OGG3. OGG OGGOGG格式可以对所有声道进行编码,支持多声道格式可以对所有声道进行编码,支持多声道模式,模式,而不像而不像MP3MP3只能编码双声道只能编码双声道。多声道音乐会带。多声道音乐会带来更多临场感,欣赏电影和交响乐时更有优势,这场来更多临场感,欣赏电影和交响乐时更有优势,这场革命性的变化是革命性的变化是MP3MP3无法支持的。在而且未来人们对无法支持的。在而且未来人们对音质要求不断提高,音质要求不断提高, OggOgg的优势将更加明显。的优势将更加明显。 信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础 4. WMA 4. WMA WMA (Wind
13、ows MediaAudio)WMA (Windows MediaAudio)格式是来自于微软的格式是来自于微软的重量级选手,后台强硬,音质要强于重量级选手,后台强硬,音质要强于MP3MP3格式,更远胜格式,更远胜于于RARA格式,它是以减少数据流量但保持音质的方法来格式,它是以减少数据流量但保持音质的方法来达到比达到比MP3MP3压缩率更高的目的,压缩率更高的目的,WMAWMA的压缩率一般都可的压缩率一般都可以达到以达到1 1:1818左右左右. . WMA WMA的另一个优点是内容提供商可以通过的另一个优点是内容提供商可以通过DRMDRM(DigitalcentersManagementD
14、igitalcentersManagement)方案如)方案如Windows Media Windows Media centersManager7centersManager7加入防拷贝保护。加入防拷贝保护。 信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础 4. WMA 4. WMA WMAWMA还支持音频流技术,适合在网络上在线播放,还支持音频流技术,适合在网络上在线播放,更方便的是不用象更方便的是不用象MP3MP3那样需要安装额外的播放器,而那样需要安装额外的播放器,而WindowsWindows操作系统和操作系统和WindowsMediaPlayerWindowsMe
15、diaPlayer的无缝捆绑让的无缝捆绑让你只要安装了你只要安装了windowswindows操作系统就可以直接播放操作系统就可以直接播放WMAWMA音音乐,新版本的乐,新版本的WindowsMediaPlayerWindowsMediaPlayer更是增加了直接把更是增加了直接把CDCD光盘转换为光盘转换为WMAWMA声音格式的功能,在声音格式的功能,在windowswindows操作系操作系统中,统中,WMAWMA是默认的编码格式是默认的编码格式 音质好的可与音质好的可与CDCD媲美,压缩率较高媲美,压缩率较高, ,可用于网络广可用于网络广播。播。信息论与编码基础信息论与编码基础信源压缩信
16、源压缩编码基础编码基础5 5、MP4MP4nMP4MP4并不是并不是MPEG-4MPEG-4或者或者MPEG-1Layer4MPEG-1Layer4,它的出现是针对,它的出现是针对MP3MP3的大众化、无版权的一种保护格式。的大众化、无版权的一种保护格式。nMP4MP4使用的是使用的是MPEG-2 AACMPEG-2 AAC技术也就是俗称的技术也就是俗称的a2ba2b或或AACAAC。其。其中,中,MPEG-2MPEG-2是是MPEGMPEG于于19941994年年1111月针对数码电视月针对数码电视( (数码影像数码影像) )提出的。它的特点就是,音质更加完美而压缩比更加大提出的。它的特点就
17、是,音质更加完美而压缩比更加大(1:15)(1:15)。MPEG-2 AAC(ISO/IEC 13818-7)MPEG-2 AAC(ISO/IEC 13818-7)在采样率为在采样率为8 896KHz96KHz下提供了下提供了1 14848个声道可选范围的高质量音频编码。个声道可选范围的高质量音频编码。AACAAC就是就是Advanced Audio Coding(Advanced Audio Coding(先进音频编码先进音频编码) )的意思,的意思,适用于从比特率在适用于从比特率在8kbit/s8kbit/s单声道的电话音质到单声道的电话音质到160kbit/s160kbit/s多声道的超
18、高质量音频范围内的编码,并且允许对多媒体多声道的超高质量音频范围内的编码,并且允许对多媒体进行编码进行编码/ /解码。解码。信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础nAACAAC与与MP3MP3相比,增加了诸如对立体声的完美再现、比特流效相比,增加了诸如对立体声的完美再现、比特流效果音扫描、多媒体控制、降噪优异等果音扫描、多媒体控制、降噪优异等MP3MP3没有的特性,使得没有的特性,使得在音频压缩后仍能完美的再现在音频压缩后仍能完美的再现CDCD音质。音质。n AACAAC技术主要由以下三个部分组成。技术主要由以下三个部分组成。 第一,第一,AT&TAT&
19、;T的音频压缩技术专利。它可以将的音频压缩技术专利。它可以将AACAAC压缩比提高到压缩比提高到20:120:1而不损失音质。这样,一首而不损失音质。这样,一首3 3分钟的歌仅仅需要分钟的歌仅仅需要2.25MB2.25MB,这在互联网上的下载速度是很惊人的。这在互联网上的下载速度是很惊人的。 第二、安全数据库。它可以为你的第二、安全数据库。它可以为你的AAC MusicAAC Music创建一个特定的创建一个特定的密钥,将此密钥存于其数据库中。同时,只有密钥,将此密钥存于其数据库中。同时,只有AACAAC的播放器的播放器才能播放含有这种密钥的文件。才能播放含有这种密钥的文件。 第三、协议认证。
20、这个认证包含了复制许可、允许复制副本数第三、协议认证。这个认证包含了复制许可、允许复制副本数目、歌曲总时间、歌曲可以播放时间以及售卖许可等信息。目、歌曲总时间、歌曲可以播放时间以及售卖许可等信息。信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础nMP4MP4技术的优越性要远远高于技术的优越性要远远高于MP3MP3,因为它更适合多媒体技,因为它更适合多媒体技术的发展以及视听欣赏的需求。但是,术的发展以及视听欣赏的需求。但是,MP4MP4是一种商品,是一种商品,它利用改良后的它利用改良后的MPEG-2 AACMPEG-2 AAC技术并强加上由出版公司直接技术并强加上由出版公司直接授
21、权的知识产权协议作为新的标准;而授权的知识产权协议作为新的标准;而MP3MP3是一种自由音是一种自由音乐格式,任何人都可以自由使用乐格式,任何人都可以自由使用。此外,。此外,MP4MP4实际上是由实际上是由音乐出版界联合授意的官方标准;音乐出版界联合授意的官方标准;MP3MP3则是广为流传的民则是广为流传的民间标准间标准。相比之下,。相比之下,MP3MP3的灵活和自由度要远远大于的灵活和自由度要远远大于MP4MP4,这使得音乐发烧友们更倾向于使用这使得音乐发烧友们更倾向于使用MP3MP3。更重要的一点是,。更重要的一点是,MP3MP3是目前最为流行的一种音乐格式,它占据着大量的网是目前最为流行
22、的一种音乐格式,它占据着大量的网络资源,这使得络资源,这使得MP4MP4的推广普及难上加难。的推广普及难上加难。 信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础 6. 6. WAVE WAV格式是微软公司开发的一种声音文件格式,格式是微软公司开发的一种声音文件格式,也叫波形声音文件,是最早的数字音频格式,被也叫波形声音文件,是最早的数字音频格式,被Windows平台及其应用程序广泛支持。平台及其应用程序广泛支持。WAV格式支持格式支持许多压缩算法,支持多种音频位数、采样频率和声道许多压缩算法,支持多种音频位数、采样频率和声道,采用,采用44.1kHz的采样频率,的采样频率,1
23、6位量化位数,因此位量化位数,因此WAV的音质与的音质与CD相差无几,但相差无几,但WAV格式对存储空间需求太格式对存储空间需求太大不便于交流和传播大不便于交流和传播 信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础1、声音压缩国际标准2 2、静止图像压缩国际标准、静止图像压缩国际标准3、视频压缩国际标准信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础qJPEG ( Joint Photographic Expert Group)1992年,联合图片专家组正式完成用于各种分辨率和格式的连续色调图像的
24、ISO/IEC 10918标准,即JPEG标准。 JPEG标准支持渐进建立和顺序建立两种图像建立模式,适合分辨率和格式的连续色调图像;支持以下四种操作模式: 1、基于DCT的顺序型操作模式; 2、基于DCT的渐进型操作模式; 3、基于DPCM的无损编码(顺序型)操作模式; 4、基于多分辨率编码的(渐进型)操作模式; 1、基于DCT的顺序型操作模式; 信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础qJPEG ( Joint Photographic Expert Group)顺序模式信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础qJPEG ( Joint Ph
25、otographic Expert Group)渐进模式JPEG-DCT信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础8*8块DCT量化器熵编码器源图像数据基于DCT的编码器压缩的图像量化表熵编码表基本系统qJPEG ( Joint Photographic Expert Group)信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础亮度量化表亮度量化表信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础信息论与编码基础信息
26、论与编码基础信源压缩信源压缩编码基础编码基础qJPEG -LSJPEG组织从1994年开始征集新的无损/近无损压缩算法提案,于1998年2月作为ITU-T建议T.87(草案)|国际标准ISO/IEC 14495-1正式公布。 上下文建模预 测误差编码游程模式数字源图像数据信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础qJPEG -LS前一行当前行S6S3S2S4S7S5S1S0上下文的建模是基于局部梯度的计算:4SD1 = - 2S2SD2 = - 3S3SD3 = - 1S如果对i=1,2,3,都有:Di= 0对无损编码|Di| NEAR对近无损编码基于上下文建模信息论与编
27、码基础信息论与编码基础信源压缩信源压缩编码基础编码基础qJPEG 2000传统JPEG标准:1)低码率压缩2)无损压缩和有损压缩3)计算机合成图像与复合文档的压缩4)在噪声环境中传输信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础qJPEG 20002000年12月,公布了JPEG2000的第1部分(核心编码系统)作为正式的国际标准,ISO/IEC 15444-1|ITU-T T.800。 JPEG2000的目标是对多种类型的静止图像(如自然图像、计算机图像、医疗图像、遥感图像以及复合文本等)实现高效压缩,并要求压缩码流具有较好的抗误码性能,用户可对图像进行多种形式的渐进传输,
28、还可压缩码流进行随机访问和处理。 JPEG2000 标准可分为六大部分: Part 1:基本系统; Part 2:基本系统的一些扩展功能; Part 3:“Motion JPEG 2000” ; Part 4:一致性测试; Part 5:实现Part 1 的参考软件; Part 6:定义复合图像文件格式JPM。 信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础qJPEG 2000JPEG 2000特征集 1)压缩一次:多种解压方式 集成了四种JPEG模式的优点,由编码器选择最高分辨率或最大图像尺寸,并决定最佳图像质量(包括无损压缩质量),而解码器则可以从压缩码流中解出任何质量或
29、尺寸的图像,直到编码端所选择的最佳质量。2)压缩域图像处理/编辑 可直接从JPEG 2000码流中把感兴趣的压缩字节抽取出来,并重组成另一个兼容码流。还有可能直接在压缩域进行图像的剪切、旋转、反转等几何操作。3)渐进性JPEG 2000支持四维渐进传输:质量、分辨率、空间位置和分量。质量:通常只要接收到约相当于0.05bit/pel的码字,即可辨认出一幅图像分辨率:码流的前几个字节用于重现图像的一个小缩略图。随着收到数据的增加,图像分辨率(或尺寸)会以每边倍乘2的速率增加,直至得到整幅图像。空间位置:收端能以近似光栅的形式接收图像序列,由上而下。分量:支持16384分量的图像,每个分量的位深可
30、为138bit。大多数超过4分量的图像来自科学仪器。分量渐进性控制对应于不同分量数据解码的顺序。这种渐进性配合其他渐进性,可用来实现多种分量交织策略。4)低位深图像JPEG2000也能压缩二值图像,把二值图像看成是在单一分辨率下的单一位面。这样则牺牲了在质量上和分辨率上的可伸缩性,但保留了空间随机访问的能力。5)感兴趣编码区域ROI:在位面编码前左移影响ROI内像素的系数,信息写入码流,解码时用来重新对准(右移)相应的系数。信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础qJPEG2000正向预处理DWT量化熵编码
31、码流组织码率控制反向预处理IDWT反量化熵解码源图像重构图像信道传输信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础JPEGJPEG2000418:1信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础JPEG与与JPEG 2000的性能比较的性能比较标准JPEGJPEG 2000主要编码技术离散余弦变换(DCT)知觉量化Zigzag扫描霍夫曼编码算术编码离散小波变化(DWT)EBCOT核心算法ROI编码空间可扩展编码质量可扩展编码面向对象编码位图形状编码容错编码、TCQ、零数扫描压缩比230250算法效率30:1以上急剧下降100:1以上急剧衰减速率失真特性比JP
32、EG提高30%应用场合Internet数字照相图像视频编辑Internet数字照相数字图书馆电子商务打印、扫描、传真、遥感信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础1、声音压缩国际标准2、静止图像压缩国际标准3 3、视频压缩国际标准、视频压缩国际标准信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础q视频压缩编码标准的特点标准的演绎性传统产业标准化的进程往往是在特定工业产品大量推出面市之后,并经过缓慢的归纳过程形成的,最终建立具有评价性目标的标准体系。而以MPEG为代表的多媒体音视频标准的制定则往往超前于市场需求,充分利用当时最先进的技术手段,给予技术发展充
33、裕的自由度,并与相关产业集团紧密联系,使得技术标准能够引领相关产品的发展。标准的通用性传统的标准是使标准中定义的技术、功能与某些特定应用领域密切相关。多媒体音视频压缩编码标准则往往具有扩展性。标准的开放性ITU和ISO/IEC所建立的各种音视频编码标准通常由三部分组成:一个压缩编码系统的体系结构;一套完整的视频压缩码流数据结构语法规则;一个通用解码器算法描述。标准名称 发布机构 发布时间主要用途H.261ITU-T1990ISDN视频会议、可视电话MPEG-1ISO/IEC1993CD-ROM视盘、视频记录MPEG-2ISO/IEC1995DVD、HDTV、视频广播H.263ITU-T1996
34、可视电话、移动可视电话、网络视频H.263+ITU-T1998H.263+ITU-T2002MPEG-4ISO/IEC2000Internet、交互视频、视频内容管理H.264ITU-T2003网络视频、无线移动视频信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础表 ITU和ISO/IEC制定的多媒体压缩编码标准信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础在标准体系构造上在标准体系构造上q两大系列音视频压缩编码标准比较H.26X系列标准更具针对性:仅仅涉及数字视频压缩编码环节。MPEG系列则更系统化,标准涵盖整个多媒体系统在具体应用系统模式上在具体应用系统模
35、式上H.26X系列标准主要围绕各种电信网络所构成的信道而设计,力图在有限的信道资源条件下,实现数字视频信息的高效传输。MPEG系列更具开放性和延展性,注重和其他各种信号处理系统相结合,努力将其构造成面向多种应用的多媒体信息处理的综合性平台。在整体编码技术发展上在整体编码技术发展上H.26X系列标准充分挖掘数字视频系统中的技术潜力,进一步提高视频系统的压缩编码性能。MPEG系列标准在确保音视频信息高效压缩的同时,结合当前多媒体信息发展的趋势,更注重应用层面上各种功能的增加。信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础qH.261标准标准CCITT于1984年成立可视电话专家组
36、,在1988年提出H.261建议草案;主要用于ISDN的会议电视和可视电话应用系统,该系统编解码器必须符合以下要求:1)在很低的传输速率下(64kbps2Mbps)能传送较高质量的图像和语音;2)能够实现双向通信,视频编码器的处理延时150ms;3)为了实现国际联网,必须能兼容不同制式的图像终端;4)既要能在准同步数字体系标准中运行,又要适应未来网络的发展;5)视频编解码器成本较低。 1990年12月,ITU-T H.261正式颁布,是第一个数字视频压缩编码标准。信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础qH.261标准标准编码器框图信息论与编码基础信息论与编码基础信源压
37、缩信源压缩编码基础编码基础qH.261标准标准运动补偿与环路滤波: 引入帧间预测和运动补偿来消除这一时间域相关性,以运动矢量信息和帧差信号替代原始信号进行传递,实现时间域冗余信息的压缩 标准选择运动预测匹配单位为16*16像素的宏块,前向整像素精度运动补偿,匹配搜索范围-15,+15。 运动矢量限制在参考帧的重建图像区域内 ,用于该宏块中4个亮度块;对于两个色差分量,运动矢量减半。信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础qH.261标准标准运动补偿与环路滤波:预测环路中引入一个简单的二维环路滤波器,对运动补偿的预测图像中的每个8*8块进行低通滤波,其作用在于消除预测参考
38、帧中的噪声,从而减少预测误差并降低预测图像的块效应。1/161/81/161/81/41/81/161/81/16nn-1n-2m-1mm-2 利用一个低通平滑滤波模板,对8*8图像块做加权平均处理,即用每一取样值四周的9个取样值按照右图系统进行加权平均,取平均值输出。信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础qH.261标准标准解码器框图信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础极低码率视频编码标准H.263、H.263+、H.263+H.264MPEG4-10双向预测编码模式半像素精度运动补偿运动矢量差分编码机制约束码率与图像质量延时限制差错恢复
39、语法定义网络友好性信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础qMPEG-1运动图像专家组于1988年成立,1993年正式发布码率低于1.5Mb/s用于数字存储媒体的运动图像及伴音的编码标准(ISO/IEC 11172),即MPEG-1,其基本目标:1)编码重建图像质量应高于电视电话的图像质量,达到或接近家用录像机的画面质量2)压缩数据能够存储在几种通用存储媒体上;3)传输码率应符合当时计算机网络的传输码率,即1Mbps 1.5Mbps4)能适应多种网络,如ISDN、局域网等;5)能满足各种实时、非时实的系统要求;6)能够实现支持类似录像机的基本交互功能。信息论与编码基础信
40、息论与编码基础信源压缩信源压缩编码基础编码基础qMPEG-1编码器框图信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础qMPEG-1双向预测: 利用在时间序列上位于其前的图像,或者位于其后的图像,或者二者同时作为参考图像,进行运动估计和运动补偿。IBBBPBBBP量化:对I帧的量化过程中,引入量化矩阵,形成非线性量化处理。信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础qMPEG-2运动图像专家组于1994年正式颁布了ISO 13818的运动图像及伴音标准(MPEG-2)。支持目标码率为4Mbps8Mbps的SDTV支持码率为10Mbps15Mbps的HDTV提
41、出新的运动补偿预测模式为帧内、帧间编码块的DCT系数分别提供独立的VLC码表信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础qMPEG-2变换编码基于DCT编码模式,增加场DCT编码模式。一个16*16宏块的数据被重新排列为两场,然后进行DCT变换。这种模式增加了垂直运动场景下编码块内的相关性,从而提高编码效率。量化仍采用帧内编码块和帧间编码块两个不同的非线性量化矩阵,将量化后帧内模块DC系数的精度从8 bit表示提高到11bit 表示。统计编码 引入交替扫描模式,比zigzag扫描更先处理具有高垂直频率的系数;针对帧内、帧间编码块DCT系数分别提供独立VLC码表。信息论与编码
42、基础信息论与编码基础信源压缩信源压缩编码基础编码基础场DCT变换块重组示意图信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础MPEG-2中的两种扫描模式信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础qMPEG-490年代中后期,人们对未来的视听产品的需求发生变化,体现如下:多媒体视听资源来源的变化多媒体信息传输方式的变化多媒体信息消费方式的变化硬件和软件技术发展带来的变化信息论与编码基础信息论与编码基础信源压缩信源压缩编码基础编码基础qMPEG-41999年,ISO/IEC编号为ISO 14496的新一代音视频对象编码标准MPEG-4正式成为国际标准;2000
43、年,ISO/IEC再推出MPEG-4第二版。允许将已有AV对象组合以生成复合AV对象,并由此生成视听场景;允许对AVOS的数据灵活地进行多路合成和同步,以便选择合适的网络来传输;允许用户在接收端生成的AV场景中与AV对象进行交互操作支持AV对象知识产权的标识与保护。 MPEG-7 标准 MPEG-MPEG-7 7 是是“多媒体内容描述接口多媒体内容描述接口”,”, (Multimedia Content Description Interface) 。准确说来,准确说来, MPEG-7MPEG-7并不是一种压缩编并不是一种压缩编码方法,继码方法,继 MPEG-4MPEG-4之后,要解决的矛盾就是之后,要解决的矛盾就是对日渐庞大的图像、对日渐庞大的图像、声音信息的管理和迅速搜索声音信息的管理和迅速搜索。MPEG7MPEG7就是针对这个矛盾的解决方就是针对这个矛盾的解决方案。案。 其目标
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2030年中国养老服务行业市场全景监测及投资前景展望报告
- 2025年清洁燃料项目可行性研究报告
- 二零二五年度宾馆客房客房用品定制合同示范文本3篇
- 2025年度EPS环保保温材料应用与市场推广合同3篇
- 软件技术咨询及服务外包合同
- 2025至2031年中国脚踏封口封切机行业投资前景及策略咨询研究报告
- 2025至2031年中国立式高压高流率气冷真空炉行业投资前景及策略咨询研究报告
- 教育行业保险资产评估服务合同
- 2024年高层建筑桩基工程承包合同3篇
- 2024版长期咨询服务合同参考
- 设计服务实施方案模板
- 辩论赛医术更重要
- 基于PLC的两台电动机顺序启动顺序停止控制设计
- 张哲华鑫仔小品《警察和我》台词剧本手稿
- 药理学实验方案
- 传染病学 日本血吸虫病
- GB/T 3098.2-2015紧固件机械性能螺母
- GB/T 20319-2017风力发电机组验收规范
- 班作业公示记录单
- 托福阅读练习及详细解析ArtisansandIndustrialization
- FZ/T 93074-2011熔喷法非织造布生产联合机
评论
0/150
提交评论