视音频编码技术

上传人：灰*** IP属地：宁夏上传时间：2021-05-08 格式：PPT 页数：39 大小：1.44MB 积分：15 举报 版权申诉

已阅读5页，还剩34页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、视频编码技术视频编码技术 men aidong, multimedia telecommunication centre, bupt 运动图象的三要素运动图象的三要素帧分辨率（帧分辨率（dvd图象：图象： 704x576704x576像素像素/帧）帧）像素（颜色的位深，真彩像素（颜色的位深，真彩24位）位）三原色（红绿篮三原色（红绿篮rgb) 亮度亮度y、色度、色度cb,cr 帧率帧率(pal:25帧帧/秒秒;ntsc:30帧帧/秒秒) men aidong, multimedia telecommunication centre, bupt 像素的数字化：像素的数字化：色彩模型色彩模型

2、 rgb模型（红绿兰）模型（红绿兰）红：红：8bit 绿：绿：8bit 兰：兰：8bit rgb模型计算机上常用模型计算机上常用 ycrcb 模型（亮度加色差）模型（亮度加色差）亮度：亮度： 8bit 红色差：红色差： 2bit（色差压缩）（色差压缩）兰色差：兰色差： 2bit（色差压缩）（色差压缩） ycrcb 模型更适合图形压缩模型更适合图形压缩 men aidong, multimedia telecommunication centre, bupt 数字图象格式：数字图象格式：帧分辨率帧分辨率视频会议图像格式图像大小（像素 sub-qcif12896 qcif176 144 c

3、if352 288 4cif704 576 10cif(hdtv)1280 720 像素、帧率两要像素、帧率两要素在数字视频图像格式中素在数字视频图像格式中为隐含要素。为隐含要素。 men aidong, multimedia telecommunication centre, bupt 运动数字图象采集数码量运动数字图象采集数码量 1帧4cif(dvd)图象像素：704x57640万/帧 1像素（红绿蓝）： 3x8位编码=24bit码率 pal制dvd图象帧率： 25帧/秒每秒图象采集数码量： 40万/帧x 24bit x 25帧/秒=240000000bit/秒 dvd图象原始数码量

4、：240mbit/秒（ rgb模型） vcd图象原始数码量：60mbit/秒即使是即使是vcdvcd图象如不压缩编码也无法在图象如不压缩编码也无法在2m2m专线（专线（e1e1专线）上传输专线）上传输 men aidong, multimedia telecommunication centre, bupt 关键技术关键技术视频压缩（视频编码）视频压缩（视频编码）音频压缩（音频编码）音频压缩（音频编码）交换方式与控制方式交换方式与控制方式 men aidong, multimedia telecommunication centre, bupt 视频压缩（视频编码）视频压缩（视频编码）

5、图象固有的统计规律图象固有的统计规律空间的相关性（空间冗余）空间的相关性（空间冗余）时间的相关性（时间冗余）时间的相关性（时间冗余）视觉、心理视觉、心理录入和显示设备录入和显示设备 men aidong, multimedia telecommunication centre, bupt8 n 国际标准组织国际标准组织 itu （vceg）更悠久、更专注于传统的视频编码目标（例如，更悠久、更专注于传统的视频编码目标（例如，更好的压缩和包丢失更好的压缩和包丢失/误码恢复）误码恢复） iso/iec（mpeg）更大、更具有雄心勃勃的目标（例如，更大、更具有雄心勃勃的目标（例如，“面

6、面向对象视频编码向对象视频编码”、“自然分析合成混合编码自然分析合成混合编码”和数字电影）和数字电影）两者有时合作制定标准（例如，两者有时合作制定标准（例如，iso、iec and itu 协作制定了协作制定了 mpeg-2/h.261 和和 mpeg avc/h.264) n 活跃的产业联盟和协会活跃的产业联盟和协会 dvd、3gpp、3gpp2、 smpte、ietf, etc. 中国的中国的 avs n 游离于正式标准之外的厂商，事实上的工业标准：游离于正式标准之外的厂商，事实上的工业标准： microsoft real networks quicktime 视频编码标准：视频编码标

7、准：视频编码标准组织视频编码标准组织 men aidong, multimedia telecommunication centre, bupt9 h.264 / mpeg4 avc h.261 h.262 / mpeg2 h.263 h.263+ h.263 + itu-t standards joint itu-t ; 去块效去块效应滤波应滤波帧内帧内预测预测 4x4 整数整数 “idct” 当前帧当前帧原始图像 1. 变换变换&量化去除空间冗余量化去除空间冗余 2. 预测（运动补偿）去除时间冗余预测（运动补偿）去除时间冗余 3. 熵编码去除变换系数的冗余熵编码去除变换系数的冗余

8、men aidong, multimedia telecommunication centre, bupt11 n 运动补偿：去除时间冗余运动补偿：去除时间冗余例例: 序列图象序列图象视频编码技术：视频编码技术：运动补偿运动补偿 n动机：运动动机：运动/固定目标的大小是可变的固定目标的大小是可变的许多小块也可能需要花费许多比特来编码许多小块也可能需要花费许多比特来编码不同块大小和形状的运动补偿不同块大小和形状的运动补偿 1616 88 44 men aidong, multimedia telecommunication centre, bupt12 大小和形状可变块（大小和形状可变块

9、（7种）种） 8x8 0 4x8 01 01 23 4x48x4 1 0 8x8 types 0 16x16 01 8x16 mb types 8x8 01 23 16x8 1 0 n运动估计匹配块的尺寸不断缩小运动估计匹配块的尺寸不断缩小 h.261：1616 h.263：88 h.264：7 种可变块大小，最小种可变块大小，最小 44 avs：4 种可变块大小，最小种可变块大小，最小 88 节省了节省了15%以上的比特率以上的比特率 forema n 30fps qcif 运动补偿：运动补偿：发展趋势发展趋势 men aidong, multimedia telecommunication

10、 centre, bupt13 n运动估计参考帧的数量不断增加运动估计参考帧的数量不断增加 i 帧（帧内编码）、帧（帧内编码）、p 帧、帧、b 帧帧多参考帧预测：假设为多参考帧预测：假设为5个参考帧预测，相对于一个参考帧来说，个参考帧预测，相对于一个参考帧来说，可节省可节省 5% 到到 10% 比特率比特率。 h.264 p 帧、帧、b 帧前后最多帧前后最多 16 帧帧 avs p 帧前后帧前后 2 帧、帧、b 前后前后 1 帧帧运动补偿：运动补偿：发展趋势发展趋势 men aidong, multimedia telecommunication centre, bupt14 n 变换编

11、码：去除空间冗余。变换编码：去除空间冗余。变换后，在变换域中，低频系数的变换后，在变换域中，低频系数的能量远大于高频系数的能量，变换系数的相关性将大大去除。能量远大于高频系数的能量，变换系数的相关性将大大去除。视频编码技术：视频编码技术：变换编码变换编码 men aidong, multimedia telecommunication centre, bupt15 变换变换编码：编码：dct(离散余弦变换离散余弦变换) n dct 快速算法是中国人陈文雄快速算法是中国人陈文雄 (1977) 提出提出 n llm 快速快速 dct 算法算法 (loeffler, ligtenberg and

12、 moschytz，1989) 此算法需要此算法需要 11 次乘法和次乘法和 29 次加法次加法 men aidong, multimedia telecommunication centre, bupt16 变换变换编码：编码： dct 变换的尺寸变换的尺寸 2*2 4*4 8*8 16*16 32*32 64*64 子块子块尺寸尺寸位位/象素象素 2.52.5 2.02.0 1.51.5 1.01.0 n dct 编码效率和尺寸之间的关系是单调曲线，其拐点在编码效率和尺寸之间的关系是单调曲线，其拐点在 44、88、1616 区段区段 n 需要根据图像分辨率（需要根据图像分辨率（qcif

13、、cif、sdtv、hdtv或数或数字电影）选择字电影）选择 dct 变换块的大小。变换块的大小。 44 更适宜于小尺寸图像，相应的块效应主观感觉也会减弱更适宜于小尺寸图像，相应的块效应主观感觉也会减弱 4 44 4 更好的运动补偿，意味着更小的空间相关性更好的运动补偿，意味着更小的空间相关性 n h.264 有有 44、88 变换块变换块 n avs avs 有有 8 88 8 变换块变换块 men aidong, multimedia telecommunication centre, bupt17 变换变换编码：编码： dct 变换的复杂度变换的复杂度 n 传统的传统的 dct 变换变

14、换 dct 需要实数运算，反变换中引起了精度的损失。需要实数运算，反变换中引起了精度的损失。 n h.264、avs 等使用了非常简单的等使用了非常简单的44或或88 整数变换整数变换：对传统对传统 dct 非常精巧的逼近非常精巧的逼近变换矩阵只包含变换矩阵只包含 +/-1 和和 +/-2 计算只需要加法、减法和移位计算只需要加法、减法和移位 n 结果显示仅有可以忽略不计的质量损失结果显示仅有可以忽略不计的质量损失 (0.02db) 差值图像基于 4x4 整数变换：主类：自适应块大小变换(8x4, 4x8, 8x8) 对于 8x8 色度和 16x16 帧内亮度块dc 系数再次变换（re

15、peated transform） 1111 2112 1111 1221 h men aidong, multimedia telecommunication centre, bupt18 上下文上下文模型模型二进制化二进制化概率概率估计估计编码编码引擎引擎更新概率估计更新概率估计自适应二进制算术编码器自适应二进制算术编码器基于过去获得的条基于过去获得的条件选择一个模型件选择一个模型非二进制符号映射非二进制符号映射为二进制序列为二进制序列使用提供的模型进行编码并更新模型使用提供的模型进行编码并更新模型 n 获得好的性能，源于：获得好的性能，源于：通过上下文通过上下

16、文选择模型选择模型基于本地统计的基于本地统计的自适应估计自适应估计算术编码算术编码减少计算复杂度减少计算复杂度视频编码技术：视频编码技术：熵编码熵编码 n h.264 cabac 熵编码熵编码 men aidong, multimedia telecommunication centre, bupt19 视频编码技术：视频编码技术：帧内预测帧内预测 n 动机：动机：i 帧是自然图像，具有很强的空间相关帧是自然图像，具有很强的空间相关 h.261、mpeg2 没有帧内预测，只有帧间预测没有帧内预测，只有帧间预测 h.263+ 和和 mpeg4 中，中，在变换域中在变换域中根据相邻块对当前块

17、的某些根据相邻块对当前块的某些系数做预测系数做预测 h.264 在空域内，依据在空域内，依据与当前块相邻的象素，对当前块进行预测。与当前块相邻的象素，对当前块进行预测。宏块或块基于先前编码的块进行预测：宏块或块基于先前编码的块进行预测：先前编码的块位于当前块的上面和先前编码的块位于当前块的上面和/或左面的块或左面的块亮度块有两类帧内预测方式：亮度块有两类帧内预测方式： 9 种种 44 帧内预测模式帧内预测模式，用于纹理区域，用于纹理区域 4 种种 1616 帧内预测模式帧内预测模式，用于平滑区域，用于平滑区域色度样值只有色度样值只有 4 种种 88 帧内预测模式帧内预测模式，类似于亮

18、度样值的，类似于亮度样值的 1616 帧内预测模式帧内预测模式 avs 同样思想：同样思想： 5 种种 88 帧内预测模式帧内预测模式，用于纹理区域，用于纹理区域 4 种种 88 帧内预测模式帧内预测模式，用于平滑区域，用于平滑区域 men aidong, multimedia telecommunication centre, bupt20 n h.264 去块效应环路滤波器去块效应环路滤波器高压缩解码的帧间图像高压缩解码的帧间图像显著地减小预测残留图像显著地减小预测残留图像没有滤波没有滤波h.264/avc 去块效应滤波去块效应滤波视频编码技术：视频编码技术：去块效应环路滤波器去块

19、效应环路滤波器 men aidong, multimedia telecommunication centre, bupt21 视频编码技术：视频编码技术：主要视频编码标准的技术比较主要视频编码标准的技术比较 mpeg-2mpeg-4h.263h.264vc-1avs 变换变换8x8 dct变换8x8 dct变换8x8 dct变换4x4、8x8 整数变换整数变换 4x4、2x2 哈达码变换哈达码变换 4x4、8x4、4x8、 8x8 整数变换 8x8 整数变换整数变换量化量化传统方式传统方式传统方式乘法与移位实现乘法与移位实现传统方式乘法与移位实现乘法与移位实现帧内预测帧内预测变换后 dc

20、系数变换域帧内预测变换域帧内预测4x4、8x8亮度块：亮度块：9 种种 16x16亮度快：亮度快：4 种种色度块：色度块：4 种种变换域帧内预测8x8 亮度块：亮度块：5 种种色度块：色度块：4 种种运动补偿块大小运动补偿块大小16x16、16x816x16、16x8、8x816x16、8x816x16、16x8、8x16、 8x8、8x4、4x8、4x4 16x16、8x816x16、16x8、 8x16、8x8 运动矢量精度运动矢量精度象素象素象素象素象素象素象素象素内插滤波器内插滤波器1/2象素：2-tap1/2象素：8-tap 1/4象素：2-tap 1/2象素：

21、2-tap1/2象素：象素：6-tap 1/4象素：象素：2-tap 1/2象素：4/2-tap 1/4象素：4-tap 1/2象素：象素：4-tap 1/4象素：象素：4-tap 参考帧参考帧1个参考帧1个参考帧1个参考帧16 个参考帧个参考帧1 个参考帧2 个参考帧个参考帧 b 帧特征帧特征前向/后向前向/前向后向/后向 2 个运动矢量前向/后向前向/前向后向/后向 2 个运动矢量前向/后向前向/前向后向/后向 2 个运动矢量前向前向/后向后向前向前向/前向前向后向后向/后向后向 2 个运动矢量个运动矢量前向/后向 2个运动矢量前向前向/后向后向对称的对称的 1

22、个运动矢个运动矢量量去块效应滤波去块效应滤波无有有有有有有有熵编码熵编码vlcvlc vlc、算术编码vlc, cavlc, cabac多 vlc 码表自适应自适应 vlc 码表码表帧编码类型帧编码类型帧、场、paff帧、场、paff帧帧、场、帧、场、paff、 mbaff 帧、场、paff帧、场、帧、场、paff 类（类（profile）simple、main、high 等 19 个类baseline、main、 externed、high (frext) simple、main、 advanced 一个类一个类帧类型帧类型i、p、bi、p、bi、p、b、si、spi、p、b、s

23、i、spi、p、b、bii、p、b 取样格式取样格式4:2:0、4:2:24:2:04:2:04:2:0、4:2:2、4:4:4、灰度、灰度、rgb 4:2:04:2:0 men aidong, multimedia telecommunication centre, bupt22 n h.264 编解码器的实现意味着放宽通常的复杂度编解码器的实现意味着放宽通常的复杂度(存储和存储和计算计算)限制，相对于限制，相对于 mpeg2编解码器，粗略估计：编解码器，粗略估计：解码能力需要增加解码能力需要增加 4-5x 编码能力需要增加编码能力需要增加 10 x 折中：折中：最好的质量和最小的带宽

24、消耗，高度复杂计算使得最好的质量和最小的带宽消耗，高度复杂计算使得 asic 昂贵，实现复杂。昂贵，实现复杂。视频编码实现：视频编码实现：h.264 md：模式判决 tq：变换和量化 mc：运动补偿 me：运动估计 vlc：变字长码 men aidong, multimedia telecommunication centre, bupt23 copy ip 存储存储 dvr ip 视频电话、会议视频电话、会议 dtv h.264 istb vod h.264 视频应用环境视频应用环境 ip 视频流视频流 dtvmpeg2 over ip stb 3gpp vod sip / h.264 o

25、ver ip 转码转码视频监控视频监控 h.264 over lan / ip hfc 转码转码转码转码视频编码应用：视频编码应用：领域领域 men aidong, multimedia telecommunication centre, bupt24 小结小结 n 现代视频编码体系结构没有革命性的改变，现代视频编码体系结构没有革命性的改变，基于混合视频编码方案基于混合视频编码方案，但不断改进，但不断改进，越来越精巧和完善，使得压缩率和图像质量不断提高，越来越精巧和完善，使得压缩率和图像质量不断提高，复杂度也大大增加：复杂度也大大增加：新的关键技术特征新的关键技术特征：增强的运动

26、补偿增强的运动补偿小尺寸的整数变换小尺寸的整数变换增强的熵编码增强的熵编码 cavlc 和和 cabac 其它：增强的去块效应滤波器等其它：增强的去块效应滤波器等在相同质量下，在相同质量下，节省比特率节省比特率 50 以上，主观质量感觉比客观以上，主观质量感觉比客观 psnr 指指标更好。标更好。复杂度增加，编码器复杂度增加，编码器 3-10 x，解码器，解码器 2-5x n 最新发展的标准有最新发展的标准有 h.264/mpeg avc、smpte vc1/ms wmv9和和我国的我国的 avs。 n 研究方向是可伸缩的视频编码研究方向是可伸缩的视频编码（scalable vid

27、eo code，svc），不同的应用，不同的应用可以由一个共同的码流来实现，目前已经公布的视频编码标准都没可以由一个共同的码流来实现，目前已经公布的视频编码标准都没有这个功能。有这个功能。数字音频压缩技术数字音频压缩技术 digital audio compression men aidong, multimedia telecommunication centre, bupt26 引言数字音频的数据量引言数字音频的数据量 n 数字化是趋势数字化是趋势信息量非常大，高传输带宽或存储容量信息量非常大，高传输带宽或存储容量 5.1 声道环绕立体声：声道环绕立体声： 648khz18bits

28、.184mbit/s n 减少代表原始声音信号的信息量减少代表原始声音信号的信息量更好利用现有频率资源更好利用现有频率资源便于计算机处理和存储便于计算机处理和存储宽带网中高质量传输宽带网中高质量传输 men aidong, multimedia telecommunication centre, bupt27 n 波形编码波形编码将波形直接变换成数字码流。特点：比特率较高、解码后质量较高、延将波形直接变换成数字码流。特点：比特率较高、解码后质量较高、延时较小。可以分为：时较小。可以分为：时域波形编码，如时域波形编码，如pcm、adpcm、 m等；等；频域波形频域波形编码，如：子带编

29、码（编码，如：子带编码（sbc）、自适应变换编码（）、自适应变换编码（atc）等。等。 pcmpcm原理（原理（19371937年，法年，法alec reeresalec reeres）电子管电子管 pcmpcm（4646年，年，bellbell实验室）实验室）晶体管晶体管 pcmpcm（6262年，市话扩容，年，市话扩容，64kb/s64kb/s）单片单片ic pcmic pcm（7070年代，微波、卫星、光纤）年代，微波、卫星、光纤）增量编码原理（增量编码原理（19461946年，法年，法 de lorainede loraine）自适应增量自适应增量 cvsdcvsd（6060

30、年代末，军用，年代末，军用，3232、16kb/s16kb/s） cvsdcvsd（continuously variable slope delta modulatorcontinuously variable slope delta modulator）（连续变化斜率增量调制器）（连续变化斜率增量调制器）其他编码（其他编码（7070年代，年代，adpcmadpcm、subbandsubband、atcatc、apcapc等）等）在在16kb/s16kb/s以上得到较好的话音质量。以上得到较好的话音质量。特点：话音质量好，但编码速率高。特点：话音质量好，但编码速率高。音频编码历史：

31、数字语音（音频编码历史：数字语音（1 1） men aidong, multimedia telecommunication centre, bupt28 n参数编码参数编码从信源信号的某个域中提取特征参数从信源信号的某个域中提取特征参数，并变换成数字码流。如：各种，并变换成数字码流。如：各种声码器。声码器。波形编码通道声码器（波形编码通道声码器（3939年，年，dudlydudly，二次大战保密电话），二次大战保密电话） lpclpc声码器（声码器（6767年，年，atalatal、schroederschroeder）同态声码器（同态声码器（6969年，年，oppenheimopp

32、enheim）共振峰声码器（共振峰声码器（7171年，年，rabinerrabiner、schaferschafer、elanaganelanagan） mbembe声码器（声码器（8888年，年，griffingriffin、limlim）波形插值（波形插值（9191年，年，w.b. kleijnw.b. kleijn） 2.4kb/s2.4kb/s、1.2kb/s1.2kb/s、较好；、较好；600-800b/s600-800b/s可懂。可懂。特点：编码速率低，自然度差特点：编码速率低，自然度差、解码后质量较低、延时解码后质量较低、延时较大较大。音频编码历史：数字语音（音频编码历

33、史：数字语音（2 2） men aidong, multimedia telecommunication centre, bupt29 n 混合编码器混合编码器将以上二种方法混合，将以上二种方法混合，利用线性预测、利用线性预测、vqvq、a-b-sa-b-s、感觉加权、后、感觉加权、后滤波等技术。滤波等技术。如：如：g723.1，g728，g729，gsm的语音编码，的语音编码，is-95的的语音编码等。语音编码等。多脉冲激励线性预测（多脉冲激励线性预测（mpelp 1982 atalmpelp 1982 atal、remderemde）规则脉冲激励线性预测（规则脉冲激励线性预测（r

34、pelp 1985 deprettererpelp 1985 deprettere、kroonkroon）码本激励线性预测（码本激励线性预测（celp 1985 manfredcelp 1985 manfred、schroederschroeder、atalatal） 8-16kb/s8-16kb/s，高质量。特点：话音质量高、编码速率低，高质量。特点：话音质量高、编码速率低，但算法复杂。但算法复杂。音频编码历史：数字语音（音频编码历史：数字语音（3 3） men aidong, multimedia telecommunication centre, bupt30 n 主要应用于娱乐与

35、鉴赏，对于重建信号的音质有很高的要主要应用于娱乐与鉴赏，对于重建信号的音质有很高的要求，目前采用比特率较高的波形编码技术进行压缩。求，目前采用比特率较高的波形编码技术进行压缩。可以可以直接在时域进行，也可以转到频域或其他变换域进行。直接在时域进行，也可以转到频域或其他变换域进行。 n 1982年激光唱盘年激光唱盘 (cd: compact disk)上市。上市。md：mini- disk，日本索尼公司采用，日本索尼公司采用atracadaptive transform acoustic coder压缩技术。压缩技术。 n 1987数字音频磁带录音数字音频磁带录音 (dat: digital

36、 audio tape) 问世。问世。 n dab (digital audio broadcasting) 源于欧洲。源于欧洲。 n ac3 来自来自 dolby 公司公司 n . 音频编码历史：宽带音频音频编码历史：宽带音频 men aidong, multimedia telecommunication centre, bupt31 音频编码性能评价（音频编码性能评价（1 1） n 编码速率编码速率（kbps、kb/s）信号带宽信号带宽：可懂度、自然度、透明度。：可懂度、自然度、透明度。 2003400hz、507000hz、2015000hz、1020000hz。采样速率采样速率：

37、8khz、16khz、32khz、44.1/48khz。样值比特数样值比特数（b/样点），样点），总速率总速率 r（kb/s）。）。固定码率及可变码率固定码率及可变码率。 n 重建语音质量重建语音质量客观评价客观评价：信噪比信噪比分段信噪比分段信噪比（一般（一般15db以上较好，以上较好，20db以上相当好）以上相当好） men aidong, multimedia telecommunication centre, bupt32 音频编码性能评价（音频编码性能评价（2 2）编解码延时（编解码延时（ms）公众网（公众网（25ms）、点对点、广播、存储）、点对点、广播、存储回声

38、控制或回声抵消回声控制或回声抵消正常通话秩序正常通话秩序与重建质量关系与重建质量关系算法复杂度算法复杂度硬件、成本硬件、成本浮点、定点浮点、定点 mips、ram、rom 其他其他抗随机误码和突发误码能力抗随机误码和突发误码能力抗丢包和丢帧能力抗丢包和丢帧能力对不同信号编码能力对不同信号编码能力级联或转接能力级联或转接能力 men aidong, multimedia telecommunication centre, bupt 语音压缩（音频编码）语音压缩（音频编码） itu-t g.711(1988)g.711(1988) 语音语音pcmpcm编码标准，编码标准，64kb

39、it/s64kbit/s g.722(1988)g.722(1988) 7 k h z7 k h z 音频编码标准，音频编码标准， 64kbit/s64kbit/s g.728(1992)g.728(1992) ld-celpld-celp语音编码标准，语音编码标准， 16kbit/s16kbit/s g.723.1g.723.1 低速率语音编码建议，具有低速率语音编码建议，具有两种速率两种速率 6 . 3 k b i t / s6 . 3 k b i t / s 和和 5.3kbit/s5.3kbit/s。 mpegmpeg mp3mp3：mpeg1 a

40、udio layer-3mpeg1 audio layer-3的的简称从简称从mpeg-1mpeg-1标准衍生的、开标准衍生的、开放的编码方案放的编码方案50k-100kbit/s50k-100kbit/s accacc mpeg2mpeg2音频压缩音频压缩 mp4mp4 men aidong, multimedia telecommunication centre, bupt34 声音压缩编码理论基础声音压缩编码理论基础 n 冗余（冗余（redundance) 信号一部分可由另一部分重建或另外表达形式简单说明，称为信号有冗信号一部分可由另一部分重建或另外表达形式简单说明，称为信号有冗余

41、余去除冗余实现压缩编码去除冗余实现压缩编码信号冗余是变化的，故不能产生恒定码流输出信号冗余是变化的，故不能产生恒定码流输出 n 不相关不相关（irrelevance) 听觉不能感觉的那部分信号，它对声音信号的确定或音色和发音位置没听觉不能感觉的那部分信号，它对声音信号的确定或音色和发音位置没有贡献有贡献不相关信号部分不传输不相关信号部分不传输利用掩蔽效应来掩盖量化失真利用掩蔽效应来掩盖量化失真 n 人耳听觉特性人耳听觉特性人耳分辨能力人耳分辨能力人耳对不同频段声音的敏感程度不同，通常对低频比对高频更敏感人耳对不同频段声音的敏感程度不同，通常对低频比对高频更敏感人耳对语音信号的相位不敏感人耳对语音信号的相位不敏感人耳掩蔽效应人耳掩蔽效应 masking effect masking effect men aidong, multimedia telecommunication centre, bupt35 现有标准：语音编码标准现有标准：语音编码标准 (1)(1) men aidong, multimed

人人文库> 全部分类> 生活休闲 > 科普知识

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

视音频编码技术

文档简介

温馨提示

最新文档

评论

视音频编码技术

文档简介

温馨提示

最新文档

评论

相关文档