电视中心视音频信号编码标准及解读培训课件_第1页
电视中心视音频信号编码标准及解读培训课件_第2页
电视中心视音频信号编码标准及解读培训课件_第3页
电视中心视音频信号编码标准及解读培训课件_第4页
电视中心视音频信号编码标准及解读培训课件_第5页
已阅读5页,还剩97页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

电视中心视音频信号编码标准及解读广东电视台网络技术部梁志强电子邮箱139电视中心视音频信号编码标准及解读电视中心技术模拟电视信号标清数字电视信号高清电视信号压缩电视信号素材交换格式编码标准及解读2电视中心技术3电视技术中心电视信号传输有线播送地面播送卫星播送分发平台家庭用户电视中心技术从上图我们看到:4电视技术中心电视传输系统家庭用户这一过程,是场景复原给观众。从现场的光信号转为电视信号,在接收端,将电信号复原为屏幕上的光信号。模拟电视信号黑白电视信号象素扫描同步黑白全电视信号的组成彩色电视信号三基色原理彩色电视信号的产生图像的生成图像的色域同步信号模拟播送制式的特点模拟复合系统的要点模拟电视信号现有的各种数字电视信号是由模拟彩色电视信号取样、编码、压缩而来的。模拟彩色电视信号的各种特性、要求,也一一反映在数字电视信号里。电视信号最早是模拟的黑白电视信号:黑白电视信号实际上是图像的亮度信号,其带宽为6。把模拟信号的特征、结构组成,标准等等搞清楚,对以后的数字信号,压缩信号也就容易搞清楚。黑白电视信号图像信号的产生:象素〔一帧电视画面是由很多个像素点组成的〕面对着场景,摄像机的摄像管把光景象转成电子信号。摄像管上有感光点,被光照到后会产生电能,依照光的照度不同,会产生不同的电能。经过电子束扫描将一幅图象的亮度分布进行象素分解,转变成按逐行逐场时间顺序排列的电信号。所谓象素,就是摄像管上的感光点,构成图像最小面积单元,具有一定的亮度和色度属性。黑白图像:象素是亮度不同的小点。

7黑白电视信号图像信号的产生:象素彩色图像:象素是亮度信号和色度信号组成。黑白图像信号是由摄像管将明暗程度不同的景物,经电子扫描和光电转换而得到的信号,也称亮度信号。摄象管某时刻输出的电流信号正比于该时刻电子束所扫描象素的亮度大小。从演示的图像和波形我们得知:信号幅度正比于亮度。扫描〔行、场扫描〕各像素的信息不是同时传送,而是按时间顺序经过惟一的一条传输通道先后传输的,通常是沿着行的方向由左至右连续扫描每个像素;〔行扫描〕8黑白电视信号图像信号的产生:扫描〔行、场扫描〕每帧画面有625行,每帧画面分两场垂直扫描,即分为奇数场和偶数场;〔场〕同步〔行、场同步信号〕为了使收、发两端扫描完全同步,发送端要给接收端提供同步脉冲信号。分别有行同步脉冲和场同步脉冲。行同步脉冲:指令电子束开始扫描行逆程的时间。场同步脉冲:指令电子束开始扫描场逆程的时间。9黑白电视信号图像信号的产生:消隐信号〔行、场消隐信号〕在行、场回扫时,用行、场消隐脉冲,将视频信号限位在黑电平,以防止扫描线干扰正常图像。黑白全电视信号由图象信号、复合同步信号和复合消隐信号组合

而成。为了使三者互不干扰,并且在接收端能够方便可靠地进行别离,黑白全电视信号按以下方式组成:10黑白电视信号11一行黑白图像波形从中可见,图象信号、行消隐信号、行同步信号三者在时间与幅度上的差异;黑色电平提升量D等于消隐电平与白色电平差值〔70%〕的0~5%黑白电视信号在一行的黑白全信号中,图象信号位于白色和黑色电平之间,复合消隐信号的电平规定比黑色电平稍黑。消隐电平和图象黑色电平之差称为黑色电平提升。黑色电平提升量D等于图象白色电平与消隐电平差值的0~5%。12黑白电视信号13全电视信号黑白电视信号黑白全电视信号的组成:图象信号安排在行、场扫描的正程,复合消隐和复合同步信号安排在行、场扫描的逆程。14图像信号复合消隐信号复合同步信号行消隐场消隐行同步场同步正程扫描逆程扫描彩色电视信号的产生三基色原理:自然界几乎所有的颜色都可以用红、绿、蓝三种互为独立的基色按一定的比例混合得到;三基色原理是对颜色进行分解与合成的重要原理,它为彩色电视技术奠定了理论基础,简化了电视信号传送处理,有了三基色原理,只需要将要传送的颜色分解为三基色〔红、绿、蓝〕,再分别以对应的一种电信号进行传送处理即可。混合色的亮度等于各基色亮度之和。在播送电视中,为了使黑白电视能与彩色电视兼容,不是传送三基色信号,而是传送将它们经过线性变换而成的一个亮度信号Y和两个色差信号和。15彩色电视信号的产生〔图像的拍摄〕分光系统红绿蓝R放大、处理G放大、处理B放大、处理编码G放大、处理调制RBGYUV摄像机拍摄图像的过程〔或摄像管〕分别将红、绿、蓝三基色光变换成三基色图像信号,编码器将红、绿、蓝三基色信号编成一个亮度信号和两个色差信号,并把它们按某一电视制式标准有机地组合成一个彩色全电视信号输出。摄像机中的编码器和电视接收机的解码器对信号的处理过程正好相反。制式编码器输出的彩色全电视信号中还包含一个色同步信号,该信号除了携带色副载波频率和相位基准信息外,还说明了倒相行和不倒相行的信息。16模拟编码彩色电视信号的产生〔图像的拍摄〕将R、G、B三基色电信号通矩阵电路,变换成亮度信号Y和色差信号〔〕和〔〕,经过编码和相应压缩,最后成为信号。颜色空间:Y=0.299R+0.5587G+0.114BU=-0.147R-0.289G+0.436B=0.492〔B-Y〕V=0.615R-0.515G-0.100B=0.877〔R-Y〕R=Y+1.140VG=Y-0.395U-0.581VB=Y+2.032U彩色电视信号的产生前面简要表达了彩色电视信号的产生,有:R、G、B模拟分量彩色电视信号;Y、U、V模拟分量彩色电视信号〔经R、G、B模拟分量信号编码而成;模拟复色电视信号〔经Y、U、V模拟分量彩色电视信号调制而成〕。在此强调:上述是有效图像信号。不是全电视信号。18上述简要介绍了彩色电视信号的产生,下面简述图像的生成:一帧电视画面是由很多个像素点组成的;〔像素〕各像素的信息不是同时传送,而是按时间顺序经过惟一的一条传输通道先后传输的,通常是沿着行的方向由左至右连续扫描每个像素;〔行〕每帧画面有625行,每帧画面分两场垂直扫描,即分为奇数场和偶数场;〔场〕在信号的发出端和接收端,必须要统一在同一时间开始每场信号和每行信号的扫描,才可以统一收到正确的画面。〔场、行同步和消隐信号〕19图像信号的分布:场消隐信号行消隐信号有效图像信号这是一帧图像信号,一帧图像信号有两场,分为奇数场和偶数场。20图像的色域彩色图像特性的三要素是:亮度、色调和色饱和度。亮度〔与黑白一样〕是指光的明暗程度,即光线的强弱,与光功率有关。色调是指光的颜色类别,与光的波长有关,彩色光的色调取决于其光谱成份。如我们通常说的红色、绿色、蓝色指的就是色调。色饱和度是指光的深浅程度〔如浅红、浅绿〕,与掺入白光的多少有关。掺入的白光越多,光越浅,色饱和度越低。如:白光色饱和度是0%〔全是白光〕,纯色光色饱和度:100%〔未掺入白光〕。一般色调与色饱和度合称为色度。色度即说明彩色光颜色的类别,又说明颜色的深浅程度。在彩色电视系统中,传输彩色图像,实质上是传输图像像素的亮度和色度。21图像的色域色域:,就是指某种设备所能表达的颜色数量所构成的范围区域在现实世界中。自然界中可见光谱的颜色组成了最大的色域空间,该色域空间中包含了人眼所能见到的所有颜色。电视中心中,国际上通行的色彩衡量标准是〔国家电视标准会〕规定的色域范围。所谓色域,就是能够表现的电视色彩范围。色域的范围仍然是一种局限性比较大的标准,其空间相对较小,因此也受到了其他色域标准的竞争压力。22图像的色域23电视色域比较同步信号:隔行扫描与帧、场、行在模拟彩色电视播送制式电视信号中,一般采用的隔行扫描,即先按顺序隔行扫描第一场整幅画面〔称为奇数场〕后,再按顺序扫描第二场整幅画面,从而完成一幅完整画面的摄像或显示。在电视技术中,1幅完整画面称为1帧;而从第一场有效行构成的画面称为奇数场;第二场有效行构成的画面称为偶数场。我国采用每秒25帧〔即每秒50场〕、每帧625行的所谓“625/50扫描标准〞。为了防止处理每场中半个数字行,第一场的场消隐期是有效行的前24行,第二场的场消隐期是有效行的前25行,所以每帧的有效行数是576行。

24同步信号:顺序传送与扫描同步:①顺序传送。先按第1、3、5、7……行,每行从左到右的顺序传送奇数场的图像信息;再按第2、4、6……行,每行从左到右的顺序传输偶数场的图像信息,最后完成1帧电视图像的信息传输。电视图像信息的这种传送方式称为“顺序传送〞。②扫描同步。图像的传输过程实践就是图像的分解和复合过程,分解和复合的过程必须保持步调一致,否则无法重现图像。由于图像的分解和复合是靠电子束扫描而成,要使电子束扫描保持完全一致,这过程叫同步。25同步信号:顺序传送与扫描同步:③扫描逆程消隐。电子束扫描完每行或每场的“掉头〞称谓扫描逆程。显然,在行或场逆程期间,我们不希望电子束在发送端和接收端显示出来。为此,我们需要每行和每场的逆程期间设置不让电子束扫描荧光屏的消隐信号〔是1个电平比黑电平还“黑〞的脉冲信号〕,因此,行〔场〕逆程期也称消隐期。而且,上述的行〔场〕同步信号,就插在这个行〔场〕消隐脉冲上。26同步信号:行同步为了使接收端的行扫描与发送端同步,而向接收机发出一个行同步信号,所以行同步脉冲的前沿决定了接收机扫描正程的结束和逆程的开始。为了确保行同步脉冲前沿的准确性,一般要求行消隐脉冲前沿超前行同步脉冲前沿1.3的时间。场同步场同步信号在场消隐信号之后出现,比场消隐信号的幅度要高。场同步的幅度与行同步信号相同,但宽度不同。根据我国的电视标准,规定场同步的重复频率就是场扫描频率,即50,其宽度为2.5H,即宽度为2.5×64160,其前沿比场消隐信号前沿滞后2.5H。27同步信号:行同步信号28模拟彩色电视播送制式标准的特点〔模拟复合信号〕:彩色全电视信号特性:彩色全电视信号由亮度信号、色度信号、色同步信号组成。其中色度信号包含〔R—Y〕和〔B—Y〕两个分量。两个色度分量由两个加权的色差信号以抑制副载波的振幅调制方式,分别调制在相位相差90度的两个同频率副载波上。两个分量之一的副载波相位是逐行倒转180度。色差信号在合成时,由于用同一的副载波频率同时传送R—Y和B—Y两个色差信号,采用了正交平衡调制的方法,使副载波信号的幅度反映色饱和度〔彩色的浓淡〕,而副载波的相位反映色调。然后,色度信号C再叠加在亮度信号Y上而形成彩色全电视信号。29模拟彩色电视播送制式标准的特点〔模拟复合信号〕:上面简单叙说了彩色全电视信号的基本特性,我们可以记作:扫描方式:隔行扫描;信号组成:亮度信号、色度信号、〔经过编码、调制〕。同步信号等等;亮度与色度的关系:逐行倒相正交平衡调幅制C信号由、两个分量组成。30标清数字电视信号信号的产生取样、量化、编码数字样点与消隐信号的关系辅助数据区嵌入音频数字信号的传输31信号的产生电视信号的组成:图象信号安排在行、场扫描的正程,复合消隐和复合同步信号安排在行、场扫描的逆程。32图像信号复合消隐信号复合同步信号行消隐场消隐行同步场同步正程扫描逆程扫描信号的产生标清电视信号是数字信号,数字信号特点是“1〞、“0〞两个值的信号信号失真不累加它便于和计算机共同使用使设备多功能化、自动化便于实现数字压缩、编码,显出数字化优越性使系统多功能化,一机多用、三网合一33信号的产生:34信号的产生:数字视频信号〔全带宽数字视频信号〕是把模拟分量信号在时间上抽样〔取样〕,在幅度上分层〔量化〕,然后进行分量编码。全带宽数字视频信号在对视频信号编码时,亮度信号和两组色差信号的取样率以4:2:2的比值相联系。分别在Y、R—Y、B—Y上各自取样和量化。取样率亮度信号Y为13.5,然后又把色度分量信号R—Y和B—Y为6.75,量化比特率为10位。经取样、量化后模拟信号就变成了在时间和幅度上均离散的有限种的幅值,每一种幅值指定一个代码,这种用代码来代表取样信号量化值的过程就称为编码。全带宽数字视频信号的串行输出码流为270。这种数字格式的视频信号,又叫信号。35取样、量化和编码:601取样 0 1 2 3 0 1 2 3 0 1 2 3 0 1 2 3 nn+263n+1n+2644:2:2取样.601〔601〕“4〞=13.5“2〞=6.75YYYY场消隐有效视频720有效行样点x576行36取样、量化和编码:〔625/50扫描的4:2:2参数〕每行总的样点数Y:864:432:432总样点数:1728每个有效行样点数Y:720:360:360总样点数:1440抽样结构正交行、场、帧内,每行的、样点位置与Y的奇数样点位置一致抽样频率Y:86413.5和:4326.7537取样、量化和编码:〔13.5亮度取样,10字〕-51.1000766.33700.030.00406401023d94031020300360_4~63003~039877_64~940040~3720有效行样点877量化电平消隐在64,峰值在94038取样、量化和编码:〔6.75色差信号取样〕

-350.0040-400.00000.0200+350.03C0+399.236405121023d960310200033360有效行样点897有效数据字信号零位在51239数字样点与消隐信号的关系:〔数字样点与行同步的关系〕数字有效行开始数字有效行结束::,

3000000表示行的起始/结束〔H〕,

场消隐〔V〕,场〔F〕1724 31725 0001726 0001727 0 1 Y2 3 Y4 40数字样点与消隐信号的关系:〔625/50标准的复用数据的字数分布〕41数字样点与消隐信号的关系〔有效样点与消隐信号的关系〕42数字样点与消隐信号的关系

〔亮度和色差信号的时分复用,由并行信号变成串行信号〕CbYCrYCbYCrYCbYCrYCbYCrYA/DA/DA/DY6.7513.54:2:210

10并行采样27并行到串行变换器270.601-2

串行数字分量

27043辅助数据:辅助数据在认识数字信号时,我们可以把数字信号看成一条数据串,由有效数据和辅助数据组成。辅助数据的概念:模拟视频中的行消隐期,在全带宽数字视频中称作行辅助数据区。如上所述在和之间可放置288个辅助数据字。标准是:第一,每一行辅助数据区可放置8个2通道数据,但必须紧接在后面不能有一个码字的空隙。第二,称作误码检测信号的码〔165标准定义〕被放置在行辅助数据区的第5或315行〔625/50系统〕,但必须紧邻在前,同样不能有一个码字的空隙。行辅助数据区的余下局部留着以后使用,目前还未作标准。行辅助数据区由定义为“〞〔〕。44辅助数据:模拟视频中的场消隐期,在全带宽数字视频中称作场或帧辅助数据区,由定义为“〞〔〕。也有些特殊规定,以625/50为例,第5行留作给165标准的码,第6行留作给168标准规定的场或帧切换,〔标准来说,则是第7行〕。第10行留作放置〔〕码。45辅助数据:在行消隐期间〔到〕及场消隐期间〔24行〕插入辅助数据。46辅助数据〔1〕数据头1复合,33分量,00033〔1〕〔1〕数据的类型〔1〕

267〔63〕〔提供序列号/接收机可判断是否丧失数据〕〔指示包中的数据总和〕检测数据包中的出错47嵌入式数字音频数字音频的产生,是在模拟音频的基础上进行取样和量化而成的,取样频率为48;音频字的分辨率为20比特;要求音频数据与视频数据同步;可以嵌入四路伴音。这是259M定义最低实施标准的A级标准。音频数据包是从信息数据形成的。48嵌入式数字音频:〔音频数据包的形成〕49嵌入式数字音频:〔音频数据的插入〕音频数据包按时分复用的方式作为辅助数据插入串行数字视频信号的行消隐区中。50信号的简要小结:4:2:2取样,10比特量化;〔取样、量化、编码在有效图像区域〕时分复用,变成串行数据流,270;辅助数据区〔在行、场消隐期〕嵌入数字音频。51高清电视信号高、标清信号的异同高、标清电视节目制播系统的压缩电视信号标清环境下高清节目的制作和播出52高、标清信号的异同标清信号的回忆在625/50扫描标准中,标清信号的宽高比为4:3,采样格式4:2:2,亮度信号的抽样频率为13.5M,两个色差信号的抽样频率为6.75M,采用10量化,有1024级量化电平,数据传输率为270〔兆比特/秒〕。每帧总行数是625行,为了防止处理每场中半个数字行,第一场的场消隐期是有效行的前24行,第二场的场消隐期是有效行的前25行,所以每帧的有效行数是576行,定时信息规定在有效视频结束〔〕和有效视频开始〔〕期间是数字行消隐时间,音频信号和辅助数据是在场消隐内的行消隐期间传送。53高、标清信号的异同标清信号的像素标清信号在625/50扫描格式中,每帧的总行数是625,去除49行场消隐,每帧有效行是576行,在理想的情况下,即图像在垂直分辨率为576像素点。根据“601建议〞每行的有效样点都是720个像素点,所以在625/50系统中标清信号的有效图像像大小为720×576。54高、标清信号的异同高清信号我国高清电视标准,图像宽高比为16:9,采用1125/50扫描格式,4:2:2编码方式,亮度信号的抽样频率为74.25,两个色差信号的抽样频率为37.125,帧频可分为24的1:1逐行扫描格式和25的2:1隔行扫描格式。数据传输比特率为1.485。每帧的总行数是1125行,第一场的场消隐期是有效行的第1124行至第20行共22行,第二场的场消隐期是有效行的第561行至583行共23行,侧每帧有效行是1080行,定时信息规定在有效视频结束〔〕和有效视频开始〔〕期间是数字行消隐时间,音频信号和辅助数据是在场消隐内的行消隐期间传送。55高、标清信号的异同高清信号的清晰度在1125/50扫描格式中,每帧的总行数是1125行,去除45行场消隐行,每帧有效行是1080行,在理想的情况下,即图像的垂直分辨率为1080像素,则每帧有效水平分辨率是:16/9×1080=1920像素,所以在1125/50系统中高清信号的有效图像大小为1920×1080。56高、标清信号的异同高清和标清信号的定时关系比较

高清和标清的定时关系625/501125/50/2:1起始行:第一场第二场1行3311行564行有效视频第一行:第一场第二场23行33621行584行有效视频最后一行:第一场第二场310623行560行1123行行消隐期:第一场第二场24行25行22行23行57高、标清信号的异同高清和标清信号不同格式的比较格式625/501125/50/2:1总行数625行1125行场频5050帧频2525宽高比4:316:9隔行比2:12:1亮度信号带宽630色差信号带宽1.515行频1562528125抽样频率Y13.56.7574.2537.125Y每行样点864点2640点每行样点432点1320点Y每行有效样点720点1920点每帧有效样点360960Y每帧有效行576行1080行每帧有效行288行576行像素纵横比3:415:16数据传输速率2701.48558高标清电视节目制播系统的压缩电视信号目前在电视中心,压缩的数字电视信号主要有:信号2信号4信号264信号格式信号〔消费〕有关音频编码素材交换格式5960信号:是“国际标准化组织〔〕〞制定的标准。还有2、4等。是早期的图像压缩方式。即静止图像压缩,的算法是基于〔离散余弦变换〕和可变长编码,把运动的视频序列作为连续的静止图像来处理,用这种压缩方式单独完整地压缩每一帧,在编辑过程中可随机存储每一帧,可进行帧精确编辑和多层图像处理,只对帧内的空间冗余进行压缩,不对帧间的时间冗余进行压缩。612信号:2图像压缩的是利用图像中的空间相关性和时间相关性两种特性,最大限度地去除图像中存在大量的冗余信息。2的编码流分为六个层次:图像序列层、图像组〔〕、图像、宏块条、宏块、块。编码率从每秒3兆比特~100兆比特,2的编码图像分为三类,分别称为I帧,P帧和B帧。I帧图像采用帧内编码方式,只利用了单帧图像内的空间相关性,而没有利用时间相关性。P帧和B帧图像采用帧间编码方式,同时利用了空间和时间上的相关性。P帧图像只采用前向时间预测,提高压缩效率和图像质量。P帧图像中可以包含帧内编码的局部,即P帧中的每一个宏块可以是前向预测,也可以是帧内编码。B帧图像采用双向时间预测,可以大大提高压缩倍数。2信号:系统的概念〔1〕〔原始流〕,对视频、音频信号及其他数据进行编码压缩后的数据流称为原始流。原始流包括访问单元,比方视频原始流的访问单元就是一副图像的编码数据。〔2〕〔分组的原始流〕,原始流形成的分组称为分组,是用来传递原始流的一种数据结构〔3〕节目是节目元素的集合。节目元素可能是原始流,这些原始流有共同的时间基点,用来做同步显示。622信号:〔4〕传输流和节目流翻译为“传输流〞翻译为“节目流〞用来传输和保存一道节目的编码数据或其他数据。的组成单位是分组。用来传输和保存多道节目的编码数据或其他数据,的组成单位是节目。和是可以互相转换的,比方从中抽取一道节目的内容并产生有效的是可能。〔5〕传输流分组和分组原始流分成很多分组,保持串行顺序,一个分组只包含一个原始流的编码数据。632信号:2标准的系统局部规定了三项任务:将视频和音频以及数据的基本码流组成一个单一的适合数字存储和传输的码流规定向解码器提供视音频同步的机理,将时间的信息加到码流中去。保证解码缓存器在同步重放时不会上溢也不会下溢。系统传输层的组成:642信号:传输码流〔〕和节目码流〔〕的结构65双层复用系统结构2信号:2具有以下几个突出特点:支持的图像分辨率最高,包括符合.601〔601〕格式的标准分辨率的数字电视和更高分辨率的。支持包括高速体育运动在内的各种活动。应用最为广泛,既包括存储媒体中的,播送电视中的数字播送电视和,还可应用于交互式的视频点播〔〕和准视频点播〔〕。还能够适配等宽带通信网。66674信号:4的编码是采用基于对象的编码理念,即在编码时将一幅景物分成假设干在时间和空间上相互联系的视频音频对象,分别编码后,再经过复用传输到接收端,然后再对不同的对象分别解码,从而组合成所需要的视频和音频。264信号在电信行业及传输使用比较多。是“国际电联〔〕〞,制定的标准。还有H.261、H.263、H.263+等标准。H.264还是由上面两个组织联合组建的联合视频组〔〕共同制定的新数字视频编码标准,所以它既是的H.264,又是的4高级视频编码〔,〕,而且它将成为4标准的第10局部。因此,不管是4、410,还是14496-10,都是指H.264。H.264最大的优势是具有很高的数据压缩比率,在同等图像质量的条件下,H.264的压缩比是2的2倍以上,是4的1.5~2倍。68编码〔,音视频编码标准〕是我国具备自主知识产权的第二代信源编码标准,包括系统、视频、音频、数字版权管理等四个主要技术标准和符合性测试等支撑标准。特点:性能高、成本低、复杂度低、专利授权模式简单。主要服务于高分辨率数字播送、高密度激光数字存储媒体、无线宽带多媒体通讯、互联网宽带流媒体等重大信息产业应用。压缩编码方式:帧内预测,帧间预测,运动补偿:变换与量化,熵编码,环路滤波。69编码70编码与H.264的比较71信号:是一种数字记录格式,视频亮度取样频率为13.5,和的取样频率是3.375。有三种格式和,他们都使用同一种压缩方式25可兼容,反之不行。25数据速率是25,,5:1的压缩比,相当于3:1的图像质量。50数据速率是50,3:1的压缩比,相当于的图像质量。有关音频编码〔压缩编码的原理〕我们需要通过抽样、量化、编码三个步骤将连续变化的模拟信号转换为数字信号。抽样就是在时间上将模拟信号离散化。量化是用有限个幅度值近似原来连续变化的幅度值,把模拟信号的连续幅度变为有限数量的有一定间隔的离散值。编码就是按一定的规律把量化后的值用二进制数字表示,然后转换成二值或多值得数字信号流。通常我们采用编码,其主要过程是将话音、图像等模拟信号每隔一段时间进行取样,使其离散化,同时将抽样值按分层单位四舍五入取整量化,并将抽样值按一组二进制码来表示抽样脉冲的幅值。72有关音频编码〔压缩编码的技术分类〕数字音频信息压缩主要是依据音频信息自身的相关性以及人耳对音频信息的听觉冗余度。音频信息在编码技术中通常分成两类来处理,分别是语音和音乐,各自采用的技术也存在着差异。语音编码技术将模拟语音信号转变为数字信号在信道中传输。语音编码的目的是在保持一定算法复杂程度和通信时延的前提下,占用尽可能少的通信容量,传送尽可能高质量的语音。它可分为波形编码、参量编码和混合编码三大类。波形编码:波形编码是在时域上进行处理,主要是为了使重组的语音波形保持原始语音信号的形状,它将语音信号作为一般的波形信号来处理。73有关音频编码〔压缩编码的技术分类〕参量编码〔声源编码〕:利用语音信息产生的数学模型,提取语音信号的特征参量,并按照模型参数重构音频信号。混合编码:将波形编码和参量编码组合起来,结合各自的长处,保持波形编码的高质量和参量编码的低速率,在4-16速率上能够得到高质量的合成语音,适合于数字移动通信的语音编码技术。音乐编码技术自适应变换编码〔频域编码〕:利用正交变化,把时域音频信号变换到另外一个域,通常采用自适应比特分配和自适应量化技术来对频域数据进行量化。742信号声音信号〔数据〕之所以能进行压缩,是因为该信号本身存在着很大的冗余度。2对音频信号的压缩,其主要分别从时域和频域来考虑;也同时考虑了人的听觉机理。时域冗余频域冗余听觉冗余752信号时域冗余的表现形式1、幅度分布的非均匀性信号的量化比特分布是针对信号的整个动态范围而设定的,对于小幅度信号而言,大量的比特数据位被闲置。2、样值间的相关性。声音信号是一个连续表达过程,通过采样之后,相邻的信号具有极强的相似性,信号差值与信号本身相比,数据量要小的多。3、信号周期的相关性。声音信息在整个可闻域的范围内,每个瞬间只有局部频率成分在起作用,即特征频率,这些特征频率会以一定的周期反复出现,周期之间具有相关关系。4、长时自我相关性。声音信息序列的样值、周期相关性,在一个相对较长的时间间隔也会是相对稳定的,这种稳定关系具有很高的相关系数。5、静音。声音信息中的停顿间歇,无论是采样还是量化都会形成冗余,找出停顿间歇并将其样值数据去除,可以减少数据量762信号:频域冗余的表现形式1、长时功率谱密度的非均匀性。任何一种声音信息,在相当长的时间间隔内,功率分布在低频局部大于高频局部,功率谱具有明显的非平坦性,对于给定的频段而言,存在相应的冗余2、语言特有的短时功率谱密度。语音信号在某些频率上会出现峰值,而在另一些频率上出现谷值,这些共振峰频率具有较大的能量,由它们决定了不同的语音特征,整个语言的功率谱以基音频率为基础,形成了向高次谐波递减的结构772信号:听觉冗余根据分析人耳对信号频率、时间等方面具有有限分辨能力而设计的心理声学模型,将通过听觉领悟信息的复杂过程,包括接受信息,识别判断和理解信号内容等几个层次的心理活动,形成相应的连觉和意境由此构成声音信息集合中的所以数据,并非对人耳区分声音的强度、音调、方位都产生作用,形成听觉冗余。由听觉冗余引出了降低数据率,实现更高效率的数字音频传输的可能。782信号:的音频压缩处理中,采用了三种数据率,即是三层。第一层高保真度,第二层为大多数视频所采用,第三层通常人们称为3,采用了复杂的编码,以获得最好的音质。79有关音频编码〔压缩编码的技术标准〕2标准:第一代音视频标准,由于建立时间长、技术相对成熟、设备易用而且可靠性高,因而应用范围最广、影响最大。高清数字电视芯片仍以2为主导。4标准:主要应用于视像〔〕,视像电子邮件〔〕和电子新闻〔〕等领域;移动多媒体以此为主导;H.264标准:目前多面向网络传输领域,如机顶盒应用;标准:视频标准主要面向高清晰度和高质量数字电视播送、数字存储媒体、网络电视、视频通信等相关应用。音视频编解码技术经过10多年的开展,在该领域存在多种互不兼容的标准,在未来相当长一段时间内这一局面仍将继续维持。80杜比33〔数字杜比〕编/解码器可广泛地用于、和中的多声道音频传输。3可把5个独立的全频带通道和一个频带为全频带1/10的辅助低音通道的信号实现统一编码,成为单一的复合数据流,其比特率比唱片一个通道的比特率705还低。它有两个主要应用:其一是充分利用视频传输系统的信道带宽;另一个是减少存储需求。主要运用于数字电视系统和影音光盘。杜比3杜比3环绕声系统杜比3环绕声播放系统示意图〔1〕全音频声道〔2〕立体环绕声〔3〕声道之间别离度高〔其特点是从家庭影院的应用和开展来看,杜比3环绕声系统将可能成为主流,因为:已确定杜比3环绕声系统为〔高清晰度电视〕音频信号的编码和解码标准。数字视盘机〔〕的音频也采用3音频标准。几乎所有著名的电影公司制作的影片都按照3系统录制。目前世界著名的电子公司生产出的机,放大器都带有3解码器。杜比3素材交换格式在电视台内各系统设备之间基本采用信号流互相连接方式,如、信号连接。网络平台之间有基于2传输流互连的方式,传送时可以同时播放和处理。但是以信号流方式传送的数字信号把元数据放在消隐期间传送,在编辑和切换时会失掉元数据。元数据被定义为:描述数据的数据,对数据及信息资源的描述性信息。在数字电视信号中,即是辅助数据区的数据,从前面表达我们知道,除了嵌入音频信号以外,辅助数据区里头数据是告诉我们有效图像的数据是什么。85素材交换格式使用文件传输的必要:需要大量采用数据文件进行存储、迁移和交换,并且使用丰富的元数据,元数据需要和视、音频数据捆在一起传送和存储。基于计算机平台的视、音频处理设备越来越多。利用文件传输视、音频及元数据是这些设备之间最有效的数据传输方法。把所有相关数据打包在一起传送,灵活性大。基于文件传输可以大量使用设备,文件可以在不同速率的广域网和局域网中交流,文件的调用速度可以适合不同的通道带宽。节省费用。文件交换不会引起图像质量下降。86素材交换格式从平台过渡平台,要把素材数据化,使元数据处理系统化,使文件交换无缝隙化,支持流和文件,有、、和等格式。〔〕“素材交换格式〞用于设备之间的文件交换,并支持简单的编辑功能。〔〕“通用交换格式〞用于存储文档的交换。〔〕“先进制作格式〞支持复的编辑功能。87素材交换格式〔格式的特点〕是音频/视频/元数据的打包结构,可以是多种音/视频格式如、、和非压缩的数据,包括元数据。不必考虑其格式和内容,将节目单元简单放在文件包内,通过网络传输,并且可以通过文件名检索出源文件。文件在传输过程中可以直接播放元数据可以保存。元数据与视、音频捆在一起传送。88素材交换格式〔格式的数据格式〕简单类型:复杂类型:89头部包头部元数据内容容器尾部包头部包头部元数据索引表内容容器体部包内容容器尾部包随机索引尾部元数据索引局部包括局部元数据和文件参数,用于文件访问,指示文件体内包括的局部、流传输中断后再恢复的信息,区分场景或片断的信息,区分不同场景类型的信息。文件体局部是整个文件的99%。采用普通容器〔-〕作为文件本体的中间容器。所有视音频流和元数据都装入这个中。有以下項目组成:系统工程、图像工程、声音工程和辅助数据工程。最基本的工程是系统工程。系统工程包含视音频流和元数据处理的详细参数。要求帧精确元数据〔如时间码等〕也存储在系统工程内。文件头文件尾文件体素材交换格式〔格式的数据格式〕〔〕编码对元数据和內容打包。识别符时间线轨〔〕文件主体的格式:主体是、、非压缩的视频素材和音频。对主体的格式有如下的规定:将编码的素材褓分成可编辑的单元,典型的编辑单元为一帧。典型的可编辑单元包括有系统工程、图像工程、声音工程、数据工程等等。90素材交换格式〔中的元数据〕91元数据用于记录时间码、文件结构、文件体内容、关键字和题目、副标题、参考数字、位置、时间、数据和版本号等。对信号小结:模拟电视信号,分为亮度信号、色度信号〔或〕;分为同步信号〔行、场同步〕。前者属于有效图像信号,后者属于消隐信号。声音信号分开传送。和信号,分为有效图像数据区;辅助数据区。与模拟的有效图像信号和消隐信号相对应。辅助数据区可放置数字音频信号和描述有效图像的元数据。压缩数字信号,仅对有效图像和音频局部进行压缩,辅助数据区元数据、数据保存。素材交换格式,可以放置多种音/视频格式如、、和非压缩的数据,包括元数据。不必考虑其格式和内容,将节目单元简单放在文件包内,通过网络传输,并且可以通过文件名检索出源文件。文件在传输中可播放。数字化是指用数字来表达音频和视频,将模拟信号转换成数字信号来处理、存储和传输,存储和播放大都以流〔〕的方式进行。播放与记录速度一致,时间上是相等的。数据化的实质是文件化,即将流形式的内容转变成为数据块〔〕形式的文件。虽然内容相同,但两者在存储、传输和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论