版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第六章 数字电视与高清晰度电视 61数字电视概述 611 数字电视概念 数字电视指的是将模拟的电视信号变换为数字形式的电视信号(更先进的电视摄像机应直接获取数字电视信号),然后进行传输、处理或进行存储的系统,或还原成图像(可先还原成模拟信号)。 数字电视信号的存储媒质可以是各种半导体存储电路(RAM、ROM、E2PROM等);也可以是视频激光光盘(VCD、DVD)或HDD,后者就是永久性的存储媒质。为了减小数据量,常常对数字电视信号进行压缩编码后再传输或存储。 512数字电视的优点(1) 数字电视的抗干扰能力强 ;(2)数字电视机稳定可靠,易于调整,便于生产 ;(3)数字电视信号便于与计算机或
2、其它数字设备接口;(4)利用数字电视信号可以实现模拟信号难以得到的信号处理功能 。162 电视信号的编码 621 电视信号的数字化 模拟电视信号转换为数字电视信号的过程是模拟/数字转换编码过程 (称可为PCM调制脉冲编码调制,由A/D转换器实现),由数字电视信号转换为模拟信号则称PCM解调过程(由D/A转换器实现)。 我们知道A/D转换是对模拟信号进行取样、量化的过程,将连续 ( 幅度和时间 ) 的信号变离散的 n 位的二进制数字码。设离散值的最大个数为M,n 与 M 的关系为 2n -1 =M。 A/D转换输出可以是 n 位平行码,也可以是数率为n fS 的串行码(为采样转换频率)。2 量化
3、过程(时域相乘,频域卷积)与频谱 根据取样定理,当信号的最高频率为fm时,应有fS 2fm ,实际上为了便于D/A后利用滤波还原信号,应有fS 2.2 fm 。n = 3,M = 7频域时域理想低通滤波器特性取样函数fS/23 622 图像信号的编码方案与参数确定 彩色图像信号通常有两种形式:彩色全电视信号(Y/C);亮度信号/色差信号(Y / R-Y、B-Y,也可称为分量信号)。因此对图像信号的PCM编码也有全信号编码和分量编码两种,数字电视系统宜用分量编码,电视接收机中的数字化处理宜用全信号编码。 1全电视信号编码 (1) 取样频率 由于取样过程是非线性过程(时域相乘),在对对全电视信号采
4、样量化时,取样频率 fS 的选择,除了要满足取样定理外,要考虑采样后的信号中fS与 fSC的差频的影响:当 fS3 fSC或 fS4 fSC时, fS与 fSC的差频将落在Y信号的频谱间隙中。 应使取样点在屏幕中的位置固定,且满足正交取样条件。 以PAL制为例,当 fS4 fSC时 fSC(283+3/4) fH +25 ,4即一行中有(1135+4/625)个取样周期。每帧的取样点个数为整数 625(1135+4/625)个取样点 ,两相邻帧间取样点的位置相同。相邻行(奇、偶两场)的起始点相隔313(1135+4/625) 个采样点,也是近似整数 (仅差0.0032),满足正交结构。fS4
5、fSC的另一好处是因fS/2与fm间有较大间隔,可以降低模拟低通滤波器和数字滤波器的设计难度。(但码率高) 5 (2) 编码位数 量化信噪比 对于经过校正的图像信号,一般都采用均匀量化,即用线性编码。设单极性图像信号的变化范围为0到1,分为2n个量化层,每个量化层高为2-n。由于均匀分布,量化误差的均方根值:满量程量化信噪比:即量化位数每增加一位,信噪比提高6dB。实验表明:当n = 7 、8(即将信号量化为127至255个层时),人们已很难感到量化的影响(但对于未经校正的图像信号,则需要量化位数应大于11),由上式可知,对应的量化信噪比约为5060dB。 全信号编码时的数据速率 以PAL制
6、fS4 fSC、n = 8(8位A/D转换)为例,总数据速率约为 44.438=141.76Mb/s。由此可见,数字图像信号的数据速率是很高约。每一帧的数据量为5.67Mb或708.8kB。 6 2分量编码 分量编码就是对Y、R-Y、B-Y或三个基色分量R、G、B分别编码,进行并行传输或时分复用传输。 (1) 取样频率 fS 的选定原则和标准 选定原则 fS应大于最高频率(Y:5.86MHz,色差2 MHz)的2.2倍。 为了得到正交的点阵结构,取样频率应为行频 fH的整数倍。 fS是50Hz /625行、60Hz/ 525两类行频的公倍数,以为了便于不同电视制式转换。 亮度信号的取样频率与色
7、差信号的取样频率之间有整数倍的关系,以使两者的取样点能重合或有固定的位置关系。 CCIR(国际无线电咨询委员会)的分量编码国际标准 对Y / R-Y/B-Y的取样频率为13.5/6.75/6.75MHz,简称4:2:2标准。( fS = 13.5MHz = 858 fS 525行 = 864 fS 625行, fH 525行 =15734.264Hz )低标准: 4:1:1/ 13.5/3.375/3.375MHz,2:1:1/ 6.75/3.375/3.375MHz 7 (2) 数字有效行(内的信号样点数) 数字有效行的数据由每行必须进行处理和存储的取样点构成,有效行期间包括了正程。两种制式
8、的数字有效行均为亮度信号样点数:720、色度样点数:360个,便于两种制式的转换。一行的起点定在行同步前沿脉冲的中部。PAL制的有效行由样点133至852构成,而正程对应的样点为142至844。 8 (3) 编码位数和排列 亮度信号和色差信号分别规一化为01及-0.5+0.5的范围,并都编为8位线性码。由于原来的R-Y最大值为0.701,B-Y的最大值为0.886,故要对R-Y和B-Y进行压缩,压缩比分别为 k R-Y =0.5/0.701、k B-Y =0.5/0.866,压缩后三分量Y、(R-Y)、(B-Y)的表示式为: Y0.299R+0.587G+0.114B (R-Y)=0.5R-0
9、.419G-0.081B; (B-Y)-0.169R-0.331G+0. 5B Y编为自然二进码,双极性的(R-Y)、(B-Y)编为偏移二进制码,即-0.5对应自然码的0,+0.5为255,零电平为128。为了防止信号过载、直流漂移,256个量化级并不全用。亮度信号的黑白电平对应于16至235量化级,色差信号则在底部和顶各留16个量化级。 分量编码的数字信号在传输时的数据序列: (B-Y)Y(R-Y) (Y) (B-Y)Y(R-Y) (Y)这里(B-Y)Y(R-Y)是空间同一取样点的数字,而(R-Y) (Y) (B-Y)中的(Y)是仅有亮度取样的空间取样点的数字,它规定在一行的偶数样点上。 (
10、B-Y)Y(R-Y)Y(B-Y)Y(R-Y)Y只对亮度信号采样对亮度色度信号都采样9 3电视伴音信号的编码 由于伴音与电视体制没有确定的关系、编码比较简单。模拟伴音信号的频带为20Hz至15kHz,高质量的伴音为20Hz至20kHz。对于15kHz信号取样频率一般取fS32kHz。对于20kHz信号,取样频率可取fS48kHz。取样频率应与图像取样频率保持固定的关系,从同一时钟源得到。在PAL的分量编码时,若仍采用48kHz取样频率,就可以保持这种关系: 13.5MHz 375 3 4 = 48kHz 伴音编码的位数要比图像编码的位数多。这是因为伴音信号的动态范围大( 90dB 以上),高质量
11、的伴音要求很高的信号噪声比,应有8590dB的信号量化噪声比。由上面的均匀量化的信噪比公式,则均匀量化所需的编码位数为13至14位。在演播室的高质量话音编码中,若要对低电平的声音仍有高的信号噪声比,编码位数甚至要取到16位。 伴音信号由于信号幅值分布的特性(非均匀分布,幅值大的概率小)以及人的听觉持性,也可以采用非线性编码,这样n11、12时也可以得到很高的声音质量。虽然伴音编码的位数比图像编码的位数多,但因是低速编码,反而更容易实现。 1063 频带压缩编码 为什么要进行频带压缩编码 一路标准清晰度的数字电视信号的码率是很高的,例如4:2:2分量编码彩色图像的码率为(13.5+26.35)8
12、216Mb/s,即便是采用1.5b/Hz的高效数字调制,传输频带也要144MHz,相当于18个模拟电视信号的频带(模拟信号一个频道为8MHz),根本无法实现。 如何进行压缩 消除电视信号中的冗余成分: 空间冗余:相邻象素/行 变化小; 时间冗余:相邻帧变化小,具有相关性; 生理冗余:人的视觉惰性,如对运动的和突变(如轮廓边界)的图像的分辨力低等 频谱冗余等 具体的压缩频带方法 : 预测编码(主要消除时间冗余和生理冗余) 变换编码(主要消除空间冗余) 其它压缩码率的措施11 631 预测编码基本含义: 从已知信号推测未来信号。目标: 减小空间和时间冗余 。 在图像预测编码中, 人们力求根据图像或
13、信息所存在的相关性,推测未来图中*人*和国 中华人民共和国 1预测编码的原理 差分脉码调制(DPCM) 像或象素的可能值。大量实验证明,一般图像的相邻两帧只有10以下的象素的亮度值会有超过2的变化,而色度只有1以下的变化。毫无疑问,预测编码技术应用到图像处理中是非常正确的。当然,预测编码仅对非独立信源起作用。 预测值是已各点量化值的线性组合 ai是预测系数 。当序列的统计特性已知时(如相关函数),可以得到这些系数的最佳值,使得预测值与样值的预测误差最小。待编码取样序列量化后数字序列预测值12 (1) 非均匀量化编码 + 固定字长 非均匀量化编码:对出规概率大的小信号细量化,对出现概率小的大信号
14、粗量化。5bit / pel的非均匀量化可以获得与 8bit / pel均匀量化大致相同的图像质量。 (2) 均匀量化 + 可变字长编码 根据熵编码原理,对概率大的小差值信号编为小字长码(位数少,去掉前导零);而对概率小的大差值信号编为大字长码。 DOCM预测编码结构简单,易于实现,压缩效率高;主要缺点是抗御误码的能力差。 2 自适应预测编码及运动补偿预测编码 实践证明,人眼观看物体细节的相对分解能力与其空间频率(物体的细小程度)和时间分辨率(物体运动的快慢)有关。一般情况下,可以认为人眼在观看物体(或图像)时,最大空间分辨率与最大时间分辨率的乘积近似为常数。根据这一点,可以对高速运动的图像赋
15、予较大的量化步长,而给与较高的传送速度;对低速运动或静止的图像赋予较小的量化步长,而给与较低的传送速度。 运动补偿是一种对活动图像的帧间编码技术,目的是根据活动图像相邻帧间的时域相关性,尽可能消除这部分冗余。13 632变换编码 将图像中的像素按区域分成一些包括MN个像素的许多方块。这些像素点的取样值构成一空间(设为X,Y二维)的数字阵列,然后将它们变换到由正交矢量构成的变换域中,再对这些变换域中的阵列系数进行编码发送,接收端通过逆变换恢复原数据。实用的变换有富里叶变换、离散余弦变换(DCT)、沃尔什(Walsh)变换等。 变换编码压缩数据的原理:图像空间存在相关性,在变换域中,各空间频率分量
16、是不均匀的,即空间频率低的区域信号幅度大,高频区域信号幅度小。若根据统计特性,低频部分编 n 大的长码,高频亮度部分编 n 小的短码(与均匀量化 + 可变字长编码类似),则平均码长和总的码率都会下降,达到压缩码率的目的。 离散余弦变换压缩率最高,有快速算法,能实现实时压缩;沃尔什变换易于硬件实现。14 633 其它压缩码率的措施 (利用图像信号的某些特性进行压缩) 1亚奈奎斯特取样 根据取样定理,应有fS2fm,若不满足此条件,会发生频谱混叠而失真。然而,由于视频信号存在较大的频谱间隙,如果恰当选择 fS2fm采样的频率,使频谱折叠区域落在原信号的频谱间隙中,就不会发生频谱折叠失真。 视频信号
17、频谱:n fHm fH, 取则折叠频率为 低通特性 梳状滤波的特性 2同步信号的编码 电视信号的行逆程和场逆程中,只有同步信号、消隐信号和色同步信号。它们所携带的信息很少,但占据的时间却很长。数字化过程中,没有必要对这些逆程信号的全部进行波形取样编码,也没有必要逐行、逐场传送这些信息,而只要对行、场定时信号单独编码,插入到图像数字信号中即可。15离散余弦变换DCT编码压缩系统简介 DCTIDCT其中:16 二维DCT变换是一种线性变换,可以分解成两个一维DCT变化的乘积。特别是当MN时,二维DCT变换可用矩阵表示: 17例:88亮度子块的DCT编码压缩和解码 JPEG88亮度子块DCDCT第一
18、步:DCT变换 DCT编码压缩18JPEG亮度量化矩阵表 第二步:量化处理降低每个DCT系数的比特数 量化过程是将DCT系数矩阵F(u,v)中的每个元素与量化矩阵Q(u,v)中的对应元素相除后,舍去小于0.5以下的小数。例如:Q(u,v)为量化矩阵。19量化结果第三步:Z扫描并串转换第四步:编码传输游程编码:本例为(39,-3,2,1, -1,1,0,0,0,0,0, -1,EOB)。EOB表示块结束,接收端收到EOB后自动将64个元素中余下的元素补零。20DCT解码复原第一步:恢复量化矩阵将EOB后的元素自动补零第二步:反量化(IQ)(619)21第三步:IDCT主要原因是量化所致。重建后的
19、信号与原信号相差很小 22JPEG色度量化矩阵表 将整幅图像分解出数个用于DCT的子块DCT系数中绝对值较大的集中在矩阵的左上角。将一些绝对值很小的系数或区块置零便于丢弃串并转换舍去零系数量化矩阵复原恢复DCT系数图像子块重建整幅图像重建传输或存储232020 DCT子块IDCT重建的10075图像活动图像的DCT编解码示例100100 DCT子块24等亮度方块黑白交错的干扰信号DCT结果量化结果特殊图像的例子重构误差会很大2564 电视信号的数字处理 641概述 利用数字技术对电视信号的处理,不仅能完成模拟处理技术中的相应,还能完成许多模拟电视中难以完成的各种功能,从而达到提高图像质量,丰富
20、电视节目等目的。 642 数字滤波器 1数字滤波器的作用(略,详见数字信号处理) 2数字滤波器的基本结构和原理(略,详见数字信号处理) 3数字滤波器举例 (1) 亮度水平滤波器 滤波器的传递函数 ( a )( b )代入 ze j =2ffS,当 fS =4 fSC时,26 (2) 亮/色分离梳状滤波器 PAL制行延时TTH A至B 的传输函数HY() 代入 ze j及 =2ffHA至C的传输函数HC() NTSC制的Y/C分离 传递函数取(1行延迟) 结构图如何画?幅频特性:2行延时27 传递函数取(1帧延迟:TTF , PAL制要延迟 2 帧 ) 这种Y/C分离方法适合于静止图像或变化十分
21、缓慢的图像,特别是静止图像(帧重复),可以获得非常高的清晰度(对同一位置的像素求和)。由于模拟延迟难以获得高精度长时间延迟,所以这种方法只能用于数字处理。 28 (3) PAL色度解调器 U支路的滤波器幅频特性由于:所以 实际延迟与标准延迟之差极小。(64.05603s )V支路的滤波器幅频特性29 分离后的U、V信号都是取样频率为fS4fSC的数字信号,分别送入锁存器以fSC频率进行再取样。由于取样时钟的频率fS4 fSC,并与色同步信号严格锁相,实际上取样时就已实现了FU、FV这两个数字色度分量分离。位于fSC零相的采样值为V 分量,位于fSC 90(将fSC延迟TS ,即一个A/D采样周
22、期)的采样值为U分量。所以利用彩色副载波fSC作为时钟进行再取样,fSC零相的再取样值即为V分量值,fSC延迟一个fS的周期TS的取样值即为U分量值,以完成副载频信号至视频信号的频率变换。30 643 电视信号的时基处理 数字信号的在存储器里的存入、取出由外部的定时信号决定。若数字电视信号在存储过程中,采用不同的存入和取出的定时信号,就可以将电视信号在时间上进行变换,这种变换称为时基处理。 1 数字时基校正 数字时基校正器(DTM)是一种典型的时基处理设备,它主要用于校正视频磁带录像机VTR)重放时输出信号的时基误差(TBE)。(RAM或SRAM) 用于DTBC的存储器容量一般为10余行以上,
23、而校正的时基误差可达几十s甚至更大。 31 2 数字时基处理的其它应用 时基变换和处理的原理,还可用于其它方面,例如倍行频或倍场频显示,隔行/逐行扫描转换,数字式彩色电视制式转换等。这些都是通过对帧存储器内的数字电视信号进行特殊的读/写控制和内插处理而实现的。 倍行/场频扫描 将电视信号以正常的取样时钟写入存储器,通过数据内插方法(即将相邻行的数据平均,得到内插行的数据;或者将相邻帧的数据平均,得到内插帧的数据)进行数据扩展。再以双倍取样频率取出数据。同时显示时以倍行频扫描,即每场625行显示,这是倍行频显示技术。也可以重新排列扫描顺序,由隔行扫描改为逐行扫描。以上两种显示扫描行数都加倍,只是
24、数据的读出顺序不同。倍行频可以消除行间的闪烁现象。倍场频显示是保持隔行扫描不变,而使场频加倍(每秒由50场提高到100场。当然行频也加倍)。倍场频显示既能消除行间闪烁,也能消除场间大面积的闪烁。 32 数字制式转换器 将525行和625行两种制式转换的数字制式转换器(DSC),也是利用上述时基变换和行、场内插等技术实现的。625=2525; 525=21253366 高清晰度电视 661 普通电视系统存在的缺陷 (以NTSC系统为例) 1总体上的缺陷 宽高比 早期拟订电视规范时,选择了4 : 3的宽高比,因为当时35mm影片有同样的宽高比,而且观众对此格式也感到舒适。但今天“宽屏幕”形式很普遍
25、,NHK的研究表明,人们更喜欢5 : 3或甚至2 : 1的宽高比。 有限的垂直分解力 (NTSC系统比PAL系统更明显) 在NTSC制的525扫描行中,只有485行能产生图像,余下的40行是场消隐期。在最佳的情况下,人们期望分解出485行,但实际上有一些影响使这个数字大大减少,如凯尔( Kell )系数和隔行系数等均使可观察到的分解力降低,最多只能达到330行左右。 有限的水平分解力 假设水平分解力近似等于垂直分解力。因此水平分解力在满屏宽约为440行。要达到这样的分解力,需要频率响应的平坦部分达到4.2MHz左右。NTSC制规定视频带宽的上限也只有4.2MHz,此频率上限不能随便扩展,因为电
26、视额道的划分大多互相紧邻。 34 严重受限的色度分解力 根据对人类视觉系统的研究结果,人眼对彩色的分辨力是有限的,因此决定利用这一点对色度系统的频率响应也作同样的限制。虽然这种方法已证明是使色度信号符合原先单色传输标准的极好方法,但目前节目制作设备却正在发生变化,为了尽量减小图像的劣化,采用RGB基色或Y、B - Y、G - Y分量进行编辑。 2隔行缺陷 行间闪烁 爬行 移动物体的垂直和对角线轮廓会发生畸变(锯齿化现象) 3其它各种缺陷 静态光栅(可见行结构) 由于电视机屏幕尺寸的增加和质量的改进,观众开始能看到组成一帧图像的各扫描行,许多人对此感到不快,使扫描点单纯地散焦,会产生使水平清晰度
27、同时下降的缺陷。按照NTSC制标准,观众要在图像高度的7倍处(PAL制是6倍)才可以避免看到行结构。在这个距离上,观看者不会有身临其境的感觉,相反是感觉在看“一只盒子中的图画”。35 大面积闪烁 研究表明,人眼可观察到频率非常高的场景亮度变化,它取决于视场和亮度电平。就正常的观看电平来讲,欧洲的PAL和SECAM的50Hz场频对许多人来说可能是太低了。测试表明,100Hz的场频对避免大面积闪烁效果是很好的,当然这时接收机的成本会有较大的增加。 串色 串色看起来就像新闻播音员身上花呢短上衣的异常彩色编织图案的效果,这是由于NTSC将高频亮度信号与色度信号混合在同一个复合信号里所致。减小此种串扰有
28、两个办法,一种是将亮度倍号带宽限制到大约3MHz(该方法比较经济,直到几年前一直在普遍使用);再就是利用流状滤波器将色度信号从亮度信号中滤出,但又会使垂直分辨率降低。 串亮 串亮是由于色度信号漏入亮度通道所致,特别是在黑白电视接收机中,屏幕上由密布点组成矩阵状干扰。串亮可采取与抗串色相同的方法来消除。 36 时域混叠 这种“车轮向后转”的视觉效应是由30帧秒的取样率造成的。 传统电视系统的缺陷小结: 为了使闪烁减少到可接受的水平,又要保持带宽不变,采用隔行扫描是最好的折中。采用这样的技术不可能没有损失,如行间闪烁、快速运动时垂直边缘模糊等。 为减轻这些缺陷的影响,尤其是要避免看到行结构,观众应
29、该在6倍图像高度距离处观看。但是在这个距离上,观看者不会有融进节目的感觉,相反是感觉它像“一只盒子中的图”。 为了使彩色电视和黑白电视兼容采用了频率分割复用技术,使得色差信号和亮度信号在频谱上的交借,这是很大的进步,但又免不了会有串亮和串色。这也是在新一代电视系统中要解决的问题。 662 人眼视觉和电视标准 1视角和临场感 当一幅清楚的图像呈现在宽阔的视觉场时,人眼将不能区分被显示的图像空间和观看者所处的空间,这将使观看者几乎忘记了这是由显示产生的图像,而获得逼真的立体视觉。因此,扩展屏幕宽度对产生临场感是极为有效的技术手段。 37 实验证明,只有当视场角至少超过20时才能开始获得具有“临场感
30、”表现的心理效果。随着观看者的视场角增加,这种心理效果也增加,当达到80 120时趋于饱和。目前的电视系统,位于最佳距离观看时,水平视角大约只有10左右,而未来的电视系统的水平视角则希望达到20 30。视觉场大小和观看距离有关,普通电视在距图像高度的7倍处观看,HDTV在距图像高度3倍的距离处观看已获得较大的视角。为了满足近处观看,HDTV的图像就必须有相应的图像细节和清晰的轮廓。 图6-2238 2垂直细节和观看距离 要提高电视系统的垂直清晰度,就必须提高扫描行数。为此有必要来确定在满足人眼视觉对图像质量要求的前提下,新的高清晰度电视系统的扫描行数至少应为多少行才合适。研究的结果表明,高清晰
31、度电视要求的扫描行数决定于人眼视觉系统的频率响应特性,并且是人眼观看图像距离的函数。 白顺序排列的条纹。对应这些不同频率的条纹图案,视觉的敏感度不同。由于人眼的视力有个极限值,即眼睛的分辨能力有限,当空间频率超过定值后,就感觉不出有明暗条纹的变化,而成了融合在一起的连续亮光。因此,空间频率特性的截止频率就相当于眼睛的分辨能力。图6-23 在单位空间里将明暗条纹按正弦分布规律变化,人眼将看到黑39图6-23横坐标r为空间频率,单位为cpd(周/度),表示每度视角包含的黑自条纹数;纵坐标为为相对视觉响应值;r 1为相对响应值下降6dB时的空间频率,称为高端截止频率,一般r 19.3cpd;若定义归
32、一化空间频率x = r / r 1,则当x = x0= r0 / r 11.5时,r0称为空间频率上限,x0为极限空间频率的系数;常数k 1,其值反映了对比度阀的变化。 由图可见,视觉的空间频率响应类似于低频端下跌的带通滤波器的响应,即当空间频率r过低或过高时,视觉的相对响应值下降。 n V2 r0V2 x0 r1V式中,V为垂直视角:n V是眼睛能够分辨的黑白线条数的上限。 另一方面,图像垂直分解力DV和系统扫描行数N之间的关系式为 DV = K KiV N式中,K为Kell系数,K = 0.7;Ki是隔行扫描系数其值为0.60.7;V为垂直扫描有效率(正程系数)。 在上限空间频率r0的情况
33、下,眼睛能分辨出屏幕上的黑白线条总数在图像垂直方向可表示为40 若对高清晰度电视的图像垂直分解力的要求不超过人的眼睛能够分辨的空间频率的上限 DV = n V,即扫描线数为 令视距与图像高度之比为d, 及 ,则扫描线数 由此可见,扫描行数直接与观察距离有关。观察距离越近,要求的扫描行数越多,这样才能使相邻扫描线不产生间隔断开的感觉。人观看电视图像的最佳距离应该是在看不清扫描线结构的情况下,能看清电视图像的所有细节,就是说要看清图像最高分辨力的线数。 41 3水平细节、图像宽度和视频带宽 由于人眼中锥状细胞是接近圆形的,其垂直分辨力和水平分辨力是接近相同的高清晰度电视水平分辨力的要求应等于垂直分
34、辨力。 普通电视的宽高比是1.33(4:3),图像的最佳观看距离为67倍的屏幕高度,水平/垂直视场角只有10左右,没有临场感。高清晰度电视采用了与宽银幕电影相同的图像宽高比16:9 ( 1.777 ),在3倍屏幕高度的观看距离上,水平/垂直视场角达19/ 33左右,具有较强的临场感。它也是在图像质量和HDTV信道限制之间的一个折中,因为在其它条件相同的情况下,视频基带的带宽和宽高比成正比。 人眼的视觉特性包括物理特性和心理特性两个方面。心理因素涉及到的对高清晰度电视质量的影响,是通过大量实验数据得到的,是综合性的。它和扫描行数、观看距离、图像宽高比、屏幕尺寸大小、空间视角场、扫描制式以及屏幕亮
35、度等都有密切相连的关系。以清晰度为例,在一定的观看距离下,若观看者感觉到高清晰度电视图像的清晰度远高于普通电视,那么随着显示图像的尺寸变小,或图像尺寸不变而视距拉远,二者之间的差别就会变得不再能察觉出来。所以,高清晰度电视是与大屏幕紧密联系在一起的。如果这个图像在小屏幕上接收,它的高清晰度优势的吸引力就不存在了。 42 下面以 N = 1125、fF =30Hz为例,估算HDTV视频信号的带宽。 在此标准下的扫描行频fHDTV H为fHDTV H =112530=33.75kHz,正程系数V取与NTSC相同,即取 V =0.92在DV = K KiV N 中的隔行系数取Ki=0.65/0.7(
36、 K= 0.7 ),则隔行扫描的HDTV视频信号带宽 f b 约为14.1/16.5MHz (DV 471/507线)。 663电视信号的空间表示 由摄像机所获取的图像是空间和时间取样的结果。行结构代表了垂直方向上的取样,利用数字信号处理技术,通过模数转换将行方向的模拟信号转换成数字信号,由此产生图像水平方向上的取样。这样,垂直和水平取样过程提供了空间分析,场和帧的重复提供了图像的时间取样。如果图像用f ( x, y )二维表示,扫描线可表示成 。用扫描线对图像进行取样,在时间域上是f ( x, y )与 的乘积,在频域上是F (, )和 的卷积(和分别是x和y方向的空间频率)。即空间位置 空
37、间频率43图6-24 图像扫描取样后的频谱如图6-24所示,其中图(a)是扫描线和图像 f ( x, y );图(b)是图像的谱F (, );图(c)是扫描线的谱;图(d )是经过扫描的图像的谱。由图可见,不发生混叠的条件是必须保证图像在 轴方向上的最高频率满足 。 44 数字电视不仅在垂直方向上用扫描线取样,在行的方向上也须取样,如图6-25(a)所示。取样点呈格子状,称之为正交取样,它可以表示成二维冲击函数 图(b)表示图像的二维谱,图(c)是取样以后的图像信号的二维谱。 如取样后的信号为fg ( x, y ),则 图6-25式中 是x、y方向的取样频率。不发生混叠的条件是限制图像在x方向
38、和y方向上的最高频率x、y,即 45 在前述的正交取样时,不发生混最的条件是取样频率要大于最高频率的两倍,如果不满足这个条件,肯定会发生混叠。但是在交错取样(offset sampling)(或称偏置取样)的情况下,即使在垂直方向和水平方向上取样频率各降仅了近一半,仍然不发生混叠,采用交错点取样使频谱面积的利用更充分了。图6-26 我们将要介绍的日本已实用化的MUSE制HDTV就是采用了的点交错(偏置)的取样方法。46 664 MUSE系统 首先需要指出,日本的MUSE系统(同时包括欧洲曾经开发过的HD-MAC系统)不是全数字式HDTV,已经成为过时被淘汰的技术。然而,MUSE毕竟 是世界上最
39、早投入实用并正式播出的高清晰度电视系统,而HD-MAC早在巴塞罗那奥运会期间进行过试播,同时它们受采用的一些技术具有一定的先进性和可借鉴性(如采用多重亚取样和运动补偿技术),所以这里对MUSE系统作简单的介绍。 1概述 日本于1964年开始进行了高清晰度电视的研究历经20余年。终于在1984年正式提出了MUSE(Multiple Sub-Nyquist Sampling Encoding),即多重亚奈奎斯特取样编码系统,用单频道作HDTV卫星广播。 MUSE系统的技术参数如下: 采用场频为60Hz的隔行扫描,扫描行数为1125行。这是为兼顾到NTSC的525行和PAL和SECAM制的625行,
40、因为1125行对于525行为15:7,而对625行则为9:5。 采用多重亚取样和运动补偿技术。重建的信号频带宽度:静止情况下亮度信号为22.75MHz,色度信号为7.425MHz;运动情况下亮度信号为14.85MHz色度信号为3.7125MHz。 47 传输形式是取样数据的模拟传输,信号的取样频率为16.2MHz。 压缩后视频信号带宽为8.1MHz,采用调频调制。 目前MUSE系统在日本巳投入使用,用直播广播卫星(DBS)在12GHz频道带宽为27MHz24MHz,效果良好,但与现有电视制式不兼容。 2MUSE信号的形成 亚取样技术 原始的模数变换的取样频率是48.6MHz,也就是信号的上限频
41、率是24.3MHz。经过压缩的信号的视频带宽的上限是8.1MHz。这里所图6-27说的压缩方法就是用亚取样的方法,也可以称为点交错的取样方法。对于静止图像,两帧(4场)呈一个周期,在一个周期内各场的取样是互相交错的,也就是由4场组成一幅图。这里利用了人眼对静止(包括慢运动)图像的空间分辨力要求高,而对时间分辨力要求低的视觉特性 。48 时间压缩技术 在MUSE系统中,亮度信号和色度信号不是采用频谱交错方式而是用时分复用方式。它是将亮度信号和色度信号分别在时间上压缩,并且将压缩以后的亮度信号和色度信号安排在一行中不同的时间段。亮度信号的压缩比是12:11,色度信号压缩得更多,和亮度信号的时间压缩
42、比是4:1。色度信号CR和CB还是轮流传送。亮度信号之所以要进行12:11的压缩,是为了在将亮度信号压缩到亮度信号的1/4之后,亮度信号和色度信号所占时间不超过行扫描全程时间(63.5s)。亮度信号的上限频率是 (48.6MHz/2)(11/12)22.275MHz,色度信号的上限频率是 (22.275MHz)(1/3)7.425MHz。 49图6-31 实现时间压缩(TCI:Time Compressed Integration) 和扩展的方框图如图6-31所示。 50 运动检测和运动补偿 MUSE系统是一个运动补偿亚取样系统。对于图像的静止区域,解码器是用时间内插,即用4场的信号的取样值采
43、重建HDTV图像。对于图像的运动区域,解码器是用空间内插,即用当前场的信号的内插。如果将时间内插用于运动部分,多行混叠会使图像质量下降。利用空间内插的区域带宽窄,这意味着图像运动部分的分解力会下降,但这个问题影响不大,因人的视觉对图像运动部分的边缘的模糊不敏感。 由于摄像机拍摄全景时如摇动镜头和倾斜拍摄造成的运动和图像中物体的运动给人眼的感觉不同,如果按物体运动那样来处理,它会使整个图画面都模糊。为此,就需要运动补偿。在编码器端,对每一场作检测,要找出一个代表景物运动的矢量。在解码器端,将前一场的图像元素取样值按运动矢量作位移。利用这样的运动补偿方法,使时间内插能够应用于播镜头和倾斜拍摄的场合
44、,而不会有模糊,改善了运动图像的分解力。 由上所述,在MUSE系统中运动补偿仅用于摇镜头和倾斜拍摄的情况,并不用在物体运动的情况。51 为了要从一场中检测出一个单一的运动矢量,必须使用全画面的信息,即使用全部像素来检测。这在理论上是可行的,但计算量太大。实际上不使用那么多的点,也能确保足够的精度。如图6-32所示,在每个328的小块中选出代表点,对这些代表点进行运算。图6-32图6-33 运动检测的方法很多,MUSE系统中是用的匹配法。如图6-33所示,将前一幅图像中的代表点相当前图像各点之间进行相关计算,求出其中相关值最高的运动矢量Z 。这里要注意的是,这里的相关计算并不是两幅都用代表点进行
45、计算,仅仅是前一幅用代表点。52 6. 6. 5 全数字电视系统 1. 全数字电视系统信号的的基本特征 . 视频和音频信号全部数字化。 . 采用MPEG-2标准对数字化视频信号进行压缩编码,目标是降低数字信号的传输码率。(信源编码) . 压缩编码后的数字视频信号在调制前,为了保证在传输工程中尽可能减少差错,通常还要加入用于纠错的RS码和卷积码,同时还要作交织处理使可能产生的差错均匀分布,以利于纠错目低是提高数字信号的传输的可靠性。 (信道编码) . 采用MPEG-2、AC-3或AAC等标准(将来可能还会有新的标准)将数字化音频信号进行压缩编码,提供5.1声道的数字伴音信号。 . 采用高效率的数
46、字调制技术,完成数字电视信号的发送传输任务。不同的数字电视系统所采用的调制方式不同,同时,相同的数字电视系统,传输媒体中所采用的调制方式也不相同。53 2. 现行的数字电视(含数字高清晰度电视)系统. 美国的ATSC (地面广播:8 VSB调制) ( ATSC :Advanced Television Systems Committee ). 欧洲的DVB (地面广播:DVB-T 采用COFDM调制) ( DVB :Digital Video Broadcast 数字视频广播; COFDM:Coded Orthogonal Frequency Division Multiplexing:编码正
47、交频分复用 ). 日本的ISDB (地面广播: ISDB -T 采用COFDM调制) ( ISDB :Integrated Services Digital Broadcasting 综合业务数字广播 ;ISDB-T:Terrestrial Integrated Services Digital Broadcasting) 这些数字电视系统的共同特点是采用MPEG-2作为图像信号的压缩标准,而在伴音信号的处理以及传输调制方法等方面各不相同,均有各自的独到之处。54 3. MPEG的基本理论(图像信源编码) MPEG(Moving Picture Expert Group)是“活动图像专家组”的
48、英文简称,1988年成立以来已经制定了MPEG-1MPEG-7等多个数字视频数字音频压缩编码标准。 MPEG-1的压缩比高达200:1,用于最高码率可达1.5Mb/s的活动图像和相应音频信号的压缩编码,图像质量与VHS相当。 MPEG-2的压缩比可达50:1, 压缩后的数字活动图像信号和相应音频信号码率可达几Mb/s,是DVD和数字高清度电视所采用的压缩编码标准。 MPEG-4的最初目标是低码率图像通信(64Kb/s以下),后来发展成为应用更加广泛的多媒体编码标准。 MPEG-4是一个开放的系统,它即支持传统标准又不排斥性标准,码率成功地涵盖了从100Kb/s10Mb/s的广阔范围,互联网上的
49、一些号称达到DVD画质的影像很多是采用MPEG-4的。 MPEG-7能对各种不同类型的多媒体信息进行标准化的描述,并将该描述与所描述的内容相联系,以实现快速有效的搜索。它的应用很广,既可应用于存储,也可用于流式应用(如广播),还可以在实时或非实时环境下应用,如:数字图书馆、多媒体名录服务(如黄页) 、广播媒体选择、多媒体编辑等,应用潜力很大。55 MPEG的视频数据流结构 为了便于对图像序列的随机访问和编辑,MPEG对视频数据流规定了分层的结构(六个层次): 图像序列层(Video Sequence layer) 图像组层(Group of Picture) 图像层(Picture) 宏块条/
50、片层 (Slice) 宏块层(Macro block) 块层(Block layer)56 图像序列:图像序列就是一个被处理的连续图像,是由图像组构成的,它包含序列头、若干个图像组层的数据以及序列终止符。 图像组(GOP) :图像组是为方便随机存取而加的,其结构和长度均为可变的,MPEG2对此没有硬性规定。图像组是随机存取视频单位,它由定义的一组或多组帧内编码帧(I帧)或非帧内编码帧(P帧或B帧)图像构成。每组包括组头,图像层数据,还有时间信息。 GOP有两个参数,即长度(N)和帧重复频率(M)。 图像:图像是独立的显示单位,也是基本编码单位,由图像头和宏块条层数据组成。在MPEG-2中,图像
51、可以是逐行的,也可以是隔行的,MPEG-1总是逐行的。 宏块条:宏块条包含若干个连续的宏块,是重新同步单位。宏块条的设置目的是防止误码的扩散,当一个宏块条出现误码时,不影响后续的宏块条解码。57 宏块:宏块层由宏块头加块层数据组成,图像以亮度数据矩阵为基准分为1616像素的宏块,宏块是进行运动补偿的基本单位。一个宏块包含个8 8的亮度块,依据类的不同,一个宏块还包含 两个8 8色度块(R-Y和B-Y各一个,4:2:0取样时)、四个8 8色度块( R-Y和B-Y各两个,4:2:2取样)或 八个88色度块 ( R-Y和B-Y各四个, 4:4:4 取样时) 。 块:块是MPEG码流的最底层,每个块是
52、一个8 8 像素的数据矩阵。每个块中只含有一种信号元素,即它或是亮度数据矩阵,或是某中色度数据矩阵。块是进行DCT运算的单位,宏块在进行DCT运算之前要被分成若干个块。58 MPEG中的三种图像类型即码流组成 三种图像类型 MPEG是基于DCT、运动补偿和Huffman编码算法的,在压缩中使用了帧内压缩和帧间压缩两种方式。为了在编码中实现最大的压缩比, MPEG使用三种类型的图像,即I帧、P帧和B帧。 I帧(Intra-Frame)是帧内压缩,不使用运动补偿,提供中等的压缩比。由于I帧不依赖于其他帧,所以是随机存取的入点,同时是解码中的基准帧。 一个图像组总是以I帧开头的,I帧压缩可以得到6:
53、1的压缩比而不产生任何可觉察的模糊现象。 P帧(Predicated-Frame)根据前面的I帧或P帧进行预测(向前预测),使用运动补偿算法进行压缩,因而压缩比要比I帧高,数据量平均达到I帧的1/3左右。P帧是对前后的B帧和后继的P帧进行解码的基准帧。P帧本身是有误差的,如果P帧的前一个基准帧也是P帧,就会造成误差传播。 B帧(Bidirectinal-Frame)是基于内插重建的帧,它基于前后的两个I、P帧或P、P帧,它使用双向预测,数据量平均可以达到I帧的1/9左右。B帧本身不作为基准,因此可以在提供更高的压缩比的情况下不传播误差。 59 码流组成 一个GOP由一串I、B、P帧组成,起始为
54、I帧。GOP的长度是一个I帧到下一个I 帧的间隔,这个长度是可变的,长GOP可以提供高的压缩比,但是会造成随机存取的延迟(必须等到下一个I帧)和误差的积累(P帧的误差传播)。一般是一秒内有两个I帧,用来作为随机存取的入口。 在MPEG-2中没有规定GOP的结构,帧重复方式可以是I、P,I、B,I、B、P,I、B、B、P,甚至全部是I帧。一种典型图像帧序为:IBBPBBPBBPBBIBBPBBPBBPBBI。B帧和P帧要求计算机有更强的功能。有些压缩器不能产生B帧或者连P帧也不能产生,则图像的压缩结果将有很明显的间断。 在MPEG-1中,每个I帧图像含有152Kb,P帧图像含有80Kb, B帧图
55、像含有23Kb,一个典型GOP由1个I帧、 3个P帧、 8个B帧组成,所以,一个GOP的数据量为152+803+238=576Kb,平均每帧为48Kb,帧频为25Hz时,其视频码率为4825=1.2Mb/s。60 4. 信道编码 提高数据传输效率,降低误码率是信道编码的任务。信道编码的本质是增加通信的可靠性。 数字信号在传输中往往由于各种原因,使得在传送的数据流中产生误码,从而使接收端产生图象跳跃、不连续、出现马赛克等现象。所以通过信道编码这一环节,对数码流进行相应的处理,使系统具有一定的纠错能力和抗干扰能力,可极大地避免码流传送中误码的发生。误码的处理技术有纠错、交织、线性内插等。 A、纠错
56、 在信道编码过程中将附加数据(如奇偶校验位)加于数据流之中,在接收端通过奇偶校验位来发现有错误的数据字,并给予纠正,纠错的方法有保持前面的字和线性内插等。数字电视系统一般采用RS等外编码方式进行纠错处理。 B、 交织 交织是一种极复杂的过程,是对纠错过程的补充,交织的基本原理是在编码时将数码流按已定义的规则“搅乱”,在接受端再将那些“搅乱”的数据字按相反的规则重新排列,使之恢复出原始次序。在DVB中是采用了卷积交织的纠错技术。61 数字电视中常用的纠错编码 RS码 RS码即里德-所罗门码,是Reed和Solomon与1960年提出来的,是在伽罗华域(Galois Field,GF)中运算的,是
57、BCH(Bose-Chaudhuri-Hocquenghem)码的一种。 BCH码是能够纠正多个错误的的纠错码,纠错能力强,构造方便,易于实现。 卷积码 卷积码非常适用于纠正随机错误,但是,解码算法本身的特性却是:如果在解码过程中发生错误,解码器可能会导致突发性错误。在卷积码的上部采用RS码块, RS码适用于检测和校正那些由解码器产生的突发性错误,其功能强大。 Turbo码 1993 年诞生的Turbo 码,对于当时欧洲的DVB 来讲太新了,对ATSC 更是如此。虽然如此,VLSI 的法国子公司ComAtlas 开发了单片Turbo 码编/解码器,它的运行速率达40Mb/s。该芯片集成了一个3
58、232 交织器,据报道其性能至少和传统的RS 外码和卷积内码的级联一样好。62 交织 在实际应用中,比特差错经常成串发生,这是由于持续时间较长的衰落谷点会影响到几个连续的比特,而信道编码仅在检测和校正单个差错和不太长的差错串时才最有效。为了纠正这些成串发生的比特差错及一些突发错误,可以运用交织技术来分散这些误差。实现交织和解交织可以使用卷积方式。 63 666 美国的HDTV( ATSC ) 1 概述 美国HDTV研究的指导思想据称首先是考虑美国电视接收机所有者和电视广播业者的利益以及美国的国情。在美国,地面电视广播迄今仍占其电视业务的一半以上,全国各地的地区电视台组成全国性的地面电视广播网。
59、各个地方台服务于特定的城乡,只有国家级的节目才用卫星等远距离手段来传送。因此,美国在发展高清晰度电视时首先考虑的是如何通过地面广播网(6MHz带宽)进行传输。 1988年9月,FCC(Federal Communications Commission:美国联邦通信委员会)作出决定:美国的新一代电视必须与现有NTSC接收机的收看性能相兼容,它的播出不能打乱现有电视频道的划分。这从根本上否定了美国采用MUSE方案的可能性。1990年3月FCC修改了HDTV的条件:取消了与NTSC接收机兼容的要求,但仍然坚持节目兼容和保持现有频道的划分。由于突破了“接收机兼容”的框框,可以充分利用数字图像压缩编码、
60、数字伴音压缩编码、数字多路复用和数字调制等先进技术,美国通用仪器(GI)公司于1990年5月首先提出数字HDTV系统Digicipher之后、美国又有三套数字HDTV方案相继问世,它们是DSC - HDTV、AD - HDTV、CCDC。 64 上述四套方案的图像压缩编码方法各有特色,但其基本工作原理与CCITT (国际电报电话咨询委员会,International Telegraph and Telephone Consultative Committee的缩写,源出于法文 Comit Consultatif International Tlgraphique et Tlphonique )
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024至2030年中国后泥板数据监测研究报告
- 2024至2030年中国FPC磁性夹具数据监测研究报告
- 2024年中国硅线石砖市场调查研究报告
- 2024年中国单相自耦调压器市场调查研究报告
- 2024年中国不锈钢子母轮病人车床市场调查研究报告
- 2024年广西百色市西林县乡镇事业单位招聘14人历年高频难、易点(公共基础测验共200题)模拟试卷有完整答案
- 基础教育中的儿童文学阅读观后感
- 宠物护理服务协议书中的特别免责条款
- 科普知识小灵通征文
- 医疗设备维护与使用安全管理制度
- 小儿体质中医调理方案课件
- 体外培育牛黄技术幻灯3课件
- 公路工程决算与工程竣工决算财务决算的关系
- 护士N2晋级N3职称评定述职报告PPT课件(带内容)
- 动物、矿物药分析课件
- 2019-2020学年江苏省徐州市九年级(上)期末数学试卷(常用)(精品)
- 精选天津高三生物知识点
- 心有灵犀猜词游戏常备词汇总结
- DB22∕T 5006-2018 装配式路面基层工程技术标准
- 《士兵突击》PPT课件(PPT 43页)
- JGJ107-2016钢筋机械连接技术规程培训宣贯
评论
0/150
提交评论