电视原理论文(共11页)_第1页
电视原理论文(共11页)_第2页
电视原理论文(共11页)_第3页
电视原理论文(共11页)_第4页
电视原理论文(共11页)_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数字电视(sh z din sh)中信号的处理(chl)摘要:数字电视(sh z din sh)的信号从发送、传输到接收的全过程都为数字化。本文简单的介绍了A/D转化,数据压缩,MPGE2的视频音频的压缩标准。以及信号调制的过程。关键字:A/D转化 数据压缩 MPGE2 信号调制数字电视是指电视的图像和音频用数字化信号发送。所以准确定义的数字电视除了指我们平时所说的数字电视接收机外,还包含了从发送、传输到接收的全过程。由电视台送出的图像及声音信号,经数字压缩和数字调制后,形成数字电视信号,经过无线介质或有线介质传送到数字电视接收机,然后通过数字解调和数字视音频解码处理还原出图像及伴音。一、将模

2、拟信号转换为数字信号将连续的模拟信号转变成数字信号是数字电视信号采集的必要步骤。在实际工作中,信号的取样是通过A/D转换芯片来完成的。通过A/D转换,将模拟信号x(t)变成数字信号x(nTs),电视信号的A/D转换一般采用脉码调制方式。为了保证数字化后的信号数据不丧失原信号的特性,采样频率应大于或至少等于信号截止频率的2倍。这就是著名的奈奎斯特(Nyquist)采样定理 对于二维图像信号,必须保证水平采样频率和垂直采样频率应分别大于图像在水平和在垂直方向上最高频率的2倍。而对于音频信号,采用的频率应大于音频信号的最大频率的2倍。一般质量音频信号的最高频率被限制在15kHz,所以目前有四种不同的

3、采样频率:48kHz;44.1kHz;44.056kHz;32kHz。采样结束后对采样信号进行量化使得幅度连续的抽样值进一步在幅度上离散化。便于利用有限长的数码来表示每个抽样点的幅度。量化所产生的误差会影响信号的质量,分析时,一般将它等效于随机杂波,称为量化噪波。当量化的位数n越大,量化的信噪比就越大,再生的图片质量就越高。对于音频信号的量化过程中所产生的噪声,为了使量化噪声转变为与输入不相关的白噪声,就要在输入的音频信号上加上一称为高频脉动信号的噪声再进行量化。接下来对样点幅度的量化值进行编码,将其转变为成二进制的数码。经抽样,量化,编码所得到的数字信号极为PCM信号。前置滤波器(fc=fs

4、/2)取样器量化器编码器f(t)f(n)模拟信号(一)图像编码数字电视中对于图像的处理是一个比较复杂的过程。数字电视是在模拟电视的基础上发展起来的,数字电视设备要和模拟电视设备长期共存,因此,在选择电视信号数字化参数时要考虑到数字电视设备的兼容性问题,使现存的模拟电视制式和数字电视能有最大程度的共同性。电视信号的数字化处理有数字复合编码和数字分量编码两种方式。数字复合编码是将复合彩色全电视信号直接进行数字化。复合编码的优点是码率低些,设备较简单,适用于在模拟系统中插入单个数字设备的情况 。采用复合编码时由抽样频率和副载频间的差拍造成的干扰将影响图像的质量 。它的缺点是由于数字电视的抽样频率必须

5、与彩色副载频保持一定的关系,而且各种制式的副载频各不相同,难以统一 。分量编码是将三基色信号R、G、B分量或亮度和色差(s ch)信号Y、(BY)、(RY)分别编码形成数字化信号分量编码的优点是编码与制式无关,只要抽样频率与行频有一定的关系,便于制式转换和统 一。由于Y、(RY)、(BY)分别编码,可采用时分复用方式(fngsh),避免亮色互串,可获得高质量的图像。在分量编码中,亮度信号(xnho)用较高的码率传送,两个色差信号的码率可低一些 ,但总的码率比较高,设备价格相应较贵。 图像的采样结构是指采样点在空间和时间上的相对位置。采样结构有正交结构和行交叉结构等几种,在数字电视图像采样中一般

6、使用正交结构,以有利于帧内和帧间信号处理。为保证采样结构为正交,要求行周期必须是采样周期的整数倍。图像亮度信号的采样应满足采样定理的要求,取样频率应大于视频带宽的2倍。为保证采样结构正交,采样频率应是行频的整数倍。为方便节目交流,亮度信号采样频率应兼顾NTSC制和PAL制,即应是这两种制式行频的最小公倍数的整数倍。为降低码率,采样频率的选择应尽量小。根据大面积着色原理,色度信号的带宽可以比亮度信号窄,同时考虑正交结构的要求,在数字电视中经常使用以下几种亮色采样格式:4:2:2格式;4:4:4格式;4:2:0格式;4:1:1格式。在4:2:2格式中,色差信号Cr和Cb的采样频率均为亮度信号采样频

7、率的一半,即:fCr=fCb=(1/2)fy=6.75MHz。也就是亮度采样频率和两个色差信号的采样频率之比为:fy:fCr:fCb4:2:2色差信号在水平(shupng)方向上的采样点数为亮度信号的一半,在垂直方向上的采样点数与亮度信号相同。这种格式(g shi)主要用于标准清晰度数字电视(SDTV)演播室中。在4:4:4格式(g shi)中,色差信号Cr和Cb的采样频率与亮度信号采样频率相同,即:fCrfCbfy13.5MHz。也就是亮度采样频率和两个色差信号的采样频率之比为:fy:fCr:fCb4:4:4。这种格式主要用于要求高质量的信号源的情况下,比如科学研究等。而4:2:0格式侧重于

8、传输链末端分配应用 ,MPEG2中使用的就是这种方式。4:1:1则应用于新闻、体育等对质量要求不高的记录环境。(二)音频编码 香农定理指出:如果信号的平均信息量小于所用传输通路的传输容量,则存在着正确的编码方式。所以要有效的利用传输通路,必须对知道传输通道的传输容量,以及信号的信息量,找出最佳的编码方式。 1、利用冗余度节约传输通路(1)预测编码它是从过去的采样值预测现在的才样值,并将真正的取样值与预测值之差进行编码传输的编码。(2)熵编码在数字化的信号中,小电平比大电平出现的机会要多。因此可以像莫尔斯电报码一样,对于出现概率较大的电平,采用短码,而概率较小的电平采用长码,从而进一步节约比特率

9、。2、利用数据压缩技术节约传输容量(1)瞬时压扩与准瞬时压扩利用人耳的听觉特性,在输入时将较宽的幅度范围进行压缩,而在输出的时候再进行扩张。压扩操作可以在A/D转换或者数字阶段进行。自适应PCM是一种根据输入信号幅度大小来改变量化阶大小的一种波形编码技术。这种自适应可以是瞬时自适应,即量化阶的大小每隔几个样本就改变,也可以使音节自适应,即量化阶的大小在较长时间周期里发生变化。(3)自差分PCM它结合了ADM的差分信号与PCM的二进制码的方法,是一种性能比较好的波形编码。它的核心想法是:利用自适应的思想改变量化阶的大小,即使用小的量化阶(step-size)去编码小的差值,使用大的量化阶去编码大

10、的差值,使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。二、数字信号的压缩 电视信号数字化后的数据量过大,使普通的存储器难以接受。而且,数码率太高使数字电视信号频带过宽,频道利用率太低,甚至无法容纳整个信号的传输。分量编码:4:2:2标准:R=165.9Mb/s 频带宽度B83MHz ;4:4:4标准:R=278.7Mb/s 频带宽度B140MHz;4次群的R为139.264Mb/s,可传话(chun hu)路1920路 。1920路电话(dinhu)传不了一套4:2:2的数字(shz)电视节目;用11套模拟电视节目换一套数字电视节目。号频带太宽,频带利用率

11、低,频率资源严重浪费。同时对电路要求高,设计复杂,维修困难,设备造价高。 所以对数字信号进行压缩显得很有必要。由于图像本身存在大量的冗余: 空间相关冗余时间相关冗余;符号相关冗余;结构相关冗余;知识相关冗余。以及人类的视觉冗余,所以对于图像信号的压缩时可行的。压缩的途径及方法:行、场逆程不传送,在接收端重新形成;亚奈奎斯特取样法,使得采样频率fs2fm,使混叠分量与亮度谱线交错;采用高效率的编码信源编码,去除电视信号中的冗余。图像压缩预测编码 利用某种数学模式对以前已知的相关数据进行运算,得出一个与当前传送样值相接近的预测值,进而把当前要传送的值减去预测值,得到一个误差值预测误差,将这个误差值

12、编码后传送出去。 当前样值预测值预测误差预测编码去除了电视信号中空间、时间上的冗余。 给出了良好的概率分布,为后面的压缩编码创造了条件。一维预测:参考样值仅与xN当前样值处于同一扫描行内的预测编码;二维预测:参考样值除了本行之外还和前一行或前几行的样值有关; 三维预测:参考样值除了本帧之外还和前一帧或前几帧图像的样值有关。 由于一、二维预测都是在同一帧内进行预测,所以也称为帧内预测编码;三维预测与前面的帧有关,所以也称为帧间预测编码。 变换编码变换编码中经常使用的是离散余弦变换DCT变换。DCT变换是把空间域上的信号变换到频率域上,使能量在空间域上分散分布的原信号变换后能量在频率域上相对集中到

13、某些少数区域内,即将空间域上的信号样值变换成频率域上的系数,经变换后的系数按频率由低到高分布。DCT变换的处理步骤:将一幅图象分成若干像块,每个像块的大小为88个像素。 对每一块像块进行DCT变换。对变换后的系数进行量化。进行之字形扫描(读出)和零游程编码像块样值数据(shj)f(x,y)为88的矩阵(j zhn),经DCT后的频域系数F(u,v)也为88的矩阵。此矩阵的左上角系数F00相当于像块中64个样值的平均直流成分(chng fn),其余的63个F(u,v)均表示64个样值中所含交流成分的系数 。经过变换后,较大的系数集中在直流分量及附近的低频区域,即信号能量主要集中在直流及低频区域的

14、少数变换系数上,高频区域的系数多为0或很小。统计编码(熵编码)统计编码是基于信号统计特性的编码技术。它的基本原理是按信源符号出现概率的不同分配以不同长度的码字(bit数),概率大的分配以短的码字,概率小的分配以长的码字。这样使最终的平均码长很小,总的数码率大大降低。经常使用的是霍夫曼编码。基本的步骤如下:将每个符号按其概率由大到小顺序排列起来。将最小的两个概率相加,并对其中较大的概率用“1”表示,较小的概率用“0”表示。反之也可,但赋值方式应保持一致。把求出的和值作为一个新的概率值再按重新排列。按照这样的步骤重复进行,直到概率加到1。分配码字。由概率为1处开始沿各点参加运算的分支线从后向前(从

15、右向左)逐一写出“0”、“1”的代号(从高位到低位写)直到各符号为止。得到的代码就是各信源符号的码字。反之也可,从符号到汇合点p1(从左到右),但代码的写出是从低位到高位。音频压缩声音信号客观统计规律。人耳听觉的生理、心理学因素根据声学理论,人耳存在着一个听觉的阈值,当某个频率的声音的强度(声强)小于某个特定的数值之后,人耳就听不见了,即当声音弱到人的耳朵刚刚可以听见时,我们称此时的声音强度为“听阈”。 在编码时,可以根据人耳的特性进行编码,减少冗余。可将时间上彼此相继的取样值归并成块;由掩蔽效应,人耳听不到的不传;对于人耳不能分辨方向的频率接近的高频音,不必再分声道,将多声道的高频音耦合到一

16、个公共通道;采用子频带编码,由每个子频带中的最小同听阈来确定各子频带取样值的必要的量化。声音压缩主要有两种编码方法:1、MUSICAM编码 MUSICAM-掩蔽型自适应通用子频带集成编码与复用。这种编码的方法属于子频带编码,它是用滤波器组将宽频带的声音信号的频谱分割为宽度均为750Hz的32个子频带。每个子带的量化和比特分配是利用人耳听觉的心理声学模型和音频信号统计特性的内在联系确定,并清除音频信号中的冗余和不相干部分,来实现有效的数据压缩。Layer1简单版本。在CD质量下,比特率为384Kb/s,压缩比为1:4。主要用于数字盒式录音磁带、VCD。Layer2标准版本,编码器的复杂度属中等。

17、CD质量下,比特率为192Kb/s左右,压缩比为1:8。在数字演播室、DAB、DVB、电缆和卫星广播ADR、计算机多媒体等数字节目的制作、交换、存储、传送中得到广泛应用。Layer3复杂版本。它是MUSICAM和ASPEC(自适应(声频)频谱感知熵编码)的混合编码。声音质量最佳。在CD质量下,使用的比特率为128Kb/s,压缩比为1:12。主要用于通信(tng xn)、尤其适用于ISDN(综合业务数据网)上传送广播节目、应用于Internet网的声音点播、MP3光盘存储等。2、杜比AC-3编码(bin m)AC-3是杜比实验室开发的数字音频编码技术,它提供5.1环绕立体声。由于AC-3系统(x

18、tng)编码灵活,在消费电子领域,目前大多数的电影制作都使用了该技术,美国等国家的数字电视系统也采用该技术作为音频编码标准。杜比AC-3也是一种感知型编码方式,它把整个音频频带根据人耳听觉特性分割成若干个较窄的频段,利用声心理学模型模拟人耳的听觉遮蔽效应,删除人耳所听不到或可忽略的部分,并采用窗函数处理、指数变换编码、自适应比特分配等压缩编码技术。AC-3采用基于改良离散余弦变换(MDCT)的自适应变换编码(ATC)算法。(三)MPGE2标准MPEG-2是一组用于视音频压缩编码及其数据流格式的国际标准。它定义了编解码技术及数据流的传输协议;制定了MPEG-2解码器之间的共同标准(MPEG-2编

19、码器之间尚无共同标准)。压缩音、视频的主要任务是去掉信源的音、视频中的信息冗余,提高信源的有效性。压缩完的音、视频数据比特流经复用系统处理复合成单路串行的比特流,复用系统把音频、视频、辅助数据的码流通过一个打包器打包(这是通俗的说法,其实是数据分组),然后再复合成单路。1. MPEG-2的系统的定义 MPEG-2系统是将视频、音频及其它数据基本流组合成一个或多个适宜于存储或传输的数据流的规范,如图1所示。由图1可见,符合ITU-R. 601标准的、帧次序为I1B2B3P4B5B6P7B8B9I10数字视频数据和符合AES/EBU标准的数字音频数据分别通过图像编码和声音编码之后,生成次序为I1P

20、4B2B3 P7B5B6I10 B8B9视频基本流(ES)和音频ES。在视频ES中还要加入一个时间基准,即加入从视频信号中取出的27MHz时钟。然后,再分别通过各自的数据包形成器,将相应的ES打包成打包基本流(PES)包,并由PES包构成PES。最后,节目复用器和传输复用器分别将视频PES和音频PES组合成相应的节目流(PS)包和传输流(TS)包,并由PS包构成PS和由TS包构成TS。显然,不允许直接传输PES,只允许传输PS和TS;PES只是PS转换为TS或TS转换为PS的中间步骤或桥梁,是MPEG数据流互换的逻辑结构,本身不能参与交换和互操作。由系统的定义,可知MPEG-2系统的任务。2.

21、系统(xtng)的任务 MPEG-2的标准由表2所示的8个文件组成,MPEG-2系统是其关键部分。MPEG以开放系统互联(OSI-Open System Interconnection)为目标,争取全球标准化。在详细规定(gudng)视音频编码算法的基础上,为传输和交换编码数据流(比特流,码流,流)创造统一条件。以利于接收端重建为指导,按照既定的参数给数据流以一定程度的“包装”。因此,MPEG-2系统应完成的任务有: 规定以包方式传输数据的协议; 为收发两端数据流同步创造条件; 确定将多个数据流合并和分离(即复用和解复用)的原则; 提供一种进行(jnxng)加密数据传输的可能性。3.系统的要点

22、根据数字通信信息量可以逐段传输的机理,将已编码数据流在时间上以一定重复周期结构分割成不能再细分的最小信息单元,这个最小信息单元就定义为数据包,几个小数据包(Data Packet)又可以打包成大数据包(Data Pack)。用数据包传输的优点是:网络中信息可占用不同的连接线路和简单暂存;通过数据包交织将多个数据流组合(复用)成一个新的数据流;便于解码器按照相应顺序对数据包进行灵活地整理。从而,数据包为数据流同步和复用奠定了基础。因此,MPEG-2系统规范不仅采用了PS、TS和PES三种数据包,而且也涉及PS和TS两种可以互相转换的数据流。显然,以数据包形式存储和传送数据流是MPEG-2系统的要

23、点。为此,MPEG-2系统规范定义了三种数据包及两种数据流:将MPEG-2压缩编码的视频基本流(ES-Elementary Stream)数据分组为包长度可变的数据包,称为打包基本流(PES- Packetized Elementary Stream)。广而言之,PES为打包了的专用视频、音频、数据、同步、识别(shbi)信息数据通道。节目流(PS)将具有共同时间基准的一个或多个PES组合(复合)而成的单一的数据流称为节目流(Program Stream)。PS包由包头、系统头、PES包3部分构成。包头由PS包起始码、系统时钟基准(SCR-System Clock Reference)的基本部

24、分、SCR的扩展部分和PS复用速率4部分组成。传输流(TS)将具有共同时间基准或具有独立时间基准的一个或多个PES组合而成的单一的数据流称为传输流(Transport Stream)。TS实际是面向数字化分配媒介(有线、卫星、地面网)的传输层接口(ji ku)。对具有共同时间基准的两个以上的PES先进行节目复用,然后再对相互可有独立时间基准的各个PS进行传输复用,即将每个PES再细分为更小的TS包。4.系统(xtng)的解码 由前述,MPEG-2系统要解决的问题是:1)系统的复用与解复用 MPEG-2采用时分多路复用技术,让多路信号在同一信道上占用不同的时隙进行存储和传输,以提高信道利用率。2

25、)声音图像要同步显示 由于时分多路复用中的位时隙、路时隙、帧之间具有严格的时间关系,这就是同步。区分各路信号以此为据。为了恢复节目,先对ES进行解码。声音、图像信号的重现需要同步显示,从而要求收发两端数据流要达到同步。为此,MPEG-2系统规范通过在数据中插入时间标志来实现:SCR或PCR为重建系统时间基准的绝对时标;在有效PS和TS产生前,已插入PES的DTS和PTS为解码和重现时刻的相对时标。3)解码缓存器无上下溢 MPEG-2系统是由视音频编码器、编码缓存器、系统编码器及复用器、信道网络编解码器及存储环境编解码器、系统解码器及解复用器、解码缓存器和视音频解码器构成。其中,编码缓存器和解码

26、缓存器延迟是可变的;信道网络编解码器及存储环境编解码器和从视/音频编码器输入到视音频解码器输出,延迟是固定的。这表明,输入视/音频编码器的数字图像和音频取样,经过固定的、不能变的点到点延迟后,应该精确地同时出现在视音频解码器的输出端。编码及解码缓存器的可变延迟的范围就应该受到严格限制,使解码缓存器无上、下溢。 为了(wi le)解决复用、同步、无溢出问题,需要定义1个系统目标解码器(STD-System Target Decoder)模型。用于解释传输流TS解码并恢复基本流ES时的过程;用于在复用器数据包交织时确定某些时间的边界条件。因此,每个相应的MPEG-2 TS必须借助于专门的解码器模型

27、来解码。下图为TS的系统(xtng)目标解码器模型。5、MPEG-2的编码(bin m) 编码是MPEG-2标准的核心内容之一,其涉及到MPEG-2视频流层结构、MPEG-2帧间编码结构、MPEG-2的类与级、MPEG-2运动估值等技术。MPEG-2视频流层结构为了便利于误码处理、随机搜索及编辑,MPEG-2用句法定义了1个层次性结构,用于表示视频编码数据。将MPEG-2视频流分为图像序列层(VSL-Video Sequence Layer)、图像组层 (GOPL-Group of Pictures Layer)、图像层(PL-Picture Layer)、宏块条层(SL-Slice Laye

28、r)、宏块层(ML-Macroblock Layer)、块层(BL-Block Layer)共6个部分,每层都有确定的功能与其对应。 6、MPEG-2视频压缩基础 码率压缩要从视觉对象、视觉生理、视觉心理3个方面入手,研究符合于人类视觉规律的视觉模型。由于视觉心理是1个很复杂的问题,难以得到其规律。因此,码率压缩只能在利用图像信号的统计特性和人类眼睛的视觉特性的基础上来进行。1) 利用图像信号的统计特性进行压缩 同一帧电视图像中相邻像素之间的幅度值相近,即同一行上的相邻像素之间幅值相近,相邻行之间同样位置上的像素幅值相近,体现了电视图像的空间冗余度;相邻两帧电视图像同一位置上像素幅度值相近,体

29、现了电视图像的时间(动态)冗余度每个像素所用bits数的多少表示了比特结构,多用的比特数为冗余量,体现了静态(比特结构)冗余度。 因此,为了清楚地了解空间冗余度、时间冗余度和静态冗余度三者之间的关系(gun x),可以通过电视图像信息的三维表示来说明。需要指出的是采用运动(yndng)补偿(MC)去除时间冗余度要进行160亿次的算术运算;采用离散余弦变换(DCT)和游程长度编码(RLC)去除空间冗余度要进行20亿次的算术运算;采用可变长度编码(VLC)去除静态(比特结构)冗余度要象“Morse Code”那样进行比特匹配。2) 利用人眼(rn yn)的视觉特性进行压缩 人眼对构成图像的不同频率

30、成分、物体的不同运动程度等具有不同的敏感度,这是由人眼的视觉特性所决定的,如人的眼睛含有对亮度敏感的柱状细胞1.8亿个,含有对色彩敏感的椎状细胞0.08亿个,由于柱状细胞的数量远大于椎状细胞,所以眼睛对亮度的敏感程度要大于对色彩的敏感程度。据此,可控制图像适合于人眼的视觉特性,从而达到压缩图像数据量的目的。例如,人眼对低频信号的敏感程度大于对高频信号的敏感程度,可用较少的bit数来表示高频信号;人眼对静态物体的敏感程度大于对动态物体的敏感程度,可减少表示动态物体的bit数;人眼对亮度信号的敏感程度大于对色度信号的敏感程度,可在行、帧方向缩减表示色度信号的bit数;人眼对图像中心信息的敏感程度大于对图像边缘信息的敏感程度,可对边缘信息少分配bit数;人眼对图像水平向及垂直向信息敏感于倾斜向信息,可减少表示倾斜向信息高频成分的bit数等。在实际工作中,由于眼睛对亮度、色度敏感程度不一样,故可将其分开处理。 为此,将单元分量RGB改变为YUV(或YCrCb)全分量。在编码时强调亮度信息,可去掉一些色度信息,如4:4:4变为4:2:2,码率由270Mbps降低到180Mbps。由上述可见,电视系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论