数字电视基础知识培训(有线电视网络技术培训班)100406课件_第1页
数字电视基础知识培训(有线电视网络技术培训班)100406课件_第2页
数字电视基础知识培训(有线电视网络技术培训班)100406课件_第3页
数字电视基础知识培训(有线电视网络技术培训班)100406课件_第4页
数字电视基础知识培训(有线电视网络技术培训班)100406课件_第5页
已阅读5页,还剩228页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2010年全疆广播影视系统有线电视网络技术培训班数字电视技术原理教学目的 数字电视技术作为广播电视的第二次革命,目前已广泛应用于广播电视系统的各个领域,从节目制作、播出的电视台、电台到节目传输的节传中心、网络公司等广电系统的各个台站都已实现广播电视的数字化。 本课程的目的是通过系统地讲解数字电视关键技术的理论知识,并结合实际应用,进一步提高工程技术人员数字电视理论水平,系统地掌握数字电视的组成结构和关键技术。 教学重点与难点1、数字电视的概念2、数字电视系统组成结构3、数字化的三要素4、信源编码技术(编码算法)5、传输流及复用技术6、信道编码技术8、调制技术 数字电视技术课程安排第1章:数字电

2、视概述 (计划时间0.5小时)第2章:数字电视编码技术(信源编码)计划时间(1.5个小时) 第3章:传输码流及其复用技术(0.5个小时)第4章:信道编码、调制技术(计划1个小时)参考书数字电视基本原理(机械工业出版社)数字电视基础 视频和音频系统的设计与安装(人民邮电出版社)本章要点了解数字电视的概念、优点。了解数字电视系统结构框图。了解数字电视的标准。了解数字电视的核心技术。模拟电视系统的特点 在电视信号的制作处理、控制调节、记录重放、调制解调、传输转播、接收显示等过程中,图像信号和伴音信号都是在时间轴上和振幅轴上连续变化的模拟信号。 模拟电视最明显的缺点是接力传输方式产生噪声,长距离传输的

3、信噪比恶化,使图像清晰度越来越受到损伤;发送传输设备中,放大器的非线性积累使图像对比度产生越来越大的畸变;相位失真的积累产生色彩失真,使“鬼影”现象愈来愈严重。同时,模拟电视还具有稳定度差、可靠性低、调整繁杂、不便集成、自动控制困难等。 (1)抗干扰能力强、无噪声积累。 模拟信号在传输的每个环节,都要加入噪声,如放大器,每级放大器的噪声都要加进去,放大后信号大了,C/N 低了。数字信号是一连串的“0”和“1”脉冲序列,在传输过程中,侵入的噪声可以通过再生的方法去除。所谓再生处理,就是收到信号后,不是直接放大,而是重新在有脉冲的位置制作一个形状完全相同的脉冲,恢复信号中脉冲的原样而清除了噪声。再

4、生是基带数字传输抗干扰的重要手段。其次,数字传输技术有非常有效的纠错方式,如我们使用的R-S 纠错,可以把误码率由10E-4 改善到10E-12。所以,我们收看数字有线电视时,主观感觉最为明显的是画面清洁,没有杂波、雪花。 (2)便于加密处理。 (3)便于存储、处理和交换。 (4)频谱资源利用率高:由于采用压缩率非常高的MPEG-2 压缩方法,使码率降低很多,加上采用高效率的调制方式,可以在一个8Mhz的带宽里传送6 套以上质量达到标准清晰度(SDTV)的节目。 (5)节省发送功率,覆盖范围广:数字信号对C/N 的要求也比模拟信号宽容。模拟信号C/N=43dB 时可以得到4 分的收看质量。数字

5、电视C/N=31dB 就可以满意收看。事实上,整个网络中,数字信号的功率电平就是以比模拟电平低10dB来传输的。 (6)设备便于集成化、微型化。 (7)便于构成综合业务数字网。 数字电视的优点数字电视设备和技术数字电视是一个大系统,从横向来说由以下四个方面组成:数字电视节目制作的设备主要有:数字摄像机、数字录像机、数字特技机、数字编辑机、数字字幕机和非线性编辑系统等;数字信号处理的技术有:压缩编码和解码技术、数据加扰和解扰、加密和解密技术等;信号传输的方式有:地面无线传输、有线(光缆)传输、卫星广播等;用于显示的设备有:阴极射线管显示器(CRT)、液晶显示器(LCD)、等离子体显示器(PDP)

6、、投影显示(包括前投、背投)等。显示器是最终体现数字电视效果或魅力的产品。 从纵向来说,是物理层传输协议、中间件标准、信息表述、信息使用、内容保护等一系列的系统问题。 其中信源编解码技术、传送复用技术、信道编解码技术、调制解调技术、中间件技术、条件接收、大屏幕显示技术。数字电视系统结构框图(3)信道编码和调制:信道编解码是负责传输误码的检测和校正的环节,调制解调是负责信号变换和频带搬移的环节;(4)传输信道:可以是广播电视系统(如地面、卫星或有线电视广播系统),也可以是电信网络系统,或存储媒介(如磁盘、光盘等);(5)接收机:包括解调、信道解码、解复用、视频、音频和各种辅助数据流的解码和终端显

7、示等。广电一体化的数字电视系统非线编录像机摄像机信号源切换台CASIEPG复用业务集成 接收卫星有线网地面无线接入互联网接入视频压缩编码音频压缩编码数字电视的主要功能免费基本数字电视业务按频道付费的数字电视业务(PPC等)VOD视频点播业务按次/时间付费的数字电视业务(IPPV、IPPT等)增强电视节目(EPG、电视广告等)数据广播业务其它业务(音乐、游戏、远程教育、双向互动业务)数字电视产业的发展趋势 随着HDTV技术、双向交互式数字电视技术、IPTV技术、移动电视与手机电视技术在数字电视领域的应用,目前的数字电视产业技术上可以实现以下功能:标准清晰度电视和高清晰度电视单向广播、双向交互固定

8、接收、移动接收和手持接收有线数字电视系统示意图 广播电视数字化与三网融合 国家“十一五”规划明确指出:要“加强宽带通信网、数字电视网和下一代互联网等信息基础设施建设,推进三网融合”。 三网融合的基础是下一代通信网、互联网和数字电视网。 传统电信网、计算机网主要指因特网和有线电视网正通过各种方式趋向于相互渗透和融合, 它涉及技术、业务、市场、行业、终端、网络乃至行业管制和政策等方面。三网融合表现为技术上趋向一致, 网络层上可以实现互联互通, 业务层上互相渗透和交叉, 应用层上趋向使用统一的协议, 行业管制和政策方面也逐渐趋向统一。 在未来通信中, 数字化是基础, 个性化、综合化是目标, 宽带化、

9、多媒化、软件化与智能化是实现的主要手段。 TV为核心的家庭网络结构ADSL modem2M4MADSLPOTSBluetoothBluetoothWebpadKitchen mateGames playerUSB1394Email phoneBluetoothSatelliticTerrestrialOpenworldPDRA/V OutRFSTBADSLPCHUBAPBluetoothEthernet100B/TA/Vin/outHi-FiD-VCRCamcorder(POTS)USBCameraPrinterCable习题什么是数字电视?与模拟电视比有哪些优点?简述数字电视系统的组成及其关

10、键技术?什么是三网融合?本章要点了解模拟信号和数字信号的特点各种电视信号的格式和简介熟悉模拟信号数字化的基本过程。熟悉电视图像信号的压缩编码方法。熟悉音频信号压缩编码方法。数字化的应用中发现的问题1、视频信号质量影响编码后的数字信号视觉效果。(数字量化导致的)2、数字化后视频信号受带外干扰。(抽样频率和干扰源频率接近导致的)3、码率压缩太低,造成画面出现块效应。4、视频和音频不同步口形对不上。2.1.2数字信号的特点数字信图2是数字信号,其特点是幅值被限制在有限个数值之内,它不是连续的而是离散的。 图2(a)是二进码,每一个码元只取两个幅值(0,A):图(b)是四进码,每个码元取四 (3、1、

11、1、3)中的一个。这种幅度是离散的信号称数字信号。2.1.3.模拟信号数字化 模拟信号的数字化过程称为脉冲编码调制PCM(Pulse Code Modulation) PCM的三个步骤是:抽样:在时间域离散化处理量化:在取值域离散化处理编码:在时间域和取值域都离散 抽样是指用每隔一定时间的信号样值序列来代替原来在时间上连续的信号,也就是在时间上将模拟信号离散化。 量化是用有限个幅度值近似原来连续变化的幅度值,把模拟信号的连续幅度变为有限数量的有一定间隔的离散值。 编码则是按照一定的规律,把量化后的值用二进制数字表示,然后转换成二值或多值的数字信号流。 在编码处理方式上分为两种:信源编码编码器中

12、实现信道编码调制器中实现 这样得到的数字信号可以通过电缆、微波干线、卫星通道等数字线路传输 。在接收端则与上述模拟信号数字化过程相反,再经过后置滤波又恢复成原来的模拟信号。编码器原理1.各种电视信号的格式和简介2.视频基本流结构3.取样频率和取样结构4.量化位数和量化等级的分配2.2视频信号数字化 彩色空间转换矩阵复合编码器A to DConv串行器RGB270MHzYR-YB-Y6.75MHz SampleRate for B-Y and R-Y13.5MHzSampleRate for Y串行器Clock X10ITU-R BT.601-2Serial DigitalComponent27

13、0Mb/secYR-YB-Y10 Bits ParallelITU-R BT.601-2Parallel Digital Component27MB/secSerial Digital Composite143Mb/sec (NTSC)177Mb/sec (PAL)Parallel Digital Composite PAL=17.7MHzNTSC=14.3MHzMultiplexed 27MB/secB-Y/Y/R-Y/Y/B-Y/Y 10 Bits Parallel4Fsc(PAL=17.7MHz)(NTSC=14.3MHz)ComponentAnalog Video(RGB)Analog

14、 CompositeVideo(PAL/NTSC)MPEG2ProgramEncoderDVDDigital Versatile (Video) DiskA to DConvAudio Color DifferenceComponentAnalog Video(Y, B-Y, R-Y)MPEG2 Protocol Transport StreamTransmissionChannelTxTransmissionChannelRxMPEG2ProgramDecoderMPEG2 Protocol Transport StreamTransmission Channel AnalysisSDH,

15、ATM, SONET or Modulated RF Signals.MPEG2 Protocol AnalysisPictureQualityAnalysisITU-R BT.601-2 Serial DigitalComponent 270Mb/secMPEG2 Protocol Program StreamDataDataAnalog CompositeVideo (PAL/NTSC)A to DConvA to DConv2.2.1各种电视信号格式的产生模拟分量模拟复合数字复合数字分量MPEG电视信号的简介 信号名称 信号简介模拟模拟复合信号2个色差信号经正交调幅后与亮度信号频率合成,

16、缺点是彩色分辨率低、有亮色串扰亮色分离信号Y/C2个色差信号经正交调幅后单独传输,避免了亮色串扰,缺点是彩色分辨率低。俗称“S端子信号”模拟分量Y/Cr/Cb信号亮度Y、色差Cr、色差Cb独立处理和传输,彼此之间无串扰,彩色分辨率可以达到亮度的1/2模拟分量R/G/B信号R、G、B三基色信号独立处理和传输,彼此之间无串扰,而且都有最高的分辨率数字数字复合信号由模拟复合信号直接A/D变换而来。早期在从模拟复合系统直接向数字系统过渡时使用。信号质量受模拟复合信号源质量的限制。数字分量信号可由模拟分量Y/Cr/Cb信号经A/D变换得到。既适用于从模拟复合系统直接向数字系统过渡,也是全数字电视系统及全

17、数字设备的标准信号源。NTSC和PAL两种制式的参数比较三基色原理自然界中的任何颜色有R、G、B三种颜色按照不同比例组成。为了实现黑白电视和彩色电视的兼容,将信号编码为亮度信号Y和两个色差信号Cr和Cb。:参数PALNTSC扫描625行525行行帧15625Hz15734Hz帧频25Hz29.97Hz场频50Hz59.94Hz彩色副载波4.43MHz3.58HzMPEG-2的编码流程输入一个I帧、P帧或B帧;在B帧或P帧的情况下进行运动预测补偿;进行88像素的DCT变换;变换系数被量化(量化级安排依赖于可用的比特率);完成变字长编码,实现比特率的缩减。MPEG-2的解码流程是MPEG-2的编码

18、流程的反过程。DCT 量化游程编码与VLC编码反DCT,反量化与帧贮存反馈I-画面 输出 (固定速率) 之字形扫描参考画面信息4:2:0输入缓存+_P或B-画面 MPEG-2的编码器简化框图 2.2.2视频基本码流(ES)层次结构分成6个层次:视频序列层(Sequence),图像组层(GOP),图像层,像条层,宏块层,像块层 视频序列实际上是节目的随机进入点;而GOP则是视频编辑的随机进入点;图像(或帧)是编码处理的单位;像条是用于同步的单位;宏块是运动补偿处理的单位;像块则是DCT处理单位。 图像组 88 图像组 宏块条宏块 块图像组图像视频序列视频基本码流ES层次结构宏块结构 (a) 4:

19、4:4 (b) 4:2:2 Y CB CR Y CB CR 5 6 1 23(c) 4:2:0Y CB CR4 图像序列层: 在起始码后是序列头,包括了图像尺寸,宽高比,图像速率等信息。在序列头后面总是跟着包含附加数据的序列扩展数据。为了确保能在不同的时间随时进入视频序列,MPEG-2允许重复发送序列头。序列层结束在序列结束码(SEQ EC)。 图像组层:图像组是指相互间有预测和生成关系的一组图像。在起始码后面是可选的GOP头,包括了时间信息,但这一信息并不是解码中实际使用的信息,即便丢失,解码也可以继续进行。分成图像组的一个目的是在同一序列内可随时进入不同的图像。一般情况下0.5s内必须传一

20、次I帧,因此对于PAL制,一个GOP通常包含12帧,常见的结构为IBBPBBPBBPBB.由于B帧为未来帧,作为预测参考帧,因此视频码流的传输要有利于解码器的解码,在传输B帧之前,传I帧或P帧。图像层:它包括了不同种类编码的图像。在MPEG2中图像分成三种编码类型:帧内编码I帧;双向预测编码的图像称为B帧;前向预测编码的图像称为P帧。 I帧只进行帧内压缩,是作为预测基准的独立帧,具有较小的压缩比。由I帧前向预测产生的P帧具有中等压缩比,并与I帧一起成为B帧的预测基准。由此产生的B帧则具有最高的压缩比。 逐行扫描的图像只能是帧格式,隔行扫描的图像可以使帧格式,也可以使场格式。 像条层:图像层下面

21、是像条层(slice)。每一个像条包括一定数量的宏块,其顺序和行扫描顺序一致。像条可以从一个宏块行(16行宽)的任何一个宏块开始。在MPEG-l中,像条可以包括多个宏块行,但在MPEG-2MPML中一个像条必须在同一宏块行中起始和结束。一个像条至少应包括一个宏块。像条是最低的比特流级别,即一旦因误码失步可以根据起始码重新同步。起始码对以上各层都是相同的。宏块层 :像条层下面的是宏块层(Macro block),宏块层已是整个结构的最下层。最前面是宏块层说明,表示用什么编码模式,后面是运动矢量以及1616位数据。像条的第一个宏块中包含了绝对运动矢量值,而其他宏块包含的是前面宏块运动矢量的差值。一

22、个宏块包括亮度分量和空间位置上相对应的色度分量。MPEG-2定义了三种宏块结构。这三种结构为:4:2:0宏块;4:2:2宏块和4:4:4宏块,分别包括6,8,16个像块,实际上对应于三种亮度和色度的采样格式。 4:2:2中每隔一个像素对色差信号采一次样。 4:2:0每隔一行对两个色差信号采一次样,每采样行中,每隔一个像素对两个色差信号采样一次。尽管像块是最低一层,但从数据结构来说除了有块结束码外,已无结构描述码,因此把宏块作为结构的最下层。像块层: 在MPEG-2中,块“Block”可以是88样值,既可称为像块,也可以是88 DCT系数或重组数据,这时应称为系数块或数据块。它是亮度信号、两个色

23、差信号之一。 所有上述各个层次都与一定的信号处理有关。如视频序列实际上是节目的随机进入点;而GOP则是视频编辑的随机进入点;图像(或帧)是编码处理的单位;像条是用于同步的单位;宏块是运动补偿处理的单位;像块则是DCT处理单位。2.2.3 抽样 把模拟信号变成数字信号时,先用一个周期为T的窄脉冲流对模拟信号幅度进行抽取, 把时间上连续变化的模拟信号变成时间上离散的信号。 打个比方:气温是逐渐变化的,每时每刻都在变化,因而它是随时间连续变化的模拟量。但观测气温不必每分每秒都测量,隔一定时间测一点画在坐标图上,连一条线,就表示了气温的变化。如果时间间隔合适,这条线的形状与连续不间断测量的曲线形状会基

24、本吻合,即,用离散量可以表示连续的模拟量。这种间隔测量的方式,叫做在连续变化的模拟量上的取样。这是把模拟信号数字化的第一步。 图(a)是时间上连续变化的模拟信号f(t);图(b)是抽样脉冲序列;图(c)是抽样后的信号fs(t)(d)(e)(f)相应的频谱。抽样频率的选择原则 首先的原则是能基本如实的代表原来的连续模拟量。间隔太远了要漏去重要的信息,比如测气温,最高气温出现在每天的14:00,取样间隔太大,偏偏漏掉了14:00,就会发生大错。因而,取样间隔与信号性质有关,要符合奈奎斯特定理:即取样频率要大于信号最高频率的二倍。这样抽取的样值就包含了原来模拟信号的全部信息而不遗漏。 取样的实现也简

25、单,让信号经过一个电子开关,开关每秒钟接通13.5M 次(当然每次接通时间都很短),就实现了在模拟信号中每秒取13.5M 个离散了的样值。这些样值,不再是连续的了。取样的结果,仅是把模拟信号进行时间上的离散。 抽样频率fS的选择要考虑以下3个条件:(1)满足奈奎斯特准则:fS 2fm ,不产生混失真 。fs=(2.22.7)fm; fm =5.8-6 MHz;fs12.7613.2 MHz(2)需要有正交的样值结构:应取行频的整数倍使抽样样点位置形成正交结构使行与行、帧与帧之间的样点位置都能对齐,称为正交结构。fs=mfH, m为整数。(3)兼顾不同的扫描制式。2.2.4量化 量化:将抽样的样

26、值变为幅度上离散的有限个二进制信号。 抽样使时间上连续的信号变为离散信号,量化又使幅度上的连续变为离散。图中Q代表量化间距;n, n+1,代表量化电平的级序。例如,n指的位置表示量化电平为nQ。 量化间距都相等,称为均匀量化或线性量化。 量化后的样值电平与原来的模拟信号电平之间有误差,称为量化误差。 量化过程是一个有损处理过程,会引入量化失真,在重构图像上增加块效应。技术参数标清电视SDTV高清电视HDTV分辨率每帧576有效行每行720有效像素每帧1080有效行每行1920有效像素宽高比4/316/9扫描方式50场/秒隔行扫描信号源标准:50场/秒隔行扫描;制作和交换:24帧/秒逐行扫描图像

27、码率(不压缩)270Mbps取样频率 X 量化比特数 = 13.5MHz X 10bit = 135Mbps 2个色差信号的码率为2 X 6.75MHz X 10bit = 135Mbps SDTV的总码率为 亮度信号码率 + 2个色差信号码率 = 135Mbps + 135Mbps = 270Mbps1.5Gbps亮度信号的码率为 取样频率 X 量化比特数 = 74.25MHz X 10bit = 742.5Mbps 2个色差信号的码率为 X 37.125MHz X 10bit = 742.5Mbps HDTV的总码率为 亮度信号码率 + 2个色差信号码率 = 742.5Mbps+742.5

28、Mbps= 1485Mbps标清电视和高清晰度电视信号的比较 串行数据接口SDI 串行数字复合信号的图像质量仍受制于彩色电视编码。SDI信号指符合ITU-R BT601建议的数字视频信号。我国已将该建议等同为国家标准GB/T17953-2000,其中规定了比特并行和比特串行两种接口信号格式。 并行数字分量信号因传输距离短及采用25针“D”型接插件连接,给系统检修带来诸多不便,实用性不强。因此串行数字分量信号已成为当前数字演播室普遍采用的格式。 对SDI信号而言,它是一种10bits字长的复用数据流,以27MS/s的符号率传送,即它的传输速率为270Mb/s。2.3数字电视的信源编码1.数字视频

29、信号压缩的必要性2.常用的数字视频编码方式3.MPEG2标准2.3数字电视的信源编码2.3.1数字视频信号压缩的必要性电视信号数字化后易与计算机结合,因而有很多优点,如方便存储和复制、信号处理多样化、提高信号质量和抗干扰能力强。问题:数据量大,要求大容量存储器,传输数据率高(270Mb/s)。 4:2:2采样,10bit量化的一帧图象数据量为:(13.510 + 2 6.75 10)/25 =10 .8Mb=1.35MB 1GB硬盘存:1GB/(1.35MB*25帧)= 29.6s的节目 结论:要使数字电视信号适合于实际存储和传输,必须压缩数据量,降低传输数据码率。 前提:压缩后图象质量保证满

30、足要求。 数字视频信号压缩的可行性视频数据压缩的可行性来自两个方面:一是视频信号中存在大量冗余度可供压缩,并且这种冗余度在解码后还可无失真地恢复;二是利用人的视觉特性,在不被主观视觉察觉的容限内,通过减少表示信号的精度,以一定的客观失真换取数据压缩。视频信号的编码方式: 复合编码(composite video):将彩色全电视信息直接编成PCM码,变成一个数字复合电视信号 分量编码(component video):将亮度信号Y,色差信号R-Y和B-Y分别编码成三个数字分量电视信号 二者比较: “复合编码”与电视制式有关 “分量编码”与电视制式无关 在节目后期制作中: “复合”需解码 “分量”

31、无需解码 传输时:“复合”由于频分复用,产生亮,色串扰 “分量”采用时分复用,无亮,色串扰2.3.2压缩编码方法 1) 利用图象时间的相关性与时间冗余度的压缩 电视图象中相继各帧对应象素点的值往往相近或相同,具有时间相关性,找出这些相关性就可以减小信息量,从而实现与时间有关的压缩。 2) 利用图象空间的相关性与空间冗余度的压缩 一幅图象相邻各点的取值往往相近或相同,具有空间相关性,找出这些相关性就可以减少信息量,从而实现与空间有关的压缩。 3)利用事件的统计特性与统计冗余度的压缩 对经常出现的数据用短码组表,对不经常 出现的数据用长码组表示,则最终用于表示这一串数据的总码位就减少了。从而实现与

32、统计冗余有关的压缩。 4)利用人眼的视觉特性与视觉冗余度的压缩 人眼的视觉特性:对亮度信号比对色度信号敏感 对低频信号比对高频信号敏感 对静止图象比对运动图象敏感 对图象中水平和垂直线条比对斜线条敏感 包含在色度信号、图象高频信号和运动图象中的一些数据并不能对增加图象相对于人眼清晰度作出贡献,而被认为是多余的数据,这就是视觉冗余度。 压缩视觉冗余度就是去掉那些相对人眼而言是看不到的或可有可无的图象数据。 基本的图象压缩编码技术 1) 分类 冗余度压缩技术,无损伤压缩技术,无失真,数学上可逆。即它是可还原的。 信息量压缩技术,有损伤压缩技术,有失真,数学上不可逆。即它是不可还原的。2)基本压缩编

33、码方法 预测编码(DPCM)差分脉冲编码调制 DPCM不直接传送图象样值本身,而是对实际样值与它的一个预测值之间的差值进行再次量化、编码。 这种方法可消除图象信号的空间相关冗余帧内预测)和时间相关冗余(帧间预测)。利用象素的相关性还可进一步减小差值。运动预测I 帧B 帧P 帧全帧编码利用I帧的运动矢量对球编码只有运动被编码球取自I帧和P帧(双向)膝取自P帧运动矢量运动矢量加于图像上 离散余弦变换(DCT) 变换编码的基本思想是,把空间域描写的图象变换到一个正交的变换域简单描写。空间域的一个NN个象素的像块正交变换后,在变换域变成NN变换系数块。原象素块的象素间相关性很强,变换系数近似统计独立,

34、能量集中在直流和少数低频系数上,降低相关性(冗余度)。 DCT(Discrete Cosine Transform)是数码率压缩的一种常用的变换编码方法。DCT是先将整体图像分成NN 像素块,然后对NN 像素块逐一进行DCT变换(时域到频域的变换,利用频谱的特性传输图像信息)。由于多数图像高频分量较少,相应图像高频分量的系数经常为零,加之人眼对高频成分的失真不太敏感,所以可用更粗的量化。因此传送变换系数的数码率,要大大小于传送像素所用的数码率。到达接收端后通过反离散余弦变换回到样值。虽有失真,但人眼是可以接受的。去空间相关性变换编码系统框图分块DCT变换量化编码解码反量化 反DCT变换消除分块

35、输入数据接收输出信道DCT 分块90 blocks ( 720 pixels )72 blocks ( 576 pixels ) 8 pixels1 DCT blockY signal in one frame8 pixels88亮度块的DCT变换、量化例 0 i 7 0 u 7j7av7 量化 DCT变换 0 u 7 0 u 7v798 92 95 80 75 82 68 5097 91 94 79 74 81 67 4995 89 92 77 72 79 65 4793 87 90 75 70 77 63 4591 85 88 73 68 75 61 4389 83 86 71 66 73

36、 59 41 87 81 84 69 64 71 57 3985 79 82 67 62 69 55 37591 106 -18 28 -34 14 18 3 35 0 0 0 0 0 0 0 -1 0 0 0 0 0 0 0 3 0 0 0 0 0 0 0 -1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 -1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 40 10 -2 2 1 0 0 0 3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

37、 0 0 0 0 0 0 0 0 0 0 0 0 0 b c88亮度块的DCT反变换、反量化处理例 d 反量化后的DCT系数 e 重建的像素样值f 重建样值与原始值之差 591 110 20 32 24 0 0 0 36 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 98 97 90 81 80 79 67 50 97 96 89 80 79 78 66 49 95 94 87 78 77 77 64 47 93 92 8

38、5 76 75 74 62 45 90 89 82 74 72 72 59 43 88 87 80 71 70 69 57 40 86 85 78 70 68 68 55 39 85 84 77 69 67 67 54 38 0 5 5 1 5 3 1 0 0 5 5 1 5 3 1 0 0 5 5 1 5 2 1 0 0 5 5 1 5 3 1 0 1 4 6 1 4 3 2 0 1 4 6 0 -4 4 2 1 1 4 6 1 4 3 2 0 0 5 5 2 5 2 1 -1de f DCT变换 例922-150-25-5-6-12-6-1-208-10624133-29312-32-1-

39、20-191-3-633320-5-4212000-4651421-11-24-1143010230-3-1DCT52100000000000000000000000000000000000000000000000000000000-158-4-100100DCT 之字形扫描是从左上角的直流(DC)系数开始,沿之字形路径扫描到右下角,将量化后的二维系数转换为一维数据序列,以便后面进行熵编码。 优点:大多数图象信号的DCT系数从左上角到右下角,由低频到高频排列,因此采用之字形扫描得到的一维数据序列中,会出现很多连零的数据,有利于游程编码。尤其在序列最后,如果都是零,可用专门符号结束,或记为EOB

40、。之字形(Zig-Zig)扫描231-74-12-1-1-2-10-102-5101000-137000000-400-100000-1-1000000-11000000000000000000000Zig-zag 扫描231-74-12-1-1-2-10-102-5101000-137000000-400-100000-1-1000000-11000000000000000000000EOB ( End Of Block )EOBEOB is transmitted instead of zeros 游程长度编码(Runlength Encoding) 是指一个码可同时表示码的值和前面有几个

41、零。在用之字形读出方式情况下,出现连零的机会较多,尤其在最后,如果都是零,在读到最后一个数后只要给出“块结束”(EOB)码,就可以结束输出,从而节省很多码率。 通常,DCT系数量化之后,都采用之字形方式读出。 霍夫曼(Hoffman)编码 霍夫曼(Hoffman)编码(属于统计编码)是可变字长编码(VLC: Variable-Length Coding)的一种,相当于对概率大的符号给短码,对概率小的符号给长码。霍夫曼编码示例符号 概率 码字 码长X1 0.20 1 0 01 2X2 0.19 0 0.39 00 2 X3 0.18 1 1 1 111 3X4 0.17 0 0.35 1 110

42、 3X5 0.15 1 0 0.61 101 3 X6 0.10 1 0 0.26 100 4 X7 0.005 1 0 0.11 10001 5 X8 0.005 0 0.01 10000 5对于霍夫曼编码,首先应知道信源符号的概率分布,而各种信源符号的概率分布是不同的。通常是利用查表的方法,根据信源数据符号直接查出相应的码字。所用的码表是根据概率分布并对大量典型图像素材进行统计制成的。1.信源编码标准的简介2.MPEG 2视频编码的“级”与“类”3.图像数据压缩的概念和方法4. MPEG.2视频编码的主要特点2.3.3 MPEG 2视频压缩编码简介信源编码标准1)第一代视频压缩编码主要包含

43、:静止图片的JPEG;活动图像的MPEG - 1 (用于VCD、光盘存储、视频监控等) 、MPEG - 2 (用于数字电视、有线电视、卫星电视以及HDTV 等) ;面向通信的H. 261 (用于ISDN视频会议等) 、H. 263 (用于POTS (传统电话业务)视频电话、桌面视频电话、移动视频电话等) 。(2)第二代视频压缩编码主要包含:静止图片的PEG2000 (用于移动通信中的静止图片、数字照相与打印、电子商务等) ;活动图像的MPEG - 4 (用于交互式视频、因特网、移动视频、2D /3D计算机图形等) ,适用于多媒体技术的MPEG - 7 和MPEG - 21; 基于H. 363和

44、MPEG - 4基础上改进、融合并适用于多媒体通信的H. 264。 第一代视频编码是基于图像基本单元像素、基于信源客观统计特性的压缩编码。而第二代视频编码不仅基于信源客观统计特性,更重要的是基于对象、基于语意内容的主、客观冗余。其编码的基本单元不再是像素,而是包含纹理、形状和运动的3类信息的对象。它具有可操作、可编辑、可选择等一系列交互多媒体技术的特点。 a)MPEG-2的类与级 1、MPEG-2有4种输入格式,称为级(Levels或等级)。从有限清晰度的VHS(家用录像系统)质量图像直到HDTV图像,每一种输入格式编码后都有一个相应的范围。 除了在源格式提供这种灵活性之外,MPEG-2还有不

45、同的处理方法,称为类(profiles或层面),每一类都包括压缩和使用方法的一个集合。不同的类意味着使用不同集合的码率压缩工具。 2、MPEG2共分类,较高的类编码更精细,而且每升高一类将提供前一类没有使用的附加工具。 甲)简单类(SP) 乙)主类(MP) 丙)信噪比可分级类SNRP 丁)空间可分级类SSP 戊)高级类(HP) 己):格式 在主类上的类是信噪比可分级类(SNRP)、空间可分级类(SSP)、高级类和4:2:2格式。这允许将编码的视频数据分为基本层和另一个或更多的上层信号。基本层表示编码图像的基本数据但代表的图像质量较低。上层信号则可用来改进信噪比或清晰度。 b)图像的4个级别:

46、甲)低级(LL:Low Level)的输入格式的像素是ITU-R 601格式的1/4,即35224030 (代表图像帧频为每秒30帧,每帧图像的有效扫描行数为240行,每行的有效像素为352个)或35228825,相应编码最大输出码率为4M b/s。 乙)主级(ML:Main level):输入格式完全符合ITU-R Rec.601格式,72048030或72057625,输出最大码率除高级类和4:2:2外是15Mb/s,高级类主级是20Mb/s,4:2:2 是50Mb/s。 丙)高1440级(H14L:High1440 Level):是每行1440有效像素的高清晰度格式。除高级类 外,最大输

47、出码率为60Mb/s,相应的高级类输出码率为80Mb/s。 丁)高级(HL):输入是每行1920有效像素的高清晰度格式,输出最大码率为80Mb/s,相应的高类输出码率为100Mb/s。MPEG-2简化的编、解码方框图MPEG-2的编码流程是:输入一个I帧、P帧或B帧;在B帧或P帧的情况下进行运动预测补偿;进行88像素的DCT变换;变换系数被量化(量化级安排依赖于可用的比特率);完成变字长编码,实现比特率的缩减。MPEG-2的解码流程是MPEG-2的编码流程的反过程。以下分别示出了MPEG-2编码器和解码器的简化方框图。DCT 量化游程编码与VLC编码反DCT,反量化与帧贮存反馈I-画面 输出

48、(固定速率) 之字形扫描参考画面信息4:2:0输入缓存+_P或B-画面 MPEG-2的编码器简化框图变字长 解码反之字 形扫描反量化反DCT运动 补偿I-画面运动矢量帧贮存P或B-画面解码的像素 MPEG-2的解码器简化框图视频数字化的应用中发现的问题1、视频信号质量影响,编码器输出效果。(数字量化导致的)2、数字化后视频信号受带外干扰或电源干扰等。(抽样频率和干扰源频率接近导致的)3、码率压缩太低,造成画面出现块效应。(采样点数太少,码率1、图象信号质量对数字编解码设备处理信号的影响存在某电视台编码节目的微分增益较大,在7-12%左右大于指标要求的低于5%的要求。微分增益不达标,将影响信号的

49、色饱和度,比如影响某一个颜色的深浅程度。色度延时也大于指标要求的20n秒的要求(在更换不同解码器时测试结果也不同,20-40n秒左右。)色度延时不达标,影响信号画面出现彩色波纹。解码器输出的接入增益比标准彩条信号偏高,大于30-40mv左右,可能造成传输画面比实际画面发亮。视频信号频响差,5MHz以上信号电平普遍低3-4dB左右。视频电平群时延和增益的频率响应色同步载波的响应多波群测试每个频率包的响应严格保证图像信号标准幅度是节目播出和传输质量的最基本的要求。国家标准规定了全电视信号幅度的标准值是1Vpp,当用l000750彩条信号作为基准信号时,图像信号峰值白电平幅度为0.7V20mV;同步

50、脉冲幅度为0.3Vpp0.009,色同步脉冲幅度为0.3Vppi0.009;黑电平与消隐电平差为0-0.05V。标准的一行视频图如下:电视节目中的视频幅度是随着图像内容而变化的,图像亮度信号瞬间峰值电平不应超过770mV,迭加色度信号后的图像信号最高峰值电平不应超过800mV,底电平以050mV为正常。在PAL制电视信号中,彩色信号是调制在频率为4.43MHz的色副载波上,而色副载波又是迭加在亮度信号上的,色副载波的幅度决定彩色信号的饱和度。在不同的亮度电平上,色度信号的幅度发生变化,导致色饱和度发生变化。 有线数字电视前端中,将本地节目基带信号通过编码器编码后送入有线数字系统中。通过一段时间

51、的测试,在有线数字系统机顶盒解码时,发现某一套本地节目色彩失真、发白、图像没有层次,怀疑编码器工作不正常,调整编码器参数和更换编码器都没有改善。 根据编码器技术指标要求,编码器复合视音频输入时,亮度幅度在700mV 100mV(峰-峰值)、行同步幅度在300mV 40mV(峰-峰值)范围内。 通过对该节目视频信号进行波形的监测,发现该视频信号幅度为1.3Vp-p左右,同步头电平在0.20.25V,色同步信号幅度也较高,接近于0.4V,电平动态范围已严重超出技术标准要求,为此,通过调整播出设备中的视频幅度,消除了该现象。以下是产生该现象原因的具体分析过程。 数字编码设备对模拟基带信号数字化处理一

52、般需要完成采样、量化和编码三个步骤。根据ITUR BT.601取样标准,亮度信号和色差信号分别采用8比特量化即256个量化级的均匀量化,之后进行线性PCM编码。同时,为了防止过载切割把视频信号调整在1V(峰-峰值),并为了避免图象信号直流分量变动所引起的信号动态范围的扩大,在量化前进行了嵌位。但是,视频信号因陡峭的前置滤波器和孔阑校正电路造成的过冲以及嵌位过程中的过度过程等引起的视频电平的不稳定性而造成过载,对256级量度信号的量化级16为黑电平,量化级235代表白电平,上下端留下的量化级作为防止超越动态范围的保护带。同时,色差信号也分配225个量化级,上下端分别留15、16个量化级,第128

53、个量化级为黑电平。 标准PAL100/0/75/0彩条信号波形中,白色信号的亮度幅度为700mv、色度幅度为0mv;黄色信号的亮度幅度为465mv、色度幅度为470mv;青色信号的亮度幅度为368mv、色度幅度为664mv;依次类推。256量化级中,图象各种颜色都规定为各自标准的量化级。根据ITU-R BT.601比色法标准中指定的100%颜色条分量信号电平,算出了相应的100/0/100/0彩条信号和100/0/75/0彩条信号的亮度、色差信号的量化级别 (参考数字电视基础-视频和音频系统的设计与安装第二版368页)。 100/0/100/0彩条信号和100/0/75/0彩条信号的亮度、色差

54、信号的量化级别表 幅度比例 信号分量白色黄色青色绿色品红红色蓝色黑色100%EY 幅度700620491411289209800EY量化级235210170145106814116100%ECB幅度0-36084-277277-843600归一化幅度0-35081.6-269269-81.63500ECB量化级128161544221410224012875%ECB幅度0-269.263-207.7207.7-63269.20归一化幅度0-262.561.2-202202-61.2262.50ECB量化级044148641921082120100%ECR幅度043-393-350350393-

55、430归一化幅度038.3-350-312312350-38.30ECR量化级128140162822824011612875%ECR幅度032.2-294.7-262.5262.5294.7-32.20归一化幅度028.7-262.5-234-234262.5-28.70ECR量化级1281194453203212137128在数字系统中超过动态范围的过载性导致的限幅等效于模拟信号的限幅和限幅后的信号的数字变换。在进行量化时,视频信号幅度超过允许值的20、30时,亮度和色度信号幅度同时偏高于ITUR BT.601取样标准所要求电平范围,为此,超出的部分将进行切割,且对切割后的灰度级发生严重失

56、调的1Vpp内图象信号,量化器按照异常量化级的信号进行编码,如,黄色信号的亮度幅度接近于甚至超过白色信号的亮度幅度时,按白色信号的量化级进行编码,为此,黄色信号变成深黄,依次类推,将青色信号的亮度幅度量化为黄色信号量化级编码。在解码时,解码器也遵循ITUR BT.601取样标准,将编码器过来的已失调的量化的数字信号认为正常的信号进行D/A转换。结果,无法恢复正常色彩,造成白限幅、过调制,画面高亮度区呈现光点闪烁、白区边缘拉黑道、无画面的层次感等信号失真现象。 对以上故障,除了要求节目录制过程中,严格按照视频信号标准进行节目的录制,对高亮度信号进行相应的幅度降低措施,在播出设备上,对幅度不标准的

57、信号的最小和最大幅度偏移维持在限定范围内, 确保视频电压幅度不会超出量化器的工作范围。尽量避免白限幅而造成色彩失真、发白,甚至图象没有层次。2、为什么数字化视频信号受干扰?数字编码器的抗干扰能力非常重要,视频带外信号通过数字化处理后进入到带内信号中产生干扰。数字编码处理过程为对复合模拟视频信号进行亮度、色度信号的分离处理后进行亮度、色度信号的分别抽样、量化和编码。由于PAL制式视频信号带宽在0-5.75MHz,为此选择的视频亮度滤波器频谱特性为允许在0-6.75Mhz的信号无损通过,带外抑制度在8MHz频谱处为40dB。应用中发现数字编码设备与广播短波发射台在一起时,虽然短波频率在8MHz-

58、15MHz左右,由于短波信号发射功率较强,超过编码器带外抑制能力。为此,输入的视频信号中除了有用的视频信号外还携带着脉冲接近或超过视频幅度的短波信号。根据柰奎斯特抽样原理,亮度抽样率为13.5MHz,抽样频谱可覆盖至6.75MHz到20MHz处。编码器抽样处理后将这带外的无用信号一并回折到视频通带内,从而导致了编码器中出现干扰。为此,对此类干扰要求机房接地达到标准,视频处理设备抗干扰性好,编码器器输入滤波器性能要好,或者根据地区的特殊性选择抽样率更高的编码器来解决。 1.取样频率、量化位数2.音频编码的必要性和可行性3.MUSICAM编码方式2.4音频信号数字化数字音频信号特点 在数字传输时,

59、声音信号数字化也包括取样、量化和编码。由于声音信号的带宽、动态范围及信杂比的要求等与图像信号相比有很大的区别-它能感觉极小的声音失真,而且又能接受极大地动态范围,所以声音信号的取样频率标准及量化电平数均与图像信号不同。一般大于图像信号的量化比特。另外,由于电视伴音在与视频单通道传输时采用了时分复用方式,故在选择声音的取样频率参数时,还应考虑与图像信号的扫描行频、场频及取样频率的关系。 音频信号取样频率选择原则也是根据取样定理,即=Fs2Fm。演播室内的高保真音频信号Fm一般为20kHz,传输用或普通音频信号Fm一般为15kHz。为了防止取样频谱混叠,通常取样频率选为:Fs=(2.1-2.5)F

60、m。在复合编码方式中,为了满足声音与图像时分复用,音频取样频率选为行频的整数倍,由于PAL/SECAM和NTSC制的行频最小公倍数的2倍为4.5MHz,为此音频取样频率选为:Fs=4.57715=44.1kHz。在分量编码方式中,亮度信号取样频率为13.5MHz,而且13.5MHz=3 4.5MHz,即与各种电视制式行频成整数倍关系,音频取样频率为:Fs=13.5MHz33754=48kHz。 音频信号的量化和码率由于人耳对声音强度比较敏感,因此音频信号量化常取16或32比特。对于音频信号,两个子帧组成一个帧,第一个子帧包含来自通道A中的取样值,或立体声中左声道的取样值;第二个子帧则为通道B或

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论