第7章图像编码1数字图像处理及分析基础 国防科技大学_第1页
第7章图像编码1数字图像处理及分析基础 国防科技大学_第2页
第7章图像编码1数字图像处理及分析基础 国防科技大学_第3页
第7章图像编码1数字图像处理及分析基础 国防科技大学_第4页
第7章图像编码1数字图像处理及分析基础 国防科技大学_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数字图像处理与分析基础数字图像处理与分析基础第七章第七章 图像编码技术图像编码技术黄爱民黄爱民 安向京安向京 骆力骆力中国水利水电出版社中国水利水电出版社新世纪电子信息与自动化系列课程改革教材新世纪电子信息与自动化系列课程改革教材ISBN7-5084-2930-3数字图像处理与分析基础第七章第七章 图像编码图像编码 Image Codingn压缩目的压缩目的n基本原理基本原理n基本方法基本方法n图像编码标准图像编码标准数字图像处理与分析基础7.1 编码的目的编码的目的n减少数据量:存储量、传输时间例1:一般彩色电视信号,YIQ色空间中各分量的带宽分别为4.2MHz、1.5MHz、0.5MHz,

2、采样原理,采样频率=2倍原始信号频率,量化为8bit,1秒钟的数据量为(4.2+1.5+0.5)*2*8=99.2MBits,约为100Mbits/S,1GB的CD-ROM存1分钟的原始电视节目。HDTV数据量约为1.2GBits/S,1GB存6秒钟HDTV。彩色静止图像:3*1024*1024*8=3MB,数字图像处理与分析基础图像通信的一般过程图像采集信源编码信道编码信道解码信源解码图像显示或存储图 像通信数字图像处理与分析基础基本概念n信源需要传输或存储的原始信息称为“信源”。包括语音、图像、视频等信息源。“信源编码”的主要任务是利用一定的编码方法降低数码率,即比特率。 n信道信息传输的

3、通路;信息在传输中要增加可靠性、抗干扰能力,就要进行“信道编码”,此时要进行奇偶校验等检测,需要增加比特数。抗干扰能力越强,增加的比特数就越多。 数字图像处理与分析基础图像编码压缩要研究的主要内容n信源压缩方法与信源模型有关语音,线性模型n比特率采样速率(每秒样本数)乘以样本精度(比特/样本) n逼真度准则或失真度准则平方误差准则 基于主观感受的逼真度准则数字图像处理与分析基础4、编码准则、编码准则输入图像f(x,y),输出g(x,y),x,y=0,1,2,N-1,(1)均方误差: 101022),(),(1NxNyyxfyxgNMSE(2)均方根信噪比:2/11010210102),(),(

4、),()(NxNyNxNyrmsyxfyxgyxgSNR(3)压缩比=原图像编码每个象素平均所需bit数 / 压缩后象素平均所需bit数保真度准则:主观保真度准则、客观保真度准则。客观保真度准则:图像均方误差、均方根信噪比。数字图像处理与分析基础主观保真度准则评分评价说明1优秀图像质量非常好2良好图像质量高,观看舒服,有干扰但不影响观看3可用图像质量可接受,有干扰但不太影响观看4刚可看图像质量差,干扰有些影响观看,希望改进5差图像质量很差,干扰严重妨碍观看6不能用图像质量极差,不能使用数字图像处理与分析基础7.2 图像压缩的基本原理n1、压缩的根据压缩的根据:图像数据量图像数据量信息量信息量I

5、=D-du, I(信息量),D(数据量), du(冗余量)保留意义完全的信息,支持查询与检索。冗余(redundancy)信息和不相干(irrelevancy)的信息。数字图像处理与分析基础压缩率用n1表示一幅图像原来的数据量,n2表示压缩后的数据量,压缩率 Cr 定义为:Cr= n1/ n2(7-2)冗余量 Rd 可表示为:Rd=1-1/Cr(7-2)数字图像处理与分析基础7.2 .2数据冗余的类型n编码冗余n像素间冗余n心理视觉冗余数字图像处理与分析基础1、编码冗余(信息熵冗余)n“码本”是表示一组信息或一组事件的一系列符号(如字母、数字等)。其中对每个信息或事件所赋予的符号成为“码字”,

6、每个码字含有的基本符号的个数称为“码长”。n设l(rk)为码字rk的码长,在二进制表示时称为“比特数(bits)”,Pr(rk)为码字的出现概率。若编码系统共有L种不同的码字,则系统可获得的平均比特数为:10)()(LkkrkavgrprlL数字图像处理与分析基础n自然码,如表示256个不同的灰度级,就用8bits的等长的二进制数据来编码每一个灰度级,这样系统的平均码长就是8bits。n定理:当l(rk)根据pr(rk)降序设计成变长编码的形式时,平均码长最小。数字图像处理与分析基础等长编码与非等长编码比较rkpr(rk)编码1L1(rk)编码2L2 (rk)编码3L3 (rk)r0=00.0

7、200030021111016r1=1/70.250013012002r2=2/70.06010310211104r3=3/70.1601131100411004r4=4/70.0810031101411014r5=5/70.21101311104012r6=6/70.03110311110061111006r7=10.1911131111016102平均码长33.782.8数字图像处理与分析基础2、像素间冗余(1)空间冗余:规则物体和规则背景的表面物理特性具有相关性。空间冗余时间冗余(2)时间冗余:序列图像像素的灰度级和颜色之间具有相关性,随机场模型数字图像处理与分析基础(3)结构冗余:纹理

8、结构(4)知识冗余:人脸的固定结构。空间冗余、时间冗余又称统计冗余,将图像信号作为概率信号时的统计特性。数字图像处理与分析基础3、心理视觉冗余n视觉系统非线性、非均匀n分辨率约26,图像量化28n动态图像的视觉延迟现象数字图像处理与分析基础7.2.3 编码方法的分类n由压缩数据恢复的图像与原始图像的差别 “可逆压缩”:编码的数据可完恢复出原始图像n“熵编码”(Entropy Coding), “无失真编码”、“无误差编码”(Error Free Coding) 、无噪声编码”(Noiseless)、“冗余度压缩 ”(Redundancy Reduction)、“数据紧缩”( DATA Comp

9、action Lossless Bit-Preserving)。“不可逆压缩”: “有失真编码”(lossy Coding),采用这类编码方法,由编码数据恢复的图像与原始图像有区别,图像编码产生的误差与编码的方法以及压缩比等因素有关。数字图像处理与分析基础1、“第一代”编码技术n三大经典编码方法“熵值编码”“预测编码”“变换编码”。数字图像处理与分析基础“熵值编码”n(概率匹配编码)n主要针对无记忆信源,根据信息码字出现概率的分布特征,寻找概率与码字长度间的最优匹配,从而进行压缩编码,又称为统计编码。n游程编码、Huffman编码和算术编码等多种。n熵值编码是信息编码的基础,也是各种实用算法的

10、一个基本组成部分。数字图像处理与分析基础“预测编码”n根据数据的统计特性得到预测值,然后传输图像像素与其预测值的差值信号,使传输的码率降低,达到压缩的目的。n预测编码方法简单经济,编码效率较高,是语音的基本编码方法。n预测编码分为线性预测编码、非线性预测编码。根据处理的信息维数不同,又可分为行内编码(一维)、帧内编码(二维)以及帧间编码(三维)。n预测编码是视频图像压缩的基础。数字图像处理与分析基础“变换编码”n进行某种正交变换来消除像素间的相关性。n可分为最佳变换编码,如K-L变换,以及次优变换编码,如离散余弦变换(DCT)等。n在实施时,辅助以区域变换编码、门限变换编码。n基于离散余弦变换

11、的静止图像压缩标准jpeg和运动图像压缩标准mpeg等一系列标准。数字图像处理与分析基础“自适应编码”n从本质上来说就是一种“混合编码”方案,它在不同阶段根据图像的不同特征将变换编码、预测编码、无误差编码等各种方案的优势综合利用起来。n关键是识别图像的特征。n多种方案的复用可实现多级压缩,已经可以得到较大的压缩比了,现有的图像压缩标准JPEG、MPEG等在设计中就利用了这种思路。数字图像处理与分析基础2、第二代编码技术n要充分利用人的视觉生理、心理特征和图像信源的各种特征,实现从“波形”编码到“模型”编码的转变,以便获得更高压缩比。n向量量化编码、基于分形的编码、基于模型的编码、基于区域分割的

12、编码、基于神经网络的编码以及识别编码和基于知识的编码等。数字图像处理与分析基础3、过渡编码技术n充分利用人类视觉特性的“多分辨率编码”方法,如子带编码、金字塔形编码和基于小波变换的编码。n这类方法原理上仍属于线性处理,属于“波形”编码,可归入经典编码方法,但它们又紧密结合人类视觉系统的特性,因此可以被看作是“第一代”编码技术向“第二代”编码技术过渡的桥梁。数字图像处理与分析基础子带编码技术:n子带编码是一种高质量、高压缩比的图像编码方法,它早已在语音信号压缩编码中获得了广泛的应用。n其基本依据是:图像信号可以划分为不同的频域段,人眼对不同频域段的敏感程度不同。例如图像信号的主要能量集中在低频区

13、域,它反映图像的平均亮度;而细节、边缘信息则集中在高频区域。n子带编码的基本思想是利用一滤波器组,通过重复卷积的方法,将输入信号分解为高频分量和低频分量,然后分别对高频和低频分量进行量化和编码。解码时,高频分量和低频分量经过插值和共轭滤波器而合成原信号。n进行子带编码的一个关键问题,是如何设计共轭滤波器组,除去混叠频谱分量。数字图像处理与分析基础小波变换编码技术n小波变换编码技术是目前的研究热点。小波变换它不仅为多分辨分析、时-频分析和子带编码建立了统一的分析方法,而且提供了更合理的表示框架。n目前小波变换在图像编码中的应用研究主要课题有:正交小波基的选择(小波包法)、小波变换与各种量化方式的

14、结合、小波变换在分形法中实现初级分形、小波变换用于运动估值等方面。n小波变换法处于图像编码当前首选方法的位置,一方面,它有快速算法,实现起来简单方便、速度快,可暂时弥补“第二代”编码技术的不足;另一方面,它有着先进的分析方法,可有效提高现有技术的水平,实现突破性进展。数字图像处理与分析基础4、第三代编码技术n在第三代编码方案中主要提出了基于运动模型(VR)的编码概念,主要针对提高电视会议、可视电话等的图像效果。数字图像处理与分析基础编码算法PCM预测编码变换编码付立叶变换斜变换小波变换统计编码Huffman编码算术编码游程编码其他编码静态图像编码二值图像编码子带编码轮廓编码图7-1 常用图像编

15、码算法分类固定自适应固定自适应离散余弦变换KL变换沃尔什哈达马Harr变换LZW比特平面逐渐浮现逐层内插方块抖动视频图像内插运动补偿条件补充运动估计帧间预测帧内预测帧间编码矢量量化数字图像处理与分析基础7.2.4 简单的图像编码模型信源PCM信息源编码器信道编码器通讯线路或存储媒体 图像通讯和编码压缩原理框图压缩编码器信宿PCM解码器信道解码器压缩解码器编码部分解码部分数字图像处理与分析基础(1)信源编码器和信源解码器原始图像映射变换(信息抽取)映射后数据量化器符号编码器(码元分配)码字 图像数据压缩的一般过程(信息源)符号解码器(原始符号表示)反映射器(信息恢复)输出图像 图像数据解压缩的一

16、般过程(信息源)映射器:映射器:将输入数据从象素域变换到另一个域中。量化器:量化器:将每个映射数据舍入为数目较少的可能数值。均匀、非均匀数字图像处理与分析基础(2)信道编码器和信道解码器汉明(Hamming)编码:正确的码字之间的最小距离要大于一个给定值码字以二进制形式表示,比特(bit)D(101),(110)=2汉明:将3个比特位的冗余加到4比特的码字上,任意两个正确码字间的距离为3,可发现和校正错误。数字图像处理与分析基础例:4bit(b3b2b1b0)7bit(h1h2h3h4h5h6h7)07160124250132330231 bhbhbbbhbhbbbhbhbbbh7654476

17、32275311hhhhchhhhchhhhch1、h2、h4分别是比特区h3b2b0、b3b1b0、b2b1b0的偶校验位。信道解码器对已建立偶校验的比特区进行检查,由c1、c2、c4指出错误,从校正后的h3h5h6h7得到正确值。数字图像处理与分析基础7.3 编码器和典型的编码方法编码器和典型的编码方法编码器编码器:给每一量化器的输出分配一个码字。等长码、非等长码、唯一可译码、瞬时码编码器X=x1,xnW=w1,wnA=a1,an图7-4 编码器的描述X:信号源;A:构成码字的符号集,a称为码元;W:代码信号源:信号源:象素灰度、行程长度、方向码、预测误差、变换系数、上一过程的结果,等等。

18、数字图像处理与分析基础码字的形式n二进制码:码元数等于2时的代码称为二进制码。n等长码:如果码字集合W中的所有码字都具有相同的长度,就是等长码。如自然二进制码。码长不等的就称为非等长码,如Huffman码。n唯一可译码(单义码):如果任何长度的一段代码只能分割成唯一的一个码字集合,则为唯一可译码。如 W=0,10,11,对代码序列S=100111000,只能分割成10、0、11、10、0、0。数字图像处理与分析基础n在编码中形成的代码集合必须是单义码,否则没有实际使用价值。n非续长代码:码字集合中的任何一个码字都不是另一个码字的续长。如W=0,10,100,111就不是非续长代码,其中“100

19、”是“10”的续长。非续长代码一定是单义码,但单义码不一定是非续长代码。如 W=0,01是单义码,但又是续长代码。非续长代码可以用树型结构构造。数字图像处理与分析基础构造非续长码n设A=0,1,W=w1,w2,w3,w4w40w1w2w4w3001110(a)w1w2w311001(b)图7-5非续长代码的树型图设置根节点,从根节点开始分枝,每条分枝代表一个码元0或者1,取其中任意一个分枝的节点代表w1。 对没有被选作代码的节点再分枝,选择其中任意一个分枝的节点作为代码w2。 依次类推,至所有节点都代表一个码字结束。数字图像处理与分析基础4、按照分枝顺序构成各码字:w1=0,w2=10,w3=

20、110,w4=111。各码字的长度为:n1=1,n2=2,n3=n4=3。树形图说明,被选作代码的节点不会再有分支,因此形成的必然是非等长的非续长代码。 数字图像处理与分析基础7.3.2无噪声编码定理无噪声编码定理nShannon的信息论如何构造码字,才能得到最短的平均码长?对特定的信息源,平均码长有下限吗?n随机事件提供的信息量,与事件的出现概率有关。 数字图像处理与分析基础)(EI称为E的自信息。1p(E)(即事件总是发生),那么,0)(EI结论:确定的事件没有提供任何新的信息,而偶然发生的事件,提供的信息量比较大。设有随机事件E,它的出现概率是p(E),那么它包含的信息量为:)(log)

21、(1log)(EPEPEI如果数字图像处理与分析基础那么信息源X=xj , j=1,2,3,n提供的信息量定义为:njjjnjjjxPxPxIxPEIEXH11)(log)()()()()(njjxP11)(H(X)称为信息的“熵”,它定义了信息的平均信息量(每单位字符)。熵值总是非负的,当构成信息源的所有事件的概率都相等时,熵值最大。如果对数的底是2,那么信息熵的度量单位就是比特(bits per symbol)。数字图像处理与分析基础其中H(x)为信号的信息为熵,L(x) 为编码的平均长度。这种编码方法的冗余度为如果某种编码方法产生的平均字长等于信息源的熵,那么它就没有任何冗余信息,达到了

22、编码的最优状态。这时要求:某种编码方法的编码效率定义为 )()(xLxH1)(log)(jjxPxL数字图像处理与分析基础“Shannon(香农)第一定理”n“无噪声编码定理”,也就是“Shannon(香农)第一定理”。p信息的码字长度与它的出现概率成反比,大概率事件的码长较短,小概率事件的码长较大,严格按照这个规律构造非等长码,就可以获得概率统计意义上最优的编码。p平均码长的下限是,对二进制编码而言,只有当所有符号的出现概率等于2的负整数幂时,(如0.5,0.25等),才能达到下限。n信息的出现概率在实际应用中很难获得,一般是用它的频率代替。数字图像处理与分析基础7.3.3几种典型的统计编码

23、方法n根据信息熵的理论,将信息出现的概率模型引入编码模型中,得到概率意义下最优编码n最常用的霍夫曼码对数码移位码算术编码等。数字图像处理与分析基础1、霍夫曼码、霍夫曼码(Huffman)基本思想:统计信号的概率分布模型,然后按信号出现的概率赋予信号不同的码长。出现概率大的信号赋予较短的码字,出现概率小的,赋予较长的码字。数字图像处理与分析基础算法n(1)统计输入信号的概率(如对一幅图像或M幅同种类型图像进行灰度分布概率统计),得到N个不同概率的信息符号;n(2)将N个输入信号按照它们的出现概率由大到小排列;n(3)合并两个概率最小的信号,形成一个新的信号。新信号的概率是这两个信号的概率和。这时

24、概率减少为N-1个;n(4)在形成新概率集合后重新排列;n(5)重复第4步,至只剩两个概率序列为止;n(6)以二进制码元(0,1)赋值,形成非续长代码树。注意,最好按统一规律分配码元,这样解码时更易于理解。n(7)霍夫曼代码的产生从根节点开始,反向进行。数字图像处理与分析基础n霍夫曼码举例霍夫曼码举例例:H-CP110.42000.330110.1401000.15010100.066010110.04110010.60.30.20.10101001L=k=1,M kP( k)=1(0.4)+2(0.3)+3(0.1)+4(0.1)+5(0.06)+5(0.04)=2.20 bitsH= -

25、k=1,M P(ak)log P(ak) = -0.4log(0.4)-0.3log(0.3)-0.1log(0.1)-0.1log(0.1)-0.06log(0.06)-0.04log(0.04)=2.14 bits数字图像处理与分析基础霍夫曼码是最佳编码: 按给定的概率分布构成的最短的代码-与概率分布相匹配的编码。编码效率: = H(x)/ L(x)= 2.14/2.20=0.97缺点: 1、强烈依赖于概率结构,工作量大。2、码字变化大,结构复杂,实现困难。数字图像处理与分析基础2、B码(对数码)概率服从乘幂定律时最佳, Pk=k-r, k=1,2,.,M, rN两部分构成:一半延续比特C

26、、一半信息比特B(采用长度增长的自然码),CBC=0/1,C同,则还是同一码字;C变,则新的码字开始。Bn:每一延续比特,有n个信息比特。例1:B1:c0 c1B2:c00 c10 c11 c01例2:1 8 5B1: 001010110100数字图像处理与分析基础3、S码(移位码,shift code)两部分: CS,基本码S、移位信息C。Sn中n表示基本码字的长度。2n中有2n -1个基本码字,一个移位信息。例:S2码1:C1 00 2:C2 01 3:C3 104:C4C1 1100 5:C4C2 1101 6:C4C3 1110 7:C4C4C1 111100特点:易于实现,对单调减小概率相当有效。数字图像处理与分析基础 算术编码是60年代初期Elias提出,由Rissanen和Pasco首次介绍了它的实用技术,在信源概率分布比较均匀情况下,它的编码效率高于哈夫曼编码(5%),没有变换编码对数据输入分块的要求,在JPEG扩展系统中用它来取代哈夫曼编码。 4、 算术编码算术编码(Arithmetic)数字图像处理与分析基础1、算术编码原理n将被编码的信源消息表示成实数轴01之间的一个间隔(Interval)(也称子区间),消息越长,编码表示它的间隔就越小,表示这一间隔所需的二进制位数就越多。信源中连续符号根据某一模式生成概率的大小来缩小间隔。数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论