图像的编码技术_第1页
图像的编码技术_第2页
图像的编码技术_第3页
图像的编码技术_第4页
图像的编码技术_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章图像编码与图像通信数字图像处理安徽建筑

大学图像编码的研究背景

——

通信方式改变带来的需求信息传输方式发生了很大的改变通信方式的改变

文字+语音

图像+文字+语音通信对象的改变

人与人人与机器,机器与机器由通信方式和通信对象的改变带来的最大问题是:

传输带宽、速度、存储器容量的限制。带来的难题,也创造了机会:如何用软件的手段来解决硬件上的物理极限。图像编码的研究背景

——

通信方式改变带来的需求图像编码的研究背景

——

海量数据带来的需求数字图像数据量的庞大。图像的传输与存储,必须解决图像数据的压缩问题。彩色视频数据量分析对于电视画面的分辨率640×480的彩色图像(像素分辨率为24bit),每秒30帧,则一秒钟的数据量为:

640×480×24×30=221.12M播放时,需要221Mbps的通信回路。

彩色视频数据量分析实时传输:在10M带宽网上实时传输的话,需要压缩到原来数据量的0.045,即0.36bit/pixel。存储:

(按1张光盘可存640M计算)如果不进行压缩,1张CD则仅可以存放2.89秒的数据。存2小时的信息则需要压缩到原来数据量的0.0004,即:0.003bit/pixel。传真数据量分析如果只传送2值图像,以200dpi的分辨率传输,一张A4稿纸的数据量为:

1654×2337×1=3888768bit=3900K按14.4K的电话线传输速率,需要传送的时间是:270秒(4.5分)

图像通信系统模型图像信息源图像预处理图像信源

编码信道编码调制信道传输解调信道解码图像信源

解码显示图像9.1基本概念9.2图像压缩原理9.3图像的压缩编码第九章图像编码与图像通信一、图像编码压缩的必要性海量图像数据的存储和处理、通信的是现代信

息传输的难点。二、图像编码压缩的可能性组成图像的各像素之间,在行列方向存在一定的相关性。从信息论角度来看,描述图像信源数据是由有效信息量和冗余量两个部分组成,可以在保持图像原有信息量的同时,去除冗余量能够节省存储和传输中的开销,同时又不损害图像信源的有效信息。

9.1基本概念数据的冗余你的大学同学,李某某,将于明天晚上6点零5分在合肥的安徽建筑大学北区大门口等你。

(36×2+5=77个半角字符)你的同学将于明天晚上6点零5分在安徽建筑大学北区大门口等你

(29×2+2=60个半角字符)李某某将于明晚6点在安建大北区大门口等你

(18×2+1=37个半角字符)结论:只要接收端不会产生误解,就可以减少承载信息的数据量。数据冗余——

描述上的冗余描述方式:

1)这是一幅2×2的图像,图像的第一个像素是绿的,第二个像素是绿的,第三个像素是绿的,第四个像素是绿的。

2)这是一幅2×2的图像,整幅图都是绿色的。

3)一幅绿色2×2的图像。整理图像的描述方法可以达到压缩的目的。1234图像冗余

——

数据冗余的压缩

图像冗余无损压缩的原理RGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGB16RGB从16×3×8=284bits压缩为:(1+3)×8=32bits压缩比为:12:1图像冗余

——

数据冗余的压缩图像冗余有损压缩的原理36353434343434323434333730343434343434343435343431343434343434343434343434343434343434343434343434342534图像冗余

——

实际图像中的数据冗余

实际图像中冗余信息的表现图像冗余

——

视觉冗余的压缩图像的视觉冗余(彩色)

RG

B2488822×2×2=242=16,777,216(248,27,4)(251,32,15)(248,27,4)(248,27,4)9.2图像压缩原理由于一幅图像存在数据冗余和主观视觉冗余,所以压缩方式可以从这两方面着手开展。改变图像信息的描述方式,以压缩掉图像中的数据冗余。忽略一些视觉不太明显的微小差异,以压缩掉图像中的视觉冗余。9.3图像的压缩编码第一代压缩编码

八十年代以前,主要是根据传统的信源编码方法。第二代压缩编码

八十年代以后,突破信源编码理论,结合分形、模型基、神经网络、小波变换等数学工具,充分利用视觉系统生理心理特性和图像信源的各种特性。9.3图像的压缩编码像素编码变换编码预测编码位平面编码增量调制熵编码算术编码DCT变换DPCM调制第一代压缩编码其他编码行程编码9.3图像的压缩编码子带编码模型编码分层编码分形编码第二代压缩编码H.261标准(ITU-T,可视电话

,视频会议)H.263、H.26L标准H.264MPEG-1标准(视频会议、VCD)MPEG-2标准(通用活动图像及其编码)MPEG-4标准(通用活动图像及其编码)AVS(audio

video

coding

standard))一、行程编码(RLE编码)行程编码是一种最简单的,在某些场合是非常有效的一种无损压缩编码方法。虽然这种编码方式的应用范围非常有限,但是因为这种方法中所体现出的编码设计思想非常明确,所以在图像编码方法中都会将其作为一种典型的方法来介绍。

一、行程编码通过改变图像的描述方式,来实现图像的压缩。将一行中灰度值相同的相邻像素,用一个计数值和该灰度值来代替。一、行程编码

例:

aaaa

bbb

cc

d

eeeee

fffffff

432157

(共22×8=176bits)

4a3b2c1d5e7f

(共12×

8=96bits)压缩比为:176:96=1.83:1一、行程编码——传真中的应用方法传真图像中一般都是白色比较多,而黑色相对比较少。常常会出现如下的情况:

500W3b470w12b4w

3b3000w

上面行程编码所需用的字节数(最高)为:

2048<3000<4096

所以计数值须用12bit来表示

采用行程编码对于:500W3b470w12b4w

3b3000w

编码为:500,3,570,

12,4,

3,3000

编码位数为:12,12,12,12,12,12,12需要的数据量为:12×7=84bit一般情况下,只传输计数值即可。压缩比为:176:84=2.1:1行程编码——传真中的应用方法根据传真件的特点,对其进行改进。已知白色多黑色少,可对白色和黑色的计数值采用不同的位数。上例,重新定义:

白色:12bit,黑色:4bit

行程编码——传真中的应用方法编码为:500,3,570,12,4,3,3000

编码位数为:12,4,12,4,12,4,12所需字节数为:4×

12+3×

4=60bit比原来的RLE方式84bit减少了60bit,相当于又提高了压缩比为84/60=1.4:1。压缩比为:176:60=2.93:1

二维行程编码

——

基本概念二维行程编码要解决的核心问题是:

将二维排列的像素,采用某种方式转化成一维排列的方式。之后按照一维行程编码方式进行编码。二维行程编码

——

数据排序如下图所示,是两种典型的二维行程编码的排列方式:(a)(b)二维行程编码——例题例:数据量:64×

8=512(bit)

如果按照行扫描的顺序排列的话,数据分布为:130,130,130,129,134,133,129,130;130,130,130,129,134,133,130,130;

130,130,130,129,132,132,130,130;129,130,130,129,130,130,129,129;127,128,127,129,131,129,131,130;127,128,127,128,127,128,132,132;125,126,129,129,127,129,133,132;127,125,128,128,126,130,131,131二维行程编码——例题二维行程编码——例题一维行程编码后为:(3,130),(1,129),(1,134),(1,133),(1,129),(4,130),(1,129),(1,134),(1,133),(5,130),(1,129),(2,132),(2,130),(1,129),(2,130),(1,129),(2,130),(2,129),(1,127),(1,128),(1,127),(1,129),(1,131),(1,129),(1,131),(1,130),(1,127),(1,128),(1,127),(1,128),(1,127),(1,128),(2,132),(1,125),(1,126),(2,129),(1,127),(1,129),(1,133),(1,132),(1,127),(1,125),(2,128),(1,126),(1,130),(2,131)压缩比为:512:506=1.01:1数据量为:46×

(3+8)=506(bit)二维行程编码——例题如果按照列扫描的顺序排列的话,数据分布为:130,130,130,129,127,127,125,127;130,130,130,130,128,128,126,125;130,130,130,130,127,127,129,128;129,129,129,129,129,128,129,128;134,134,132,130,131,127,127,126;133,133,132,130,129,128,129,130;129,130,130,129,131,132,133,131;130,130,130,129,130,132,132,131二维行程编码

——例题一维行程编码为:压缩比为:512:462=1.11:1(3,130),(1,129),(2,127),(1,125),(1,127),(4,130),(2,128),(1,126),(1,125),(4,130),(2,127),(1,129),(1,128),(5,129),(1,128),(1,129),(1,128),(2,134),(1,132),(1,130),(1,131),(2,127),(1,126),(2,133),(1,132),(1,130),(1,129),(1,128),(1,129),(1,130),(1,129),(2,130),(1,129),(1,131),(1,132),(1,133),(1,131),(3,130),(1,129),(1,130),(2,132),(1,131)数据量为:42×

(3+8)=462(bit)二维行程编码——例题如果按照Z字扫描的顺序排列的话,数据分布为:130,130,130,129,127,127,125,127;130,130,130,130,128,128,126,125;130,130,130,130,127,127,129,128;129,129,129,129,129,128,129,128;134,134,132,130,131,127,127,126;133,133,132,130,129,128,129,130;129,130,130,129,131,132,133,131;130,130,130,129,130,132,132,131二维行程编码

——例题一维行程编码为:压缩比为:512:462=1.11:1(9,130),(1,129),(2,130),(4,129),(2,134),(1,132),(1,130),(1,131),(1,129),(1,127),(1,128),(2,127),(1,128),(1,127),(1,128),(1,127),(1,128),(1,129),(1,130),(1,132),(2,133),(1,129),(2,130),(1,129),(1,131),(1,132),(1,133),(1,129),(1,127),(2,129),(1,126),(1,125),(1,127),(1,125),(2,128),(1,126),(1,130),(2,131),(2,132),(1,130),(1,129),(3,130)数据量为:42×

(3+8)=462(bit)二、Huffman编码(熵编码)行程编码要获得好的压缩率的前提,有比较长的相邻像素的值是相同的。熵是指数据中承载的信息量。熵编码是指在完全不损失信息量前提下最小数据量的编码。二、Huffman编码为了达到大的压缩率,将在图像中出现频度大的像素值,给一个比较短的编码,将出现频度小的像素值,给一个比较长的编码。二、Huffman编码例:

aaaa

bbb

cc

d

eeeee

fffffff

432157如果不进行特殊的编码,按照图像像素的描述,需要的数据量为:

22×

8=176bits

二、Huffman编码——基本原理

aaaa

bbb

cc

d

eeeee

fffffff

432157按照熵编码的原理进行编码:

f=0e=10a=101b=1111c=11100d=11101编码规则是长短不一的异字头码,具有码字唯一可译性,能实时进行解码。(一)

基本原理

由:f=0e=10a=101b=1111c=11100d=11101

aaaabbbccdeeeeefffffff

10110110110111111111111111100111001110110101010100000000

数据量:7×

1+5×

2+4×

3+3×

4+2×

5+1×

5=56bit

压缩比为:176:56=3.14:1(二)编码基本步骤

首先求出图像中灰度分布的灰度直方图;根据该直方图,对其按照分布概率从小到大的顺序进行排列;每一次从中选择出两个概率为最小的节点相加,形成一个新的节点,构造一个称为“Huffman树”的二叉树;对此二叉树进行编码,得到Huffman编码码字。(三)实例

数据序列

aaaabbbccdeeeeefffffff

其概率分布为:

a:4/22b:3/22c:2/22d:1/22e:5/22f:7/22

概率大小的排序为:

dc

b

a

e

f

1/222/22

3/22

4/22

5/22

7/22例cbafe7/225/224/222/2210f=11e=01a=00b=101c=1001d=1000d1/223/226/2222/2213/229/223/2210101010

f=11e=01a=00b=101c=1001d=1000经Huffman编码后的数据为:1010101010001001001000100010000111111111101010101010101共7×

2+5×

2+4×

2+3×

3+2×

4+1×

4=53bit压缩比为176:53=3.32:1(四)Huffman编码在图像压缩中的实际应用对一幅图像进行编码时,如果图像的大小大于256时,这幅图像的不同的码字就有可能是很大,例如极限为256个不同的码字。如果采用全局Huffman编码则压缩效率不高。甚至有可能与原来的等长编码的数据量相同。

(四)Huffman编码在图像压缩中的实际应用

常用的且有效的方法是:将图像分割成若干的小块,对每块进行独立的Huffman编码。例如:分成8×8

的子块,可以大大降低不同灰度值的个数(最多是64而不是256)。(四)

Huffman编码在图像压缩中的实际应用8×

8分块的编码压缩比为2.12:116×

16分块的编码压缩比为1.64:1全图的编码压缩比为1.09:1三、预测编码(DPCM)利用图像信号的空间或时间相关性,用已传输的像素对当前的像素进行预测,然后对预测值与真实值的差(预测误差)进行编码处理和传输。三、预测编码-+f

’(m,n)e’(m,n)e(m,n)输入f(m,n)量化器Q预测器输出f’

(m,n)反量化器IQ预测器e(m,n)编码器输出预测误差的量化值三、预测编码预测器的设计主要是确定预测器的阶数N,以及各个预测系数。阶数N是指预测器的输出是由N个输入数据的线性组合而成。

三、预测编码X0X4X2X3X1×a0×a1×a2×a3X0X1X2X3根据图像信号的统计特性,可以通过一组合适的预测系数,使得预测误差e’(m,n)的分布大部分集中在0附近,经过非均匀量化,减少量化层,压缩图像数据。

安徽建筑工业学院最优线性预测假定当前待编码的像素为XN,其前面N个已编像素分别为X0,X1,….,XN-1,若用它们对XN进行预测,{ai/i=0,1,….N-1}表示预测系数,则可以写成预测误差为:

预测误差的均方值为

极小值

由此解出N个预测系数{ai

/i=0,1,….N-1},由于本方法求解时使预测误差的均方值极小,因此称为最佳预测系数。四、算术编码

算术编码方法:

将被编码的信源消息表示成实数轴上0~1之间的一个间隔,消息越长,编码表示它的间隔就越小,表示这一间隔所需的二进制位数就越多,码字就越长,反之,编码所需的二进制位数就越少,码字就越短。例:设图像信源编码用a、b、c、d表示,出现的概率分别为1/2、1/4、1/8、1/8。则信源编码符号集的所有符号的概率之和组成了一个完整的概率空间,用单位长度的矩形来表示。1/2、1/4、1/8、1/8(一)、编码过程对aabc进行算术编码1、编码前,指针指向码点0,指针活动宽度为1,即从0到1;2、编码a,指针指向新的码点0+1×0.011=0.011(前面的码点+前面指针活动宽度×a的码点),指针有效活动宽度1×0.1=0.1(前面的单位长度×a的概率);3、编码a,指针指向新的码点0.011+0.1×0.011=0.1001,指针有效活动宽度0.1×0.1=0.01;4、编码b,指针指向新的码点0.1001+0.01×0.001=0.10011,指针有效活动宽度0.01×0.01=0.0001;5、编码c,指针指向新的码点0.10011+0.0001×0.111=0.1010011,指针有效活动宽度0.0001×0.001=0.0000001。最后的码点值1010011就是对aabc进行算术编码的结果。1/2、1/4、1/8、1/8a0.0110.1、0.01、0.001、0.0010.011+0.1×0.011=0.1001(0.1×0.1=0.01)0.1001+0.01×0.001=0.10011(0.01×0.01=0.0001)0.10011+0.0001×0.111=0.1010011随着码字的增加,指针活动范围越来越小,也就越来越精确,编码的码字位数就越多,算法中只含有加法和移位运算,因此称为算术编码。(二)、解码过程①在0~1区间里定位,由于0.011<0.1010011<0.111,解得第一个码字为a;②码字序列减去前面的码点值,0.1010011-0.011=0.0100011,再乘以2,0.0100011×2=0.100011,因为在编码过程中子区间宽度乘以a的概率(0.1=1/2),0.011<0.0100011<0.111,解得第二个码字为a;③码字序列减去前面的码点值,0.100011-0.011=0.001011,再乘以2,0.001011×2=0.01011,因为在编码过程中子区间宽度乘以a的概率(0.1=1/2),0.001<0.01011<0.011,解得第二个码字为b;④01011-0.001=0.00111,再乘以4,0.00111×4=0.111,因为在编码过程中子区间宽度乘以b的概率(0.01=1/4),正好是c。算术编码效率比霍夫曼编码效率高,在H.263、H.264/AVC和AVS编码标准中用算术编码(基于内容的自适应算术编码)代替霍夫曼编码,提高编码效率。五、变换编码行程编码与Huffman编码的设计思想都是基于对信息表述方法的改变,属于无损压缩方式。虽然无损压缩可以保证接收方获得的信息与发送方相同,但是其压缩率一定有极限。因此,采用忽略视觉不敏感的部分进行有损压缩是提高压缩率的一条好的途径。

(一)

设计思想基于DCT变换编码是希望在接收方不产生误解的前提下进行一定的信息丢失。由前面所讲到的频域变换得到的启示,就是将低频与高频部分的信息,分别按照不同的数据承载方式进行表述。(二)基本概念将空域描述的图像经过某种变换,在变换域中进行描述,达到改变能量分布的目的,将图像能量在空域的分散分布变为在变换域的能量的相对集中分布,利于进一步处理,获得对图像信息量有效压缩。DCT变换:正变换:逆变换:其中:(三)DCT变换编码DCT变换DCT逆变换原图像量化取整1)编码过程:2)解码过程:压缩图像反量化取整压缩图像解压图像例:原图像为:DCT变换变换编码把统计上彼此密切相关的像素所构成的矩阵通过线性变换正交变换,变成统计上彼此较为相互独立,甚至达到完全独立的变换系数所构成的矩阵。由信息论可知,正交变换不改变信源的熵值,变换前后的图像的信息量并无损失,完全可以通过反变换得到原来的图像值。但经正交变换后的数据分布发生了很大的改变,系数向新坐标点集中。正交变换本身并不压缩数据,但它为新坐标系中的数据压缩创造了条件。DCT变换编码原图重建图六、静止图像编码又称方块截短编码,把一幅图像分成若干个子块,子块大小为N×N个像素,子块中第i个像素为Pi(i=1,2,…m),其亮度值为Xi;子块的代表性亮度即亮度级分量为a0,a1,用一个二元码Фi指明像素Pi编码后属于a0或a1,Φi称为分辨力分量。子块的亮度阈值为XT,像素Pi编码后的亮度值为Yi,

基本编码方法为

编码后的子块像素亮度为{Y1,Y2,…Ym}

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论