数字图像处理-第四章1讲_第1页
数字图像处理-第四章1讲_第2页
数字图像处理-第四章1讲_第3页
数字图像处理-第四章1讲_第4页
数字图像处理-第四章1讲_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数字图像处理1图像增强2直方图均衡化3空间域图像平滑4空间域图像锐化原始图像Sobel算子输出图像5频率域图像处理FFTFFT6图像增强区别?联系?74.1概述---基础知识4.2统计编码4.3预测编码4.4变换编码4.5图像编码的国际标准第四章图像编码与压缩8大容量存储问题?实时传输问题?数据压缩4.1概述---基础知识为什么要进行数据压缩??

一方面:数字化带来的问题——数据量大!另一方面:从目前计算机的软硬件发展水平及发展趋势来看,在将来很长的一段时间内,数字化的媒体数据以压缩形式存储和传输仍将是主要的选择。电话(20~3400Hz)8000样本数/秒×12比特/样本=96kbps宽带语音(50~7000Hz)16000样本数/秒×14比特/样本=224kbps宽带音频(20~20000Hz)44100样本数/秒×16比特/样本×2信道=1.412Mbps图像512×512像素色彩图像×24比特/像素=6.3M比特/图像视频640×480像素色彩图像×24比特/像素×30帧/秒=221Mbps

高清晰度电视(HDTV)1280×720像素色彩图像×24比特/像素×60帧/秒=1.3Gbps数据压缩:减少表示给定信息量所需的数据量。9为什么能够进行数据压缩?压缩的基础是什么?空间冗余时间冗余结构冗余视觉冗余知识冗余编码冗余数据冗余!!!4.1.1图像编码基本原理10空间冗余:

图像内部相邻像素间存在较强的相关性所造成的冗余。4.1.1图像编码基本原理114.1.1图像编码基本原理时间冗余:

视频图像序列中不同帧之间的相关性。124.1.1图像编码基本原理结构冗余:

图像中存在很强的纹理结构或相似性。13(a)256级灰度(b)16级灰度4.1.1图像编码基本原理视觉冗余:

人眼不能感知或不敏感的那部分图像信息。14例如,人脸的图像有固定的结构。比如说嘴的上方有鼻子,鼻子的两侧有眼睛,鼻子位于正脸图像的中线上等。这类规律性的结构可由先验知识和背景知识得到,我们称此类冗余为知识冗余。4.1.1图像编码基本原理知识冗余:

有些图像中包含与某些先验知识有关的信息。15信息熵:(设信源有N个事件)熵:熵是信息量的度量方法设某个事件出现的概率为:信息量表示为:4.1.1图像编码基本原理编码冗余(信息熵冗余):

如果图像中平均每个像素使用的比特数大于该图像的信息熵,则图像存在冗余,这种冗余称为信息熵冗余。16假设区间[0,1]内的一个离散随机变量rk表示图像的灰度级,且每个rk出现的概率为pr(rk),则:

其中,nk是第k个灰度级在图像中出现的次数,n是图像中的像素总数。

假设l(rk)表示每个rk值的比特数,则每个像素所需的平均比特数为:4.1.1图像编码基本原理17编码是符号系统(字符、数字、位及类似的符号)。它用于表示信息的主体或事件的集合。每个信息或事件都被赋予一个编码符号序列,称为码字。每个码字中符号的个数是这个码字的长度。即每个灰度值所用的比特数和灰度级出现的概率相乘,所得乘积相加后可得到不同灰度值的平均码字长度。对M*N大小的图像进行编码所需的比特数?M*N*Lavg4.1.1图像编码基本原理18rkpr(rk)编码1l1(rk)rk=00.190003rk=1/70.250013rk=2/70.210103rk=3/70.160113rk=4/70.081003rk=5/70.061013rk=6/70.031103rk=10.021113编码2l2(rk)11201210200130001400001500000160000006=2×0.19+2×0.25+2×0.21+3×0.16+4×0.08+5×0.06+6×0.03+6×0.02=2.7bit4.1.1图像编码基本原理19压缩比r:r=3/2.7=1.11r=d/D其中,d表示原始图像平均码长,D表示压缩后平均码字长度。冗余度R:R=d/H-1=1–1/rR=1-1/1.11=0.099表明使用编码1有大约10%的数据是冗余的。编码效率η:η=H/D=1/(1+R)当经过编码压缩后图像信息的冗余度接近零,或编码效率接近1,表明平均码长接近其下限。4.1.1图像编码基本原理η=1/(1+0.099)=90.99%204.1.2图像编码压缩技术的分类无损压缩:

解码图像与原始图像严格相同,压缩大约在2:1~5:1之间。如:行程长度编码、Huffman编码、算术编码等。有损压缩:

还原图像与原始图像存在一定的误差,但视觉效果一般可以接受,压缩比可以从几倍到上百倍来调节。

常用的有变换编码和预测编码。根据解压重建后的图像和原始图像之间是否有误差:21

熵编码/统计编码

是基于信号统计特性的编码技术,是一种无损编码。其基本原理是:给出现概率较大的符号赋予一个短码字,而出现概率较小的符号赋予一个长码字,从而使得最终的平均码长最小。常见的熵编码方法有:行程长度编码、Huffman编码、算术编码。预测编码基于图像数据空间或时间冗余特性,用相邻的已知像素(或像素块)来预测当前像素(或像素块)的取值,然后再对预测误差进行量化和编码。变换编码

将空间域上的图像经过正交变换映射到另一变换域上,使变换后的系数之间的相关性降低。图像变换本身不能压缩数据,但变换后图像的大部分能量只集中到少数几个变换系数上,采用适当的量化和熵编码即可有效压缩图像。混合编码

综合了熵编码、变换编码或预测编码的编码方法,如JPEG标准和MPEG标准。根据编码压缩的原理分类:4.1.2图像编码压缩技术的分类22图像的保真度准则。压缩比要大;算法要简单,压缩/解压缩速度快,以满足实时性要求;失真小。当三者不能兼得时,要综合考虑。4.1.3图像编码压缩的评价23通常的数据压缩过程:4.2统计编码方法数据编码器(压缩)存储或网络传输解码(解压缩)数据24理论基础

对源数据符号采用变长编码,即对出现概率大的源数据信号赋于短码字,对于出现概率小的源数据符号赋于长码字。它在变长编码方法中是最佳的。4.2.1Huffman编码25Huffman编码规则1)将信源符号按照概率递增的顺序排列2)合并最小的两个概率信号;并重新按照上一步进行排列;3)重复(1)(2)直至概率为1;4)每次合并信号源时,将合并的两个信号分别赋予0和1;5)寻找从概率1到每一信源符号的路径,记录路径上的1和0;6)写出每一符号的1、0序列作为该符号的编码。4.2.1Huffman编码26元素xix1x2x3x4x5x6概率p(xi)0.400.30.100.100.060.044.2.1Huffman编码270.40.10.040.060.10.31.010.6100.10.30.2111000101011010100100000114.2.1Huffman编码0.10.4028码字码长1

00011010001010010111234550.40

0.300.100.100.060.04源数据符号x1

x2x3x4x5x6B(X)

=∑Piβi=0.40×1+0.3×2+0.10×3+0.10×4+0.06×5+0.04×5=2.20(bit)B’(X)

=-∑pilog2pi=-(0.40×log20.4+0.3×log20.3+0.10×log20.1+0.10×log20.1+0.06×log20.06+0.04×log20.04)

≈2.14(bit)4.2.1Huffman编码η=H/D=2.14/2.20=97.3%η等长

=H/D=2.14/3=71.3%291.霍夫曼编码平均码长大于熵,但是最接近熵的编码;2.霍夫曼编码构造出的编码值不是唯一的;3.当图像灰度值分布很不均匀时,霍夫曼编码的效率就高;而图像灰度值的概率分布较均匀时,编码效率就低。4、必须先计算出图像数据的概率特性形成编码表后,才能对图像数据编码。Huffman编码的特点:4.2.1Huffman编码30概率分布为2的负幂次方概率分布为均匀分布信源符号出现概率霍夫曼码字码字长度出现概率霍夫曼码字码字长度S02^-1110.1251113S12^-20120.1251103S22^-300130.1251013S32^-4000140.1251003S42^-50000150.1250113S52^-600000160.1250103S62^-7000000170.1250013S72^-7000000070.1250003编码效率H=1.984375D=1.984375η=100%H=3D=3η=100%31几个问题值得注意:1.霍夫曼码没有错误保护功能;2.霍夫曼码是可变长度码,因此很难随意查找或调用压缩文件中间的内容,然后再译码;3.接收端需保存一个与发送端相同的霍夫曼码表。4.2.1Huffman编码32

基本原理 将编码的信息表示成实数0和1之间的一个间隔(Interval)(即一个小数范围),信息越长,编码表示它的间隔就越小,表示这一间隔所需的二进制位就越多。

4.2.2算术编码33编码方法

字符:aeiou概率:0.20.30.10.20.2(1)确定概率分布区间aeiou[0,0.2)[0.2,0.5)[0.5,0.6)[0.6,0.8)[0.8,1.0)

(2)确定边界取值

Ns=Fs+Cl×L

Ne=Fs+Cr×L其中,

Ns、

Ne为新区间的起始、结束位置;Fs为前子区间的起始位置;Cl、Cr分别为当前符号的区间左端、右端;L为前子区间的长度。4.2.2算术编码34e[0.2,0.5),ea

Ns=0.2+0×0.3=0.2Ne=0.2+0.2×0.3=0.26eai

Ns=0.2+0.5×0.06=0.23Ne=0.2+0.6×0.06=0.236举例:编码数据串为“eai”Ns=Fs+Cl×LNe=Fs+Cr×L

字符串“eai”编码后范围为[0.23,0.236),即此范围内的数值代码都唯一对应该字符串。a[0,0.2)i[0.5,0.6)351e0.5ea0.26

0.2360.80.60.50.20uoieauoieauoieauoiea

0.2eai

0.230.236算术编码的优缺点:对整个消息只产生一个码字,无需用一个特定的代码替代一个输入符号;小数的精度不可能无限长,在运算中存在溢出的问题需要解决;对错误非常敏感,如果有一位发生错误就会导致整个消息译错。374.2.1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论