版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章变换编码变换编码变换编码(TransformCoding):将信源输出分解/变换为其组成部分,然后根据每个成分的特性分别进行编码主要内容Karhunen-Loéve变换(KLT)离散余弦变换(discretecosinetransform,DCT)变换系数的量化编码JPEG例:动机y=2.5x例:动机
——旋转考虑(可逆)变换例:动机
——变换后的序列例:动机
——压缩抛弃坐标第二维…用定长码编码,可降低50%!例:动机
——重构序列原始值重构值例:动机
——误差分析误差取决于被置为0的那些n的幅值如果幅值很小,则误差也很小即大多数信息在每个数据对的第一个元素中例:动机
——从统计分析的角度上面我们从几何的角度分析了变换我们也可以从统计分析角度来审视变换:当变换对序列去相关时,能得到最大压缩主成分方法(PrincipleComponentMethod)即样本—样本之间的相关性为0变换编码变换将原始序列{xn}分成大小为N的块将每个块映射成变换序列
{n}
可逆映射每块的不同元素的通常有不同的统计特性量化,根据目标平均码率统计序列的统计特性可能对不同的子序列采取不同的技术失真熵编码定长码、Huffman编码、算术编码、RLE+算术编码…变换我们主要考虑线性变换:{n}每个元素的特性与其位置有关如:在上述例子中元素的位置是奇数还是偶数设计变换序列的方差决定编码策略N
与特定领域有关,基于实践考虑计算代价、延迟、信源统计特性的稳定性重构:变换(2)写成矩阵形式(1-D):2-D变换:可分解的2-D变换:变换(3)矩阵形式的可分解2-D变换:我们要讨论的变换都是正交变换(Orthonormaltransforms)正交变换正交矩阵:如果一个矩阵满足其中I为单位阵,则称A为正交矩阵。每行/列点积为1,不同行/列的点积为0正交矩阵的逆矩阵等于其转置:正交反变换:正交变换(2)能量守恒性质:总能量守恒,但通常能量在各系数上分布并不均匀变换编码增益为增益与系数方差的集中程度有关若每个系数的方差相等,则没有增益几何均值算术均值从信号分解的角度考虑变换:反变换为变换行=基向量表示x与ai之间的相似性相似性越高,变换系数越大例:第一行:低通信号,x0和x1的均值第二行:高通信号,x0和x1的差值A为正交矩阵从信号分解的角度(2)例(续):考虑两个序列:低通:(3,1)高通:(3,-1)矩阵的角度1-D变换:变换矩阵的行展开类似的,2-D变换可视为变换矩阵行向量外积构成的矩阵的展开外积:矩阵的角度(2)例:外积为:矩阵的角度(3)例(续):逆变换为:DC系数AC系数基矩阵Karhunen-LoéveTransform(KLT)亦称为HotellingTransformHotelling于1933年用于离散数据去相关Karhunen、Loéve分别于1947年和1948用于连续函数分析Kramer和Mathews、Huang和Schultheiss分别于1956年、1963年用于数据压缩(变换编码)在统计分析中被称为主成份分析
(Principal
ComponentsAnalysis,PCA)KLT(2)目标:用一个正交变换,去除输入之间的相关性自相关矩阵:
{n}不相关为对角阵A为正交矩阵基函数(A的行向量)为矩阵的特征向量
{n}的方差为的特征值是对称的可正交对角化KLT的性质从N维中任取
系数,令其他系数为0,得到的重构误差(均方误差)为其中为的特征值,也是k
的方差所以KLT最小均方误差意义下的最佳变换KLT达到最佳的能量集中KLT的性质(2)任何正交变换的行列式的值:任何正交变换的协方差的行列式的值:KLT变换后(对角)协方差矩阵的行列式Hadamardin不等式:任何对称、半正定矩阵的行列式小于等于其对角线元素的乘积变换系数方差的几何均值最小编码增益GTC最大例:KLT对块大小为2的平稳过程,自相关矩阵为特征值:特征向量:须满足正交约束,归一化:所以,KLT的变换矩阵为:KLT(3)既然KLT是最佳的,为什么还会有其他的变换呢?没有快速计算方法KLT取决于信号的统计性质对平稳过程,KLT比较合适但对大多数输入,需重复计算/传输变换矩阵寻找结构化的变换,使得其性能接近KLTDCT离散余弦变换
(DiscreteCosineTransform,DCT)变换矩阵为cosine的函数源自DFT但更适合压缩DCT基向量变化随行号增大而增大(频率越来越高)DCT基矩阵DFTvs.DCTDFT:DCT:函数的不连续影响Fourier级数的收敛,从而需要更多基函数,影响压缩DCT更连续DFT在边界不连续DFTvs.DCT(2)DCT变换后的能量更集中更适合压缩DCT的性质对Markov过程:当很大时,DCT的性能接近KLT的性能
实际上,很多信源都是很大的Markov过程DCT是一个最流行的变换JPEGMPEGH.261…离散正弦变换
(DiscreteSineTransform,DST)变换矩阵为sine的函数:类似DCT,有很好的性质当很小时,DST的性能接近KLT的性能在图像/语音编码应用中,与DCT变换互补离散DiscreteWalsh-Hadamard变换N阶Hadamard矩阵HHT=NIN=2k的构造规则:…DWH变换从Hadamard矩阵HN推导得到变换矩阵H归一:乘以将每行以Wash序(sequencyorder)排列如:性能:计算简单:+/-,在有限硬件上容易实现但压缩性能比采用DCT稍差各种变换的比较(1)各种变换的比较(2)对块大小为1×32的典型自然图像,各种变换的能量集中比较:i主要内容Karhunen-Loéve变换(KLT)离散余弦变换(discretecosinetransform,DCT)变换系数的量化编码JPEG例1:空域量化vs.变换域量化x=[100110120130140150160170]T8点DCT变换:y=[381.84-64.420-6.730-2.010-0.5070]
能量主要集中在前两个系数7水平的中平量化器例1:空域量化vs.变换域量化(2)方案1:直接对原始数据进行量化方案2:对DCT系数进行量化△=6,量化后的DCT系数:[64-110-10000]3个非0DCT系数MSE:w/oDCT:3.0w/DCT:1.5例1:空域量化vs.变换域量化(3)△=20,2个非0DCT系数:[19-3000000]DCT系数重构效果仍然很平滑直接方法开始产生块/mosaic效应MSE:w/oDCT:50.0w/DCT:9.07例1:空域量化vs.变换域量化(4)△=100,2个非0DCT系数:[4-1000000]DCT系数重构效果仍然平滑直接方法产生的块/mosaic效应更多MSE:w/oDCT:1000w/DCT:205例2:空域量化vs.变换域量化输入数据: 8978767570828182 12295868080767481 18415312610685767175 22120518014697716867 225222217194144957882 228225227220193146110108 223224225224220197156120 2172192192242302201971512-DDCT变换系数(取整):1155259-23611730 -377-5085-101047-3 -4-158-2442-15101 -23-34-199-54-1 196-15-106-5-1 31336-920-3 8-24-13-10-2 20-32-200-1大多数能量集中在左上角例2:空域量化vs.变换域量化(2)
在变换域量化通常能得到更好的结果我们还可以做得更好对不同的子带采取不同的量化步长
DCT系数的分布变换系数的比特分配我们讨论的变换为正交变换变换过程为能量守恒,所以总的误差=量化误差每个子带的能量:每个子带的量化误差:总的量化误差:变换系数的比特分配(2)比特分配问题:计算,使得最小并满足比特率:子带能量:
为对角线上第k个元素变换系数的比特分配(3)用Lagrangian乘子法得到最佳的比特分配对所有的k,每个子带的量化误差的方差尽可能相等变换系数的比特分配(4)
方差越大,比特数越多代入比特率约束最佳失真和每个系数的码率分别为变换系数的比特分配(5)变换编码的最佳失真为假设对原始信号的码率失真函数为则变换编码增益为变换系数的比特分配(6)变换编码增益为
为Rxx对角线的元素,对平稳过程,Rxx每个(i,i)相等增益与系数方差的集中程度有关若每个系数的方差相等,则没有增益几何均值算术均值变换系数的比特分配(7)上述最佳不一定为整数,甚至不能保证为正数
但增大了平均码率,还需均匀减小非0递归比特分配满足约束:且为整数所以码率分配算法为:1、计算每个成分的方差2、虽所以的3、对所有的方差排序,对最大的方差的成分分配1比特
若比特数用尽,停止;否则转第3步上述算法称为zonalsampling递归比特分配(2)8*8变换的比特分配阈值编码zonalsampling基于平均值进行比特分配局部变化可能不能很好重构如边缘像素阈值编码:对所有大于阈值的系数进行编码,而丢弃其他较小的系数阈值编码(2)对2-D图像编码可采用Zigzag方式编码可得到很多高频系数为0,发送EOB(EndofBlock)即可总结正交变换:对信号空间的坐标进行旋转变换的目的:去相关:使得在量化时,对各系数单独量化(标量量化),而不会损伤过多效率(与矢量量化相比)变换本身并不会产生压缩,但变换会使得量化更容易实现,真正实现压缩的是变换后的量化能量集中:稀疏,将原始信号的能量压缩到尽可能少的系数对原始信号只用少数幅值较大的系数表示比特分配与方差的log成正比KLT是最佳的,但其是信号相关的,没有快速算法
DCT性能接近KLT,有快速计算算法通常采用DCT:对图像采用8x8的块大小、均匀量化
、Z字扫描(JPEG,MPEG,ITU-TH.261,H.263…)下节课内容下节课内容:JPEG作业:Sayood3rd,pp.421-4222,4变换编码JPEGJPEG标准JPEG:JointPhotographicExpertsGroup正式名称:ISO/IECJTC1/SC29/WG10与CCITT(现为ITU)学习组VIII联合工作开始于1986年于1992年形成国际标准ISO/IEC10918-1和CCITT建议T.81
广泛用于图像交换、WWW、数字图像Motion-JPEG为数字视频编缉的事实标准InternationalOrganizationforStandardizationInternationalElectrotechnicalCommissionJointISO/IECTechnicalCommittee(InformationTechnology)Subcommittee29
(CodingofAudio,Picture,MultimediaandHypermediaInformation)WorkingGroup10(JBIG,JPEG)JPEG:8×8的块编码JPEG标准JPEG规定了4种运行模式,以满足不同需要:基于DPCM的无损编码模式:压缩比可达2:1基于DCT的有损顺序编码模式:压缩比可达10:1以上基于DCT的递增编码模式基于DCT的分层编码模式基本(baseline)JPEG编码器Huffman编码:通过简单的查表就可以实现Huffman编码可以用自适应二进制算术编码代替(由于专利问题,很少产品支持)
编码效率提高10%,但算法更复杂颜色空间JPEG标准本身并没有规定具体的颜色空间,只是对各分量分别进行编码实现中通常将高度相关RGB颜色空间转换到相关性较小的YCbCr颜色空间RGBYCbCr(8bit/pixel)YCbCrRGB颜色空间图像的主要信息包括在Y通道Cb、Cr更平滑容易压缩人眼对色度分量不敏感对色度分量可以进行下采样:如4:2:2,4:2:0CbCr零偏置(LevelOffset)对于灰度级是2n的像素,通过减去2n-1,将无符号的整数值变成有符号数对于n=8,即将0~255的值域,通过减去128,转换为值域在128~127]内目的:使像素的绝对值出现3位10进制的概率大大减少DCT变换对每个单独的彩色图像分量,把整个分量图像分成8×8的图像块,如图所示,并作为两维离散余弦变换DCT的输入DCT变换:其中逆变换:量化中平型均匀量化器:量化步长是按照系数所在的位置颜色分量来确定因为人眼对亮度信号比对色差信号更敏感,因此使用了两种量化表:亮度量化值和色差量化值根据人眼的视觉特性(对低频敏感,对高频不太敏感)对低频分量采取较细的量化,对高频分量采取较粗的量化如果原始图象中细节丰富,则去掉的数据较多,量化后的系数与量化前差别反之,细节少的原始图象在压缩时去掉的数据少些DCT系数量化步长人眼的对亮度敏感性DCLowHighLowHighSensitiveforhumaneyesLesssensitiveforhumaneyes建议基本量化表基于人的生理感知阈值实验量化表缩放真正的量化表=缩放因子×基本量化表质量因子≤50:缩放因子=50/质量;质量因子>50:缩放因子=2–质量/50缩放因子70586不同质量因子的图像示例GIF:258898bytes100:326321bytes75:70586bytes
50:46295bytes
25:29360bytes10:15325byteshttp://www.cs.sfu.ca/CC/365/mark/material/cgi-bin/whichjpeg.cgi9438bytes例: 用8x8的JEPG基线标准,压缩并重构下列子图52 55 61 66 70 61 64 7363 59 66 90 109 85 69 7262 59 68 113 144 104 66 7363 58 71 122 154 106 70 6967 61 68 104 126 88 68 7079 65 60 70 77 68 58 7585 71 64 59 55 61 65 8387 79 69 68 65 76 78 940偏置转换后-76 -73 -67 -62 -58 -67 -64 -55-65 -69 -62 -38 -19 -43 -59 -56-66 -69 -60 -15 16 -24 -62 -55-65 -70 -57 -6 26 -22 -58 -59-61 -67 -60 -24 -2 -40 -60 -58-49 -63 -68 -58 -51 -65 -70 -53-43 -57 -64 -69 -73 -67 -63 -45-41 -49 -59 -60 -63 -52 -50 -34正向DCT变换(n=8)后变成-415 -29 -62 25 55 -20 -1 37 -21 -62 9 11 -7 -6 6-46 8 77 -25 -30 10 7 -5-50 13 35 -15 -9 6 0 311 -8 -13 -2 -1 1 -4 1-10 1 3 -3 -1 0 2 -1-4 -1 2 -1 2 -3 1 -2-1 -1 -1 -2 -1 -1 0 -1量化变换后的数组-26 -3 -6 2 2 -1 0 01 -2 -4 1 1 0 0 0-3 1 5 -1 -1 0 0 00-4 1 2 -1 0 0 0 001 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 0DC系数的差分编码8×8图像块经过DCT变换之后得到的DC直流系数有两个特点系数的数值比较大相邻8×8图像块的DC系数值变化不大:冗余根据这个特点,JPEG算法使用了差分脉冲调制编码(DPCM)技术,对相邻图像块之间量化DC系数的差值DIFF进行编码:DC系数的差分编码对DIFF用Huffman编码:分成类别,类似指数Golomb编码类别ID:一元码编码类内索引:采用定长码DC类别范围范围大小0011-1,122-3,-2,2,343-7,
-6,
-5,
-4,4,5,6,784-15,…,-8,8,…,15165-31,…,-16,16,…,3132………15[-32767,-16384],[16384,32767]32768DC系数的差分编码
例:DC=8,上一DC=5,则DIFF=8-5=3
类别ID=2,类内索引=3,则码流=10011AC系数的Z字扫描由于经DCT变换后,系数大多数集中在左上角,即低频分量区,因此采用Z字形按频率的高低顺序读出,可以出现很多连零的机会。可以使用游程编码。尤其在最后,如果都是零,给出EOB(EndofBlock)即可。Zig-zag扫描26−30−3−2−62−41−411512−11−1200000−1−1EOBAC系数的游程编码在JPEG和MPEG编码中规定为:(run,level)表示连续run个0,后面跟值为level的系数如:−30−3−2−62−41−411512−11−1200000−1−1EOB表示为(0,-3);(1,-3);(0,-2);(0,-6);(0,2);(0,-4);(0,1);(0,-4);(0,1)(0,1);(0,5);(0,1);
(0,2);(0,-1);(0,1);(0,-1);(0,2);(5,-1);(0,-1);EOB编码:Run:最多15个,用4位表示ZLevel:类似DC分成16个类别,用4位表示表示类别号C类内索引对(Z,C)联合用Huffman编码对类内索引用定长码编码AC系数的Huffman编码Z:0的游程;C:类别ZRL:表示16个0;当0的个数大于15时,分成多次如20个0,紧跟-1:ZRL;(4,-1)(run,level)序列:(0,-3);(1,-3);...Z/C序列:0/2,1/2,…-3是第2类的第1个值,(0,-3):0100-3是第2类的第1个值,(1,-3):1101100重构与编码相反解码Huffman数据解码DC差值重构量化后的系数DCT你变换丢弃填充的行/列反0偏置对丢失的CbCr分量差值(下采样的逆过程)YCbCrRGB重构量化后的系数(已通过DC差重构DC系数)乘以量化表,得到IDCT:+128:重构误差:每个像素大约为5的平均绝对误差误差在左下角比较明显原图重构图示例图像示例图像基于DPCM的无损编码模式采用三邻域二维预测编码和熵编码无失真编码器源图像数据压缩的图像数据预测器熵编码器表说明DPCM预测编码框图基于DCT的递增编码模式此模式与顺序模式编码步骤基本一致不同之处在于:递增模式每个图像分量的编码要经过多次扫描才完成第一次扫描只进行一次粗糙的压缩,然后根据此数据先重建一幅质量低的图像以后的扫描再作较细的扫描,使重建图像质量不断提高,直到满意为止递增模式分为两种:按频段累进按位累进基于DCT的分层编码模式1、降低原始图像的空间分辨率2、对已经降低分辨率的图像按照顺序编码模式进行压缩并存储或传输3、对低分辨率图像进行解码,然后用插值法提高图像的分辨率4、将分辨率已经升高的图像作为原图像的预测值,并把它与原图像的差值进行基于DCT的编码5、重复步骤3、4直到图像达到完整的分辨率总结JPEG:各种基本算法的精妙组合:DCT+DPCM+Huffman其他标准也类似ReferencesG.K.Wallace,“TheJPEGstillpicturecompressionstandard,”IEEETrans.ConsumerElectronics,vol.38,no.1,pp.xviii-xxxiv,Feb.1992.TU-TRec.T.81
/ITU-T/studygroups/com16/jpeg1x/index.html
Wiki:/wiki/JpegJPEG2000JPEG2000概述JPEG2000编码器编码器结构预处理核心处理熵编码:EBCOTJPEG2000概述静止图像压缩标准:连续色调和二值1997年开始,2000年定案主要特性:低码率下性能更好(与JPEG相比)分辨率和质量可伸缩随机访问ROI
(RegionOfInterest)容错:在位流中可加入同步码支持大图像应用更广:复合文档压缩在单一数据流中统一有失真编码和无失真编码代价(与JPEG相比):更多存储更复杂JPEGat0.125bpp(放大后)192:1JPEG2000at0.125bpp(放大后)192:1JPEG2000JPEG2000概述JPEG2000编码器编码器结构预处理核心处理熵编码:EBCOT编码器结构DiscreteWaveletTransformQuantizationEBCOTEntropycodingTier1:BlockCodingImagedataPre-processingTier2:LayerCodingBitstreamRateControlJPEG2000JPEG2000概述JPEG2000编码器编码器结构预处理核心处理熵编码:EBCOT预处理贴片划分(ImageTiling)颜色变换贴片划分(1)图像可能太大,编码器一次不能处理图像被分割成不重叠的贴片(tile),所有的操作都是以贴片为处理单元颜色变换、小波变换、量化和熵编码贴片的一个主要目的是可以对图像中感兴趣的部分进行解码解码器识别位流中的每个贴片,并且只对包含在贴片中的像素进行解码贴片划分(2)参考网格:(referencegrid):Xsiz,Ysiz图像区域偏移量:XOsiz,YOsiz图像与参考网格底端对齐
每个成分的水平/竖直方向采样周期:XRsiz,YRSiz如XRsiz=2,YRsiz=1XRsiz=2,YRsiz=2.贴片划分(3)所有贴片大小相等,边界处除外贴片划分(4)贴片的大小会影响图像的主观质量和客观质量太小的贴片会带来更多的“贴片效应”颜色变换支持两种颜色变换不可逆变换(Irreversiblecolortransform,ICT):YCbCr空间同JPEG中的颜色变换用于浮点小波变换/有失真编码可逆变换(Reversiblecolortransform,RCT):YUV空间用于整数小波变换,可用于有失真编码或无失真编码可选:对色度分量进行下采样同JPEG一样,颜色分量也进行0偏置处理:-2n-1可逆颜色变换颜色变换:逆变换:JPEG2000JPEG2000概述JPEG2000编码器编码器结构预处理核心处理熵编码:EBCOT核心处理小波变换量化离散小波变换(DWT)DWT(2)双正交DWTh0与g0正交h1与g1正交DWT(3)不可逆:Daubechies(9,7)在低码率下性能最好,但计算复杂度高可逆:LeGall(5,3):整数实现无失真编码,计算复杂度低nh0(n)nh1(n)0+6/8-1+1±1+2/8-2,0-1/2±2-1/8nh0(n)nh1(n)0+0.602949018236-1+1.115087052456±1+0.266864118442-2,0-0.591271763114±2-0.078223266528-3,1-0.057543526228±3-0.016864118442-4,2+0.091271763114±4+0.026748757410DWT(4)支持卷积方式和提升方式实现离散小波变换卷积:滤波器与信号卷积提升格式:预测和更新DWTCohen-Daubechies-Feauveau(CDF)(9,7)的提升格式:其中P表示像素值,C表示小波系数
LeGall(5,3)用整数小波变换实现=1.586,=0.052,=0.882,=0.443,K=1.230量化JPEG2000支持两种量化带死区的标量量化网格量化(TrellisCodedQuantization)带死区的均匀量化死区:0附近区域的大小为其他区域的2倍量化规则:对每个子带b,用户选择基本量化步长△b,并用该步长对该子带中的所有系数量化可根据视觉模型(如对比敏感函数,contrastsensitivityfunction)选择每个子带的步长
相同视觉质量下能得到更高的压缩比JPEG2000JPEG2000概述JPEG2000编码器编码器结构预处理核心处理熵编码:EBCOTEBCOTEBCOT:EmbeddedBlockCodingwithOptimizedTruncationTier1:分块编码(BlockCoding)将每个子带分成独立编码的码块(32x32or64x64)Tier2:最佳截断(OptimalTruncation)在所有块被压缩后,一个后处理过程决定每块的截断点压缩后的率—失真(Post-compressionrate-distortion,PCRD)优化上下文建模算术编码码率—失真控制cxD(Tier1)(Tier2)量化后的系数位流EmbeddedBlockCodingOptimizedTruncationTier-1第一轮(Tier-1)编码:编码块的小波系数按位面算术编码位面编码(Bit-PlaneCoding)分数位面(FractionalBit-Plane)扫描MQ编码器上下文建模算术编码码率—失真控制cxD(Tier1)(Tier2)量化后的系数位流EmbeddedBlockCodingOptimizedTruncation分块编码与EZW和SPIHT的哲学思想不同由于没有利用带内冗余,会轻微牺牲效率,但这会带来其他好处分块编码的优点提供SNR(或质量)和分辨率可伸缩分辨率可伸缩:可解码小图像通过发送逐个子带的块码流实现EZW和SPIHT只有SNR可伸缩:不同子带的数据混合在一起可以利用局部统计性:对算术编码有用提供随机访问特征减少存储要求允许并行实现编码块的位平面分解1SignbitMSBLSBMagnitudebitsinsignificantsignificantPixelBit-plane10011000动态扫描和分数位平面每块用位平面编码编码动态扫描:先编码更可能是重要系数的系数EZW和SPIHT采用确定的扫描顺序每个位平面进一步被细分为3个步骤编码(分数位平面):1.重要性传播过程(significancepass):对可能是重要的系数2.幅值细化过程(refinementpass):对已是重要的系数3.清除过程(cleanuppass):对不太可能是重要的系数每个系数值在上述3个步骤中的之一出现在每一个步骤中,系数以确定的顺序访问面向条带(Stripe)的扫描每条4行按列扫描位平面编码原语4种“原语”编码操作零编码(ZeroCoding,ZC):在significanceandcleanuppasses对系数的第p个位平面,如果系数仍不是重要系数符号编码(Sign
Coding,SC):在significancepass当系数从不重要变成重要时幅值细化(MagnitudeRefinement,MR):在refinementpass对重要系数,细化1比特游程编码(RLC):只在cleanuppass用游程符号编码多个连续系数的重要性EBCOT中的上下文共18种上下文10种:重要性编码5种:符号编码3种:细化编码而JBIG和JBIG-2有上千种上下文对每块,重新初始化上下文模型提高容错性允许并行实现三个编码步骤重要性传播步骤(对第一个位平面省略):
系数不重要,但8邻居中至少有一个重要的系数,根据当前位平面检查其是否变成重要的这些系数更可能是重要的系数,因为其有重要的邻居如果样本仍是不重要的,用ZC原语编码如果样本变成重要的(该位为1时),将其重要性标志置为1,并用SC原语编码其符号位幅值细化步骤(对第一个位平面省略):在前一个位平面已经是重要的系数,用MR原语编码清除步骤:对其他剩下的系数,用ZC和RLC原语编码该过程中的系数极有可能仍是不重要的ZeroCoding亦称为重要性编码(Significancecoding)的正常模式若不重要系数在当前位平面仍是不重要的,发送0否则发送1,然后发送系数的符号位系数的重要性与其邻居有关上下文模型:如果系数仍是不重要的,用9个上下文(索引0-8)编码系数的第p个位平面根据8邻居的状态决定ZC上下文Sh:水平方向重要邻居的数目(0-2)Sv:竖直方向重要邻居的数目(0-2)Sd:对角线向重要邻居的数目(0-4)利用前一个位平面的信息如果邻居不在同一块内,则认为该邻居是不重要的邻居系数之间的相关性邻居系数的重要性可用来预测当前系数的重要性HL子带捕获竖直方向的边缘LH子带捕获水平方向的边缘不同的边缘需要不同方向的邻居ZeroCoding上下文Sh:水平方向重要邻居的数目(0-2)Sv:竖直方向重要邻居的数目(0-2)Sd:对角线向重要邻居的数目(0-4)LL,LH,HL子带ZC上下文
举例水平方向邻居的重要性预测性最好竖直方向邻居的重要性预测性最好对角线方向邻居的重要性预测性最好ZeroCoding上下文游程编码
—重要性编码的游程模式应用于不重要概率高的区域当满足下列条件时,进入游程模式:1.在前一个位平面,列中的所有4个系数都是不重要的2.其中任何一个都没有重要的邻居解码器采用相同的决策如果进入游程模式,发送一个二进制的RunInterruption符号,采用索为9的上下文,用于标识该4个系数中是否有系数在当前位平面是重要的如果所有的都是不重要的(很有可能)发送0否则(不太可能):发送1,然后发送列中前面不重要系数的数目,紧跟第一个重要系数的符号。其余用正常模式编码。不重要系数的数目在[0,3]区间内近似均匀分布用2比特表示,用均匀分布编码符号编码当系数从不重要变成重要时采用相邻系数的符号位表现出强相关性例:LH子带中的水平方向系数趋向于有相同的符号HL子带中的竖直方向系数趋向于有相反的符号符号编码的上下文呢:利用直接4邻居的符号(2个水平、2个竖直)每个邻居可能是:不重要、正、负3^4=81种可能的配置JPEG2000中简化为5种上下文:索引:10-14幅值细化编码对重要系数的第p个比特编码:上下文模型:选用3个上下文(索引15-17)上下文选择,基于:该比特是否为该系数的第一个细化比特该系数是否有重要的邻居(水平、竖直或对角线)编码举例位平面2:重要性过程:忽略,开始时所有都是不重要的细化过程:忽略,开始时没有重要的系数清除过程:0,0:前2列用RLC:都是不重要的1,
1,0,0,1,0:第3列用RLC:不是所有都是不重要的,前面有2个不重要,且下一个系数为正的重要系数,最后一个系数为正的重要系数
0,0,0,0:最后1列,不能用RLC,对每个系数用ZC:所有都是不重要的编码举例(2)位平面1:重要性过程:逐列扫描所有有至少一个重要邻居的不重要的系数1,0,1,1,1,1,0,0,0,1,1(这轮中有4个新的重要系数)细化过程:1,1清除过程:0,1,1,0,1,0,0,1,0,0(这轮中3个新的重要系数)编码举例(3)位平面0:重要性过程:逐列扫描所有有至少一个重要邻居的不重要的系数1,1,1,0,1,0,1,0,0,1,0,1,1(这轮中有6个新的重要系数)细化过程:1,0,0,0,1,1,0,1,0清除过程:该例中无EBCOTEBCOT:EmbeddedBlockCodingwithOptimizedTruncationTier-1:分块编码(BlockCoding)将每个子带分成独立编码的码块(32x32or64x64)Tier-2:最佳截断(OptimalTruncation)在所有块被压缩后,一个后处理过程决定每块的截断点压缩后的率—失真(Post-compressionrate-distortion,PCRD)优化上下文建模算术编码码率—失真控制cxD(Tier1)(Tier2)量化后的系数位流EmbeddedBlockCodingOptimizedTruncationTier-2:最佳截断块截断:每个编码块产生的位流有不同的小块组成每个位平面3小块,对应3个分数位平面编码过程最后的位流由不同的质量层组成每层由不同块的合适
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 衣服销售员工作心得-文档
- 2025地坪、围墙工程合同
- 2025图书委托出版合同
- 2025项目合同书参考式样
- 2025年度生物科技合伙人合作协议3篇
- 2025年度年度办公用房租赁合同(含家具配备)
- 二零二五年度生态保护项目经理委托协议3篇
- 二零二五年度农业种植与农业知识产权保护合作协议3篇
- 2025年度商业综合体个人租赁合同3篇
- 2025年度上市公司股份收购及转让协议书范本3篇
- fsQCA方法与案例分析
- 中国火锅文化课件
- 矿产贸易风险管控
- 湖南省湘西自治州四校2025届高二数学第一学期期末质量检测试题含解析
- 期末 (试题) -2024-2025学年川教版(三起)英语五年级上册
- 2025届四川省新高考八省适应性联考模拟演练 生物试卷(含答案)
- 安全生产方案及保证措施
- 非物质文化遗产主题班会之英歌舞课件
- 柯桥区五年级上学期语文期末学业评价测试试卷
- 中国矿业大学《自然辩证法》2022-2023学年期末试卷
- TCWAN 0105-2024 搅拌摩擦焊接机器人系统技术条件
评论
0/150
提交评论