图像编码技术的研究和应用.doc_第1页
图像编码技术的研究和应用.doc_第2页
图像编码技术的研究和应用.doc_第3页
图像编码技术的研究和应用.doc_第4页
图像编码技术的研究和应用.doc_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

图像编码技术的研究和应用 一幅二维图像可以表示为将一个二维亮度函数通过采样和量化而得到的一个二维数组 。这样一个 二维数组的数据量通常很大 ,从而对存储 、处理和传 输都带来了许多问题 ,提出了许多新的要求 。为此 人们试图采用对图像新的表达方法以减少表示一幅 图像需要的数据量 ,这就是图像编码所要解决的主要问题 。压缩数据量的主要方法是消除冗余数据,从数学角度来讲是要将原始图像转化为从统计角度看尽可能不相关的数据集 。这个转换要在图像进行 存储 、处理和传输之前进行 ,而在这之后需要将压缩 了的图像解压缩以重建原始图像或其近似图像.图像压缩和图像解压缩 ,通常也分别称为图像编码和图像解码。图 1 通用的图像编码系统模型 这里给出了一个通用的图像编码系统模型 ,如图 。这个模型主要包括 2 个通过信道级连接的结构 模块 :编码器和解码器 。当一幅输入图像送入编码 器后 ,编码器根据输入数据进行信源编码产生一组信号 。这组信号在进一步被信道编码器编码后进入信道 。通过信道传输后的码被送入信道解码器和信源解码器 ,解码器重建输出的图像 。一般来说 ,输出 图是输入图的精确复制 ,那么系统是无失真的或者 信息保持型的 ;否则 ,称系统是信息损失的 。图 2 源编码器和源解码器模型 信源编码器的作用是减少或消除输入图像中的编码冗余 、像素间冗余及心理视觉冗余 。尽管信源 编码器的结构与具体应用和对保真度的要求有关 , 但一般情况下信源编码器包括 顺 序 的 3 个 独 立 操 作 ,而对应的信源解器包含反序的 2 个独立操作 (见图 2) 。在信源编码器中 ,映射器将输入数据变换以减少表达图像的数据 ,这与具体编码技术有关 。量化器根据给定的保真度准则减少映射器输出的精 确度 。这 个 操 作 可 以 减 少 心 理 冗 余 , 但 不 可 翻 转 。 符号编码器产生表达量化器输出的码本 ,并根据码 本输出 .符号编码器编码为了减少冗余 ,这个操作 是可以反转的 。 当信道是有噪声的或者容易产生误差时 ,信道编码器和信道解码器对这个编解码过程是非常重要 的 。由于信源编码器的输出数据一般只有很少的冗 余 ,所以他们对传输噪声很敏感 。信道编码器通过 把可控制的冗余加入信源编码器后的码字以减少信 道噪声的影响 。1 现代编码方法这里介绍了几种比较热的编码方法 : 第二代编 码方法 、分形编码 、模型编码 、神经网络编码 、小波变 换编码 。1 . 1 第 二 代 图 像 编 码 方 法 第 二 代 图 像 编 码 方 法 1 是针对传统编码方法中没有考虑人眼对轮廓 、 边缘的特殊敏感性和方向感知特性而提出的 。它认 为传统的第一代编码技术以信息论和数字信号处理 技术为理论基础 ,出发点是消除图像数据的统计冗 余信息 ,包括信息熵冗余 、空间冗余和时间冗余 。其 编码压缩图像数据的能力已接近极限 ,压缩比难以 提高 。第二代图像编码方法充分利用人眼视觉系统 的生理和心理视觉冗余特性以及信源的各种性质以 期获得高压缩比 ,这类方法一般要对图像进行预处 理 ,将图像数据根据视觉敏感性进行分割 。按处理方法的不同 ,第二代图像编码方法可分 为两种典型的编码技术 2 : 一种是基于分裂合并的 方法 ,先将图像分为纹理和边缘轮廓 ,然后各自采用 不同的方法编码 ; 另一种是基于各向异性滤波器的 方法 ,先对图像进行方向性滤波 ,得到不同方向的图 像信息 ,再根据人眼的方向敏感性对各个通道采用 特定的方法单独编码 。但是到目前为止 ,第二代图像编码方法复原图 像的质量不尽人意 3 。原因之一在 于 我 们 对 人 眼 视觉特性的了解仍较为肤浅 ; 原因之二是图像的分 裂合并算法 、各向异性滤波算法没有提供一种很好 的机制来利用已知的人眼视觉特性 。然而这种编码 方法强调利用人眼视觉特性的思想对后来各种图像 编码方法的研究产生了深刻的影响 。2 . 2 分形图像编码 分形图像编码是在分形几何理论的基础上发展起来的一种编码方法 。分形理论是 欧氏几何相关理论的扩展 ,是研究不规则图形和混 沌运动的一门新科学 。它描述了自然界物体的自相 似性 ,这种自相似性可以是确定的 ,也可以是统计意义上的 。这一理论基础决定了它只有对具备明显自 相似性或统计自相似性的图像 ,例如海岸线 、云彩 、 大树等才有较高的编码效率 。而一般图像不具有这 一特性 ,因此编码效率与图像性质学特性有关 ,而且 分形图像编码方法实质上是通过消除图像的几何冗余度来压缩数据的 ,根本没有考虑人眼视觉特性的作用 。分形 图 像 压 缩 的 概 念 是 80 年 代 中 后 期 由 Bar nsley 等人提出的 , 其理论基础是迭代函数系统 ( IFS : Iterated Functio nSystem) 理 论 , 着 眼 点 是 利 用 自然图像普遍存在的自相似特性 ( 几何尺度不论怎 样变化 ,景物任何一小部分的形状都与较大部分的 形状极其相似) ,将这些自相似的结构以某种函数映 射关系的形式表现出来 ,当这些函数映射关系满足 一定的条件时 ,就可通过迭代计算重建图像 。所以 , 分形图像编码过程是找映射关系的过程 ,而解码过 程则是依照映射关系迭代计算的过程 。整个方法包 括以下步骤 : (1) 将原图 (集合 X) 予分割为若干分形 子图 X ( m) ,m = 1 ,2 ,3 M ; (2) 对每一个子块 X ( m) 提取 IFS 代码 ; (3) 对 IFS 代码进行编码 、传输 (或储 存) ; (4) 译码形成 IFS 代码 ; ( 5) 由 IFS 代码构造 X ( m) 的重构子块 Y ( m) ; ( 6) 由 Y ( m) 构造 X 的重构 图 Y。这种分形图像压缩方法的实现不需要对图像 有什么先验知识的了解 。2 . 3 基于模型的图像编码 基于模型的图像编码技 术 4 是近几年发展起来的一种很有前途的编码方 法 。它利用了计算机视觉和计算机图形学中的方法 和理论 ,其基本出发点是在编 、解码两端分别建立起 相同的模型 ,针对输入的图像提取模型参数 ,或根据 模型参数重建图像 。模型编码方法的核心是建模和 提取模型参数 ,其中模型的选取 、描述和建立是决定 模型编码质量的关键因素 。为了对图像数据建模 , 一般要求对输入图像要有某些先验知识 。目前研究 最多 、进展最快的是针对可视电话应用中的图像序 列编码 。这类应用中的图像大多为人的头肩像 。 基于模型的图像编码方法是利用先验模型来抽 取图像中的主要信息 ,并以模型参数的形式表示它 们 ,因此可以获得很高的压缩比 。然而在模型编码 方法的研究中还存在很多问题 ,例如 : ( 1) 模型法需 要先验知识 ,不适合于一般的应用 。(2) 对不同的应 用所建模型是不一样的 。( 3) 在线框模型中控制点 的个数不易确定 ,还未找到有效的方法能根据图像 内容来选取 。(4) 由于利用模型法压缩后复原图像 的大部分是用图形学的方法产生的 ,因此看起来不够自然 。(5) 传统的误差评估准则不适合用于对模 型编码的评价 。2 . 4 神经网络图像编码 在图像编码的各种方法中 , 除信息保持型编码方法外 ,其余所有方法始终没有 解决好如何充分利用人的视觉特性这个问题 。神经 网络图像编码 5 试图在此有所突破 ,现在直接用于图像压缩的神经网络主要有 B P 网络和自组织映射神经网络 。采用 B P 网络实现数据压缩好比是强迫 数据通过细腰型网络的瓶颈 ,并期望在网络的瓶颈 处能获得较紧凑的数据表示 。图 3 给出了 B P 网络进行数据压缩的原理 , 这 是一 n - m - n 型三层 B P 神经网络 ,输入层有 n 个神经元 。通过 B P 训练算法 , 在网络的学习过程中调整网络的权重 ,使训练集图像的重建误差 E = | |X - Z| | 2 均值达到最小 ( X 为输入层样本集 , Z 为输 出层样本集) ,或者说 ,使重建图像在均方误差意义 上尽可能地相似于原始图像 。训练后的神经网络便 可用来进行图像压缩 ,隐层神经元矢量 Y 为压缩结果 。 图 3 B P 神经网络压缩图自组织映射神经网络中的神经元可以自动地根据外部刺激的兴奋点来调整自己在由外界信号决定 的参数空间中的位置 。以一种双层神经网络为例 : 其中输入层神经元 ( x1 , x2 , x3 , xn) 简单地反映着 外部刺激 ,在输出层中 , M 个神经元排布成二维网 络 ,其中每个神经元 j 接收两类输入 : 来自输入层神 经元 i 的输入 xi ( 权重为 Wij) 和来自输出层神经元 的固定权重 。对每一个外界输入矢量 X = ( x1 , x2 , x3 , xn) ,只有一个同该输入的距离 d1 =f( X ,Wj) , Wj = ( W1j ,W2j , W3j , Wnj) 为最小的神经元 j 才 被激发 。其中 ,距离函数 f ( X , Wj) 反映了在某一准 则 (一般为平方误差准则) 下 ,矢量 X 与 Wj 之间的 距离 。在网络的训 练 中 我 们 只 需 要 提 供 输 入 矢 量 X ,通过调整从公共的外部输入到每个神经元 j 的连 接权重 Wj ,权重矢量将逐渐指向输入矢量空间的聚 类 。从而实现了输入空间的维数压缩 ,完成了类似 于矢量量化的功能 。2 . 5 小波图像编码 一维连续小波变换可看成原始 信号和一组不同尺度的小波带 通 滤 波 器 的 滤 波 运 算 ,从而可把信号分解到一系列频带上进行分析处理 ,将其离散化后即为离散小波变换 。小波变换图像编 码 压 缩 6 的 核 心 问 题 是 要 对 子带图像进行小波分解系数的量化和编码 。低频子 带图像包含原图像的大部分能量 ,即包含图像的基 本特性 。它在图像重构算法中起主导作用 ,对重建 图像的质量有很大影响 ,因此这部分信号应精确保 留 。高频子图像的系数分布符合广义高斯分布 ,对 其系数进行粗量化编码较为有效 。这也完全符合人 的视觉特性 ,根据对人眼视觉系统的研究可知 ,人眼 视觉灵敏度具有明显的低通特性 ,而且对不同方向 上的敏感度也不一样 ,尤其是对倾斜方向的刺激不 太敏感 ,如人眼对对角线方向子图像系数误差敏感 度较低 ,因此可对对角线方向子图像进行粗量化高 压缩 。小波变换后的能量主要集中在低频系数分量 , 而其他高频系数分量大多为零值 ,这为高倍率压缩 提供了可能 。通过选择合适的具有平滑特性的小波 基 ,就可消除重建图像中出现的方块效应 ,减小量化 噪声 ,获得较好的重建图像质量 。小波变换图像编码压缩方法可分为如下两大类 :基于传统的图像编码方法 、基于分形理论的小波 变换图像编码方法 。基于传统的图像编码方法 7 包括 : 零树小波编码 、基于塔式网格 矢 量 量 化 的 小 波 变 换 编 码 、基 于 LB G 算法的小波变换编码 、基于标量量化的小波变 换编码等 。由于不同分辨率级子图像之间存在着相似性 , 因此 , 利 用 此 相 似 性 , 可 提 高 压 缩 比 8 。J . M . Shapiro 采用零树自嵌套编码方法 ,对小波分解系数 进行压缩 ,在 PSN R = 27 . 54dB 的情况下 ,获得的压 缩比为 1281 。这是最著名的一种小波变换图像编 码压缩方法 。该方法的优点是 :与传统的 DC T 编码 相比 ,它既可以克服方块效应 ,又可以在低比特率下 获得较好的图像主观质量 。缺点是 : 由于它对各子 带采用相同的门限量化 ,因此不能充分利用人眼的 视觉特性 ,限制了图像压缩比的进一步提高 。对此 , A . Said 等人提出了改进算法 。针对分形图像编码尚存在的缺点 ,如编码算法 的耗时 、自然图像不一定具有严格的分形结构而无 法达到预期的高压缩比 、高压缩倍率时的方块效应 等 ,有人提出了基于小波变换的分形编码 9 。它具 有以下特点 :其一 ,采用平滑小波可去除传统分形变 换中存在的方块效应 ;其二 ,小波表示使图像的四叉 树分割十分自然 ;其三 ,可将零树算法看成是该算法 的一个特例 。图像经过金字塔形离散小波变换后的 系数在小波域内可组成分层树状数据结构 小波 树 ,这些跨越不同分辨率的小波树之间存在一定的 相似性 ,可通过分形变换来描述 。基于小波变换的 分形压缩过程就是一个由分层树状结构的顶部开始 一层层地向下预测其余系数的过程 ,而这个由上至 下 、由粗至细的预测过程是通过分形编码来实现的 。基于小波变换的图像编码压缩的特点是 1 0 ,压缩比高 ,压缩速度快 ,压缩后能保持信号与图像的特 征不变 ,且在传递过程中就可以抗干扰 。从现在的研究结果可看到 ,该方法已获得了较好的编码效果 ,是现代图像压缩技术研究的热点之一 ,也是十分有 前途的一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论