浅析基于IWT和FCM的曲线矢量数据压缩方法(全文)_第1页
浅析基于IWT和FCM的曲线矢量数据压缩方法(全文)_第2页
浅析基于IWT和FCM的曲线矢量数据压缩方法(全文)_第3页
浅析基于IWT和FCM的曲线矢量数据压缩方法(全文)_第4页
浅析基于IWT和FCM的曲线矢量数据压缩方法(全文)_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

精品文档-下载后可编辑浅析基于IWT和FCM的曲线矢量数据压缩方法(全文)摘要:矢量数据压缩对于gis数据的存储、网络传输以及在移动设备中的使用都具有重要意义。在此通过对曲线矢量数据特点的分析,提出基于整数小波变换的矢量数据压缩方法。压缩方案包括3个主要流程:矢量数据整型化。曲线矢量数据具有相邻坐标点间坐标值大小差别不大的特点,将坐标点间的差值转换为整型的偏移量,用偏移量表示矢量数据的坐标点,利用整数小波变换处理偏移量序列。实验表明,偏移量序列经过整数小波变换得到的小波系数序列在空间分布上更加集中,适合使用高效的编码压缩方法;对变换后的小波系数进行编码压缩。在此使用模糊c均值聚类字典法编码实现了曲线矢量数据的有损编码。通过实验和其他压缩算法结果的对比,该方法具有压缩比较高,失真小的特点。关键词:空间矢量数据;整数小波变换;模糊c均值聚类;字典法编码;shp

methodofcurvevectordatacompressionbasedoniwtandfcm

zhangjun-lan1,wangyi2

(1.collegeofinformationscienceandtechnology,beijingnormaluniversity,beijing100875,china;

2.oceanuniversityofchina,qingdao266003,china)

abstract:thevectordatacompressionhasgreatsignificanceingisdatastorage,networktransmissionanditsapplicationinmobiledevices.acompressionmethodbasedontheintegerwavelettransform(iwt)andfuzzycmeans(fcm)isproposedaccordingtotheanalysisforthecharacteristicofcurvevectordata.thecompressionschemeincludes3steps:integerformofvectordata,offsetsequenceprocessingwithiwtandcodingcompressionoftransformedwaveletcoefficients.thelossycodingofcurvevectordatawasrealizedwiththedictionarycodingoffcm.comparedwithotheralgorithms,this?method?hasthecharacteristicsofhighcompressionratioandlessdistortion.keywords:spatialvectordata;integerwavelettransform(iwt);fcm;dictionaryencoding;shp

对矢量化后的地形图等进行压缩处理的过程称之为空间矢量数据的压缩。地图数字化中矢量数据的压缩主要包括各种地形图要素的数据压缩。等高线是地图中最多的图形要素,所以对矢量化后的地图的数据压缩主要是对曲线的压缩,目前讨论最多的也是曲线矢量数据的压缩。在此针对矢量数据的压缩问题进行研究。

传统的矢量数据压缩方法的核心思想是从矢量数据的坐标点集中运用一定的算法抽取出最能体现矢量数据特征的子集。这类曲线矢量数据压缩算法主要有:垂距限值法、角度限值法、douglas-peucker算法(splitnig算法),以及黄培之提出的具有预测功能的曲线矢量数据压缩方法等[1-3]。

近年来,矢量数据的量化编码压缩算法的研究得到重视。钟尚平等[4]根据平面矢量地图文件的存储特性,有机结合“无附加码书”字典编码方法,可逆并显著地压缩了矢量地图。王立胜等[5]基于第二代小波变换理论实现了对空间矢量数据的无损压缩。黄越峰等提出了使用基于整数小波变换和ffep编码的曲线数据压缩方法[6]。kolesnikov等提出了链码方法用于矢量数据压缩[7]。

本文首次提出结合实际矢量数据文件的存储结构和曲线矢量数据的特性,将浮点型的矢量数据坐标值预处理成整型值表示的坐标值之间的偏移量。进而引入先进的整数小波变换对整型的偏移量序列进一步处理,分析变换后的小波系数的幅值,分布等特征后,采用了高效的基于模糊c均值聚类和字典法编码方案进行压缩存储。实验结果表明,本文的压缩方法能够达到较高的无损压缩比。

1矢量数据的整型化

矢量数据文件一般包括表示数据属性和存储结构的元信息和实际图形的坐标点序列,其中浮点型坐标点序列占据了文件的绝大部分存储空间。对矢量数据文件进行压缩主要是对坐标点序列进行压缩。

对于二维的平面矢量数据,坐标点序列由?x坐标序列和y坐标序列组成。由于使用浮点型表示,每个坐标值占用的存储空间为8个字节。本文使用的是基于整数小波变换的压缩方法,因此首先是将坐标点序列用整型数表示。

由于同一曲线和多边形实体的坐标点序列是密集的和顺序的,因此相邻点间的坐标值之差的变化范围很小,可以用整型数来表示。对于由n个点序列([xn,yn],n=0,1,2,…,n-1)表示的曲线或多边形实体,坐标值整型化为([x′n,y′n]n=0,1,2…?n-1)?过程如下:

步骤1:记录x0,y0,令x??0??′=0,y??0??′=0。

步骤2:对于n=1,2,…,n-1,x′n=xn-x?n-1?y′n=yn-y?n-1?。

步骤3:已知xn的最高精度为10?-p?,yn的最高精度为10?-q?,则x′n=x′n×10p,y′n=y′n×10q。?

2整数小波变换及其在矢量数据压缩中的应用

2.1整数小波变换

传统的小波变换又称为第一代小波变换,其变换过程主要是利用小波滤波器组对图像行列分别滤波,进行卷积运算,由于都是实数域的变换,即使待分析信号本身是整数序列,相应小波变换系数也是实数。由于数字图像一般都是用整数表示,非常希望有一种“整数-整数小波变换”,将整数序列映射为整数小波系数,并且这种映射是可逆的,具有这种性质的小波变换称为整数小波变换(iwt)。sweldens等提出的提升(lifting)小波变换方法是一种新的小波变换工具,利用它可以不采用傅里叶变换作为主要分析工具,能够很容易地构造一般的整数小波变换[8]。

2.2整数小波变换在曲线矢量数据压缩中的应用

整数小波变换可以将数据的绝大部分能量压缩到低频系数中,只有少部分在高频系数中。利用整数小波变换的这个特性可以实现数据的压缩。近年来基于整数小波变换的图像压缩已经成为一个研究热点[9]。

为了直观说明整数小波系数分布的特点,本文对国家铁路线曲线矢量数据(shp格式)使用第1节中的整型化处理后,进行了两层整数小波变换分解,并对小波系数进行统计分析如图1所示。

图1全国铁路线曲线矢量数据

经过对图2的数据点分布图和图3的整数小波系数分布图进行对比,可以发现数据点经整数小波变换后得到的小波系数在空间分布上聚集性更强,大量的幅值分布在零附近,达到了去相关的目的,适合于采用高效的编码压缩方法。

图2整型化处理后的数据点分布图

图3数据点经整数小波变换后的小波系数空间分布图

3基于整数小波变换(iwt)和模糊k-均值聚类的编码压缩方案

3.1压缩流程

使用iwt变换压缩曲线矢量数据的原理是通过iwt变换将空间域的坐标串变换为频率域的小波系数序列,对系数序列进行量化和编码获得压缩数据流。在使用iwt变换前,将同一条曲线或者多边形实体的矢量数据组成一个待压缩子块。对每个块中的x和y坐标序列使用第一节中整型化方法转化成整型的偏移量序列。对得到的整型偏移量序列进行整数小波变换,得到小波系数序列。对小波系数进行编码,得到压缩后的矢量数据。压缩流程如图4所示。

图4iwt曲线矢量数据压缩流程

3.2整数小波系数编码

由2.2节的统计分析可知,曲线矢量数据经过整型化和整数小波变换处理后得到的整数小波系数在空间分布上非常集中,大量的幅值集中在零附近。本文针对这个特点,提出使用改进的一维模糊c-均值聚类算法对整数小波系数进行聚类,建立系数字典,将整数小波系数转换为其所属类均值对应的字典索引,从而实现快速高效的编码。

3.2.1模糊c-均值聚类(fcm)

设?{xi,i=1,2,…,n}是n个样本组成的样本集合,预定类别数目c,mi,i=1,2,…,c为每个聚类的中心,μj(xi)是第i个样本对于第j类的隶属度函数。用隶属度函数定义聚类损失函数lμ:?

l?μ?=∑cj=1∑ni=1[μ?j?(x?i?)]bd?i?2?j?(1)

式中:?d?i??j?=x?i?-m?j?为第i个样本与第j个聚类中心间的欧几里得距离;b∈(1,∞)是可以控制聚类结果模糊程度的常数。

模糊c-均值方法[10]要求每个样本对于各个聚类的隶属度之和为1。?即要满足:

∑cj=1μj(xi)=1,i=1,2,…,n(2)

使用拉格朗日乘数法进行推导,可以得到使式(1)取极小值的必要条件:

mj=∑ni=1[μj(xi)]bxi/∑ni=1[μj(xi)]b(3)

μ?j?(x?i?)=1/∑ck=1(d?i??j?/d?ik?)?2/(b-1)?(4)

由上述2个必要条件,模糊c-均值聚类算法是一个简单的迭代过程。算法步骤如下:

步骤1:设定聚类数目c和参数b。

步骤2:初始化各个聚类中心mi。

步骤3:根据式(4)计算隶属度函数。如果小于?某个?确定的阈值,或相对上次隶属度函数值的改变量小于某个阈值,算法停止。

步骤4:根据式(3)更新各类聚类中心。

3.2.2使用fcm字典法对整数小波系数编码

分别

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论