




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第1节高光谱数据降维与可分性准则
武汉大学遥感信息工程学院
龚龑
《高光谱遥感》第四章高光谱数据处理1第一页,共四十七页。一、高光谱数据的降维问题二、类别可分性准则三、基于几何距离的可分性准则四、基于类的概率密度的可分性准则第四章第1节高光谱数据降维与可分性准则2第二页,共四十七页。高光谱分辨率的影响在给定的波长区间内,高的光谱分辨率导致影像波段数众多、连续。一方面,高光谱遥感的核心优势是反映光谱特征的细微差异;另一方面众多的波段数目给数据处理带来新的问题。一、高光谱数据的降维问题1.1高光谱数据的高维特征3第三页,共四十七页。波谱空间与光谱空间波段数众多导致光谱空间维数的增多高光谱多光谱灰度值灰度值一、高光谱数据的降维问题1.1高光谱数据的高维特征波段数众多导致波谱曲线信息的丰富“维数”是指光谱空间的维数4第四页,共四十七页。
高光谱影像属于高维空间数据,已有的研究结果表明,这种数据有许多不同于低维数据的分布特性,这些特性决定了人们在对高光谱影像分析时应采用不同策略和方法。一、高光谱数据的降维问题1.1高光谱数据的高维特征5第五页,共四十七页。1.信息冗余大
波段数量多,但并非每个波段在任何时候都是有用信息。波段之间的相关性导致信息冗余很大,尤其是相邻波段之间的相关性很强。一、高光谱数据的降维问题1.2高维特征带来的新问题例如:对于有N个波段的高光谱数据来讲,当前应用需求是区分w1类和w2类。如果利用任意一个波段都能达到这个目的,那么,仅取一个波段就包含了足够信息,其余N-1维特征就是多余的。6第六页,共四十七页。根据超维立方体的体积公式,随着空间维数的增加,超立方体的体积急剧增加,并且向角部分布。一、高光谱数据的降维问题1.2高维特征带来的新问题2.超维几何体体积7第七页,共四十七页。一、高光谱数据的降维问题1.2高维特征带来的新问题2.超维几何体体积伽马函数超立方体中内切求的体积与超立方体之比8第八页,共四十七页。例如:密度分析GRID算法一、高光谱数据的降维问题1.2高维特征带来的新问题2.超维几何体体积由于体积因素影响,高维空间中数据的分布呈现出稀疏、严重不规则等特点,使得常规的分析算法效果不佳。
9第九页,共四十七页。思考:既然不同波段包含了不同光谱信息,那么,在利用遥感影像分类时,是否波段越多,分类越精确?研究表明,事实并非如此一、高光谱数据的降维问题1.2高维特征带来的新问题3.“维数灾难”问题10第十页,共四十七页。一、高光谱数据的降维问题1.2高维特征带来的新问题3.“维数灾难”问题11第十一页,共四十七页。这说明高光谱数据区分地类之间的能力极大地受到训练样本的限制,在分析高光谱影像时,要获得好的分类精度就需要更多的训练样本。如果训练样本不足时,往往会出现在样本点数目一定的前提下,分类精度随着特征维数的增加“先增后降”的现象,这就是所谓的Hughes”维数灾难”现象。一、高光谱数据的降维问题1.2高维特征带来的新问题3.“维数灾难”问题12第十二页,共四十七页。随着空间维数的增加,要得到同样精度的估计值将需要更多的样本数。研究表明,对于监督分类而言,若要得到比较满意的分类结果:一、高光谱数据的降维问题1.2高维特征带来的新问题4.高维空间中的参数估计问题线性分类器需要的样本数与空间的维数呈线性关系。对于基于二次估计量的分类器,所需的样本数与空间的维数呈平方关系。13第十三页,共四十七页。模式识别的类别统计信息向量均值和方差等根据训练样本估算出来训练样本的数目相对于特征空间的维数的比例参数估计不准确分类精度较低多光谱图像高高光谱图像低一、高光谱数据的降维问题1.2高维特征带来的新问题4.高维空间中的参数估计问题因此,“维数灾难”现象可以从样本数量与数据复杂度关系理论来解释分类精度较高参数估计较准确14第十四页,共四十七页。
在高维数据空间中,除了数据点分布的绝对位置以外,数据分布的形状和方向对于分类具有更加重要的影响作用。一、高光谱数据的降维问题1.2高维特征带来的新问题5.高阶统计特性15第十五页,共四十七页。一、高光谱数据的降维问题1.2高维特征带来的新问题5.高阶统计特性16第十六页,共四十七页。在低维空间,只使用均值向量进行分类的结果比只使用方差信息得到的结果的精度高,说明在此种情况下,在分类过程中数据分布的位置比分布的形状和方向作用要大的多,这也是人们通常遇到的情况。但是,当维数增加时,只考虑均值信息进行分类的精度并不再增加,而考虑方差信息的分类精度却随着特征维数的增加而继续增加。一、高光谱数据的降维问题1.2高维特征带来的新问题5.高阶统计特性17第十七页,共四十七页。综上所述,高维特征引起了多种问题因此,在高光谱数据应用的特定阶段,可以对高维数据进行降维处理,得到具有代表意义的低维光谱特征,并在低维光谱空间中进行相应分析(聚类分析)。信息冗余大超维几何体体积“维数灾难”问题高维空间中的参数估计问题高阶统计特性一、高光谱数据的降维问题1.2高维特征带来的新问题18第十八页,共四十七页。若为D维空间中的一个容量为N的数据集合,假设其来自于维数为D的某一数据集的采样。降维的目标是探求数据集合适的低维坐标描述,将原数据集合投影到低维空间,获得原数据集合的低维简洁表示。一、高光谱数据的降维问题1.3高光谱降维方法:波段选择特征变换19第十九页,共四十七页。注意不要走向另一个极端:降维绝对不是对高维光谱信息的舍弃,而是立足于高维数据,针对不同的使用目的得到相应低维数据。图书馆的书种类繁多,不同专业的同学各取所需,只选一小部分,但并不意味着其它的书是多余的。一、高光谱数据的降维问题1.3高光谱降维20第二十页,共四十七页。高光谱数据降维的方法波段选择特征变换具体内容在下一讲中介绍
降维后得到的低维特征空间是否有效进行类别区分?一、高光谱数据的降维问题1.3高光谱降维21第二十一页,共四十七页。一、高光谱数据的降维问题二、类别可分性准则三、基于几何距离的可分性准则四、基于类的概率密度的可分性准则第四章第1节高光谱数据降维与可分性准则22第二十二页,共四十七页。降维得到低维特征形成特征空间分布不同可分性存在差异衡量可分性?可分性判据定量化的指标指导降维二、类别可分性准则2.1高光谱数据降维与类别可分性判据的关系23第二十三页,共四十七页。概念:从高维数据中得到了一组用来分类的特征,需要一个定量的标准来衡量特征对分类的有效性。2.2可分性准则基本概念可分性准则二、类别可分性准则可分性准则的主要类型:基于几何距离的可分性准则基于概率密度的可分性准则特点:通过已知类别先验知识,衡量当前特征空间对类别的区分效果。24第二十四页,共四十七页。一、高光谱数据的降维问题二、类别可分性准则三、基于几何距离的可分性准则四、基于类的概率密度的可分性准则第四章第1节高光谱数据降维与可分性准则25第二十五页,共四十七页。不同的类别不同的分布区域类别可分性区域可分性区域可分性通过几何距离来度量三、基于几何距离的可分性准则3.1基本思想26第二十六页,共四十七页。1.点与点的距离在维特征空间中,特征点与特征点之间的欧氏距离为:3.2几何距离可分性准则原理三、基于几何距离的可分性准则27第二十七页,共四十七页。当前点与点集中每个点逐个计算距离2.点与点集的距离3.2几何距离可分性准则原理三、基于几何距离的可分性准则28第二十八页,共四十七页。总体的均值矢量类内的均值矢量3.类内及总体的均值矢量3.2几何距离可分性准则原理三、基于几何距离的可分性准则29第二十九页,共四十七页。类内均方欧氏距离定义为:类内均方距离也可定义为:3.2几何距离可分性准则原理4.类内距离先求出各自到类心的距离的平方,再求和两两运算,不涉及类心三、基于几何距离的可分性准则30第三十页,共四十七页。类内离差矩阵,反映类内部样本在均值周围的散布情况。(矩阵的迹)与类内均方欧氏距离的关系:3.2几何距离可分性准则原理5.类内离差矩阵三、基于几何距离的可分性准则31第三十一页,共四十七页。两类样本之间的距离X1X2X3Y1Y2A类B类两两之间3.2几何距离可分性准则原理6.两类之间的距离三、基于几何距离的可分性准则32第三十二页,共四十七页。取欧氏距离时,总的均方距离为总的样本距离两类样本之间的距离类与类两两求和3.2几何距离可分性准则原理7.各类总的均方距离三、基于几何距离的可分性准则33第三十三页,共四十七页。第i类的离差矩阵第i类的比例A.总的类内离差矩阵3.2几何距离可分性准则原理7.多类情况离差矩阵三、基于几何距离的可分性准则34第三十四页,共四十七页。第i类样本均值总体样本均值每一类只有一个代表B.类间离差矩阵3.2几何距离可分性准则原理7.多类情况离差矩阵三、基于几何距离的可分性准则35第三十五页,共四十七页。任一样本实质是样本总体的协方差矩阵不涉及类的概念总体样本均值C.总体离差矩阵3.2几何距离可分性准则原理7.多类情况离差矩阵三、基于几何距离的可分性准则36第三十六页,共四十七页。点与点的距离点到点集类内的均值矢量类内距离类内均方距离类内离差矩阵总体的均值矢量两类之间的距离总体离差矩阵各类模式之间总的均方距离如何通过几何距离衡量可分性?三、基于几何距离的可分性准则3.3判据构造1.离差矩阵分析37第三十七页,共四十七页。样本的散布程度样本越分散矩阵数值越大类的内部越紧密越好类之间越分散越好降维方案1降维方案2样本的类别信息已知越小越好越大越好情况复杂三、基于几何距离的可分性准则3.3判据构造1.离差矩阵分析38第三十八页,共四十七页。原则:数值的大小直接体现降维后特征空间的类别可分性。常见判据:3.3判据构造2.依据可分性准则构造判据三、基于几何距离的可分性准则39第三十九页,共四十七页。一、高光谱数据的降维问题二、类别可分性准则三、基于几何距离的可分性准则四、基于类的概率密度的可分性准则第四章第1节高光谱数据降维与可分性准则40第四十页,共四十七页。先验概率后验概率条件概率在样本集中,预先已知的某一类出现的概率P(Wi)对于样本集中的某一模式x,它属于某类Wi的概率P(Wi|x)在某一类Wi中,模式x出现的概率P(x|Wi)4.1基本概念回顾四、基于概率密度的可分性准则41第四十一页,共四十七页。W1
W2
P(x|W1)P(x|W2)P100%0%W2W1100%W1
W2
P(x|W1)P(x|W2)P0%W1W2各类的条件概率密度函数P(x|Wi)重叠度越低,特征可分性越好。四、基于概率密度的可分性准则4.2概率密度分析42第四十二页,共四十七页。可分性判据的设定衡量概率密度重叠度立足于基本性质:
Jp>=0;当两类概率密度完全不重叠时,Jp取最大值;当两类概率密度完全重叠时,Jp等于0;两类概率密度具有“对称性”。四、基于概率密度的可分性准则4.3基本性质43第四十三页,共四十七页。进行相关性运算,实际上是对两个概率密度函数进行卷积运算。两个概率密度函数越重合,卷积结果越大;当二者完全重合时,相当于对p(x)进行全概率积分,等于1;当二者完全分离时,卷积结果等于零。在开区间(0,1)内,y=-ln(x)取值范围为0至正无穷大。(性质1,2,3)四、基于概率密度的可分性准则4.4Bhattacharyya判据44第四十四页,共四十七页。更具一般性的判据:S=0.5时,Chernoff判据即为Bhattacharyya判据四、基于概率密度的可分性准则4.5Chernoff判据45第四十五页,共四十七页。特征空间对w1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年湖北轻工职业技术学院单招职业倾向性测试题库一套
- 员工参股合同范本
- 2025年河北工业职业技术大学单招职业技能测试题库一套
- 现代农业科技在办公自动化中的应用
- 2025-2030年中国电子标签读写器市场运行趋势规划研究报告
- 2025-2030年中国牛磺酸行业运行态势及发展建议分析报告
- 科技企业社交媒体运营的新趋势与策略
- 社交金融背景下的现代银行服务模式研究
- 2025-2030年中国水果批发市场运营现状及发展规划分析报告
- 2025-2030年中国板式换热器产业运行状况及发展趋势预测报告
- 小学三年级数学口算天天练-A4纸直接打印
- 2025年亿达商学院成立仪式及论坛经验总结(三篇)
- (2025)驾照C1证考试科目一必考题库及参考答案(包过版)
- 2025年湖南理工职业技术学院高职单招职业技能测试近5年常考版参考题库含答案解析
- 罕见病诊治与病例管理制度
- 课题申报书:“四新”建设与创新创业人才培养基本范式研究
- 妇科常见急危重症护理
- 春季高考高职单招数学模拟试题七套含答案
- 2024-2025学年陕西省宝鸡市高三上学期高考模拟检测(一)英语试题(含解析)
- 2025年企业的演讲稿例文(2篇)
- 电瓶三轮车安全培训
评论
0/150
提交评论