第八章特性提取_第1页
第八章特性提取_第2页
第八章特性提取_第3页
第八章特性提取_第4页
第八章特性提取_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

TableofContents8.1

基本概念特征选择与提取是模式识别中重要而困难的一个环节:分析各种特征的有效性并选出最有代表性的特征是模式识别系统设计的关键步骤。降低特征维数在很多情况下是有效设计分类器的重要课题。计算上更易实现。消除特征间的相关性,使新特征更有利于分类。引言数据获取预处理特征提取

与选择分类决策分类器

设计信号空间特征空间xa8.1.1三大类特征三大类特征:物理、结构和数学特征物理和结构特征:易于为人的直觉感知,但有时难于定量描述,因而不易用于机器判别。数学特征:易于用机器定量描述和判别,如基于统计的特征。讨论的重点是根据学习样本来选择和提取数学特征,而物理和结构特征的测量与分析涉及研究对象本身的物理规律。引言8.1.2有关特征的基本概念特征形成(acquisition):信号获取或测量→原始测量,其值域称为测量空间:对象表示x=测量空间的点原始特征:通过基本计算产生基本特征y实例:数字图象中的各像素灰度值人体的各种生理指标原始测量和原始特征分析:原始测量不能反映对象(类别)本质高维原始特征不利于分类器设计:计算量大,数据冗余,样本分布十分稀疏。引言特征的选择与提取两类提取有效信息、压缩特征空间的方法:特征提取和特征选择特征提取(extraction):用映射(或变换)的方法把高维原始特征变换为较少的新特征。特征选择(selection)

:从原始特征中挑选出一些最有代表性、分类性能最好的特征。特征的选择与提取与具体问题有很大关系,目前没有理论能给出对任何问题都有效的特征选择与提取方法。引言特征的选择与提取举例细胞图像自动分类:原始测量:(正常与异常)细胞的数字图像原始特征(特征的形成,找到一组代表细胞性质的特征):细胞面积,胞核面积,形状系数,光密度,核内纹理,核浆比等等压缩特征:原始特征的维数仍很高,需压缩以便于分类特征选择:挑选最有分类信息的特征,方法有:专家知识,数学方法特征提取:数学变换,消除特征之间的相关性。傅立叶变换或小波变换用PCA方法作特征压缩引言8.2基于类别可分性判据的特征提取特征提取:用映射(或变换)的方法把高维原始特征变换为较少的新特征。线性变换:特征有效性=类别可分性

类别可分性判据J:衡量不同特征及其组合对分类是否有效的定量准则基于可分性判据的特征提取,就是求最优变换W*基于距离可分性判据的特征提取样本类间

离散度矩阵样本类内

离散度矩阵类间可分离性判据可分性判据8.3主成分分析方法特征提取:用映射(或变换)的方法把高维原始特征变换为较少的新特征主成分分析PCA(PrincipleComponentAnalysis)方法:K.Pearson提出,从一组特征中计算出一组按重要性排列的新特征,它们是原特征的线性组合,并且相互之间不相关。第一主成分变换特征

提取构造拉格朗日函数:第一主成分变换特征

提取最优解推广特征

提取数据中大部分信息集中在较少的几个主成分上根据给定的比例,选择适当数目的主成分作为样本的新特征8.4K-L(Karhunen-Loeve)变换特征提取:

用映射(或变换)的方法把高维原始特征变换为较少的新特征K-L(Karhunen-Loeve)变换:

特征降维变换后,不能完全地表示原有的对象,信息总会有损失。希望找到一种信息能量最为集中的的变换方法,使降维后信息损失最小。最优正交线性变换。K-L变换(展开)离散K-L变换:对(随机)向量x用确定的完备正交归一向量组(系)uj展开特征

提取组合系数有限项K-L展开的均方误差用有限项估计x

:该估计的均方误差:特征

提取记矩阵则求解最小均方误差正交基用Lagrange乘子法,得到:结论:以相关矩阵R的d个本征向量为基向量来展开x时,其均方误差为:K-L变换:当取矩阵R的d个最大本征值对应的本征向量来展开x时,其截断均方误差,在所有用d维正交坐标系展开中最小。这d个本征向量组成的正交坐标系称作x所在的D维空间的d维K-L变换坐标系,x在K-L坐标系上的展开系数向量y称作x的K-L变换特征

提取K-L变换的表示K-L变换的向量展开表示:K-L变换的矩阵表示:特征

提取K-L变换的性质K-L变换是信号的最佳压缩表示,误差最小。y的相关矩阵是对角矩阵,即各分量互不相关。特征

提取K-L坐标系将相关函数矩阵对角化K-L坐标系将相关函数矩阵对角化,即通过K-L变换消除原有向量x的各分量间的相关性,从而有可能去掉那些带有较少信息的分量以达到降低特征维数的目的。特征

提取K-L变换图解x1x2u2u1二次

曲线方程标准二次

曲线方程特征

提取等概率密度轨迹K-L变换的数据压缩例解以2x1变换为例,有两个本证向量,取变换矩阵U=[u1],则x的K-L变换y为:

y=UTx=u1Tx=y1变换的能量损失为特征

提取未知类别样本的K-L变换常用总体样本的协方差矩阵C=E[(x-μ)(x-μ)T]

进行K-L变换,K-L坐标系U=[u1,u2,...,ud]按照C的本征值的下降次序选择。例:设一样本集的协方差矩阵是:

求最优2x1特征提取器U

解答:计算特征值及特征向量[V,D]=eig(C);

特征值D=[24.736,2.263]T,特征向量:

由于λ1>λ2,故最优2x1特征提取器

此时的K-L变换式为:特征

提取8.5

讨论特征的选择与提取是模式识别中重

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论