模式识别-第11讲-基于K-L展开式的特征提取_第1页
模式识别-第11讲-基于K-L展开式的特征提取_第2页
模式识别-第11讲-基于K-L展开式的特征提取_第3页
模式识别-第11讲-基于K-L展开式的特征提取_第4页
模式识别-第11讲-基于K-L展开式的特征提取_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

模式识别

授课教师薛耀红xueyh@第11讲基于K-L变换的特征提取回顾:两类提取有效信息、压缩特征空间的方法:特征提取

(extraction):用映射(或变换)的方法把原始特征变换为较少的新特征特征选择(selection)

:从原始特征中挑选出一些最有代表性,分类性能最好的特征常见类别可分离性判据:-基于距离的可分性判据-基于概率密度分布的判据基于K-L展开式的特征提取K-L变换,是一种常用的正交变换,K-L变换常用来作为数据压缩,这里我们用它作降维。学习这一节主要要掌握以下几个问题:1.什么是正交变换;2.K-L变换是一种最佳的正交变换,要弄清是什么意义的最佳,也就是说它最佳的定义;3.K-L变换的性质;4.K-L变换的重要应用。

基于K-L展开式的特征提取正交变换概念变换是一种工具,它的用途归根结底是用来描述事物,特别是描述信号用的。例如我们看到一个复杂的时序信号,希望能够对它进行描述。描述事物的基本方法之一是将复杂的事物化成简单事物的组合,或对其进行分解,分析其组成的成分。例如对一波形,我们希望知道它是快速变化的(高频),还是缓慢变化的(低频),或是一成不变的(常量)。如果它既有快速变化的成分,又有缓慢变化的成分,又有常量部分,那么我们往往希望将它的成分析取出来。这时我们就要用到变换。基于K-L展开式的特征提取正交变换概念变换的实质是一套度量用的工具,例如用大尺子度量大的东西,用小尺子度量小的东西,在信号处理中用高频,低频或常量来衡量一个信号中的各种不同成分。对某一套完整的工具就称为某种变换。如傅里叶变换就是用一套随时间正弦、余弦变化的信号作为度量工具,这些正弦,余弦信号的频率是各不相同的,才能度量出信号中相应的不同频率成分。基于K-L展开式的特征提取图6-1图6-2a图6-2b例如,图6-1中的信号只有一个单一频率的简谐信号,而图6-2(a)中信号就不是一个简谐信号所描述的,它起码可以分解成图6-2中的两个成分,一是基波,另一是三次谐波。基于K-L展开式的特征提取由此可以看出,对事物可以有不同的描述方法,如图6-2(a)是对信号的一种描述,而图6-2(b)则利用成分分解,得到该事物的另一种描述。当将一事物从一种描述转换成另一种描述时,就要用不同的工具,因而每一套工具称为一种变换。为了对复杂事物进行经济有效的描述,我们希望将其分解成相互独立的成分,譬如我们分析其快速变化的成分时,就希望它只不再混杂其它成分。傅里叶变换为例,希望它分析出某种频率的成分,就不要包含其它任何频率的成分。这就要求,作为变换的工具中的每个成分是相互独立的,用其中某一个工具就只能从信号中分析出一种成分,而分析不出其它成分。基于K-L展开式的特征提取

用变换对信号进行分析,所使用的数学工具是点积。点积的实质就是两个信号中相同成分之间乘积之总和。图6-3(a)中是两个随时间连续变化的信号,它们之间的点积运算定义为图6-3a在这里同一成分是指同一时刻t两个信号的值F(t)与G(t)。积分就是在整个时间域上求和。基于K-L展开式的特征提取图6-3(b)中的向量A与B在一个二维空间定义,它们两者分别含有成分为(a1,a2)与(b1,b2),a1与b1是两者的同一种成分,a2与b2则是另一种成分。故它们的点积定义为a1b1+a2b2,在这种条件下就不需要积分,而只是简单求和。图6-3b基于K-L展开式的特征提取点积运算的结果是一个数值,或大于零,小于零或等于零等于零的情况在图6-3(b)中出现在A与B之间夹角为90°的情况,这表明B中没有A的成分,A中也没有B的成分,因此又称相互正交。由此我们知道作为一种变换,如果这种变换中的每一种成分与其它成分都正交时,它们之间的关系就相互独立了,每一种成分的作用是其它成分所不能代替的。拿傅里叶变换来说,频率为f的成分只能靠变换频率为f的成分去析取。另一方面也说明了这套变换必须是完备的,也就是它必须包含一切必要的成分,例如必须有基波的任何一次整数倍频率的谐波,否则就会对信号分析不全面。基于K-L展开式的特征提取上式中要求uiTuj=1,是考虑到ui是作为度量事物的单位应用的,它本身的模应该为1,ui又称为某一个基。而被分解后的任何事物(在此指信号)可等成各种成分之和。故任一信号X可表示成:

其中ci是相应基ui的相应成分。综合以上分析,我们可以将对这种变换的定义总结为:

如果将这种变换中的每一成分,用一个向量ui表示,i是其下标,原理上可以到∞,则我们要求的正交变换可表示成:基于K-L展开式的特征提取基于Karhunen-Loeve变换的特征提取方法是以在特征空间分布的样本特征向量为原始数据,通过实行K-L变换,找到维数较少的组合特征,达到降维的目的。由于样本的描述都是离散的向量,因此我们只讨论K-L变换的离散情况。K-L变换:对给定一个D维训练样本集(原始特征空间),进行特征空间的降维,降到d维,d<D。也就是说将d+1维以上的成分略去,显然原信号会因此受到一些损失。基于K-L展开式的特征提取K-L变换的最佳体现在对给定一个训练样本集条件下,能使这种误差从总体上来说是最小。注意这里讲的是总体,这是因为降维以后,训练样本集中的每个样本数据都受到损失,要衡量的是总体效果。这种情况下最常用的指标是均方误差最小,或称均方误差的期望值最小。这就是说要找的正交变换能使一组样本集的均方误差的期望值为最小。基于K-L展开式的特征提取K-L变换是一种正交变换,即将一个向量x,在某一种坐标系统中的描述,转换成用另一种基向量组成的坐标系来表示。这组基向量是正交的,其中每个坐标基向量用uj表示,j=1,…,∞,因此,一个向量x可表示成我们将表示的无限多维基向量坐标系统改成有限维坐标系近似,即:基于K-L展开式的特征提取我们希望在同样维数条件下,使向量X的估计量误差最小。确切地说是使所引起的均方误差为最小。X基于K-L展开式的特征提取要使均方误差最小是一个求极值的问题,即求最佳的正交变换的基ui,i=1,…∞。因此还要满足变换是正交归一这个条件,因此这是一个求条件极值的问题,一般方法是利用拉格朗日乘子法将条件数值转换成一个求无条件极值的问题,实质求解过程是对拉格朗日函数g(ui)求偏导而得出的结果。

基于K-L展开式的特征提取基于K-L展开式的特征提取基于K-L展开式的特征提取用矩阵ψ=E[xxT

]

的前d

个本征值(从大到小排列)对应的本征向量作为基来展开x

时,截断误差在所有用d

维正交坐标系展开中是最小的。uj

,j=1,2,…,d

张成了新的特征空间.展开系数cj=ujTx,

j=1,2,…,d

则组成了新的特征向量.基于K-L展开式的特征提取向量应是矩阵的特征值的特征向量,而此时截断误差为。如将按其大小顺序排列,即则取前d项特征值对应的特征向量组成的坐标系,可使向量的均方误差为最小。满足上述条件的变换就是K-L变换。基于K-L展开式的特征提取K-L变换的基并没有固定的形式,它是从对给定数据集{x}进行计算产生的。换句话说,给定的数据集不同,得到的K-L变换基函数也因此而不同。正是因为它对给定数据集{x}存在依赖关系,它在降低维数时仍能较好地描述数据,因此是模式识别中降低特征空间维数的有效方法。但是由于它的正交基函数族是从训练样本集中计算出来的,因此并不存在一种对任何数据都适用的K-L变换基,一般的作法是先用一组训练数据计算出K-L变换基,然后用这组基来分析其它数据。K-L变换的性质2.展开系数互不相关K-L展开式的第一个重要性质是展开系数彼此无关的,即任意两个系数乘积的期望为其中:ij为Kronecker积。说明:因为 来自样本,K-L坐标系将其作了对角化,消除了原向量x各分量之间的相关性。从而可能消去带有较少信息的坐标轴,降低空间的维数。例如,简化坐标:3.表示熵信息熵是对于不确定性的度量。K-L变换的实质是使矩阵的D个特征值中,只有几个是较大的,其余较小,因此,K-L坐标系可以有效地进行信息压缩。说明:1如果所有的特征值相等,即同等重要,则HR取最大值。2如果熵值=0,则表示x的所有信息仅由一个展开项表示即可。3熵函数叫做表示熵,可以用来估计信息压

缩的程度。4对同一特征向量集{x},K-L坐标系下的表示熵为最小。4.总体熵一般说来,各类均值向量通常包含有较多的判别信息。选择这样一些特征量,使当用同一类的这些特征量的均值所组成的向量代表该类的样本用来进行分类时,所引起的分类不确定性度量最小。可以用总体熵来度量这种分类的不确定性。总体熵可以作为类均值向量代表同类各样本的不确定性的一种度量。总体熵的意义总体熵的意义K-L坐标系的生成数据集合{x}的K-L坐标系是由二阶统计量来确定的。可以使用以下几种方法来生成K-L坐标系:样本所属类别未知时:1、可以使用样本的自相关矩阵2、对于无类别标签的样本集,均值向量无意

义,也常使用协方差矩阵

样本所属类别已知时:可以使用各种二阶矩,得到不同的K-L坐标系1、使用总类内离散度矩阵使用条件:(1)样本集合{x}有类别标签(2)各类的先验概率已知(3)均值向量已知(4)协方差矩阵已知

2、每次使用一个类别样本集合来建立K-L坐

标系。

该K-L变换常用于信息压缩,很少用于分类。未知类别样本的K-L变换举例用总体样本的协方差矩阵C=E[(x-μ)(x-μ)T]

进行K-L变换,K-L坐标系U=[u1,u2,...,ud]按照C的本征值的下降次序选择例:设一样本集的协方差矩阵是:

求最优2x1特征提取器U

解:计算特征值及特征向量[V,D]=eig(C);

特征值D=[24.736,2.263]T,特征向量:

由于λ1>λ2,故最优2x1特征提取器

此时的K-L变换式为:基于K-L变换的数据压缩举例给出样本数据如下:试用K-L变换作一维数据压缩。思路:1)求总体均值向量;2)求产生矩阵ψ

3)求产生矩阵的特征值λi及特征向量;

4)按λi排序,确定变换矩阵W;

5)利用求新的一维样本。K-L变换的一些典型应用上面我们从数学的角度分析了K-L变换的性质。归结起来,它消除了各分量之间的相关性,因而用它来描述事物时,可以减少描述量的冗余性,做到用最经济有效的方法描述事物。下面结合一些应用实例来说明如何运用K-L变换的这一性质。K-L变换的一些典型应用以人脸图象这个例子看,K-L变换的降维效果是十分明显的。对一幅人脸图象,如果它由M行与N列象素组成,则原始的特征空间维数就应为M×N。而如果在K-L变换以后只用到30个基,那么维数就降至30,由此可见降维的效果是极其明显的。另一方面降维与数据压缩又是紧密联系在一起的。譬如原训练样本集的数量为V,而现采用30个基,每个基实质上是一幅图象,再加上每幅图像的描述参数,数据量是大大降低,尤其是图象数很大时,压缩量是十分明显的。

1.降维与压缩K-L变换的一些典型应用使用K-L变换不仅仅起到降维与压缩数据的作用,更重要的是每个描述量都有明确的意义,因而改变某一个参数就可让图象按所需要的方向变化。在没有使用K-L变换的原数据集中对图象的描述量是每个象素的灰度值,而孤立地改变某个象素的灰度值是没有意义的。而在使用K-L变换后,每个描述量都有其各自的作用。因此通过改变这些参数的值就可实现对模型的有效描述,这在图象生成中是很有用的。因此利用K-L变换构造出可控制的,连续可调的参数模型,这在人脸识别与人脸图象重构采方面的应用是十分有效的。2.构造参数模型K-L变换的一些典型应用图像重构K-L变换的一些典型应用利用K-L变换进行人脸图象识别是一个著名的方法。其原理:首先搜集要识别的人的人脸图象,建立人脸图象库;利用K-L变换确定相应的“特征脸”图像,再反过来用这些“特征脸”图像对人脸图象库中的人脸图象进行K-L变换,从而得到每幅图象的参数向量,并将每幅图的参数向量存起来。在识别时,先对一张所输入的脸图象进行必要的规范化,再进行K-L变换分析,得到其参数向量。将这个参数向量与库中每幅图的参数向量进行比较,找到最相似的参数向量,也就等于找到最相似的人脸,从而认为所输入的人脸图象就是库内该人的一张人脸,完成了识别过程。

3.人脸识别利用特征脸法进行人脸识别的过程由训练阶段和识别阶段两个阶段组成其具体步骤如下:训练阶段第一步:假设训练集有200个样本,由灰度图组成,每个样本大小为M*N写出训练样本矩阵:其中向量xi为由第i个图像的每一列向量堆叠成一列的MN维列向量,即把矩阵向量化,如下图所示:训练阶段如:第i个图像矩阵为则xi为训练阶段第二步:计算平均脸

计算训练图片的平均脸:训练阶段第三步:计算差值脸计算每一张人脸与平均脸的差值训练阶段第四步:构建协方差矩阵训练阶段第五步:求协方差矩阵的特征值和特征向量,构造特征脸空间协方差矩阵的维数为MN*MN,考虑其维数较大,计算量比较大,所以采用奇异值分解(SingularValueDecomposition,SVD)定理,通过求解的特征值和特征向量来获得的特征值和特征向量。训练阶段求出的特征值及其正交归一化特征向量根据特征值的贡献率选取前p个最大特征值及其对应的特征向量贡献率是指选取的特征值的和与占所有特征值的和比,即:训练阶段一般取即使训练样本在前p个特征向量集上的投影有99%的能量求出原协方差矩阵的特征向量则“特征脸”空间为:

训练阶段第六步将每一幅人脸与平均脸的差值脸矢量投影到“特征脸”空间,即识别阶段第一步:将待识别的人脸图像与平均脸的差值脸投影到特征脸空间,得到其特征向量表示:识别阶段第二步:定义阈值识别阶段第三步:采用欧式距离来计算与每个人脸的距离识别阶段

为了区分人脸和非人脸,还需要计算原始图像与由特征脸空间重建的图像之间的距离其中:识别阶段根据以下规则对人脸进行分类:1)若,则输入图像不是人脸图像;2)若,且,则输入图像包含未知人脸;3)若,且,则输入图像为库中第k个人的人脸。2D-PCA2D-PCA是在基本PCA算法上的改进,主要不同是协方差矩阵构造方法不同,选取前P个最大特征值和特征向量也有所不同。训练阶段1设训练样本集合为:其中:

i表示第i个人,即类别数,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论