Fisher分类器(算法及程序)_第1页
Fisher分类器(算法及程序)_第2页
Fisher分类器(算法及程序)_第3页
Fisher分类器(算法及程序)_第4页
Fisher分类器(算法及程序)_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 3.5Fisher分类器(FisherLinearDiscriminant)Fisher判别法是历史上最早提出的判别方法之一,其基本思想是将n类m维数据集尽可能地投影到一个方向(一条直线),使得类与类之间尽可能分开。从形式上看,该方法就是所谓的一种降维处理方法。为简单起见,我们以两类问题叫和2的分类来说明Fisher判别法的原理,如图3.4所示。设数据阵为XwRNxm,叫共有%个样本,込共有N个样本,N=N+N2。两个类别在输入空间的均值向量为图3.4,Fisher判别法几何原理示意图“2=1N11N2工xpX如1乞XPXP如2eRmeRm(3.37)设有一个投影方向帀=(W,w2,,wm)

2、reRm,这两个均值向量在该方向的投影为“=wT“1=丄工wTXeR1N1X叭P1“2=WT“2=丄乞WTXeR122Np2Xew2p2在w方向,两均值之差为丁/、“1-“2二W-“2丿类似地,样本总均值向量在该方向的投影为1N“=WT“=EWTXeR1N=1定义类间散度(Between-classscatter)平方和SS为BSSB=N1“丄+N2“2-“1=为Nj&.-“=N1F“1-+N2=wTn1(“1-“)“i-“&+N2=wTSBw(3.38)(3.39)(3.40)(3.41)其中(3.42)Sb=N1(fi1-p)0-py+N2(fi2-“)%-“y=彳Nj-p)p丄j=1定义

3、类j的类内散度(Within-classscatter)平方和为(3.43)SS”=ivTx-p)=工WTx-wTp.WjpjpjpeNjpeNj两个类的总的类内散度误差平方和为ssw=为SS.=S工WTx一wTp.)Wwjpjj=1j=1peNj=wT为工G一p.)(-p)p厂Jp厂J_j=1peNJ=WTSwW(3.44)其中,(3.45)Sw工以p-“儿-“jj=1pwNj我们的目的是使类间散度平方和SSB与类内散度平方和SS的比Bw值为最大,即maxJ(w)=谿SS(3.46)图3.5a,Fisher判别法类间散度平方和(分子)的几何意义oo.wpplpxp1xp2十土vp2叫类k、%

4、类图3.5b,Fisher判别法类内散度平方和(分母)的几何意义图3.5给出了类间散度平方和SB与类内散度平方和SE的几何意义。根据图3.5a,类间散度平方和SB的另一种表示方式为SSB二*-fl2丄=vT片-wT%)=WT(%-%2)%1-%2Fw=wTSBw(3.47)这里SB=-%2沟1-%2P(3.48)可以证明,(3.48)与(3.42)只相差一个系数。简单证明如下:由于如1、+工XpXp如2丿N1%1+N2%N(3.49)/%-n%1+n%斗1N丿%-N1%1+N2%2YI2N丿+等(%2-%1沟2-%1片(3.50)由(3.42)得SB=N1(%1-%)%-%Y+N2(%2-%)

5、%2-%片=N1f%1-N%+N2(%2-也=等(%1-%2)Q%2”=NN2(%1-%2沟1-%2片这说明,(3.48)与(3.42)只相差一个与样本数有关的常数。根据图3.5b,类内散度平方和SSE的另一种表示方式为Sv22p2XpE21-片)2+工(SSEpxeo.p1(S-A)(p-讣+工。p-2)(p-“200(3.57)不定如果wTX_0为0,则判别公式为确定。的一些经验公式为(1)取两个类别均值在w方向投影的简单平均_wT(“+“2)(3.58)(2)考虑样本数的两个类别均值在w方向投影的平均 (3.59)0_币T他片+N2“2)N或(3.60)0=WT32A+N1月2)N(3)

6、考虑类方差的两个类别均值在w方向投影的平均(3.61)0=W&2“1+C1“2丿C1+C2或(3.62)0=wTq“1+c1“2丿C1+C2这里,、b2分别为两个类别在W方向投影的均方差。当然,当类内散度阵SW不可逆时,Fisher判别法失效例5在研究地震预报中,遇到沙基液化问题,选择了下列7个有关的因素:x1:震级,x2:震中距(公里),X3:水深(米),x4:土深(米)x5:贯入值,x6:最大地面加速度(10-2N/m2),x7:地震持续时间(秒)具体数据如表1所示。x1X2X3X4X5X6X7类别序号6.6391.06.06.00.1220I16.6391.06.0120.1220I26

7、.1471.06.06.00.0812I36.1471.06.0120.0812I48.4322.07.5190.3575I57.26.01.07.0280.3030I68.41133.56.0180.1575I77.5521.06.0120.1640I87.5523.57.56.00.1640I98.31130.07.5350.12180I107.81721.03.5140.2145I117.81721.53.0150.2145II128.4321.05.04.00.3575II138.4322.09.0100.3575II148.4322.54.0100.3575II156.3114.57

8、.53.00.2015II167.08.04.54.59.00.2530II177.08.06.07.54.00.2530II187.08.01.56.01.00.2530II198.31611.54.04.00.0870II208.31610.52.51.00.0870II217.26.03.54.0120.3030II227.26.01.03.03.00.3030II237.26.01.06.05.00.3030II245.56.02.53.07.00.1818II258.41133.54.56.00.1575II268.41133.54.58.00.1575II277.5521.06.0

9、6.00.1640II287.5521.07.58.00.1640II298.3970.06.05.00.15180II308.3972.56.05.00.15180II318.3890.06.0100.16180II328.3561.56.0130.25180II337.81721.03.56.00.2145II347.82831.04.56.00.1845II35解,设数据文件名为d:a.txt,用Matlab实现的源程序如下loadd:ss.txt;a=ss;m=mean(a(1:12,:);m(2:2,:)=mean(a(13:35,:);ssb=(m(1:1,:)-m(2:2,:)*

10、(m(1:1,:)-m(2:2,:);ssw=zeros(7,7);fori=1:12,ssw=ssw+(a(i:i,:)-m(1:1,:)*(a(i:i,:)-m(1:1,:);endfori=13:35,ssw=ssw+(a(i:i,:)-m(2:2,:)*(a(i:i,:)-m(2:2,:);endw=inv(ssw)*(m(1:1,:)-m(2:2,:);result=a*w;theta=w*(m(1:1,:)+m(2:2,:)/2;fori=1:35,result(i:i,2:2)=theta;result(i:i,3:3)=i;end投影方向向量为w=(0.0202,-0.0001

11、,-0.0175,0.0156,0.0160,-0.7333,-0.0016)T分类阈值为8=0.1358。决策面方程为兀:l(x)=0.0202x1-0.0001x2-0.0175x3+0.0156x4+0.0160 x5-0.7333x6-0.0016x7-0.1358=0.分类结果为序号WTX0=0.1358(3.58)0=0.1007(3.59)0=0.1709(3.60)0=0.1567(3.61)0=0.1149(3.62)10.181220.277230.212540.308550.174960.416370.247580.232590.1160*100.4551110.1745120.173913-0.0866140.054215

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论