第3章 判别函数及几何分类法_第1页
第3章 判别函数及几何分类法_第2页
第3章 判别函数及几何分类法_第3页
第3章 判别函数及几何分类法_第4页
第3章 判别函数及几何分类法_第5页
已阅读5页,还剩124页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第第3章章 判别函数及几何分类法判别函数及几何分类法3.1 判别函数判别函数3.2 线性判别函数线性判别函数3.3 广义线性判别函数广义线性判别函数3.4 线性判别函数的几何性质线性判别函数的几何性质3.5 感知器算法感知器算法3.6 梯度法梯度法3.7 最小平方误差算法最小平方误差算法3.8 非线性判别函数非线性判别函数3.1 判别函数判别函数聚类分析法(第七章)判决函数法几何分类法确定性事件分类(第三章)概率分类法随机事件分类(第二章)线性判决函数法统 计 决 策 方 法非线性判决函数法复习与引申:复习与引申:模式识别统计若分属于1,2的两类模式可用一方程d(x) =0来划分,那么称d(x

2、) 为判别函数,或称判决函数、决策函数。3.1 判别函数判别函数(discriminant function) 直接用来对模式进行分类的准则函数。例:一个二维的两类判别问题,模式分布如图示,这些分属于1,2两类的模式可用一直线方程 d(x)=0来划分。0)(32211wxwxwd x21,xx为坐标变量,321,www为方程参数。式中:图3.2 两类二维模式的分布1判别函数的定义判别函数的定义若 ,则若 ,则 类;若 ,则 类;0)(xd1x0)(xd2x0)(xd21xx或 或拒绝将某一未知模式 x 代入:维数=3时:判别边界为一平面。维数3时:判别边界为一超平面。32211)(wxwxwd

3、x d(x) 表示的是一种分类的标准,它可以是1、2、3维的,也可以是更高维的。 判别界面的正负侧,是在训练判别函数的权值时确定的。2判别函数正负值的确定判别函数正负值的确定图3.3 判别函数正负的确定1)判决函数d(x)的几何性质。它可以是线性的或非线性的函 数,维数在特征提取时已经确定。如:已知三维线性分类 判决函数的性质就确定了判决函数 的形式:4332211)(wxwxwxwdx3. 确定判别函数的两个因素确定判别函数的两个因素例:非线性判决函数2)判决函数d(x)的系数。用所给的模式样本确定。3.2 线性判别函数线性判别函数3.2.1 线性判别函数的一般形式线性判别函数的一般形式将二

4、维模式推广到n维,线性判别函数的一般形式为:t1 122nn00 dw xw xw xwwxw x (3-2)t21,.,nxxxx式中:1 122nn012t120 11nndw xw xw xwxxwwwwxl lmxw xt120,.,nwwwwwt211 ,.,nxxxx增广向量的形式:式中:为增广权向量,为增广模式向量。t12,.,nw www权向量3.2.2 线性判别函数的性质线性判别函数的性质21t, 0, 0)(xxxwx若若d1. 两类情况d(x) = 0:不可判别情况,可以或拒绝或21xx) 对m个线性可分模式类,1, 2, m,有三种划分方式:2. 多类情况 ii两分法j

5、i两分法ji两分法特例ii两分法(1)多类情况1: 用线性判别函数将属于i类的模式与其余不属于i类的模式分开。将某个待分类模式 x 分别代入 m 个类的d (x)中,若只有di(x)0,其他d(x)均0的条件超过一个,或全部的di(x)dj(x)就相当于多类情况2中的dij(x) 0。ji两分法特例(3)多类情况3: 因此对具有判别函数 midii, 1,)(txwx的m类情况,判别函数性质为: ijimjiijddxxx若, 2 , 1,;,)(或: ikimkddxxx若, 1,max)( 识别分类时: 判别界面需要做差值。对i类,应满足: di其他所有dj2313dddd0122x1x

6、0)(21-xdxd- 0)(31-xdxd 0)(32-xdxd3212dddd3121dddd3 除边界区外,没有不确定区域。特点: 是第二种情况的特例。由于dij(x)= di (x) dj(x) ,若在第三种情况下可分,则在第二种情况下也可分,但反过来不一定。2313dddd0122x1x 0)(21-xdxd- 0)(31-xdxd 0)(32-xdxd3212dddd3121dddd3 把 m 类情况分成了(m -1)个两类问题。并且 类的判别界面全部与 类的判别界面相邻(向无穷远处延伸的区域除外)。iijj特别的定义23212211)(1)()(xdxxdxxd-xxx例例3.5

7、 一个三类模式(m=3)分类器,其判决函数为: 试判断x0=1,1t属于哪一类,且分别给出三类的判决界面。解: 2003020102030201)()()()(1)(1111)(011)(-xxxxxxxxddddddd012)()(121-xddxx02)()(2131-xxddxx012)()(112-xddxx012)()(2132-xxddxx)()(1331xxdd-)()(2332xxdd-类的判决函数:1判决界面如图所示。类的判决函数:2类的判决函数:3- 0)(21-xdxd2313dddd0.5x2- 0)(31-xdxd 0)(32-xdxd3212dddd3121dddd

8、110.5123x1-o2x1x 0)(21-xxdd- 0)(31-xxdd 0)(32-xxdd例例3.6 已知判决界面的位置和正负侧,分析三类模式的分布 区域 。132(1) 明确概念:线性可分。 一旦线性判别函数的系数wk被确定以后,这些函数就可以作为模式分类的基础。3. 小结小结(2) 分法的比较:jiii与 对于m类模式的分类, 两分法共需要m个判别函数,但 两分法需要m(m-1)/2个。当时m3时,后者需要更多个判别式(缺点),但对模式的线性可分的可能性要更大一些(优点)。 jiii原因: 一种类别模式的分布要比m-1类模式的分布更为聚集, 分法受到的限制条件少,故线性可分的可能

9、性大。jiii两分法 全部不属任何类 ir,可能 属于1或3 1230)(2xd0)(3xdir,可能 属于3或2 -0)(1xd0, 0312ddd0, 0321ddd0, 0,321dddir,可能属于1或2 0, 0213ddd2x1x若只有di(x)0,其他d(x)均 0时,原点在超平面的正侧;wn+1 tik xw()=1+kw( )ickxw+( )kw( )0tik xw若( )0tik xw若(3)分析分类结果:只要有一个错误分类,回到(2),直至 对所有样本正确分类。 分类正确时,对权向量“赏”这里用“不罚”,即权向量不变;分类错误时,对权向量“罚”对其修改,向正确的方向转换

10、。感知器算法是一种赏罚过程:感知器算法是一种赏罚过程:3. 收敛性收敛性收敛性:经过算法的有限次迭代运算后,求出了一个使所有样本都能正确分类的w,则称算法是收敛的。可以证明感知器算法是收敛的。收敛条件:模式类别线性可分。 例例3.8 已知两类训练样本解:所有样本写成增广向量形式; 进行规范化处理,属于2的样本乘以(1)。t11 , 0 , 0xt21 , 1 , 0xt31, 0 , 1 -xt41, 1, 1-x用感知器算法求出将模式分为两类的权向量解和判别函数。 :1t10,0x:2t21 ,0xt30, 1xt41 , 1x任取w(1)=0,取c=1,迭代过程为:第一轮: 0,1000

11、, 0 , 0) 1 (1txwt11 , 0 , 0) 1 () 2(, 0xww故1,1101 , 0 , 0)2(2txwt1 , 0 , 0) 2() 3 (, 0ww故-1,1-01-1 , 0 , 0)3(3txwt30 , 0 , 1-) 3 () 4(, 0xww故1,1-1-1-0 , 0 , 1-)4(4txwt0 , 0 , 1-) 4() 5 (, 0ww故有两个wt(k)xi 0的情况(错判),进行第二轮迭代。t11t1 , 0 , 1-)5()6(,00)5(xwwxw故t2t1 , 0 , 1-(6)7(,01)6(wwxw故t33t0 , 0 , 2-)7()8

12、(,00)7(xwwxw故t4t0 , 0 , 2-)8()9(,02)8(wwxw故第二轮:t11t1 , 0 , 2-)9()10(,00)9(xwwxw故(10)11(,01)10(2twwxw故)11()12(,01)11(3twwxw故)12()13(,01)12(4twwxw故第三轮:)13()14(,01)13(1twwxw故(14)15(,01)14(2twwxw故)15()16(,01)15(3twwxw故)16()17(,01)16(4twwxw故第四轮:t1 , 0 , 2-w该轮迭代的分类结果全部正确,故解向量1+2=)(1xd x相应的判别函数为: 当c、w(1)取其

13、他值时,结果可能不一样,所以感知器算法的解不是单值的。判别界面d(x)=0如图示。采用多类情况3的方法时,应有:4. 感知器算法用于多类情况感知器算法用于多类情况mj, 1= ix ,)(ijddjixx若,则 midi, 1,对于m类模式应存在m个判决函数:算法主要内容:m,21设有 m 种模式类别: mjj, 1,1w设其权向量初值为: 第k次迭代时,一个属于i类的模式样本 x 被送入分类器,计算所有判别函数训练样本为增广向量形式,但不需要规范化处理不需要规范化处理。 分二种情况修改权向量: mjkkdjj, 1,txw 若第l个权向量使 ,则相应的权向量作调整,即: -lijkkckkc

14、kkjjllii,111wwxwwxww 可以证明:只要模式类在情况3判别函数时是可分的,则经过有限次迭代后算法收敛。, c为正的校正增量例例3.9 设有三个线性可分的模式类,三类的训练样本分别为 若 则权向量不变; mjijkdkdji, 2 , 1;, mjkkjj, 2 , 1,1ww( )( )kdkdli t33t22t111 , 11 , 10 , 0-xxx:;:;:现采用多类情况3的方式分类,试用感知器算法求出判别函数。 解:增广向量形式:t3t2t11,1, 1,1,1, 1,1 , 0 , 0-xxx注意,这里任一类的样本都不能乘以(1)。任取初始权向量t3210 , 0

15、, 0) 1 () 1 () 1 (www;c=1 第一次迭代: 0111t11xwd 0111t22xwd 0111t33xwd三个权向量都需要修改:11x 1121dd 1131dd,但且不成立,t1111 , 0 , 0) 1 ()2(xwwt1221, 0 , 0) 1 ()2(-xwwt1331, 0 , 0) 1 ()2(-xww第二次迭代: 1222t11xwd 1222t22-xwd 1222t33-xwd22x 2212dd 2232dd,但且不成立,修改权向量:t2110 , 1, 1)2() 3(-xwwt2220 , 1 , 1)2() 3(xwwt2332, 1, 1

16、)2()3(-xww第三次迭代: 修改为权向量。33x 3313dd 3323dd,但且不成立, 以上进行的一轮迭代运算中,三个样本都未正确分类,进行下一轮迭代。第四次迭代: 在第五、六、七迭代中,对所有三个样本都已正确分类。权向量的解:t11110 , 2, 0)5()6()7(-wwwwt22222, 0 , 2)5()6()7(-wwwwt33332, 0 , 2)5()6()7(-wwww判别函数:212)(xd-x22)(12-xdx22)(13-xdx 设函数f (y)是向量 的函数,则f (y)的梯度定义为:3.6 梯度法梯度法t21,nyyyy t21,ddnyfyfyfffy

17、yy梯度的方向方向是函数 f (y) 在y点增长最快的方向,梯度的模模是f (y)在增长最快的方向上的增长率 (增长率最大值)。1. 梯度概念梯度概念 梯度向量的最重要性质之一:指出函数梯度向量的最重要性质之一:指出函数 f 在其自变量增加在其自变量增加时,增长最快的方向。时,增长最快的方向。3.6.1 梯度法基本原理梯度法基本原理显然:负梯度指出了最陡下降方向。梯度算法的依据。即:2. 梯度算法梯度算法 设两个线性可分的模式类1和2的样本共n个,2类样本乘(-1)。将两类样本分开的判决函数d(x)应满足: 梯度算法的目的仍然是求一个满足上述条件的权向量,主导思想是将联立不等式求解w的问题,转

18、换成求准则函数极小值的问题。nidii, 2 , 10)(txwxn个不等式 准则函数的选取原则: 具有唯一的最小值,并且这个最小值发生在w txi0时。 用负梯度向量的值对权向量w进行修正,实现使准则函数达到极小值的目的。 基本思路: 定义一个对错误分类敏感的准则函数j(w, x),在j的梯度方向上对权向量进行修改。一般关系表示成从w(k)导出w(k+1):其中c是正的比例因子。 梯度法求解步骤: jckjckk-www)(1 kjckkwwwxwww-,1(1)将样本写成规范化增广向量形式,选择准则函数,设置初始权向量w(1),括号内为迭代次数k=1。 权向量修正为:)(,)(kijkjw

19、wwxw )(1kjckk-ww迭代次数k加1,输入下一个训练样本,计算新的权向量,直至对全部训练样本完成一轮迭代。 (3)在一轮迭代中,如果有一个样本使 ,回到(2)进行下 一轮迭代。否则, w不再变化,算法收敛。0j(2)依次输入训练样本x。设第k次迭代时输入样本为xi,此时 已有权向量w(k),求 :)(kj例例3.10 选择准则函数 , ,简单地考虑x为一维增广模式的情况x=1,此时w=w,两者均为标量,xwxwxwtt),(-jwwj-),(xw错误分类时: 22,1-wwwwwjjxxww0010twwxw ckckk221-www, 对权向量校正。 jckk-ww1正确分类时:0

20、010twwxw0-wwwj kckkwww-01, 对权向量不做修正。说明: 随着权向量w向理想值接近,准则函数关于w的导数 ( )越来越趋近于零,这意味着准则函数j 越来越接近最小值。当 最终 时,j达到最小值,此时w不再改变,算法收敛。j0j 将感知器算法中联立不等式求解w的问题,转换为求函数j极小值的问题。 kjckjckkwwwxwwww-,1 c) 梯度算法是求解权向量的一般解法,算法的具体计算形式取决于准则函数j(w, x)的选择,j(w, x)的形式不同,得到的具体算法不同。a) b) c值的选择很重要,如c值太小,收敛太慢;但若太大,搜索又可能过头,甚至引起发散。3.6.2

21、固定增量法固定增量法准则函数:求w(k)的递推公式:1. 求j的梯度?,wxwjj方法:函数对向量求导=函数对向量的分量求导,即t1,nxfxffx该准则函数有唯一最小值“0”,且发生在 的时候。 0txw设 ,t211 ,nxxxxt121,nnwwwwwxwxwxwtt21),(-j部分:niniiwxw11twwxwt111111,iniininiikniniiwxwwwxwwwxwwxt11 ,nkxxxnnddddixxxxtt 111111tnnnnxxiwxwxwt首先求另:矩阵论中有xwxwxwtt21),(-jxxwxwxw-tsgn21,jj其中 -0, 10, 1sgnt

22、ttxwxwxw若若 由的结论 有: xwxwtxwxwwxwxwttt0时,xwxwwxwxw-ttt0时,xxwwxwttsgnxwxwxwtt21),(-j kjckjckkwwwxwwww-,12. 求w(k+1)将 代入得: xxwxww-)(sgn211tkckk 0)(,0)(, 0ttxwxxwwkckk若若 xwxxw)(sgn2tkck-xxwxwxw-tsgn21,jj 由此可以看出,感知器算法是梯度法的特例。即:梯度法是将感知器算法中联立不等式求解w的问题,转换为求函数j极小值的问题,将原来有多个解的情况,变成求最优解的情况。上式即为固定增量算法,与感知器算法形式完全相

23、同 。 0)(,0)(, 01ttxwxxwwwkckkk若若即: 0, 0,1ttiiikckkkkxwxwxwww若若只要模式类是线性可分的,算法就会给出解。n线性分类器设计任务:给定样本集k,确定线性判别函数g(x)=wtx的各项系数w。步骤:1.抽取类别标志明确的样本集合 k=x1,x2,xn作为训练样本集。2.确定一准则函数j(k,w),其值反映分类器的性能,其极值解对应于“最好”决策。3.用最优化技术求准则函数j的极值解w*,从而确定判别函数,完成分类器设计。*argmax (,)j kwwwn对于未知样本x,计算g(x),判断其类别4.2 fisher线性判别线性判别n线性判别函

24、数y=g(x)=wtx:n样本向量x各分量的线性加权n样本向量x与权向量w的向量点积n如果| w |=1,则视作向量x在向量w上的投影 nfisher准则的基本原理:找到一个最合适的投影方向,使两类样本在该方向上投影之间的距离尽可能远,而每一类样本的投影尽可能紧凑,从而使分类效果为最佳。fisher线性判别线性判别图例图例fisher判别x1x2w1h: g=0w2fisher准则的描述:用投影后数据的统计性质均值和离散度的函数作为判别优劣的标准。d维空间样本分布的描述量维空间样本分布的描述量fisher判别n各类样本均值向量mi1 1,2iix kiinmxn样本类内离散度类内离散度矩阵si

25、与总类内离散度矩阵sw ()() , 1,2itiiii-xsxmxm12wsssn样本类间离散度类间离散度矩阵sb:1212()()tb-smmmm离散度矩阵在形式上与协方差矩阵很相似,但协方差矩阵是一种期望值,而离散矩阵只是表示有限个样本在空间分布的离散程度一维一维y空间样本分布的描述量空间样本分布的描述量n各类样本均值1, 1,2iiyimyinn样本类内离散度和总类内离散度2() , 1,2iiiysymi-12wsssn样本类间离散度 212()bsmm-以上定义描述d维空间样本点到一向量投影的分投影的分散情况散情况,因此也就是对某向量w的投影在w上的分布。样本离散度的定义与随机变量

26、方差相类似 nfisher准则函数定义的原则为,希望投影后,在一维空间中样本类别区分清晰,即两类距离越大越好,也就是类间离散度越大越好;各类样本内部密集,即类内离散度越小越好,根据上述准则,构造fisher准则函数。12wsss2121212()( )bfsmmjwssss-样本与其投影统计量间的关系样本与其投影统计量间的关系22()()()()iiiiiyttix kttiiix ktssym-w xw mwwxmxwwm1212()ttwssssswwww2212121212()()()()tttbtbtssmm-w mw mwwmmmmwwfisher准则函数准则函数n评价投影方向w的原

27、则,使原样本向量在该方向上的投影能兼顾类间分布尽可能分开,类内尽可能密集的要求nfisher准则函数的定义:12( )tbbftwssjwssswwwwnfisher最佳投影方向的求解*argmax( )fjwwwfisher最佳投影方向的求解最佳投影方向的求解n采用拉格朗日乘子算法解决*112()ws-wmmm1-m2是一向量,对与(m1-m2)平行的向量投影可使两均值点的距离最远。但是如从使类间分得较开,同时又使类内密集程度较高这样一个综合指标来看,则需根据两类样本的分布离散程度对投影方向作相应的调整,这就体现在对m1-m2 向量按sw-1作一线性变换,从而使fisher准则函数达到极值点

28、判别函数的确定n前面讨论了使fisher准则函数极大的d维向量w*的计算方法,判别函数中的另一项w0(阈值)可采用以下几种方法确定:1202mmw1122012n mn mwmnn1212012ln()/()22ppmmwnn-0102ttywyww xxw xxn分类规则:fisher公式的推导公式的推导12( )tbbftwssjwssswwwwc0twsww令 lagrange:( , )()ttbwlssc-wwwww定义函数 ( , ):0bwlss-wwww令 1wbss-ww111212112()()()twbwwssssr-wwmmmmwmm*111212()()wwrss-w

29、mmmm*112()ws-wmm3.7 最小平方误差算法最小平方误差算法(least mean square error, lmse;亦称ho-kashyap算法) 上述的感知器算法、梯度算法、固定增量算法或其他类似方法,只有当模式类可分离时才收敛,在不可分的情况下,算法会来回摆动,始终不收敛。当一次次迭代而又不见收敛时,造成不收敛现象的原因分不清,有两种可能:a) 迭代过程本身收敛缓慢b) 模式本身不可分对可分模式收敛。对于类别不可分的情况也能指出来。lmse算法特点:1. 分类器的不等式方程分类器的不等式方程-nnnnnnnnnnnnnwxwxwxwwxwxwxwwxwxwxwxxx对对对

30、00012211212222211111122111类1类20tixw 两类分类问题的解相当于求一组线性不等式的解。如果给出分属于 , 两个模式类的训练样本集 ,应满足:12, 2 , 1,niix其中,xi是规范化增广样本向量, 。t21 1,iniiixxxx上式分开写为:写成矩阵形式为 : 令n (n+1) 的长方矩阵为x,则 , 变为:0tixw0xw0-11112112122221112110000111nnnnnnnnnnnnwwwwxxxxxxxxx-nnnnnnnnnnnnnwxwxwxwwxwxwxwwxwxwxwxxx对对对0001221121222221111112211

31、1类1类21,.inl式中:t121,nnwwwww121tt1tt2t1-nnnnixxxxxx0xw0-11112112122221112110000111nnnnnnnnnnnnwwwwxxxxxxxxx0为零向量 感知器算法是通过解不等式组 ,求出w。0xw2. lmse算法算法1) 原理原理的求解。式中: 两式等价。t21,nibbbbb为各分量均为较小正值的矢量。lmse算法把对满足 xw 0 的求解,改为满足bxw 在方程组系数矩阵中当行数列数时,通常无解,称为矛盾方程组,一般求近似解。在模式识别中,通常训练样本数n总是大于模式的维数n,因此方程的个数(行数)模式向量的维数(列数

32、),是矛盾方程组,只能求近似解w*,即说明:极小-bxw * lmse算法的出发点:选择一个准则函数,使得当j达到最小值时,xw=b 可得到近似解(最小二乘近似解)。 lmse算法的思路:bwbxwxw、通过求准则函数极小找求解对求解对 0转化为转化为准则函数定义为: 221,bxwbxw-j“最小二乘”: 最小:使方程组两边误差最小, 也即使j最小。 二乘:次数为2,乘了两次最小平方(误差算法)1111121111221111111111-nninnnnnnnnininnbbbwwwwxxxxxxxxbxw-nniinnnnnnninnininnnbbbbwwxwxbwwxwxbwwxwxx

33、wxwxwtt11t1111111111111向量各分量的平方和向量各分量的平方和-22bxw-niiinnbbb12t2t211t2xwxwxwbxw考察向量(xwb) 有:可以看出: 当函数j达到最小值,等式xw=b有最优解。即又将问题转化为求准则函数极小值的问题。 因为j有两个变量w和b,有更多的自由度供选择求解,故可望改善算法的收敛速率。21t22121,-niiibjxwbxwbxwxw=b 的近似解也称“最优近似解”: 使方程组两边所有误差之和最小(即最优)的解。准则函数:bxbxxxwbxxwxbxwx#t1tttt0-使j 对w求最小,令 ,得:2) 推导推导lmse算法递推公

34、式算法递推公式与问题相关的两个梯度: bxwxw-tjbxwbxwb-21j (3-46)(3-47)由(3-47)式可知:只要求出b,就可求出w。求递推公式:(1) 求w 的递推关系x为n(n+1)长方阵,x#为(n+1) n 长方阵。t1t#xxxx-称为x的伪逆,式中: (3-45)0wj(2) 求b(k+1)的迭代式 kjckkbbbbb-1 kkkkckkbxwbxwbb-21(3-46)代入,得cc 2 kkkebxw- 令,定义(3-49) kkckkeebb1(3-50)(3-46)bxwbxwb-21j利用梯度算法公式有: kjckkwwwxwww-,1 kkbbxxxxx-

35、#t1t kckckexexbx#(3) 求w(k+1)的迭代式将(3-50)代入(3-47)式w=x#b 有: kkckkkeebxbxw#11 kkkbxwxxxex-t1t#=0 kckexw#0 kkkebxw-(3-49) kkckkeebb1(3-50) 11#bxw kkkbxwe- kckkexww#1 kkckkeebb111#kkbxw总结:设初值b(1),各分量均为正值,括号中数字代表迭代次数 。w(k+1)、b(k+1)互相独立,先后次序无关。求出b,w后,再迭代出下一个e,从而计算出新的b, w。 11#bxw kkkbxwe- kkckkeebb1或另一算法:先算b

36、(k+1),再算w(k+1)。3)模式类别可分性判别)模式类别可分性判别 如果e(k)0 ,表明xw(k)b(k) 0, 隐含有解。继续迭代, 可使e(k) 0 。 如果e(k)0,有解。分以下几种情况:111-kkkbxwe kkww1 kkee1 kkbb111#kkbxw情况分析: kkckkeebb1e(k)0,线性可分,若进入(5)可使e(k) 0 ,得最优解。如果e(k)0,线性不可分,停止迭代,无解,算法结束。如果e(k)=0,线性可分,解为w(k),算法结束。否则,说明e(k)的各分量值有正有负,进入(5)。 kckkexww#1 kkckkeebb1 kkckkeebb111

37、#kkbxw(5) 计算w(k+1)和b(k+1)。方法1:分别计算方法2:先计算再计算迭代次数k加1,返回(4)。3. 算法特点算法特点(1) 算法尽管略为复杂一些,但提供了线性可分的测试特征。(2) 同时利用n个训练样本,同时修改w和b,故收敛速度快。(3) 计算矩阵 复杂,但可用迭代算法计算。1t-xx例3.11 已知两类模式训练样本: tt11 ,0,0,0:tt21 ,1,0,1:试用lmse算法求解权向量。-111101110100x解:(1) 写出规范化增广样本矩阵: aij是aij的代数余子式,注意两者的行和列的标号互换。 t1t#xxxx- (2) 求伪逆矩阵-4222212

38、12111101110100111110101100txx*11aaa-求逆矩阵:333231232221131211aaaaaaaaaa332313232212312111*aaaaaaaaaa若,则 |a|a的行列式a*a的伴随矩阵422221212txx 划去aij所在的行和列的元素,余下元素构成的行列式做aij的余子式,记作mij ,将 叫做元素aij的代数余子式。例:代数余子式定义: ijijam ji1- 323112113231121132231-aaaaaaaaa-322240204413222402041t1txxxx44884416422221212t-xx行列式: 333

39、231232221131211aaaaaaaaaa*11aaa-1113222222224111111010110032224020441#x -1024084111111113222222224111#bxw(3) 取 和 c=1 开始迭代: t1 , 1 , 1 , 11 b -0000111111111111102111101110100111bxwe 121-xd x解为 w(1) ,判断函数为:t1t#xxxx-图示如下:例3.12 已知模式训练样本: ,tt11 , 1,0 ,0:tt20, 1,1 ,0:-101110111100x( 2) 求 :t1t#xxxx-1113222

40、2222241#x解:(1) 规范化增广样本矩阵:(3) 取 和c=1,迭代: t1 , 1 , 1 , 11 b用lmse算法求解权向量。 t#00011bxw ttt111111110000111-bxwe e(1)全部分量为负,无解,停止迭代。为线性不可分模式。 小结:小结:(1) 感知器法、梯度法、最小平方误差算法讨论的分类算法都是通过模式样本来确定判别函数的系数,所以要使一个分类器设计完善,必须采用有代表性的数据,训练判别函数的权系数。它们能合理反映模式数据的总体。(2) 要获得一个有较好判别性能的线性分类器,所需要的训练样本的数目的确定。用指标二分法能力n0来确定训练样本的数目:通

41、常训练样本的数目不能低于n0 ,选为 n0的510倍左右。二维:不能低于6个样本,最好选在3060个样本之间。三维:不能低于8个样本,最好选在4080个样本之间。120nnn为模式维数如3.8 非线性判别函数非线性判别函数3.8.1 分段线性判别函数分段线性判别函数线性判别函数的特点:形式简单,容易学习; 用于线性可分的模式类。非线性判别函数:用于线性不可分情况。分段线性、超曲面。 特点基本组成为超平面。* 相对简单;* 能逼近各种形状的超曲面。1一般分段线性判别函数一般分段线性判别函数设有m类模式,将i类(i=1,2, ,m)划分为li个子类:miiliiii, 2 , 1,:21其中第n个

42、子类的判别函数: milndinini, 2 , 1;, 2 , 1)()(txwxi类的判别函数定义为:, 2 , 1),(max)(iniilnddxxm类的判决规则: , 2 , 1),(max)(middijxxjx若,则用各类判别函数进行分类判决实际是用各类选出的子类判别函数进行判决判别面由各子类的判别函数决定若i类的第n个子类和j类的第m个子类相邻,判别界面方程为:)()(xxmjnidd子类之间的判别界面组成各类之间的判别界面类间判别界面分段线性2基于距离的分段线性判别函数基于距离的分段线性判别函数设 1类均值向量:11111niinxm21221niinxm2类均值向量:n1,

43、n2:两类样本数。 任一模式x到m1和m2的欧氏距离平方:211|)(mxx-d222|)(mxx-d判决规则:)()(21xxdd1x若, 则)()(12xxdd2x若, 则判别界面方程:2221|mxmx-1)最小距离分类器化简得:0)()(21t12t2t21-mmmmxmm x的线性方程,确定一个超平面。 最小距离分类器 2)分段线性距离分类器 设:m类模式,其中i类划分为li个子类,第n个子类的均值向量为 。每个子类的判别函数:nimmilndinini, 2 , 1;, 2 , 1,|)(2-mxx每类的判别函数: , 2 , 1),(min)(iniilnddxx判决规则:, 2

44、 , 1),(min)(middijxx若jx则mi, 2 , 13.8.2 分段线性判别函数的学习方法分段线性判别函数的学习方法1已知子类划分时的学习方法已知子类划分时的学习方法* 每个子类看成独立的类;* 在一类范围内根据多类情况3,学习各子类判别函数;* 继而得到各类判别函数。 2已知子类数目时的学习方法已知子类数目时的学习方法 用类似于固定增量算法的错误修正算法学习分段线性判别函数 3未知子类数目时的学习方法未知子类数目时的学习方法树状分段线性分类器 树状分段线性分类器判别函数的学习及分类过程 暂停点暂停点:,; :,3.8.3 势函数法势函数法1. 势函数概念势函数概念划分属于1和2

45、类模式样本: 样本是模式空间中的点, 将每个点比拟为点能源,在点上势能达到峰值,随着与该点距离的增大,势能分布迅速减小。 1类样本势能为正势能积累形成 “高地”; 2类样本势能(-1)势能积累形成 “凹地”; 在两类电势分布之间,选择合适的等势面(如零等势面),即可认为是判别界面了。借用点能源的势能概念解决模式分类问题。 kx),(kxxkxo一个样本xk的势能分布用势函数k( x , xk )表示)(xkxo12积累势函数一维情况示例2. 势函数法判别函数的产生势函数法判别函数的产生依次输入样本,利用势函数逐步积累势能的过程。 判别函数由模式空间中样本向量 的势函数k(x, xk)累加产生,

46、分类器计算积累势k(x),最后取d(x)=k(x)。21,2, 1,kkkxx且设初始积累势函函数 ,下标为迭代次数。0)(0xk势函数法:势函数法:第一步:加入训练样本 x1 ,k1(x) 描述了加入第一个样本后的边界划分。-211011101),()(),()()(xxxxxxxxx若若kkkkk第二步:加第二个训练样本x2,分三种情况:)()(12xxkk分类正确,势函数不变:0)(2112xxk且若0)(2122xxk且或21212,),()()(xxxxxxxxkkkkk,错误分类,修改势函数:0)(2112xxk但若,错误分类,修改势函数:0)(2122xxk但若21212,),(

47、)()(xxxxxxxxkkkkk- 第k步:设kk(x) 为加入训练样本x1 ,x2 ,xk后的积累势函数, 则加入第k+1个样本,有:)(1xkk正确分类, 0)(111kkkkxx且若0)(121kkkkxx且或)(1xkk,错误分类:0)(111kkkk xx但若0)(121kkkk xx但若 ,错误分类:)(1xkk以上决定积累位势的迭代算法可写为:其中rk+1 为校正项系数,定义为:)(xkk),()(1kkkkxxx),()(1-kkkkxxx),()()(111kkkkkrkkxxxx(3-57)-0, 10, 10,00,01211111211111kkkkkkkkkkkkk

48、kkkkrxxxxxxxx且对于且对于且对于且对于(3-58)从所给的训练样本集 中略去不使积累势发生变化的那些样本,可得一简化样本序列 (校正错误的样本),算法可规纳为:,21kxxx,21jxxx),()(1jjxjkkkxxx即:由(k+1)个训练样本产生的积累势,等于两类中校正错误 的样本的总势能之差。 -21,1,1jjjxx对于对于式中, ),()()(111kkkkkrkkxxxx-0, 10, 10, 00, 01211111211111kkkkkkkkkkkkkkkkkrxxxxxxxx且对于且对于且对于且对于(3-59)(3-60) 从势函数算法可看出,积累势函数起着判别函

49、数的作用,因此可直接用作判别函数,故取 d(x)=k(x) 。由(3-57)式得:式中rk+1按(3-58)式取值:1111sgn121-kkkkkdrx也可简写成:-0, 10, 10,00,01211111211111kkkkkkkkkkkkkddddrxxxxxxxx且对于且对于且对于且对于式中 取值同(3-60) :1k-211,1,1jjkxx对于对于),()()(111kkkkkrkkxxxx(3-57),()()(111kkkkkrddxxxx(3-61) 两个n维向量 x 和 xk 的函数k(x, xk) ,如同时满足下列三个条件,都可做为势函数:3. 势函数的选择势函数的选择,当且仅当 x = xk 时达到最大值。)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论