2023年用身高与体重数据进行性别分类的实验报告_第1页
2023年用身高与体重数据进行性别分类的实验报告_第2页
2023年用身高与体重数据进行性别分类的实验报告_第3页
2023年用身高与体重数据进行性别分类的实验报告_第4页
2023年用身高与体重数据进行性别分类的实验报告_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

用身高和体重数据进行性别分类的实验报告姓名:刘懿郴学号:范英学号:胡亮学号:班级:93911、基本规定用FAMALE.TXT和MALE.TXT的数据作为训练样本集,建立Bayes分类器,用测试样本数据对该分类器进行测试。调整特性、分类器等方面的一些因素,考察它们对分类器性能的影响,从而加深对所学内容的理解和感性结识。2、具体做法(1)应用两个特性进行实验:同时采用身高和体重数据作为特性,分别假设两者相关或不相关,在正态分布假设下估计概率密度,建立最小错误率Bayeserrorl2forn=1:50a=HW2(:,n);u11=[173.9200;65.5020];thegemal1=[20.753623.0582;23.058259.8982];%%%ADEuul2=[162.8400;52.5960];thgema12=(43.934415.5254;15.525431.1285];%%%%A®Eudet1l=det(thegema11);detl2=det(thgemal2);p(11)=1/((2*pi)*(detllA0.5))*exp(-l/2*((a-u11)//thegema11)*(a-ull));P(12)=l/((2*pi)*(detl2-0.5))*exp(-l/2*((a-u12),/thgemal2)*(a-u12));pz=p(11)*pw1+p(12)*pw2;pll=(p(11)*pwl)/pz;%%%ma1e°6^e,p12=(p(12)*pw2)/pz;1e06NeJAAEg=p11-p12;%%%%tesI2Q0504oiafemaleif(g<0)1efemale2=fema1e2+1;eIseerror21=error21+1;endendfema1e2error21forn=51:number2a=HW2(:,n);u11=[173.9200;65.5020]:thegemall=[20.753623.0582:23.058259.8982];%%%AD^uu12=[162.8400;52.5960];thgema12=[43.934415.5254;15.525431.1285];%%%%A®Eudetll=det(thegemail);detl2=det(thgema12):p(ll)=l/((2*pi)*(det11A0.5))*exp(-l/2*((a-u*/thegemall)*(a-ul1));p(12)=1/((2*pi)*(det12人0.5))*exp(-l/2*((a-u12)'/thgema12)*(a-ul2));Pz=P(11)*pw1+p(12)*pw2;p11=(p(11)*pw1)/pz;%%%ma1自,AA£p12=(p(12)*pw2)/pz;e06Ne,AAEg=p11-p12;%%%%test2Q050,btafema1ef(g>0)%%%AD<HiEQ2»EQmalemale2=male2+l;elseerror22=error22+1;endendmale2error22(2)当身高与体重不相关ull=[l73.9200;65.5020];thegema11=(20.75360;059.8982]ul2=[162.8400:52.5960];thgemal2=[43.93440;031.1285]:%%%%A®Eudetll=det(thegema11);det12=det(thgemal2);进行替代u11=[173.9200;65.5020];thegemal1=[20.753623.0582;23.058259.8982];%%%A£)Euul2=[l62.8400;52.5960];thgema12=(43.934415.5254;15.525431.1285]即可(3)(4)基本都类似有源程序代码可以直接运营即可分类器,写出得到的决策规则,将该分类器应用到训练/测试样本,考察训练/测试错误情况。比较相关假设和不相关假设下结果的差异。在分类器设计时可以考察采用不同先验概率(如0.5vs.0.5,0.75vs.0.25,0.9vs.0.1等)进行实验,考察对决策和错误率的影响。(2)自行给出一个决策表,采用最小风险的Bayes决策反复上面的实验。3、实验原理已知样本服从正态分布,1p(x)=-T--T-exp(1)(1)(1)(2兀产|婷〃(1)所以可以用最大似然估计来估计U和2两个参数样本类分为男生吗和女生%两类,运用最大似然估计分别估计出男生样本的汽,4,和女生样本的〃2/2,然后将数据带入(1)公式分别计算两者的类条件概率密度P(*l1%)和P(*21做),然后根据贝叶斯公式IP(%包)P(3j)P①|X)=—》(/叫万(吗)1=1计算出两类的后验概率P31㈤和P®1%)实验一:对于两类情况,我们可以仅定义一个判别函数:。(%)=-2(%)-。1(外其中3(“=pm/x)=①JP3)£p(x/&)P(例)/=|g2(x)"5/x)=华⑹?⑷2P(为&)p(?)

/=1并将决策规则表达为假如g(x)>0,贝映策归;g(x)<0,则决策必。实验二:我们定义一个决策表如下图2损失态%%%06%20R(%k)==》2P®gj=iR(%l*)=A21P(W1IX)我们定义判别函数^(x)=R(a1|x)-R(a2|x)并将决策规则表达为假如g(力>0,则决策归;g(x)<0,则决策必。蛤、粮田口*在带入判别函数g(,t)实验流程图(173.9200)协方差M=165.5020,4、实验结果(173.9200)协方差M=165.5020,运用matlab我们计算出了male.txt和female.txt的均值和lf20.753623.058211nL,=和1(23.058259.8982(162.8400]十(43.934415.52541

、52.5960/2一(15.525431.1285,这样我们可以运用公式和判别函数与决策规则对训练/测试样本集进行分类,结果如下:(1)当体重和身高相关的时候先验概率先验概率先验概率testltest2先验概率testltest2男性pw女性pw男性判断正I男性判断错女性判断11女性判断与正确率错误率男性判断11男性判断与女性判断正女性判断正确率错i:0.10.90.10.613197150.10.90.10.61319715115080%20%1539702.90%2113949167.30%3249186.70%13一:)

5

aO

O

24S

66420W292O.9对于testl测试集,总体来说,对样本集的判断对的率随着男性的先验概率的增长(女性先验概率的减少)先增大后减小,而对于男性或者女性的的个体判别随着男性的先验概率的增长而对的率不断增长或不断减小(也就是随着男性先验概率的增长,将男性判断为女性的概率越来越少,甚至没有;而把女性判别为男性的概率越来越大)而对于testl测试集,对样本集的判断对的率随着男性的先验概率的增长(女性先验概率的减少)而不断增长,而对于男性或者女性的的个体判别随着男性的先验概率的增长而对的率不断增长或不断减小(也就是随着男性先验概率的增长,将男性判断为女性的概率越来越大;而把女性判别为男性的概率越来越小)(2)当体重和身高不相关的时候先验概率testltest2男性PW妁tpw男性判断口男性判断错女性判断改性判骷正确率错误率男性判断i男性判断以性判断及性判断正确率错误0.10.917315091.40%8.60$1935749180.70%19.0.40.6200150100%0%2173349180.70%11.0.50.520014197.10%2.90$2232748290.X9.0.60.420014197.10%2.90%2262448291.30%8.0.90.120012391.40%8.60%242842894.70%5.对于test1测试集,总体来说,对样本集的判断对的率随着男性的先验概率的增长(女性先验概率的减少)先增大后减小,而对于男性或者女性的的个体判别随着男性的先验概率的增长而对的率不断增长或不断减小(也就是随着男性先验概率的增长,将男性判断为女性的概率越来越少,甚至没有;而把女性判别为男性的概率越来越大)而对于testI测试集,对样本集的判断对的率随着男性的先验概率的增长(女性先验概率的减少)而不断增长,而对于男性或者女性的的个体判别随着男性的先验概率的增长而对的率不断增长或不断减小(也就是随着男性先验概率的增长,将男性判断为女性的概率越来越大;而把女性判别为男性的概率越来越小)(3)当体重和身高相关的时候先验概率testltest2男性叫女性pw男性判断」男性判断女性判断女性判用正确率错误率男性判由男性判H女性判N女性判的正确率错误率0.10.91010150#####28.60%11413650045.30%0.40.6155150#####14.30%17476491#####25.70%0.50.515515014.30%1915949180%20%0.60.4192141«####8.60%20446491糊聃15.70%0.90.1200123#####8.60%2428446糊聃4.70%对于test1测试集,总体来说,对样本集的判断对的率随着男性的先验概率的增长(女性先验概率的减少)先增大后减小,而对于男性或者女性的的个体判别随着男性的先验概率的增长而对的率不断增长或不断减小(也就是随着男性先验概率的增长,将男性判断为女性的概率越来越少,甚至没有;而把女性判别为男性的概率越来越大)而对于testl测试集,对样本集的判断对的率随着男性的先验概率的增长(女性先验概率的减少)而不断增长,而对于男性或者女性的的个体判别随着男性的先验概率的增长而对的率不断增长或不断减小(也就是随着男性先验概率的增长,将男性判断为女性的概率越来越大;而把女性判别为男性的概率越来越小)(4)当体重和身高不相关的时候先验概率testltest2男性pw女性叫男性判断j男性判断毛女性判断j女性判断彳正确率错误率男性判断口男性判断彳女性判航女性判断正确率错误率0.10.913715080%20%1569450068.70%31%0.40.618215094.30%5.70%2054549184.70%15.30%0.50.519115097.10%2.90%2064449185%15%0.60.419115097.10%2.90%2104049186.30%13.70%0.90.120014197.10%2.90%2351546493.70%6.30%对于testl测试集,总体来说,对样本集的判断对的率随着男性的先验概率的增长(女性先验概率的减少)先增大后减小,而对于男性或者女性的的个体判别随着男性的先验概率的增长而对的率不断增长或不断减小(也就是随着男性先验概率的增长,将男性判断为女性的概率越来越少,甚至没有;而把女性判别为男性的概率越来越大)而对于lestl测试集,对样本集的判断对的率随着男性的先验概率的增长(女性先验概率的减少)而不断增长,而对于男性或者女性的的个体判别随着男性的先验概率的增长而对的率不断增长或不断减小(也就是随着男性先验概率的增长,将男性判断为女性的概率越来越大;而把女性判别为男性的概率越来越小)。.结果总体分析由实验结果可知,对测试集的测试数据表白,最小错误率的贝叶斯分类器在假设两特性相关的情况下,男生类与女生类的先验概率与事实越接近既各为0.5时其准确率越高,当男生的先验概率大于女生时,容易将女生误判为男生,当男生的先验概率小于女生时,容易将男生误判为女生,在假设两特性不相关时分类器对先验概率依赖较小且准确率较高。而对样本集的测试数据则表白女生先验概率大于男生时分类器的准确率较高,假设两类特性不相关时其准确率变化不大,但女生先验概率较大时对男生的误判较多,男生的先验概率较大时对女生的误判较多。最小风险的贝叶斯分类器假设两类特性相关时,男生类与女生类的先验概率与事实接近既各为0.5时其准确率较高,由于男生误判为女生的损失较大,所以男生的先验概率越大则将女生误判为男生的概率越高,准确率则较低,女生的先验概率较高时分类器准确率较高,假设两类特性相关时,情况与不相关时类似,说明最小风险的贝叶斯分类器对先验概率依赖限度较高而对特性之间是否互相独立关系不大。此外,对样本集的分类测试对的率明显低于测试集,分析认为是由于样本分布并不十分近似正态分布,且数据分布比较分散,而测试集的数据却恰好较严格服从正态分布且数据分布比较集中。.实验心得通过实验更加深刻地理解了贝叶斯分类器的设计过程以及模式辨认的流程,通过实验了解了所学知识的实用价值,明白了最大似然估计,最小错误率的贝叶斯分类器与最小风险的贝叶斯分类器的优缺陷与合用情况,通过讨论解决实验中碰到的问题.明白了书中的公式不止需要记忆,还需要理解,明白了团队分工协作的重要性。.相关实验代码(1)当体重和身高相关的最小错误率分类期代码clearall;pwl=input(1ADfiupAIEi^e,AAE£o*)pw2=input-A®EupAIENe,AaE£o/)male1=0;fema1el=0;errorll=0:errorl2=0;male2=0;female2=0;error21=0;error22=0;%2aEONu±^[tlHt1W]=textread('E:\z6EyIAR§JEU\A£E^ESI±d\A£E^E^±dEpNe\test1.txt\»%f%f%*sf);[t2Ht2W]=textread('E:\^6EyiAN§£U\A£E^Ec±d\A£E^Ec±5EpNe\test2.txt','%f%f%*sz);HW1=[t1Ht1W];HW1=HW1';HW2=[t2Ht2W];HW2=HW21;numberl=length(HW1);%%%%%%%%%%%%%%%test1(15,20)pA.dEynumber2=1ength(HW2);est2(50,250)pAidEyforn=1:20a=HW1(:,n);u11=[173.9200;65.5020]:thegema11=[20.753623.0582;23.058259.8982];%%%ADEuu12=[162,8400;52.5960];thgemal2=[43.934415.5254;15.525431.1285];%%%%A@Eudet1l=det(thegemall);det12=det(thgemal2);p(11)=1/((2*pi)*(det1lA0.5))*exp{-l/2*((a-u11)'/thegema11)*(a-u11));p(12)=1/((2*pi)*(det12八0.5))*exp(—1/2*((a-ul2)1/thgemal2)*(a-u12));pz=p(11)*pw1+p(12)*pw2;p11=(p(11)*pwl)/pz;pl2=(p(l2)*p

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论