用身高与体重数据进行性别分类的实验报告_第1页
用身高与体重数据进行性别分类的实验报告_第2页
用身高与体重数据进行性别分类的实验报告_第3页
用身高与体重数据进行性别分类的实验报告_第4页
用身高与体重数据进行性别分类的实验报告_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

用身高和体重数据进行性别分类的实验报告姓名:刘懿郴学号:2023302308范英学号:2023302316胡亮学号:2023302319班级:9391基本要求用FAMALE.TXT和MALE.TXT的数据作为训练样本集,建立Bayes分类器,用测试样本数据对该分类器进行测试。调整特征、分类器等方面的一些因素,考察它们对分类器性能的影响,从而加深对所学内容的理解和感性认识。2、具体做法(1)应用两个特征进行实验:同时采用身高和体重数据作为特征,分别假设二者相关或不相关,在正态分布假设下估计概率密度,建立最小错误率Bayes分类器,写出得到的决策规则,将该分类器应用到训练/测试样本,考察训练/测试错误情况。比较相关假设和不相关假设下结果的差异。在分类器设计时可以考察采用不同先验概率(如0.5vs.0.5,0.75vs.0.25,0.9vs.0.1等)进行实验,考察对决策和错误率的影响。自行给出一个决策表,采用最小风险的Bayes决策重复上面的实验。3、实验原理已知样本服从正态分布,(1)所以可以用最大似然估计来估计μ和Σ两个参数币样本类分为果男生内和女生煮两类,利用役最大似然估免计分别剪估计出男生写样本的烈,德,和女生样赵本的秘,投,然后盐将数据带入柴(1)公式少分别计馒算两者艇的类条霜锤件概率密度悠和洞,然后根据露贝叶斯公式巾计算出两类周的后验概率渗和活实验一:脊对于两类情礼况,我们可池以仅定义一坐个判别函数退:艰逮抹田膜其中扔施=舅趴恋业悟=饭侵并将决策规尽则表示为贷两如果展匆嗓>0,勿则决策案;磨秒慰矩<0,则决羞策退。缸实验二隔:我们定义请一个决策表狂如下图掠腐损失晃状态她管撒筒决策损失鱼0炉6淋2挑0地我们定义判洒别函数仿并将决策规进则表示为绪裤如果阶惜>0,则决携策胳;简律寻边<0,艘则决策桶。xxx>0?输入数据样本集带入判别函数演民趋校词熟久驱抢N案撤当合姐彻晶Y窃变剑南迫搬送撤确浴毛嗽实验呈流串程简图肢4冒、灵实验结果提队英利用mat练lab我们芒计算出了m剃ale.t行xt循总和fema范le.tx恐t的均值和卷协方差驰,咸和圾,块,册这样我们可明以利用公式趣和判别函数股与决策规则毅对训练/测思试样本集进恰行分类,结垫果如下:馒当体重和身但高相关的时斤候组帐雕泻对于tes晚t1南测试集,总偏体来招说,对样本稼集的判断正略确率随着男淋性的先验概阀率的增加(塌女性先验概射率的减少)坡先增大后减螺小,而对于辣男性或者女谊性的的个体石判别随着男让性的先验概筑率的增加而贿正确率畜不断增加或愉不断减小(挺也就是随着弹男性先覆达图验概率的增哄加剩,将男性判辣断为女性的欣概率越来越弓少,甚至没朴有;而把女蜘性判别为男唯性的概率越蚂来越加大)暴而对于te轰st1测试超集,对样本著集的判断正眼确率随着男诞性的先验概枯率的增加(占女性先验概准率的减少)符而不断增加辜,而对于男地性或者女性窄的的个体判易别随着男性乡的先验概率敏的增加而正绕确率不断增冲加或不断减著小(也就是微随着男性先惩验概率的增泻加,将男性甘判断为女性甩的概率越来涛越大;而把性女性判别为仿男性的概率凝越来越小)刷(2)当体剖重和身高不雀相关的时候叠谅售辨邻对于tes礼t1测试集伪,总体来说依,对样本集迈的判断正确惭率随村着男性的先厦验概率的增室加(女性先舞验概率的减浸少)先增大利后减小,而赖对于男性或伴者女捆性的的个体骂判别随着男供性的先验概蜂率的增加而兼正确率不断仰增加或不断狭减小(也就活是随膨着男性先验梁概率的增加埋,将男性判闲断为女性的傍概率越来越烟少,甚至没耐有;而把女尼性判别为男多性的概率越忽来越大)而蓬对于tes瓦t1测试集丹,对样本集浑的判断正确宝率随着男性气的先验概率狱的增加(女闪性先验概率讲的减少)而摆不断增加,伤而对于男性剑或者女性的致的个体判别盘随着男性的扁先验概率的挺增加而正确锣率不断增加步或不断减小暴(也就是随田着男性先验允概率的增加获,将男性判亡断为女性的押概率越来越阅大;而把女莲性判别为男学性的涝概率越来越魂小)杜(3)当体斯重和身高相谣关的时候芳轨窄趴对于tes校t1测试集策,总体来说岸,对样本集烫的判断正确佛率随着男性题的先验概率式的增加(女娇性先验概率答的减少)先犯增大后减小迎,而对于男悄性或者女性竭的的个体判对别随着男性程的先验概率咱的增加而正光确率不断增劳加唱或不断减小食(也就是随评着男性先级挺验概率蔽的增加,将郊男性判断为锋女性的概率宁越来越少,哭甚至没有;疼而把女性判事别为男性的野概率越来越首大)而对于燕test1膨测试集,对赵样本集的判剃断正确率随近着督男性的先验桐概率的增加异(女性先验劣概率的减少世)房而不断增加绢,而对于男振性或者女性听的的个体判康别随着男性唉的先验概率合的增加而正逼确率僻不断增加或辣不断减小(袍也就是随着留男性先验概胡率的增加,区将男性判断奔为女性的概拿率越逆来越大;而登把女性判别回为男性的概低率越来越小徐)班(4)当体吃重和身高不射相关的时候挪驰虏蔑对悲于踢test1殊测试集,总罢体来说,对半样本集的判出断正确率随受着男性的先轮验概率的增电加(女性先示验概率的减乐少)先增大候后减小,而简对于男性或到者女性的的终个体判别随伸着男性的先令验概率的增恭加而正确率鲜不断增加或撇不断减小(背也就是随着响男性先朝哨榆验概率的增俱加,将男性锁判断为女性乞的概率越来债越少,甚至围没有;而把茅女性判别为亲男性亏的概率越来起越大)而对谦于test焦1测试集,倒对样本集的脂判断正确率除随着男性的粘先验窃概率的增加回(女性先验咳概率的减少只)而不断增类加,而对于铁男性或者女帐性的的个体纺判别随着男仅性的先验概拌率的增加而偿正确率不断森增加或不断脚减小(也就尚是随着男性贴先验概率的准增加,将男揉性判断为女拒性的概率越杨来越大;而流把女性判别肆为男性的概箩率越来越小俭)。累5.结果总显体分析倍由实验结果再可知,对测盒试集的测试垒数据表明,险最小错误率萝的贝叶斯分腔类器在假设乞两特征相关体的情况下,哀男生类与女梦生类的先验舰概率与事实谷越接近既各伙为0.5时肚其准确率越承高,当男生金的先验概率教大于女生时重,容易将女肤生误固判为男生,派当男生的先融验概率小于毯女生时,容逢易将男生误排判为女生,干在假设两特陆征不赚相关时分类渐器对先验概皱率依赖较小剑且准确率较冈高。葵而对样本集薯的测试数据苏则表明女生诉先验概率大盐于男生时分更类器的准确节率较高,假过设两类特征改不相关时其惊准确率变化袍不大,但女甲生先验概率绩较大时对男杂生的误判较跨多,男生的岗先验概率较谢大时对女生郊的误判较多昼。切最小风险的蹈贝叶斯分类讯器假设两类纸特征相关时醋,男生类与熊女生类的先索验概率与事顶实接近既各变为0.5时财其准确率较搂高,由于男兴生误判为女肿生的损失较饰大,暖所以男生的晌先验概率越由大则将女生狭误判为男生岗的概率越高须,准确率则织较低,女生涛的先螺验概率较高锐时分类器准摔确率较高,遍假设两类特叫征相关时,布情况与不相过关时类似,驳说明思最小风险的蔑贝叶斯分类贱器对先验概矛率依赖程度程较高而泥对特征之间政是否相互独纲立关系不大庆。课另外,对样总本集的分类牵测试正确率践明显低于测拳试集,分析档认为是由于限样本分布并传不十分近似泛正态分布,攻且数据分布绢比较分散,浑而测试集的喜数据却恰好辛较严格服从秃正态分布且昏数据分布比夺较集中。寒6.实验心花得考通过实验更阁加深刻地理梁解了贝叶斯谊分类器的设垄计过程以及比模式识别的冬流程,通过壮实验了解了孙所学知识的末实用价值,驴明白了最大芳似然估计,耀最小错误率圣的贝叶斯分识类器与最小倾风险的贝叶于斯分类器的爽优缺哨点与适用情微况。通过讨师论解决实验贴中遇到的问锈题,明白了榴书中的公式劫不止需要记尘忆,诊还需要理解猎,明白了团衫队分工协作洲的重要性。央7.灿相关实验代怪码他(1)法当体重和身称高相关的最巷小错误率分含类期代码军猜clear塌订all召;泉pw1=i犬nput(框'ÄÐÉú脸µÄÏÈÑ姥é¸ÅÂÊ净£º'平)呈pw2=i画nput(欺'Å®Éú聚µÄÏÈÑ项é¸ÅÂÊ浇£º'叔)键male1无=0;fe腰male1大=0;er昼ror11艰=0;er度ror12唉=0;ma脸le2=0凯;fema闷le2=0兆;怒error晶21=0;近error胶22=0;柱%²âÊÔ旨Ñù±¾俭[t1H拢t就1W]=t斯extre供ad(永'E:\´香óÈýÏÂ伞ѧÆÚ\屡ģʽÊ锦¶±ð\Ä搜£Ê½Ê¶开±ðʵÑ您é\tes生t1.tx倒t'界,雪'%f%立f%*s与'杯);厨[t2H膀t2W]=迈textr杯ead(城'E:\´药óÈýÏÂ役ѧÆÚ\烧ģʽÊ坡¶±ð\Ä乘£Ê½Ê¶元±ðʵÑ互é\tes诊t2.tx水t'掌,妻'%f%蛮f%*s指'教);逐HW1=[低t1Ht某1W];H背W1=HW庄1';挎HW2=[熔t2Ht轰2W];H隐W2=HW属2';者numbe政r1=le嫌ngth(祸HW1)亦;遥%%%%%搅%%%%%陷%%%%%珠test1导(15,2圣0)µ狼ĸöÊý仁numbe属r2=le材ngth(揉HW2)文;笨%%%%%莲%%%%%极%%%%%拴test2泥(50,2梯50)µÄ忆¸öÊý两for牙n=1:毕20鬼a=H杨W1(:,闯n);性摇u11=[欧173.9无200;6贫5.502乓0];th昼egema域11=[2原0.753只623.压0582;段23.05忽8259原.8982呼];基%%%ÄÐ中Éú帐骡u12=[啄162.8津400;5竞2.596孟0];th迁gema1肚2=[43育.9344袜15愁.5254狼;15.5交2543敌1.128吗5];魂%%%%Å寇®Éú少蹈det11帆=det(纹thege慕ma11)附;det1厘2=det稿(thge寄ma12)睡;箩昨p(11)认=1/((搬2*p遥i)*(d叼et11^苗0.5))咳*exp(倚-1/2*灶((a-u营11)'/番thege隔ma11)值*(a-u鬼11));歉挖p(12)蔬=1/((新2*pi)烈*(det回12^0.压5))*e批xp(-1裙/2*((劣a-u12鞋)'/th悔gema1赞2)*(a报-u12)鞭);月爸pz=p(监11)*p论w1+p(研12)*p溉w2;卫帖p蓝11=(p侨(11)*火pw1)/艺pz;p1至2=(p(威12)*p挥w2险)/pz;洲贱g=p11检-p12;移炕if悔(g>0腥)手%%%Ñù矩±¾¼¯Ç杯°15¸ö著ÈËÊÇÄ奉ÐÉú见课m昏ale1=饥male1展+1;困店else封蛾e斥rror1柳1=err案or11+姐1;饼葬endend锹mal度e1皆err付or11泡煤for百n=21堤:numb具er1足a=H百W1(:,怕n);饰医u11=[尚173.9竭200;6造5.502辨0];th也egem明a11=[惕20.75咏3623联.0582惰;23.0阅5825斜9.898啄2]丢;薯%%%ÄÐ泉Éú淡吸u12=[滩162.8针400;5糖2.596欢0];th津gema1撒2=[43勿.9344讲15.5喂2加54;15颠.5254御31.1截285];暗%%%%Å悄®Éú盏趁det11先=det(干thege鸭ma11)极;det1刮2=det惨(thge胖ma12)栋;测殿p(11)片=1/((魔2*pi)域*(det林11^0.体5))*e祸xp(-1子/2*((家a-u11落)'/th渴egema淹11)*(钥a-u11丙));嘉岛p(12承)=1/(元(2*pi贱)*(de谦t12^0虹.5))*楼exp(-曾1/2*(边(a汁-u12)揭'/thg休ema12否)*(a-腿u12))较;妙雀pz=p(猪11)*p祖w1+p(纪12)*p袍w2;柏击p11=策(p(11畜)*pw1保)/pz;德p12=(宪p(12)蛋*pw2)出/pz;游屡g=p11背-p12;昌置if涨(g<0踪)砍%%%Ñù嚼±¾¼¯t爆est1º维ó20¸ö略ÊÇfem病ale戴若femal镰e1=fe多male1旗+1;之刷else辜忧e尊rror1壮2=err复or12+敞1;笑品endend罢fem链ale1女err竖or12池离依for马n=1:跑50吸a=H素W2(:,惑n);谅融u11=[扇173.9丹200;6鱼5.502宽0];th杀ege薯ma11=垂[20.7释5362谎3.058陕2;23.从0582援59.89电82];进%%%ÄÐ剥Éú迎衬u12=[客162.8链400;5派2.596绑0];th松gema1甲2=[43疼.9344钟15.5墓254;1论5.525径431.冶1285]僚;斩%%%%Å万®Éú温困det11悟=det(五thege楼ma11)棉;det1炎2=怖det(t桃hgema厕12);河灶p(11)护=1/((已2*pi)快*(碑det11疾^0.5)挂)*exp妄(-1/2燕*((a-炊u11)'具/theg渗ema11爱)*(a-鹅u11))珍;溜炭p(1坟2)=1/近((2*p结i)*(d叶et12^晚0.5))孕*exp(呈-1/2*徒((a-u似12)'/渣thgem伴a12)*衬(a-u1奋2));夕桑pz=p(隶11)*p昂w1+p(厌12)*p徐w2;沿葱p11=(它p(11)徒*pw1)统/pz;乔%%%ma懒leºóÑ英é¸ÅÂÊ谁学p12=(京p(12)铁*pw2)庭/pz;欣%刑%%%fe讲maleº捕óÑé¸Å方ÂÊ稿野g=p11裙-p12;卵%%%%化test2狠Ç°50¸匪öΪfe筐male店钻if蛙(g<0涌)伍%%%ÅÐ时¶ÏÊDz竟»ÊÇfe震male迹宫fe岔male2训=fema奏le2+1广;啦砖else熟遍e曲rror2刮1=err狡or21+浩1;劳良endend黄fem敏ale2记err氧or21蒜纺for略n=51完:numb侮er2币a=H网W2(:,容n);绕冒u11=[绵173.9肥200;6销5.502宁0];th启eg耳ema11吓=[20.汽7536旬23.05叙82;23壁.0582狱59.8兔98嘉2];意%%%ÄÐ行Éú举该u12=[图162.8置400;5泽2.596量0];th脚gema1得2=[43粮.9344修15.字5254;糊15.52挠5431么.1285挺];螺%%%%Å刑®Éú耕捏det11熊=det(吉thege要ma11)墓;det1恋2=det雕(thge晓ma12)蛋;门好p(11)熊=1/((故2*pi)先*(det晒11^0.向5))*e窃xp(-1词/2*((惰a-u11撒)'/th粱egema菠11)*(大a-u11责));拆迷p(作12)=1稳/((2*段pi)*(仰det12脏^0.5)彻)*exp教(-1/2貌*(足(a-u1麻2)'/t怎hgema挣12)*(椅a-u12四));观秋pz=

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论