




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、.最近邻法和k近邻法学号: 02105120名:吴林1 .基本概念:最近邻:对于未知样本x,比较x和n个已知类别的样本之间的欧元距离以确定x与最接近的样本相同。k近邻法:取未知样本x的k近邻,看到该k近邻多属于哪个类,将x分类为哪个类。 k取奇数,为了避免k1=k2的情况。2 .问题分析:为了判别x属于哪一类,求最接近x的k个样本(在k=1的情况下,为最近邻法)且判别该k个样本的大部分属于哪一类。可以使用欧元距离公式来计算两个采样之间的距离s=sqrt(x1-x2)2 (y1-y2)2)3 .算法分析:在该算法中,将每个类的样本的一半作为训练样本,剩下的作为试验样本。 举例来说,iris设定每
2、一类25组为训练样本,剩馀25组为测试样本,从一个测试样本x顺次求出最接近的k个样本,并确定k个样本中的大部分属于哪一类,那么x属于哪一类? 进行10次测试,取10次的分类正解率的平均值来验证算法的性能。MATLAB代码:最近的邻居计算实现了对Iris进行分类clc;totalsum=0;for ii=1:10data=load(iris.txt )data1=data (1:50,1:4 )取得% iris-setas数据的25组rbow1=randperm(50 )train sample1=data1 (rbo ww1 (:1:25 ),1:4 );rboww1(:2633365050)
3、=sort(rboww1(:2633365050 ) ); %剩下的25对按行下标的大小排列测试样本1=数据1 (rbo ww1 (:26336550 ),1:4 );data2=取得data (51:100,1:4 ) iris-versi color数据的25组rbio2=ranperm(50 )trainsample2=data2(rbio2(:1:4 )、1:4 )rbotw2(:2633365050)=sort(rbotw2(:2633365050 ) );测试样本2=数据2 (rbio2(:263336550 )、1:4 )data3=获取data (101:50,1:4 ) ir
4、is-virgin ICA数据的25组rbow3=randperm(50 )train sample3=data3(rbot w3 (:1:4 )、1:4 )rbotw3(:2633365050)=sort(rbotw3(:2633365050 ) );测试样本3=数据3 (rbo ww3(:263336550 )、1:4 )包含trainsample=cat(1,trainsample1,trainsample2,trainsample3) u组数据的样本集测试示例=cat (1,测试示例1,测试示例2,测试示例3 )new char=zeros (1,75 )和=0;i,j =大小(tra
5、in sample ) % I=60,j=4“u,v”=大小(测试示例) % u=90,v=4for x=1:ufor y=1:iresult=sqrt(testsample(x,1)-trainsample(y,1)2 (testsample(x,3)-trainsample(y,3 ) )newchar(1,y)=result;结束;new,Ind=sort(newchar )等级1=0;等级2=0;等级3=0;I fdind (1,1 )=25等级1=等级11;else if sind (1,1 ) 25ind (1,1 )=50等级2=等级2 1;else等级3=等级3 1;结束if等
6、级1等级2等级1等级3m=1;ty=Iris-setosa;else ifs等级2等级1等级2等级3m=2;ty=iris-versi颜色;else ifs等级3等级1等级3等级2m=3;ty=Iris-virginica;elsem=0;ty=none;结束PK=25m 0disp (第%d组数据分类后为%s类,rbow1(:x 25 ),ty );elseif x=25m=0disp(sprintf (第%d组数据分类后为%s类,rbow1(:x 25 ),none ) );结束ifx2x5x=50ms0disp(sprintf (第%d组数据分类后为%s类,50 rbow2(:x ),t
7、y ) );elseif x25x=50m=0disp (在第%d组数据分类后为%s类,50 rbow2(:x,none ) );结束if x50x=75m0disp (第%d组数据分类后为%s级,100 rbow3(:x-25 ),ty );elseif x50x=75m=0disp (第%d组数据分类后为%s级,100 rbow3(:x-25 ),none );结束if (x=25m=1)| (x2x5x=50m=2)| (x50x=75m=3)sum=sum 1;结束结束disp (第%d级分类识别率为%4.2f、ii、sum/75 );totalsum=totalsum (sum/75
8、 )结束disp(sprintf(10次分类平均识别率为%4.2f,totalsum/10 ) );测试结果:第三组数据分为Iris-setosa类第五组数据分为Iris-setosa类第六组数据分为Iris-setosa类第七组数据分为Iris-setosa类第十组数据分为Iris-setosa类第11组数据分为Iris-setosa类第十二组数据被归类为Iris-setosa类第十四组数据分为Iris-setosa类第16组数据分为Iris-setosa类第18组数据分为Iris-setosa类第19组数据分为Iris-setosa类第20组数据被分类为Iris-setosa类第23组数据
9、被分类为Iris-setosa类第24组数据被分类为Iris-setosa类第26组数据分为Iris-setosa类第28组数据分为Iris-setosa类第30组数据被分类为Iris-setosa类第31组数据被分类为Iris-setosa类第34组数据被分类为Iris-setosa类第37组数据分为Iris-setosa类第39组数据分为Iris-setosa类第41组数据分为Iris-setosa类第44组数据分为Iris-setosa类第45组数据分为Iris-setosa类第49组数据分为Iris-setosa类第51组数据被分类为Iris-versicolor类第53组数据被分类为
10、Iris-versicolor类第54组数据被分类为Iris-versicolor类第55组数据被分类为Iris-versicolor类第57组数据被分类为Iris-versicolor类第58组数据被分类为Iris-versicolor类第59组数据分为Iris-versicolor类第60组数据被分类为Iris-versicolor类第61组数据分为Iris-versicolor类第62组数据分为Iris-versicolor类第68组数据分为Iris-versicolor类第70组数据被分类为Iris-versicolor类第71组的数据被归类为Iris-virginica类第74组数据
11、被分类为Iris-versicolor类第75组数据被分类为Iris-versicolor类第77组中的数据被分类为Iris-versicolor类第79组中的数据被分类为Iris-versicolor类第80组数据被分类为Iris-versicolor类第84组数据被分类为Iris-virginica类第85组数据被分类为Iris-versicolor类第92组数据被分类为Iris-versicolor类第95组数据被分类为Iris-versicolor类第97组数据被分类为Iris-versicolor类第98组的数据被分类为Iris-versicolor类第99个数据被分类为Iris-v
12、ersicolor类第102组数据被分类为Iris-virginica类第103组的数据被分类为Iris-virginica类第105组的数据被归类为Iris-virginica类第106组的数据被归类为Iris-virginica类第107组中的数据被分类为Iris-versicolor类第108组数据被分类为Iris-virginica类第114组数据被分类为Iris-virginica类第118组数据被分类为Iris-virginica类第119组数据被分类为Iris-virginica类第124组数据被分类为Iris-virginica类第125组数据被归类为Iris-virginic
13、a类第126组数据被归类为Iris-virginica类第127组数据被归类为Iris-virginica类第128组数据被分类为Iris-virginica类第129组数据被分类为Iris-virginica类第130组数据被分类为Iris-virginica类第133组数据被分类为Iris-virginica类第135组数据被分类为Iris-virginica类第137组数据被分类为Iris-virginica类第138组数据被分类为Iris-virginica类第142组数据被分类为Iris-virginica类第144组数据被分类为Iris-virginica类第148组数据被分类为I
14、ris-virginica类第149组数据被分类为Iris-virginica类第150组数据被归类为Iris-virginica类k近邻法wine分类:clc;otalsum=0;for ii=1:10 %循环测试10次data=load (wine.txt )导入wine数据data1=data (1:59,1:13 ) %取得第一类数据的30组rbow1=randperm(59 )train sample1=data1 (sort (rbo w1 (:1:30 ) )、1:13;rbo w1 (:31336559 )=sort (rbo w1 (:31336559 ) ); %剩下的29
15、组按行下标的大小排列测试样本1=数据1 (rbo ww1 (:31333659 ),1:13 );data2=data (60336330,1:13 ) %获取第二类数据的35组rbio2=ranperm(71 )train sample2=data2(sort (rbio2(:1:13 ) )、1:13;rbot w2 (:36336071 )=sort (rbot w2 (:36336071 ) );测试样本2=数据2 (rbio2(:36:71 )、1:13 )data3=data (131336078,1:13 ) %取得第三类数据的24组rbow3=randperm(48 )trai
16、n sample3=第3天(sort (rbot w3 (:1:13 ) )、1:13;rbot w3 (:25336848 )=sort (rbot w3 (:25336848 ) );测试样本3=数据3 (rbot w3 (:25336348 ),1:13 );包含train_sample=cat(1,trainsample1,trainsample2,train sample3)组数据的样本集test_sample=cat(1,testsample1,testsample2,testsample3)k=19; 近邻法new char=zeros (1,89 )sum=0;i,j =大小(train _ sample ) % I=89,j=13“u,v”=大小(test _ sampl
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 储备干部面试题及答案
- java面试题及答案项目经验
- 消化系统疾病护理共同要点
- 保育员消毒培训
- 2025年中国木制小提琴弓行业市场全景分析及前景机遇研判报告
- 肿瘤科急诊的护理
- 中风中医护理病例讨论
- 中心静脉压测量护理查房
- 流程讲解规范实施指南
- 直肠癌术后引流管的护理
- 70岁以上的换领驾驶证三力测试题答案
- 药品售后服务承诺书
- 露天矿防火安全知识讲座
- 2024年山东烟台财金集团招聘笔试参考题库含答案解析
- GB/T 43234-2023成型模斜导柱
- 马工程版《中国经济史》各章思考题答题要点及详解
- 中建公路工程10T龙门吊安拆方案
- 2023年石狮市国企招聘考试基础题库
- OBE理念下的一流专业和课程建设
- 游戏俱乐部群公告范本
- 国家玩具安全技术规范
评论
0/150
提交评论