本科毕业设计论文-基于半监督学习方法的研究_第1页
本科毕业设计论文-基于半监督学习方法的研究_第2页
本科毕业设计论文-基于半监督学习方法的研究_第3页
本科毕业设计论文-基于半监督学习方法的研究_第4页
本科毕业设计论文-基于半监督学习方法的研究_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

#OSk-NN(k=1)OSk-NN(k=1)图6-2CM方法与其它方法的比较值得注总的是当不同类别的点的比例接近时,髙斯谐波方法比较好,其误差率低于我们的假设一致性方法。2GCM算法实验数据为了研究使用不同核矩阵对半监督学习算法的影响,我们选取了UCI数据集以及半监督学习方法中常用的数据集,见表6-1所示。另外,我们也选择了Moons数据集以及两个服从正态分布且具有很好分离性能的数据集Normalo表6-1不同数据集的特征数据集类別数目维数数据点的个数Glass69214Ionosphere234351Sonar260208G50C250550G10N2105506.2实验方法CM实验方法通过进行多组实验和变换a的值,来计算准确率,最总准确率为多组实脸的平均值。GCM实验方法在实验研究中,主要进行了6组实验。首先,对指数函数中尺度因子a(sigma)进行了实验,分别选取0.15、025、0.350.45、055065、0.75、085与095共9个数值:在半监督学习方法中,具有类标号实例的数据分別选取1、5、10、20、30、40与50。对每组数值进行了10次实验,针对不同数据集,取10次实验中具有相同尺度因子g时的平均值。然后,针对K近邻度量方法所涉及的参数进行了实验研究,分别选取K为2、5、10、30与50。最后,针对不同度量方法对GCM算法进行了性能比较。由于非线性度量是双曲正切度量的特殊情形,因此,实脸中研究了除非线性度量外的四种度量方法。6.3实验结果与分析CM与GCM算法相比,GCM算法的准确度更髙。实验结果分别见图6-3、图64与图6-5所示。

♦■Moons口.Normal—A—-GlassXIonosphere・--•SonarOG10n——1—-G50c不同的sigma取值图6-3不同数据集的尺度因子Sigma与正确率间的关系由图6・3可以看到,对于不同的具有标号的数据数目对算法的性能具有较小的影响。针对不同的数据集,尺度因子a(sigma)的取值在[0.15,0.35]时,算法的性能最优。特别是对于容易分开的数据集,尺度因子o(sigma)具有较大的范围。OMoonsBNormalAGlassX1oiiospheie・-※・・SonM-・o・-G10n―I——G50c近邻数目图6-4不同数据集的近邻数目与正确率间的关系在K近邻度量中,由图6-4可以知道,对于大部分数据集算法的性能对近邻数目的敏感性较小,当使用5近邻时,算法的性能基本上达到较好的值。另外,这些结果的获得依赖于有标号数据的数目,这种带标号数据越多,算法的性能越好:同样,对于容易分开的数据集,对有标号数据的数日依赖性较弱,当算法的性能达到最优后,与近邻数日基本上无关。

—❖—Exp—B—K-near图6-5GCM算法中使用不同度量的数据集的正确率针对所有的数据集,实验研究了加权s阶Minkowski度虽:中s=l>s=2与s=oo且所有q满足相等时的条件,GCM算法的性能几乎没有变化,从实验研究中发现,在大部分数据集上具有类标号数据的个数对算法的性能具有一定的影响,当达到一定值时,性能变化不大。在图6-5中,针对使用不同个数的有标号数据,将算法的性能进行了平均,可以看到,在所研究的几种度量中,使用欧几里得度量的GCM算法的性能是最差的,使用指数度量方法性能达到了最优,而使用另外两种度量的GCM算法的性能介于它们之间。从实验结果可以得出,指数度量方法是最优的,不同度量中的参数取值对算法的性能具有一定的影响。七结论从上世纪80年代末,半监督学习在国外就已经有大量学者开始投入研究,但在我国的起步比较晚。现如今,半监督学习方法成为机器学习中的一个重要研究课题。在本文中,我们研究了CM算法并扩展和核矩阵的选择,基于核策略的半监督学习方法,深入分析了五种不同的度量及它们之间的关系,实验研究了使用不同度量方法中参数对算法性能的影响,实验比较了使用这些度量的GCM算法的性能。在以后的研究中,从理论上进一步分析CM算法与GCM算法,以及最优的参数取值。本论文是在指导老师李凯老师的梢心指导下完成的。论文从选题、撰写、修改到定稿,老师都给予了悉心的指导且倾注了大量的心血。在这里,首先我要感谢我的导师李凯老师。李老师平日里工作繁多,但在我做毕业设计的每个阶段,从开始准备,査阅资料,设计草案的确定和修改,中期检查,后期详细设计,到系统测试等整个过程中都给予了我悉心的指导。并且我从李凯老师身上学到了很多东西,李老师认貞•负责的工作态度,严谨的治学精神和深厚的理论水平都使我受益匪浅。他无论在理论上还是在实践中,都给与我很大的帮助,使我得到不少的提髙,这对于我以后的工作和学习都有一种巨大的帮助,感谢他耐心的辅导。在此对李凯老师表示最诚挚的感谢!同样感谢为我在本次毕业论文完成过程中提供过帮助和宝贵建议的其他领导、老师和同学。最后,感谢我的母校河北大学四年以来为我提供的良好学习生活环境,及对我知识的掌握和为人成长方而所作的培育。参考文献美•米歇尔著,曾华军等译,机器学习,机械工业出版社张海藩.软件工程导论.北京:淸华大学出版社,2003周志华,半监督学习中的协同训练风范,南京大学计算机软件新技术国家重点实脸室,南京210093(美)埃克尔著,陈昊鹏译java编程思想,机械工业出版社耿祥义,张跃平编著,java2实用教程,淸华大学出版社欧立奇,朱梅,段韬编著,Java程序员而试宝典,电子工业出版社ZhouZH.,ZhanDC,YangQ.Semi-supervisedlearningwithveryfewlabeledtrainingexamples[C]//Proceedingsofthe22ndAAAIConferenceonArtificialhitelligenceVancouver,Canad2007:675-680WangW,ZhouZHOnmulti-viewactivelearningandthecombinationwithsemi-supervisedlearning[C]//Proceedingsofthe25thhiternationalConferenceonMachineLearning.Helsinki,Omnipress,20081152-1159ZhuXJ.Semi-supervisedlearningliteraturesurvey[R]UniversityofWisconsin,Madison,2008ZhouDXBousquetO,ThomasNL,etal.Learningwithlocalandglobalconsistency[R].NfaxPlanckInstituteforBiologicalCybernetics,Tubingen,Germany,2003ChapelleO,ZienA.Semi-supe

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论