决策树算法在商标分类中的应用_第1页
决策树算法在商标分类中的应用_第2页
决策树算法在商标分类中的应用_第3页
决策树算法在商标分类中的应用_第4页
决策树算法在商标分类中的应用_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人工智能原理姓名:成军学好:510061813论文题目:决策树算法在商标分类中的应用

蒸中文佛摘要幅:棕决策辛树一蜡般都全是自右上而汁下的问来生柱成的汇。每逼个决汪策或王事件径(即掩自然占状态仪)都示可能雕引出捡两个轨或多丘个事向件,旗导致虹不同仆的结嫂果,雁把这闯种决剖策分库支画唱成图革形很捷像一阅棵树辨的枝晚干材。本之文将塑使用凑决策液树算祥法对踢给定往的商缝标进趣行分狭类。佣其中狮有三枣大类蠢商标鞠数据踏,每歌大类昌使用堪五分繁之三竹的数充据进慰行训渡练,膜使用耳五分办之二似的数寻据进颜行测腰试熊。我索们应终用J幻av僻a和浊My户SQ指l数馒据库蜘进行皱测试壳。用傍c4舰.5辽算法提构造枕决策照树。旅最终烧对数洽据进蜡行准启确率读计算业。艰关键谨词:宾盼决策披树聋分偷类饮商盆标束测圈试棋Ti赤tl舌e趟:捡D罩ec纽is码io搬n对tr袋ee远a惜lg忽or厕it常hm扔慎依of彼t涂he娇a盟pp斯li掠ca三ti闯on多f蜡or伪t宴ra皂de君ma胳rk此c横la酷ss传if钳ic耻at雅io挺n扁A虏bs码tr都ac按t钟:涝灾Th免e缝de年ci蹄si磨on础t桶re劲e持is桑c尺om象mo严nl统y激to陪p-赞do至wn尾t健o润ge散ne宁ra勺te践.篮Ea在ch卷d崭ec虚is啄io易n绩or纤e向ve拳nt回s则(n缸am晌el咐y搏na坝tu折ra肺l拆st触at郑e)带a膊re膝l趟ik惰el拘y贷to珍e姨li阿ci共t背tw农o认or任m浮or廉e括ev匀en考ts德,驻le啊ad蜜t生o轨di撒ff网er找en悦t奉re锻su垫lt垃s,柱p睛ut昌t晌hi喝s稀de拦ci过si旦on谎b乎ra热nc盖h妙lo上se姓r跳g爽ra男ph构ic彩s璃is喂l顶ik说e疲a匠tr禽ee素b饿ra丑nc坟he父s.豪T岩hi舟s史ar插ti尖cl灵e柿wi萌ll矿u浅se伴t衰he葛d甲ec默is葱io灾n侍tr吓ee矩a私lg循or气it挎hm供f骡or司g棚iv御en隶t件he畅t扰ra亮de肺ma澡rk进o众f术cl饱as阔si壁fi馅ca寒ti绳on磁.档Th旷er铃e肿ar户e抢th壶re每e革ki梁nd吸s宏of慢t批ra菜de没ma陷rk平d围at木a,娇e咏ac拌h株of行t到he辱g盘ro渗up晚s捕us池in馆g纹th休re喉e布fi科ft俩hs法o爸f趁th蛾e崇da班ta凭t疮o宵tr对ai恐n,勒u尿se太t秋wo杠f粒if乏th捷s锡of院t徒he靠e艺xp拨er栏im犁e袍nt柱al歇d锈at酬a.岭W侧e角us疮e逼Ja立va版a役nd公M粱y扯SQ掉L搂d中at尤ab溜as净e揪te互st特in滴g.勤U鉴se验c滚4.姨5辩de叼ci曾si隶on肃t暗re跑e叔al鸽go其ri膜th腿m'土s搁co烫ns俯tr率uc承ti忌on禁.恭Fi纯na扁ll祖y付,错ca惭lc钱ul坝at丘e晨th戏e波da殖ta暗a巨cc毁ur逼ac坡y哀.眼K炕ey住wo车rd尿s:比器De晕ci请si畏on争t斩re尾e族c阶la封ss辽if货ic养at暮io含n氏b抢ra位nd来虽te统st籍引言宣:记机器三学习泰一般掩分为纤3玩种类评型:遮有监枯督的银、无溜监督御的以巴及强岩化学很习孙【1摊】腊。反有监湾督学橡习问衣题涉云及从知它的吩输入淘和输证出的住实例耐中学倾习一就个函宴数忍。猫对于乡完全歪可观拼察的虽环境继,智渡能体瘦总能蔑够观庭察到雪它的榜行动脸所带厕来的答影响三,因违此有衣监督洪学习拔是可谈行的呆,否预则会遗困难胶一些完。墨药无监势督学佛习问着题涉此及在往未提情供明谋确的割输出刚值的雅情况处下,僻学习述输入预的模屋式贵。紧纯粹姿的无族监督渠学习络智能晨体无浸法学罗习要蚀做什涨么,枪因为关它没稍有信这息说卵明什正么能烧构成仿正确俊的行底动或盏者所配期望凉的状银态萄。唐前彼强化狗学习息问题版,是亩三类逗问题参中最薯普遍机的一咬个。遵强化掏学习腔是从装强化隔物(代起加翼强作寺用的默事物撞)中归进行腊学习股,而是不是型根据阁教师控所说闯的应持该做耍什么乡进行异学习筝。魄正文写:薄决策拴树方壤法是登挖掘未分类围规则外的有窑效方皆法,析通常浑包括苍两个再部分胶:贷①诚树的烛生成帆,开估始时搁所有锁的数绪据都拨在根炒节点途,然送后根答据设糠定的制标准手选择在测试俘属性宫,悬用不率同的颗测试裹属性路递归筑进行蜻数据花分割怖。钳②注树的普修剪钥,就登是除牲去一我些可岔能是河噪音精或异择常的验数据回。基命于信众息熵须的斗ID每3后算法插、倾C4芳.城5明算法核都能芒有效应地生武成决迎策树盏,建麻决策饥树的蚂关键造在于傻建立针分支钓时对桌记录洪字段迅不同菜取值伍的选孤择。配选择窗不同燕的字湖段值刃使划两分巡出来挑的记祝录子无集不啦同云影响复决策案树生异长的叫快慢彼及决接策树趟的结姐构,港从而姜可寻伞找到烛规则壁信息闸的优泄劣。崭可见侮,决黑策树宇算法贵的技竞术难船点就汇是选院择一剧个好食的分熟支取佣值。堂利用刻好的体取值肠产生权分支顾可加没快决宽策树业的生句长,杯更重乳要是兆产生喝好结屿构的菠决策享树,部并可丧得到擦较好顺的规静则信谦息。铺相反证,若渡根据倒一个椅差的抵取值条产生妄分支笨,不本但减圣慢决芦策树澡的生抢长速珠度,究而且拥使产贫生的慎决策候树分码支过氧细、哈结构纽差,伶从而食难以妹发现装有用搏的规抖则信见息。的随着豪训练命样本胃集中游样本肃个数榜的不陶断增统多副(垮即样慧本集碎规模哗不断双扩大浸)寺,训坊练样俩本集给在主开存中盟换进窝换出劫就耗冶费了臣大量每的时染间,柄严重毁影响薯了算健法效家率。漆因此虑使算宋法能病有效述处理逼大规雁模的辞训练沾样本葛集已威成为振决策腾树算秧法研赶究的喇一个躺重要奉问题景,也昨是目锦前国嘴内对嘴决策志树算马法研筝究的躬热点扶。喝本文叶利用刺决策优树C亿4.溉5算虽法来勾解决鹊图像倡的分绍类问马题。央现在蒸我们突引用条下c尤4.弊5算举法的阳实例吸【2炭】贫。游C4泛.购5羡算法惠是构迫造决枝策树挽分类纠规则踩的一沃种算妹法,槽它是禁ID箩3符算法已的扩回展。孟ID醋3主算法拉只能潮处理撕离散哲型的研描述茎性属猪性违而厨C4谣.5灾算法挑还能竞够处困理描捐述属庄性取拴值为助连续客型的约情况倍。选屯取节前点的犯标准床是最硬大信队息增与益率任,具喊体的煮算法喂步骤要如下剑:难St踏ep享l皱:谊数据舅源进上行数也据预菜处理肺,将益连续咸型的姐属性斥变量丝进行别离散疫化处啦理形垒成决肉策树匙的训拦练集欲(饭如果樱连续久取值鼻的属胜性则己忽略榆);何(1田)户根据泥原始净数据匠,找斜到该舱连续达型属浙性的替最小万取值护a榨0熔大取辰值卸a域n+莫1混;妈(2青)忘在折路区埋蝴间烧[a堤错,拣b]画插人片n鬼数值籍等分杂为荐n+离l谨个小郑区间萍;锤(3却)串分别弹以职a惠i货,折i=刘1,游2,煎⋯秘,扇n可。为捕分段断点,甲将区除间胶[a睁0穴,a好n+畜1戒]雕划分释为两尺个子趋区间搅:设音[a绞0款,a镜j垂]插,拼[扇(妄a学i+滴1打,a气n+仆1通)码]避对应副该连纹续型热的属但性变钥量的龄两类良取值正,有员n壤种划检分方居式输;求St靠e愧p2剂殃:败计算任每个离属性客的信帽息增正益和颜信息驱增益逆率代;练(1艺)漫计算之属性校A拥的信冲息增己益担Ga视in靠(A坊)存信息免增益忽G盈ai尸n(掠A)袖的计岂算和纵ID识3妈算法眼中的桃完全脂一致棍;溪(2销)感计冲塔算起斤属性威A引的信缩息增疯益率雕G食ai劣n厅一物Ra网ti呀o(乌A辛)G剖ai迫n葱一格Ra云ti窃o(杂A)队=士G贞a私in或(A封)艰/I听(A很)蹈对于鼓取值惑连续纽的属暑性而披言,幅分别陈计算平以钻a着i辜(何i=略1,惠2,株…们,乎n)飘为分外割点滨,对趟应分依类的中信息法增益趴率,餐选择偷最大隙信息惹增益晕率对已应的举a史i驴,作御为该树属性蜡分类写的分虹割点幻。选睬择信萄息篇陈增益描率最跑大的豆属性痒,作京为当定前的勿属性平节点肝,得吩到决层策树娱的根足节点两。援St午ep草3拳:痰根节物点属鹿性每镇一个施可能困的取斥值对捷应一拳个子榜集,穿对样雀本子攀集递言归地婚执行腔以上啊St中ep跳2港过程广,直送到划德分的慰每个淘子集样中的岔观测迎数据拥在分你类属门性上误取值疲都相按同,巴生成猎决策行树。棋St燕ep雨4采:奥根据墙构造品的决棒策树喘提取愧分类茅规则择,对王新的览数据剑集进歉行分挤类。踩类似某算法势的主初要思普想都通是,瓦逐步饺找出农能够出为各郊个层饲次的挽分类堂提供构最大租信息滥量的谢变量帅,由远此可侦以确融定决锄策树财从根傻到枝休,再你从枝愉到叶舍的结制构。逢决策毙树生杨成的惑过程示也就井是对妄训练唐数据债集迸匆行分下类的熄过程荣。敏现在故分析报给出勇的商可标,鸟建立怪数据众库。吴并建务立表宫:陪其中渡id记是主港键。已属性昂包括膜:c套ir拨cl根e、销re碑ct各an姿gl阴e、窜tr扶ia呢ng堆le振、c粗on裁ne刃ct暑、o绝bj品ec器t。否分别飘是圆圈、长达方形捧、三漏角形齿、组虫合行余、所怨属分罚类。宜接着户用3我/5处的数问据作掏为训猫练集砍,2借/5确的数献据集慈作为慰测试彻集。杏对所坚有商烧标进爪行定何义属苗性,毙并保款存到谋数据娇库中心。如涨下:斩由于副数据尿量比嘱较大哑,这险里就抖不全男部列疫出,腾接着旧用s故ql争语句干对数冷据查园询,艺比如悲要查缘询从信id该1套—多id午10肠0中膀ci盏rc聚le研属性乳都是迹1的溪个数蓝是多坝少:拿S仁el副ec担t董su近m叛(c易ir眨cl径e)滑F劳ro爪m云br秧an腔d里W胃he竟re纹i标d<之10萄1址an楼d拿id腊>0沫a仁nd宝c联ir勺cl石e=狐1陆接着稿根据残c4颈.5役算法秒计算犬得到仁:派Ga功in画Ra遮ti颗快ci签rc由le袋(A覆)=红竿0.况23针21就21夸31答Ga窃in纽Ra扬ti枣戏Re下ct落an达ge四(A武)=桥堆6.途44耕12闹31漠21制Ga蝴in稻Ra袭ti纷娇tr拼ia陕ng例le识(A袭)=凡乖2斩.9振18壶92谨83辽7写Ga淡in埋Ra踪ti货o暂co如nn笼ec贞t行(A贸)=费5.倡32枝41粱23忠21奏结论循:资根据霉c4隐.乳5算盯法,陈增益战率高恶的作离为分像界点技,则胀我们算可以院得到互决策费树的艘结构拜:RRectangle粮足结送徒丧杏沿软招傲警竖佛看挪袭塌宝愿R碧=0程消弄炒击尚适R=虽1Object2Object2connect叮抬途它倾防蹦退兼跪挠之何丙宏爹翠鱼揪升雕有寨中C晶=1殃卫剪爬码络C承=0Object3Object3Object1闯最后伤对训舒练集顾和测束试测攻试集鼻进行鸣准确蔑率计法算:钻在数播据库盼中使细用查父询:校S配el穿ec塔t忽*秃F蚊ro葛m搞br妥an降d纸W欧he跑re莲r恢ec浸ta馋ng餐le梳=0教a缴nd扒o古bj姻ec筛t=翼2抗用球宋的值肆除以削测试秒集的捧60掀,就理是正竖确率蝴。最彩终的搞结果堡是:跃类烂第一穿类臭第二拾类酒第三暮类坟正确技率饱71蓝.7庸6%间78像.6盏5%装86仿.6员%孔训练死集淡接着劝用同对样的白方法希对测朝试集呆进行稻测试拌,得桂:的类稿第一中类劣第二遗类由第三吹

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论