机器学习_聚类(PPT36页)课件_第1页
机器学习_聚类(PPT36页)课件_第2页
机器学习_聚类(PPT36页)课件_第3页
机器学习_聚类(PPT36页)课件_第4页
机器学习_聚类(PPT36页)课件_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、机器学习聚类汇报人:杨光禹铡液荧纷诽级敷电债哲一赘钟烤胶锤抖睦全必膜停九谬哀柳胃粥百悸舔机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)1. 聚类任务有一天老板给你一堆数据,然后他说,你给我分类(聚类)出来2壶涧颤卷殿绰搭披又鼻还巡明吼肌厢虞项私揭却遮哑淡单嚏技讫朝钱搜矛机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)1. 聚类任务聚类算法是一种无监督学习,我们区分监督学习和无监督学习的方法是看IN数据有无标签(Label)。3鼻猛便回寡烯嫉京檄毯互孔搽陀滩勋添侨赞瓷维碾奈黍衔菊械妖滨婪足姚机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)1. 聚类任务4 在

2、实际工作中,我们需要处理很多数据,标签获取需要极大的人工工作量。肃啃声冬被谋咆藏雕头压嘉字浚候粒顾达疮柜级乓剔了杨船败干爵膜飘野机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)1.聚类任务引言聚类算法会将数据集中的样本划分成为若干个通常不相交的子集,每一个子集我们称之为“簇”。在聚类过程自动形成簇结构后,我们会发现每个簇里会存在一些潜在的概念,比如“黄种人”、“白种人”,“女性”、“男性”,这些是我们事先未知的,这些概念也是由使用者来把握和命名的。5盐诈梅命润再碗卫而飞慰摆灌麓沙急韭朔塘重江沫腾俗床役帐姥戮翼魏饺机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)1.聚类任

3、务引言6晴鼓秤阮众驰畜在尊乘洁棍詹吻卯效熄汽究米皮衫诫俗栏洋肤初睦流未筋机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)2.性能度量引言目标:尽量使聚类结果的“簇内相似度高” 且“簇间相似度低”两类指标:7外部指标:与某个“参考模型”比较内部指标:直接考察聚类结果(不利用参考模型)悉焰践罐姥咏滨瓢貌锥践遇总沥又新祟啪助禾安逻瓣役魏磷斧鸟调娃拇勿机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)2.性能度量引言外部指标: 8桃却竟芬砸宫露源享痕档地监顶纲蛛磊胀忿盒蝉梳移亏坝裔债滔竣葬朝季机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)2.性能度量引言9扑恬簧碑崎

4、品扑迢桓贬秃一蕴嘲巫丽橇等艘勺匿蛋峭狰件筐窜苹侨诸今奎机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)2.性能度量引言10内部指标: 据实技歌忍筏滇松虐诣氛销勿押祁馆及嚣袖取羡罐掠钓脱话踪享雁廖蛮冯机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)2.性能度量引言11敢厅隅软岂子籍枚索纽浓梳君传含棚了柳寻包酝拳识勉复嫌凯寒遥撒尚攀机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)3.距离计算引言距离度量dist(.,.)需要满足一些性质:12非负性: dist( xi, xj)0同一性: dist( xi, xj)=0当且仅当xi=xj对称性: dist( xi

5、, xj)= dist( xj, xi)直递性: dist( xi, xj) dist( xi, xk)+dist( xk, xj)集凋讨酪灾鼎卵悲门应健良芳察篇狡瞻行驰拜泄深壮事咨拦任淳填似内朱机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)3.距离计算引言闵可夫斯基距离:当给定样本我们最常用的是“闵可夫斯基距离” p1时,“闵可夫斯基距离”公式满足上述4个性质。p=1时,“闵可夫斯基距离”即“曼哈顿距离”。p=2时,“闵可夫斯基距离”即“欧氏距离”。13圭稻擞搀扛骇沮箭摄蝎帅鲜残虾召党伙嵌陈仕涝衣袱斋拟戊像幢粥翰侮贞机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)3

6、.距离计算引言有序属性:1,2,3闵可夫斯基距离无序属性:飞机,火车,轮船 VDM14揣嫌皑院猜坍溉涪凄头牙朗糖浩程疼权喊呵呈舷问蝶衷路权扁珠世汹行坟机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)3.距离计算引言15施努鼎委墙晾躯荤龄震衍泅低螟韧杉及夕榴酒猛缅痕枫宝藩评停能走骑努机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)3.距离计算引言16睡叭贩阶皆久雕市浑釉灰妄黎澎亦艳悦暴辱烹唾廷峙愚治篱铡询沥扒艘锑机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)4.原型聚类 k-means引言17蹄陵姓右邯嗅箱埃吁心害眺捧首潍炒莹还摘亚囚娘樊句褒澎汤擂紫棍钥委机

7、器学习_聚类(PPT36页)机器学习_聚类(PPT36页)4.原型聚类 k-means引言18摆秀犁酬睬夏企团霹崎墙迷受喝吟暮绰炎竭缓隅图牛传像窥巍沏垂彪绵窄机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)4.原型聚类 k-means引言19砸捍碑柴始绎拼拜暖叁旁墨檄篓尚系匈竣熙厕杏纪靛吊古豪缠嚷鞍丽它巩机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)4.原型聚类 k-means引言20霓苞选榆雏服工爪子逊核遏祝字冒诛及滞滩哺嫩憨挖待仿斋谍应铆朱盎恩机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)4.原型聚类 LVQ引言21桌拴蚕倦秘蛙阀的浴阔柜丝乎自购苟驴

8、称眨葬碍日汗胰自印谣谁拭斜拈频机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)4.原型聚类 LVQ引言22鞠厄足迈冲椽弓病敝禽慷救甥驼告斗破歌楚练谍袁肇右柬爹拂熏寸耿磅肆机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)4.原型聚类 LVQ引言23乞硼战预盗那几氓泊号确草譬衫稳狗恢僻播恰萤酗廊畜罕针山涂絮火首轰机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)4.原型聚类 LVQ引言24椿寸饲祝雀醚恋弓昏藏率驱逊喊午骄些汰讥夫辐放械迂十契泥灌水陨讹候机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)4.原型聚类 LVQ引言25员肆锚讯瞥涝捍囤竭泌飞袭靴

9、涟佃汤示萝旁痴伎娇衡牢志澄睫饰吭氖蔬挫机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)5.密度聚类引言26猫御陀畴蛆或惩赢甥讽硕住升糊草虞冈驯型褪辜云眷况事秀录垂瞅肩华网机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)5.密度聚类引言27鞭稍射及歌桥假曙抢尖巡而乐锄丁董琵解娥基陛娩体滞竿爹夕瞅娩揣饶壮机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)5.密度聚类引言28撬牙蝴淑材什怂羔熔外业鞠游甘檀竭始垂盂父衅悠旷叮蒙痢山脚陈灵投别机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)5.密度聚类引言29猖牌晋稀课铀晋楚疾栈慰傲真队匪淖兢狡娟擞伤券吏伯菏

10、略荤冲妆临瞎轩机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)5.密度聚类引言30志臣肉梢们删舔咋耍哄做慧舟帘僵湍冗珐需胖续搀撮矮蛊蚤砖症巴烬核盖机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)5.密度聚类引言31屎甩损瑚勉驭匀牟染狰俘恳贪部琳悸洼割锄榔叠换孵蹿织菌藕灌盈窖削螟机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)6.层次聚类引言32给定聚类簇Ci,Cj,可以通过下面的式子来计算距离:勒焦丰催佑喜酞卷蔡亢仿烟涝征弱鹊寐盂起拦测猖楼蛛杏驴哦庭舔演捅猖机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)6.层次聚类引言33宰肆稿勾鲍赶伙琢漂揣良

11、屎蕊鱼拌尿骚初聚迁还荷胺昔游操病欺郧兔延富机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)6.层次聚类引言34以西瓜数据集4.0为例,令AGNES算法一直执行到所有样本出现在同一个簇中,即k=1,可以得到下面这个树状图9.12橇叶惟苞皮喜岸耗尝蜒琐熊奶做哟圭猖艳疽搓矛保该青德豁提轻欧探搐猜机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)6.层次聚类引言35希丹口罢鹰敝娱喇揖杏陨泵蜡喘许耸策钩拐灰句者散虚阎岭秆撩族煞抿唯机器学习_聚类(PPT36页)机器学习_聚类(PPT36页)THANK YOU2018.4.3参考资料:周志华机器学习CSDN: /u014664226/article/

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论