数据挖掘与数据分析 第八章课后习题及答案_第1页
数据挖掘与数据分析 第八章课后习题及答案_第2页
数据挖掘与数据分析 第八章课后习题及答案_第3页
数据挖掘与数据分析 第八章课后习题及答案_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章课后习题答案详解1.已知样本点间的相似度如下表所示,使用此数据进行最大距离和平均距离凝聚层次聚类,并绘制树状图显示结果。p1p2p3p4p5p6p1p2p3p4p5p61.000.370.320.450.210.550.371.000.640.470.980.730.320.641.000.430.840.350.450.470.431.000.760.480.210.980.840.761.000.830.550.730.350.480.831.00答:读取数据:#导入相应的包library(ggdendro)library(ggplot2)#导入数据raw<-read.csv("C:\\Users\\HP\\Desktop\\Clustering.csv",encoding="UTF-8")head(raw)输出:层次聚类并绘制树状图:#使用函数hclust()实现层次聚类#使用dist()函数计算距离hc<-hclust(dist(raw[,]),method="average")#利用dendro函数进行聚类结果的转化#提取数据df<-dendro_data(hc,type="rectangle")df1<-df$segmentsdf2<-df$labelshead(df1)输出:#绘制树状图ggplot()+geom_segment(data=df1,aes(x=x,y=y,xend=xend,yend=yend))+geom_text(data=df2,aes(x=x,y=y,label=label))输出:上述是使用平均距离进行的凝聚层级聚类,如果用最大距离来计算,就是将“average”替换成“complete”,代码如下:hc<-hclust(dist(raw[,]),method="complete")2.凝聚层次聚类和分裂层次聚类有什么区别?答:在给定n个对象的数据集后,可通过层次聚类对数据集进行层次分解,直到满足某种收敛条件为止。层次聚类根据层次分解顺序的不同可以分为:凝聚层次聚类和分裂层次聚类,它们的区别主要在于:凝聚层次聚类采用一种自下向上的策略,它首先将每个样本点看成单独的一类,然后找出距离最小的两个类进行合并,不断重复直到所有样本都合并成一类,或者达到一个收敛,即满足某个终止条件。分裂层次聚类与凝聚层次聚类相反,采用一种自顶向下的策略,它首先将所有样本当作一类,然后找出距离最远的两个类进行分裂,不断重复直到每个样本自成一类,或者达到某个终止条件。3.凝聚层次聚类和分裂层次聚类对应算法流程包含哪几步?答:(1)凝聚层次聚类算法流程:①定义每个观测值(样本点)为一类;②计算任意两类之间的距离,度量样本间的相似度;③合并距离最近(相似度最高)的两个类;④重复步骤②和③,直到所有类合并为一类。(2)分裂层次聚类算法流程:①定义所有观测值(样本点)为一类;②计算任意两样本点之间的距离;③找出同一类中距离最远的两个样本点a和b,分别作为两个簇的中心;④若类中剩余的样本点距离类中心a更近,将其分配到以a为中心的类中,否则分配到以b为中心的类中;⑤重复步骤③和④,直到每个观测值为一类。层次聚类有哪些优缺点?答:(1)层次聚类优点①层次聚类中距离和相似度容易定义,算法相对简单。②适用于任意形状和任意属性的数据集。③层次聚类不需要预先指定聚类数,能够得到不同粒度上的多层次聚类结构。④可以使用树形图对聚类结果进行可视化,易于解释和理解。⑤对样本的输入顺序不敏感。(2)层次聚类缺点①算法时间复杂度较大。②过程具有不可逆性,一旦

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论