聚类分析练习题20121105_第1页
聚类分析练习题20121105_第2页
聚类分析练习题20121105_第3页
聚类分析练习题20121105_第4页
聚类分析练习题20121105_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、For personal use only in study and research; notfor commercial use羅 For personal use only in study and research; not for commercial use蒃薈聚类分析和判别分析练习题莈一、选择题蚅1需要在聚类分析中保序的聚类分析是()。芀 A.两步聚类 B.有序聚类C.系统聚类D.k-均值聚类羀2在系统聚类中R2是()。螈 A.组内离差平方和除以组间离差平方和蒆 B.组间离差平方和除以组内离差平方和莂 C.组间离差平方和除以总离差平方和肇 D.组间均方除以总均方。腿3系统聚类的单

2、调性是指()。羂 A.每步并类的距离是单调增的莃B.每步并类的距离是单调减的莁C.聚类的类数越来越少蚆D.系统聚类R2会越来越小蚂4以下的系统聚类方法中,哪种系统聚类直接利用了组内的离差平方和。()賺A.最长距离法蕿B.组间平均连接法肆C.组内平均连接法D.WARD 法5以下系统聚类方法中所用的相似性的度量,哪种最不稳健(PP2A. (Xik -Xjk) B. k=1k=1 XikXk xXjkD. (xi-xj)门Xi -xj)6.以下系统聚类方法中所用的相似性的度量,哪种考虑了变量间的相关性(PPA. (Xik -Xjk)2 B. k iXik - Xjk k =1 xik xjkP C.

3、 ( .Xik -、.、Xjk)2D. (Xi -xj) 2_1(xi -xj)kd膃 7.以下统计量,可以用来刻画分为几类的合理性统计量为()?A.可决系数或判定系数R2(W-FG )/(G-1) 袄C.FG/( nG)袃D.W PW肁8.以下关于聚类分析的陈述,哪些是正确的()膈A.进行聚类分析的统计数据有关于类的变量薈B.进行聚类分析的变量应该进行标准化处理蚄C.不同的类间距离会产生不同的递推公式膂D.递推公式有利于运算速度的提高。D(3)的信息需要D (2)提供。蒁9.判别分析和聚类分析所要求统计数据的不同是()肇A.判别分析没有刻画类的变量,聚类分析有该变量莄B.聚类分析没有刻画类的

4、变量,判别分析有该变量罿C.分析的变量在不同的样品上要有差异蕿D.要选择与研究目的有关的变量蒇10.距离判别法所用的距离是()膅A.马氏距离B.欧氏距离C.绝对值距离D.欧氏平方距离羁11.在一些条件同时满足的场合,距离判别和贝叶斯判别等价,是以下哪些条件螇()祎A.正态分布假定B.等协方差矩阵假定袅C.均值相等假定D.先验概率相等假定肂12.常用逐步判别分析选择不了的标准是()肀A.上统计量越小变量的判别贡献更大芅B.上统计量越大变量的判别贡献更大蚅C.判定系数越小变量的判别贡献更大袀D.判定系数越大变量的判别贡献更大膈二、填空题螅1、聚类分析是建立一种分类方法,它将一批样本或变量按照它们在

5、性质上的进行科学的分类。莆2. Q型聚类法是按 进行聚类,R型聚类法是按 进行聚类。羁3. Q型聚类相似程度指标常见是 、,而R型聚类相似程度指标通常采用、。薀4.在聚类分析中需要对原始数据进行无量纲化处理,以消除不同量纲或数量级的影响,达到数据间可同度量的目的。常用的无量纲化方法有以下几种:蒈5 .六种 Q 型聚类方法分别为 、袂、 。羂6.判别分析是要解决在研究对象已知 的情况下,确定新的观测数据属于已知类别中哪一类的多元统计方法。虿7用判别分析方法处理问题时,通常以 作为衡量新样本点与各已知组别接近程度的指标。袈&进行判别分析时,通常指定一种判别规则,用来判定新样本的归属,常见的判别准则

6、有 。薂9.类内样本点接近,类间样本点疏远的性质,可以通过与的大小差异表现出来,而两者的比值能把不同的类区别开来。这个比值越大,说明类与类间的差异越,分类效果越。螀10.最大的错判概率为 ,这时两个总体的均值向量的关系是 。螇11.两个点x和y是从同一个总体中抽出的样本,二者的马氏距离可以表达为 。芇三、总结系统聚类有哪些方法?他们的 D (0)可以如何定义,其各种方法的递推公式式什么。证明类平均法的递推公式是d2(j,m)kD2(J,K) 5lD2(J,L)氐 nL袁 四、系统聚类类别的确定有哪些方法或指标?膀五、如果在系统聚类时,某步产生了如下的两个小类蚆 (2,3,4 , (3,4,5)

7、,(3,5(2)4,4 ,(6,卜 5) 肃如果用离差平方和法聚类,两个小类的距离是多少。袂六、简述系统聚类法的基本思想及主要步骤。芈六、简述快速聚类的基本思想及主要步骤。膆七、某地区将农村经济类型分为三类:G1 较富裕类型,G2 中等类型,G3 较贫困类型。每种类型以五个指标为依据:x1 = 土地生产率=农村社会总产值/总土地面积(百元/每亩),x2=劳动生产率=农村社会 总产值/农村劳动力(百元/每个劳动力),x3=人均收入=农村经济纯收入/农业人口(百元海人),x4=费用水平 =总费用/总收入,x5=农村工业比重=农村工业产 值/农村社会总产值。每 种类型分 别有容量为 ni=5,n2=

8、8,n3=4的样本(每个个体以县为单位),其数据如下:袄蚀1蚀2薅3薄4螁5蝿6芈7芄8螃袇X1肇 3.85薆 3.51薀 4.12羇 5.01薈 3.67羃蒂袀G1(较富裕)蚈X2螅 6.75螃 5.73衿 4.45袅 4.68芃 5.84肅X3蚁 4.79螀 4.01莅 3.68蒃 3.64蒀 4.27薀X4莈 0.85羆 0.81螂 0.89蚃 0.78蒈 0.87艿X5薇 0.59芆 0.60薁 0.48荿 0.53羇 0.64莇螄X1莀 3.61葿 3.65莈 4.11蒆 2.98莃 3.21蕿 2.87蒅 3.35袃 4.00G2(中等)薃X2莁 4.05蚅 3.74蚅 4.13莂

9、 3.69莁 3.55肆 3.78膃 3.81肁 4.27羈X3芅 2.65羅 2.86芀 3.15肇 2.90蚆 3.13蒃 2.60芃 2.71膈 2.97螆X4芄 0.90蒃 0.91羀 0.93腿 0.89蚂 0.88节 0.94羀 0.95薈 0.90蒄X5莂 0.45薈 0.43螈 0.41羂 0.41賺 0.48蚇 0.39袄 0.38蚄 0.44膂蒁X1蒇 3.23袅 3.03袀 2.54薀 2.11G3(较贫困)肇X2膅 4.08肂 3.21膈 3.50蒈 2.981.07莄X3羁 1.85肀 2.03螅 1.510.990.21罿X4螇 0.96芅 0.94莆 0.97蕿X

10、5祎 0.38蚅 0.25羁 0.34(1) 试以x3,x5为变量,建立三个类别的判别函数9和8的样本,其数据如下: 试以x1,x2,x3,x4,x5为变量,建立马氏距离判别函数123456789G1X120.228.524.626.529.036.736.027.625.0X214.28.414.815.211.99.618.09.516.0G2X121.623.217.814.411.018.915.416.1X27.54.59.27.25.56.38.07.8八、设两个二维总体有公共协方差,从二总体中分别抽取了容量为采用马氏距离判别法则确定点(23.1,9.2)属于哪一类。九、以下数据是

11、20种啤酒的相关数据,进行聚类分析。名称热量钠含量酒精价格Budweise144.0019.004.70.43Schlitz181.0019.004.90.43lonenbra157.0015.004.90.48Kronenso170.007.005.20.73Hein eke n152.0011.005.00.77Old-miln145.0023.004.60.26Aucsberg175.0024.005.50.40Strchs-b149.0027.004.70.42Miller-l99.0010.004.30.43Sudeiser113.006.003.70.44Coors140.0016

12、.004.60.44Coorslic102.0015.004.10.46Michelos135.0011.004.20.50Secrs150.0019.004.70.76Kkirin149.006.005.00.79Pabst-ex68.0015.002.30.36Hamms136.0019.004.40.43Heilema n144.0024.004.90.43Olympia-72.006.002.90.46Schlite-97.007.004.20.47十、讨论系统聚类、k均值聚类和有序聚类的技术。说明其特点。仅供个人用于学习、研究;不得用于商业用途For personal use onl

13、y in study and research; not for commercial use.Nur f u r den pers?nlichen f u r Studien, Forschung, zu kommerziellen Zwecken verwendet werden.Pour l e tude et la recherche uniquementa des fins personnelles; pasa des fins commerciales.to员bko gA.nrogeHKO TOpMenob3ymrnflCH6yHeHuac egoB u HHuefigoHMUCnO 员 B30BaTbCEb KOMMepqeckuxue 贝 ex.仅供个人用于学习、研究;不得用于商业用途For personal use only in study and research; not for commercial use.Nur f u r den pers?nlichen f u r Studien, Forschung, zu kommerziel

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论