




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、聚类分析课堂例题为了研究世界各国森林、草原资源的分布规律,共抽取了21个国家的数据,每个国家4项指标,原始数据见下表1。使用该原始数据对国别进行聚类分析。表1 抽样数据表国别森林面积(万公顷)森林覆盖率(%)林木蓄积量(亿立方米)草原面积(万公顷)中国1197812.593.531908美国2844630.4202.023754日本250167.224.858德国102828.414.0599英国2108.61.51147法国145826.716.01288意大利63521.13.6514加拿大3261332.7192.82385澳大利亚1070013.910.545190前苏联9200041
2、.1841.537370捷克45835.88.9168波兰86827.811.4405匈牙利16117.42.5129南斯拉夫92936.311.4640罗马尼亚63426.711.3447保加利亚38534.72.5200印度674820.529.01200印尼218084.033.71200尼日利亚149016.10.82090墨西哥485024.632.67450巴西5750067.6238.015900Matlab 解 答Matlab提供了两种方法进行聚类分析。一种是利用 clusterdata函数对样本数据进行一次聚类,其缺点为可供用户选择的面较窄,不能更改距离的计算方法;另一种是分
3、步聚类:(1)找到数据集合中变量两两之间的相似性和非相似性,用pdist函数计算变量之间的距离;(2)用 linkage函数定义变量之间的连接;(3)用 cophenetic函数评价聚类信息;(4)用cluster函数创建聚类。1Matlab中相关函数介绍1.1 pdist函数调用格式:Y=pdist(X,metric)说明:用 metric指定的方法计算 X 数据矩阵中对象之间的距离。X:一个m×n的矩阵,它是由m个对象组成的数据集,每个对象的大小为n。metric取值如下:euclidean:欧氏距离(默认);seuclidean:标准化欧氏距离;mahalanobis:马氏距离
4、;cityblock:布洛克距离;minkowski:明可夫斯基距离;cosine:correlation: hamming:jaccard: chebychev:Chebychev距离。1.2 squareform函数 调用格式:Z=squareform(Y,.) 说明: 强制将距离矩阵从上三角形式转化为方阵形式,或从方阵形式转化为上三角形式。1.3 linkage函数调用格式:Z=linkage(Y,method)说 明:用method参数指定的算法计算系统聚类树。 Y:pdist函数返回的距离向量; method:可取值如下: single:最短距离法(默认); complete:最长距
5、离法;average:未加权平均距离法; weighted: 加权平均法;centroid: 质心距离法; median:加权质心距离法;ward:内平方距离法(最小方差算法)返回:Z为一个包含聚类树信息的(m-1)×3的矩阵。1.4 dendrogram函数调用格式:H,T,=dendrogram(Z,p,)说明:生成只有顶部p个节点的冰柱图(谱系图)。1.5 cophenet函数调用格式:c=cophenetic(Z,Y)说明:利用pdist函数生成的Y和linkage函数生成的Z计算cophenet相关系数。1.6 cluster 函数调用格式:T=cluster(Z,)说明:
6、根据linkage函数的输出Z 创建分类。1.7 clusterdata函数调用格式:T=clusterdata(X,)说明:根据数据创建分类。T=clusterdata(X,cutoff)与下面的一组命令等价:Y=pdist(X,euclid);Z=linkage(Y,single);T=cluster(Z,cutoff);2. Matlab程序2.1 一次聚类法X=11978 12.5 93.5 31908;57500 67.6 238.0 15900;T=clusterdata(X,0.9)谱系图分类结果:2.2 分步聚类Step1 寻找变量之间的相似性用pdist函数计算相似矩阵,有多种方法可以计算距离,进行计算之前最好先将数据用zscore函数进行标准化。X2=zscore(X); %标准化数据Y2=pdist(X2); %计算距离Step2 定义变量之间的连接Z2=linkage(Y2);Step3 评价聚类信息 C2=cophenet(Z2,Y2); /0.94698Step4 创建聚类,并作出谱系图 T=cluster(Z2,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 哈尔滨2024高三数学试卷
- 海纳教育数学试卷
- 河东一年级数学试卷
- 2025-2030年中国邮件输送分拣系统项目投资可行性研究分析报告
- 2025年中国汽车外部清洗机行业市场发展前景及发展趋势与投资战略研究报告
- 2025年中国冷冻离心机行业发展监测及投资战略规划研究报告
- 轨枕垫行业深度研究分析报告(2024-2030版)
- 2024年中国精制镍行业市场调查报告
- 2025年中国选矿机械行业市场行情动态研究报告
- 健康用药课件图片素材
- 甘肃机电职业技术学院招聘事业编制工作人员笔试真题2024
- 医疗不良事件管理体系建设与持续改进
- GB 19304-2018食品安全国家标准包装饮用水生产卫生规范
- 风电施工合同模板
- GA/T 1567-2019城市道路交通隔离栏设置指南
- 小学英语素材-1-5年级英语牛津词汇表(带音标) 牛津上海版
- 2022年重庆出版集团有限公司招聘笔试试题及答案解析
- DB11-T1836-2021 城市桥梁工程施工技术规程高清最新版
- 大猪料配方设计思路课件
- 川崎病课件讲稿
- 《优质提问教学法-让每个学生都参与其中》读书笔记
评论
0/150
提交评论