下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、聚类分析课堂例题为了研究世界各国森林、草原资源的分布规律,共抽取了21个国家的数据,每个国家4项指标,原始数据见下表1。使用该原始数据对国别进行聚类分析。表1 抽样数据表国别森林面积(万公顷)森林覆盖率(%)林木蓄积量(亿立方米)草原面积(万公顷)中国1197812.593.531908美国2844630.4202.023754日本250167.224.858德国102828.414.0599英国2108.61.51147法国145826.716.01288意大利63521.13.6514加拿大3261332.7192.82385澳大利亚1070013.910.545190前苏联9200041
2、.1841.537370捷克45835.88.9168波兰86827.811.4405匈牙利16117.42.5129南斯拉夫92936.311.4640罗马尼亚63426.711.3447保加利亚38534.72.5200印度674820.529.01200印尼218084.033.71200尼日利亚149016.10.82090墨西哥485024.632.67450巴西5750067.6238.015900Matlab 解 答Matlab提供了两种方法进行聚类分析。一种是利用 clusterdata函数对样本数据进行一次聚类,其缺点为可供用户选择的面较窄,不能更改距离的计算方法;另一种是分
3、步聚类:(1)找到数据集合中变量两两之间的相似性和非相似性,用pdist函数计算变量之间的距离;(2)用 linkage函数定义变量之间的连接;(3)用 cophenetic函数评价聚类信息;(4)用cluster函数创建聚类。1Matlab中相关函数介绍1.1 pdist函数调用格式:Y=pdist(X,metric)说明:用 metric指定的方法计算 X 数据矩阵中对象之间的距离。X:一个m×n的矩阵,它是由m个对象组成的数据集,每个对象的大小为n。metric取值如下:euclidean:欧氏距离(默认);seuclidean:标准化欧氏距离;mahalanobis:马氏距离
4、;cityblock:布洛克距离;minkowski:明可夫斯基距离;cosine:correlation: hamming:jaccard: chebychev:Chebychev距离。1.2 squareform函数 调用格式:Z=squareform(Y,.) 说明: 强制将距离矩阵从上三角形式转化为方阵形式,或从方阵形式转化为上三角形式。1.3 linkage函数调用格式:Z=linkage(Y,method)说 明:用method参数指定的算法计算系统聚类树。 Y:pdist函数返回的距离向量; method:可取值如下: single:最短距离法(默认); complete:最长距
5、离法;average:未加权平均距离法; weighted: 加权平均法;centroid: 质心距离法; median:加权质心距离法;ward:内平方距离法(最小方差算法)返回:Z为一个包含聚类树信息的(m-1)×3的矩阵。1.4 dendrogram函数调用格式:H,T,=dendrogram(Z,p,)说明:生成只有顶部p个节点的冰柱图(谱系图)。1.5 cophenet函数调用格式:c=cophenetic(Z,Y)说明:利用pdist函数生成的Y和linkage函数生成的Z计算cophenet相关系数。1.6 cluster 函数调用格式:T=cluster(Z,)说明:
6、根据linkage函数的输出Z 创建分类。1.7 clusterdata函数调用格式:T=clusterdata(X,)说明:根据数据创建分类。T=clusterdata(X,cutoff)与下面的一组命令等价:Y=pdist(X,euclid);Z=linkage(Y,single);T=cluster(Z,cutoff);2. Matlab程序2.1 一次聚类法X=11978 12.5 93.5 31908;57500 67.6 238.0 15900;T=clusterdata(X,0.9)谱系图分类结果:2.2 分步聚类Step1 寻找变量之间的相似性用pdist函数计算相似矩阵,有多种方法可以计算距离,进行计算之前最好先将数据用zscore函数进行标准化。X2=zscore(X); %标准化数据Y2=pdist(X2); %计算距离Step2 定义变量之间的连接Z2=linkage(Y2);Step3 评价聚类信息 C2=cophenet(Z2,Y2); /0.94698Step4 创建聚类,并作出谱系图 T=cluster(Z2,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 建筑安装合同
- 2025年眉山市青神县人民法院公开招聘劳务派遣司法警察的备考题库及1套完整答案详解
- 咸安区2026年面向教育部直属师范大学公费师范毕业生专项招聘备考题库及参考答案详解一套
- 2025年甘肃电器科学研究院聘用人员招聘备考题库及一套参考答案详解
- 什邡市人力资源和社会保障局什邡市民政局关于2025年面向全市公开选调工作人员的备考题库及完整答案详解一套
- 2026年培训课程合同
- 2025年中国科学院深海科学与工程研究所招聘备考题库(十三)及1套完整答案详解
- 中化地质矿山总局地质研究院2026年高校应届毕业生招聘备考题库及一套完整答案详解
- 县总工会过紧日子经验材料
- 酒驾个人讨论辨析发言材料
- 《当代广播电视概论(第3版)》全套教学课件
- 2025年乐山市商业银行社会招聘笔试参考题库附答案解析
- 急救护理:基础技能与操作
- 一件代发协议合同
- 2025年商洛市中心医院招聘(35人)参考笔试试题及答案解析
- Unit 6 A Day in the Life Section A Prociation +(2a-2e) 课件 2025-2026学年人教版七年级英语上册
- 《煤矿安全规程(2025)》防治水部分解读课件
- 2026年无人机物流配送应急预案制定与风险防控
- 山东开放大学《劳动合同法(本科)》形考作业1-3终考答案
- 15《我们不乱扔》课件 2025-2026学年道德与法治一年级上册统编版
- 发电厂项目管理员岗位考试试卷及答案
评论
0/150
提交评论