



免费预览已结束,剩余1页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
实验五 聚类分析一、实验说明 实验项目名称:聚类分析 实验类型:基础 实验课时:2 实验所用主要仪器:微型计算机1台(能够连接互联网,32bit或64bit的Windows操作系统),R软件编程环境。二、实验目的:1.系统聚类法:使用dist函数计算各种距离,使用hclust函数分别进行最短距离法、最长距离法、中间距离法、类平均法、重心法、ward法等六种聚类分析,对聚类结果使用plot函数作出聚类树形图,通过查看碎石图(最小距离height与聚类数目的散点图)选择聚类数,使用rect.hclust函数在聚类树形图上加框分类,使用cutree函数得到聚类结果;安装并加载mvstats包,使用H.clust函数进行上述六种系统聚类分析。2.使用scale函数在各变量量纲不一致或取值相差较大时,对数据进行标准化变换。3.kmeans聚类法:使用kmeans函数进行快速聚类,并会查看聚类结果。三、实验内容和步骤1.通过运行代码,查看运行结果,学习使用R命令进行系统聚类(又称为分层聚类,层次聚类)和kmeans聚类(又称为k均值聚类)。2.聚类分析的练习案例:1)教材的四个例子:例7-1(165,166,170,171页),例7-2(171至175页),例7-3(176至179页),案例分析:全国区域经济的聚类分析(180至183页)2)某年我国31个省、直辖市、自治区环境污染状况的聚类分析数据。3.练习的代码文件:“练习ch7-1.R”,“练习ch7-2.R”4.练习的数据文件:“mvstats(2015).xls” (表单d7.2),“mvcase.xls” (表单Case6),“PollutionData.txt” 四、实验要求1.完成教材的184-185页: 2,3题,见数据文件:“mvexec3.xls”(表单E7.2)。2.分析数据文件:“birth.csv”: 70个国家和地区的出生率(%)和死亡率(%)数据,删去(除了表头的)第17行和第52行的都是FRANCE的观测值,对剩下的68个国家和地区的出生率和死亡率进行聚类分析。 3.分析数据文件:“LA_Neighborhoods.txt”:美国普查局2000年的洛杉矶街区数据。一共110个街区,15个变量。第1个变量:LA_Nbhd(街区名字),第2个变量:Income(收入中位数),第3个变量:Schools(公立学校API中位数),API是涉及学生成绩的Academic Performance Index的缩写,第4个变量:Diversity(种族多样性),第5个变量:Age (年龄中位数),第6个变量:Homes (有房家庭比例),第7个变量:Vets (复员军人比例),第8个变量:Asian(亚裔人口比例),第9个变量:Black(非裔比例),第10个变量: Latino (拉美裔比例),第11个变量:White (欧裔比例),第12个变量:Population (人口),第13个变量:Area (面积)第14个变量:Longitude(经度),第15个变量:Latitude(纬度),请自行增加第16个变量:人口密度density= Population/ Area,使用第1,2,5,6,11,16个变量创建新数据框,根据第2,5,6,11,16这五个变量对110个洛杉矶街区进行聚类分析(聚类前考虑对数据施行标准化变换)。4. 撰写纸质稿的实验报告,要求实验报告最后一段有文字总结(学习心得,实验总结,提出问题,对于课程的意见和建议等),书写请用正楷字,勿用草书。下周三上课时
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 黑龙江省双鸭山市名校2025年中考仿真模拟卷(二)英语试题含答案
- 上海交通职业技术学院《宠物疾病学》2023-2024学年第二学期期末试卷
- 山西省大同市云冈区翰林学校2025届数学五下期末考试模拟试题含答案
- 郑州美术学院《机器人视觉技术》2023-2024学年第二学期期末试卷
- 新疆工程学院《魏晋人物与文化》2023-2024学年第一学期期末试卷
- 江苏省东台市第二教育联盟重点达标名校2025届初三5月第四次测评化学试题含解析
- 浙江省杭州市富阳区2025年初三质量检查化学试题含解析
- 民办安徽旅游职业学院《物料与能量衡算原理》2023-2024学年第二学期期末试卷
- 江苏第二师范学院《财务管理学》2023-2024学年第二学期期末试卷
- 三亚航空旅游职业学院《生物制药大实验》2023-2024学年第二学期期末试卷
- 猜猜我有多爱你-绘本故事
- 译林英语六年级下册期中试卷(含答案)
- 金融领域AI大模型和AGENT实践
- 钢板加固梁施工方案
- GDAL源码剖析与开发指南
- 《化工腐蚀与防护》课程标准(煤化工技术)
- 土方平衡工程施工方案样本
- 消防安全知识掌上手册APP开发指南
- 培养孩子的人际交往能力
- 高三二诊考试分析报告
- 2024年ISO14001体系目标、指标和管理方案一览表
评论
0/150
提交评论