版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
项目背景|项目概述|主要任务|任务实施步骤拓展实训用户聚类分析【数据挖掘应用】课程负责人:陈清华01101111011010111101010000101101010100111101背景先导项目概述项目主要任务任务实施步骤01Background02BriefIntroduction03Tasks04ImplementationSteps主要内容项目总体要求
用户聚类分析
从hws.csv文件中读取数据,并根据身高、体重、性别对用户进行聚类,并选择适当的图表对聚类分析结果进行可视化。最终,为用户推荐合适的产品、提供健身建议。项目实施结果得到聚类模型熟练使用sklearn实现聚类分析应用
重点:阿里云大数据分析与应用中级5.2.3会调整聚类分析模型的参数实现聚类效果的优化
难点:大数据工程技术人员国家职业技能标准中级6.3.2会使用Matplotlib等可视化包实现聚类模型的可视化证岗项目能力目标
一、使用DBSCAN聚类算法依据身高、体重、性别数据进行聚类(1)从hws.csv中读取数据
(2)数据预处理:标签映射(3)原始数据可视化分析(4)使用DBSCAN获取簇的数量(5)DBSCAN模型可视化项目实施步骤
二、使用K-Means聚类算法依据身高、体重、性别数据进行聚类(1)基于DBSCAN获得的簇类数量,设置KMeans()中的相应参数(2)使用K-Means聚类算法对用户进行聚类(3)调整KMeans()参数(4)选择指标评估K-Means模型的优劣(5)最优模型的可视化项目实施步骤任务解决方案:DBSCAN示例#加载数据data=pd.read_csv('hws.csv')#对性别进行数值化处理le=preprocessing.LabelEncoder()data['Gender']=le.fit_transform(data['Gender'])#归一化minMax=MinMaxScaler()data['Weight2']=minMax.fit_transform(data[['Weight']])data['Height2']=minMax.fit_transform(data[['Height']])data['BMI']=minMax.fit_transform(data[['BMI']])data.head()dbscan=DBSCAN(eps=0.1,min_samples=5)dbscan.fit(data[['Gender','Weight2','Height2']])还在等什
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 第4课 喜看稻菽千重浪学案(1)高一上学期语文部编版必修上册
- 陕县2024年一级造价工程师《土建计量》考前冲刺试题含解析
- 黔东南南苗族侗族自治州黄平县2024年一级造价工程师《土建计量》统考试题含解析
- 【大学课件】管理信息系统
- 土木工程概预算课件
- 《财务管理流程介绍》课件
- 《不燃放烟花爆竹》课件
- 哈密无尘车间施工方案
- 有关九年级英语教学工作计划
- 合肥绿色环保围挡施工方案
- 2022年广东省深圳市第九届“鹏程杯”八年级邀请赛数学试卷
- 大数据通识教程全套教学课件
- 八大浪费培训教材课件
- 民间借贷法律知识讲座
- 高中地理命题培训课件
- 精神科护理技能-暴力行为的防范与护理
- 【数学】天津市河北区2024届高三上学期期末质量检测试题(解析版)
- 2024年山东鲁信实业集团有限公司招聘笔试参考题库含答案解析
- 医院保密培训课件
- 干部履历表(中共中央组织部2015年制)
- 畜禽粪污资源化利用项目商业计划书
评论
0/150
提交评论