Python与机器学习(第2版)(微课版) 课件 5-04-拓展实训:用户聚类分析任务说明_第1页
Python与机器学习(第2版)(微课版) 课件 5-04-拓展实训:用户聚类分析任务说明_第2页
Python与机器学习(第2版)(微课版) 课件 5-04-拓展实训:用户聚类分析任务说明_第3页
Python与机器学习(第2版)(微课版) 课件 5-04-拓展实训:用户聚类分析任务说明_第4页
Python与机器学习(第2版)(微课版) 课件 5-04-拓展实训:用户聚类分析任务说明_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

项目背景|项目概述|主要任务|任务实施步骤拓展实训用户聚类分析【数据挖掘应用】课程负责人:陈清华01101111011010111101010000101101010100111101背景先导项目概述项目主要任务任务实施步骤01Background02BriefIntroduction03Tasks04ImplementationSteps主要内容项目总体要求

用户聚类分析

从hws.csv文件中读取数据,并根据身高、体重、性别对用户进行聚类,并选择适当的图表对聚类分析结果进行可视化。最终,为用户推荐合适的产品、提供健身建议。项目实施结果得到聚类模型熟练使用sklearn实现聚类分析应用

重点:阿里云大数据分析与应用中级5.2.3会调整聚类分析模型的参数实现聚类效果的优化

难点:大数据工程技术人员国家职业技能标准中级6.3.2会使用Matplotlib等可视化包实现聚类模型的可视化证岗项目能力目标

一、使用DBSCAN聚类算法依据身高、体重、性别数据进行聚类(1)从hws.csv中读取数据

(2)数据预处理:标签映射(3)原始数据可视化分析(4)使用DBSCAN获取簇的数量(5)DBSCAN模型可视化项目实施步骤

二、使用K-Means聚类算法依据身高、体重、性别数据进行聚类(1)基于DBSCAN获得的簇类数量,设置KMeans()中的相应参数(2)使用K-Means聚类算法对用户进行聚类(3)调整KMeans()参数(4)选择指标评估K-Means模型的优劣(5)最优模型的可视化项目实施步骤任务解决方案:DBSCAN示例#加载数据data=pd.read_csv('hws.csv')#对性别进行数值化处理le=preprocessing.LabelEncoder()data['Gender']=le.fit_transform(data['Gender'])#归一化minMax=MinMaxScaler()data['Weight2']=minMax.fit_transform(data[['Weight']])data['Height2']=minMax.fit_transform(data[['Height']])data['BMI']=minMax.fit_transform(data[['BMI']])data.head()dbscan=DBSCAN(eps=0.1,min_samples=5)dbscan.fit(data[['Gender','Weight2','Height2']])还在等什

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论