




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
主讲人:陈清华DBSCAN聚类分析任务实施【数据挖掘应用】课程观影用户聚类分析会使用sklearn包中的DBSCAN实现聚类分析应用
重点:阿里云大数据分析与应用中级5.2.3会调整DBSCAN聚类分析模型的参数实现分类效果的优化
难点:大数据工程技术人员国家职业技能标准中级6.3.2会使用Matplotlib包实现聚类模型的可视化能力目标证岗任务内容任务工单引导问题任务评价标准任务解决方案代码解析使用BDSCAN聚类确定质心个数散点图教学难点基于散点图分析两项数据的分布情况,判断基于密度的聚类方法使用的可行性。接着,使用sklearn包中DBSCAN算法实现分析影评数据对用户做聚类,并用图表展现聚类结果。任务概述
任务描述:基于影评数据filmScore.csv,使用BDSCAN确定质心个数。010010011001101010100100110110100101110101000100001011011101001010101101010011010010任务工单
任务要求任务概述最后结果数据源(1)聚类分析与分类分析有何区别?在数据挖掘流程上是否有不同?(2)常见的聚类分析方法有哪些?其适用情境有何不同?(3)基于密度的聚类算法原理是什么?DBSCAN是如何实现聚类的?(4)sklearn中是如何实现DBSCAN聚类分析方法的?写出关键函数与实现步骤。(5)DBSCAN算法中关键参数有哪些?对结果有何影响?”
问题引导:任务概述
任务评价:任务概述评价内容评价要点分值分数评定自我评价1.任务实施数据加载与分析3分数据导入正确得1分,源数据分析与可视化展现完备得2分
模型训练2分模型构建正确得1分,训练顺利执行得1分
聚类结果展现2分能准确展现聚类结果得2分
2.参数调优模型可视化并评估效果2分评估结果详细得1分
3.任务总结依据任务实施情况总结结论1分总结内容切中本任务的重点要点得1分
合计10分
任务解决方案
一、模型训练过程1、初始化分类器2、拟合fit3、预测predict4、准确性评估#data中存储了影评数据fromsklearn.cluster
importDBSCANy_pred=DBSCAN().fit_predict(data)
plt.scatter(data[0],data[1],c=y_pred)任务解决方案
二、模型可视化importmatplotlib.pyplotaspltfrompylabimportmpl#设置字体为SimHei,以显示中文mpl.rcParams['font.sans-serif']=['SimHei']mpl.rcParams['axes.unicode_minus']=False#聚类结果的可视化plt.scatter(data['filmname1'],data['filmname2'],c=y_pred)plt.colorbar()plt.title(u'聚类结果(DBSCAN)')plt.show()任务解决方案
三、DBSCAN()参数调整#调用DBSCAN,确定质心个数y_pred=DBSCAN(eps=1.3,min_samples=20).fit_predict(data)任务解决方案
四、模型可视化进阶importseaborn
assnsdbscan=DBSCAN()
dbscan.fit(data)
data['dbscan_label']=dbscan.labels_
g=sns.FacetGrid(data,hue='dbscan_label')
g.map(plt.scatter,0,1).add_legend()
plt.show()小结1.sklearn中
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 护厂巡逻管理办法
- 报纸杂志管理办法
- 施工扣分管理办法
- 材料现场管理办法
- 2024年四川省宣汉县急诊医学(副高)考试题含答案
- 村镇规划管理办法
- 执行项目管理办法
- 报刊流通管理办法
- 恩平公园管理办法
- 房产公寓管理办法
- 创伤严重程度(AIS)(ISS)评分表(完整版)
- 仓储业务基础知识培训课件
- 苏教版二年级数学下册第六单元《三位数的加法笔算》教案
- 7年级数学试卷(有答案)
- 干热河谷优秀课件
- 误吸预防与处理
- 台风过后复工前安全检查表
- GB/T 20840.8-2007互感器第8部分:电子式电流互感器
- GB/T 2007.1-1987散装矿产品取样、制样通则手工取样方法
- 《歌唱祖国》-课件
- 天津临港海洋重工建造基地码头工程(PPT)
评论
0/150
提交评论