


下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
备课日期:年月日授课时间课时(理论+实验)周次星期:节次:授课课题K均值聚类教学目标1.理解K均值聚类基本原理;2.掌握Scikit-learnK均值聚类库的使用方法。教学重点1.K均值聚类原理;2.Scikit-learnK均值聚类库的使用。教学准备PPT、点名册等。教学方法指导阅读、案例法。教学过程设计备注课题引入【思考】新生入学一段时间后形成不同群体,其原因是什么?【关键】“物以类聚、人以群分”的关键。【时间】分钟。教学步骤及主要内容【主板书】§3.7.K均值聚类---------------------------------------------------------------------------一、基本原理【主板书】基本原理1.聚类与聚类分析的概念。聚类是指将样本集划分为若干的类别以使同类样本最为相似、异类样本差别最大的分类过程;聚类分析则是以样本相似性为基础,对样本集自动进行聚类的过程,属于无监督学习。聚类分析旨在在样本集中计算样本之间的相似性以将样本集分成指定数量的类别(如3类);类内样本相似性越大、类间样本相似性越低,则聚类效果越好。2.K均值聚类(1)基本思想:采用距离作为样本相似性指标而将样本集分成K个类别,而其中每个类别的聚类中心根据该类别中所有样本的均值得到。(2)代价函数(含义)。J=(3)求解过程:同类样本越相似,异类样本差别越大,则误差平方越小。(4)K值选择:肘部法则。(5)Calinski-Harabasz分数值及其含义。s【强化与拓展】矩阵的迹、协方差。〖PPT〗三类样本聚类过程。【时间】分钟。【提问】。二、Scikit-learn库的使用【主板书】Scikit-learn库的使用1.库导入fromsklearn.clusterimportKMeans2.模型构建与求解sklearn.cluster.KMeans(n_clusters=8,max_iter=300)n_clusters:簇的个数。max_iter:最大迭代次数。3.常用方法与属性KM.fit(X)#模型构建。y_predict=KM.predict(X)#每个样本的类别标记。centroids=KM.cluster_centers_#每个类别中心。inertia=KM.inertia_#聚类结果评估。4.应用实例〖PPT〗。例1:随机生成样本进行聚类。【强化与拓展】图例说明的显示;聚类中心的显示。例2:聚类数对聚类精度的影响〖PPT〗。(1)产生数据:make_blobs(聚类中心、标准差等参数设置)。(2)求取K=2、3与4时的CH值。(3)比较结果。【时间】分钟。【提问】。课堂练习其他无小结与作业课堂小结K-means算法原理非常简单且使用广泛,但也仍存在以下缺陷:(1)K值需要预先指定,然而,在很多情况下K值的估计是非常困难的,需要针对不同问题与先验知识进行估计。(2)对初始选取的聚类中心较为敏感,不同的聚类中心将得到不同的聚类结果。(3)并不适于所有的数据类型,对于非球形分布、不同尺寸和不同密度等形式的样本,聚类效果不一定理想。本课作业利用Scikit-learn库生成make_blobs
数据并将数据划分为训练数据与测试数据两部分。fromsklearn.datasets.samples_generatorimportmake_blobs
X,y=make_blobs(n_samples=500,n_features=2,centers=[[-1,-1],[0,0],[1,1],[2,2]],cluster_std=[0.4,0.3,0.1,0.2])
请完成以下实验:(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 第11课《答谢中书书》教学设计-2024-2025学年统编版语文八年级上册
- 5,3细胞呼吸的原理和应用-第一课时教学设计-2024-2025学年高一上学期生物人教版(2019)必修1
- 第八单元《词义的辨析和词语的使用》教学设计 2024-2025学年统编版高中语文必修上册
- 2 回延安2024-2025学年八年级下册语文同步教学设计(统编版)
- Unit 7 Happy birthday Section A Grammar 教学设计2024-2025学年人教版(2024)七年级英语上册
- 第五单元 货币与赋税制度 单元教学设计-2023-2024学年高中历史统编版(2019)选择性必修1
- 2024年12月江苏省医疗器械检验所工作人员6人笔试历年典型考题(历年真题考点)解题思路附带答案详解
- 第3章数据处理与应用3.4数据分析报告与应用 -高中教学同步《信息技术-数据与计算》教学设计(人民教育出版社)
- 2025年湖南都市职业学院单招职业技能测试题库完美版
- 篮球 行进间双手胸前传接球 教学设计-2023-2024学年高一上学期体育与健康人教版必修第一册
- 2024年知识竞赛-中小学财务管理知识考试近5年真题集锦(频考类试题)带答案
- 产后康复课件完整版
- 牧场物语-矿石镇的伙伴们-完全攻略
- 海康在线测评题
- 幼儿园数学《比较物体的大小》课件
- 住院证明模板
- DB37-T3953-2020医疗卫生机构安全风险分级管控体系实施指南
- T-CSPSTC 111-2022 表层混凝土低渗透高密实化施工技术规程
- 食品经营安全管理制度目录
- GB 39752-2024电动汽车供电设备安全要求
- 南通大学开题报告模版
评论
0/150
提交评论