机器学习原理与应用电子教案 5.7K均值聚类_第1页
机器学习原理与应用电子教案 5.7K均值聚类_第2页
机器学习原理与应用电子教案 5.7K均值聚类_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

备课日期:年月日授课时间课时(理论+实验)周次星期:节次:授课课题K均值聚类教学目标1.理解K均值聚类基本原理;2.掌握Scikit-learnK均值聚类库的使用方法。教学重点1.K均值聚类原理;2.Scikit-learnK均值聚类库的使用。教学准备PPT、点名册等。教学方法指导阅读、案例法。教学过程设计备注课题引入【思考】新生入学一段时间后形成不同群体,其原因是什么?【关键】“物以类聚、人以群分”的关键。【时间】分钟。教学步骤及主要内容【主板书】§3.7.K均值聚类---------------------------------------------------------------------------一、基本原理【主板书】基本原理1.聚类与聚类分析的概念。聚类是指将样本集划分为若干的类别以使同类样本最为相似、异类样本差别最大的分类过程;聚类分析则是以样本相似性为基础,对样本集自动进行聚类的过程,属于无监督学习。聚类分析旨在在样本集中计算样本之间的相似性以将样本集分成指定数量的类别(如3类);类内样本相似性越大、类间样本相似性越低,则聚类效果越好。2.K均值聚类(1)基本思想:采用距离作为样本相似性指标而将样本集分成K个类别,而其中每个类别的聚类中心根据该类别中所有样本的均值得到。(2)代价函数(含义)。J=(3)求解过程:同类样本越相似,异类样本差别越大,则误差平方越小。(4)K值选择:肘部法则。(5)Calinski-Harabasz分数值及其含义。s【强化与拓展】矩阵的迹、协方差。〖PPT〗三类样本聚类过程。【时间】分钟。【提问】。二、Scikit-learn库的使用【主板书】Scikit-learn库的使用1.库导入fromsklearn.clusterimportKMeans2.模型构建与求解sklearn.cluster.KMeans(n_clusters=8,max_iter=300)n_clusters:簇的个数。max_iter:最大迭代次数。3.常用方法与属性KM.fit(X)#模型构建。y_predict=KM.predict(X)#每个样本的类别标记。centroids=KM.cluster_centers_#每个类别中心。inertia=KM.inertia_#聚类结果评估。4.应用实例〖PPT〗。例1:随机生成样本进行聚类。【强化与拓展】图例说明的显示;聚类中心的显示。例2:聚类数对聚类精度的影响〖PPT〗。(1)产生数据:make_blobs(聚类中心、标准差等参数设置)。(2)求取K=2、3与4时的CH值。(3)比较结果。【时间】分钟。【提问】。课堂练习其他无小结与作业课堂小结K-means算法原理非常简单且使用广泛,但也仍存在以下缺陷:(1)K值需要预先指定,然而,在很多情况下K值的估计是非常困难的,需要针对不同问题与先验知识进行估计。(2)对初始选取的聚类中心较为敏感,不同的聚类中心将得到不同的聚类结果。(3)并不适于所有的数据类型,对于非球形分布、不同尺寸和不同密度等形式的样本,聚类效果不一定理想。本课作业利用Scikit-learn库生成make_blobs

数据并将数据划分为训练数据与测试数据两部分。fromsklearn.datasets.samples_generatorimportmake_blobs

X,y=make_blobs(n_samples=500,n_features=2,centers=[[-1,-1],[0,0],[1,1],[2,2]],cluster_std=[0.4,0.3,0.1,0.2])

请完成以下实验:(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论