数据分析方法各章d6z_第1页
数据分析方法各章d6z_第2页
数据分析方法各章d6z_第3页
数据分析方法各章d6z_第4页
数据分析方法各章d6z_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 p1m m k 13. Minkowski 距离 d ( xi , x j ) xik x jk1k p4. Chebyshev 距离 d ( xi , x j ) max xik x jk)2ijs2p (x xk 1kikjk5. 方差距离d ( x , x ) 6. 马氏距离 d(x, y) (x y)T S1(x y)令 dij d ( xi , x j ) , 可得距离矩阵 D (dij )nn .6.2 快速聚类法 (指定分类数,对结果有较大影响)1. 快速聚类法的步骤(1) 选择聚点经验选择k 个样品作为聚点;人为选择k 个样品作为聚点;最小最大原则先选 2 个, d ( xi

2、 , xi ) maxd ij12(ii) 再选第 3 个, mind ( xi , xi ), d ( xi , xi )3132 maxmin(d ( x j, xi ),d (x j, xi ), j i1,i 2123r(iii) 一般设已选l 个, 则第l 1 个由以下式子确定 mind ( xi , xi ), r 1 l1 maxmind ( x j, xi ), r 1 l, j i1 il(2) 具体步骤假设采用欧氏距离.k1) 设初始聚点集 L(0) x(0) , x(0) , x(0)12初始分类( i 1 k )(最近者)G(0) x | d ( x, x(0) ) d

3、 ( x, x(0) ), j 1 k, j iiijG(0) G(0) ,G(0) ,G(0)12k2) 计算新聚点i iiin( 0 )i x Gx(1) 1 x , i 1 k .新聚点集12kL(1) x(1) , x(1) , x(1)12k,G(1)新分类集 G(1) G(1) ,G(1) ,3) 设在第m 步已得12k,G(m )G(m) G(m) ,G(m) ,以推得k,G(m1)G(m1) G(m1) ,G(m1),12若 d (m) d (0) , 则停止.ii其中 d(m ) maxd(x(m) , x(m1) ),i 1 k)iid(0 ) maxd(x(0) , x(

4、0) ),i, j 1 k,i j)一般 0.02 .例 6.1 根据表 6.1, 把 13 个国家分成 4 类.解 按最小最大原则, 得最初 4 个聚点最终聚类结果以 X1 (90 年得分)为横坐标,X 2 (95 年得分)为纵坐标得类间距为例 6.2 由 19521998 年国内生产总值的三个指标:X1 :第一产业(农业)占生产总值的百分比;X 2 :第二产业(工业及建筑业)占生产总值的百分比;X 3 :第三产业占生产总值的百分比.(1) 分为 3 类;(2) 分为 4 类.解 分类结果如下分成 4 类结果类似.2. 用 Lm 距离进行快速聚类1(1) 对 L1 ,记d ( xi , x

5、j ) xik xjk xi x j1k p当 p 1 维 x1, x2 , xn , 有(证略)njj1 jnj1| x c | min c M med x当 p 维, x1, x2 , xn , 也有M (M1, M2 , Mp )T (称为中位向量)其中分量 Mi ,i 1 p 均为中位数.使得nj1| x jk Mk | min, k 1 p1nj1j1 k 1n p | x jk Mk | min从而 x j Mm(2) 对一般Lm1 ,记d ( xi , x j ) xi x j当 p 1 维 x1, x2 , xn , 称n| x j c |m min c 为m 中心j1当 p 维 x1, x2 , xn , 称c (c ,c ,c )T 为m 中心向量1 2p其中分量cj , j 1 p 均为 x jk 的m 中心, 满足njkkj1m| x M | min, k 1 pnn pmmmj1j1 k 1 min从而 x j M | x jk Mk |结论: 1 中心向量=中位向量; 2 中心向量=均值向量.对一维数据,宜用 L1 ; 此外宜用 Lm1 .结果与m 有关.例 6.3 利用表 6.1 的 13 个国家可持续发展综合国力的数据进行分类(4 类),(1) 用 L1 ; (2) 用 L1 5 .解 (1) 由proc fastclus 过程(l

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论