第10章-多维标度分析_第1页
第10章-多维标度分析_第2页
第10章-多维标度分析_第3页
第10章-多维标度分析_第4页
第10章-多维标度分析_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

主编:费宇中国人民大学出版社2023/2/3主编:费宇1第10章多维标度分析10.1

多维标度法的基本思想10.2

古典多维标度法多维标度法的几个基本概念;

已知距离矩阵时CMDS解;

已知相似系数矩阵时CMDS解;10.3

非度量多维标度法10.4案例分析与R实现2023/2/3主编:费宇2第10章多维标度分析2023/2/3主编:费宇310.1

多维标度法的基本思想多维标度法:是用低维空间

Rk(k<p)中的n个点去重新标度和展示高维空间Rp中n个点(的某种距离或某种相似性),将高维空间中的研究对象(样本或变量)简化到低维空间中进行定位、归类和分析且有效保留研究对象间原始关系的多元数据分析技术的总称.是一种维数缩减方法,主要思想是在降维的同时让新得到的n个点与原来的n个点保持较高的相似度(如位置关系、距离、类别等).2023/2/3主编:费宇4多维标度法起源于上世纪40年代的心理测度.1958年Torgerson正式提出了这一方法.目前应用广泛,内容丰富,方法较多.主要分为两类:度量分析法,非度量分析法.它与主成分分析有相通之处:

共同点:均先降维,再做简明有效的分析;

不同点:主成分法按包含信息大小选取主成

分;多维标度法按标度前后距离阵

尽量接近或相似来构造拟合点.10.2

古典多维标度分析2023/2/3主编:费宇5例10.1在地图上重新标度我国八个城市,使得它们之间的距离尽量接近于表10.1中的距离.

北京天津济南青岛郑州上海杭州南京北京0

天津1180

济南4393630

青岛6685713620

郑州7147294437720

上海125911458867769840

杭州132811918728289622030

南京1065936626617710322305010.2.1

多维标度法的几个基本概念2023/2/3主编:费宇6古典多维标度(CMDS)解的定义对于距离阵,多维标度法的目的是要寻找较小的k和Rk中的n个点,记,表示xi与xj在Rk中的欧氏距离,使得与在某种意义下尽量接近,记称为的一个古典多维标度(CMDS)解,称xi为的一个拟合构造点,称为的拟合构图,称为的拟合距离阵.2023/2/3主编:费宇7特别,当时,称xi为的一个构造点,称为的构图,注意的构图不唯一.2023/2/3主编:费宇8几个相关矩阵构造:2023/2/3主编:费宇9

距离阵为欧氏距离阵的充要条件:从欧氏距离阵D出发得到构图

X的步骤:见下面例10.2.2023/2/3主编:费宇10例10.2

由D求

X的过程示例2023/2/3主编:费宇11例10.2(续)

由D求

X的过程示例2023/2/3主编:费宇1210.2.2

已知距离矩阵时CMDS解上面求解CMDS解的实现过程,可使用stats包中的cmdscale函数;也可使用MASS包中isoMDS函数.

例10.3对表10.1给出的我国八个城市间的距离矩阵D,利用R软件stats包中的cmdscale函数求

的CMDS解,给出拟合构图

及拟合构造点.2023/2/3主编:费宇13例10.3(续)#打开数据文件eg10.3.xls,选取C2:K10后复制>eg10.3=read.table("clipboard",header=T)#读入数据>D10.3=cmdscale(eg10.3,k=2,eig=T);D10.3#k取为2,并给出B的前两个特征向量和所有特征值>sum(abs(D10.3$eig[1:2]))/sum(abs(D10.3$eig))#j算a1.2>sum((D10.3$eig[1:2])^2)/sum((D10.3$eig)^2)#算a2.2>x=D10.3$points[,1];y=D10.3$points[,2]>plot(x,y,xlim=c(-700,800),ylim=c(-300,600))#根据两个特征向量的分量大小绘散点图>text(x,y,labels=s(eg10.3),adj=c(0,-0.5),cex=0.8)#将拟合点用行名标出2023/2/3主编:费宇14图10.1我国八城市距离阵的拟合构图:2023/2/3主编:费宇152023/2/3主编:费宇1610.2.3

已知相似系数阵阵时CMDS解2023/2/3主编:费宇17例10.4

六门课程之间的相关系数矩阵C(它也为相似系数矩阵),求C的CMDS解,并给出拟合构图

及拟合构造点.2023/2/3主编:费宇18

2023/2/3主编:费宇19例10.4(续)#打开数据文件eg10.4.xls,选取A10:G16,然后复制>eg10.4=read.table("clipboard",header=T)#读入数据>D10.4=cmdscale(eg10.4,k=2,eig=T);D10.4>sum(abs(D10.4$eig[1:2]))/sum(abs(D10.4$eig))#算a1.2>sum((D10.4$eig[1:2])^2)/sum((D10.4$eig)^2)#算a2.2>x=D10.4$points[,1]>y=D10.4$points[,2]>plot(x,y,xlim=c(-0.6,0.8),ylim=c(-0.6,0.7))#绘拟合图>text(x,y,labels=s(eg10.4),adj=c(0,-1),cex=0.8)可看出:算术、代数、几何较为接近,英语和盖尔语较为相近,而历史课程与其他课程的差异较大2023/2/3主编:费宇202023/2/3主编:费宇2110.4案例分析与R实现案例10.1表10.5给出了2010年我国31个省市自治区农村居民家庭人均生活消费支出的统计数据.一共选取八个指标:x1为食品消费;x2为衣着消费;x3为居住消费;x4为家庭设备用品及服务;x5为交通通讯;x6为文教娱乐用品及服务;x7为医疗保健;x8为其他商品和服务支出.试用多维标度法对其进行统计分析,并对分析结果的实际意义进行解释.2023/2/3主编:费宇22案例10.1(续)本案例我们采用MASS包中的isoMDS函数来实现#打开数据文件case10.1.xls,选取区域A2:I33,然后复制>case10.1<-read.table("clipboard",header=T)#读入数据>D1=as.matrix(case10.1)#需要将数据转换成矩阵形式>D=dist(D1)#求距离阵>library(MASS)#载入MASS包,使用isoMDS函数>fit=isoMDS(D,k=2);fit>x=fit$points[,1];>y=fit$points[,2]>plot(x,y)#画散点图>text(x,y,labels=s(case10.1),adj=c(0.5,1.5),cex=0.7)#设置标签位置大小>abline(h=0,v=0,lty=3)#采用虚线划分四个象限2023/2/3主编:费宇232023/2/3主编:费宇24从图10.3可以比较直观地看出,在总支出方面,上海、北京、广东、浙江、江苏、天津、福建等沿海地区,是我国传统的经济发达地带,又是改革开放的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论