多元统计正交因子分析实验报告_第1页
多元统计正交因子分析实验报告_第2页
多元统计正交因子分析实验报告_第3页
多元统计正交因子分析实验报告_第4页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.正交因子分析 (设计性实验)(Orthogonal factor analysis)实验原理:因子分析是主成分分析的推广和发展, 其目的是用少数几个不可观测的隐变量,即因子,来解释原始变量之间的相关关系, 它也是属于多元分析中处理降维的一种统计方法。 因子分析的基本思想是通过变量间的协方差矩阵 (或相关系数矩阵)部结构的研究, 寻找能控制所有变量的少数几个因子去描述多个变量之间的相关关系。 因子分析中最常用的数学模型是正交因子模型, 其特点是模型中的因子相互之间正交。实验题目一:下表中给出了二战以来奥运会运动员十项运动成绩的相关系数矩阵:(E9a6)100米1.00.跳远0.591.00.铅

2、球0.350.421.00.跳高0.340.510.381.00.400 米0.630.490.190.291.00.110 米跨栏 0.40 0.52 0.36 0.46 0.34 1.00 . . . .铁饼0.280.310.730.270.170.321.00. . .撑竿跳高0.20 0.36 0.24 0.39 0.23 0.33 0.24 1.00 . .标枪80.340.241.00 .1500米-0.070.09-0.080.180.390.00-0.02 0.17-0.00 1.00实验要求:( 1)试由相关系数 矩阵作因子分析

3、; covmat( 2)试根据因子载荷,并结合题目背景知识,对公共因子进行命名。实验题目二: 下表中给出了不同国家及地区的女子径赛记录:(t1a7)100 m200 m400 m800 m1500 m3000 mMarathonCountry(s)(s)(s)(min)(min)(min)(min). .argentin11.6122.9439.79178.52australi11.222.3551.081.984.139.08152.37austria11.4323.0950.621.994.229.34159.37belgium11.4123.045224.148.8

4、8157.85bermuda11.4623.0589.81169.98brazil11.3123.1799.77168.75burma12.1424.47552.184.459.51191.02canada1122.2550.0624.068.81149.45chile1224.5254.92.054.239.37171.38china11.9524.4154.972.084.339.31168.48columbia11.62453.262.114.359.46165.42cookis12.94.8411.1233.22costa

5、11.9624.6810.43171.8czech11.0921.9747.991.894.148.92158.85denmark11.4223.5253.62.034.188.71151.75domrep11.7924.0556.052.244.749.89203.88finland11.1322.3950.142.034.18.92154.23france11.1522.5951.7324.148.98155.27gdr10.8121.7148.161.933.968.75157.68frg11.0122.3949.751.954.038.59148.53gbni1

6、122.1350.461.984.038.62149.72greece11.7924.0854.932.074.359.87182.2guatemal11.8424.5456.092.284.8610.54215.08hungary11.4523.0651.52.014.148.98156.37india11.9524.2829.98188.03indonesi11.8524.2455.342.224.6110.02201.28ireland11.4323.5153.242.054.118.89149.38israel11.4523.5759.37160

7、.48italy11.292352.011.963.988.63151.82japan11.732453.732.094.359.2150.5kenya11.7323.8852.724.159.2181.05korea11.9624.4929.62164.65dprkorea12.2525.7851.21.974.259.35179.17luxembou12.0324.9656.12.074.389.64174.68malaysia12.2324.2155.092.194.6910.46182.17mauritiu11.7625.0858.12.274.7910.9261

8、.13mexico11.8923.6253.762.044.259.59158.53netherla11.2522.8152.381.994.069.01152.48nz11.5523.1351.62.024.188.76145.48norway11.5823.3153.122.034.018.53145.48png12.2525.0756.962.244.8410.69233philippi11.7623.5410.16200.37poland11.1322.2149.291.953.998.97160.82portugal11.8124.2254.32.094.168

9、.84151.2. .rumania11.4423.4651.21.923.968.53165.45singapor12.32555.082.124.529.94182.77spain11.823.9853.592.054.149.02162.6sweden11.1622.8251.792.024.128.84154.48switzerl11.4523.3153.112.024.078.77153.42taipei11.2222.689.63177.87thailand11.7524.46210.28168.45turkey11.9824.4456.4

10、52.154.379.38201.08usa10.7921.8350.621.963.958.5142.72ussr11.0622.1949.191.893.878.45151.22wsamoa12.7425.8558.732.335.8113.04306(数据来源: 1984年洛杉机奥运会 IAAF/AFT径赛与田赛统计手册)ussr11.0622.1949.191.893.878.45151.22rumania11.4423.4651.21.923.968.53165.45实验要求:( 1)根据以上数据对女子径赛项目作因子分析;( 2)对公共因子进行 解释;( 3)计算各个国家的第一因子得

11、分并进行 排名 。要求列出排名前 10的国家或地区,并给出 中国的名次 。实验题目一分析报告:R程序:record<-read.table("data4.txt",head=F)#导入数据record<-record,-1#删除第一列record<-as.matrix(record)#将原数据矩阵化options(digits=2)#保留两位小数pca.data1<-princomp(covmat=record)# 以相关系数矩阵作为基础,建立主成分分析summary(pca.data1)#输出主成分分析报表fact1.st<-factanal

12、(covmat=record,factors=5,rotation="none") #作因子分析,不旋转fact1.ro<-factanal(covmat=record,factors=5,rotation="varimax")#作因子分析,旋转. .fact1.st#输出不旋转的结果fact1.ro#输出旋转的结果apply(fact1.ro$loadings)2,1,sum)#计算共同度fact2.ro<-factanal(covmat=record,factors=4,rotation="varimax")#作因子分

13、析,旋转fact2.ro#输出旋转的结果apply(fact2.ro$loadings)2,1,sum)#计算共同度输出结果及分析:( 1) 试由相关系数矩阵作因子分析;record<-read.table("data4.txt",head=F)#导入数据record<-record,-1#删除第一列record<-as.matrix(record)#将原数据矩阵化options(digits=2)#保留两位小数pca.data1<-princomp(covmat=record)#以相关系数矩阵作为基础,建立主成分分析summary(pca.data

14、1)#输出主成分分析报表为了确定因子分析中因子的数目,我们先对相关系数矩阵做主成分分析表 1 主成分分析报表Comp.Comp.Comp.Comp.Comp.Comp.Comp.Comp.Comp.Comp.12345678910Standard1.951.231.060.9560.8490.7710.7260.6190.4850.456deviationProportionof0.3910.0720.0590.0530.0380.0240.021VarianceCumulative0.380.530.640.7330.8050.8650.9170.9560.9791.

15、000Proportion由方差累计贡献率得到,在第五主成分,累积贡献率达到了80%以上,并趋于稳定。我们确定因子分析中因子数目为5.fact1.st<-factanal(covmat=record,factors=5,rotation="none") #作因子. .分析,不旋转fact1.ro<-factanal(covmat=record,factors=5,rotation="varimax")#作因子分析,旋转fact1.st#输出不旋转的结果fact1.ro#输出旋转的结果apply(fact1.ro$loadings)2,1,su

16、m)#计算共同度做因子分析,得到未旋转的因子载荷以及旋转的因子载荷表 2未旋转的因子载荷FactorFactor1Factor2Factor3Factor4Factor5100米0.2080.7910.301-0.167跳远0.3780.5950.2460.242铅球0.6440.761跳高0.4150.3440.1570.471-0.139400米0.4460.688-0.113-0.2030.116110米跨栏0.2650.4350.2610.343铁饼0.5030.534撑竿跳高0.3070.2400.4020.214标枪0.3130.3140.3781500米0.707-0.704累积

17、贡献率0.20.380.550.6160.640表 3 旋转的因子载荷FactorFactor1Factor2Factor3Factor4Factor5Communalities100米0.1710.8150.276-0.1410.79跳远0.2230.4800.5800.62铅球0.9550.1390.2411.00跳高0.2110.1520.6870.1170.56400米0.7600.1930.3260.1260.74. .110米跨栏0.1870.2780.5650.45铁饼0.6930.1250.1940.1110.55撑竿跳高0.1120.5010.1190.2820.36标枪0.

18、4080.1400.4010.351500米0.9891.00累积贡献率0.170.340.500.610.640观察表格中被标注为 绿色的两个因子载荷(标枪项目一行),在 Factor1中的因子载荷为0.408 ,在 Factor5中的因子载荷为0.401 ,比较两个因子载荷,0.408>0.401,因此我们最终选取0.408 。这样一来, 我们做因子分时, 只需要 4个因子即可。因此,我们下面再做4 个因子的旋转因子分析。fact2.ro<-factanal(covmat=record,factors=4,rotation="varimax")#作因子分析,

19、旋转fact2.ro#输出旋转的结果apply(fact2.ro$loadings)2,1,sum)#计算共同度表 4旋转的因子载荷FactorFactor1Factor2Factor3Factor4Communalities100米0.1670.8570.246-0.1380.84跳远0.2390.4760.5810.62铅球0.9630.1530.2011.00跳高0.2420.1720.6320.1130.50400米0.7100.2360.3310.67110米跨栏0.2050.2610.5880.46铁饼0.6990.1330.1790.54撑竿跳高0.1380.5120.1170.

20、30标枪0.4180.1750.211500米0.1130.9881.00累积贡献率0.180.340.500.61( 2)试根据因子载荷,并结合题目背景知识,对公共因子进行命名. .由旋转后的载荷可发现,第一因子中,铅球、铁饼和标枪的载荷较大,可命名为投掷因子;第二因子中,100 米和 400 米的载荷较大,可命名为短跑因子;第三因子中,跳远、跳高、110 米跨栏、撑竿跳高较大,可命名为弹跳因子;第四因子中, 1500 米的载荷较大,可命名为长跑因子。实验题目二分析报告:R程序:b<-read.csv("data42.csv")#导入数据b1<-b,-1#删除

21、第一列pc.b1<-princomp(b1,cor=T)#做主成分分析summary(pc.b1)#主成分分析结果fact.b1<-factanal(b1,factor=2,method="mle",rotation="none") #未旋转的因子分析fact.b1$loadings # 输出不旋转的结果 fact.b2<-factanal(b1,factor=2,method="mle",rotation="varimax",scores= "regression")#旋转的

22、因子分析fact.b2$loadings#输出旋转的结果apply(fact.b2$loadings)2,1,sum)#计算共同度shapiro.test(fact.b2$scores)#检验正态性fact.b3<-factanal(b1,factor=2,method="mle",rotation="varimax",scores=" Bartlett")border(fact.b3$scores,1,decreasing=F),1#排名输出结果及分析:( 1)根据以上数据对女子径赛项目作因子分析;b<-read.csv

23、("data42.csv")#导入数据b1<-b,-1pc.b1<-princomp(b1,cor=T)summary(pc.b1). .表 4主成分分析结果Comp.Comp.Comp.Comp.Comp.Comp.Comp.1234567Standard0.8080.5480.3540.2320.1970.1492.41068deviationProportion of0.0070.0050.0030.830.0930.0430.018762VarianceCumulative0.9910.9961.0000.830.9230.9660.984280Prop

24、ortion根据主成分分析的结果可以看出, 在第 2 个特征根处,累计贡献率就已经达到了 92.3%。因此,我们选用 2 个因子进行因子分析。fact.b1<-factanal(b1,factor=2,method="mle",rotation="none")fact.b1$loadingsfact.b2<-factanal(b1,factor=2,method="mle",rotation="varimax",scores="regression")fact.b2$loadingsapply(fact.b2$loadings)2,1,sum)表 5未旋转的因子载荷Factor1Factor2X100.m.s.0.95-0.13X200.m.s.0.97-0.22X400.m.s.0.900X800.m.min.0.830.38X1500.m.min.0.840.53X3000.m.min.0.840.49Marathon.min.0.800.40表 6旋转的因子载荷Factor1Factor2CommunalitiesX100.m.s.0.440.850.92X200.m.s.0.380.921X400.m.s.0.570.69

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论