版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、实验主成分分析和因子分析实1SAS实验主成分分析和因子分析实1SAS2INSIGHT作主成分分析 2.1实验形式(个人83.2(系统、实验设备、主要仪器、材料等8.1SAS系统的个人电脑(每人一台3 应注意的几个问主成分分析是通过降维技术用少数几个综合变量来代替原始多个变量的一种统计分析方法。这些综合变量集中了原始变量的大部分信息。70%80%,已可令人满意。 11 4040 (1989和 Gorsuch(19833Pp11 4040 (1989和 Gorsuch(19833Pp主成份过prun p data=p p语句typecov 或 typecorr指明数据集类型,例如typecorr:
2、表new为一相关系corr数据集out数据集名原始数据和主分量得分的输出数据集outs数据集名生成一个包括变量的平均数、标准差、相关系数、特征值、特征向量的输出数据集。另外,如果规定cov 选项,还包括由协方差矩阵进行的计算(般由相关系数矩阵进行计算n个数指定主分量要求在模型中不含截距不打印输出分析结果n个数指定主分量要求在模型中不含截距不打印输出分析结果方差。如果没有规定pvar语句指明分析的数值变量。var语句,则对所有数值变量进行分partial 语句指明对偏相关阵或偏协方差矩阵进行分析出去变量的名字二、 实例分50750个州每100 000罪,r(,obbey(assaul(bugla
3、r(lacen(,以便帮助较50个州七的比率数图11-21 第1序e州斗殴夜盗偷盗汽1. 建立数据文件。程序如下:data princ1 input e $1-15 murder robbery assault burglary larceny auto title Crime rates per 100,000 population by e cards 1. 建立数据文件。程序如下:data princ1 input e $1-15 murder robbery assault burglary larceny auto title Crime rates per 100,000 popu
4、lation by e cards 14.2 10.8 96.8 278.3 1135.5 1881.9 96.8 284.0 1331.7 3369.8 5.4 39.7 173.9 811.6 2772.2 ;NEW HNEW JERSEY NEW MEXICO NEW YORKNORTHCAROLINA NORTH DAKOTA RHODE ISLAND SOUTHCAROLINA SOUTH DAKOTA WEST run p 菜 单 操 作 方 法 为 选 择 7AdditionaloptionsTabletocontainoriginaldataandpproc p run p 菜
5、 单 操 作 方 法 为 选 择 7AdditionaloptionsTabletocontainoriginaldataandpproc p p p proc prin1 ;se prin1 prin2 murder p robbery assault burglary larceny auto procsort proc pr proc ;se prin1 prin2 murder robbery assault burglary larceny auto p formchar=|-|+|- vpct=65 plot run e 程序说明pp数据集中(在35.3所示procsortprin
6、1prin2 procproc表50比率的主成份表35.4 按第一主成表35.4 按第一主成份排序50个州(给出前5条和后5条MURDER RROBBERY ASSAULT BURGLARY LARCENYNORTH-SoutH-3.17203 -WEST-3.14772 -Principal507Simple SCorrelationMatrix EigenvaluesoftheCorrelationMatrix 表35.5 按第二主成份排序50个州(给表35.5 按第二主成份排序50个州(给出前5条和后5条 35.3 中输出结果76.5,前三个主成分的累计贡献率达 86.9,最终为 100
7、%。因此可以考虑只取前面两个或三个主成分,它们能,其方差为 4.11496/7=58.7851%735.3 (d)7PRIN1=0.300279 murder + 0.440157burglary+0.357360arcenyrobbery +0.396652assault murder 与该指标之间的相关系数,如 PRIN1 与 MURDER 相关系数为 0.300279 MASSACHUSETTS(PRIN2=2.63105)FACTORMASSACHUSETTS(PRIN2=2.63105)FACTORFACTOR 过程主要包含两个语句:PROC法时,还要配上PRIORS 语句。 析SA
8、SOUT也可以是 method用以规定提取因子的方法;还可以是 ro e用以给出旋转方法, 四、(3)PRIORSPRIORS 1 2SASPRIORS 意大荷丹瑞墨西意大荷丹瑞墨西澳大利亚 ;7图12-14 数据集2.PROCFACTORDATA=sy12_2SIMPLE/*要求屏幕输出样本的简单统计量及相关系数阵Varx1-TITLE消费支出数据分析; 15图12-15 12-16图12-16 它们是用公因子表示原始变量的回归系数。结果还给出了公因子解释能力的估计(图12-17 Variance Explained by Each Facor给出了公因子对原始变量的解释能力(方差贡献)的量
9、度,FinalCommunality Estimates:图12-16 它们是用公因子表示原始变量的回归系数。结果还给出了公因子解释能力的估计(图12-17 Variance Explained by Each Facor给出了公因子对原始变量的解释能力(方差贡献)的量度,FinalCommunality Estimates:Total3个公因子对原始变量的解释能力的总和。最由因子载荷系数看出,33.为了得到更好的因子解释,在上面的 PROC FACTOR 语句中再加上一个 E Parsimax parsimax 旋转(经试验此旋 PROCFACTORDATA=sy12_2n=EParsima
10、x REORDER;/*Parsimax,正交parsimax 旋转法Varx1-parsimax12-18从结果看,得到的因子比旋转前有了较大改进。第一因子在 x8(其他)、x4(图12-18 4.FACTORSCORE PROCFACTORDATA=sy12_2n=E图12-18 4.FACTORSCORE PROCFACTORDATA=sy12_2n=E=Parsimax REORDERSCOREVarx1-12-19图12-19 F1 =0.0617x1 +0.2058x2 0.3190 x3 +0.3127x4 0.0807x5 0.0635x6 +0.12645x7 +0.3183
11、x8 F2 =0.3403x1 0.0936x2 0.0472x3 0.0380 x4 0.0200 x5 +0.2598x6 +0.5135x7 +0.2451x8 F3 =0.1743x1 + 0.0176x2 0.0471x3 0.2674x4 + 0.5570 x5 0.4069x6 0.1883x7 + 10图12-20 PROCDATA= VARdqfactor1factor2factor3; PROCPLOTDATA=PLOTfactor2*factor1$dq=*/href=0vref=0; 12-2012-211 33的支出相对较低,在“医2、4图12-21 1】200311
12、-3 内的支出相对较低,在“医2、4图12-21 1】200311-3 内【实验 12-3 各地区农村居民家庭平均每人生活消费支出情况:元内【实验 12-3 各地区农村居民家庭平均每人生活消费支出情况:元内5(包括:背景、数据来源、分析方法和过程、结果分析及评价等内容6一、使用INSIGHT作主成分分 (cm)11-1. id、sg、tz、xw、zg1234567895(包括:背景、数据来源、分析方法和过程、结果分析及评价等内容6一、使用INSIGHT作主成分分 (cm)11-1. id、sg、tz、xw、zg123456789图11-1 数据集2. 图11-1 数据集2. (2) Sg、tz
13、、xw、zg Y id Label 11-2图11-2 框(3) 单击“Output框(11-3左)中选中“Principal 按钮,打开“PrincipalComponent)“All 图11-3 (4) 三次单击“OK框3.(1) 11-4图11-4 (2) 11-53.(1) 11-4图11-4 (2) 11-5图11-5 0.7 (Eigenvalue(Difference(Cumulative图11-6 相关系数矩阵的特征值即各主成分的方差,可以看出,第一主成分的方差贡献率为 (4)11-7Prin1=0.496966sg*+0.514571tz*+0.480901xw*+ Prin
14、2=0.543213sg*+0.210246tz*+0.724621xw*图11-7 均在0.5 图11-8 PlotsID 变量值,单击“OK11-8 所示。(6) INSIGHT图11-8 PlotsID 变量值,单击“OK11-8 所示。(6) INSIGHT11-9左所示。单击数据窗口左上角的箭头,在弹出的菜单中选择“Sort(排序(Des 图11-9 单击“OK11-10图11-10 二、使用“分析家”作主成分分【实验 11-2】2003 年各地区农村居民家庭平均每人生活消费支出情况如表 11-11-2 各地区农村居民家庭平均每人生活消费支出情况:元1.SASExcelsy11_2.
15、xls mylib.sy11_211-11 、交通和通讯、文、其他商品及服务图11-11 数据集内1.SASExcelsy11_2.xls mylib.sy11_211-11 、交通和通讯、文、其他商品及服务图11-11 数据集内 (主成分分析,打开“Principal框中选择主成分分析的变量,如图 (主成分分析,打开“Principal框中选择主成分分析的变量,如图11-12所示图11-Principal图11-13 框 data(5) 单击“Plots”按钮,打开“Principal 14,选中“(6) 单击“OK图11-14 3.(1) 11-15 6 图11-15 (2) 11-16图
16、11-16 (Eigenvalues图11-15 (2) 11-16图11-16 (Eigenvalues(Difference(Cumulative86.49%,远远大于其它主成分,说明第一主成分已经代表了绝大部分信息。6-17右)图11-17 (4) 11-18给出相关系数矩阵的特征向量,由最大特征值所对应的特征向量可以写出Prin1=0.35sp*+0.33yz*+0.36jz*+0.37sb*+0.36yl*+0.37jttx*+0.36wjyl*+图11-18 Name dq11-19图11-19 Mode然后,选择菜单“Data”“SortPrin1 11-20 所示。2003 、
17、和图11-20 三、用INSIGHT 作因子分12-116岁男孩身高(cm)(cm)(kg)与骨盆宽(cm)12-1(sy12_1.xls)INSIGHT 图11-19 Mode然后,选择菜单“Data”“SortPrin1 11-20 所示。2003 、和图11-20 三、用INSIGHT 作因子分12-116岁男孩身高(cm)(cm)(kg)与骨盆宽(cm)12-1(sy12_1.xls)INSIGHT 12-1 16 1234561. id、sg、zg、tz、xw、jk与gpk图12-1 数据集图12-2 框2. 2) Sg、zg、tz、xw、jk、gpkY idLabel 12-2 7
18、891. id、sg、zg、tz、xw、jk与gpk图12-1 数据集图12-2 框2. 2) Sg、zg、tz、xw、jk、gpkY idLabel 12-2 789 Output(12-3左Principal(主成分分析”复选框,单击下面的“Principal Component Options(主成分选项打开“PrincipalComponent Output(12-3左Principal(主成分分析”复选框,单击下面的“Principal Component Options(主成分选项打开“PrincipalComponentAll) 图12-3 框12-412-5图12-4 84.21%2 84.21%。图12-5 12-5 1 2 0.53.重新回到INSIGHT 的数据窗口,选择菜单yze”“Multivariate(Y X)(多元 框,将变量Sg、zg、tz、xw、jk、gpk 选为Y 变量。框(图12-6)中单
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 淮阴师范学院《京杭大运河主题设计》2022-2023学年第一学期期末试卷
- 夏日拖鞋课件教学课件
- 淮阴师范学院《中学思想政治学科课程标准与教材分析》2022-2023学年第一学期期末试卷
- 淮阴师范学院《中国古代文学作品选(3)》2021-2022学年第一学期期末试卷
- 沟通魅力课件教学课件
- 简单护理课件教学课件
- 淮阴师范学院《法学概论》2023-2024学年期末试卷
- 淮阴师范学院《大众健美操》2021-2022学年第一学期期末试卷
- 淮阴工学院《液压与气压传动》2021-2022学年第一学期期末试卷
- 淮阴工学院《投资学》2022-2023学年第一学期期末试卷
- 复杂性尿路感染
- 重度残疾儿童送教上门
- 膀胱癌综合治疗新进展
- 音乐ppt课件《小小的船》
- 中药传统技能大赛(高职组)考试题库(浓缩500题)
- 疏浚与吹填技术
- 红十字救护员知识考试复习题库200题(含答案)
- 井冈山斗争和井冈山精神教学课件
- 儿科急危重症护理常规
- 大学校园危机氛围评估与分析
- 用数对表示点的位置
评论
0/150
提交评论