




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、proc princomp data=duo.innovation prefix=z out=o; run; proc plot data=o; plot z2*z1 $ region=*/href=0 vref=0; run; proc sort data=o; by descending z1; run; proc print data=o; var z1 z2; run; quit;,主成分分析在SAS中用princomp过程:,plot过程已经很熟悉了。 href=0表示在横坐标z1=0处画一条垂线,vref=0表示在纵坐标z2=0处画一条垂线。 $region=*表示每个点在图上用*
2、表示,并且在*后显示该样本点的region变量的值。,主成分分析有一个princomp过程就足够了。prefix=z表示,在输出数据集中(o中),主成分变量是z1、z2、,sort和print过程也是很熟悉的过程了。,proc standard data=vregex1 out=sv mean=0 std=1; var x1-x3 y; run; proc princomp data=sv prefix=z out=opcr ; var x1 x2 x3; run; proc print data=opcr; var z1 z2 y; run; proc reg data=opcr ; mod
3、el y=z1 z2; run; quit; proc reg data=vregex1 outest=out; model y=x1-x3/pcomit=1,2; run; quit; proc print data=out; run;,首先对数据标准化,然后对标准化后的数据进行主成分分析。这也就相当于是对相关系数进行的主成分分析。,作回归分析,自变量取第1、2主成分,因变量为y。,直接作主成分回归分析。 pcomit=1,2表示分别作两个回归,分别是剔除1个主成分,和剔除2个主成分,所做的主成分回归。,主成分回归的结果:,由于刚才我们分析了y与z1、z2的回归,z1、z2的回归系数非0都是
4、99%显著的。而z1、z2又有99%的累积贡献率。因此我们可以认为我们对y与z1、z2、z3之间的回归,取y对z1、z2的回归最佳。 y对z1、z2的回归,还原为x1、x2、x3的系数后就是上图中红线圈起的第2行。这是看_PCOMIT_=1知道的,这表示,这一行是主成分回归,而且删除了最不重要的一个主成分后,回归的结果。 而y与z1回归,再还原为x1、x2、x3的系数,就是上图中最后一行。因这一行_PCOMIT_=2。,proc princomp data=文件名 n=?out=文件名1 outstat=文件名2 cov prefix=?; run;,SAS 程序,指定基于协差阵分析,若省略,
5、基于相关系数矩阵,proc factor data=文件名 r=v n=?out=文件名1 outstat=文件名2; run;,SAS 程序,6,proc factor data=tmp1.innovation r=v n=4 out=out; run; data a1; set out; f=(5.8617*factor1+2.6989*factor2+2.0995*factor3+1.5842*factor4)/14; run; data a2; set a1; keep region f factor1 factor2 factor3 factor4 ; run; proc sort
6、data=a2; by descending f; run; proc print data=a2; run;,Proc cluster method=选项 data=文件名 outtree=文件名1 standard; var variable-list; id variable; run; Proc tree data=文件名1 horizontal graphics; id variable; run;,Method选项,single 最短距离法 complete 最长距离法 median 中间距离法 centroid 重心法 average 类平均法 ward 离差平方和法(Ward法
7、),聚类分析 SAS 程序,Proc fastclus maxcluster= data=文件名 seep=文件名 mean=文件名 out=文件名 ; var variable-list; run;,Maxcluster = n,快速聚类程序,指定所允许的最大分类个数,seep= 指定一个SAS数据集,其中包括要选择的 初始凝聚点,可以缺省,Mean= 生成一个输出数据集,其中包含每个类的均值和一些统计量,Out= 生成一个输出数据集,其中包含原始数据和新变量CLUSTER和DISTANCE,9,Proc cancorr data=SAS数据集 out= SAS数据集 outstat= SA
8、S数据集 all;,with 变量名;,Var 变量名;,Run;,典型相关 SAS 程序,用来列出被分析的两组变量中的第二组变量,用来列出被分析的两组变量中的第一组变量,OUT= 包含原始数据和典型变量得分的数据集 OUTSTAT= 包含分析中用到的各种统计量,produce simple statistics, input variable correlations, and canonical redundancy analysis,proc corresp data=tmp1.examp911 out=results rp cp all; tables 行变量名, 列变量名; weig
9、ht 变量名; run; proc plot data=results; plot dim1*dim2=_NAME_ /box vspace=6 hspace=10 haxis=-.30 to .30 by .15 vaxis=-.30 to .30 by .15; run;,对应分析 原始数据,作图字符由变量=_NAME_ 给出,box 指要求画出的边框围住整个图形, vspace=6 ,hspace=10规定图中纵坐标、横坐标单位格在图中的实际长度.,data examp911; input mental $ A B C D E; cards; 0(好) 121 57 72 36 21 1(轻微症状形成) 188 105 141 97 71 2(中等症状形成)112 65 77 54 54 3(受损) 86 60 94 78 71 ; proc corresp data=examp911 out=results rp cp short; var A B C D E; id mental; run; proc plot data=results; plot dim1*dim2=*$ mental
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 语文-陕西省安康市2025届高三下学期第二次质量联考(安康二模)试题和答案
- 临漳门楼施工方案
- 楼顶装修电梯施工方案
- 2025年北京平谷区高三一模数学试题答案详解
- boot项目合同范本
- 公益林合同范例
- 建立行业合作提升竞争力计划
- 急诊护理质量提升行动计划
- 基础心理学知识培训课件
- 学校班主任的性别教育引导策略计划
- 2025年湖南水利水电职业技术学院单招职业技能测试题库参考答案
- (部编版2025新教材)道德与法治一年级下册-第1课《有个新目标》课件
- 临床基于高级健康评估的高血压Ⅲ级合并脑梗死患者康复个案护理
- 2024年湖北省联合发展投资集团有限公司人员招聘考试题库及答案解析
- T∕ACSC 01-2022 辅助生殖医学中心建设标准(高清最新版)
- comsol学生操作手册4函数定义用户指南
- 出口退税手册核销操作步骤
- 潘通色卡TCX棉布色彩电子版查询部分
- 第三章社科信息检索原理与技术PPT课件
- 《当代广播电视概论》试题A卷及答案
- DELL-PS系列存储安装手册
评论
0/150
提交评论