SAS推断分析程序_第1页
SAS推断分析程序_第2页
SAS推断分析程序_第3页
SAS推断分析程序_第4页
SAS推断分析程序_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精选优质文档-倾情为你奉上精选优质文档-倾情为你奉上专心-专注-专业专心-专注-专业精选优质文档-倾情为你奉上专心-专注-专业SAS/多元推断分析过程 一、多元相关分析基本语句Proc corr option;VAR 变量名;WITH变量名;PARTIAL变量名;WEIGHT变量名;BY变量名; Proc corr是分析相关系数的基本命令。Option选项如下:DATA=SAS数据集,指定分析的数据集。PEARSON,分析皮尔逊相关系数。SPEARMAN,分析斯皮尔曼相关系数。NOSIMPLE,不输出各变量的描述统计量。NOPROB,不输出相关系数检验的P值。COV,输出协方差矩阵。OUTP=

2、 SAS数据集,把皮尔逊相关系数储存到SAS数据集。OUTS =SAS数据集,把斯皮尔曼相关系数储存到SAS数据集。VAR变量名,指定分析相关系数的变量。WITH变量名,计算PARTIAL变量名,计算PARTIAL指定的变量固定不变时,WITH指定的变量与VAR指定的变量之间的偏相关系数。WEIGHT变量名,计算加权相关系数,把权数定义为行变量。BY变量名,以BY指定的变量为基准,计算VAR指定的变量之间的相关系数。例 为了研究四川经济增长的影响因素,欲建立四川省经济增长模型。主要经济指标采用国内生产总值增长率(x1),投资指标资本形成总额增长率(X2),人口指标用自然增长率(X3),就业指标

3、失业率(X4)和就业率(X6)和消费指标居民消费水平增长率(X5)。分析指标之间的关系。data a;input x1-x6;cards;数据行省略;proc corr nosimpl cov;var x1;with x2 x3 x5;partial x4;run;The CORR Procedure(相关分析过程) 1 Partial Variables: x4 3 With Variables: x2 x3 x5 1 Variables: x1 Partial Covariance Matrix, DF = 19 x1 x2 57. x3 4. x5 53. Pearson Partial

4、 Correlation Coefficients, N = 21 Prob |r| under H0: Partial Rho=0 x1 x2 0.88628 .0001 x3 0.26475 0.2593 x5 0.96317 F Wilks Lambda 0. 6.87 4 33 0.0004 Pillais Trace 0. 6.87 4 33 0.0004 Hotelling-Lawley Trace 0. 6.87 4 33 0.0004 Roys Greatest Root 0. 6.87 4 33 0.00042、成对总体均值检验我们在现实中经常遇到两个总体是相关的测量结果的比

5、较,比如,考察同一组人在参加一年的长跑锻炼前后的心率有无显著差异。这时,每个人一年前的心率和一年后的心率是相关的,心率本来较快的人锻炼后仍相对于其它人较快。所以,检验这样的成对总体的均值不能使用两样本t检验的方法,因为独立性条件不再满足。这时,我们可以检验两个变量间的差值的均值是否为零,这等价于检验两组测量值的平均水平有无显著差异。在SAS/STAT8.0以上的版本,成对样本均值差异性的检验,不需要做两成对样本的观测值之差,直接可以得到结果。基本语句:proc ttest 选项;class 变量名;var 变量名;paired 样本1的变量名*样本2的变量名;run;例 对电器组装车间研究引入

6、新的组装方法后,单位时间内工人的组装数量是否有显著性提高。于是从组装线上随机抽调了15个工人,进行了一个月的培训,研究该成对样本的数据是否有显著性差异。data a;input worker x1 x2 ;cards;1 34 33 2 28 36 3 29 50 4 45 41 5 26 37 6 27 417 24 39 8 15 21 9 15 20 10 27 37 11 23 21 12 31 1813 20 29 14 35 38 15 20 27;proc ttest;paired x1*x2;run; The TTEST Procedure Statistics Lower C

7、L Upper CL Lower CL Upper CL Difference N Mean Mean Mean Std Dev Std Dev Std Dev Std Err Minimum Maximum x1 - x2 15 -10.63 -5.933 -1.232 6.2152 8.4892 13.388 2.1919 -21 13 T-Tests Difference DF t Value Pr |t| x1 - x2 14 -2.71 0.01703、总体均值分量间结构关系的检验 该检验在SAS程序上如何完成,我暂时无法给出,只能用EXCEL来完成该检验。例1 设,时取自该总体的样

8、本。检验至少存在一对令则与上面的原假设等价的假设为 。注:矩阵不是唯一的,例2假定人类的体形有这样一个一般规律的身高、胸围和上臂围平均尺寸比例为。检验比例是否符合这一规律。检验:至少有两个不等则上面的假设可以表达为 ,为了检验 ,可以用统计量当为真时,对给定的显著性水平,检验的规则当时,拒绝原假设;当时,接受原假设。三、单因素方差分析ANOVA过程方差分析把指标的方差分解为由因素的不同取值能够解释的部分,和剩余的不能解释的部分,然后比较两部分,当能用因素解释的部分明显大于剩余的部分时认为因素是显著的。方差分析假定观测是彼此独立的,观测为正态分布的样本,由因素各水平分成的各组的方差相等。在这些假

9、定满足时,就可以用ANOVA过程来进行方差分析。其一般写法为PROC ANOVA DATA数据集;CLASS 因素;MODEL 指标因素; MEANS T/ALPHA LSD SCHEFFE;RUN;PROC ANOVA,运行方差分析程序的命令。 CLASS 因素,表示因子,在模型中作为自变量使用。MODEL 指标因素; 运行以指标为因变量,因素为自变量的单因素方差分析,指标可以是多变量的。manova h=因素,进行多变量的方差分析。MEANS T/ALPHA=P LSD SCHEFFE BON REGWQ,利用给的显著性水平,进行LSD、SCHEFFE、BON和REGWQ多重检验。注(多重

10、检验):方差分析只检验各组是否没有任何两两之间的差异,但不检验到底是哪两组之间有显著差异,即。在三个或多个组之间进行两个或多个比较的检验叫做多重比较。多重比较在统计学中没有一个公认的解决方法,而是提供了若干种检验方法。因为多重比较要进行不只一次的比较,所以在多重比较的检验水平有两种:总错误率(experimentwise error rate)和单次比较错误率。总错误率是指所有比较(比如,五个组两两之间比较有10次)的总第一类错误概率,单次比较错误率是指每一次比较的第一类错误概率。显然,总错误率要比单次比较错误率高.有10种比较法:Bonferroni(简称Bon):要求对全部主效应的平均值的

11、差异进行最小差异显著性水平T检验。(2)Tukeys HSDD(简称TLUKEY):对所有主效应的平均值,进行TUKEY的学生化范围检验(Studentized range test)。(3)Duncans multiple-range test(DUNCAN):对所有主效应的平均值进行Duncan如多重范围检验(Multiple-range test)。(4) Dunnetts t-test:Dunnett的T检验。(5) Fishers LSD:费歇尔LSD检验。(6) Gabriel multipie-comparison procedure(GABRIEL):对所有主效应的均值进行Ga

12、briel的多重比较 (Multiple comparison)。 (7) Student-Newman-Keuls multiple-range test(SNK):对所有主效应平均值进行比Keuls的多重范围检验。 (8) wallerDuncan K-ratio t-test(WALLER):对所有主效应的平均值,进行Waller-Duncan K率的t检验。 (9) Scheffes multiplecomparison procedure (SCHEFFE):对所有主效应的均值进行 scheffe多重比较。 (10) Ryan-Einot-Gabriel-Welsch multipl

13、e-range test(REGWF):对所有主效应的均值进行Ryan-Einot-Gabriel-welsch的多重F检验。如果采用命令法,则还有以下的选项:在SAS/ANOVA过程中使用MEANS语句进行多重比较。格式如下:MEANS T/ALPHA=P LSD SCHEFFE BON REGWQ;如果不使用选项,则只对因素的各水平计算指标的平均值和标准差。要进行两两比较,有多种方法,可以在MEANS语句的选项中指定检验方法。例:为了研究某年全国各地农民家庭收支的分布情况,对全国28个地区进行了抽样调查。食品,衣着,燃料,住房,生活用品及其他和文化服务支出。进行多元方差分析。data a;

14、input type x1-x6;cards;1 135.20 36.40 10.47 44.16 36.49 3.94 1 146.68 32.83 17.79 27.29 39.09 3.471 159.37 33.38 18.37 11.81 25.29 5.22 1 144.98 29.12 11.67 42.60 27.30 5.741 169.92 32.75 12.72 47.12 34.35 5.00 1 115.84 30.76 12.20 33.61 33.77 3.852 116.22 29.57 12.24 13.76 21.75 6.04 2 153.11 23.09

15、 15.62 23.54 18.18 6.392 144.92 21.26 16.96 19.52 21.75 6.73 2 140.54 21.59 17.64 19.19 15.97 4.942 140.64 28.26 12.35 18.53 20.95 6.23 2 164.02 24.74 13.63 22.20 18.06 6.042 139.08 18.47 14.63 13.41 20.66 3.85 2 137.80 20.74 11.70 17.74 16.49 4.392 121.67 21.53 12.58 14.49 12.18 4.57 2 123.24 38.00

16、 13.72 4.64 17.77 5.753 95.21 22.83 9.30 22.44 22.81 2.80 3 104.78 25.11 6.46 9.89 18.17 3.253 128.41 27.63 8.94 12.58 23.99 3.27 3 101.18 23.26 8.46 20.20 20.50 4.303 124.27 19.81 8.89 14.22 15.53 3.03 3 106.02 20.56 10.94 10.11 18.00 3.293 95.65 16.82 5.70 6.03 12.36 4.49 3 107.12 16.45 8.98 5.40

17、8.78 5.933 113.74 24.11 6.46 9.61 22.92 2.53;proc anova;class TYPE;model x1-x6=TYPE;MEANS TYPE/ALPHA=0.05 LSD SCHEFFE bon regwq;manova h= TYPE;run;部分输出: MANOVA Test Criteria and F Approximations for the Hypothesis of No Overall type Effect H = Anova SSCP Matrix for type E = Error SSCP Matrix S=2 M=1

18、.5 N=1.5 Statistic Value F Value Num DF Den DF Pr F Wilks Lambda 0. 2.81 12 10 0.0559 Pillais Trace 1. 2.76 12 12 0.0459 Hotelling-Lawley Trace 8. 3.25 12 5.3659 0.0921 Roys Greatest Root 6. 6.67 6 6 0.01811、用重复t检验控制单次比较错误率重复t检验的想法很简单:在适当的检验水平下对两组之间进行两样本t检验并对所有组两两之间检验。控制的是每次比较的第一类错误概率。缺省使用0.05水平。注意这

19、样检验的总错误率将大大高于每次比较的错误率(实际上等于),等于所做的两两比较的次数)。 检验的规则:,则拒绝原假设,认为和水平有显著性差异。The ANOVA Proceduret Tests (LSD) for x1(对x1做多重T检验) NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 22 Error Mean Square 217.8363 Critical Value

20、of t 2.07387() Least Significant Difference 15.361 Harmonic Mean of Cell Sizes 7.NOTE: Cell sizes are not equal. Means with the same letter are not significantly different. t Grouping Mean N type A 145.332 6 1 A A 138.124 10 2 B 108.487 9 3结果先说明了检验的指标是变量x1,然后说明了这种检验控制单次比较的第一类错误概率而不是总的第一类错误概率。接着给出了检验

21、的一些指标,比如水平(Alpha)为0.05(控制单次比较的第一类错误概率),自由度(df)为22,误差的均方(MSE),是方差分析表中误差的均方)为217.8363,两样本t检验的t统计量的临界值(Critical Value of T)为2.07387,如果两样本t检验的t统计量值绝对值超过临界值则认为两组有显著差异,或者等价地,如果两组的均值之差绝对值大于最小显著差别(Least Significant Difference)15.361也是有显著差异。下面列出了检验的结果,把因素各水平的指标平均值由大到小排列,然后把两两比较的结果用第一列的字母来表示,字母相同的水平没有显著差异,字母不

22、同的水平有显著差异。多重比较的总第一类错误的概率为。2、用Bonferroni t检验控制总错误率Bonferroni t检验通过把每次比较的错误率取得很小来控制总误差率。比如,在4水平下,要做=8次比较,总的显著性水平为0.05(即总第一类错误概率为0.05),则把每次比较的错误率控制在,但是,这样得到的实际总第一类错误率可能要比预定的水平小得多。检验的准则同方法一。在MEANS语句中使用BON语句可以执行Bonferroni t检验,缺省总错误率控制水平为0.05。The ANOVA ProcedureBonferroni (Dunn) t Tests for x1 NOTE: This

23、test controls the Type I experimentwise error rate, but it generally has a higher Type II error rate than REGWQ. Alpha 0.05 Error Degrees of Freedom 22 Error Mean Square 217.8363 Critical Value of t 2.59121 Minimum Significant Difference 19.193 Harmonic Mean of Cell Sizes 7. NOTE: Cell sizes are not

24、 equal. Means with the same letter are not significantly different. Bon Grouping Mean N type A 145.332 6 1 A A 138.124 10 2 B 108.487 9 3结果先说明了检验类型和指标x1,然后说明了检验控制总第一类错误率,对本题而言,每次的第一类错误的概率为0.。但一般比REGWQ方法的第二类错误概率高(检验功效较低)。下面给出了几个检验用的值。最后给出了Bonferroni t检验的结果,有相同分组字母的因素水平间无显著差异,否则有显著差异。3、用REGWQ检验控制总错误率用

25、Bonferroni t检验控制总错误率过于保守,功效较低,不易发现实际存在的显著差异。REGWQ方法可以控制总错误率并且一般比Bonferroni t检验要好。这种方法执行多阶段的检验,它对因素水平的各种子集进行检验。在MEANS语句中用REGWQ选项可以进行REGWQ检验。The ANOVA ProcedureRyan-Einot-Gabriel-Welsch Multiple Range Test for x1NOTE: This test controls the Type I experimentwise error rate. Alpha 0.05 Error Degrees of

26、 Freedom 22 Error Mean Square 217.8363 Harmonic Mean of Cell Sizes 7. NOTE: Cell sizes are not equal. Number of Means 2 3 Critical Range 15.36103 18. Means with the same letter are not significantly different. REGWQ Grouping Mean N type A 145.332 6 1 A A 138.124 10 2 B 108.487 9 34、SCHEFFE检验,则拒绝原假设,

27、认为和水平有显著性差异。The ANOVA ProcedureScheffes Test for x1NOTE: This test controls the Type I experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 22 Error Mean Square 217.8363 Critical Value of F 3.44336 Minimum Significant Difference 19.438 Harmonic Mean of Cell Sizes 7. NOTE: Cell sizes are no

28、t equal. Means with the same letter are not significantly different. Scheffe Grouping Mean N type A 145.332 6 1 A A 138.124 10 2 B 108.487 9 3MEANS语句的选项可以同时使用。在MEANS语句中可以用ALPHA=水平值来指定检验的水平。ANOVA过程中还提供了其它的多重比较方法,请自己参考有关资料。四、多因素方差分析SAS提供了若干个方差分析过程,可以考虑多个因素、有交互作用、有嵌套等情况的方差分析。用GLM过程还可以用一般线性模型来处理方差分析问题。在

29、这里我们只介绍如何用ANOVA过程进行均衡设计的多因素方差分析。1、无交互效应的多因素方差分析例如,为了分析包装设计对销售额的影响,选顶了20家商店及4种包装,又根据商店的规模,把20家商店以4个商店一个区组,分为5组。随机抽样的如下的资料。 包装设计水平区组1234140231733232454025343313847444415645543604764我们首先把数据输入为SAS数据集。输入的办法可以是直接输入各个观测data xiaoshou;do design=1 to 4; do size=1 to 5; input sales; output; end;end;cards;40 32

30、 43 44 43 23 45 31 41 60 17 40 38 56 47 33 25 47 45 64run;proc anova;class design size;model sales=design size;MEANS design size/ALPHA=0.05 LSD SCHEFFE;run;以上的程序解释:do design=1 to 4,表示包装设计水平有4。do size=1 to 5,表示商店规模有5。input sales,输入销售额end,表示结束DO语句。class design size,表示design和size是自变量。model sales=design

31、 size,表示以sales为因变量的方差分析模型。MEANS design size/ALPHA=0.05 LSD SCHEFFE,进行多重比较。输出的结果如下:Dependent Variable: sales Sum of Source DF Squares Mean Square F Value Pr F Model 7 1552. 221. 2.43 0.0842 Error 12 1093. 91. Corrected Total 19 2646. R-Square Coeff Var Root MSE sales Mean 0. 23.45440 9. 40.70000 Source DF Anova SS Mean Square F Value Pr F design 3 31. 10. 0.11 0.9506 size 4 1521. 380. 4.17 0.0240 t Tests (LSD) for sales(为销售额做的多重T检验) Alpha 0.05 Error Degrees of Freedom 12 Error Mean Square 91.125 Critical Value of t 2.17881 Least Significant Diffe

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论