概率统计及SAS应用程序ppt课件_第1页
概率统计及SAS应用程序ppt课件_第2页
概率统计及SAS应用程序ppt课件_第3页
概率统计及SAS应用程序ppt课件_第4页
概率统计及SAS应用程序ppt课件_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、运用讲义运用讲义 Statistical Analysis System 简称为简称为SAS,可用来分析数可用来分析数据和编写报告据和编写报告.它是美国它是美国SAS研讨所的产品研讨所的产品,在国际在国际上被誉为规范软件上被誉为规范软件,在我国深受医学、农林、财经、社在我国深受医学、农林、财经、社会科学、行政管理等众多领域的专业任务者的好评。会科学、行政管理等众多领域的专业任务者的好评。有关的最新信息,可以查看有关的最新信息,可以查看sas。 采用积木式模块构造,采用积木式模块构造,其中的其中的/模块是目前功能最强的多元统模块是目前功能最强的多元统计分析程序集计分析程序集,可以做回归分析、聚类

2、分析、判别分析、可以做回归分析、聚类分析、判别分析、主成分分析、因子分析、典型相关分析主成分分析、因子分析、典型相关分析(下学期引见下学期引见)以及各种实验设计的方差分析和协方差分析。以及各种实验设计的方差分析和协方差分析。本讲义围绕本讲义围绕SAS的运用的运用,讲述以下六部分内容:讲述以下六部分内容: 运用根底;运用根底; 常用语句;常用语句; 效力过程;效力过程; 描画性统计程式;描画性统计程式; 方差分析程式;方差分析程式; 回归分析程式;回归分析程式;启动计算机启动计算机,点击点击SAS图标后图标后,即可进入即可进入SAS的显示管理的显示管理系统系统.在在View中有四个主要的窗口中有

3、四个主要的窗口(其他的先不思索其他的先不思索): (1)编辑窗口编辑窗口(program editor):编辑程式和数据文件编辑程式和数据文件; (2)日志窗口日志窗口(log):记录运转情况记录运转情况, 显示显示error信息信息; (3)输出窗口输出窗口(output):输出运转的结果输出运转的结果; (4)图形窗口图形窗口(graph):输出图形输出图形.点击点击 View 菜单中的菜单中的 Program editor、Log、Output、Graph 命令可以进入编辑、日志、输出及图形窗口命令可以进入编辑、日志、输出及图形窗口.按功能键按功能键F5、F6、F7也可以进入编辑、日志及

4、输出窗口也可以进入编辑、日志及输出窗口.退出退出SAS有两种方法:有两种方法: (1) 点击点击 File 菜单中的菜单中的 Exit 命令;命令; (2) 点击窗口右上角的点击窗口右上角的。概率统计及概率统计及SAS运用教材中的程序运用教材中的程序 运用运用SAS计算二项分布的概率,请留意计算二项分布的概率,请留意SAS中中 probbnml(p,n,k)= P(Xk)=,n,2,1,0k,)p1(p iXPknkk0ik0i! )kn( !k!n 因此,当因此,当n=5,k=3,p=0.2时,运用时,运用SAS直接计直接计算算PX=3的程序为:的程序为:data probnml;p=pro

5、bbnml(0.2,5,3)-probbnml(0.2,5,2);proc print; run; 输出的结果为:输出的结果为:0.0512。当当n=5,k=4,p=0.8时时,运用运用SAS直接计算直接计算P(X=4)+P(x=5)的程序为:的程序为: data ex; p=1-probbnml(0.8,5,3); proc print; run;输出的结果为:输出的结果为:0.73728。运用运用SAS直接计算例直接计算例1.3.1中所求概率的中所求概率的P8X12的的程序为:程序为: data ex;p=probbnml(0.5,20,12)-probbnml(0.5,20,7);pro

6、c print;run;输出的结果为:输出的结果为:0.7368240356。运用运用SAS中的中的probnorm(x)近似计算二项分布的概率时近似计算二项分布的概率时,请留意请留意 probnorm(x)= td2texp21)x(F2x1 ,0 因此,运用因此,运用SAS近似计算近似计算P8X12的程序为:的程序为:data ex;p=probnorm(1.12)-probnorm(-1.12);proc print;run;输出的结果为:输出的结果为: 0.73729.其中其中1.12=(12+0.5-10)/sqrt(5)2.在在SAS中有中有probnorm(x)函数函数,用此函数

7、可以求用此函数可以求 PXx.当当x=1.645,1.96,2.576时时,不查规范正态分布的分布不查规范正态分布的分布函数的函数值表,运用函数的函数值表,运用SAS直接计算直接计算PXx的程序为的程序为data ex;do x=1.645,1.96,2.576;(给给x依次赋值,添加赋值后可依次赋值,添加赋值后可全部列出的函数值表全部列出的函数值表)p=probnorm(x);put x p;(计算并输出计算并输出x对应的概率对应的概率)end;run; 输出的结果如下输出的结果如下(在在Log窗口中显示窗口中显示): 1.645 0.9500150945 1.96 0.9750021049

8、 2.576 0.9950024677 用以下程序更好用以下程序更好:data ex; input x;p=probnorm(x);list;cards;1.645 1.96 2.576;proc print;run; 输出的结果如下输出的结果如下(在在Log窗口中显示窗口中显示): 1.645 0.9500150945 1.96 0.9750021049 2.576 0.9950024677 以下是用以下是用SAS程序绘制的二维正态分布分布密度函数程序绘制的二维正态分布分布密度函数的表示图。所用的的表示图。所用的SAS程序为:程序为:data ex;do x=-3 to 3 by 0.25;

9、do y=-3 to 3 by 0.25;p=exp(-(x*x+y*y)*5/4+x*y*3/2)/2)/2/3.1416;output;end;end;proc g3d;plot y*x=p;run;3运用运用SAS计算规范正态分布的分位数计算规范正态分布的分位数在在SAS中有中有probit(p)函数,用此函数可以求函数,用此函数可以求p分位数分位数.SAS程序为程序为data ex;do p=0.025,0.05,0.1,0.9,0.95,0.975;u=probit(p);put u p ;end;run;输出的结果如下:输出的结果如下: -1.959963985 0.025 -1.

10、644853627 0.05 -1.281551566 0.1 1.2815515655 0.9 1.644853627 0.95 1.9599639845 0.975 用以下程序更好用以下程序更好:data ex; input p; u=probit(p);list;cards;0.025 0.05 0.1 0.9 0.95 0.975;proc print;run;输出的结果如下:输出的结果如下: -1.959963985 0.025 -1.644853627 0.05 -1.281551566 0.1 1.2815515655 0.9 1.644853627 0.95 1.9599639

11、845 0.975当当=0.10,0.05,0.01时,运用时,运用SAS计算双侧分位计算双侧分位数的程序为:数的程序为:data ex;do x=0.1,0.05,0.01;p=1-x/2;u=probit(p);put x p u;end;run;输出的结果如下:输出的结果如下: 0.1 0.95 1.644853627 0.05 0.975 1.9599639845 0.01 0.995 2.57582930354运用运用SAS计算卡方分布的分位数计算卡方分布的分位数在在SAS中有中有cinv(p,df)函数,用此函数可以求函数,用此函数可以求p分位数分位数.SAS程序为程序为data

12、ex;do df=4;do p=0.025,0.05,0.1,0.9,0.95,0.975;c=cinv(p,df);put p df c;end;end;run;输出的结果如下:输出的结果如下: 0.025 4 0.4844185571 0.05 4 0.7107230214 0.1 4 1.0636232168 0.9 4 7.7794403397 0.95 4 9.4877290368 0.975 4 11.143286782用以下程序更好用以下程序更好:data ex; input p df; c=cinv(p,df);list;cards;0.025 4 0.05 4 0.1 4 0

13、.9 4 0.95 4 0.975 4;proc print;run;输出的结果如下:输出的结果如下: 0.025 4 0.4844185571 0.05 4 0.7107230214 0.1 4 1.0636232168 0.9 4 7.7794403397 0.95 4 9.4877290368 0.975 4 11.1432867825运用运用SAS计算计算t分布的分位数分布的分位数在在SAS中有中有tinv(p,df)函数,用此函数可以求函数,用此函数可以求p分位数分位数.SAS程序为程序为data ex;do df=4;do p=0.025,0.05,0.1,0.9,0.95,0.9

14、75;t=tinv(p,df);put p df t;end;end;run;输出的结果如下:输出的结果如下: 0.025 4 -2.776445105 0.05 4 -2.131846786 0.1 4 -1.533206274 0.9 4 1.5332062741 0.95 4 2.1318467863 0.975 4 2.77644510526运用运用SAS计算计算F分布的分位数分布的分位数在在SAS中有中有finv(p,df1,df2)函数函数,用此函数可以求用此函数可以求p分位数分位数.SAS程序为程序为data ex;do p=0.025,0.05,0.1,0.9,0.95,0.9

15、75;do df1=3;df2=4;f=finv(p,df1,df2);put p df1 df2 f;end;end;run;输出的结果如下:输出的结果如下: 0.025 3 4 0.0662208725 0.05 3 4 0.1096830108 0.1 3 4 0.1871732255 0.9 3 4 4.1908604389 0.95 3 4 6.5921164 0.975 3 4 9.9791985322还可以用以下程序更好还可以用以下程序更好:data ex; input p df1 df2; f=finv(p,df1,df2);list;cards; 0.025 3 4 0.05

16、 3 4 0.1 3 4 0.9 3 4 0.95 3 4 0.975 3 4;proc print;run;data probdist;input a b c;probbnml01=probbnml(a,b,c);probchi01=probchi(c,b);probf01=probf(a,b,c);probit01=probit(a);probnorm01=probnorm(a);probt01=probt(a,b);list;cards;0.1 4 3 0.3 5 4 0.4 6 5 0.6 6 4 0.9 8 3;proc print;run;普通计算普通计算data xzh;a=12

17、+13;b=13-12*2;c=sqrt(19*3);d=18*(1/3);e=log10(1000);g=sin(3); /*f=arcsin(1) lack */x=12.4221/84.7599;cv=0.20197/2.55;proc print; 矩阵计算矩阵计算data xzhmatrix;proc iml;x=1 2 3 4 5,2 4 7 8 9,3 7 10 15 20, 4 8 15 30 20,5 9 20 20 40; g=inv(x); x2=x*x; e=eigval(x); d=eigvec(x);f=trace(x); h=det(x); J=t(x); pri

18、nt x x2;print d g e h f;print J; run;data hist01;input x;cards;45 46 48 51 51 57 62 64;proc gchart;vbar x/type=pct space=0;run;data hist01;input x;cards;70 72 94 24 68 57 90 95 93 109 64 58 79 40 118 84 70 99 132 154 100 77 34 68 26 48 87 85 95 123 105 107 55 45 73 109 58 101 134 94 94 62 156 61 84

19、77 123 40 107 79 131 72 66 30 44 141 98 100 90 78 44 50 58 60 76 78 92 101 62 152 97 81 54 98 75 118 130 90 115 100 80 69 98 84 25 179 97 76 56 73 43 82 60 68 160 ;proc gchart;vbar x/type=cpct space=0;run;data ex;input x ;cards;45 46 48 51 51 57 62 64;proc univariate;run;Quantiles(Def=5)分位数分位数100% M

20、ax 64 99% 64 75% Q3 59.5 95% 64 50% Med 51 90% 64 25% Q1 47 10% 45 0% Min 45 5% 45 Q3-Q1 12.5 1% 45 Range 19 Mode 51 运用运用SAS作例作例2.1.2中样本观测值经过整理后的描画中样本观测值经过整理后的描画性统计的程序为:性统计的程序为:data ex;input x f ;cards;25 6 50 20 75 29 100 26 125 11 150 6 175 2;proc univariate;var x;freq f;run;运用运用SAS作例作例2.1.3中样本观测值

21、的描画性统计的程序中样本观测值的描画性统计的程序:data xzh;input x y;cards; 1.58 180 9.98 28 9.42 25 1.25 117 0.3 165 2.41 175 11.01 40 1.85 160 6.04 120 5.92 80 ; proc corr cov vaardf=n; run;输出的结果如下:输出的结果如下:Covariance Matrix DF = 10 X Y X 14.685864 -207.220000 Y -207.220000 3453.800000Pearson Correlation Coefficients / Pro

22、b |R| under Ho: Rho=0 / N = 10 X Y X 1.00000 -0.92019 0.0 0.0002 Y -0.92019 1.00000 0.0002 0.0(1)求一个正态总体均值的置信区间求一个正态总体均值的置信区间SAS程序为程序为data ex;input x ;cards;6.6 4.6 5.4 5.8 5.5;proc means mean std clm;proc means mean std clm alpha=0.1;run;程序运转的结果为:程序运转的结果为:Analysis Variable : Y Mean Std Dev T Prob|T

23、| -18.2000000 11.9373364 -3.3717089 0.0280结果中的结果中的Prob|T|为服从为服从t分布的随机变量分布的随机变量X的的绝对值绝对值|T|的概率的概率, 即即P|X|T| . (2)两个正态总体均值作假设检验的两个正态总体均值作假设检验的SAS程序程序 data xzh;do a=1 to 2;do i=1 to 5;input x ;output;end;end;cards;800 840 870 920 850900 880 890 890 840;proc ttest cochran;class a;var x;proc print;run; V

24、ariances T Method DF Prob|T|Unequal -1.0770 Satterthwaite 6.1 0.3220 Cochran 4.0 0.3419Equal -1.0776 8.0 0.3126For H0: Variances are equal, F = 3.51 DF = (4,4) ProbF = 0.2515结果中的结果中的Variances对应两个选项:对应两个选项:假设以为方差相等,那么假设以为方差相等,那么DF=8,Prob|T|为为0.3126;假设以为方差不相等,那么根据假设以为方差不相等,那么根据Satterthwaite检验法或检验法或Coc

25、hran和和Cox检验法作近似的检验法作近似的t检验检验.两种检验法的两种检验法的统计量都是统计量都是 ,2121wwxxt 22*2212*11/,/nswnsw )1/()1/()(222121221 nwnwwwDFCochran和和Cox检验法检验法DF=4.0,Prob|T|为为0.3419;其临界值其临界值 21222111)1()1(wwntwntwt )1(,/21 nttnnn 则则若若 运用运用SAS作正态性检验作正态性检验SAS程序为程序为data ex;input x ;cards;7 11 6 6 6 7 9 5 10 6 3 10;proc univariate n

26、ormal;run;SAS结果阐明结果阐明PW0.05,因此接受因此接受H。.假设要作多重比较并求均值差的置信区间,那么添加假设要作多重比较并求均值差的置信区间,那么添加means a/lsd cldiff;run;(2)等反复的情形:等反复的情形: data ex;do a=1 to 3;do i=1 to 4;input x ;output;end;end;cards;21 24 27 20 20 18 19 15 22 25 27 22;proc anova;class a;model x=a; run; Dependent Variable: x Sum of Source DF Sq

27、uares Mean Square F Value Pr F Model 2 82.6666667 41.3333333 6.00 0.0221 Error 9 62.0000000 6.8888889 Corrected Total 11 144.6666667假设要作多重比较并求均值差的置信区间,那么添加假设要作多重比较并求均值差的置信区间,那么添加means a/lsd cldiff;run;二级系统分组实验方差分析的二级系统分组实验方差分析的SAS程序:程序:data ex;do a=1 to 3;do b=1 to 3; do i=1 to 5;input x ; output;en

28、d;end;end; cards; 0.7 0.6 0.9 0.5 0.6 0.9 0.9 0.7 1.1 0.7 0.8 0.6 0.9 1.0 0.8 1.2 1.4 1.6 1.2 1.5 1.1 0.9 1.3 1.2 1.0 1.5 1.4 0.9 1.3 1.6 0.6 0.6 0.8 0.9 0.7 0.5 0.8 0.9 1.0 0.6 0.6 1.2 0.8 0.9 1.0 ; proc anova;class a b;model x=a b(a); means a b(a)/duncan;run; 运用运用SAS作一元线性回归分析作一元线性回归分析data ex;input

29、 x y ; cards; 1.5 4.8 1.8 5.7 2.4 7 3 8.3 3.5 10.9 3.9 12.4 4.4 13.1 4.8 13.6 5 15.3 2 . ; proc gplot; plot y*x;/* 以以y为纵坐标,以为纵坐标,以x为横坐标为横坐标*/symbol i=rl v=dot;/* i=rl表示画回归直线表示画回归直线*/* v=dot表示观测值对应的点标志为小圆点表示观测值对应的点标志为小圆点*/ proc reg;model y=x/cli;run;/*y=x表示以表示以y为因变量,以为因变量,以x为自变量,为自变量,*/*cli表示要求预测值的表示

30、要求预测值的95%置信区间置信区间*/输出的结果如下输出的结果如下:Dependent Variable: Y Analysis of Variance Sum of Mean Source DF Squares Square F Value ProbF Model 1 112.48368 112.48368 387.516 0.0001 Error 7 2.03188 0.29027C Total 8 114.5156 运用运用SAS作一元非线性回归作一元非线性回归 (1)线性化后作线性回归的线性化后作线性回归的SAS程序为程序为 data xzh;input x y; x1=1/x; lx

31、=log(x);ly=log(y);Cards;1 1.85 2 1.37 3 1.02 4 0.75 4 0.56 6 0.41 6 0.31 8 0.23 8 0.17 ; Proc reg; model y=x1;Proc reg; model ly=lx;Proc reg; model ly=x;Run;(2)计算剩余平方和的计算剩余平方和的SAS程序为程序为 data xzh01;input x y; x1=1/x;lx=log(x);ly=log(y); y1=0.1159+1.9291*x1;q1+(y-y1)*2; y2=exp(0.9638-1.1292*lx); q2+(y

32、-y2)*2;y2=exp(0.9230-0.3221*x); q3+(y-y3)*2;Cards;1 1.85 2 1.37 3 1.02 4 0.75 4 0.56 6 0.41 6 0.31 8 0.23 8 0.17 ; proc print; sum;var q1-q3;run; The REG Procedure Model: MODEL1 Dependent Variable: y Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr F Model 1 2.33605 2.33605 57.86

33、 0.0001 Error 7 0.28264 0.04038 C Total 8 2.61869 Parameter Estimates Parameter Standard Variable DF Estimate Error t Value Pr |t| Intercept 1 0.11593 0.10603 1.09 0.3104 x1 1 1.92915 0.25362 7.61 0.0001 Dependent Variable: YSource DF Sum of Mean Squares Square F Value Pr FModel 2 60.75000 30.37500

34、0.77 0.4767Error 21 830.8750 39.5655 C Total 23 891.6250 Dependent Variable: YSource DF Sum of Mean Squares Square F Value Pr FModel 3 842.79 280.93 115.06 0.0001 X 1 782.045 782.045 320.31 0.0001 A 2 222.84 111.42 45.64 0.0001Error 20 48.83 2.44 C Total 23 891.625 A Y LSMEAN 1 62.0695475 2 55.51245

35、23 3 64.2930002双要素实验思索交互作用的情形:双要素实验思索交互作用的情形:SAS程序为程序为 data ex;do a=1 to 4;do b=1 to 2;do i=1 to 2;input x y ;output;end;end;end;cards;14.6 97.8 12.1 94.2 19.5 113.2 18.8 110.1 13.6 100.3 12.9 98.5 18.5 119.4 18.2 114.7 12.8 99.2 10.7 89.6 18.2 112.2 16.9 105.312 102.1 12.4 103.8 16.4 117.2 17.2 117

36、.9;proc glm;class a b;model y=x a b a*b/solution;lsmeans a b;run;Source DF Type III SS Mean Square F Value Pr F x 1 68.72 68.72 17.95 0.0039 a 3 241.58 80.528 21.03 0.0007 b 1 0.233 0.233 0.06 0.8124 a*b 3 17.092 5.697 1.49 0.2986 Standard Parameter Estimate Error t Value Pr |t| Intercept 65.319 12.

37、406 5.27 0.0012 x 3.109 0.734 4.24 0.0039 协方差分析的结论:要素协方差分析的结论:要素A的效应及套在的效应及套在A中的中的B(A) 矫正后有极显著的差别矫正后有极显著的差别. data ex;do a=1 to 7;do b=1 to 3;do i=1 to 3;input x y ;output;end;end;end;cards;15.6 105 16.4 104 15.6 96 13.6 109 15.6 104 14.8 107 12.0 69 12.0 85 12.8 57 16.0 152 16.0 149 15.6 116 15.6 15

38、.6 107 16.8 14.4 149 15.6 156 14.8 143 14.8 93 15.6 106 14.8 91 17.6 106 18.8 87 18.0 88 14.4 117 15.2 102 15.6 120 18.4 118 20.0 140 17.6 111 17.6 157 15.2 105 16.4 119 18.8 157 18.0 164 17.2 22.0 20.0 19.2 144 17.2 127 15.6 60 15.6 108 17.6 132 17.6 150 16.0 109 14.4 169 13.2 143 14.8 15814.4 145

39、14.8 153 13.6 13.6 154 13.6 154 14.0 13116.4 120 17.2 121 15.2 107 14.4 118 12.8 73 14.0 8714.4 143 14.0 130 12.8 118;proc anova;class a b;model y=a b(a);means a b(a)/lsd;proc glm;class a b;model y=x a b(a)/solution;lsmeans a b(a);run;Source DF Type III SS Mean Square F Value Pr F x 1 2858.707 2858.707 15.44 0.0003 a 6 24066.38 4011.064 21.67 |t| Intercept -7.516 35.949 -0.21 0.8354 x 10.0376 2.554 3.93 0.0003 运用运用SAS作拟合优度检验作拟合优度检验SAS程序为程序为 data xzh;input n np

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论