版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
SAS程序操作
SAS语句以一个关键词开始,以分号(;)结束;
dataa;
inputx;
cards;
323544565;proc
print;
run;SAS程序的基本结构数据步:创建数据过程步:调用数据分析过程看一个SAS程序DATAHW;
INPUTNAME$SEX$AGEHEIGHTWEIGHT;CARDS;WANGXIAF121.6356LILIF111.5849CHENLINGHEM111.5744WANGWENQINGM101.4842LIUHAIQINGM101.4235ZHOULIF111.5340ZHAOXINM.1.4233LINLINF121.5844;PROCPRINT;RUN;SAS程序的基本结构dataHW;/*建立数据库,命名为HW*/inputNAME$SEX$AGEHEIGHTWEIGHT@@;/*输入变量名,如果变量是字符型变量,变量名后加$,如果是数值型的变量就直接写变量名,在所有变量输入完以后加上@@,表示多行数据同时读入;如果没有没加@@,则表示每行只输入第一个数据,第一个数据之后的忽略*/cards;/*输入数据的标记*/WANGXIAF121.6356LILIF111.5849CHENLINGHEM111.5744WANGWENQINGM101.4842LIUHAIQINGM101.4235ZHOULIF111.5340ZHAOXINM.1.4233LINLINF121.5844;/*数据输结束的标记*/proc
print;/*运行打印过程*/run;datachild;inputidx1$x2x3x4x5x6;cards;1m3295.514.053.549.642m35.13.052.041.613m3389.012.553.535.81254m176168.053.582.0100.14255f3091.011.048.035.39256f3391.011.547.044.98521f178163.051.079.087.42;proc
means;/*调用means过程,可以求出均值方差标准误置信区间等*/run;Means过程dataa;inputx@@;cards;75.0 54.8 64.0 64.8 47.462.2 66.9 52.0 62.2 65.062.2 65.0 58.7 57.5 63.555.2 66.6 73.5 64.0 57.057.0 63.9 69.0 58.0 56.957.5 50.0 52.2 72.0 57.055.4 48.5 57.0 75.5 50.562.9 63.4 61.0 58.5 61.552.5 61.0 69.5 62.5 52.660.0 63.9 56.8 54.0 66.260.0 66.2 55.9 54.4 58.472.8 58.0 65.3 62.2 49.846.5 66.7 58.0 63.2 52.265.7 59.3 66.3 68.6 74.959.5 61.5 63.1 77.0 65.550.0 58.5 59.8 75.5 63.357.0 58.4 67.0 71.8 49.863.0 68.3 55.5 58.5 64.059.0 68.0 55.5 64.8 62.064.0 69.9 48.6 70.5 58.5;procunivariatedata=anormalplot;/*调用univariate过程,进行正态性检验,并画图*/run;正态性检验方法1:(粗略判断)看偏度skewness和峰度kurtosis是否接近于0如何判断是否正态?当均值不知道时,可以用中位数代替均值原假设是:均值=0这里做了三个检验检验均值是否为0这个有四个检验正态性的检验(原假设是:服从正态分布):这四个检验只要有一个拒绝就拒绝原假设,如果四个检验p值大于0.05,接受原假设,服从正态分布。方法2:看4个检验P值越接近1,数据的正态性越能肯定pp图呈现为一条直线,那么可以认为数据服从正态分布,画出分布形态图,从直观上检验数据的是否正态分布,当*与+重合较多表明数据基本符合正态分布方法3:pp图qq图呈现为一条直线,那么可以认为数据服从正态分布方法4:看QQ(Quantile-quantile)图直方图如果是成正态分布密度曲线形状,即拱形,我们可以初步判断数据服从正态分布方法5:看直方图在运行了之前的程序之后Solutions->Analysis->Analystfile->OpenbySASname此时弹出selectamember的窗口,在窗口下面的libraries中点击work,右方会出现一些数据库名(即我们变成时data后面的名字,例如这里的A),然后双击我们要选的数据库名,就会出现一个表格。下面就可以画我们想画的图了1:直方图Graphs->histogram->将变量选入analysis中,在选项fix中选中normal,就会在直方图画出正态密度图,用来比较直方图与正态密度图的拟合程度。2:QQ图Stastics->Desriptive->Distributions,将变量选入Analysis中,在plots选项中选择Quantile-quantileplot,然后ok即可3:pp图,同qq图同样的方法,在plots中选probabilityplot直方图与QQ图画法菜单操作注意:这里证明正态的方法并不是独立的,一般图形只是根据直观经验判断,我们只能初步判断是否是正态分布,真正的判断标准是那些检验!单个正态总体期望的检验例1
某切割机在正常工作时,切割每段金属棒的平均长度为10.5cm,标准差是0.15cm,今从一批产品中随机的抽取15段进行测量,其结果如下:假定切割的长度X服从正态分布,且标准差没有变化,试问该机工作是否正常?dataread;inputl@@;cards;10.410.610.110.410.510.310.310.210.910.610.810.510.710.210.7;proc
ttestdata=readh0=10.5;/*调用ttest过程,比较均值是否与给出的均值相等*/run;方法1:用procttestdataread;inputL@@;L=L-10.5cards;10.4
10.6
10.1
10.4
10.5
10.3
10.3
10.210.9
10.6
10.8
10.5
10.7
10.2
10.7;proc
meansnmeanstderrtprt;/*调用means过程,n表示计算样本量,mean表示计算均值,stderr表示计算标准误,t表示进行进行t检验,prt表示将p值表示出来*/run;方法2:用procmeansSolution→Analysis→Analyst(分析员系统)(出现空白数据表)→File→OpenBySasName…
(在Makeoneselection窗口中)→work→选中数据名(DataE3212见V8文件)→(OK)→Statistics→HypothesisTestsOneSamplez—testforaMean…→待分析变量x→Variable→std.dev.of(即σ)填入0.01(或Variance(即σ2)内填入0.012)→Tests→Interval→OK→OK已知方差时单变量总体均值检验的菜单操作把上面的步骤OneSamplez—testforaMean变为One-Samplet-TestforaMean
方差未知时单变量总体均值检验的菜单操作例3
某厂生产的某种型号的电池,其寿命长期以来服从方差
=5000(小时2)的正态分布,现有一批这种电池,从它生产情况来看,寿命的波动性有所变化.现随机的取26只电池,测出其寿命的样本方差=9200(小时2).问根据这一数据能否推断这批电池的寿命的波动性较以往的有显著的变化?单个正态总体方差的检验这里我只知道怎样用菜单操作,如何编写程序暂时不知道。下面是菜单操作过程:Solutions->Analysis->Analyst然后在出现的表格中输入数据,或者导入数据,stastics->Hypothesistests->onesampletestforaVariance然后将变量选入Variable,在Var窗口中填入要检验的数值。注意!这里填入的是方差,不是标准差!例如上例中就应该填入5000.单个正态总体方差的检验两个正态分布总体均值和方差的检验1.非配对(即两个样本量不一样,又或者说是试验次数不相等)有性系产量PB8669
97
106
51
97
65
73
83
79
41
92GL132
61
50
46
73
43
80
61
46
56
60
29
38
48
26
23
61实例:今有某种作物的两个有性系PB86与GL1,均在同一环境、同一管理下生长,产量列于下表,试测定其产量均值差的置信区间并作成组法试验资料的显著性。datayild;inputstrain$yield@@;cards;a69a97a106a51a97a65a73a83a79a41a92b32b61b50b46b73b43b80b61b56b60b29b38b48b26b23b61b46;proc
ttest;classstrain;varyield;run;VariablestrainNLowerCL
MeanMeanUpperCL
MeanLowerCL
StdDevStd
DevUpperCL
StdDevStd
ErrMinimumMaximumyielda1163.94477.54591.14614.14620.24535.5296.104241106yieldb1740.664957.3412.08116.22124.6873.93422380yieldDiff(1-2)
14.32728.54542.76414.07817.87624.4986.9173
T-TestsVariableMethodVariancesDFt
ValuePr
>
|t|yieldPooledEqual264.130.0003yieldSatterthwaiteUnequal18.13.930.0010EqualityofVariancesVariableMethodNum
DFDen
DFFValuePr
>
FyieldFoldedF10161.560.4141先看第三个结果即,是检验方差是否相等的检验,p值>0.05,那么接受原假设,即方差相等,那么看第二个结果的第二行,equal相的p值,这个结果检验均值是否相等,p值<0.05,所以拒绝原假设,认为均值不相等。与之前单变量的菜单类似在运行了之前的程序之后Solutions->Analysis->Analystfile->OpenbySASname此时弹出selectamember的窗口,在窗口下面的libraries中点击work,右方会出现一些数据库名(即我们变成时data后面的名字,例如这里的A),然后双击我们要选的数据库名,就会出现一个表格。Statistics→HypothesisTests->TwoSamplet—testforMeans,然后把组的名字选到group中,把因变量的名字宣导dependent中,如果要检验两样本均值是否相等,则将mean1-mean2设为0,如果是别的自己可以设定。非配对的均值检验的菜单操作Solutions->Analysis->Analyst然后在出现的表格中输入数据,或者导入数据,(又或者,如果刚刚运行了程序,那么可以在file中的openbySASname中找到刚刚运行过的数据集名,点击即可)stastics->Hypothesistests->two-sampletestforaVariances,然后把组的名字选到group中,把因变量的名字选到dependent中,点击ok即可。非配对两个正态分布方差的检验菜单操作2.配对(即两个样本量一样,试验是一对一的)datac;inputab@@;diff=a-b;cards;24272728262321312426;proc
meanstprt;vardiff;run;方法1:procmeansdatac;inputab@@;cards;24272728262321312426;proc
ttest;paireda*b;/*a和b的配对均值检验*/run;方法2:procttest在运行了之前的程序之后Solutions->Analysis->Analystfile->OpenbySASname此时弹出selectamember的窗口,在窗口下面的libraries中点击work,右方会出现一些数据库名(即我们变成时data后面的名字,例如这里的A),然后双击我们要选的数据库名,就会出现一个表格。Statistics→HypothesisTests->TwoSamplepairedt—testforMeans,然后把组的名字分别选到group1和group2中,如果要检验两样本均值是否相等,则将group1-group2设为0,如果是别的自己可以设定。配对的均值检验的菜单操作菜单操作SAS分为临时文件和永久文件永久数据集名必须由两部分组成:前一部分是它的库名,后一部分是才是数据集名,两部分中间用小数点连接。比如放在mylib库中的数据集teach必须用mylib。Teach表示。我们在关闭SAS后,它不会被自动删除。SAS的保存问题有时候做试验的数据量十分大,我们需要导入数据,使用INFILE语句指定从哪一文件中读入数据。datac;infile'c:/dolly.xls';inputa@@;Procprint;run;之前运行不到是因为excel表的后缀名弄错了!现在的可以运行了~从外部文件读取数据方差分析的本质是:要解决的问题在诸个水平的因素的组合寻找出优化的组合。方差分析的目的是:分析或检验总体间的均值是否不同方差分析方差分析和协方差分析SAS过程ANOVA过程
-----速度快,功能有限,平衡资料GLM过程
-----速度慢,但功能强大(非平衡资料协方差分析)dataf;inputlevel$pig@@;cards;a51a40a43a48b23b25b26c23c28;proc
anova;classlevel;modelpig=level;run;
例1以A、B、C三种饲料喂猪,得一个月后每猪所增体重(单位:500g)于下表,试作方差分析。(与书p42页例子类似)饲料ABC增重514043482325262328单因素方差分析,只有一个因素饲料的不同,有三个水平A,B,C,水平A做了4次试验。菜单操作可以参考书上p43,或者张老师的课件单因素方差分析只讨论自变量a和b独自对因变量的影响;另一种,不仅要研究自变量a和b独自对因变量的影响,而且还要同时考虑a、b两个自变量交互地影响因变量。双因素方差分析1.无重复试验双因素方差分析
例2设甲、乙、丙、丁四个工人操作机器Ⅰ、Ⅱ、Ⅲ各一天,其产品产量如下表,问工人和机器对产品产量是否有显著影响?(与书p44的例子类似)工人A机器B甲乙丙丁ⅠⅡⅢdataff;doa=1to4;dob=1to3;inputn@@;output;end;end;cards;506352475442475741535848;proc
anova;classab;modeln=ab;/*对两个因子模拟模型*/run;菜单操作可以参考书上p45或者张老师的课件多因素方分析的SAS程序例:DATASTEAK;INPUTW$NY@@;CARDS;A150A263A352 B147B254B342 C147C257C341D153D258D348;PROCGLM;CLASSWN;MODELY=WN;RUN;
工人机器123甲(A)506352 乙(B)475442 丙(C)
475741丁(D)535848
多因素方差分析多因素无交互作用的方差分析例3用某新药治疗血吸虫患者,采用三天疗法,在治疗前及治疗后分别定期测定患者的血清谷丙转氨酶的变化,以观察该药对肝功能的影响,测定结果如下表。试分析不同阶段血清谷丙转氨酶是否有差异?表3某新药治疗血吸虫患者血清谷丙转氨酶的变化情况因子1:有7个水平因子2:有6个水平datali_3;doi=1to7;/*对因子1做循环*/doj=1to6;/*对因子2做循环*/inputx@@;output;end;end;cards;6336188138635490200238220188144543630083100924572140213144100545417515010036726330016314490647720718512287;procanova;classij;modelx=ij;run;
区组IIIIIITB处理A1B1C1C2C31214133912111134109928B2C1C2C31099289982666719A2B1C1C2C332494341176720B2C1C2C322373451257719Tr838287252T区组和处理两向表2:有重复的双因素方差分析(考虑交互作用)DATASTEAK;INPUTA$B$C$Y;CARDS;A1B1C112A1B1C114A1B1C113 A1B1C212A1B1C211A1B1C211 A1B1C310A1B1C39A1B1C39 A1B2C110A1B2C19A1B2C19 A1B2C29A1B2C29A1B2C28 A1B2C36A1B2C36A1B2C37A2B1C13A2B1C12A2B1C14 A2B1C24A2B1C23A2B1C24 A2B1C37A2B1C36A2B1C37 A2B2C12A2B2C12A2B2C13 A2B2C23A2B2C24A2B2C25 A2B2C35A2B2C37A2B2C37;PROC
GLM;CLASSABC;MODELY=ABCA*BB*C;/*这个模型包括了三个因子,还有因子之间的交互作用*/RUN;多重比较F测验是一个整体的概念。仅能测出不同处理效应的平均数的显著差异性。但是,是否各个平均数间都有显著差异性?还是仅有部分平均数间有显著差异而另一部分平均数间没有显著差异?它不曾提供任何信息。要明确各个平均数间的差异显著性,还必须对各平均数进行多重比较。包装方式123总和均值甲12183015乙1412133913丙1917215719丁24305427例:研究某糖果包装方式与销售量的关系(四水平不等重复)来源SSDFMSFF0.05(3,6)包装25838611.214.76误差4667.67总和3049方差分析表
DATAglm;INPUTX$Y@@;CARDS;a12a18b14b12b13c19c17c21d24d30;
PROC
glm;classX;modely=x;meansx/lsd;meansx/lsdalpha=0.01;meansx/duncan;meansx/scheffecldiff;meansx/snk;meansx/tukeycldiff;run;12345均值A(15)77151199.8B(20)121712181815.4C(25)141818191917.6D(30)192522192321.6E(35)71011151110.8例:研究合成纤维中棉花含量对抗拉强度的影响(五水平5重复)来源SSDFMSFF0.01(4,20)含棉率475.764118.9414.764.43误差161.20208.06总和636.9624方差分析表
DATAglm;INPUTX$Y@@;CARDS;157157151515111592012201720122018201825142518251825192519301930253022301930233573510351135153511;
PROC
glm;classX;modely=x;meansx/lsd;meansx/lsdalpha=0.01;meansx/duncan;meansx/scheffecldiff;meansx/snk;meansx/tukeycldiff;run;(1方差分析表)DependentVariable:YSumofSourceDFSquaresMeanSquareFValuePr>FModel4475.7600000118.940000014.76<.0001Error20161.20000008.0600000CorrectedTotal24636.9600000R-SquareCoeffVarRootMSEYMean0.74692318.876422.83901415.04000SourceDFTypeISSMeanSquareFValuePr>FX4475.7600000118.940000014.76<.0001(2。LSD多重比较分析表)tTests(LSD)forYNOTE:ThistestcontrolstheTypeIcomparisonwiseerrorrate,nottheexperimentwiseerrorrate.Alpha0.05ErrorDegreesofFreedom20ErrorMeanSquare8.06CriticalValueoft2.08596LeastSignificantDifference3.7455Meanswiththesameletterarenotsignificantlydifferent.tGroupingMeanNXA21.600530B17.600525BB15.400520C10.800535CC9.80051521.6-17.6=4>3.7455,说明30和25之间存在差异
TheGLMProcedure(3。Duncan多重比较分析表(LSR法))Duncan'sMultipleRangeTestforYNOTE:ThistestcontrolstheTypeIcomparisonwiseerrorrate,nottheexperimentwiseerrorrate.Alpha0.05ErrorDegreesofFreedom20ErrorMeanSquare8.06NumberofMeans2345CriticalRange3.7453.9314.0504.132Meanswiththesameletterarenotsignificantlydifferent.DuncanGroupingMeanNXA21.600530B17.600525BB15.400520C10.800535CC9.800515TheGLMProcedure(4。谢菲多重比较分析表)
Scheffe'sTestforYNOTE:ThistestcontrolstheTypeIexperimentwiseerrorrate.Alpha0.05ErrorDegreesofFreedom20ErrorMeanSquare8.06CriticalValueofF2.86608MinimumSignificantDifference6.0796Meanswiththesameletterarenotsignificantlydifferent.ScheffeGroupingMeanNXA21.600530ABA17.600525BBC15.400520CC10.800535CC9.800515TheGLMProcedure(5.q多重比较分析表)
Student-Newman-KeulsTestforYNOTE:ThistestcontrolstheTypeIexperimentwiseerrorrateunderthecompletenullhypothesisbutnotunderpartialnullhypotheses.Alpha0.05ErrorDegreesofFreedom20ErrorMeanSquare8.06NumberofMeans2345CriticalRange3.74545414.54270985.02563185.3729606Meanswiththesameletterarenotsignificantlydifferent.SNKGroupingMeanNXA21.600530B17.600525BB15.400520C10.800535CC9.800515TheGLMProcedure(6。Tukey's多重比较分析表)Tukey'sStudentizedRange(HSD)TestforYNOTE:ThistestcontrolstheTypeIexperimentwiseerrorrate,butitgenerallyhasahigherTypeIIerrorratethanREGWQ.Alpha0.05ErrorDegreesofFreedom20ErrorMeanSquare8.06CriticalValueofStudentizedRange4.23186MinimumSignificantDifference5.373Meanswiththesameletterarenotsignificantlydifferent.TukeyGroupingMeanNXA21.600530ABA17.600525BBC15.400520CDC10.800535DD9.800515(4。谢菲多重比较差比较分析表)Comparisonssignificantatthe0.05levelareindicatedby***.DifferenceXBetweenSimultaneous95%ComparisonMeansConfidenceLimits30-254.000-2.08010.08030-206.200
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中考物理复习主题单元11第29课时动态电路分析课件
- 第一章集合与常用逻辑用语考点三充分条件与必要条件教案
- 初数论等教案(同余的概念及其基本性质)
- 《蚂蚁》教学反思
- 电子组装线胶工招聘协议书
- 五年级语文下册教案
- 苗木种植承包合同
- 古玩市场土地租赁合同
- 外卖厨房炊事员聘用协议
- 道路桥梁设计与施工咨询合同
- 部编版五年级语文上册第五单元教学计划及全部教案
- 带状疱疹后神经痛动物模型及其相关病理机制研究进展
- 全面预算管理编制操作流程图
- 普通公制螺纹基本牙型及基本尺寸和公差
- 调试工作内容(调试报告模板)
- (完整版)律师事务所律师办理非诉讼业务规则
- 农作物病虫害三生四诱一隔绿色防控技术及三高三低科学用药技术的应用
- 超实用注塑产品成本计算表+含公式
- 气固相催化反应宏观动力学PPT课件
- 煤矿开采学第六章采煤工作面矿山压力规律
- ProE5.0全套教程(完整版)
评论
0/150
提交评论