ChSAS基本统计过程二实用_第1页
ChSAS基本统计过程二实用_第2页
ChSAS基本统计过程二实用_第3页
ChSAS基本统计过程二实用_第4页
ChSAS基本统计过程二实用_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

会计学1ChSAS基本统计过程二实用2.TABLESrequest(s)</option(s)>;

TABLES语句是该过程中非常重要的一条语句。在一个PROCFREQ过程中,可以有任意多个tables语句;

如果没有tables语句,FREQ对数据集中的每个变量都生成一个单向频数表;

如果tables语句没有任何说明选项(options),FREQ对tables语句中规定的变量的每个水平将计算频数、累计频数、占总频数的百分数及累计百分数。第1页/共23页在TABLES语句中,用request(s)指定制表要求。这里,可以是用*连接起来的一个变量或多个变量。在一个TABLES语句中可以给出任意多个制表要求。

例如:。Tablesa;对指定变量a产生一个单向频数表;。Tables

a*b;产生以b为列、a为行的二维列联表;。Tables

a*b*c;产生以c列、b为行、a为分层的三维列联表。这里,按照a的不同取值形成b*c的不同列联表。。Tables

a*(bc);等价于tablesa*ba*c;

。Tables

(ab)*(cd);等价于tablesa*ca*db*cb*d;

。Tables

(abc)*d;等价于tablesa*db*dc*d;第2页/共23页2)在TABLES语句的斜杠(/)后面可以使用如下选项:CHISQ:要求进行卡方检验(Chi-SquareTest)Fisher:要求对大于2×2的表进行Fisher的精确检验;Agree:做配对卡方检验;ALPHA=p:确定置信区间的水平是100(1-p)%的置信区间,默认p=0.05;ALL:要求所有由CHISQ、MEASURES和CMH选项给出的检验和度量;NOCOL、NOROW、NOPERCENT、NOFREQ

最为常用的选项是CHISQ和FISHER。第3页/共23页3.WEIGHTvariable;

通常每个观测对频数计数的贡献都是1,但当出现WEIGHT语句时,每个观测对频数计数的贡献为这个观测对应的权数变量的值。

。如果资料是最原始的形式,通常情况下不需要此语句;。如果资料是以频数的形式出现,则需要该语句。Dataa;Inputrowcolf;Cards;1174125121562219;Run;+-甲组7451乙组5619四格表资料

建立SAS数据集,行变量row,列变量col,行列交叉对应的频数f第4页/共23页

rowcolFrequency|Percent|RowPct|ColPct|1|2|Total---------+--------+--------+

1|1|1|2|25.00|25.00|50.00|50.00|50.00||50.00|50.00|---------+--------+--------+

2|1|1|2|25.00|25.00|50.00|50.00|50.00||50.00|50.00|---------+--------+--------+Total2

2

4

50.00

50.00

100.00

rowcolFrequency|Percent|RowPct|ColPct|1|2|Total---------+--------+--------+

1|74|51|125|37.00|25.50|62.50|59.20|40.80||56.92|72.86|---------+--------+--------+

2|56|19|75|28.00|9.50|37.50|74.67|25.33||43.08|27.14|---------+--------+--------+Total130

70

200

65.00

35.00

100.00Procfreqdata=a;Tablesrow*col;Weightf;Run;产生结果如下:Procfreqdata=a;Tablesrow*col;Run;产生结果如下:无weight语句可见,有无weight语句对结果产生很大的差异,对于该资料,由于是频数资料,因此一定要加上weight语句。第5页/共23页例4-8:频数表的编制某年某地149名成人脉博资料(次/分)的测定数据如下:试作频数表。

586468728181686372947965947983715875656868839168737256536070686560796273888070638373686765103746470947957537583586967867969817575745768687177709554686648757089104795971679577685960729777867787755583687557937456797266687961608579589768797271885471946860837480717152637378867084827261688894728475839681

为了编制频数表并作频数分析,首先需要建立一个数据集,将所有的数据进行分组,然后在此基础上调用相应的SAS过程(FREQ过程)来达到我们的目的。下面给出相应的程序:第6页/共23页建立SAS数据集Dataex49;Inputx@@;Cards;586468728181686372947965947983715875656868839168737256536070686560796273888070638373686765103746470947957537583586967867969817575745768687177709554686648757089104795971679577685960729777867787755583687557937456797266687961608579589768797271885471946860837480717152637378867084827261688894728475839681;Run;第7页/共23页Dataex491;Setex49;

grp=int((x-45)/5)*5+45;Run;int()取整函数int(1.7)=1int(5.2)=5int(0.4)=0确定起始分组和组距:组距:5,起始分组:45-50grp=int((x-45)/5)*5+45;语句将每一个脉搏值进行分组,例如脉搏82,被分入grp=int((82-45)/5)*5+45=int(7.4)*5+45=80,即80-85组内。提示:该资料还可以用前面学过的格式实现频数分组。建立格式之后,在FREQ过程中对原始变量x应用分组格式即可。利用表达式对数据进行分组第8页/共23页分组频数百分比累积频数累积百分比

CumulativeCumulativeGrpFrequencyPercentFrequencyPercent--------------------------------------------------------

45

1

0.67

1

0.67

50

5

3.36

6

4.03

55

12

8.05

18

12.08

60

13

8.72

31

20.81

65

27

18.12

58

38.93

70

29

19.46

87

58.39

75

23

15.44

110

73.83

80

16

10.74

126

84.56

85

9

6.04

135

90.60

90

7

4.70

142

95.30

95

5

3.36

147

98.66100

2

1.34

149

100.00Procfreqdata=ex491;Tablesgrp;Run;对分组变量grp进行频数分析,产生以下结果:第9页/共23页Procgchartdata=ex491;/*调用gchart过程*/

hbarx/space=0/*生成直方图,直条间无空隙*/

midpoints=47.5to102.5by5/*直条对应的组中值*/freqcfreqpercentcpercent;/*输出统计量*/Run;如果要将上面的频数表以频数图的形式表达出来,可以使用如下程序:关于gchart过程,感兴趣的同学可以在SAS命令框里输入“helpgchart”并回车得到帮助。第10页/共23页第11页/共23页例4-9某研究人员收集了婴儿的相关资料,试进行描述性分析第12页/共23页分析内容------《一维表》-------小孩腹泻发生比例是多少?发生次数怎样?分娩方式:手术产和顺产比例分别是多少?喂养方式构成?(母乳、牛奶、混合)------《交叉表》-------不同喂养方式的腹泻发生率怎样?分娩方式与喂养方式有无关联?第13页/共23页建立SAS数据集通过excel直接导入SAS,注意第一行为SAS变量名将数据保存在txt文本文件中,通过infile读入Dataa;infile‘c:\aa.txt’;Inputnofxfxcstzfmwynljy;

labelno='编号’fx='小孩腹泻'fxcs='腹泻次数'tz='小孩体重'fm='分娩方式'wy='喂养方式'nl='母亲年龄'jy='教育程度';Run;第14页/共23页分析程序Procfreqdata=a;tablefxfxcsfmwy;Run;Procfreqdata=a;tablefxcs;wherefx=1;Run;Procfreqdata=a;tablewy*fx;tablefm*wy/chisq;Run;第15页/共23页结果略第16页/共23页例4-10.用抗凝剂与不用抗凝剂治疗急性心肌梗塞的疗效比较,结果如下表:组别生存死亡合计不用抗凝剂7451125用抗凝剂561975合计13070200请比较两种治疗方法的生存情况是否相同?第17页/共23页DATAex410;INPUTg1g2f@@;CARDS;1174125121562219;PROCFREQDATA=ex410;TABLESg1*g2/chisqFisher;WEIGHTf;RUN;首先建立需要的SAS数据集调用FREQ过程,g1*g2要求生成二维表,chisq选项要求做卡方检验,fisher选项要求做fisher精确检验(注意对于四格表该选项可以省略);由于是频数资料,因此加上weight语句并给出频数变量f。第18页/共23页g1(行变量)g2(列变量)

Frequency|

Percent|

RowPct|

ColPct|1|2|Total---------+--------+--------+

1|74|51|125|37.00|25.50|62.50|59.20|40.80||56.92|72.86|---------+--------+--------+

2|56|19|75|28.00|9.50|37.50|74.67|25.33||43.08|27.14|---------+--------+--------+Total130

70

200

65.00

35.00

100.00频数百分比行百分比列百分比

每一个格子中四个数据的含义第19页/共23页StatisticsforTableofg1byg2

统计量自由度统计量的值p值

StatisticDFValueProb------------------------------------------------------Chi-Square1

4.9289

0.0264LikelihoodRatioChi-Square1

5.0529

0.0246ContinuityAdj.Chi-Square1

4.2725

0.0387Mantel-HaenszelChi-Square1

4.9043

0.0268PhiCoefficient-0.1570ContingencyCoef

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论