![同济医学院SAS求基本统计量过程_第1页](http://file4.renrendoc.com/view/44c0b544e0d72e75be0cfa01b6348a5c/44c0b544e0d72e75be0cfa01b6348a5c1.gif)
![同济医学院SAS求基本统计量过程_第2页](http://file4.renrendoc.com/view/44c0b544e0d72e75be0cfa01b6348a5c/44c0b544e0d72e75be0cfa01b6348a5c2.gif)
![同济医学院SAS求基本统计量过程_第3页](http://file4.renrendoc.com/view/44c0b544e0d72e75be0cfa01b6348a5c/44c0b544e0d72e75be0cfa01b6348a5c3.gif)
![同济医学院SAS求基本统计量过程_第4页](http://file4.renrendoc.com/view/44c0b544e0d72e75be0cfa01b6348a5c/44c0b544e0d72e75be0cfa01b6348a5c4.gif)
![同济医学院SAS求基本统计量过程_第5页](http://file4.renrendoc.com/view/44c0b544e0d72e75be0cfa01b6348a5c/44c0b544e0d72e75be0cfa01b6348a5c5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
同济医学院SAS求基本统计量过程第1页/共26页求基本统计量过程
ProcedureofdescriptivestatisticsSAS应用第2页/共26页程序选择计量资料描述性研究
集中趋势:meanmedian
离散程度:stdvarianceCVrange
分布检验(正态性检验)计数资料描述性研究
率(rate)构成比(propotion)比(ratio)MEANS过程UNIVARIATE过程过程名FREQ过程第3页/共26页三个求基本统计量过程Means过程Univariate过程Freq过程第4页/共26页一.MEANS过程
用于计量资料(numericaldata)描述性分析。求均数(mean)、标准差(standarddeviation)、最大值(maximum)、最小值(minimum)等基本统计量,产生包含统计结果的数据集以便作为其他过程的输入数据集。1.功能第5页/共26页2.格式
PROCMEANS
<选择项><关键字>;
VAR变量…;
FREQ
变量…;
ID变量…;
BY
变量…;
OUTPUT选择项;第6页/共26页3.语句说明:
1、PROCMEANS语句
PROCMEANS<选择项><统计关键字选择项>;1)选择项包括:
DATA=SAS数据集指明需做MEANS分析的SAS数据集名。
ALPHA=n指定计算可信限的α值,缺省α=0.05。
NOPRINT不打印统计值,仅建立一个新数据集。
MAXDEC=n输出结果取n位小数,缺省值为7。
VARDEF=DF计算方差时的除数是自由度(N-1)。
=N计算方差时的除数是观测数。第7页/共26页PROCMEANS<选择项><统计关键字选择项>;
N无缺省值的观察数
MEAN均值
STD标准差
MIN最小值
MAX最大值
RANGE极差
SUM所有不缺省项变量值的和
VAR方差
USS未修正的平方和
CSS修正的平方和
CV变异系数2)统计关键字选择项第8页/共26页STDERR标准误
T总体均值为0的学生t值
PRTt值的最大绝对值的概率
SKEWNESS偏度
KURTOSIS峰度
CLM上下可信限值
LCLM可信限下限值
UCLM可信限上限值
2)统计关键字选择项3)缺省时,自动地为每个数值型变量输出五个统计量:N、MIN、MAX、MEAN、STD。第9页/共26页2、主要语句
(1)VAR语句:指明需要计算均数等统计量的变量。如果求多个变量的统计量,多个变量之间用空格分开,列于VAR之后。如果不加此语句,则MEANS过程对数据集中所有数值型变量进行计算;(2)FREQ语句:指明频数处理变量(3)ID语句:输出的数据集包含该语句所指的变量
(4)BY语句:指明用以分组统计的变量。使用BY语句之前,数据集一定按BY语句中的变量排过序。(5)OUTPUT语句:产生包含有基本统计值的数据集第10页/共26页OUTPUT语句
OUTPUTOUT=SAS数据集统计关键字=变量名清单;功能:将MEANS过程产生的统计值输出到一个新的SAS数据集。1.OUT=SAS数据集指定计算结果放入新的数据集里。2.统计关键=变量名清单指明新数据集中想要的统计项,并给包含这些统计项的变量起名,这些名字将作为统计值在新数据集中使用。统计关键字为<统计关键字选择项>的任意统计量,变量名清单为VAR语句中的变量名,可以取一个,也可以取多个。需要注意的是,LCLM,UCLM(同时指定输出为双侧;如只选一个,输出单侧可信区间)可以重新对统计量命名,也可用原名;格式n=nmean=meanprt=p
第11页/共26页例1:PROCSORTDATA=CLASS1;BYSEX;PROCMEANSDATA=CLASS1;VARHEIGHT;BYSEX;RUN;PROCMEANSDATA=CLASS1;VARHEIGHT;OUTPUTOUT=NEWMEAN=MEANHEIGHT;RUN;第12页/共26页Datagmean;Inputx@@;Y=log10(x);Cards;2530323428Procmeansnoprint;Vary;Outputout=gmean1mean=y1;Datagmean2;Setgmean1;X1=10**y1;Procprint;Varx1;Run;例2例16-2某地区1953至1957年人口的自然增长率为25‰、30‰、32‰、34‰、28‰,求平均增长率。第13页/共26页二.UNIVARIATE过程1.格式:PROCUNIVARIATE
[data=SAS数据集]normalplot;
VAR变量…;
FREQ
变量…;
ID变量…;
OUTPUT
OUT=dataset
keyword=name;第14页/共26页2.功能:
求数据集中某(些)变量均数(mean)百分位数(percentiles)、极值(extremes)等基本统计量。与MEANS过程的区别在于它可以计算更多的反应数据分布的统计量。
Normal:用于正态性检验。
Plot:给出干叶图、箱式图及正态概率图,检验数据是否服从正态分布。第15页/共26页例2:测定30名正常男子血浆中性脂肪含量(mg/lwml)的结果如下:
163219313169281264124942241452851072694166622491361001994079423512012856080217252165107第16页/共26页Libnameb“c:\zfhl”;datab.blood;inputx@@;cards;163219313169281264124942241452851072694166622491361001994079423512012856080217252165107;procprint;run;procunivariatenormalplot;varx;run;
第17页/共26页5.125.134.584.314.094.414.334.584.245.454.324.844.915.145.254.894.794.905.094.045.145.464.664.204.213.735.175.795.464.494.855.284.784.324.945.214.685.094.684.915.135.263.844.174.563.526.004.054.924.874.284.465.035.695.254.565.534.584.864.974.704.284.375.334.784.755.395.274.896.184.135.224.444.134.434.025.865.125.363.864.685.485.314.534.834.113.294.184.134.063.424.684.525.193.705.514.644.924.934.903.925.044.704.543.954.404.313.774.164.585.353.715.274.525.214.374.804.753.865.69例3某地随机抽取正常成年男子120名,其红细胞数如下,试作该批样本的频数表。第18页/共26页
三.FREQ过程
1.格式:
PROCFREQ[data=SAS数据集];
TABLES变量[*变量][*变量]…;
2.功能:求一维或多维频数表(frequencytable)。
第19页/共26页3.说明:(1)PROCFREQ:调用FREQ过程;(2)data=SAS数据集:指明需处理的数据集;(3)TABLES语句:指明需要计算频数的变量以及频数表的列表方法。
如果求一维频数表,则将求频数的变量列于TABLES之后即可;如果求多个变量的的联合频数(多维频数表或称列联表),将需要计算频数的变量用星号“*”分开,其中最后一个变量将用于列变量(纵标目),倒数第二个变量为行变量(横标目),其余变量为分层变量,每一层列一个频数表;
一个FREQ过程可以有多个TABLES语句,即可以同时列出多个频数表。第20页/共26页TABLES语句请求式请求式由一个或多个“*”号与变量连接组成。如:
TABLESA;输出一维频数表。
TABLESA*B;输出以A变量为行、B变量为列的二维表列联表。
TABLESA*B*C;输出以A变量为页、B变量为行、
C变量为列的三维表列联表。
TABLESA*(BC);等同于TABLESA*BA*C。
TABLESAB*(CD);等同于TABLESA*CA*DB*CB*D。
TABLES(A-C);等同于TABLESABC。第21页/共26页TABLES变量[*变量]/选择项1、选择项请求统计假设检验选择项:CHISQ/CMH
请求附加的表格信息的选择项
:EXPECTED打印在独立性(或齐性)假设下格子的理论频数。
MISSPRINT带缺省值的频数列出来,但不参加统计量计算。禁止打印选择项
NOCOL禁止打印列联表中各格的列百分数。
NOFREQ禁止打印列联表中各格的频数。
NOPERCENT禁止打印列联表中各格的百分数。
NOPRINT禁止打印表格,但允许打印由CHISQ、
MEASURES、CMH和ALL所指定的统计值。
NOROW禁止打印列联表
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年集成电路代工厂商业秘密保护合同
- 2025年动力调谐陀螺平台项目建议书
- 提升学校艺术教育影响力的策略计划
- 医院宣传工作总结与改进方法计划
- 班级传统文化传承活动的计划
- 营养科膳食服务效果评估与改进计划
- 强化模块独立性降低系统耦合风险
- 小学开学第一天班主任讲话2022
- 小学生公民意识教育故事征文
- 旅游景区游客意外事故免责条款
- 苏州2025年江苏苏州太仓市高新区(科教新城娄东街道陆渡街道)招聘司法协理员(编外用工)10人笔试历年参考题库附带答案详解
- 幼儿园课件:健康教案
- 2025至2031年中国助眠床垫行业投资前景及策略咨询研究报告
- 绵阳市高中2022级(2025届)高三第二次诊断性考试(二诊)语文试卷(含答案)
- 常州初三强基数学试卷
- 物业服务和后勤运输保障服务总体服务方案
- 2025年极兔速递有限公司招聘笔试参考题库含答案解析
- 苏少版小学一年级下册综合实践活动单元备课
- 铁岭卫生职业学院单招参考试题库(含答案)
- 中国古钱币大全图谱[共33页]
- 相亲相爱一家人简谱
评论
0/150
提交评论