版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
SAS软件介绍
.SAS软件介绍.1一、概述SAS系统全称为StatisticsAnalysisSystem,最早由北卡罗来纳大学的两位生物统计学研究生编制,并于1976年成立了SAS软件研究所,正式推出了SAS软件。SAS是用于决策支持的大型集成信息系统,但该软件系统最早的功能限于统计分析,至今,统计分析功能也仍是它的重要组成部分和核心功能。.一、概述SAS系统全称为StatisticsAnalysi2SAS系统是一个组合软件系统,它由多个功能模块组合而成,其基本部分是BASESAS模块。BASESAS模块是SAS系统的核心,承担着主要的数据管理任务,并管理用户使用环境,进行用户语言的处理,调用其他SAS模块和产品。.SAS系统是一个组合软件系统,它由多个功能模块组合而成,其基3启动SAS二、初识SAS
.启动SAS二、初识SAS.4启动后,出现如图的SAS运行界面,它象其它Windows应用程序一样,在一个主窗口内,包含若干个子窗口,并有菜单条、工具栏、状态栏等。SAS有三个最重要的子窗口:程序窗口(PROGRAMEDITOR)、运行记录窗口(LOG)、输出窗口(OUTPUT)。.启动后,出现如图的SAS运行界面,它象其它Windows应5ProgramEditor的窗口(窗口标签为Editor)就是用来输入SAS语句的,编程操作的所有内容都是在该窗口内完成的。要运行程序,只要用鼠标单击工具栏的提交(Submit)图标,或用Run菜单下的Submit命令,或者直接按下F8键,就可运行程序。如果选中某一段程序,然后进行调用,则系统只执行被选中的部分。..6Editor窗口.Editor窗口.7Log窗口.Log窗口.8运行记录窗口则记录每段程序的运行情况、所用时间、生成数据保存情况。如果有错误还会用红色指示错误。.运行记录窗口则记录每段程序的运行情况、所用时间、生成数据保存9Log窗口出错原因:数据行末尾加了分号.Log窗口出错原因:数据行末尾加了分号.10三、SAS程序的基本结构SAS程序由语句组成,语句用分号结束。语句一般由特定的关键词开始,语句中可包含变量名、运算符等,它们以空格分隔。SAS对语句所占的行数无限制,一个语句可占多行,同样,多个语句也可占一行。.三、SAS程序的基本结构.11SAS中的变量及数据集名称由英文字母、数字、下划线组成,第一个字符必须是字母或下划线,名字最多用8个字符,大写字母和小写字母不区分。比如,name,abc,aBC,x1,year12,_NULL_等是合法的名字,且abc和aBC是同一个名字,而class-1(不能有减号)、abit(不能有空格)、serial#(不能有特殊字符)、Documents(超长)等不是合法的名字。四、SAS中的命名
.SAS中的变量及数据集名称由英文字母、数字、下划线组成,第一12程序步分为两种,一种叫数据步(datastep),一种叫过程步(procstep),分别以DATA语句和PROC语句开始。数据步和过程步由若干个语句组成,一般以RUN语句结束。前者用来创建和修改用于统计分析的数据集,后者则利用已创建的数据集完成特定的统计分析任务。比如下面的例子:五、SAS中的程序步
.程序步分为两种,一种叫数据步(datastep),一13dataaaaa;建立数据集,数据集名称为aaaainputx@@;数据集中有一个变量xcards;提示以下录入的为数据12345注意数据行末尾不要加分号;procprint;“输出”过程varx;要求输出变量xrun;程序结束要加上run语句才能运行.dataaaaa;建立数据集,数据集名称为aaaa14数据步均以DATA语句开始,用于创建和处理数据集。数据步中常用的语句如下表:表2数据步的常用语句语句格式功能DATA语句DATA数据集名;数据步的开始,同时命名将要创建的数据集INPUT语句INPUT变量名<变量类型起止列数>…;确定变量的读入格式,即确定输入的数据所对应的变量六、数据步基本结构.数据步均以DATA语句开始,用于创建和处理数据集。数据15下面是几个例子:Data语句:Dataabc;INPUT语句:Inputxyz;/*输入变量x,y,z*/Inputx1-x10;/*输入10个变量x1到x10*/Inputx$y@@;/*输入变量x,y,符号$指明x为字符变量,@@表示数据是连续读入*/.下面是几个例子:.16七、SAS程序的过程步
通俗地说,SAS程序的过程步就是用于实现各种统计分析功能的SAS命令,我们只需要按照其格式调用它们。过程步总是以一个proc语句开始,后面紧跟着过程步名。如procprint;/*打印输出过程*/
.七、SAS程序的过程步通俗地说,SAS程序的过程步就是用于17八、数据集的引用如有一数据集已建立好,下次要使用时可以使用set语句来引用,如:datadef;setabc;将abc数据集内容复制到def数据集中。run;.八、数据集的引用如有一数据集已建立好,下次要使用时可以使用s18九、从excel导入数据将预先录入在excel中的数据集导入到sas中:File-importdata-选择microsoftexcel97or2000(*.xls).九、从excel导入数据将预先录入在excel中的数据集导入19next下一步:浏览确认excel数据集的位置.next下一步:浏览确认excel数据集的位置.20在临时数据集work中为导入的数据集起名,例如abc.在临时数据集work中为导入的数据集起名,例如abc.21完成后按finish.完成后按finish.22Log窗口会有提示导入成功.Log窗口会有提示导入成功.23导入数据集的注意事项被引用的Excel数据集此时必须保证关闭状态才能被引用,否则会出错。被引用的Excel数据集内尽量使用英文的变量名,否则容易出错。.导入数据集的注意事项被引用的Excel数据集此时必须保证关闭24计量资料的统计描述Univariate、Means过程.计量资料的统计描述Univariate、Means过程.25理论回顾计量资料的统计描述(频数表,直方(条)图,统计指标)正态分布资料偏峰分布资料
M(P25~P75).理论回顾计量资料的统计描述.26某地120名18岁~35岁健康男性居民血清铁含量(μmol/L)
实例分析变量类型?资料分布?定量变量1.根据专业知识2.绘制直方图或频数表3.统计学检验(正态性).某地120名18岁~35岁健康男性居民血清铁含量(μmol/27datat;inputx@@;*@@是行保持标记符;
cards;7.42 8.65 23.02 21.61……24.66 14.1816.52;Run;SAS程序:建立数据集.SAS程序:建立数据集.28SAS程序:计算统计指标,绘制直方图procunivariatedata=t;*调用univariate过程;varx;*对变量x进行分析;HISTOGRAMx/MIDPOINTS=7
TO
29
BY
2;*绘制直方图;run;.SAS程序:计算统计指标,绘制直方图.29运行结果(graph窗口).运行结果(graph窗口).30均数标准差方差变异系数中位数极差四分位数间距未校正平方和校正平方和偏度系数峰度系数运行结果(output窗口).均数标准差方差变异系数中位数极差四分位数间距未校正平方和校正31运行结果(output窗口).运行结果(output窗口).32Means过程Procmeansmeanstdminmax;Varx;Run;可限定输出常用的指标.Means过程Procmeansmeanstdmin33定性资料的统计描述FREQ过程.定性资料的统计描述FREQ过程.34现有一份预防医学专业61名学生的个人资料,包括年级(grade)、性别(sex)和个人是否拥有电脑(pc)等等信息,试用一维表描述性别比例,用二维表描述不同性别学生拥有个人电脑的情况。
.现有一份预防医学专业61名学生的个人资料,包括.35SAS程序:proc
freq;tablessex;/*一维表*/run;proc
freq;tablessex*pc;/*二维表*/run;.SAS程序:procfreq;.36置信区间Tinv函数以及赋值语句.置信区间Tinv函数以及赋值语句.37总体均数的可信区间t分布法SAS函数:TINV
t=TINV(p,df)可求t分位数的函数,p是从-∞到当前t分位数位置的面积。df=n-1(自由度)当p<0.5,求出来的t为负数;当p>0.5,求出来的t为正数。t0-∞p.总体均数的可信区间t分布法t0-∞p.38例:随机抽取15名学生,记录他们的性别(sex)、年龄(age)、体重(w)和身高(h),求:学生身高的95%置信区间。f1546156f1441149f1865165m1550160m1348155m1870180m1438150m1655165m1768176m1660170f1750160f1758160f1660165m1765175f1861162.例:随机抽取15名学生,记录他们的性别(sex)、年龄(ag39dataa;inputsex$agewh@@;cards;f1546156f1441149f1865165m1550160m1348155m1870180m1438150m1655165m1768176m1660170f1750160f1758160F1660165m1765175f1861162;.dataa;.40procmeans;varh;Outputout=bmean=meanstd=sn=n;/*把均数,标准差,样本含量存放在数据集b中,方便下面写赋值语句计算置信区间*/datac;set
b;t=tinv(0.975,n-1);/*也可使用t=tinv(0.025,n-1);但此时计算出来的t界值为负数。*/yl=mean-t*s/sqrt(n);/*可信区间的下限*/y2=mean+t*s/sqrt(n);/*可信区间的上限*/procprint;run;.procmeans;.41t检验ttest过程.t检验ttest过程.42t检验
1.单样本t检验
2.配对t检验
3.两个独立样本的t检验.t检验
1.单样本t检验
2.配对t检验
3.两个独43一、单样本资料的
t检验
目的:根据样本均数推断其总体均数是否与已知总体均数0相等——与0的比较。应用条件:独立性正态性.一、单样本资料的t检验目的:根据样本均数推断其44例1某镇痛新药在药厂投入量产,已知该药的生产技术标准为:每片药中平均有效药物含量为40.4mg。为评价生产质量是否达标,现抽测10片药物,结果为:41.3,40.8,38.7,42.7,43.0,38.6,42.7,39.5,42.1,42.1,问该厂是否达到生产要求?
.例1某镇痛新药在药厂投入量产,已知该药的生产技术标准为:每45dataaa;inputa@@;cards;41.340.838.742.743.038.642.739.542.142.1;数据步.dataaa;数据步.46
procttestH0=40.4;vara;run;过程步.procttestH0=40.4;过程步.47
本例t=1.41,双侧检验p=0.1917,按a=0.05水准,不拒绝H0,差别无统计学意义,尚不认为该厂生产质量不达标。.本例t=1.41,双侧检验p=0.1917,按a=048二、配对资料t检验资料类型:两个同质对象接受不同处理;同一受试对象分别接受不同的处理,同一受试对象处理前后。条件:差值d服从正态分布.二、配对资料t检验资料类型:.49例2.例2.50数据步dataaa;
inputx1x2@@;
cards;
0.94 0.921.02 1.011.14 1.11
1.23 1.221.31 1.321.41 1.42
1.53 1.511.61 1.611.72 1.72
1.81 1.821.93 1.932.02 2.04
;.数据步dataaa;
inputx1x2@@;
car51
procttest;pairedx1*x2;run;过程步.过程步.52
本例t=0.771,P=0.4569,在α=0.05水平上不能拒绝H0,差别没有统计学意义
,尚不能认为两法测定结果不同。
.本例t=0.771,P=0.4569,在α=0.05水平53两个独立样本的t检验
应用条件:(1)观察值之间是独立的;(2)每组观察值来自正态分布的总体;(3)两个独立组的方差相等。.两个独立样本的t检验应用条件:.54例3:.例3:.55dataaa;inputxgroup@@;cards;241361251141261341231201151191142182202152222242212252272232procunivariatenormal;/*正态性检验*/classgroup;varx;run;procttest;classgroup;varx;run;.dataaa;.56..57F=2.92,P=0.1258,提示两总体方差相等。.F=2.92,P=0.1258,提示两总体方差相等。.58正态性检验结果:
w1=0.93988,P=0.551;w2=0.96219,P=0.8106;提示两组资料均服从正态分布。方差齐性检验结果:
F=2.92,P=0.1258,提示两总体方差相等。t检验结果:
t=1.02,P=0.3215,不拒绝H0,还不能认为两组药物的疗效有差别。结果解释:.正态性检验结果:结果解释:.59SAS软件介绍
.SAS软件介绍.60一、概述SAS系统全称为StatisticsAnalysisSystem,最早由北卡罗来纳大学的两位生物统计学研究生编制,并于1976年成立了SAS软件研究所,正式推出了SAS软件。SAS是用于决策支持的大型集成信息系统,但该软件系统最早的功能限于统计分析,至今,统计分析功能也仍是它的重要组成部分和核心功能。.一、概述SAS系统全称为StatisticsAnalysi61SAS系统是一个组合软件系统,它由多个功能模块组合而成,其基本部分是BASESAS模块。BASESAS模块是SAS系统的核心,承担着主要的数据管理任务,并管理用户使用环境,进行用户语言的处理,调用其他SAS模块和产品。.SAS系统是一个组合软件系统,它由多个功能模块组合而成,其基62启动SAS二、初识SAS
.启动SAS二、初识SAS.63启动后,出现如图的SAS运行界面,它象其它Windows应用程序一样,在一个主窗口内,包含若干个子窗口,并有菜单条、工具栏、状态栏等。SAS有三个最重要的子窗口:程序窗口(PROGRAMEDITOR)、运行记录窗口(LOG)、输出窗口(OUTPUT)。.启动后,出现如图的SAS运行界面,它象其它Windows应64ProgramEditor的窗口(窗口标签为Editor)就是用来输入SAS语句的,编程操作的所有内容都是在该窗口内完成的。要运行程序,只要用鼠标单击工具栏的提交(Submit)图标,或用Run菜单下的Submit命令,或者直接按下F8键,就可运行程序。如果选中某一段程序,然后进行调用,则系统只执行被选中的部分。..65Editor窗口.Editor窗口.66Log窗口.Log窗口.67运行记录窗口则记录每段程序的运行情况、所用时间、生成数据保存情况。如果有错误还会用红色指示错误。.运行记录窗口则记录每段程序的运行情况、所用时间、生成数据保存68Log窗口出错原因:数据行末尾加了分号.Log窗口出错原因:数据行末尾加了分号.69三、SAS程序的基本结构SAS程序由语句组成,语句用分号结束。语句一般由特定的关键词开始,语句中可包含变量名、运算符等,它们以空格分隔。SAS对语句所占的行数无限制,一个语句可占多行,同样,多个语句也可占一行。.三、SAS程序的基本结构.70SAS中的变量及数据集名称由英文字母、数字、下划线组成,第一个字符必须是字母或下划线,名字最多用8个字符,大写字母和小写字母不区分。比如,name,abc,aBC,x1,year12,_NULL_等是合法的名字,且abc和aBC是同一个名字,而class-1(不能有减号)、abit(不能有空格)、serial#(不能有特殊字符)、Documents(超长)等不是合法的名字。四、SAS中的命名
.SAS中的变量及数据集名称由英文字母、数字、下划线组成,第一71程序步分为两种,一种叫数据步(datastep),一种叫过程步(procstep),分别以DATA语句和PROC语句开始。数据步和过程步由若干个语句组成,一般以RUN语句结束。前者用来创建和修改用于统计分析的数据集,后者则利用已创建的数据集完成特定的统计分析任务。比如下面的例子:五、SAS中的程序步
.程序步分为两种,一种叫数据步(datastep),一72dataaaaa;建立数据集,数据集名称为aaaainputx@@;数据集中有一个变量xcards;提示以下录入的为数据12345注意数据行末尾不要加分号;procprint;“输出”过程varx;要求输出变量xrun;程序结束要加上run语句才能运行.dataaaaa;建立数据集,数据集名称为aaaa73数据步均以DATA语句开始,用于创建和处理数据集。数据步中常用的语句如下表:表2数据步的常用语句语句格式功能DATA语句DATA数据集名;数据步的开始,同时命名将要创建的数据集INPUT语句INPUT变量名<变量类型起止列数>…;确定变量的读入格式,即确定输入的数据所对应的变量六、数据步基本结构.数据步均以DATA语句开始,用于创建和处理数据集。数据74下面是几个例子:Data语句:Dataabc;INPUT语句:Inputxyz;/*输入变量x,y,z*/Inputx1-x10;/*输入10个变量x1到x10*/Inputx$y@@;/*输入变量x,y,符号$指明x为字符变量,@@表示数据是连续读入*/.下面是几个例子:.75七、SAS程序的过程步
通俗地说,SAS程序的过程步就是用于实现各种统计分析功能的SAS命令,我们只需要按照其格式调用它们。过程步总是以一个proc语句开始,后面紧跟着过程步名。如procprint;/*打印输出过程*/
.七、SAS程序的过程步通俗地说,SAS程序的过程步就是用于76八、数据集的引用如有一数据集已建立好,下次要使用时可以使用set语句来引用,如:datadef;setabc;将abc数据集内容复制到def数据集中。run;.八、数据集的引用如有一数据集已建立好,下次要使用时可以使用s77九、从excel导入数据将预先录入在excel中的数据集导入到sas中:File-importdata-选择microsoftexcel97or2000(*.xls).九、从excel导入数据将预先录入在excel中的数据集导入78next下一步:浏览确认excel数据集的位置.next下一步:浏览确认excel数据集的位置.79在临时数据集work中为导入的数据集起名,例如abc.在临时数据集work中为导入的数据集起名,例如abc.80完成后按finish.完成后按finish.81Log窗口会有提示导入成功.Log窗口会有提示导入成功.82导入数据集的注意事项被引用的Excel数据集此时必须保证关闭状态才能被引用,否则会出错。被引用的Excel数据集内尽量使用英文的变量名,否则容易出错。.导入数据集的注意事项被引用的Excel数据集此时必须保证关闭83计量资料的统计描述Univariate、Means过程.计量资料的统计描述Univariate、Means过程.84理论回顾计量资料的统计描述(频数表,直方(条)图,统计指标)正态分布资料偏峰分布资料
M(P25~P75).理论回顾计量资料的统计描述.85某地120名18岁~35岁健康男性居民血清铁含量(μmol/L)
实例分析变量类型?资料分布?定量变量1.根据专业知识2.绘制直方图或频数表3.统计学检验(正态性).某地120名18岁~35岁健康男性居民血清铁含量(μmol/86datat;inputx@@;*@@是行保持标记符;
cards;7.42 8.65 23.02 21.61……24.66 14.1816.52;Run;SAS程序:建立数据集.SAS程序:建立数据集.87SAS程序:计算统计指标,绘制直方图procunivariatedata=t;*调用univariate过程;varx;*对变量x进行分析;HISTOGRAMx/MIDPOINTS=7
TO
29
BY
2;*绘制直方图;run;.SAS程序:计算统计指标,绘制直方图.88运行结果(graph窗口).运行结果(graph窗口).89均数标准差方差变异系数中位数极差四分位数间距未校正平方和校正平方和偏度系数峰度系数运行结果(output窗口).均数标准差方差变异系数中位数极差四分位数间距未校正平方和校正90运行结果(output窗口).运行结果(output窗口).91Means过程Procmeansmeanstdminmax;Varx;Run;可限定输出常用的指标.Means过程Procmeansmeanstdmin92定性资料的统计描述FREQ过程.定性资料的统计描述FREQ过程.93现有一份预防医学专业61名学生的个人资料,包括年级(grade)、性别(sex)和个人是否拥有电脑(pc)等等信息,试用一维表描述性别比例,用二维表描述不同性别学生拥有个人电脑的情况。
.现有一份预防医学专业61名学生的个人资料,包括.94SAS程序:proc
freq;tablessex;/*一维表*/run;proc
freq;tablessex*pc;/*二维表*/run;.SAS程序:procfreq;.95置信区间Tinv函数以及赋值语句.置信区间Tinv函数以及赋值语句.96总体均数的可信区间t分布法SAS函数:TINV
t=TINV(p,df)可求t分位数的函数,p是从-∞到当前t分位数位置的面积。df=n-1(自由度)当p<0.5,求出来的t为负数;当p>0.5,求出来的t为正数。t0-∞p.总体均数的可信区间t分布法t0-∞p.97例:随机抽取15名学生,记录他们的性别(sex)、年龄(age)、体重(w)和身高(h),求:学生身高的95%置信区间。f1546156f1441149f1865165m1550160m1348155m1870180m1438150m1655165m1768176m1660170f1750160f1758160f1660165m1765175f1861162.例:随机抽取15名学生,记录他们的性别(sex)、年龄(ag98dataa;inputsex$agewh@@;cards;f1546156f1441149f1865165m1550160m1348155m1870180m1438150m1655165m1768176m1660170f1750160f1758160F1660165m1765175f1861162;.dataa;.99procmeans;varh;Outputout=bmean=meanstd=sn=n;/*把均数,标准差,样本含量存放在数据集b中,方便下面写赋值语句计算置信区间*/datac;set
b;t=tinv(0.975,n-1);/*也可使用t=tinv(0.025,n-1);但此时计算出来的t界值为负数。*/yl=mean-t*s/sqrt(n);/*可信区间的下限*/y2=mean+t*s/sqrt(n);/*可信区间的上限*/procprint;run;.procmeans;.100t检验ttest过程.t检验ttest过程.101t检验
1.单样本t检验
2.配对t检验
3.两个独立样本的t检验.t检验
1.单样本t检验
2.配对t检验
3.两个独102一、单样本资料的
t检验
目的:根据样本均数推断其总体均数是否与已知总体均数0相等——与0的比较。应用条件:独立性正态性.一、单样本资料的t检验目的:根据样本均数推断其103例1某镇痛新药在药厂投入量产,已知该药的生产技术标准为:每片药中平均有效药物含量为40.4mg。为评价生产质量是否达标,现抽测10片药物,结果为:41.3,40.8,38.7,42.7,43.0,38.6,42.7,39.5,42.1,42.1,问该厂是否达到生产要求?
.例1某镇痛新药在药厂投入量产,已知该药的生产技术标准为:每104dataaa;inputa@@;cards;41.340.838.742.743.038.642.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度商业地产商铺租赁合同示范文本2篇
- 2024年商务采购合同模板(矿产资源采购)2篇
- 2024版北京地区特色离婚财产分割合同3篇
- 2024年邮政快递行业人才引进合作协议2篇
- 2024年度石材铺装工程质量检测合同
- 睡眠质量与心理健康关系研究-第1篇-洞察分析
- 庆云摊位出租合同
- 门窗检测合同模板
- 店铺长期租赁合同模板
- 2024年度租赁合同书范例及其详细条款3篇
- 2024年中冶建工集团有限公司招聘笔试参考题库含答案解析
- O型密封圈压缩量计算
- 公交公司点钞管理制度
- 呆滞料与超期物料处理流程
- 2019年4月自考00015英语二真题及答案含解析
- 重症患者中心静脉导管管理专家共识解读
- 长输管道牺牲阳极法阴极保护施工方案
- 保函(履约、投标、付款、质量等保函参考格式)
- 北京东城区北京汇文中学2023-2024学年高二物理第一学期期末复习检测模拟试题含解析
- 《流程分析与改善》课件
- 花道-插花技艺养成智慧树知到课后章节答案2023年下云南林业职业技术学院
评论
0/150
提交评论