版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1 tatistical nalysis ystem 盐城师范学院数学科学学院盐城师范学院数学科学学院 统计系统计系 李万斌李万斌 2014.9 2 第一节第一节 SASSAS软件简介软件简介 1966年美国年美国North Carolina州立大学的两位生物州立大学的两位生物 统计学研究生开始研制统计学研究生开始研制SAS系统,直至系统,直至1976年成立了年成立了 SAS软件研究所,正式推出了软件研究所,正式推出了SAS软件,软件,1985年推出年推出 微机版微机版SAS。 SAS是用于决策支持的大型集成信息系统,软件是用于决策支持的大型集成信息系统,软件 系统最早的功能限于统计分析,逐渐
2、成为一个用来管系统最早的功能限于统计分析,逐渐成为一个用来管 理、分析数据和编写报告的大型集成应用软件系统,理、分析数据和编写报告的大型集成应用软件系统, 具有完备的数据访问、管理、分析、呈现及应用开发具有完备的数据访问、管理、分析、呈现及应用开发 等功能,完全超出了单纯统计应用的功能。属于世界等功能,完全超出了单纯统计应用的功能。属于世界 领先,使用最为广泛的统计软件之一。领先,使用最为广泛的统计软件之一。 3 由于由于SAS系统是从大型机上的系统发展系统是从大型机上的系统发展 而来,在设计上也是完全针对专业用户进行而来,在设计上也是完全针对专业用户进行 设计,因此操作以设计,因此操作以SA
3、S语言编程为主,另外语言编程为主,另外 也有非编程方式的菜单系统,但人机对话的也有非编程方式的菜单系统,但人机对话的 界面不太友好。界面不太友好。 学习学习SAS软件时,需要用户有基本的统软件时,需要用户有基本的统 计学知识,对所选用的统计方法有较清楚的计学知识,对所选用的统计方法有较清楚的 了解,没有统计学基础知识要掌握了解,没有统计学基础知识要掌握SAS软件软件 较为困难。较为困难。 4 SAS系统是一个模块化的组合软件系统,它系统是一个模块化的组合软件系统,它 提供了约提供了约20多个模块,各个模块之间既相互独立多个模块,各个模块之间既相互独立 又相互交融补充。本课程用得最多的是又相互交
4、融补充。本课程用得最多的是Base SAS 模块和模块和SAS/STAT模块。模块。 Base SAS是是SAS系统的基础。系统的基础。它既可以单独它既可以单独 使用,也可以与其他模块组成一个用户化的使用,也可以与其他模块组成一个用户化的SAS系系 统,但是其他模块必须与之结合起来才能使用。统,但是其他模块必须与之结合起来才能使用。 Base SAS主要承担着数据及用户使用环境的管理、主要承担着数据及用户使用环境的管理、 SAS语言程序的处理,并具有基本的数据分析和报语言程序的处理,并具有基本的数据分析和报 告等统计功能。告等统计功能。 5 SAS/STAT提供了当今流行的主要统计提供了当今流
5、行的主要统计 分析方法分析方法,是国际上统计分析领域的标准权,是国际上统计分析领域的标准权 威软件。它具有回归分析、方差分析、属性威软件。它具有回归分析、方差分析、属性 数据分析、多元分析、聚类分析、判别分析、数据分析、多元分析、聚类分析、判别分析、 非参数分析、生存分析和心理测量分析等统非参数分析、生存分析和心理测量分析等统 计功能。计功能。 6 第二节第二节 SASSAS软件的使用基础软件的使用基础 一、一、SAS的启动和退出的启动和退出 v启动启动SAS v双击桌面SAS图标 v开始菜单 程序 The Sas System The Sas System for Windows V*.*
6、v直接双击SAS应用程序 v退出退出SAS v标题栏关闭按钮 v菜单栏 File Exit 7 标题栏、菜单栏、工具栏标题栏、菜单栏、工具栏 vEditor 程序编辑器窗口 vLOG 运行过程日志窗口 vOutput 结果输出窗口 vExplorer 资源管理器窗口 vResults 结果索引窗口 三个窗口间切换F4 Recall (调回程序) F5 Editor (程序)F8 Submit (发送程序) F6 LOG (日志)F1 Help (帮助) F7 Output (结果)F9 Keys (功能键列表) 二、二、SAS的工作窗口的工作窗口 SAS常用功能键常用功能键 8 第二节第二节
7、SASSAS软件的使用基础软件的使用基础 9 vEditor窗口窗口 主要用于打开SAS程序文件(*.sas)、编辑 和修改SAS程序、并提交全部或部分SAS程序。 vLOG窗口窗口 显示有关的SAS会话和提交SAS程序的信息, 包括程序的出错信息等(*.log) vOutput窗口窗口 主要显示提交SAS程序后的运行结果(*.lst) vExplorer窗口窗口 主要用于查看和管理所有SAS文件,而且 可以对非SAS文件创建快捷方式。 vResults 窗口窗口 主要用于操作和管理提交SAS程序后的输 出结果。他的内容与Output窗口的内容一一对应,可以 看成是Output窗口内容的名称。
8、 二、二、SAS的工作窗口的工作窗口 10 第三节第三节 SASSAS语言的语句和程序语言的语句和程序 一、一、SAS 语句语句 一个SAS语句就是要求SAS系统执行某种操作 或给SAS系统提供一些信息的命令。 SAS语句通常由语句通常由SAS关键字、关键字、SAS名称、运算符及特名称、运算符及特 殊字符组成殊字符组成。 规则: (1)以 ;结尾 (2)以SAS关键字开始。如: data,proc,input,cards,model,class,if,keep,set,run 11 第三节第三节 SASSAS语言的语句和程序语言的语句和程序 一、一、SAS 语句语句 (3)注释语句可以用 *
9、开始,或者用/*/表示中间 内容是注释语句。 例1.1 Data sas1_1; /*sas1_1是数据集名*/ Input id name$ height weight; Bmi=weight/height*2; Cards; /*数据流开始*/ 1 judy 1.56 45 2 lucy 1.67 53 3 lili 1.58 50 ; /*数据流结束*/ Proc print data=sas1_1; Run; 12 第三节第三节 SASSAS语言的语句和程序语言的语句和程序 一、一、SAS 语句语句 1.SAS关键字关键字 几乎所有的SAS语句都是由SAS关键字开始的, 说明SAS语句
10、的类型。data语句,input语句,proc语句, run语句 2.SAS数据集名和变量名数据集名和变量名 (1)32个字符之内, (2)第一个字母必须为字母或_;第二个以后可以为字母或 数字。 (3)字母不区分大小写。 (4)不能使用空格和%¥#$等特殊字符 13 第三节第三节 SASSAS语言的语句和程序语言的语句和程序 一、一、SAS 语句语句 3.SAS运算符运算符 包括比较运算、算术运算、逻辑运算 (1)算数运算符 + - * / * (2)比较运算符 = = = 2 and y3 or/| 逻辑或 x2 or y3 Not/ 逻辑非 最大 35;结果为5 5;结果为3 | 连接
11、A=my name is; B=SAS; C=A|B; 那么C=“my name is SAS” 14 第三节第三节 SASSAS语言的语句和程序语言的语句和程序 一、一、SAS 语句语句 4.SAS函数函数 函数的一般形式:函数的一般形式: 函数名(自变量,自变量,函数名(自变量,自变量,) (1)SAS常用的概率和密度函数常用的概率和密度函数 标准正态分布密度函数:标准正态分布密度函数:probnorm(x) 如:如:y=probnorm(-1.96); 结果为结果为0.025 t分布密度函数:分布密度函数:probt(x,df) 如:如:y1= probt(0.95,100);结果为结果
12、为0.82780 F分布密度函数:分布密度函数:probF(x,df1,df2) 2分布密度函数:分布密度函数:probCHI(x,df) 二项分布概率函数:二项分布概率函数:probBNML(p,n,m) 泊松分布概率函数:泊松分布概率函数:poisson(m,n) 15 第三节第三节 SASSAS语言的语句和程序语言的语句和程序 正态分布分位数函数:正态分布分位数函数:probit(p) 0p1 如:如:y=probit (0.025), 结果为结果为-1.96 t分布分位数函数:分布分位数函数:TINV(p,df) F分布分位数函数:分布分位数函数:FINV(p,df1,df2) 2分布
13、分位数函数:分布分位数函数:CINV(p,df) 其它常用函数其它常用函数 ABS(x)-取取X的绝对值的绝对值 SQRT(x)-计算计算X的平方根的平方根 MOD(x,y)-求求x/y的余数的余数 16 第三节第三节 SASSAS语言的语句和程序语言的语句和程序 EXP(x)-计算计算e的的x次幂次幂 LOG(x)-对自变量对自变量x求以求以e为底的自然对数为底的自然对数 LOG10(x)-对自变量对自变量x求以求以10为底的对数为底的对数 CEIL(x)-取取自变量自变量x的最小整数。的最小整数。 如如 CEIL(5.7)=6 FLOOR(x)-取取自变量自变量x的最大整数。的最大整数。
14、如如 CEIL(5.7)=5 INT(x)-取取X的整数部分的整数部分 ROUND(x,n)-X按按n的精度取舍入值的精度取舍入值 17 第三节第三节 SASSAS语言的语句和程序语言的语句和程序 data sas1_2; y1=probnorm(-1.96); /*标准正态分布密度函数标准正态分布密度函数*/ y2=probt(0.95,100); /* t分布密度函数分布密度函数*/ y3=probit(0.025); /*正态分布分位数函数正态分布分位数函数*/ x1=log10(100); /*对自变量对自变量x求以求以10为底的对数为底的对数*/ x2=exp(2); /*计算计算e
15、的的x次幂次幂*/ x3=CEIL(5.7); /*取取自变量自变量x的最小整数的最小整数*/ x4=ABS(-8); /*取取X的绝对值的绝对值*/ x5=SQRT(36); /*计算计算X的平方根的平方根*/ x6=MOD(10,3); /*求求x/y的余数的余数*/ x7=FLOOR(5.7); /*取取自变量自变量x的最大整数的最大整数*/ x8=INT(5.6874); /*取取X的整数部分的整数部分*/ x9=ROUND(5.4874,0.001); /* X按按n的精度取舍入值的精度取舍入值*/ A=my name is ; B=SAS; C=A|B; proc print da
16、ta=sas1_2; run; 18 第三节第三节 SASSAS语言的语句和程序语言的语句和程序 二、二、SAS 程序程序 将一系列将一系列SAS语句按逻辑顺序排列起来,构成语句按逻辑顺序排列起来,构成SAS程程 序。通常包括数据步和过程步两部分。序。通常包括数据步和过程步两部分。 数据步数据步以以data语句开头,以语句开头,以run语句结束。主要作用是语句结束。主要作用是 建立数据集。建立数据集。 过程步过程步以以proc开头,以开头,以run语句结束。主要作用是激活语句结束。主要作用是激活 SAS过程对数据进行处理和分析。过程对数据进行处理和分析。 提交提交SAS程序:(程序:(1)工具
17、栏提交图标,)工具栏提交图标, (2)run/submit, (3)使用)使用F3功能键功能键 19 第三节第三节 SASSAS语言的语句和程序语言的语句和程序 二、二、SAS 程序程序 程序的储存:(程序的储存:(1)键入)键入“file 路径路径+文件名文件名.扩展名扩展名” 如:如:file d:usersas1-1.sas; (2)“文件文件”菜单菜单“保存保存” 程序的调用:(程序的调用:(1)键入)键入infile路径路径+文件名文件名+扩展名扩展名 如:如:infile d:usersas1-1.sas; (2)“文件文件”菜单菜单“打开打开” 20 第三节第三节 SASSAS语
18、言的语句和程序语言的语句和程序 例例1.3 SAS程序举例程序举例 data sas1_3; /*创建名为sas1_3的SAS数据集*/ Input id nam$ height weight; bmi=weight/height*2; cards; 1 Judy 1.56 45 /*数据流中每个数据值之间最少有1各空格*/ 2 Lucy 1.67 53 ; run; /*数据步结束*/ proc print data=sas1_3; /*显示输出sas1_3数据集到output窗口*/ run; /*过程步结束*/ 21 第二章第二章 建立建立SASSAS数据集数据集 第一节第一节 SAS数
19、据集概述数据集概述 一、一、SAS数据集基本格式数据集基本格式 SAS数据集可以看做由若干行和若干列组成的表格,数据集可以看做由若干行和若干列组成的表格, 一个数据集等价于关系型数据库中的一个表。一个数据集等价于关系型数据库中的一个表。 idnameheightweight 1Judy15645 2Lucy16753 3Susan15655 4tony17870 变量 观观 测测 变量有两种类型:变量有两种类型: 数值型变量数值型变量 字符型变量字符型变量 22 第二章第二章 建立建立SASSAS数据集数据集 第一节第一节 SAS数据集概述数据集概述 一、一、SAS数据集基本格式数据集基本格式
20、 例例2_1 缺失值的例子缺失值的例子 Data sas2_1; Input id name$ height weight; If name=999 then name=.; If weight=999 then weight=.; Cards; 1 Judy 156 999 2 Lucy 167 58 3 999 165 55 4 Tomy 178 62 ; Proc print data=sas2_1; run; 23 第二章第二章 建立建立SASSAS数据集数据集 二、临时二、临时SAS数据集和永久数据集和永久SAS数据集数据集 临时数据集临时数据集只能在只能在SAS会话过程中创建使用,
21、一旦退会话过程中创建使用,一旦退 出出SAS,数据集就不存在了。,数据集就不存在了。 在在Explorer窗口中可以看到一个名为窗口中可以看到一个名为work的的SAS数据数据 库,主要存放库,主要存放SAS临时数据集。创建时可以用两水平临时数据集。创建时可以用两水平 命名方式:如命名方式:如work.数据集名数据集名,也可以用,也可以用一水平的命一水平的命 名方式名方式:如:如数据集名。数据集名。 24 二、临时二、临时SAS数据集和永久数据集和永久SAS数据集数据集 永久性数据集永久性数据集储存在硬盘里,因此,在以后的每一次储存在硬盘里,因此,在以后的每一次 SAS会话中都可以在打开。在创
22、建和使用会话中都可以在打开。在创建和使用SAS永久性永久性 数据集之前,需要先建立一个数据集之前,需要先建立一个SAS数据库来制定永久数据库来制定永久 数据集存放的路径。一个数据集存放的路径。一个SAS数据库相当于硬盘上的数据库相当于硬盘上的 一个文件夹,可以将一个文件夹,可以将SAS数据集写入或读出。数据集写入或读出。 命名永久性数据集时必须用命名永久性数据集时必须用两水平的命名方式两水平的命名方式,即,即数数 据库名据库名.数据集名数据集名,数据库名实际是一个,数据库名实际是一个SAS数据库的数据库的 逻辑名。逻辑名。 第二章第二章 建立建立SASSAS数据集数据集 25 例例2_2 SA
23、S程序举例程序举例 libname tj d:user; /*创建名为tj的sas数据库*/ data tj.sas2_2; /*创建永久性数据集sas2_2,保存在d:user 下*/ Input id name$ height weight; bmi=weight/height*2; cards; 1 Judy 1.56 45 2 Lucy 1.67 53 ; run; proc print data=tj.sas2_2; /*将保存在d:user的数据 集sas2_2显示输出到output窗口*/ run; 第二章第二章 建立建立SASSAS数据集数据集 26 第二章第二章 建立建立SA
24、SSAS数据集数据集 第二节第二节 SAS数据集的建立数据集的建立 一、用数据步创建一、用数据步创建SAS数据集数据集 创建创建SAS数据集最主要的方式是使用数据集最主要的方式是使用Base SAS中的数据步。中的数据步。 一个一个SAS数据步由数据步由data语句开始,后面接着其他程序语句,语句开始,后面接着其他程序语句, 通过从原始数据文件中读入数据或对已存在的通过从原始数据文件中读入数据或对已存在的SAS数据集进数据集进 行操作来建立新的行操作来建立新的SAS数据集。在数据集。在SAS程序中,用户可以使程序中,用户可以使 用不同的来源输入数据。常用的数据输入来源包括用不同的来源输入数据。
25、常用的数据输入来源包括: (1)原始数据以数据流的方式;)原始数据以数据流的方式; (2)原始数据以外部文件的方式;)原始数据以外部文件的方式; (3)已经存在的)已经存在的SAS数据集;数据集; (4)通过程序语句来建立数据集。)通过程序语句来建立数据集。 27 1、从数据流中读入数据、从数据流中读入数据 在在SAS程序中,用程序中,用cards语句定义数据流的开始。语句定义数据流的开始。 Input语句用于从数据流中读入数据。语句用于从数据流中读入数据。 28 例例2.3 从数据流读入数据建立数据集从数据流读入数据建立数据集 data sas2_3; /*创建名为sas2_3的SAS数据集
26、*/ Input id name$ height weight; /*从数据流中读入数据*/ cards; 1 Judy 156 45 2 Lucy 167 53 3 Susan 165 55 4 tony 178 70 ; run; /*数据步结束*/ proc print data=sas2_3; /*显示输出sas2_3数据集到output 窗口*/ run; /*过程步结束*/ 29 2、从外部文件中读入数据、从外部文件中读入数据 Infile语句用来指定外部文件,通常外部文件并不是语句用来指定外部文件,通常外部文件并不是 SAS文件。用文件。用input语句将外部文件中的数据读入语句
27、将外部文件中的数据读入 SAS中建立中建立SAS数据集。外部文件中的记录可以按数据集。外部文件中的记录可以按 一个变量一列的方式排列,也可以没用格式,不安一个变量一列的方式排列,也可以没用格式,不安 列方式排列。列方式排列。 30 例例2.4 从外部文件读入数据从外部文件读入数据 外部文本文件外部文本文件k:userstudent.txt 1 Judy 1.56 45 2 Lucy 1.67 53 3 Susan 1.65 55 4 tony 1.78 70 SAS程序:程序: Data sas2_4; Infile d:userstudent.txt; /*指定外部文件*/ Input id
28、 name$ height weight; /*从外部文件中读取记录*/ Run; Proc print data=sas2_4; Run; 31 3、从、从SAS数据集中读入数据数据集中读入数据 用用set语句可以从已有的语句可以从已有的SAS数据集中创建新的数据集。数据集中创建新的数据集。 运行运行set语句,语句,SAS会从已有的会从已有的SAS数据集中读入观数据集中读入观 测,包括原始数据集中的所有变量,还可以在原数测,包括原始数据集中的所有变量,还可以在原数 据集变量基础上创建新的变量。据集变量基础上创建新的变量。 32 例例2.5 从已有的从已有的SAS数据集中读入数据数据集中读入
29、数据 Data sas2_5; set sas2_4; /*从已有的数据集sas2_4中读入数据*/ Bmi=weight/height*2; /*生成一个新变量*/ Run; Proc print data=sas2_5; Run; 33 例例2.6 利用程序语句建立利用程序语句建立SAS数据集数据集 Data sas2_6; Do i=1 to 10; /*do与end语句之间的语句被重复执行10次*/ Y=rannor(2008); /*产生来自标准正态分布的随机数*/ Output; End; Proc print data=sas2_6; Run; 4、利用程序语句建立、利用程序语句
30、建立SAS数据集数据集 34 SAS中中Import/Export向导可用于将其他类向导可用于将其他类 型的文件,如型的文件,如Excel、Access、dBase、文、文 本文件等转为本文件等转为SAS数据集。在数据集。在file菜单下点菜单下点 击击import/export,按向导指示操作即可。,按向导指示操作即可。 二、二、Import/Export向导创建向导创建SAS数据集数据集 35 第三节第三节 SASSAS数据集的修改数据集的修改 例例2.7 按观测连接按观测连接SAS数据集数据集 IdnameSexheightweight 4Tonymale17870 5Tommale17
31、065 IdnameSexheigh t weight 1Judyfemale15645 2Lucyfemale16753 3Susanfemale16555 female male 需要连接的SAS数据集 一、一、SAS数据集的合并数据集的合并 1、按观测连接、按观测连接SAS数据集数据集 36 第三节第三节 SASSAS数据集的修改数据集的修改 例例2.7 连接连接SAS数据集的例子数据集的例子 Data sas2_7; Set tj.female tj.male; Run; Proc print data=sas2_7; Run; 使用使用set语句可以将两个或多个数据集按观测连成一语句
32、可以将两个或多个数据集按观测连成一 个大的数据集,这也是将新变量追加已有数据集上个大的数据集,这也是将新变量追加已有数据集上 的一种方式。的一种方式。 37 第三节第三节 SASSAS数据集的修改数据集的修改 例例2.8 一对一匹配合并一对一匹配合并SAS数据集数据集 Idheightweight 115645 216753 316555 IdnameSexAge 1Judyfemale21 2Lucyfemale22 3Susanfemale19 student1student2 需要连接的SAS数据集 语句语句merge可以合并两个或多个数据集中的变量,这可以合并两个或多个数据集中的变量,
33、这 些数据集中的观测是一一对应的。些数据集中的观测是一一对应的。 2、按变量合并、按变量合并SAS数据集数据集 38 第三节第三节 SASSAS数据集的修改数据集的修改 例例2.8 按变量合并按变量合并SAS数据集数据集 Data sas2_8; Merge student1 student2; Run; Proc print data=sas2_8; Run; 39 第三节第三节 SASSAS数据集的修改数据集的修改 例例2.9 利用程序语句建立利用程序语句建立SAS数据集数据集 Idheightweight 115645 216753 417870 517765 IdnameSexAge
34、1Judyfemale21 2Lucyfemale22 3Susanfemale19 student3 student4 需要连接的SAS数据集 如果需要合并的数据集中的观测并不是一一对应的关系,则需如果需要合并的数据集中的观测并不是一一对应的关系,则需 要用要用by语句指定各数据集中用于匹配观测的变量。(使用语句指定各数据集中用于匹配观测的变量。(使用by语语 句之前,需要先对关键字段进行排序。句之前,需要先对关键字段进行排序。 40 第三节第三节 SASSAS语言的语句和程序语言的语句和程序 例例2.9 按变量合并按变量合并SAS数据集数据集 Proc sort data student3
35、;by id; Proc sort data student4;by id; Data sas2_9; Merge student3 student4; Run; Proc print data=sas2_9; Run; 41 第三节第三节 SASSAS语言的语句和程序语言的语句和程序 如果只想保留数据集中的部分观测,有两种如果只想保留数据集中的部分观测,有两种 方式建立哑集。方式建立哑集。 第一种可以用第一种可以用if 条件语句告诉条件语句告诉SAS需要保留需要保留 符合条件的观测;另一种用符合条件的观测;另一种用ifthan delete 语句告诉语句告诉SAS将不符合条件的观测删除。将不
36、符合条件的观测删除。 二、建立二、建立SAS数据集的哑集数据集的哑集 1、删除观测、删除观测 42 第三节第三节 SASSAS语言的语句和程序语言的语句和程序 例例2.10 删除观测的例子删除观测的例子 IdnameSexAgeheightweight 1Judyfemale2115645 2Lucyfemale2216753 3Susanfemale1916555 4TonyMale2317870 5Tommale2517765 student 43 第三节第三节 SASSAS语言的语句和程序语言的语句和程序 例例2.10 程序程序1 Data sas2_10; Set student; I
37、f sex=female; Run; Proc print data=sas2_10; Run; 44 第三节第三节 SASSAS语言的语句和程序语言的语句和程序 例例2.10 程序程序2 Data sas2_10; Set student; If sex=female then delete; Run; Proc print data=sas2_10; Run; 45 第三节第三节 SASSAS语言的语句和程序语言的语句和程序 有时并不需要数据集中的所有变量,可以有时并不需要数据集中的所有变量,可以 用用drop或或keep语句来删除或保留数据集语句来删除或保留数据集 中的变量,注意同一个数
38、据步中中的变量,注意同一个数据步中drop和和 keep语句不能同时出现。语句不能同时出现。 2、删除变量、删除变量 46 第三节第三节 SASSAS语言的语句和程序语言的语句和程序 例例2.11 程序程序1 Data sas2_11; Set student; Keep id name sex age; Run; Proc print data=sas2_11; Run; 删除变量的例子,仅保留数据集删除变量的例子,仅保留数据集student中的部分变量中的部分变量 (id,name,sex,age)。可以用下面两个)。可以用下面两个SAS程序。程序。 47 第三节第三节 SASSAS语言的
39、语句和程序语言的语句和程序 例例2.11 程序程序2 Data sas2_11; Set student; Drop height weight; Run; Proc print data=sas2_11; Run; 48 例例3.1 抽样调查某地抽样调查某地120名名1835岁健康男性居民血岁健康男性居民血 清铁含量(清铁含量(mol/L),数据如下。试编制此血清铁资),数据如下。试编制此血清铁资 料的频数分布表并描述该资料。料的频数分布表并描述该资料。 第三章第三章 常用统计描述常用统计描述 7.42 8.65 23.02 21.61 21.31 21.46 9.97 22.73 14.9
40、4 20.18 21.62 23.07 20.38 8.40 17.32 29.64 19.69 21.69 23.90 17.45 19.08 20.52 24.14 23.77 18.36 23.04 24.22 24.13 21.53 11.09 18.89 18.26 23.29 17.67 15.38 18.61 14.27 17.40 22.55 17.55 16.10 17.98 20.13 21.00 14.56 19.89 19.82 17.48 14.89 18.37 19.50 17.08 18.12 26.02 11.34 13.81 10.25 15.94 15.83
41、 18.54 24.52 19.26 26.13 16.99 18.89 18.46 20.87 17.51 13.12 11.75 17.40 21.36 17.14 13.77 12.50 20.40 20.30 19.38 23.11 12.67 23.02 24.36 25.61 19.53 14.77 14.37 24.75 12.73 17.25 19.09 16.79 17.19 19.32 19.59 19.12 15.31 21.75 19.47 15.51 10.86 27.81 21.65 16.32 20.75 22.11 13.17 17.55 19.26 12.65
42、 18.48 19.83 23.12 19.22 19.22 16.72 27.90 11.74 24.66 14.18 16.52 49 第三章第三章 常用统计描述常用统计描述 一、定量资料的统计描述一、定量资料的统计描述 1、定量资料的频数表、定量资料的频数表 l先用先用MEANS过程找出最大值和最小值过程找出最大值和最小值 MIN=7.42 MAX=29.64 RANGE=22.22 l确定组距确定组距(I=2)和第一组段的下限和第一组段的下限(L=7) l然后建立新变量(然后建立新变量(x0),将变量),将变量X转化为该数据所在组段的下限值转化为该数据所在组段的下限值 赋值新的变量:赋
43、值新的变量:x0=INT(X-L)/I)*I+L 或:或:x0=x-mod(x-L,I) 或:x0=I*INT(x/I)+I/2 l用用FREQ过程作频数表:过程作频数表: proc freq; tables x0; Run; 50 第三章第三章 常用统计描述常用统计描述 2、简单描述简单描述:MEANS过程 输出样本含量、均数、标准差、最小值、最大值 ( N、Mean、Std Dev、Minimum、Maximum) 3、详细描述详细描述:UNIVARIATE过程 输出更多指标:样本含量、均数、标准差、最小值、最大值、 方差、标准误 、中位数、四分位数间距、常用百分位数、 众数、平方和、离均
44、差平方和等,可以作正态性检验 另外还显示原数据中的部分极端值 51 第三章第三章 常用统计描述常用统计描述 PROC MEANS; CLASS SEX; VAR HEIGHT WEIGHT; RUN; CLASS 指定分组变量(可以不写)指定分组变量(可以不写) VAR 指定需要分析的变量指定需要分析的变量(不写即分析全部变量)不写即分析全部变量) MAXDEC=n 指定计算结果保留小数位数指定计算结果保留小数位数(默认默认2位位) 可加的选项有:标准误(StdErr)、方差(Var)、总和(Sum)、平方 和(USS)、离均差平方和(CSS)、全距(Range)、变异系数 (CV)、偏度系数
45、(Skewness)、峰度系数(Kurtosis)、可信区间 (CLM)等 还可以计算总体均数=0的 t 检验(T、Prt) 不加任何选项时,自动输出5项结果: N、Mean、Std Dev、Minimum、Maximum 52 第三章第三章 常用统计描述常用统计描述 Data sas3_1;Input x; Gr=2; x0=gr*int(x/gr)+gr/2; /*计算组中值计算组中值X0*/ Cards; 7.42 8.65 23.02 21.6124.66 14.18 16.52 ; proc freq data=sas3_1; Tables x0/out=iron; /*out=ir
46、on表示输出变量为X0的一维频数分布表*/ Proc univariate data =sas3_1;Var x; Histogram x/midpoints=7 to 29 by 2; /*组中值的取值范围从729,组距为2*/ Run; Proc means data=sas3_1;Var x; Run; 53 第三章第三章 常用统计描述常用统计描述 例例3.2随机抽取随机抽取15名学生,记录他们的性别(名学生,记录他们的性别(sex)、年龄、年龄 (age)、体重()、体重(w,kg)、和身高()、和身高(h,cm),求:),求: (1)按性别分组分别计算学生们身高和体重的均数、标准)按
47、性别分组分别计算学生们身高和体重的均数、标准 差、变异系数、中位数和差、变异系数、中位数和P50。 (2)计算学生身高)计算学生身高95%可信区间。要求结果保留小数点后可信区间。要求结果保留小数点后3 位。位。 F 15 46 156 f 14 41 149 f 18 65 165 m 15 50 160 m 13 48 155 m 18 70 180 m 14 38 150 m 16 55 165 m 17 68 176 m 16 60 170 f 17 50 160 f 17 58 160 f 16 60 165 m 17 65 175 f 18 61 162 54 Data sas3_2
48、; Input sex$ age w h ; Cards; f 15 46 156 f 14 41 149 f 18 65 165 m 15 50 160 m 13 48 155 m 18 70 180 m 14 38 150 m 16 55 165 m 17 68 176 m 16 60 170 f 17 50 160 f 17 58 160 f 16 60 165 m 17 65 175 f 18 61 162 ; Proc means data=sas3_2 mean std cv median p50 clm maxdec=3; /*选项maxdec指小数点后保留的位数*/ Var h
49、 w; Class sex; Run; 55 第三章第三章 常用统计描述常用统计描述 例例3.3 对对40名麻疹易感儿童接种麻疹疫苗一个月后,名麻疹易感儿童接种麻疹疫苗一个月后, 测得其血凝抑制抗体滴度如下,求其平均滴度。测得其血凝抑制抗体滴度如下,求其平均滴度。 56 Data sas3_3; /*计算几何均数计算几何均数*/ Input f x ; Y=log10(x); Cards; 1 4 5 8 6 16 2 32 7 64 10 128 4 256 5 512 ; Proc means noprint; /*选项noprint表示不打印程序运行结果*/ Var y; Freq f;
50、 Output out=b mean=my; /*选项out=b和mean=my表示把该过程步运行所得均数叫my,并 放入数据集b中*/ Data c; Set b; mx=10*my; Proc print data=c; Var mx; Run; 57 二、定性资料统计描述二、定性资料统计描述 FREQ 过程过程 可以产生频数表和 n 维列联表 PROC FREQ;TABLES A ;RUN; TABLES 指定要分析的定性变量 TABLES A 产生一维频数表 TABLES A*B 产生二维列联表(A是行B是列) TABLES A*B*C 产生三维列联表 (A是分层,B是行,C是列) T
51、ABLES A*(B C) 产生A*B、A*C两个二维表 TABLES X1-X3 产生X1、X2、X3三个一维表 TABLES (X1-X4)*Y 产生X1*Y X2*Y X3*Y X4*Y四个二维表 第三章第三章 常用统计描述常用统计描述 58 如描述以下三个定性变量(如描述以下三个定性变量(258人)人) A文化程度(文化程度(1=文盲文盲2=初中以下初中以下3=高中高中4=大学)大学) B工作强度(工作强度(1=轻轻 2=中中 3=重)重) C月收入月收入 (1=11 THEN G=2; ELSE G=1; CARDS; 0.84 1.05 1.20 1.20 1.39 1.53 1.
52、67 1.80 1.87 2.07 2.11 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87 ; PROC TTEST; CLASS G; VAR X; RUN; 70 两样本均数比较用两样本均数比较用TTEST过程(方式二)过程(方式二) DATA sas4_4; INPUT X g; CARDS; 0.84 1 1.05 1 1.20 1 1.20 1 1.39 1 1.53 1 1.67 1 1.80 1 1.87 1 2.07 1 2.11 1 0.54 2 0.64 2 0.64 2 0.75 2 0.
53、76 2 0.81 2 1.16 2 1.20 2 1.34 2 1.35 2 1.48 2 1.56 2 1.87 2 ; PROC TTEST; CLASS g; VAR X; RUN; 71 结果:结果: Statistics Lower CL Upper CL Lower CL Upper CL Variable G N Mean Mean Mean Std Dev Std Dev Std Dev Std Err X 13 0.8295 1.0846 1.3397 0.3027 0.4221 0.6969 0.1171 1 X 11 1.2375 1.5209 1.8043 0.294
54、7 0.4218 0.7402 0.1272 2 X Diff (1-2) -0.795 -0.436 -0.078 0.3264 0.422 0.5973 0.1729 T-Tests Variable Method Variances DF t Value Pr |t| X Pooled Equal 22 -2.52 0.0193 X Satterthwaite Unequal 21.4 -2.52 0.0196 Equality of Variances Variable Method Num DF Den DF F Value Pr F X Folded F 12 10 1.00 1.
55、0000 72 两大样本均数比较时,如只有均数标准差,而无原始两大样本均数比较时,如只有均数标准差,而无原始 数据时,无法直接调用数据时,无法直接调用SAS软件中的某个过程进行分软件中的某个过程进行分 析,只能在数据步中按照计算公式编写程序完成。析,只能在数据步中按照计算公式编写程序完成。 调查健康人群红细胞数 (1012/L)资料如下: 男性360人,均数466.02,标准差57.46; 女性255人,均数417.80,标准差29.10。 试比较男女红细胞数有无差别? (方式三) 73 DATA BB; INPUT N1 X1 S1 N2 X2 S2; SE=SQRT(S1*S1/N1+S2
56、*S2/N2); U=ABS(X1-X2)/SE; P1=1-PROBNORM(U); P=2*P1; U=ROUND(U,0.001); P=ROUND(P,0.00001); IF P22表作表作Fisher确切概率确切概率 EXPECTED可以显示每个格子的理论值可以显示每个格子的理论值 CMH可以计算队列研究和病例对照研究的可以计算队列研究和病例对照研究的RR值值 NOROW、NOCOL、NOPERCENT 不显示相应百分不显示相应百分 数数 NOPRINT 不显示表格,只显示计算的统计量不显示表格,只显示计算的统计量 97 例例6-2 某医师为研究乙肝免疫球蛋白预防胎儿宫内某医师为研
57、究乙肝免疫球蛋白预防胎儿宫内 感染感染HBV的效果,将的效果,将33例例HBsAg阳性孕妇随机分为阳性孕妇随机分为 预防注射组和非预防组,结果见表预防注射组和非预防组,结果见表7-4。问两组新生。问两组新生 儿的儿的HBV总体感染率有无差别?总体感染率有无差别? 组别组别阳性阳性阴性阴性合计合计 感染率感染率 (%) 预防注射组预防注射组4182218.18 非预防组非预防组5(3)61145.45 合计合计9243327.27 四格表确切概率法四格表确切概率法 98 第六章第六章 2 2 检验 检验 data sas6_2; input r c f ; cards; 1 1 4 1 2 18
58、 2 1 5 2 2 6 ; proc freq; weight f; tables r*c/chisq expected; run; 99 例例6-3 某实验室分别用乳胶凝集法和免疫荧光法对某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统名可疑系统 红斑狼疮患者血清中抗核抗体进行测定,结果见表红斑狼疮患者血清中抗核抗体进行测定,结果见表7-3。问两种。问两种 方法的检测结果有无差别?方法的检测结果有无差别? 第六章第六章 2 2 检验 检验 二、配对四格表的二、配对四格表的2 检验检验 免疫荧光法免疫荧光法 乳胶凝集法乳胶凝集法 合计合计 11(a)12(b)23 2(c)33(d)35
59、 合计合计134558 100 data sas6_3; input r c f ; cards; 1 1 11 1 2 12 2 1 2 2 2 33 ; proc freq; weight f; tables r*c/chisq agree; run; 第六章第六章 2 2 检验 检验 二、配对四格表的二、配对四格表的2 检验(方法一:适合检验(方法一:适合b+c40) Tables r*c/agree 对列联表作 MCNemar检验和 一致性检验 101 DATA b; INPUT f11 f12 f21 f22; IF f12+f2140 THEN chisq=(ABS(f12-f21
60、)-1)*2/(f12+f21); ELSE chisq=ABS(f12-f21)*2/(f12+f21); p=1-PROBCHI(chisq,1); CARDS; 11 12 2 33 ; PROC PRINT data=b; RUN; 第六章第六章 2 2 检验 检验 二、配对四格表的二、配对四格表的2 检验(方法二)检验(方法二) 102 疗法 有效 无效 合计 有效率(%) 物理疗法组 199 7 206 96.60 药物治疗组 164 18 182 90.11 外用膏药组 118 26 144 81.94 合计 481 51 532 90.41 例6-4 某医师研究物理疗法、药物治
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论