第三章区间估计与假设检验PPT课件_第1页
第三章区间估计与假设检验PPT课件_第2页
第三章区间估计与假设检验PPT课件_第3页
第三章区间估计与假设检验PPT课件_第4页
第三章区间估计与假设检验PPT课件_第5页
已阅读5页,还剩85页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 2021/6/71 第三章 区间估计与假设检验 n3.1 区间估计与假设检验的基本概念区间估计与假设检验的基本概念 n3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现 n3.3 总体比例的区间估计与假设检验的总体比例的区间估计与假设检验的SAS实现实现 n3.4 总体方差的区间估计与假设检验的总体方差的区间估计与假设检验的SAS实现实现 n3.5 分布检验分布检验 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 2021/6/72 n3.1 3.

2、1 区间估计与假设检验的基本概念区间估计与假设检验的基本概念 n3.1.1 区间估计区间估计 n3.1.2 假设检验假设检验 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 3.1.1 区间估计区间估计 1. 1. 点估计和区间估计点估计和区间估计 参数的估计方法主要有两种:点估计和区间估计。参数的估计方法主要有两种:点估计和区间估计。 点估计是用样本的观测值估计总体未知参数的值。由点估计是用样本的观测值估计总体未知参数的值。由 于样本的随机性,不同样本观测值计算得出的参数的估于样本的随机性,不同样本观测值计算得出的参数的估 计值间存在着差异,因此常用一个区间

3、估计总体的参数,计值间存在着差异,因此常用一个区间估计总体的参数, 并把具有一定可靠性和精度的估计区间称为置信区间。并把具有一定可靠性和精度的估计区间称为置信区间。 利用构造的统计量及样本观测值,计算得出参数的置信利用构造的统计量及样本观测值,计算得出参数的置信 区间的方法称为参数的区间估计。区间的方法称为参数的区间估计。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 2. 2. 参数的置信区间参数的置信区间 在区间估计中,对于总体的未知参数在区间估计中,对于总体的未知参数,需要求出两,需要求出两 个统计量个统计量1(X1,X2,.,Xn)和和2(X1,X2

4、,.,Xn)来分来分 别估计总体参数别估计总体参数的上限和下限,使得总体参数在区间的上限和下限,使得总体参数在区间 (1,2)内的概率为)内的概率为 P1 2 = 1 其中其中1 称为置信水平,而称为置信水平,而(1,2)称为称为的置信区间,的置信区间, 1,2分别称为置信下限和置信上限。置信水平为分别称为置信下限和置信上限。置信水平为1 的的 含义是随机区间含义是随机区间(1,2)以以1 的概率包含了参数的概率包含了参数。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 3. 3. 正态总体均值和方差的置信区间正态总体均值和方差的置信区间 参数的区间估计大多

5、是对正态总体的参数进行估计,参数的区间估计大多是对正态总体的参数进行估计, 如对单总体均值、方差的估计、两总体均值差的估计和如对单总体均值、方差的估计、两总体均值差的估计和 两总体方差比的估计等。两总体方差比的估计等。 正态总体参数的各种置信区间见表正态总体参数的各种置信区间见表3-1。 )1 ,0( N n X Z n ZX n ZX 22 , ) 1( nt nS X t ) 1(),) 1( 22 n S ntX n S ntX )( 2 1 2 2 n X n i i )( )( , )( )( 2 21 1 2 2 2 1 2 n X n X n i i n i i ) 1( ) 1

6、( 2 1 2 2 2 2 n XXSn n i i ) 1( )( , ) 1( )( 2 21 1 2 2 2 1 2 n XX n XX n i i n i i 被估参数条件枢轴量及其分布参数的置信区间 单 正 态 总 体 2已知 2未知 2 已知 未知 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 正态总体参数的各种置信区间见表正态总体参数的各种置信区间见表3-1。 )1 ,0( )( 2 2 21 2 1 21 N nn YX Z 2 2 21 2 12 nnZYX )2( 11 )( 21 21 21 nnt nnS YX t w 2 ) 1()

7、 1( 21 2 22 2 11 nn SnSn Sw 21212 11)2(nnSnntYX w 2 2 2 1 ) 1, 1( 21 2 2 2 1 2 2 2 1 nnF SS F ) 1, 1( 1 , ) 1, 1( 1 2121 2 2 2 1 212/ 2 2 2 1 nnFS S nnFS S 其中 被估参数条件枢轴量及其分布参数的置信区间 两 正 态 总 体 1 - 2 两样本 独立, 12, 22 已知 两样本 独立, 12= 22 = 2 未 知 两样本 独立, 1, 2 未知 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 4. 4.

8、总体比例与比例差的置信区间总体比例与比例差的置信区间 实际应用中经常需要对总体比例进行估计,如产品的实际应用中经常需要对总体比例进行估计,如产品的 合格率、大学生的就业率和手机的普及率等。记合格率、大学生的就业率和手机的普及率等。记和和P分分 别表示总体比例和样本比例,则当样本容量别表示总体比例和样本比例,则当样本容量n很大时很大时 (一般当(一般当nP和和n(1 P)均大于均大于5时,就可以认为样本容量时,就可以认为样本容量 足够大),样本比例足够大),样本比例P的抽样分布可用正态分布近似。的抽样分布可用正态分布近似。 总体比例与比例差的置信区间如表总体比例与比例差的置信区间如表3-2所示。

9、所示。 ),( 近似 10 )1 ( N n PP P Z n PP ZP )1 ( 2 ),( 近似 10 )1 ()1 ( )()( 222111 2121 N nn PP z 2 22 1 11 221 )1()1( )( n PP n PP ZPP 待估参数枢轴量及其分布参数的置信区间 总体 比例 两总 体比 例差 1-2 其中P1,P2为两个样本比例 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 3.1.2 假设检验假设检验 1. 1. 假设检验的基本原理假设检验的基本原理 对总体参数进行假设检验时,首先要给定一个原假设对总体参数进行假设检验时,首

10、先要给定一个原假设 H0,H0是关于总体参数的表述,与此同时存在一个与是关于总体参数的表述,与此同时存在一个与 H0相对立的备择假设相对立的备择假设H1,H0与与H1有且仅有一个成立;有且仅有一个成立; 经过一次抽样,若发生了小概率事件(通常把概率小于经过一次抽样,若发生了小概率事件(通常把概率小于 0.05的事件称为小概率事件),可以依据的事件称为小概率事件),可以依据“小概率事件小概率事件 在一次实验中几乎不可能发生在一次实验中几乎不可能发生”的理由,怀疑原假设不的理由,怀疑原假设不 真,作出拒绝原假设真,作出拒绝原假设H0,接受,接受H1的决定;反之,若小的决定;反之,若小 概率事件没有

11、发生,就没有理由拒绝概率事件没有发生,就没有理由拒绝H0,从而应作出拒,从而应作出拒 绝绝H1的决定。的决定。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 2. 2. 假设检验的步骤假设检验的步骤 1) 根据问题确立原假设根据问题确立原假设H0和备选假设和备选假设H1; 2) 确定一个显著水平确定一个显著水平 ,它是衡量稀有性(小概率事,它是衡量稀有性(小概率事 件)的标准,常取为件)的标准,常取为0.05; 3) 选定合适的检验用统计量选定合适的检验用统计量W(通常在原假设中相等(通常在原假设中相等 成立时,成立时,W的分布是已知的),根据的分布是已知的

12、),根据W的分布及的分布及 的值,的值, 确定确定H0的拒绝域。的拒绝域。 4) 由样本观测值计算出统计量由样本观测值计算出统计量W的观测值的观测值W0,如果,如果 W0落入落入H0的拒绝域,则拒绝的拒绝域,则拒绝H0;否则,不能拒绝原假;否则,不能拒绝原假 设设H0。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 注意:在注意:在SAS系统中,是由样本观测值计算出统计量系统中,是由样本观测值计算出统计量 W的观测值的观测值W0和衡量观测结果极端性的和衡量观测结果极端性的p值(值(p值就是当值就是当 原假设成立时得到样本观测值和更极端结果的概率),原假设成立

13、时得到样本观测值和更极端结果的概率), 然后比较然后比较p和和 作判断:作判断:p ,拒绝原假设,拒绝原假设H0;p ,不,不 能拒绝原假设能拒绝原假设H0。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 p值通常由下面公式计算而得到。值通常由下面公式计算而得到。 p = P|W| |W0| = 2 P W |W0| (拒绝域为两边对称的区域时)(拒绝域为两边对称的区域时) p = minPW W0,PW W0 (拒绝域为两边非对称区域时)(拒绝域为两边非对称区域时) p = PW W0 (拒绝域为右边区域时)(拒绝域为右边区域时) p = PW W0 (拒

14、绝域为左边区域时)(拒绝域为左边区域时) 只需根据只需根据SAS计算出的计算出的p值,就可以在指定的显著水值,就可以在指定的显著水 平下,作出拒绝或不能拒绝原假设的决定。平下,作出拒绝或不能拒绝原假设的决定。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 3. 3. 正态总体均值和方差的假设检验正态总体均值和方差的假设检验 对正态总体的参数进行假设检验是假设检验的重要内对正态总体的参数进行假设检验是假设检验的重要内 容,如对单总体均值、方差的检验、两总体均值之差的容,如对单总体均值、方差的检验、两总体均值之差的 检验和两总体方差比的检验等。正态总体参数的各种

15、检检验和两总体方差比的检验等。正态总体参数的各种检 验方法见下表验方法见下表3-3至表至表3-5。 表3-3 单正态总体N(,2)均值的检验法 2 n X Z 0 2 nS X t 0 检验名称条件检验类别H0H1检验统计量分布拒绝域 Z检验已知 双边检验 = 0 0 N(0,1) | Z | Z/2 左边检验 0 0Z Z t检验未知 双边检验 = 0 0 t(n 1) | t | t/2(n 1) 左边检验 0 0t t(n 1) STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 表3-4 单正态总体N(,2)方差2的检验法 2 0 2 2 0 2 n i

16、i X 1 2 0 2 )( 2 n )( 2 21 2 n )( 2 2 2 n 2 0 2 2 0 2 )( 2 1 2 n 2 0 2 2 0 2 )( 22 n 2 0 2 2 0 2 n i i XX Sn 1 2 0 . 2 0 2 2 ) 1( ) 1( 2 n ) 1( 2 21 2 n ) 1( 2 2 2 n 2 0 2 2 0 2 ) 1( 2 1 2 n 2 0 2 2 0 2 ) 1( 22 n 或 检验 名称 条件 检验 类别 H0H1检验统计量分布拒绝域 2检 验 已 知 双边 检验 左边 检验 右边 检验 未 知 双边 检验 左边 检验 右边 检验 STATST

17、ATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 表3-5 两正态总体的均值差与方差比的检验 21 11nnS YX t w 2 ) 1() 1( 21 2 22 2 11 nn SnSn Sw )2( 212 nntt )2( 21 nntt )2( 21 nntt nS d t d ) 1( nt ) 1( 2 ntt ) 1( ntt ) 1( ntt 1/ 2 2 2 1 1/ 2 2 2 1 2 2 2 1 SSF ) 1, 1( 212/1 nnFF ) 1, 1( 212/ nnFF 1/ 2 2 2 1 1/ 2 2 2 1 ) 1, 1( 211 nnFF

18、 1/ 2 2 2 1 1/ 2 2 2 1 ) 1, 1( 21 nnFF 名 称 条件类别H0H1检验统计量分布拒绝域 Z检 验 两样本 独立, 12=22= 2未知 双边检验1-2=01-20 t(n1 + n2 2)左边检验1-201-20 t检 验 成对匹 配样本, 12,22 未知 双边检验 d=0d0 左边检验 d0d0 F检 验 两样本 独立, 1, 2 未知 双边检验 F(n11,n21) 左边检验 右边检验 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 4. 4. 总体比例与比例差的检验总体比例与比例差的检验 当样本容量当样本容量n很大时

19、,可根据表很大时,可根据表3-6对总体比例与比例对总体比例与比例 差进行假设检验。差进行假设检验。 表3-6 总体比例与比例差的检验 n P z )1 ( 00 0 222111 21 )1 ()1 (nPPnPP PP z 检验名称检验类别H0H1 检验统计量分布拒绝域 比例检验 双边检验 = 0 0 N(0,1) | z | z/2 左边检验 0 0| z | z 两总体比例差检 验 双边检验1 = 21 2 N(0,1) | z | z/2 左边检验1 21 2| z | z STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 2021/6/716 n3.2

20、 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的 SASSAS实现实现 n3.2.1 使用使用INSIGHT模块模块 n3.2.2 使用使用“分析家分析家” n3.2.3 使用使用TTEST过程过程 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 3.2.1 使用使用INSIGHT模块模块 1. 1. 总体均值的区间估计总体均值的区间估计 【例【例3-1】某药材生产商要对其仓库中的】某药材生产商要对其仓库中的1000箱药材的箱药材的 平均重量进行估计,药材重量的总体方差未知,随机抽平均重量进行估计,药材重量的总体方差未知,随机抽 取取16

21、箱样本称重后结果如表箱样本称重后结果如表3-7所示。所示。 表3-7 16箱药材重量(单位:千克) 设药材重量数据存放于数据集设药材重量数据存放于数据集Mylib.yczl中,其中重中,其中重 量变量名为量变量名为weight。求该仓库中每箱药材平均重量在。求该仓库中每箱药材平均重量在 95%置信水平下的置信区间。置信水平下的置信区间。 5050565149534752 5353495355485055 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 步骤如下:步骤如下: 1) 启动启动INSIGHT模块,并打开数据集模块,并打开数据集Mylib.yczl;

22、2) 选择菜单选择菜单“Analyze”“Distribution(Y)”; 3) 在打开的在打开的“Distribution(Y)”对话框中进行区间估计对话框中进行区间估计 的设置(如图)。的设置(如图)。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 结果包括一个名为结果包括一个名为“95Confidence Intervals(95% 置信区间)置信区间)”的列表,表中给出了均值、标准差、方差的列表,表中给出了均值、标准差、方差 的估计值(的估计值(Parameter)、置信下限()、置信下限(LCL)和置信上)和置信上 限(限(UCL),如图),如图

23、3-2所示。结果表明,根据抽样样本,所示。结果表明,根据抽样样本, 该仓库中药材的平均重量以该仓库中药材的平均重量以95%的可能性位于的可能性位于50.08千千 克至克至52.92千克之间。千克之间。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 2. 2. 单样本总体均值的假设检验单样本总体均值的假设检验 【例【例3-2】一家食品厂以生产袋装食品为主,每天的产】一家食品厂以生产袋装食品为主,每天的产 量大约为量大约为8000袋,每袋重量规定为袋,每袋重量规定为100克。为了分析每克。为了分析每 袋重量是否符合要求,质检部门经常进行抽检。现从某袋重量是否符合

24、要求,质检部门经常进行抽检。现从某 天生产的一批食品中随机抽取了天生产的一批食品中随机抽取了25袋,测得每袋重量如袋,测得每袋重量如 表表3-8所示。所示。 表3-8 25袋食品的重量(单位:克) 试从抽检的样本数据出发,检验变量试从抽检的样本数据出发,检验变量WEIGHT的均值的均值 与与100克是否有显著差异。假定表克是否有显著差异。假定表3-8数据存放在数据集数据存放在数据集 Mylib.spzl中,重量变量名为中,重量变量名为WEIGHT。 112.5101.0103.0102.0100.5102.6107.595.0108.8 115.6100.0123.5102.0101.6102

25、.2116.695.497.8 108.6105.0136.8102.8101.598.493.3 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 设变量设变量WEIGHT的均值为的均值为,问题是希望通过样本数,问题是希望通过样本数 据检验变量据检验变量WEIGHT均值的如下假设:均值的如下假设: H0: = 100,H1: 100。 使用使用INSIGHT对均值进行检验的步骤如下:对均值进行检验的步骤如下: 1) 首先启动首先启动INSIGHT,并打开数据集,并打开数据集Mylib.spzl; 2) 选择菜单选择菜单“Analyze”“Distributio

26、n(Y)”; 3) 在打开的在打开的“Distribution(Y)”对话框中选定分析变量对话框中选定分析变量 WEIGHT; 4) 单击单击“OK”按钮,得到变量的描述性统计量;按钮,得到变量的描述性统计量; STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 5) 选择菜单选择菜单“Tables(表)(表)”“Tests for Location (位置检验)(位置检验)”;在弹出的;在弹出的“Tests for Location”对话框对话框 中输入中输入100,单击,单击“OK”按钮得到输出结果如图所示。按钮得到输出结果如图所示。 STATSTATSTAT

27、STATSASSAS软件与统计应用教程软件与统计应用教程 结果显示,观测值不等于结果显示,观测值不等于100克的观测有克的观测有24个,其中个,其中 19个观测值大于个观测值大于100。 图中第一个检验为图中第一个检验为t检验检验(Students t),需要假定变量,需要假定变量 服从正态分布,检验的服从正态分布,检验的p值为值为0.0105,这个检验在,这个检验在0.05水水 平下是显著的,所以可认为均值与平下是显著的,所以可认为均值与100克有显著差异。克有显著差异。 第二个检验第二个检验(Sign)是叫做符号检验的非参数检验,其是叫做符号检验的非参数检验,其p值值 为为0.0066,在

28、,在0.05水平下也是显著的,结论不变。第三水平下也是显著的,结论不变。第三 个检验个检验(Sgned Rank)是叫做符号秩检验的非参数检验,是叫做符号秩检验的非参数检验, 其其p值为值为0.0048,在,在0.05水平下是显著的,结论不变。水平下是显著的,结论不变。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 3. 3. 两样本总体均值的比较:成对匹配样本两样本总体均值的比较:成对匹配样本 在在INSIGHT中比较成对样本均值是否显著差异,可中比较成对样本均值是否显著差异,可 以计算两变量的差值变量,再检验差值变量的均值是否以计算两变量的差值变量,再检

29、验差值变量的均值是否 显著为显著为0。 【例【例3-3】由】由10名学生组成一个随机样本,让他们分别名学生组成一个随机样本,让他们分别 采用采用A和和B两套试卷进行测试,结果如表两套试卷进行测试,结果如表3-9所示。所示。 表3-9 10名学生两套试卷的成绩 试从样本数据出发,分析两套试卷是否有显著差异。试从样本数据出发,分析两套试卷是否有显著差异。 试卷A78637289914968768555 试卷B71446184745155607739 差值71911517-21316816 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 步骤如下:步骤如下: 1)

30、首先生成差值变量:首先生成差值变量: 启动启动INSIGHT,并打开数据集,并打开数据集Mylib.sjcj。选择菜单。选择菜单 “Edit”“Variables”“Other”,打开,打开“Edit Variables” 对话框,选择对话框,选择A为为Y变量,变量,B为为X变量,然后选择变换变量,然后选择变换 (Transformation):):Y X,如图,生成新的差值变量,如图,生成新的差值变量 d; STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 2) 然后对变量然后对变量d的均值做如下假设:的均值做如下假设: H0:d = 0,H1:d 0。 3)

31、 选择菜单选择菜单“Analyze”“Distribution(Y)”;在打;在打 开的开的“Distribution(Y)”对话框中选定分析变量对话框中选定分析变量:选择变:选择变 量差值量差值d,单击,单击“Y”按钮按钮,将变量,将变量d移到右上方的列表移到右上方的列表 框中;框中; 4) 单击单击“Output”按钮,在打开的对话框中选中按钮,在打开的对话框中选中 “Tests for Location(位置检验)(位置检验)”复选框;复选框; 5) 两次单击两次单击“OK”按钮,得到变量的描述性统计量;按钮,得到变量的描述性统计量; STATSTATSTATSTATSASSAS软件与统

32、计应用教程软件与统计应用教程 6) 选择菜单选择菜单“Tables(表)(表)”“Tests for Location (位置检验)(位置检验)”;在弹出的;在弹出的“Tests for Location”对话框对话框 中输入中输入0,单击,单击“OK”按钮得到输出结果如图所示。按钮得到输出结果如图所示。 结果显示三个检验的结论都是结果显示三个检验的结论都是p值小于值小于0.05,所以应,所以应 拒绝原假设,即总体的均值与拒绝原假设,即总体的均值与0有显著差异。所以两套有显著差异。所以两套 试卷有显著差异。试卷有显著差异。 虽然虽然SAS给出三个检验结果,其实作结论时只需其中给出三个检验结果,

33、其实作结论时只需其中 一个。如果可以认为分析变量服从正态分布只要看一个。如果可以认为分析变量服从正态分布只要看t检检 验结果;否则只须看符号秩检验结果。只有在数据为两验结果;否则只须看符号秩检验结果。只有在数据为两 两比较的大小结果而没有具体数值时符号检验才有用。两比较的大小结果而没有具体数值时符号检验才有用。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 3.2.2 使用使用“分析家分析家” 1. 1. 总体均值的置信区间总体均值的置信区间 【例【例3-4】在】在“分析家分析家”中求例中求例3-1中每箱药材平均重量中每箱药材平均重量 在在95%置信水平下的

34、置信区间。置信水平下的置信区间。 步骤如下:步骤如下: 1) 在在“分析家分析家”模块中打开数据集模块中打开数据集Mylib.yczl; 2) 选择菜单选择菜单“Statistics(统计)(统计)”“Hypothesis Tests(假设检验)(假设检验)”“One Sample t test for a Mean (单样本均值(单样本均值t - 检验)检验)”; 3) 在打开的在打开的“One Sample t test for a Mean”对话框对话框 中设置均值的置信区间(如图中设置均值的置信区间(如图3-6)。)。 STATSTATSTATSTATSASSAS软件与统计应用教程软件

35、与统计应用教程 3) 在打开的在打开的“One Sample t test for a Mean”对话框对话框 中设置均值的置信区间(如图中设置均值的置信区间(如图3-6)。)。 结果表明(下图),根据抽样样本,该仓库中药材的结果表明(下图),根据抽样样本,该仓库中药材的 平均重量以平均重量以95%的可能性位于的可能性位于50.08千克至千克至52.92千克之千克之 间。间。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 2. 2. 单样本总体均值的假设检验单样本总体均值的假设检验 【例【例3-5】使用】使用“分析家分析家”检验例检验例3-2中食品重量是否符

36、中食品重量是否符 合要求。希望通过样本数据检验变量合要求。希望通过样本数据检验变量WEIGHT均值的均值的 如下假设:如下假设: H0: = 100,H1: 100。 由于此时的方差未知,所以使用由于此时的方差未知,所以使用t检验法。步骤如下:检验法。步骤如下: 1) 在在“分析家分析家”中打开数据集中打开数据集Mylib.spzl; 2) 选择菜单选择菜单“Statistics(统计)(统计)”“Hypothesis Tests(假设检验)(假设检验)”“One Sample t test for a Mean (单样本均值(单样本均值t - 检验)检验)”,打开,打开“One Sample

37、 t test for a Mean”对话框;对话框; STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 4)按图按图3-8所示设置均值检验,单击所示设置均值检验,单击“OK”按钮,得按钮,得 到结果如图左所示。;到结果如图左所示。; 显示结果(图右)表明显示结果(图右)表明t统计量的统计量的p值为值为0.01050.05, 所以拒绝原假设,即认为总体的均值不等于所以拒绝原假设,即认为总体的均值不等于100。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 3. 3. 两样本总体均值的比较:成对匹配样本两样本总体均值的比较:成对

38、匹配样本 【例【例3-6】使用】使用“分析家分析家”对例对例3-3中两套试卷检验有无中两套试卷检验有无 显著差异。显著差异。 这是一个(成对匹配)双样本均值检验问题,若这是一个(成对匹配)双样本均值检验问题,若1和和 2分别表示两套试卷的平均成绩,则检验的是:分别表示两套试卷的平均成绩,则检验的是: H0:1 2 = 0,H1:1 2 0; 分析步骤如下:分析步骤如下: 1) 在在“分析家分析家”中打开数据集中打开数据集Mylib.sjdf; 2) 选择菜单选择菜单“Statistics(统计)(统计)”“Hypothesis Tests(假设检验)(假设检验)”“Two Sample Pai

39、red t - Test for a Mean(均值的成对双样本(均值的成对双样本t - 检验)检验)”; STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 3) 在打开的在打开的“Two Sample Paired t - Test for a Mean” 对话框中,按图左所示设置双样本均值检验,单击对话框中,按图左所示设置双样本均值检验,单击 “OK”按钮,得到结果如图右所示按钮,得到结果如图右所示 结果显示,无论两总体的方差是否相等,结果显示,无论两总体的方差是否相等,t统计量的统计量的 p值值 = 0.0005 0.05,所以在,所以在95%的置信水平下

40、,拒绝原的置信水平下,拒绝原 假设,两总体的均值有显著差异。假设,两总体的均值有显著差异。 结果表明可以结果表明可以95%的把握认为两套试卷有显著差异。的把握认为两套试卷有显著差异。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 4. 4. 两样本总体均值的比较:独立样本两样本总体均值的比较:独立样本 【例【例3-7】为估计两种方法组装产品所需时间的差异,】为估计两种方法组装产品所需时间的差异, 分别对两种不同的组装方法各随机安排一些个工人进行分别对两种不同的组装方法各随机安排一些个工人进行 操作试验,每个工人组装一件产品所需的时间如表操作试验,每个工人组装

41、一件产品所需的时间如表3-10 所示。试以所示。试以95%的置信水平推断两种方法组装产品所需的置信水平推断两种方法组装产品所需 平均时间有无差异。平均时间有无差异。 表3-10 两种方法组装产品所需的时间(单位:分钟) 这是一个(独立)两样本均值检验问题,若这是一个(独立)两样本均值检验问题,若1和和2分分 别表示两种方法组装一件产品所需的平均时间,则检验别表示两种方法组装一件产品所需的平均时间,则检验 的是:的是:H0:1 2 = 0,H1:1 2 0; 方法128.330.129.037.632.128.836.037.238.534.428.030.0 方法227.622.231.033

42、.820.030.231.726.032.031.2 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 假定表假定表3-10数据存放在数据集数据存放在数据集Mylib.zzcpsj中,将两中,将两 个样本中被比较均值的变量的观测值记在同一分析变量个样本中被比较均值的变量的观测值记在同一分析变量 F下,不同的样本用一个分类变量下,不同的样本用一个分类变量g的不同值加以区分,的不同值加以区分, 而且分类变量而且分类变量g只能取两个值,否则无法进行。只能取两个值,否则无法进行。 分析步骤如下:分析步骤如下: 1) 在在“分析家分析家”中打开数据集中打开数据集Mylib

43、.zzcpsj; 2) 选择菜单选择菜单“Statistics(统计)(统计)”“Hypothesis Tests(假设检验)(假设检验)”“Two Sample t - Test for Mean (两样本均值的(两样本均值的t - 检验)检验)”; STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 3) 在打开的在打开的“Two Sample t - Test for a Mean”对话框对话框 中,按图中,按图3-12所示设置双样本均值检验,单击所示设置双样本均值检验,单击“OK”按按 钮,得到结果如图钮,得到结果如图3-13所示所示 结果显示,由于结果显

44、示,由于t统计量的统计量的p值值 = 0.0433,所以在,所以在95%的的 置信水平下,应该拒绝原假设,即两种方法所需时间有置信水平下,应该拒绝原假设,即两种方法所需时间有 差异。表明有差异。表明有95%的把握认为两种方法所需时间有差异。的把握认为两种方法所需时间有差异。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 3.2.3 使用使用TTEST过程过程 TTEST过程可以执行单样本均值的过程可以执行单样本均值的t检验、配对数据的检验、配对数据的t 检验以及双样本均值比较的检验以及双样本均值比较的t检验。检验。 1. 1. 语法格式语法格式 PROC T

45、TEST ; CLASS ; VAR ; PAIED ; BY ; RUN; 其中,其中,PROC TTEST和和RUN语句是必须的,其余语语句是必须的,其余语 句都是可选的,而且可调换顺序。句都是可选的,而且可调换顺序。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 CLASS语句所指定的分组变量是用来进行组间比较语句所指定的分组变量是用来进行组间比较 的;而的;而BY语句所指定的分组变量是用来将数据分为若语句所指定的分组变量是用来将数据分为若 干个更小的样本,以便干个更小的样本,以便SAS分别在各小样本内进行各自分别在各小样本内进行各自 独立的处理。独立

46、的处理。 VAR语句引导要检验的所有变量列表,语句引导要检验的所有变量列表,SAS将对将对VAR 语句所引导的所有变量分别进行组间均值比较的语句所引导的所有变量分别进行组间均值比较的t检验。检验。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 PAIED语句用来指定配对语句用来指定配对t检验中要进行比较的变量检验中要进行比较的变量 对,其后所带的变量名列表一般形式及其产生的效果见对,其后所带的变量名列表一般形式及其产生的效果见 表表3-11。 表3-11 选项及其含义 变量名列表形式产生的效果 a*ba b a*b c*da b, c d (a b)*(c

47、d)a c, a d, b c, b d (a b)*(c b)a c, a b, b c STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 PROC TTEST语句后可跟的选项及其表示的含义如语句后可跟的选项及其表示的含义如 表表3-12所示。所示。 表3-12 选项及其含义 选项代表的含义 data =等号后为SAS数据集名,指定ttest过程所要处理的数据集,默认值为最近处 理的数据集 alpha =等号后为01之间的任何值,指定置信水平,默认为0.05 ci =等号后为“equal, umpu, none”中的一个,表示标准差的置信区间的显示形式, 默认

48、为ci = equal cochran有此选项时,ttest过程对方差不齐时的近似t检验增加cochran近似法 h0 =等号后为任意实数,表示检验假设中对两均值差值的设定,默认值为0 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 2. 2. 总体均值的置信区间总体均值的置信区间 【例【例3-8】仍然考虑例】仍然考虑例3-3中的样本数据。假定其中数据中的样本数据。假定其中数据 使用如下数据步存放在数据集使用如下数据步存放在数据集sjcj中,两套试卷得分的中,两套试卷得分的 变量名分别为变量名分别为A和和B。 data sjcj; input A B; car

49、ds; 78 71 63 44 72 61 89 84 91 74 49 51 68 55 76 60 85 77 55 39 ; run; STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 【例【例3-8】仍然考虑例】仍然考虑例3-3中的样本数据。假定其中数据中的样本数据。假定其中数据 使用如下数据步存放在数据集使用如下数据步存放在数据集sjcj中,两套试卷得分的中,两套试卷得分的 变量名分别为变量名分别为A和和B。 使用最简代码求均值、标准差的置信区间:使用最简代码求均值、标准差的置信区间: proc ttest data = sjcj; run; 代码运行

50、结果给出两个变量在代码运行结果给出两个变量在95%置信水平下的均值、置信水平下的均值、 标准差的置信区间,以及对原假设标准差的置信区间,以及对原假设0= 0所作的所作的t检验的检验的p 值,如图所示。值,如图所示。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 3. 3. 单样本总体均值的假设检验单样本总体均值的假设检验 在例在例3-8中增加原假设选项以及置信水平,代码如下:中增加原假设选项以及置信水平,代码如下: proc ttest h0=70 alpha = 0.01 data=sjcj; var A; run; 代码运行结果除了给出变量代码运行结果除

51、了给出变量A在在99%置信水平下的均置信水平下的均 值、标准差的置信区间外,还给出对假设值、标准差的置信区间外,还给出对假设0 = 70,所作,所作 的的t-检验的检验的p值,如图值,如图3-15所示。所示。 结果显示结果显示t统计量的统计量的p值值 = 0.5734,不能拒绝(,不能拒绝(57.34%的的 把握)原假设:均值把握)原假设:均值 = 70。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 4. 4. 配对两样本均值的假设检验配对两样本均值的假设检验 在例在例3-8中检验两套试卷有无显著差异,代码如下:中检验两套试卷有无显著差异,代码如下: pr

52、oc ttest data=sjcj; paired A*B; run; 代码运行结果给出了对原假设代码运行结果给出了对原假设1 2 = 0所作的所作的t检验检验 的的p值,如图值,如图3-16所示。所示。 结果显示结果显示t统计量的统计量的p值值 = 0.0005 0.05,因此拒绝原假,因此拒绝原假 设。说明两套试卷有显著差异。设。说明两套试卷有显著差异。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 5. 5. 独立两样本均值的假设检验独立两样本均值的假设检验 过程过程TTEST还可以用于进行独立双样本均值比较的还可以用于进行独立双样本均值比较的t 检

53、验法。它的用法为检验法。它的用法为 PROC TTEST DATA = ; CLASS ; VAR ; RUN; 使用这一格式要求将两个样本中被比较均值的变量的使用这一格式要求将两个样本中被比较均值的变量的 观测值记在同一分析变量下,不同的样本用另一个分类观测值记在同一分析变量下,不同的样本用另一个分类 变量的不同值加以区分,而且分类变量只能取两个值,变量的不同值加以区分,而且分类变量只能取两个值, 否则将报错。否则将报错。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 【例【例3-9】仍然考虑例】仍然考虑例3-7中的样本数据。假定其中数据中的样本数据。假定

54、其中数据 使用如下数据步存放在数据集使用如下数据步存放在数据集zzcpsj中:中: data zzcpsj; input f g$; cards; 28.3 1 27.6 2 30.1 1 22.2 2 29 1 31 2 37.6 1 33.8 2 32.1 1 20 2 28.8 1 30.2 2 36 1 31.7 2 37.2 1 26 2 38.5 1 32 2 34.4 1 31.2 2 28 1 30 1 ; run; STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 将两批工人的测量结果看作两个样本,但其数据都放将两批工人的测量结果看作两个样本,

55、但其数据都放 在一个数据集之中,所需的时间值是记录在同一分析变在一个数据集之中,所需的时间值是记录在同一分析变 量量f之下,而两种方法的差别是由变量之下,而两种方法的差别是由变量g的值加以区分的,的值加以区分的, 所以所以g可作为分类变量。检验代码如下:可作为分类变量。检验代码如下: proc ttest data=zzcpsj; class g; var f; run; 检验结果如图所示。检验结果如图所示。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 在检验中,先看其最后关于方差等式的检验结果,检验在检验中,先看其最后关于方差等式的检验结果,检验 方差相

56、等是用的方差相等是用的F 统计量,其数值为统计量,其数值为1.29,相应的,相应的p值值 为为0.67790.05 = ,所以不能拒绝方差相等的假设。,所以不能拒绝方差相等的假设。 在方差相等的前提下,检验均值差异使用在方差相等的前提下,检验均值差异使用Pooled方法,方法, 对应统计量的对应统计量的t值为值为2.16,相应的,相应的p值为值为0.04330.05 = , 所以两种方法所需的时间是有显著差异的。所以两种方法所需的时间是有显著差异的。 在异方差的情况下,使用在异方差的情况下,使用Satterthwaite法检验均值的法检验均值的 差异。差异。 STATSTATSTATSTATS

57、ASSAS软件与统计应用教程软件与统计应用教程 2021/6/749 n3.3 3.3 总体比例的区间估计与假设检验的总体比例的区间估计与假设检验的 SASSAS实现实现 n3.3.1 总体比例的置信区间总体比例的置信区间 n3.3.2 单样本总体比例的假设检验单样本总体比例的假设检验 n3.3.3 两总体比例的比较两总体比例的比较 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 3.3.1 总体比例的置信区间总体比例的置信区间 【例【例3-10】2019年底北京市私家车拥有量已达到年底北京市私家车拥有量已达到129.8万万 辆,位居全国之首,据业内人士分析其

58、中国产中低档汽辆,位居全国之首,据业内人士分析其中国产中低档汽 车的比例较大,为了估计目前北京市场个人购车的平均车的比例较大,为了估计目前北京市场个人购车的平均 价格,调查人员于某日在北京最大的车市随机抽取价格,调查人员于某日在北京最大的车市随机抽取36位位 私人消费购车者,得到他们所购汽车的价格,见下表。私人消费购车者,得到他们所购汽车的价格,见下表。 表3-13 年底购车价格(单位:万元) 根据以上调查数据,试以根据以上调查数据,试以95的置信水平推断该地区购的置信水平推断该地区购 买私家车在买私家车在15万元以上的消费者占有的比例。万元以上的消费者占有的比例。 6.8811.2819.9

59、813.610.614.86.8811.7820.98 24.412.314.86.8813.6813.630.314.614.8 8.2814.9814.79.614.617.49.615.6815.8 9.612.95.3810.1815.6820.510.614.87.38 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 设购车价格数据存放在数据集设购车价格数据存放在数据集Mylib.gcjg中,价格变中,价格变 量名为量名为price。这是一个单样本比例的区间估计问题。由。这是一个单样本比例的区间估计问题。由 于在于在SAS中只能对两水平的分类变量作比

60、例的区间估计中只能对两水平的分类变量作比例的区间估计 与检验,所以首先要按变量与检验,所以首先要按变量price生成一个新的分类变量。生成一个新的分类变量。 步骤如下:步骤如下: 1) 在在“分析家分析家”中打开数据集中打开数据集Mylib.gcjg; 2) 选择主菜单选择主菜单“Edit(编辑)(编辑)”“Mode(模(模 式)式)”“Edit(编辑)(编辑)”,使数据集可以被编辑(修,使数据集可以被编辑(修 改);改); STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 3) 选择主菜单选择主菜单“Data(数据)(数据)”“Transform(变(变 换)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论