SAS软件及统计应用教程3_第1页
SAS软件及统计应用教程3_第2页
SAS软件及统计应用教程3_第3页
SAS软件及统计应用教程3_第4页
SAS软件及统计应用教程3_第5页
已阅读5页,还剩84页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章区间估计与假设检验,3.1区间估计与假设检验的基本概念3.2总体均值的区间估计与假设检验的SAS实现3.3总体比例的区间估计与假设检验的SAS实现3.4总体方差的区间估计与假设检验的SAS实现3.5分布检验,3.1区间估计与假设检验的基本概念3.1.1区间估计3.1.2假设检验,3.1.1区间估计1.点估计和区间估计参数的估计方法主要有两种:点估计和区间估计。点估计是用样本的观测值估计总体未知参数的值。由于样本的随机性,不同样本观测值计算得出的参数的估计值间存在着差异,因此常用一个区间估计总体的参数,并把具有一定可靠性和精度的估计区间称为置信区间。利用构造的统计量及样本观测值,计算得出参

2、数的置信区间的方法称为参数的区间估计。,2.参数的置信区间在区间估计中,对于总体的未知参数,需要求出两个统计量1(X1,X2,.,Xn)和2(X1,X2,.,Xn)来分别估计总体参数的上限和下限,使得总体参数在区间(1,2)内的概率为P12=1其中1称为置信水平,而(1,2)称为的置信区间,1,2分别称为置信下限和置信上限。置信水平为1的含义是随机区间(1,2)以1的概率包含了参数。,3.正态总体均值和方差的置信区间参数的区间估计大多是对正态总体的参数进行估计,如对单总体均值、方差的估计、两总体均值差的估计和两总体方差比的估计等。正态总体参数的各种置信区间见表3-1。,正态总体参数的各种置信区

3、间见表3-1。,其中,4.总体比例与比例差的置信区间实际应用中经常需要对总体比例进行估计,如产品的合格率、大学生的就业率和手机的普及率等。记和P分别表示总体比例和样本比例,则当样本容量n很大时(一般当nP和n(1P)均大于5时,就可以认为样本容量足够大),样本比例P的抽样分布可用正态分布近似。总体比例与比例差的置信区间如表3-2所示。,3.1.2假设检验1.假设检验的基本原理对总体参数进行假设检验时,首先要给定一个原假设H0,H0是关于总体参数的表述,与此同时存在一个与H0相对立的备择假设H1,H0与H1有且仅有一个成立;经过一次抽样,若发生了小概率事件(通常把概率小于0.05的事件称为小概率

4、事件),可以依据“小概率事件在一次实验中几乎不可能发生”的理由,怀疑原假设不真,作出拒绝原假设H0,接受H1的决定;反之,若小概率事件没有发生,就没有理由拒绝H0,从而应作出拒绝H1的决定。,2.假设检验的步骤1)根据问题确立原假设H0和备选假设H1;2)确定一个显著水平,它是衡量稀有性(小概率事件)的标准,常取为0.05;3)选定合适的检验用统计量W(通常在原假设中相等成立时,W的分布是已知的),根据W的分布及的值,确定H0的拒绝域。4)由样本观测值计算出统计量W的观测值W0,如果W0落入H0的拒绝域,则拒绝H0;否则,不能拒绝原假设H0。,注意:在SAS系统中,是由样本观测值计算出统计量W

5、的观测值W0和衡量观测结果极端性的p值(p值就是当原假设成立时得到样本观测值和更极端结果的概率),然后比较p和作判断:p,拒绝原假设H0;p,不能拒绝原假设H0。,p值通常由下面公式计算而得到。p=P|W|W0|=2PW|W0|(拒绝域为两边对称的区域时)p=minPWW0,PWW0(拒绝域为两边非对称区域时)p=PWW0(拒绝域为右边区域时)p=PWW0(拒绝域为左边区域时)只需根据SAS计算出的p值,就可以在指定的显著水平下,作出拒绝或不能拒绝原假设的决定。,3.正态总体均值和方差的假设检验对正态总体的参数进行假设检验是假设检验的重要内容,如对单总体均值、方差的检验、两总体均值之差的检验和

6、两总体方差比的检验等。正态总体参数的各种检验方法见下表3-3至表3-5。表3-3单正态总体N(,2)均值的检验法,表3-4单正态总体N(,2)方差2的检验法,或,表3-5两正态总体的均值差与方差比的检验,4.总体比例与比例差的检验当样本容量n很大时,可根据表3-6对总体比例与比例差进行假设检验。表3-6总体比例与比例差的检验,3.2总体均值的区间估计与假设检验的SAS实现3.2.1使用INSIGHT模块3.2.2使用“分析家”3.2.3使用TTEST过程,3.2.1使用INSIGHT模块1.总体均值的区间估计【例3-1】某药材生产商要对其仓库中的1000箱药材的平均重量进行估计,药材重量的总体

7、方差未知,随机抽取16箱样本称重后结果如表3-7所示。表3-716箱药材重量(单位:千克)设药材重量数据存放于数据集Mylib.yczl中,其中重量变量名为weight。求该仓库中每箱药材平均重量在95%置信水平下的置信区间。,步骤如下:1)启动INSIGHT模块,并打开数据集Mylib.yczl;2)选择菜单“Analyze”“Distribution(Y)”;3)在打开的“Distribution(Y)”对话框中进行区间估计的设置(如图)。,结果包括一个名为“95ConfidenceIntervals(95%置信区间)”的列表,表中给出了均值、标准差、方差的估计值(Parameter)、置

8、信下限(LCL)和置信上限(UCL),如图3-2所示。结果表明,根据抽样样本,该仓库中药材的平均重量以95%的可能性位于50.08千克至52.92千克之间。,2.单样本总体均值的假设检验【例3-2】一家食品厂以生产袋装食品为主,每天的产量大约为8000袋,每袋重量规定为100克。为了分析每袋重量是否符合要求,质检部门经常进行抽检。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如表3-8所示。表3-825袋食品的重量(单位:克)试从抽检的样本数据出发,检验变量WEIGHT的均值与100克是否有显著差异。假定表3-8数据存放在数据集Mylib.spzl中,重量变量名为WEIGHT。,设变量

9、WEIGHT的均值为,问题是希望通过样本数据检验变量WEIGHT均值的如下假设:H0:=100,H1:100。使用INSIGHT对均值进行检验的步骤如下:1)首先启动INSIGHT,并打开数据集Mylib.spzl;2)选择菜单“Analyze”“Distribution(Y)”;3)在打开的“Distribution(Y)”对话框中选定分析变量WEIGHT;4)单击“OK”按钮,得到变量的描述性统计量;,5)选择菜单“Tables(表)”“TestsforLocation(位置检验)”;在弹出的“TestsforLocation”对话框中输入100,单击“OK”按钮得到输出结果如图所示。,结

10、果显示,观测值不等于100克的观测有24个,其中19个观测值大于100。图中第一个检验为t检验(Studentst),需要假定变量服从正态分布,检验的p值为0.0105,这个检验在0.05水平下是显著的,所以可认为均值与100克有显著差异。第二个检验(Sign)是叫做符号检验的非参数检验,其p值为0.0066,在0.05水平下也是显著的,结论不变。第三个检验(SgnedRank)是叫做符号秩检验的非参数检验,其p值为0.0048,在0.05水平下是显著的,结论不变。,3.两样本总体均值的比较:成对匹配样本在INSIGHT中比较成对样本均值是否显著差异,可以计算两变量的差值变量,再检验差值变量的

11、均值是否显著为0。【例3-3】由10名学生组成一个随机样本,让他们分别采用A和B两套试卷进行测试,结果如表3-9所示。表3-910名学生两套试卷的成绩试从样本数据出发,分析两套试卷是否有显著差异。,步骤如下:1)首先生成差值变量:启动INSIGHT,并打开数据集Mylib.sjdf。选择菜单“Edit”“Variables”“Other”,打开“EditVariables”对话框,选择A为Y变量,B为X变量,然后选择变换(Transformation):YX,如图,生成新的差值变量d;,2)然后对变量d的均值做如下假设:H0:d=0,H1:d0。3)选择菜单“Analyze”“Distribu

12、tion(Y)”;在打开的“Distribution(Y)”对话框中选定分析变量:选择变量差值d,单击“Y”按钮,将变量d移到右上方的列表框中;4)单击“Output”按钮,在打开的对话框中选中“TestsforLocation(位置检验)”复选框;5)两次单击“OK”按钮,得到变量的描述性统计量;,6)选择菜单“Tables(表)”“TestsforLocation(位置检验)”;在弹出的“TestsforLocation”对话框中输入0,单击“OK”按钮得到输出结果如图所示。结果显示三个检验的结论都是p值小于0.05,所以应拒绝原假设,即总体的均值与0有显著差异。所以两套试卷有显著差异。虽

13、然SAS给出三个检验结果,其实作结论时只需其中一个。如果可以认为分析变量服从正态分布只要看t检验结果;否则只须看符号秩检验结果。只有在数据为两两比较的大小结果而没有具体数值时符号检验才有用。,3.2.2使用“分析家”1.总体均值的置信区间【例3-4】在“分析家”中求例3-1中每箱药材平均重量在95%置信水平下的置信区间。步骤如下:1)在“分析家”模块中打开数据集Mylib.yczl;2)选择菜单“Statistics(统计)”“HypothesisTests(假设检验)”“OneSamplettestforaMean(单样本均值t-检验)”;3)在打开的“OneSamplettestforaM

14、ean”对话框中设置均值的置信区间(如图3-6)。,3)在打开的“OneSamplettestforaMean”对话框中设置均值的置信区间(如图3-6)。结果表明(下图),根据抽样样本,该仓库中药材的平均重量以95%的可能性位于50.08千克至52.92千克之间。,2.单样本总体均值的假设检验【例3-5】使用“分析家”检验例3-2中食品重量是否符合要求。希望通过样本数据检验变量WEIGHT均值的如下假设:H0:=100,H1:100。由于此时的方差未知,所以使用t检验法。步骤如下:1)在“分析家”中打开数据集Mylib.spzl;2)选择菜单“Statistics(统计)”“Hypothesi

15、sTests(假设检验)”“OneSamplettestforaMean(单样本均值t-检验)”,打开“OneSamplettestforaMean”对话框;,4)按图3-8所示设置均值检验,单击“OK”按钮,得到结果如图左所示。;显示结果(图右)表明t统计量的p值为0.01050.05,所以拒绝原假设,即认为总体的均值不等于100。,3.两样本总体均值的比较:成对匹配样本【例3-6】使用“分析家”对例3-3中两套试卷检验有无显著差异。这是一个(成对匹配)双样本均值检验问题,若1和2分别表示两套试卷的平均成绩,则检验的是:H0:12=0,H1:120;分析步骤如下:1)在“分析家”中打开数据集

16、Mylib.sjdf;2)选择菜单“Statistics(统计)”“HypothesisTests(假设检验)”“TwoSamplePairedt-TestforaMean(均值的成对双样本t-检验)”;,3)在打开的“TwoSamplePairedt-TestforaMean”对话框中,按图左所示设置双样本均值检验,单击“OK”按钮,得到结果如图右所示结果显示,无论两总体的方差是否相等,t统计量的p值=0.000552;步骤如下:1)选择菜单“Statistics”“HypothesisTests”“OneSampleTestforaVariance(单样本方差检验)”,打开“OneSamp

17、leTestforaVariance”对话框并按图设置;2)单击“OK”按钮,得到结果。,结果(图左)显示,样本方差为12.732,由于2检验的p值=0.9504,所以不能拒绝方差25的原假设。结果表明有95%的把握可以认为该模拟考试的成绩太过集中。,3.4.3两样本总体方差的比较【例3-15】已知两只股票深发展(000001)和万科A(000002)在2004年6月21个交易日的收益率如表3-16所示。试在0.05的显著水平下判断深发展的风险是否高于万科A?表3-16深发展和万科A在2004年6月21个交易日的收益率,这是一个双样本方差检验问题,若1和2分别表示深发展和万科A两只股票收益率的

18、方差,则检验的是:H0:12,H1:10.150.05=,所以不能拒绝原假设,可以认为变量income总体分布为正态分布。,3.5.3在“分析家”中研究分布【例3-17】在“分析家”中研究例3-10例3-12中北京市场个人购车价格变量price的正态性。1.绘制分布拟合图和QQ图首先在“分析家”中打开数据集Mylib.gcjg;选择主菜单“Statistics”“Descriptive”“Distributions”,打开“Distributions”对话框。,按图(上图)设置分析选项,三次单击“OK”按钮,得到直方图和QQ图如图(下图)所示。,2.分布检验继续上述步骤。在分析家窗口的项目管理器中双击“FittedDistributionsofGcjg”项,得到检验结果如图3-443-45所示。,年底数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论