第七章 假设检验_第1页
第七章 假设检验_第2页
第七章 假设检验_第3页
第七章 假设检验_第4页
第七章 假设检验_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

参数估计和假设检验是统计推断的两个组成部分,都是利用样本对总体进行某种推断,但推断的角度不同。参数估计讨论的是用样本统计量估计总体参数的方法。假设检验讨论的是用样本信息去检验对总体参数的某种假设是否成立的程序和方法。学习目标:1.理解假设检验的基本思想和基本步骤;

2.理解假设检验的两类错误及其关系;

3.熟练掌握总体均数的假设检验方法;

4.熟练利用SPSS对总体方差、总体率及样本正态性进行各种假设检验。第八章假设检验一、什么是假设检验我们以一个实例来讲解:根据1989年的统计资料,某地女性新生儿的平均体重为3190克。为判断该地1990年的女性新生儿体重与1989年相比有无显著差异,从该地1990年的女性新生儿中随机抽取30人,测得其平均体重为3210克。从样本数据看,1990年女新生儿体重比1989年略高,但这种差异可能是由于抽样的随机性带来的,也许这两年新生儿的体重并没有显著差异。究竟是否存在显著差异?可以先假设这两年新生儿的体重没有显著差异,然后利用样本信息检验这个假设能否成立。先对推断的总体参数或分布提出某种假设,然后通过样本统计量去验证这个假设是否成立,这一过程称为假设检验,亦称显著性检验。假设检验分为参数检验和非参数检验;参数检验是已知总体分布,对总体的某个参数提出假设(原假设H0),用样本来检验这个假设是否正确(是接受还是拒绝原假设H0);非参数检验是对总体分布提出假设(原假设H0),用样本来检验这个假设是否正确(是接受还是拒绝原假设H0)。第一节假设检验概述二、假设检验的基本原理小概率原理——发生概率很小的随机事件(小概率事件)在一次实验中几乎是不可能发生的。根据这一原理,可以先假设总体参数的某项取值为真,也就是假设其发生的可能性很大,然后抽取一个样本进行观察,如果样本信息显示出现了与事先假设相反的结果且与原假设差别很大,则说明原来假定的小概率事件在一次实验中发生了,这是一个违背小概率原理的不合理现象,因此有理由怀疑和拒绝原假设;否则不能拒绝原假设。例如:某厂产品合格率为99%,从一批(100件)产品中随机抽取一件,恰好是次品的概率为1%。随机抽取一件是次品几乎是不可能的,但是这种情况发生了,我们有理由怀疑该厂的合格率为99%.这时我们犯错误的概率是1%。著名的英国统计家RonaldFisher把20分之1作为标准,也就是0.05,从此0.05或比0.05小的概率都被认为是小概率Fisher没有任何深奥的理由解释他为什么选择0.05,只是说他忽然想起来的。第一节假设检验概述三、假设检验的基本思想...因此我们拒绝假设x=50...如果这是总体的真实均值样本均值x=50抽样分布H0这个值不像我们应该得到的样本均值...20第一节假设检验概述四、假设检验的步骤1.提出统计假设原假设(也称零假设或无效假设),用H0表示,通常为被比较的两者无差异,如μ1=μ2;备择假设(也称对立假设),用H1表示,通常为原假设被否定时准备选择的假设,如μ1≠μ2,可能是μ1<μ2或μ1>μ2等等。应该注意:⑴对任一假设检验问题,其所有可能结果均应包括在所提出的两个对立假设中,原假设与对立假设总有一个、也只能有一个成立。⑵原假设一定要有等号:=或≦或≥。原假设不是随意提出的,应该本着“不轻易拒绝原假设”的原则。第一节假设检验概述四、假设检验的步骤2.确定检验方法,计算检验统计量检验统计量的选择是根据研究目的与要求、数据资料的分布、样本含量的大小等确定的。常用的检验方法有u检验、t检验、F检验和χ2检验等。u检验(单尾和双尾)

t检验(单尾和双尾)u检验(单尾和双尾)u、2检验(单尾和双尾)均值总体率方差第一节假设检验概述四、假设检验的步骤3.确定显著性水平α,求出临界值显著性水平α是当原假设为正确时被拒绝的概率,是由研究者事先确定的。显著性水平的大小应根据研究需要的精确度和可靠性而定。通常取α=0.05或α=0.01,即接受原假设的决定是正确的可能性(概率)为95%或99%。根据给定的显著性水平α,查表得出相应的临界值,同时指定拒绝域。第一节假设检验概述四、假设检验的步骤4.作出统计推断结论将计算的检验统计量与临界值作比较,如果前者(绝对值)<后者,说明检验统计量的值落在接受域内,概率P>α,接受H0,拒绝H1,差别无统计学意义;如果前者(绝对值)≥后者,说明检验统计量的值落拒绝域内,概率P≦α,拒绝H0,接受H1,差别有统计学意义。通常将:P>0.05称为“差别不具显著性”;0.01<P≦0.05称为“差别具显著性”,常以“*”表示;P≦0.01,称为“差别具高度显著性”,常以“**”表示。抽样分布H0值临界值临界值a/2a/2

样本统计量拒绝域拒绝域接受域1-α置信水平第一节假设检验概述五、假设检验的两类错误假设检验是依据小概率原理进行判断的,这就决定了统计结论仍有犯错误的可能。两类错误:“弃真”错误(第I类错误):H0为真时却被拒绝,犯错概率为α;“纳伪”错误(第II类错误):H0为假时却被接受。犯错概率为β。

假设检验中各种可能结果的概率

接受H0拒绝H0,接受H1H0

为真1-α(正确决策)α(弃真错误)H0

为伪β(取伪错误)1-β(正确决策)第一节假设检验概述假设检验两类错误关系的图示

以单侧上限检验为例,设H0

:X≤X0,H1:X>X0从上图可以看出,如果临界值沿水平方向右移,α将变小而β变大,即若减小α错误,就会增大犯β错误的机会;如果临界值沿水平方向左移,α将变大而β变小,即若减小β错误,也会增大犯α错误的机会。要想减少α与β,一个方法就是要增大样本容量n。图(a):

X≤X0H0为真图(b):X>X0

H0为伪第一节假设检验概述六、单双侧检验根据假设的形式不同,假设检验可以分为双侧假设检验和单侧假设检验。若原假设是总体参数等于某一数值,如H0:X=X0,即备择假设H1:X≠X0,那么只要X<X0和X>X0二者中有一个成立,就可以否定原假设。这种假设检验称为双侧检验。若原假设是总体参数大于等于或小于等于某一数值,如H0:X≥X0(即H1:X<X0);或H0:X≤X0(即H1:X>X0),那么对于前者当X<X0时,对于后者当X>X0时,可以否定原假设。这种假设检验称为单侧检验。可以分为左侧检验(H1:X<X0)和右侧检验(H1:X>X0)。第一节假设检验概述一、μ=μ0的假设检验(一个正态总体均数的检验)根据随机变量的分布情况、方差是否已知及样本含量的大小,若假设H0:μ=μ0成立,则检验统计量计算公式如下表:第二节均数的假设检验总体分布样本容量σ2已知σ2未知正态分布小样本n<30

大样本n≥30

非正态分布小样本n<30

大样本n≥30

【例8-1】已知我国健康成年男子安静时的脉搏服从正态分布,其平均数为72次/分,标准差为6.4次/分。随机抽测某体院四年级36名男生安静时的脉搏,其平均数68.2次/分,标准差为3.1次/分。试问体院四年级男生安静时的脉搏与一般健康成年男子安静时的脉搏是否相同?(取α=0.05)。解:从题意可知,μ0=72,σ=6.4,x=68.2,S=3.1,n=36。(1)建立假设:H0:μ=μ0=72,H1:μ≠μ0(2)计算统计量:(3)根据显著性水平α=0.05,查表得双侧检验临界值:u0.05/2=1.96(4)作出统计推断结论:因为∣u∣=3.562>u0.05/2=1.96,P<0.05,差异具显著性,拒绝H0,接受H1。可以认为体院四年级男生安静时的脉搏与健康成年男子安静时的脉搏存在着差异。u01.96-1.960.025拒绝H0拒绝H00.025第二节均数的假设检验【例8-2】已知我国女篮运动员的纵跳成绩服从正态分布,平均成绩为60厘米,随机抽测某省队11名女篮运动员,测得纵跳成绩平均值为61.91厘米,标准差为7.09厘米,试问该省队女篮运动员的纵跳成绩与我国女篮运动员的纵跳成绩有无差别?(取α=0.05)。解:本题σ未知,μ0=60,x=61.91,S=7.09,n=11。(1)建立假设:H0:μ=μ0=60,H1:μ≠μ0(2)计算统计量:(3)根据显著性水平α=0.05,查表得双侧检验临界值:t0.05/2(10)=2.228(4)作出统计推断结论:因为∣t∣=0.893<t0.05/2(10)=2.228,P>0.05,差异不具显著性,接受H0。可以认为该省女篮运动员的纵跳成绩与我国女篮运动员的纵跳成绩没有差别。第二节均数的假设检验t02.228-2.2280.025拒绝H0拒绝H00.025总体分布方差是否齐性σ2已知σ2未知正态分布齐性

非齐性

非正态分布要求n1n2足够大

二、

μ1=μ2的假设检验(两个总体均值的检验)假设有两个总体的独立样本,样本含量分别为n1,n2。若假设H0:μ1=μ2成立,则检验统计量计算公式如下表:服从自由度为的t分布要求n1、n2≥30要求n1、n2≥100第二节均数的假设检验三、配对(匹配)检验在分组设计中,常常采用配对设计。将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理,称为随机配对设计。配对设计方式有:两种同质受试对象分别接受两种不同的处理;同一受试对象分别接受两种不同的处理;对同一受试对象处理前后的结果进行比较,也称自身对照。应用配对设计可以减少实验的误差和个体差异,排除对处理因素的干扰,提高检验的灵敏度。这种设计的样本数据是成对出现的。当变量服从正态,采用配对试验,可以用配对试验的t检验。若变量X1、X2分别服从正态分布,则X1-X2也服从正态分布。当原假设μd=0(μd是每对观察值的差值d=X1-X2所属总体的均数)成立,而σd未知,用样本值替代,则有:服从自由度为n-1的t分布。其中d、Sd分别是d的平均数和标准差,n是所配的对数。其接受域、拒绝域同μ=μ0的t检验。第二节均数的假设检验【例8-3】某研究所为研究长时间持续运动对血尿酸浓度的影响,让10名男青年在自行车功力计上持续运动两小时,测得运动前后的血尿酸浓度(mg%)数据如下表,试问长时间持续运动对人体血尿酸浓度有无影响?(取α=0.01)。序号12345678910Σ运动前5.44.83.63.45.75.53.63.85.24.5运动后6.64.85.46.06.35.54.85.06.55.8dd2第二节均数的假设检验解:(1)建立假设:H0:μd=0,H1:μd≠0(2)计算统计量:(3)根据显著性水平α=0.01,查表得双侧检验临界值:t0.01/2(9)=3.250(4)作出统计推断结论:因为∣t∣=4.524>t0.01/2(9)=3.250,P<0.01,差异具高度显著性,拒绝H0。可以认为长时间持续运动对人体血尿酸浓度有影响。序号12345678910Σ运动前5.44.83.63.45.75.53.63.85.24.5运动后6.64.85.46.06.35.54.85.06.55.8d-1.20-1.8-2.6-0.60-1.2-1.2-1.3-1.3-11.2d21.4403.246.760.3601.441.441.691.6918.1第二节均数的假设检验在研究工作中,有时仅仅用平均水平对其总体进行分析还不够。例如,试想通过考试成绩对一种新教法的效果进行判定,经教学实验,新教法与旧教法考试成绩均数属同一总体,即新旧教法的平均水平相同,通常就认为二者没有差别。但是检验离散程度时发现σ>σ0,也就是说,新教法拉大了学生成绩之间的差距,即新教法可能对好的学生提高成绩有促进作用,而对差生来说更加不适应,新教法具有较强的针对性。所以不能说新教法的效果等同于旧教法。由此可见,研究工作中有时还需要进行方差的假设检验。另外,两个独立小样本均值的检验也需要了解方差是否齐性,即对方差进行检验。第三节方差的假设检验一、

σ=σ0的假设检验(一个正态总体方差检验)当随机变量服从正态分布x~N(μ,σ),从总体中抽取样本观测值为x1、x2…xn,如原假设σ=σ0成立,则有服从自由度为n-1的χ2分布。式中S2为σ2的估计值,

σ02为已知总体方差。对于显著性水平α,其拒绝域和接受域如下图:一个总方差检验拒绝域与接受域第三节方差的假设检验二、

σ1=σ2的假设检验(两个正态总体方差检验)当随机变量服从正态分布,x1~N(μ1,σ1),x2~N(μ2,σ2),从总体中抽取样本观测值为x11,x12…x1n;x21,x22…x2n,如原假设σ1=σ2成立,则有服从自由度为(n1-1,n2-1)的F分布,为了查表方面,设定S12>S22,对于显著性水平α,拒绝域为F≥F

α/2

(n1-1,n2-1),接受域为F<F

α/2(n1-1,n2-1)

,如下图两个总方差检验拒绝域与接受域第三节方差的假设检验率是定性资料常用的描述指标,指某事发生的频繁程度,如命中率、成功率、达标率等。对率的假设检验常用u检验和χ2检验。一、总体率的u检验当np与n(1-p)均大于5,p与(1-p)均大于0.01时,p近似正态分布,可用u检验。第四节率的假设检验x1、x2分别为两样本事件发生的次数二、总体率的χ2检验χ2检验,它是一种用途较广的检验方法,除了可用于方差的检验外,还可用于两个或两个以上样本率或构成比之间的检验,也可用于数据分布类型的检验。总体率的χ2检验是利用列联表的形式,检验实际频数和理论频数的差别是否是由抽样误差所引起的,达到由样本率(或样本构成比)来推断总体率(或总体构成比)的目的。所谓列联表是指由两个以上的变量进行交叉分类的频数分布表。将横向变量(行)的划分类别视为R(row),纵向变量(列)的划分类别视为C(column),则可以将每一个具体的列联表称为行×列列联表,也可称为R×C列联表。总体率的χ2检验又称为R×C列联表的χ2检验检验统计量:第四节率的假设检验近似服从自由度为df=(r-1)(c-1)的χ2分布。式中Aij是位于第i行第i列交叉处的实际频数,Tij是位于第i行第i列交叉处的理论频数。理论频数Tij的计算公式为:ni是A所在行的合计,nj是A所在列的合计,n是多个样本数的合计。(A-T)反映实际频数与

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论