第三章 spss 生物统计学_第1页
第三章 spss 生物统计学_第2页
第三章 spss 生物统计学_第3页
第三章 spss 生物统计学_第4页
第三章 spss 生物统计学_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章统计推断

前面第四章第六节讲了样本平均数抽样分布的问题。抽样研究的目的是用样本信息来推断总体特征,这就是我们将重点讨论的统计推断问题。所谓统计推断是指根据样本以及问题的条件和假定模型对未知事物(即总体)作出的以概率形式表述的推断,它主要包括假设检验和参数估计两个内容。

假设检验又叫显著性检验,其方法很多,常用的有t检验、F检验和χ2检验等。尽管这些检验方法的用途及使用条件不同,但其检验的基本原理是相同的。本章以平均数的差异显著性检验为例阐明显著性检验的原理,介绍几种t检验的方法,然后介绍总体均数的区间估计。第一节

显著性检验的基本原理第二节

样本均数与总体均数的差异显著性检验第三节

两样本平均数的差异显著性检验第四节

显著性检验中应注意的问题第五节

总体均数的区间估计第一节显著性检验的基本原理一、显著性检验的意义二、显著性检验的基本步骤三、显著水平与两类错误四、双侧检验与单侧检验一、显著性检验的意义

本节的内容主要是解决这样几个问题,即进行显著性检验的目的、检验对象、基本思想和基本前提是什么?下面结合具体例子来说明。

(一)为什么要进行显著性检验?在某种猪场随机抽测了甲、乙两品种经产母猪各10头的产仔初生窝重:甲品种10头母猪产仔平均初生窝重标准差;乙品种10头母猪产仔平均初生窝重,标准差。问题:能否仅凭这两个样本均数差值立即得出甲、乙两品种母猪经产仔初生窝重不同的结论呢?

统计学认为,这样得出的结论是不可靠的。这是因为试验指标既受处理因素的影响,又受试验误差(或抽样误差)的影响。如果我们再分别随机抽测10头甲、乙两品种猪母猪产仔初生窝重,又可得到两个样本资料。两样本均数就不一定是13.5kg和11.63kg,其差值也不一定是1.87kg。

怎样通过样本来推断总体呢?——这正是显著性检验要解决的问题。

(二)检验对象

设甲品种猪经产母猪产仔初生窝重的总体均数为,乙品种的总体均数为。试验研究(本例为抽样比较)的目的,就是要给、是否相同做出推断,由于总体均数、未知,在进行显著性检验时只能以样本均数、作为检验对象,更确切地说,是以作为检验对象。事实上,因为样本均数具有下述特征:

离均差的平方和最小。说明样本平均数与样本各个观察值最接近,平均数是资料的代表数。

样本平均数是总体均数的无偏估计值,

统计学中心极限定理,样本平均数服从或逼近正态分布。所以,以样本平均数作为检验对象,由两个样本均数差异的大小去推断样本所属总体平均数是否相同是有其依据的。由上所述,一方面我们有依据由样本均数的差异来推断总体均数、相同与否,另一方面又不能仅据样本均数表面上的差异直接作出结论,其根本原因在于试验误差(或抽样误差)的不可避免性。(三)基本思想

我们所得到的观察值由两部分组成,即若样本含量为n,则可得到n个观察值。于是样本平均数。说明样本均数并非总体均数,它还包含试验误差的成分。对于接受不同处理的两个样本来说,则有:

两个样本均数之差试验的处理效应试验误差样本平均数的差包含有试验误差,它不只是试验的表面效应。因此,仅凭就对总体均数、是否相同下结论是不可靠的。只有通过显著性检验才能从中提取结论。

对进行显著性检验就是要分析:

主要由处理效应引起的,还是主要由试验误差所造成?虽然处理效应未知,但试验的表面效应是可以计算的,借助数理统计方法试验误差又是可以估计的。所以,可从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在,这就是显著性检验的基本思想。(四)基本前提

为了通过样本对其所在的总体作出符合实际的推断,要求合理进行试验设计,准确地进行试验与观察记载,尽量降低试验误差,避免系统误差,使样本尽可能代表总体。只有从正确、完整而又足够的资料中才能获得可靠的结论。若资料中包含有较大的试验误差与系统误差,有许多遗漏、缺失甚至错误,再好的统计方法也无济于事。因此,收集到正确、完整而又足够的资料是通过显著性检验获得可靠结论的基本前提。小结:(一)显著性检验要解决的问题——如何通过样本来推断估计总体。(二)检验的对象及其依据——样本平均数(根据有三条)。(三)显著性检验的基本思想——从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在。(四)通过检验获得可靠结论的基本前提——收集到正确、完整而又足够的资料。二、显著性检验的基本步骤

(一)首先对试验样本所在的总体作假设。这里假设,即假设甲、乙两品种猪经产母猪仔猪初生重的总体均数相等,其意义是试验的表面效应系试验误差,处理无效,故称为无效假设(nullhypothesis),记作。

无效假设是被检验的假设,通过检验可能被接受,也可能被否定。提出的同时,相应地有一对应假设,称为备择假设(alternativehypothesis),记作。

备择假设是在无效假设被否定时准备接受的假设。

本例的备择假设是:甲、乙两品种猪经产母猪仔猪初生窝重的总体均数不相等,记作亦即存在处理效应,试验的表面效应除包含试验误差外,主要的是含有处理效应在内。

(二)在无效假设成立的前提下,构造合适的统计量,并研究试验所得统计量的抽样分布。

就我们的例子,研究在无效假设成立的前提下,统计量的抽样分布。经统计学研究,得到一个的t分布。(请联系上一章的内容思考如何得出该结论的??)其中为均数差异标准误;分别为两样本的含量、平均数、均方。根据前面两个样本的数据,计算得:

于是下面进一步估计出的两尾概率,即估计是多少。查附表3,在时,两尾概率为0.05的临界t值,两尾概率为0.01的临界t值,即:由于根据两样本数据计算所得的t值为2.234,介于二个临界t值之间,所以,|t|≥2.234的概率P介于0.01和0.05之间,即:0.01<P<0.05

(三)根据“小概率事件实际不可能性原理”否定或接受无效假设。当一事件发生的概率很小(例如小于0.05或0.01)时,在一次试验中可以认为其实际上不可能发生,这叫小概率事件实际不可能性原理。|t|≥2.234的两尾概率

说明试验处理效应不存在,即试验的表面效应为试验误差的可能性在0.01~0.05之间。在生物学研究中常以0.05和0.01两个概率作为

某事件是否是小概率事件的标准。若本例中,按所建立的,表面效应为试验误差的概率在0.01~0.05之间,即无效假设属于小概率事件,根据小概率原理,故有理由否定,从而接受可以认为甲、乙两品种经产母猪的仔猪初生窝重总体平均数不相同。小概率事件不认为是小概率事件小结(显著性检验的基本步骤):

首先对试验样本所在的总体作假设(无效假设和备择假设)。

在无效假设成立的前提下,构造合适的统计量,并研究试验所得统计量的抽样分布。(得出无效假设成立的概率)

根据“小概率事件实际不可能性原理”否定或接受无效假设。(在一定的概率保证下,对无效假设是否成立作出判断)综上所述,显著性检验,从建立假设到最后依概率的大小来决定接受还是否定假设,这一过程实际上应用所谓“概率性质的反证法”对试验样本所属总体所作假设的统计证明。对于各种显著性检验的方法,除明确其应用条件,掌握有关统计运算方法外,正确的逻辑推理是不可忽视的。三、显著水平与两类错误

(一)显著水平(Significancelevel)在显著性检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”。用来确定否定或接受无效假设的概率标准叫显著水平,记作α。在生物学研究中常取α=0.05或α=0.01。

(二)显著水平α在显著性检验(t检验)中的应用

若,则说明试验的表面效应属于试验误差的概率P>0.05,即表面效应属于试验误差的可能性大,不能否定。这时称“差异不显著”,记为“ns”或不标记;

若,则说明试验的表面效应属于试验误差的概率P在0.01~0.05之间,即0.01<P<0.05,亦即表面效应属于试验误差的可能性较小,应否定,接受,这时称“差异显著”,记为“*”;

若,则说明试验的表面效应属于试验误差的概率P不超过0.01,即P≤0.01。亦即表面效应属于试验误差的可能性更小,应否定,接受,这时称“差异极显著”,记为“**”。(三)两类错误因为显著性检验是根据“小概率事件实际不可能性原理”来否定或接受无效假设的,所以不论是接受还是否定无效假设,都没有100%的把握。也就是说,在检验一个假设时可能犯两类错误。

第一类错误是真实情况为成立,却否定了它,犯了“弃真”错误,也叫Ⅰ型错误(typeⅠerror)

犯Ⅰ型错误的概率不会超过α,Ⅰ型错误也叫α错误,在医学上还称为假阳性错误。

第二类错误是实际不成立,却接受了它,犯了“纳伪”错误,也叫Ⅱ型错误(typeⅡerror)。犯Ⅱ型错误的概率记为β。Ⅱ型错误又叫β错误,在医学上还称为假阴性错误。犯Ⅱ型错误可能性β的大小与α取值的大小、两均数差异大小等因素有关。

两类错误间的关系

如图所示,图中左边曲线是为真时,的分布密度曲线;右边曲线是为真时,的分布密度曲线()。因此,在检验选用显著水平时,应考虑到这两种错误推断后果的严重性大小,还应考虑到试验的难易,试验结果的重要程度。两类错误示意图

由图不难看出,当α值变小时,β值变大;反之,α值变大时,β值变小。也就是说Ⅰ型错误α的降低必然伴随着Ⅱ型错误β的升高。若一个试验耗费大,可靠性要求高,不允许反复,那么α值应取小些;当一个试验结论的使用事关重大,容易产生严重后果,如药物的毒性试验,α值亦应取小些。对于一些试验条件不易控制,试验误差较大的试验,可将α值放宽到0.1,甚至放宽到0.25。在提高显著水平,即减小α值时,为了减小犯Ⅱ型错误的概率,可适当增大样本含量。增大样本含量可以同时降低犯两类错误的可能性。

两类错误的关系

客观实际否定接受成立Ⅰ型错误(α)推断正确(1-α)不成立推断正确(1-β)Ⅱ型错误(β)小结:因为显著性检验是根据“小概率事件实际不可能性原理”来否定或接受无效假设的,所以不论是接受还是否定无效假设,都没有100%的把握。

若经t检验“差异显著”,对此结论有95%的把握,同时要冒5%下错结论的风险;

“差异极显著”,对此结论有99%的把握,同时要冒1%下错结论的风险;

“差异不显著”,是指在本次试验条件下,无效假设未被否定。

“差异不显著”不一定是“没有差异”。这有两种可能:

或者这两个样本所在的总体确实没有差异;

或者这两个样本所在总体平均数有差异而因为试验误差大被掩盖了。因而不能仅凭统计推断就作出绝对肯定或绝对否定的结论。“有很大的可靠性,但有一定的错误率”,这是统计推断的基本特点。四、双侧检验与单侧检验

(一)双侧检验

(two-sidedtest)

在显著性检验中,无效假设为,备择假设为。此时备择假设包括了或两种可能。这个假设的目的在于判断与有无差异,而不考虑谁大谁小。此时,在α水平上否定域为(-∞,-)和[,+∞],对称地分配在t分布曲线的两侧尾部,每侧的概率为α/2,如下图所示。这种利用两尾概率进行的检验叫双侧检验,也叫双尾检验,为双侧检验的临界t值。单侧检验

双侧检验图A图B(二)单侧检验(one-sidedtest)

但在有些情况下,双侧检验不一定符合实际情况。如采用某种新的配套技术措施以期提高鸡的产蛋量,已知此种配套技术的实施不会降低产蛋量。若进行新技术与常规技术的比较试验,无效假设应为,即假设新技术的实施没有提高产蛋量,备择假设应为,即新配套技术的实施使产蛋量有所提高。

检验目的在于推断实施新技术是否提高了产蛋量,这时的否定域在t分布曲线的右尾。在α水平上,的否定域为[,+∞],右侧的概率为α,如图A所示。若无效假设为,备择假设为,此时的否定域在t分布曲线的左尾。在α水平上,的否定域为(-∞,-),左侧的概率为α。如图B所示。这种利用一尾概率进行的检验叫单侧检验也叫单尾检验。此时为单侧检验的临界t值。

(三)单侧检验与双侧检验的关系单侧检验的tα=双侧检验的t2α若对同一资料进行双侧检验也进行单侧检验,那么在α水平上单侧检验显著,只相当于双侧检验在2α水平上显著。所以,同一资料双侧检验与单侧检验所得的结论不一定相同。双侧检验显著,单侧检验一定显著;反之,单侧检验显著,双侧检验未必显著。

(四)应用选用单侧检验还是双侧检验应根据专业知识及问题的要求(分析的目的)在试验设计时就确定。一般若事先不知道所比较的两个处理效果谁好谁坏,分析的目的在于推断两个处理效果有无差别,则选用双侧检验;若根据理论知识或实践经验判断甲处理的效果不会比乙处理的效果差(或相反),分析的目的在于推断甲处理是否比乙处理好(或差),则用单侧检验。

一般情况下,如不作特殊说明均指双侧检验。第二节样本均数与总体均数的差异显著性检验——t检验

在实际工作中往往需要检验一个样本均数与已知总体均数是否有显著差异,即检验样本是否属于某一总体。这里的一般为一些公认的指标。如畜禽正常生理生化指标、生产性能指标、经大量调查所得的平均值、经验数或规定的某种指标值。

检验的基本步骤:

(一)建立假设,其中μ为样本所在总体均值。

(二)在无效假设成立的条件下,计算t值。其中,n为样本含量,为样本标准误。

(三)根据计算出的自由度,查得临界值:。将计算所得t值的绝对值与其比较,作出推断。

若,则P>0.05,不能否定,表明样本均数与总体均数差异不显著;

若,则0.01<P≤0.05,否定,接受,表明样本均数与总体均数差异显著;

若,则P≤0.01,否定,接受,表明样本均数与总体均数差异极显著。【例】在鱼塘中10个点取水样,测定水中含氧量,得数据:4.33,4.62,3.89,4.14,4.78,4.64,4.52,4.48,4.55,4.26(mg/l),能否认为该鱼塘中平均含氧量为4.50(mg/l)。显然,本例应进行双侧t检验。

1.建立假设

2.计算t值

经计算得:=4.421,S=0.267所以

3.查临界t值,并作出推断由df=10-1=9查t值表(附表3)得,=2.262。因为,P>0.05,故不能否定,可以认为该鱼塘中平均含氧量为4.50(m

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论