假设检验基本原理课件_第1页
假设检验基本原理课件_第2页
假设检验基本原理课件_第3页
假设检验基本原理课件_第4页
假设检验基本原理课件_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物统计学假设检验基本原理ppt课件1如果一个人说他从来没有说过谎。他能够证明吗?要证明他没有说过谎,他必须出示他从小到大每一时刻的录音录像,所有书写的东西等等,还要证明这些物证是完全的、真实的、没有间断的。这简直是不可能的。即使他找到一些证人,比如他的同学、家人和同事,那也只能够证明在那些证人在场的某些片刻,他没有被听到说谎。如果一个人说他从来没有说过谎。他能够证明吗?要证明他没有说过2反过来,如果要证明这个人说过谎很容易,只要有一次被抓住就足够了。企图肯定什么事物很难,而否定却要相对容易得多。这就是假设检验背后的哲学。反过来,如果要证明这个人说过谎很容易,只要有一次被抓住就足够3区间估计与假设检验的基本区别上一章中讨论了置信区间的估计方法。它是利用样本数据,以抽样总体的分布为理论基础,用一定的概率保证来计算出原总体中未知参数的区间范围。特别值得注意的是:在作区间估计之前,我们对所要估计的参数是一无所知的。而在这一章中,我们所要做的工作是,先对要研究的参数作一个假设,然后去检验这个假设是否正确。因此假设检验对于所研究的参数总是先有一个假设的值。这也是这两种方法最基本的区别。区间估计与假设检验的基本区别上一章中讨论了置信区间的估计方法4

假设检验又叫显著性检验是统计学中的一个重要内容。显著性检验的方法很多,常用的有u检验、t检验、F检验和

2检验等。尽管这些检验方法的使用条件及用途不同,但检验的基本原理是相同的。 假设检验又叫显著性检验是统计学中的一个重要内容。56它是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。然后在H0成立的条件下计算检验统计量,最后获得P值来判断。

假设检验基本思想6它是利用小概率反证法思想,从问题的对立面(H0)出发间接判67问题实质上都是希望通过样本统计量与总体参数的差别,或两个样本统计量的差别,来推断总体参数是否不同。这种识别的过程,就是本章介绍的假设检验(hypothesistest)。

7问题实质上都是希望通过样本统计量与总体参数的差别,或两个样78假设检验在统计方法中的地位统计方法描述统计推断统计参数估计假设检验8假设检验在统计方法中的地位统计方法描述统计推断统计参数估计8999第一节统计假设检验的基本原理

一、显著性检验的意义第一节统计假设检验的一、显著性检验的意义10如,某地进行了两个水稻品种对比试验,在相同条件下,两个水稻品种分别种植10个小区,获得两个水稻品种的平均产量为:

我们能否根据

就判定这两个水稻品种平均产量不同?结论是,不一定。如,某地进行了两个水稻品种对比试验,在相同条件下,两个水稻品11 这里,试验的表面差异是由两部分组成:一部分是试验的真实差异;另一部分是试验误差。

虽然真实差异未知,但试验的表面差异 是可以计算的,借助数理统计方法可以对试验误差作出估计。所以,可将试验的表面差异与试验误差相比较间接推断真实差异是否存在,即进行差异显著性检验。 这里,试验的表面差异是由两部分组成:12二、显著性检验的步骤

【例3·1】已知某品种玉米单穗重~N(300,9.52),即单穗重总体平均数300g,标准差9.5g。在种植过程中喷洒了某种药剂的植株中随机抽取9个果穗,测得平均单穗重308g,试问这种药剂对该品种玉米的平均单穗重有无真实影响?二、显著性检验的步骤 【例3·1】已知某品种玉米单穗重~13

(一)提出假设

首先对样本所在的总体作一个假设。假设喷洒了药剂的玉米单穗重总体平均数与原来的玉米单穗重总体平均数之间没有真实差异,即或。也就是假设表面差异是由抽样误差造成的。(一)提出假设首先对样本所在的总体作一个假14 这种假设通常称为无效假设或零假设,记为。无效假设是待检验的假设,它有可能被接受,也有可能被否定。相应地还要有一个对应假设,称为备择假设。备择假设是在无效假设被否定时,准备接受的假设,记为或。通过检验,若否定无效假设,我们就接受备择假设。此外,样本频率、变异数以及多个平均数的假设检验,也应根据试验目的提出无效假设和备则假设。 这种假设通常称为无效假设或零假设,记为15(二)确定显著水平

在进行无效假设和备择假设后,要确定一个否定H0的概率标准,这个概率标准叫显著水平(significancelevel)或概率水平(probabilitylevel),记作α。α是人为规定的小概率界限,生物统计学中常取α=0.05和α=0.01两个显著水平。(二)确定显著水平16

(三)计算概率

在假定无效假设成立的前提下,根据所检验的统计数的抽样分布,计算表面差异是由抽样误差造成的概率。本例是在假定无效假设

成立的前提下,研究在~N(300,9.52)这一已知正态总体中抽样所获得的样本平均数的分布。(三)计算概率在假定无效假设成立的前提下1718

若,则样本平均数,,,将其标准化,得

本例,得18 若,则样本平均数18 下面估计|u|≥2.526的两尾概率,即估计P(|u

|≥2.526)是多少?我们知道,两尾概率为0.05的临界值为=1.96,两尾概率为0.01的临界值为=2.58,即:

P(||>1.96) =P(>1.96)+P(<-1.96) =0.05

u 下面估计|u|≥2.526的两尾概率,即估计P(|u|≥19P(||>2.58) =P(>2.58)+P(<-2.58) =0.01 根据样本数据计算所得的值为2.526,介于两个临界值之间,即:<2.526<P(||>2.58) 根据样本数据计算所得的20 所以,||≥2.526的概率P介于0.01和0.05之间,即

0.01<p<0.05

说明假定表面差异()是由抽样误差造成的概率在0.01—0.05之间(小概率取值范围内)。 所以,||≥2.526的概率P介于0.01和0.0521

(四)统计推断

根据小概率事件实际不可能性原理作出否定或接受无效假设的推断。(四)统计推断 根据小概率事件实际不可能性原理作出22 根据这一原理,当表面差异是抽样误差的概率在小于0.05(α)时,可以认为在一次抽样中表面差异是抽样误差实际上是不可能的,因而否定原先所作的无效假设H0:,接受备择假设HA:,即认为存在真实差异。当表面差异是抽样误差的概率大于0.05(α)时,说明无效假设H0:成立的可能性大,不能被否定,因而也就不能接受备择假设HA:。 根据这一原理,当表面差异是抽样误差的概率在小23 显著性检验的结果表明:本例的样本平均数与原总体平均数之间的表面差异()除包含抽样误差外,还包含真实差异(),即喷洒了药剂的玉米单穗重总体平均数与原来的玉米单穗重总体平均数不同。 显著性检验的结果表明:2425 综上所述,显著性检验,从提出无效假设与备择假设,到根据小概率事件实际不可能性原理来否定或接受无效假设,这一过程实际上是应用所谓“概率性质的反证法”对样本所属总体所作的无效假设的统计推断。 上述显著性检验利用了分布来估计出∣u∣≥2.526的两尾概率,所以称为检验.

25 综上所述,显著性检验,从提出无效假设与备择假设2526假设检验的步骤可概括为:(1)对样本所属总体提出无效假设H0和备择假设HA;(2)确定检验的显著水平α;(3)在H0正确的前提下,根据抽样分布的统计数,进行假设检验的概率计算;(4)根据显著水平α的统计数(如u值)临界值,进行差异是否显著的推断。26假设检验的步骤可概括为:(1)对样本所属总体提出无效假设26三、显著水平与两种类型的错误

(一)显著水平

用来否定或接受无效假设的概率标准叫显著水平,记作。在生物学研究中常取=0.05,称为5%显著水平;或=0.01,称为1%显著水平或极显著水平。三、显著水平与两种类型的错误 用来否定或接受无效假设的概27可以看到,是否否定无效假设,是用实际计算出的检验统计数的绝对值与显著水平对应的临界值比较:若||≥,则在水平上否定若||<,则不能在水平上否定。

可以看到,是否否定无效假设28

区间和称为水平上的否定域,而区间则称为水平上的接受域。 区间和29 因为在显著性检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”,所以我们下的结论不可能有百分之百的把握。(二)两类错误

因为在显著性检验中,否定或接受无效假设的依据是“小概率事件30 例如,经检验获得“差异显著”的结论,我们有95%的把握否定无效假设H0,同时要冒5%下错结论的风险;(拒真错误)

而经检验获得“差异不显著”的结论,在统计学上是指“没有理由”否定无效假设H0,同样也要冒下错结论的风险。(存假错误) 例如,经检验获得“差异显著”的结论,我们有95%的把31

显著性检验可能出现两种类型的错误:Ⅰ类错误(拒真)与Ⅱ类错误(存假)。 Ⅰ类错误又称为错误,就是把真实的差异错判为是非真实的差异,即实际上H0正确,检验结果为否定H0。犯Ⅰ类型错误的可能性一般不会超过所选用的显著水平;显著性检验可能出现两种类型的错误:Ⅰ类错误(拒真)与32 Ⅱ类错误又称为错误,就是把非真实的差异错判为是真实的差异,即实际上HA正确,检验结果却未能否定H0

。犯Ⅱ类型错误的可能性记为

,一般是随着的减小或试验误差的增大而增大,所以越小或试验误差越大,就越容易将试验的真实差异错判为试验误差。 Ⅱ类错误又称为错误,就是把非真实的差异错判为是真实33显著性检验的两类错误归纳如下:表3-1显著性检验的两类错误显著性检验的两类错误归纳如下:表3-1显著性3435

因而,不能仅凭统计推断就简单地作出绝对肯定或绝对否定的结论。“有很大的可靠性,但有一定的错误率”这是统计推断的基本特点。35 因而,不能仅凭统计推断就简单地作出绝对肯定或绝对否35为了降低犯两类错误的概率,一般从选取适当的显著水平和增加试验重复次数来考虑。因为选取数值小的显著水平值可以降低犯Ⅰ类型错误的概率,但与此同时也增大了犯Ⅱ型错误的概率,所以显著水平值的选用要同时考虑到犯两类错误的概率的大小。为了降低犯两类错误的概率,一般从选取适当的显著水3637ab减少(增加)I型错误,将会增加(减少)II型错误增大n同时降低a与ba与b间的关系37ab减少(增加)I型错误,将会增加(减少)II型错误a3738减少I型错误的主要方法:假设检验时设定

值。减少II型错误的主要方法:提高检验效能。提高检验效能的最有效方法:增加样本量。如何选择合适的样本量:实验设计。38减少I型错误的主要方法:假设检验时设定值。减少II型38 在【例3·1】中,对应于无效假设H0: 的备择假设为HA:。HA实际上包含了或这两种情况。此时,在水平上否定域为和,对称地分配在分布曲线的两侧尾部,每侧尾部的概率为

,如图3-1所示。这种利用两尾概率进行的检验叫两尾检验.为水平两尾检验的临界值。四、两尾检验与一尾检验 在【例3·1】中,对应于无效假设H0: 3940图3-1双侧检验抽样分布H0值临界值临界值a/2a/2

样本统计量拒绝域拒绝域接受域1-

置信水平40图3-1双侧检验抽样分布H0值临界值临界值a/2a4041

图3-2单侧检验-1H0值临界值a样本统计量拒绝域接受域抽样分布1-

置信水平41图3-2单侧检验-1H0值临界值a样本统计量拒绝4142

图3-2单侧检验-2H0值临界值a样本统计量拒绝域接受域抽样分布1-

置信水平42图3-2单侧检验-2H0值临界值a样本统计量拒绝42 两尾检验的目的在于判断与有无差异,而不考虑与谁大谁小。 在有些情况下两尾检验不一定符合实际情况。 两尾检验的目的在于判断与有无差异,而不考虑43 例如,目前我国大豆育种工作者认为,大豆籽粒蛋白质含量超过45%()的品种为高蛋白品种。如果进行样品含

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论