第四章 显著性检验_第1页
第四章 显著性检验_第2页
第四章 显著性检验_第3页
第四章 显著性检验_第4页
第四章 显著性检验_第5页
已阅读5页,还剩103页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

总体总体样本样本样本样本样本抽样分布统计推断图抽样分布与统计推断的关系第四章显著性检验统计推断假设检验参数估计显著性检验点估计区间估计t,u,F,χ2检验第一节显著性检验基本原理第二节单个样本平均数的显著性检验第三节两个样本平均数差异的显著性检验第四节百分数资料的显著性检验率五节参数的区间估计本章主要内容及难点1.首先介绍显著性检验的基本原理和步骤;2.其次介绍显著水平、两类错误、一尾检验、两尾检验的概念;3.单个样本平均数的t检验4.配对资料t检验,非配对资料t检验5.百分数资料的u检验难点:显著性检验基本原理理解,t检验、u检验的使用条件。第一节显著性检验

的基本原理一、显著性检验的意义显著性检验的意义在于:区分样本统计数与所在总体参数的差异是由试验误差引起,还是二者本质不同。

例如,大豆籽粒蛋白质含量高于45%(记为μ0)的品种为高蛋白品种。某种子公司对一大豆新品种随机抽取5个样品进行测定,得平均蛋白质含量为,。我们能否根据1.5%就认定该大豆新品种就是高蛋白品种?

———不一定。真实差异表面差异

虽然真实差异(μ-μ0)不能计算,但表面差异(-μ0)可以计算,试验误差也可以用数理统计方法估计。所以可将表面差异与试验误差比较间接推断真实差异是否存在。如果(μ-μ0)=0,我们就说真实差异不存在;如果(μ-μ0)≠0,我们就说真实差异存在。这就是显著性检验的基本思想。

又如,某地做了两个水稻品种对比试验,在相同条件下,两个水稻品种分别种植10个小区,获得两个水稻品种的平均产量为

=510㎏/666.7㎡、=500㎏/666.7㎡。

=10㎏/666.7㎡。仅凭这个表面差值我们照样不能判断两个水稻品种生产潜力本质上不同。于是表面差异真实差异试验误差

同样真实差异(μ1-μ2)不能计算,但表面差异()可以计算,试验误差也可以用数理统计方法估计。所以可将表面差异与试验误差比较间接推断真实差异是否存在。如果(μ1-μ2)=0,我们就说真实差异不存在;如果(μ1-μ2)≠0,我们就说真实差异存在。统计假设测验的意义用简式表示为(-μ0)μ-μ0=0?由推断()μ1-μ2=0?

二、显著性检验的步骤【例4·1】已知某品种玉米单穗重x~N(300,9.52),即单穗重总体平均数300g,标准差9.5g。种植过程喷洒了增产素,随机抽取9个果穗,测得平均单穗重308g,问这种增产素对该品种玉米的平均单穗重有无真实影响?

(一)提出假设对样本所在总体作一个假设。假设喷洒增产素的玉米单穗重总体平均数μ与原玉米单穗重总体平均数μ0之间没有真实差异,记为H0:或。也就是假设表面差异()全由抽样误差造成。这个假设叫无效假设(nullhypothesis)。

与此对应的还有一个备择假设(alternativehypothesis)。备择假设是在无效假设被否定时,准备接受的假设,记为HA:或。具体到这个例子,备择假设意味着喷洒增产素的玉米单穗重总体平均数μ与原来的玉米单穗重总体平均数μ0之间存在真实差异。

(二)计算概率在无效假设成立前提下,根据所检验的统计数的抽样分布规律,计算表面差异()全由抽样误差造成的概率有多大。也就是计算无效假设成立这个事件的概率有多大。

本例是在无效假设H0:成立的前提下,研究从N(300,9.52)总体中以n=9抽样所得样本平均数的分布。由抽样分布结论知:本例

那么u=2.526的概率是多少?因为(u0.05=1.96)<(u=2.526)<(u0.01=2.58)所以,这个u值的概率为:0.01<p<0.05,说明我们所作的无效假设H0:成立的可能性在1%与5%之间,也即表面差异()全由抽样误差造成的概率在0.01~0.05之间。

(三)统计推断根据小概率原理作出否定或不能否定无效假设的推断。

若随机事件的概率很小,例如小于0.05,0.01,0.001,称之为小概率事件。在统计学上,把小概率事件在一次试验中看成是实际不可能发生的事件,称为小概率事件实际不可能原理。

如果把0.05作为判定小概率事件的标准,那么本例所作的无效假设是一个小概率事件。它在一次抽样中实际不可能发生,因而否定H0:μ=μ0,接受HA:μ≠μ0,认为这个样本所在的总体与原总体存在真实差异。即喷施增产素对这个玉米品种的平均单穗重有真实影响,它能使玉米的穗重增加。这种利用u分布计算概率进行的假设检验称为u检验。

三、显著水平与两类错误

(一)显著水平(significantlevel)用来判定小概率事件的概率标准叫显著水平,记作α。在生物学研究中常取α=0.05、0.01。到底选用哪种显著水平,要根据试验要求或试验结论的重要性而定。

对u检验,若∣u∣<1.96,说明试验的表面差异属于试验误差的概率p>0.05,即表面差异属于试验误差的可能性大。统计学上把这一检验结果表述为:“总体平均数μ与μ0差异不显著”;

若1.96≤|u|<2.58,则说明试验的表面差异属于试验误差的概率p在0.01——0.05之间,即0.01<p≤0.05,表面差异属于试验误差的可能性较小。统计学上把这一检验结果表述为:“总体平均数μ与μ0差异显著”,u值右上方标记*;

若|u|≥2.58,则说明试验的表面差异属于试验误差的概率p不超过0.01,即p

≤0.01,表面差异属于试验误差的可能性更小。统计上把这一检验结果表述为:“总体平均数μ与μ0差异极显著”,U值右上方标记**。

假设检验的几何意义:

接受区域φ(u)

-uα0uαu否定区域(二)两类错误显著性检验可能出现两种类型的错误:

Ⅰ型错误又称为α错误,本来无效假设H0正确,但检验结果却否定H0。就是把试验误差当成真实差异。犯Ⅰ型错误的原因是根据小概率原理否定无效假设造成的。

例如140行水稻产量一例,假如把它们当成一个有限总体,且服从正态分布。每个观察值是一个样本,则距平均数μ±1.96σ范围内观察值占95%,大于这个范围以外,占5%,处在正态分布的两尾。如果从这个总体抽样,抽到范围外的观察值几率较小,只有5%,但它仍是这个总体的样本。现在我们根据小概率原理否定了它是这个总体的样本,犯的这个错误叫Ⅰ型错误,概率不超过5%。

又如我们在做新品种与原品种的比较试验中,无效假设是新品种不增产,备择假设是新品种增产。α=0.05,通过样本信息和在无效假设前提下,计算的概率小于0.05,则否定无效假设,如果概率为10%,则不能否定无效假设,但是新品种不增产的概率也只有10%,增产的可能性为90%,实际应用中,人们把没有充分理由否定的无效假设认可为接受,那么接受这个无效假设就有可能犯Ⅱ型错误,犯Ⅱ型错误的概率在本例为10%。Ⅱ型错误又称β错误,本来无效假设H0是错误的,但检验结果却接受H0。就是把真实差异当成试验误差。犯Ⅱ型错误,一般是随着的减小或试验误差的增大而增大。犯Ⅱ型错误的原因是原假设下的抽样分布与真实分布发生部分重叠。

为了降低犯两类错误的概率,一般从选取适当的显著水平α和增加试验重复次数n来考虑。β

四、两尾检验与一尾检验

两尾检验:对应于无效假设H0:的备择假设为HA:。在α水平上的否定域为和,对称地分配在u分布曲线的两侧尾部,每侧尾部的概率为α/2。uα为α水平两尾检验的临界u值。两尾检验的目的在于判断μ与μ0有无显著差异,而不考虑μ与μ0谁大谁小。这种利用两尾概率进行的假设检验称两尾检验。接受区域

95%否定区域

2.5%否定区域2.5%μ-uaua图4.1

α=0.05时HA:µ≠µ0的HA接受区和否定区

一尾检验:对应于无效假设H0:μ=μ0的备择假设为HA:μ>μ0(或HA:μ<μ0)。这时否定域位于u分布曲线的右尾(或左尾),即或)。例如,当α=0.05时,否定域为(或),uα为一尾检验的临界u值。这种利用一尾概率进行的假设检验称一尾检验。图aα=0.05,H0:µ=µ0;HA:µ>µ00.95α=0.05接受区否定区α=0.05否定区接受区0.95图bα=0.05,H0:µ=µ0;HA:µ<µ0

五、显著性检验应注意的问题1、要有合理的试验设计和准确的试验操作,避免系统误差、降低试验误差,提高试验的准确性和精确性。2、选用的显著性检验方法要符合其应用条件。3、选用合理的统计假设。4、正确理解显著性检验结论的统计意义。5、统计分析结论的应用,还要与经济效益等结合起来综合考虑。第二节样本平均数与总体平均数差异显著性检验一、总体方差σ2已知或σ2虽未知但

样本容量n相当大,用u检验法。【例4·2】糯玉米良种苏玉糯1号的鲜果穗重x~N(216.5,45.22)。现引进一高产品种奥玉特1号,在8个小区种植,得其鲜果穗重为:255.0

185.0

252.0

290.0

159.9190.0

212.7

278.5(g),问新引入品种鲜果穗重与苏玉糯1号有无显著差异?1、提出假设H0:μ=μ0

=216.5g,即新引入品种鲜果穗重与苏玉糯1号鲜果穗重相同;HA:μ≠μ=216.5g,即新引入品种鲜果穗重与苏玉糯1号鲜果穗重不相同。2、计算u值

3、统计推断

由于计算所得的u<u0.05=1.96,故p>0.05。不能否定H0:μ=μ0=216.5g,表明新引入品种鲜果穗重与苏玉糯1号鲜果穗重差异不显著,可以认为新引入品种鲜果穗重与苏玉糯1号鲜果穗重相同。

【例4·3】晚稻良种汕优63的千粒重μ0=27.5g。现育成一高产品种协优辐819,在9个小区种植,得千粒重为:32.5、28.6、28.4、24.7、29.1、27.2、29.8、33.3、29.7(g),试问新育成品种的千粒重与汕优63有无显著差异?二、总体方差σ2为未知、且为小样本(n<30),用t检验法

本例,由于总体方差未知,又是小样本,故采用t检验法。其步骤如下:1、提出假设H0:μ=μ0=27.5g,即新育成品种千粒重与当地良种汕优63的千粒重相同。HA:μ≠27.5g,即新育成品种千粒重与当地良种汕优63的千粒重不相同。

2、计算t值

3、统计推断由df=8查临界t值,得:t0.05(8)=2.306,计算所得的|t|<t0.05(8),故p>0.05,不能否定H0:μ=27.5g,表明新育成品种千粒重与当地良种汕优63的千粒重差异不显著,可以认为新育成品种千粒重与当地良种汕优63的千粒重相同。第三节两个样本平均数差异

显著性检验

一、非配对设计两个样本平均数

差异显著性检验

非配对设计是将试验单位完全随机地分为两组,然后再随机地对两组分别实施两种不同处理;两组试验单位相互独立,所得观测值相互独立;两个处理的样本容量可以相等,也可以不相等,所得数据称为非配对数据(也称成组数据)。

(一)两个样本的总体方差σ12和σ22已知或总体方差σ12和σ22未知,但为大样本时,用u检验法。u值的计算公式为:均数差数标准误计算公式为:【例4·4】已知优质早稻佳辐占小区产量的σ2=1.35。现用A、B两种方法抽样,A法取15(n1)个样点,得小区产量=7.69kg;B法取9(n2)个样点,得小区产量=8.77kg。问A、B两种取样方法的小区产量差异是否显著?1、提出假设

H0:μ1=μ2;即A、B两种取样法的小区产量相同;

HA:μ1≠μ2;即A、B两种取样法的小区产量不相同。显著水平为0.05。2、计算u值已知,n1=15,n2=93、统计推断

因为计算所得的|u|介于u0.05=1.96与u0.01=2.58之间,故0.01<p<0.05,否定H0:μ1=μ2,接受HA:μ1≠μ2,即A、B两种取样方法所得的小区产量差异显著。(二)在两个样本的总体方差σ12和σ22未知、但,且为小样本时,用t检验法。又在H0:μ1=μ2前提下,意味着两样本来自同一总体,因而可将样本合并,计算样本合并均方估计总体方差。且统计学已证明,合并均方是总体方差的无偏估计。【例4·5】测得马铃薯两个品种鲁引1号和大西洋的块茎干物质含量(%)结果如下表所示。试检验两个品种的块茎干物质含量有无显著差异。鲁引1号18.6820.6718.4218.0017.4415.95大西洋18.6823.2221.4219.0018.921、提出假设H0:μ1=μ2,即两个马铃薯品种的块茎干物质含量相同;HA:μ1≠μ2,即两个马铃薯品种的块茎干物质含量不相同。2、计算t值本例

3、统计推断

根据df=9,查附表3得:t0.05(9)=2.262,因为计算得的|t|=1.926<t0.05(9)=2.262,故p>0.05,不能否定H0:μ1=μ2,表明两个马铃薯品种的块茎干物质含量差异不显著,可以认为两个马铃薯品种的块茎干物质含量相同。

(三)两个样本的总体方差σ12和σ22为未知,,且两个样本又为小样本时,用近似t

检验法。t′的自由度为有效自由度df′,其计算公式为【例4·6】测定糯玉米品种江南花糯的出籽率(%)8次(n1=8),得=68.06,=123.74;测定扬农01的出籽率(%)6次(n2=6),得=62.88,=46.67。试检验这两个糯玉米品种出籽率差异是否显著。1、提出假设H0:μ1=μ2,即两个糯玉米品种出籽率相同;HA:μ1≠μ2,即两个糯玉米品种出籽率不相同。2、计算t'值

3、统计推断根据df′=10查附表3得:t0.05(10)=2.228,因计算得的|t′|<2.228,故p>0.05,不能否定H0:μ1=μ2,表明两个糯玉米品种出籽率差异不显著,可以认为两个糯玉米品种出籽率相同。二、配对设计两样本平均数差异显著性检验

当试验单元间差异较大,用完全随机设计将会增大试验误差,降低试验结果的准确性。为此可按局部控制的原理,把条件一致的两个供试单元配成一对,并设多个配对,再对每一配对两个单元随机独立实施一处理,这就是配对试验,实为处理数为2的随机区组试验,这样得到的数据称为配对数据。(x11,x21)(x12,x22)(x13,x23)(x14,x24)由于各配对间供试单元差异较大,不便由x1-x2--推断µ1=µ2?可由di=x1i-x2i消除不同配对间试验单元的差异。因此可通过各配对差数的平均数来推断μd=0或某一常数?-μd)(d_st=d-遵从df=n-1的t分布。sd-称为差数标准误[例5.6]

选较一致的两株番茄配成一对,共7对,每对中一株接种A处理病毒、另一株接种B处理病毒,以叶面枯斑数作为致病力强弱的指标。试分析这两种处理病毒方法的差异显著性。

配对号1234567∑

Ax1i1013835206Bx2i25121415122718

差数di-151-6-12-7-7-12-581、提出假设H0:μd=μ1-μ2=0,即两种钝化病毒方式病斑数相同;HA:μd=μ1-μ2≠0,即两种钝化病毒方式病斑数本质不相同;

2、计算t值

t值公式

差数标准误公式

df=n-13、推断第四节百分率资料的显著性检验二项

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论