第六统计假设检验演示文稿_第1页
第六统计假设检验演示文稿_第2页
第六统计假设检验演示文稿_第3页
第六统计假设检验演示文稿_第4页
第六统计假设检验演示文稿_第5页
已阅读5页,还剩106页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六统计假设检验演示文稿目前一页\总数一百一十一页\编于十点(优选)第六统计假设检验目前二页\总数一百一十一页\编于十点一、统计推断的概念

统计推断:是指用一个或一系列样本的结果去估计总体可能的结果的过程。统计推断基本上包括两大部分的内容,一是假设测验,二是参数估计。目前三页\总数一百一十一页\编于十点统计推断参数估计假设测验点估计区间估计统计推断的前提条件:资料必须来自随机样本;统计数的分布规律必须已知。目前四页\总数一百一十一页\编于十点

二、统计假设测验的意义[例]有一水稻施肥试验,甲乙两种施肥方法的水稻产量如下x1(甲)x2(乙)8.29.68.78.99.48.510.711.29.210.911.110.8Σ=53.3Σ=63.9=8.88=10.65能否仅凭这两个平数的差值-=1.77,立即得出甲与乙两种施肥方法的水稻产量不同的结论呢?目前五页\总数一百一十一页\编于十点

统计学认为,这样得出的结论是不可靠的。因为如果我们再做一次甲乙两种施肥方法试验,又可得到两个样本资料。由于抽样误差的随机性,两样本平均数就不一定是8.88和10.65,其差值也不一定是1.77。造成这种差异可能有两种原因,一是两种施肥方法不同造成的差异,即是两种施肥方法本质不同所致,另一可能是试验误差(或抽样误差)。

二、统计假设测验的意义目前六页\总数一百一十一页\编于十点

对两个样本进行比较时,必须判断样本间差异是抽样误差造成的,还是本质不同引起的。如何区分两类性质的差异?怎样通过样本来推断总体?这正是显著性检验要解决的问题。

二、统计假设测验的意义目前七页\总数一百一十一页\编于十点

二、统计假设测验的意义

两个总体间的差异如何比较?一种方法是研究整个总体,即由总体中的所有个体数据计算出总体参数进行比较。这种研究整个总体的方法是很准确的,但常常是不可能进行的,因为总体往往是无限总体,或者是包含个体很多的有限总体。因此,不得不采用另一种方法,即研究样本,通过样本研究其所代表的总体。目前八页\总数一百一十一页\编于十点

二、统计假设测验的意义

设甲施肥方法的总体平均数为,乙施肥方法的总体平均数为,试验研究的目的,就是要给、是否相同做出推断。由于总体平均数、未知,在进行显著性检验时只能以样本平均数、作为检验对象,更确切地说,是以(-)作为检验对象。目前九页\总数一百一十一页\编于十点观测值由两部分组成,即若样本含量为n,则可得到n

个观测值:样本平均数:对于接受不同处理的两个样本来说,则有:

二、统计假设测验的意义处理效应试验误差表面效应目前十页\总数一百一十一页\编于十点

虽然处理效应(-)未知,但试验的表面效应是可以计算的,借助数理统计方法可以对试验误差作出估计。所以,可从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在,这就是显著性检验的基本思想。

二、统计假设测验的意义目前十一页\总数一百一十一页\编于十点

先假设真实差异不存在,表面差异全为试验误差。然后计算这一假设出现的概率,根据小概率事件实际不可能性原理,判断假设是否正确。这是对样本所属总体所做假设是否正确的统计证明,称为统计假设测验(statisticalhypothesistest)。

二、统计假设测验的意义目前十二页\总数一百一十一页\编于十点三、显著性检验的基本步骤

(一)首先对试验样本所在的总体作假设无效假设:=或-=0或无效假设是被检验的假设,通过检验可能被接受,也可能被否定。提出H0的同时相应地提出一对应假设,备择假设:或或备择假设是在无效假设被否定时准备接受的假设。目前十三页\总数一百一十一页\编于十点

如何才能判断Ho是否正确?就需要一个界限和标准。统计区间:在统计假设检验中“接受”或“否定”所提出的“无效假设”Ho的概率范围,称为统计区间。显著水平:统计推断时,衡量差异显著性程度的概率标准,称为显著性水平,以α表示。常用显著水平α=0.05称为5%的显著水平

α=0.01称为1%的显著水平也有用

α=0.25称为25%的显著水平

α=0.10称为10%的显著水平

(一)首先对试验样本所在的总体作假设目前十四页\总数一百一十一页\编于十点

µ0=360kg

,σ=40kgn=16,x=380kg-

µ

µ≠µ0?原品种新品系(二)在无效假设成立的前提下,计算无效假

设正确的概率目前十五页\总数一百一十一页\编于十点在H0:μ=μ0(360kg)为正确的前提下,样本平均数=380kg则是此分布总体中的一个随机变量,据此,就可以根据正态分布求概率的方法算出在平均数μ=360kg的总体中,抽到一个样本平均数和μ相差≥20kg的概率,从而确定是接受或否定H0。(二)在无效假设成立的前提下,计算无效假

设正确的概率目前十六页\总数一百一十一页\编于十点(二)在无效假设成立的前提下,计算无效假

设正确的概率

0f()查附表2,即得u值对应的概率p<0.05。表明20Kg差异属于试验误差的概率小于5%。根据小概率事件实际不可能性原理,这个假设应被否定,即表面差异不全为试验误差,新品系与原品种之间存在真实差异。目前十七页\总数一百一十一页\编于十点统计上,当1%<p≤5%称所测差异显著,

p≤1%称差异极显著,

p>5%称差异不显著,所以,统计假设测验又叫差异显著性测验(differencesignificancetest)判定是否属小概率事件的概率值叫显著水平(significantlevel),一般以α表示。农业上常取0.05和0.01。凡计算出的概率p小于α的事件即为小概率事件。目前十八页\总数一百一十一页\编于十点从H0正确出发,根据的抽样分布划出一个区间,如-μ的差数在这一区间则接受H0,简称为接受区间,则该差数应解释为随机误差;如-μ的差数在这一区间外则否定H0,简称为否定区间,则该差数应解释为本质上不同的真实差异。区间的确定:接受区间与否定区间的两个(二)在无效假设成立的前提下,计算无效假

设正确的概率目前十九页\总数一百一十一页\编于十点(二)在无效假设成立的前提下,计算无效假

设正确的概率若要在0.05水平上接受H0:µ=µ0α=0.05时,由附表2得u=1.96则u=µ0_x-σx-︳︳<1.96(σx-=σ√n)x-<µ0-1.96σx-()µ0+1.96σx-()<假设接受区域(acceptanceregion)假设否定区域(negationregion)x-≤(µ0-1.96σx-)σx-x-≥(µ0+1.96)或目前二十页\总数一百一十一页\编于十点接受区域

95%否定区域

2.5%否定区域2.5%360340.4379.5

α=0.05时H0:µ=µ0的接受区和否定区µ0-1.96σx-()µ0+1.96σx-()=360-1.96×10=340.4kg=360+1.96×10=379.5kg目前二十一页\总数一百一十一页\编于十点同理,α=0.01时,由附表2得u=2.58,则H0:µ=µ0的接受区域为x-<µ0-2.58σx-()µ0+2.58σx-()<否定区域为--x≤(µ0-2.58σx-)σx-x≥(µ0+2.58)或-(二)在无效假设成立的前提下,计算无效假

设正确的概率目前二十二页\总数一百一十一页\编于十点

在实际检验时,计算概率可以简化,因为在标准正态分布下:

P(|u|>1.96)=0.05,

P(|u|>2.58)=0.01,因此,在用u分布作检验时,

|u|≥1.96,表明概率P<0.05,可在0.05水平上否定H0;

|u|≥2.58,表明概率P<0.01,可在0.01水平上否定H0|u|<1.96,表明P>0.05,可接受H0。不必再计算实际的概率。目前二十三页\总数一百一十一页\编于十点

否定区间

否定区间接受区间f(u)-uα0uαU

f()接受区间目前二十四页\总数一百一十一页\编于十点

(三)根据“小概率事件实际不可能性原理”否定或接受无效假设

在统计学上,把小概率事件在一次试验中看成是实际上不可能发生的事件,称为小概率事件实际不可能原理。根据这一原理,当试验的表面效应是试验误差的概率小于0.05时,可以认为在一次试验中试验表面效应是试验误差实际上是不可能的,因而否定原先所作的无效假设,接受备择假设。目前二十五页\总数一百一十一页\编于十点四、两尾测验和一尾测验统计假设测验中H0:µ=µ0具有两个否定区,HA:µ≠µ0,这类测验称两尾测验(two-tailedtest),在假设测验中所考虑的概率为左右两尾概率之和。当H0:µ≤µ0,HA:µ>µ0,则否定区在分布的右尾。x-x-当H0:µ≥µ0,HA:µ<µ0,则否定区在分布的左尾。象这种在假设测验中所考虑的概率只用一尾概率的测验称为一尾测验(one-tailedtest)。选用一尾测验还是两尾测验,应根据专业知识而定。目前二十六页\总数一百一十一页\编于十点α=0.05时H0:µ≤µ0的接受区和否定区0.95α=0.05接受区否定区α=0.05否定区接受区0.95α=0.05时H0:µ≥µ0的接受区和否定区否定区间为否定区间为目前二十七页\总数一百一十一页\编于十点四、统计假设测验的两类错误检验结果有四种情况:第一类错误:把非真实差异错判为真实差异。犯此错误的概率为α。

检验结果真实情况否定H0接受H0H0正确第一类错误正确H0错误正确第二类错误f()μ0接受区间否定区间目前二十八页\总数一百一十一页\编于十点第二类错误:把真实差异错判为非真实差异。犯此错误的概率为β。

由图可见,β的大小与|μ-μ0|、α有反比关系;而与标准误有正比关系。β

μ0μ否定区间

接受区间

β目前二十九页\总数一百一十一页\编于十点实际中控制犯两类错误的措施有以下几种:①适当增大水平间差距,即增大|μ-μ0|。②增加n。③根据试验目的,通过调整α的大小来控制犯错误的概率。即当试验者主观希望获得差异显著(不显著)的检验结果时,(此时易接受第一类(二类)错误),应适当减小(增大)α。目前三十页\总数一百一十一页\编于十点第二节单个平均数的假设检验

单个平均数的假设检验就是检验某一样本所属总体平均数是否和某一指定的总体平均数相同,检验所依据的理论基是平均数的抽样分布

目前三十一页\总数一百一十一页\编于十点一单个平均数u检验(一)应用条件:

1总体参数μ0和σ2为已知。

2总体参数μ0已知,σ2为未知,但为大样本(n≥30),可用S2估计。目前三十二页\总数一百一十一页\编于十点(二)方法步骤[例1]已知某工厂排污水中石油浓度分布属正态分布,经处理后随机采样16次,得样本平均数=48mg·L-1。已知原总体平均数μ=50mg·L-1,总体方差σ2=6.25,问污水处理前后石油含量有无显著差异?

一单个平均数u检验目前三十三页\总数一百一十一页\编于十点统计假设

H0:μ=μ0(50g·L-1)

HA:μ≠μ0

计算均数标准误和μ值

推断u>u0.01(2.58),差异极显著表明污水经处理后石油含量极显著地降低

目前三十四页\总数一百一十一页\编于十点(一)t分布二、单个平均数t检验

不论X是否服从正态分布,只要n很大,都有~将随机变量标准化得:

当总体标准差σ未知时,以样本标准差S代替σ所得到的统计量记为t目前三十五页\总数一百一十一页\编于十点t分布的定义:若X~N(μ,σ2),则t=

~t(df)——t分布。n……

,st=t总体

Xμ,σ2目前三十六页\总数一百一十一页\编于十点在计算时,由于采用S来代替σ,使得t

变量不再服从标准正态分布,而是服从t分布(t-distribution)。它的概率分布密度函数如下:(一)t分布df=n-1为自由度。

二、单个平均数t检验

目前三十七页\总数一百一十一页\编于十点

1、t分布受自由度的制约,每一个自由度都有一条t分布密度曲线。

2、t分布密度曲线以纵轴为对称轴,左右对称,且在t=0时,分布密度函数取得最大值。

3、与标准正态分布曲线相比,t分布曲线顶部略低,两尾部稍高而平。df越小这种趋势越明显。df越大,t分布越趋近于标准正态分布。当n>30时,t分布与标准正态分布的区别很小;n>100时,t分布基本与标准正态分布相同;n→∞时,t

分布与标准正态分布完全一致。t分布的主要特性:目前三十八页\总数一百一十一页\编于十点-3-2-10123t或u0.40.30.20.1f(t)或(u)Фu分布t分布(df=1)t分布及其与标准正态曲线的比较目前三十九页\总数一百一十一页\编于十点

4、P(a<t<b)==面积A

a0bt

f(t)At分布的主要特性:目前四十页\总数一百一十一页\编于十点表3为学生氏t值表(两尾),表达式子P(|t|≥tα)=α中tα与α之间的关系,由α查找tα。如图,有P(|t|≥tα)=P(t≤-tα+t≥tα)

=P(t≤-tα)+P(t≥tα)

查t表时所用参数为自由度df。-tα0tαt

目前四十一页\总数一百一十一页\编于十点例如,当df=3时,查附表3得两尾概率为0.05的临界t值为t0.05,3=3.182。这表明从3.182~∞的概率和从-3.182~-∞的概率各为0.025。而两尾概率为0.01的临界t值为t0.01,3=5.841,由此可见,df不变时,P越大,t越小;P越小,t越大。两尾测验,H0:μ=μ0t≥tα(df),否定H0,反之接受H0。一尾测验,H0:μ≤μ0t≥t2α(df),否定H0,反之接受H0。若H0:μ≥μ0t≤-t2α(df),否定H0,反之接受H0。这种用t分布计算所作假设的概率,进行的假设测验叫t测验(t-test)目前四十二页\总数一百一十一页\编于十点0f(t)t-tα(df)=

-3.182tα(df)=3.182∞-∞df=30.0250.025t分布的两尾测验和一尾测验临界t值t2α(df)=2.353-t2α(df)=-2.353目前四十三页\总数一百一十一页\编于十点应用条件:

总体参数μ0和σ2为已知或未知,样本平均数来自小样本(n<30)。二、单个平均数t检验

目前四十四页\总数一百一十一页\编于十点方法步骤

[例2]种在受污染地区小麦千粒重平均为36.0g,随机抽取未受污染地区10个点小麦千粒重为38.0、37.0、39.0、38.0、39.0、38.0、39.0、36.0、38.0、37.0g,问污染与无污染地区小麦千粒重有无显著差异。二、单个平均数t检验

目前四十五页\总数一百一十一页\编于十点方法步骤

第一步建立假设H0:μ=μ0(36.0g)HA:μ≠μ0

第二步确定显著水准α=0.05、0.01(两尾)二、单个平均数t检验

目前四十六页\总数一百一十一页\编于十点第三步计算统计量t值和自由度dfdf=n-1=10-1=9二、单个平均数t检验

方法步骤

目前四十七页\总数一百一十一页\编于十点第四步查表找临界t值tα,并作统计推断:查表3得t0.05(9)=2.262,t0.01(9)=3.250∵|t|=6.05>t0.01(9)=3.250∴否定H0,认为差异极显著,即受污染地区极显著地影响了小麦千粒重。二、单个平均数t检验

目前四十八页\总数一百一十一页\编于十点

单个平均数的统计假设检验

U检验

t检验适用情况正态分布或已知σ

或n≥30σ未知,n<30检验方式两尾检验一尾检验两尾检验一尾检验

统计假设H0

μ=μ0μ=μ0μ=μ0μ=μ0HAμ≠μ0μ>μ0或μ<μ0μ≠μ0μ>μ0或μ<μ0检验统计量

检验临界值C

UαU0.05=1.96U0.01=2.58

U2αU0.1=1.64U0.02=2.32tα(n-1)

t2α(n-1)统计推断否定H0

U≥C

t≥C接受H0

U≤C

t≤C目前四十九页\总数一百一十一页\编于十点第三节两个平均数相比较的假设检验由||推断μ1-μ2=0?目前五十页\总数一百一十一页\编于十点一成组数据的平均数比较成组数据其中n1、n2可等可不等。甲乙将试验单位完全随机分为两组,再随机各实施一处理,这样得到的数据称为成组数据,以组的平均数作为比较的标准。目前五十一页\总数一百一十一页\编于十点(一)u检验1、应用条件

两个样本总体方差σ12和σ22已知,总体方差未知,但n1≥30、n2≥30一般情况下,两个总体的方差是未知的,因此这里着重讨论两个大样本的比较。目前五十二页\总数一百一十一页\编于十点2、方法步骤假定甲、乙两总体所属的总体平均数分别为μ1和μ2,分别从甲、乙两总体各随机抽取一个大样本,其中:

样本I;

S1

n1

样本Ⅱ:

S2

n2(一)u检验目前五十三页\总数一百一十一页\编于十点统计假设

H0:μ1=μ2,HA:μ1≠μ2计算样平均数差数标准误和u值

在无效假设H0:μ1=μ2时,μ1-μ2=0,故上式为:根据u值的大小推断差异显著性。目前五十四页\总数一百一十一页\编于十点[例3]不同季度监测某工厂排污水中某污染物含量(mg/L)。结果列于表,试检验两个季度排污水中污染物含量有无显著差异?季度污染物含量(mg/L)一季度3184713846465444882181624557623937692153445361457235627042883774428747466554285863546259305329627853二季度3144652240535450344946484931236958424424513243332549476636363433416238384066477124532025314160325638目前五十五页\总数一百一十一页\编于十点统计假设

H:μ1=μ2,HA:μ1≠μ2计算各样本平均数,方差S2,样本平均数差数标准误和u值

目前五十六页\总数一百一十一页\编于十点统计推断

u>u0.01=2.58,差异极显著,表明第一季度排污水中污染物含量极显著高于第二季度。目前五十七页\总数一百一十一页\编于十点(二)t检验1、应用条件

两个样本总体方差σ12和σ22未知,但两个样本所在总体都服从正态分布,并且

目前五十八页\总数一百一十一页\编于十点可证:在满足上述条件时,H0:下,有~t(n1+n2-2)具有自由度df=n1+n2-2其中差异标准误(二)t检验2、方法步骤目前五十九页\总数一百一十一页\编于十点(二)t检验目前六十页\总数一百一十一页\编于十点[例4]对某地污灌区和非污灌区水稻产量进行调查,各测定5个点,每个点30m2,结果见表,试检验污灌区和非污灌区水稻产量有无显著差异?ni污灌区非污灌区161.03721.0065.04225.00261.53782.2566.74448.89362.33881.2966.34395.69462.53906.2567.14502.41563.13981.6167.84596.84∑310.419272.40332.922168.8362.0866.58目前六十一页\总数一百一十一页\编于十点解:第一步建立假设H0:μ1=μ2(两种灌区的水稻产量无显著差异)

HA:μ1

≠μ2

第二步确定显著水准α=0.05、0.01(两尾)

目前六十二页\总数一百一十一页\编于十点第三步计算统计量t值和自由度dfdf=n1+n2-2

=5+5-2=8目前六十三页\总数一百一十一页\编于十点第四步查表找临界t值tα,并作统计推断:查表3得,t0.05(8)=2.306

t0.01(8)=3.55∵|t|=7.544>t0.01(8)=3.55,∴否定H0,差异极显著,表明污灌区由于有毒物质危害,其水稻产量极显著地低于污灌区。目前六十四页\总数一百一十一页\编于十点(二)近似t检验

1、应用条件

两个样本总体方差σ12和σ22未知,并且

目前六十五页\总数一百一十一页\编于十点当,,则此时的不再准确地服从t分布。因此Cochran和Con提出近似t测验法,用t´与t´α相比较,(二)近似t检验

目前六十六页\总数一百一十一页\编于十点在进行检验时,如果两个样本的样本容量相等,即n1=n2=n,可直接取df=n-1进行检验;如果n1≠n2,则需采用转换自由度的方法进行,即先计算k值和(二)近似t检验

目前六十七页\总数一百一十一页\编于十点[例5]调查某地受某重金属污染区5个点的水稻产量,非污染区10个点的水稻产量,试检验两者有无显著差异?(二)近似t检验

统计假设:H0:μ1=μ2,HA:μ1≠μ2目前六十八页\总数一百一十一页\编于十点计算K及df´:计算平均数差数标准误及统计推断:由df′=9查t值表得t0.01=3.25,>t0.01=3.25,差异极显著,表明重金属污染造成水稻严重减产。目前六十九页\总数一百一十一页\编于十点二成对数据的平均数比较当试验单元间差异较大,用完全随机试验将对试验指标有明显影响。可把条件一致的两个供试单元配成一对,并设多个配对,再对每一配对两个单元随机独立实施一处理,这就是配对试验,实为处理数为2的随机区组试验,这样得到的数据称为成对数据。目前七十页\总数一百一十一页\编于十点配对设计试验资料的一般形式

例如,①半叶法试验资料②不同土层养分测定资料③同一供试单元上④单因素两水平随机区组作处理前后的对试验资料比资料样号处理12…N甲x11x12…x1n乙x21x22…x2nd=x1-x2d1d2…dn

=-目前七十一页\总数一百一十一页\编于十点二成对数据的平均数比较方法步骤:

(一)提出无效假设与备择假设

其中为两样本配对数据差值d总体平均数,它等于两样本所属总体平均数与之差,即

。所设无效假设、备择假设相当于

目前七十二页\总数一百一十一页\编于十点二成对数据的平均数比较方法步骤:(二)计算t值式中,为差数标准误,计算公式为:d为两样本各对数据之差

Sd为d的标准差;n为配对的对子数,即试验的重复数。

目前七十三页\总数一百一十一页\编于十点(三)查临界t值,作出统计推断

根据df=n-1查临界t值:t0.05(n-1)和t0.01(n-1),将计算所得t值的绝对值与其比较,作出推断。

二成对数据的平均数比较方法步骤:目前七十四页\总数一百一十一页\编于十点[例6]某地在同一地点采集不同土壤深度的土样,共采10个点,分别测定镉含量,测定结果见表。试检验不同深度土壤中镉元素垂直分布有无显著差异?镉含量d1=x11-x120~20cmx120~40cmx210.280.36-0.060.006420.320.260.060.003630.270.24-0.020.000440.340.310.030.000950.290.32-0.030.000960.290.31-0.040.001670.330.320.010.000180.310.300.010.000190.290.34-0.050.0025100.280.2800∑-0.110.0165-0.011目前七十五页\总数一百一十一页\编于十点

1、提出无效假设与备择假设

,即假定不同深度土壤中镉含量无差异

,即假定有不同深度土壤中镉含量差异

目前七十六页\总数一百一十一页\编于十点

2、计算t值目前七十七页\总数一百一十一页\编于十点

3、查临界t值,作出统计推断由df=9,查t值表得:t0.05(9)=2.262,因为|t|<t0.05(9),接受,表明表明0-20cm与20-40cm两层土壤镉含量无显著差异。目前七十八页\总数一百一十一页\编于十点

成对数据的比较是假定各个配对的差数的分布为正态分布,具有N(0,2);而每一配对的两个供试单位是彼此相关的。

成组数据的比较是假定两个样本皆来自于各自的正态总体,两个样本的各个供试单位都是彼此独立的,两个样本平均数的差数服从平均数为(1-2),方差为的正态分布。目前七十九页\总数一百一十一页\编于十点

成对数据由于加强了试验控制,使其可比性提高,因而提高了试验精确度。

成对比较不受两样本的总体方差的干扰,分析时不需考虑是否相等的问题,但成组数据要考虑是否相等的问题。目前八十页\总数一百一十一页\编于十点第四节百分数的假设检验

在第四章介绍二项分布时曾指出:由具有两个属性类别的质量性状利用统计次数法得来的次数资料进而计算出的百分数资料,如成活率、死亡率、孵化率、感染率、阳性率等是服从二项分布的。这类百分数的假设检验应按二项分布进行。即从二项式(p+q)n的展开式中求出某项属性个体的百分数的概率,然后根据概率的大小作出推断。

目前八十一页\总数一百一十一页\编于十点第四节百分数的假设检验但是,当样本容量n较大,P不过分小,np和nq又均不小于5时,二项分布接近正态分布,因而可将百分数资料作正态分布处理,从而作出近似的测验。目前八十二页\总数一百一十一页\编于十点np,nq小于5时,通过二项展开式计算概率;

np,nq大于5,小于30时,可以进行u测验,但要作连续性矫正;

np,nq大于30时,可进行u测验,无需作连续矫正。目前八十三页\总数一百一十一页\编于十点一、单个样本百分数的假设检验需要检验一个服从二项分布的样本百分数与已知的二项总体百分数差异是否显著,其目的在于检验一个样本百分数所在二项总体百分数p是否与已知二项总体百分数p0相同,换句话说,检验该样本百分数是否来自总体百分数为p0的二项总体。目前八十四页\总数一百一十一页\编于十点方法步骤:(一)提出无效假设与备择假设(二)计算u值或uc对于二项成数总体平均数总体方差总体标准差目前八十五页\总数一百一十一页\编于十点当n→∞,p不是很小,np、nq>5时,二项分布→正态分布。此时有~N(,)。标准化后有~N(0,12)其中——差异标准误。

在H0:p=p0下,~N(0,12)应用条件:n>30,np、nq>5目前八十六页\总数一百一十一页\编于十点如果np或nq小于30,需进行连续性矫正。经矫正的正态离差用uc表示:目前八十七页\总数一百一十一页\编于十点

若(或)<1.96,接受,表明样本百分数与总体百分数差异不显著;若,否定,接受,表明样本百分数与总体百分数PO差异显著;

若,否定,接受,表明样本百分数与总体百分数PO差异极显著。方法步骤:(三)将计算所得的u或uc的绝对值与1.96、2.58比较,作出统计推断

目前八十八页\总数一百一十一页\编于十点

[例7]

按规定,某工厂排污水中含某种污染物的超标率应低于8%(P)时即为合格,现采样210次,超标23次,问抽样结果与超标率低于8%有无显著差别?1、提出无效假设与备择假设

H0:P=P0=0.08,HA:P≠P02、计算u值目前八十九页\总数一百一十一页\编于十点3、作出统计推断因为,接受H0,差异不显著,表明抽样结果与超标率低于8%,无显著差别。目前九十页\总数一百一十一页\编于十点检验服从二项分布的两个样本百分数差异是否显著。其目的在于检验两个样本百分数、所在的两个二项总体百分数P1、P2是否相同。当两样本的np、nq均大于5时,可以近似地采用u检验法进行检验,但在np和(或)nq小于或等于30时,需作连续性矫正。检验的基本步骤是:二、两个样本百分数的假设检验目前九十一页\总数一百一十一页\编于十点二、两个样本百分数的假设检验(一)提出无效假设与备择假设目前九十二页\总数一百一十一页\编于十点二、两个样本百分数的假设检验(二)计算u值或uc值其中,为两个样本百分数,为样本百分数差异标准误为合并样本百分数:目前九十三页\总数一百一十一页\编于十点(三)将u或uc的绝对值与1.96、2.58比较,作出统计推断二、两个样本百分数的假设检验若(或)<1.96,p>0.05,接受,表明两个样本百分数、差异不显著;

若(或)<2.58,0.01<p≤0.05,否定,接受,表明两个样本百分数、差异显著;

若(或)>2.58,p≤0.01,否定,接受,表明两个样本百分数、差异极显著;目前九十四页\总数一百一十一页\编于十点[例5.4.2]调查高肥力地某小麦品种251株(n1),发现感白粉病的238株(x1),感病率为0.948(238/251),同时调查了中肥力地该品种324株(n2),感白粉病的有268株(x2),感病率为0.827(268/324),试检验该小麦品种在高、中肥力地种植,感病率差异是否显著?目前九十五页\总数一百一十一页\编于十点

本例为服从二项分布的百分率资料,样本容量较大,n1

=251,n2

=324,且即、、、均大于5,并且大于30,可利用u检验法,不需作连续矫正。目前九十六页\总数一百一十一页\编于十点第一步

建立假设H0:p1=p2(两种肥力上的小麦的感白粉病无显著差异)

HA:p1≠p2第二步确定显著水准α=0.05、0.01(两尾)目前九十七页\总数一百一十一页\编于十点第三步计算统计量u值

目前九十八页\总

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论