数学假设检验2011_第1页
数学假设检验2011_第2页
数学假设检验2011_第3页
数学假设检验2011_第4页
数学假设检验2011_第5页
已阅读5页,还剩117页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数学假设检验2011第1页/共122页第四章假设检验下一张

主页

退出

上一张

第2页/共122页总体总体样本样本样本样本样本抽样分布统计推断

抽样分布与统计推断的关系第3页/共122页统计推断总体样本抽样分布第4页/共122页进行田间试验的目的并不是仅获得样本资料,而是通过样本资料的有关信息推测样本所在总体的有关特征,这就是统计推断。第5页/共122页统计推断参数估计假设测验点估计区间估计统计推断的前提条件:资料必须来自随机样本;统计数的分布规律必须已知。第6页/共122页

假设检验(testofhypothsis)

显著性检验(testofsignificance)

常用的有u检验、t检验、F检验和2检验等。尽管这些检验方法的使用条件及用途不同,但检验的基本原理是相同的。下一张

主页

退出

上一张

第7页/共122页第一节假设检验的基本原理

下一张

主页

退出

上一张

第8页/共122页下一张

主页

退出

上一张

例如,某小麦品种一般亩产300Kg,即总体平均数,并且已知该品种产量的标准差。现从该品种中选择优良单株繁育成一新品系,通过25个小区试验,平均产量为330Kg即。问试验结果是否表明新品系与原品种的生产能力不一样?

第9页/共122页一、统计假设测验的基本思路

与μ0的表面差异是由真实差异(μ-

μ0)和试验误差构成。表面差异构成的三种可能性:真实差异和试验误差全为真实差异全为试验误差第10页/共122页

因此统计推断只能从第三种可能性出发点,先假设真实差异不存在,试验的表面差异全为试验误差。在该假设正确的前提下,计算试验结果出现的概率,根据概率的大小来判断假设是否正确,即真实差异是否存在。第11页/共122页

统计假设测验:对统计假设是否正确的证明过程。统计假设:在科学研究中,往往要提出一个有关某一总体参数的假设。先作出处理无效的假设,再依据该假设概率大小来判断接受或否定该假设的过程。第12页/共122页统计推断:把试验的表面效应与误差大小相比较并由表面效应可能属于误差的概率而作出推论的方法。第13页/共122页二、统计假设测验的基本步骤根据中心极限定理知,n=25时的样本平均数遵从正态分布在假设全为试验误差即

μ=μ0的前提下,可以算出表面差异全为试验误差的概率。第14页/共122页标准正态离差u=µ0_x-σx-=330-30075/√25=2σx-=√nσ)查附表2,当u=2时,概率P介于0.04和0.05之间。表明差异属于试验误差的概率在4%~5%之间。第15页/共122页试验表面差异全为试验误差的概率小于0.05。根据小概率事件实际不可能性原理,原先的假设应被否定,即表面差异不全为试验误差,新品系与原品种之间存在真实差异。第16页/共122页

随机事件概率的大小客观地反映事件在一次试验中发生的可能性的大小。概率大,表示该事件发生的可能性大;概率小,说明该事件发生的可能性小;农业研究中多采用5%、1%这两个标准作为小概率事件。小概率事件实际不可能性原理第17页/共122页显著水平(significantlevel):判断是否属小概率事件的概率值,以α表示。第18页/共122页当1%<p≤5%称所测差异显著;所以,统计假设测验又叫差异显著性测验(differencesignificancetest)p>5%称差异不显著;p≤1%称差异极显著;第19页/共122页无效假设(nullhypothesis),记为H0:µ=µ0。假设新品系的产量与原品种没有差异。与无效假设对应的另一个统计假设.

备择假设(alternatehypothesis),记为HA:µ≠µ0。第20页/共122页无效假设是有意义的;据之可计算出因抽样误差而获得样本结果的概率。无效假设的形式是多种多样的,随研究的内容不同而不同,但必须遵循两个原则:第21页/共122页1.对样本所属总体提出假设,包括无效假设和备择假设。2.确定显著水平α。3.在H0下,依统计数的抽样分布,计算实际差数的概率。统计假设测验的基本步骤:第22页/共122页统计假设测验的基本步骤:4.统计推断,将α与算得的概率相比较,根据小概率事件实际不可能性原理作出是否否定H0的推断。第23页/共122页三、统计假设测验的几何意义

从本质上说是将统计数的分布划分为无效假设接受区和否定区。第24页/共122页若要在0.05水平上接受H0:µ=µ0则u=µ0_x-σx-︳︳<1.96(σx-=σ√n)x-<µ0-1.96σx-()µ0+1.96σx-()<假设接受区域(acceptanceregion)假设否定区域(negationregion)x-≤(µ0-1.96σx-)σx-x-≥(µ0+1.96)或(图4.1)即P(u)≥0.05α=0.05时,由附表2得u=1.96270.6kg329.4kg第25页/共122页同理,α=0.01时,由附表2得u=2.58,则H0:µ=µ0的接受区域为:x-<µ0-2.58σx-()µ0+2.58σx-()<否定区域为:--x≤(µ0-2.58σx-)σx-x≥(µ0+2.58)或-261.3338.7第26页/共122页小麦品种一例,µ0=300,σx_=15,故H0:µ=µ0的95%接受区域为x_<(300+1.96×15)(300-1.96×15)<即270.6<x_<329.4新品系试种的25个小区样本平均数x_=330㎏落入接受区外,H0被否定,与u测验结果一致。有95%的把握认为新品系与原品种亩产量存在真实差异。(图4.1)第27页/共122页接受区域

95%否定区域

2.5%否定区域2.5%300270.6329.4图4-1α=0.05时H0:µ=µ0的接受区和否定区第28页/共122页四、两尾测验和一尾测验HA:µ≠µ0µ>µ0

和µ<µ0

H0具有两个否定区,分别位于平均数分布的左右两尾,这类测验称两尾测验(two-tailedtest),在假设测验中所考虑的概率为左右两尾概率之和。H0:µ=µ0第29页/共122页象这种在假设测验中所考虑的概率只用一尾概率的测验称为一尾测验(one-tailedtest)(图4.2)。当H0:µ≤µ0,HA:µ>µ0,则否定区在分布的右尾。x-x-当H0:µ≥µ0,HA:µ<µ0,则否定区在分布的左尾。第30页/共122页当α=0.05时,三种无效假设的接受区间:H0:μ=μ0H0:μ≥μ0H0:μ≤μ0(270.4,329.6)(275.4,+)(-,324.6)第31页/共122页一尾检验的=两尾检验的

=2.33。

一尾检验的=两尾检验的下一张

主页

退出

上一张

例如, 一尾检验的=两尾检验的

=1.64,

第32页/共122页图4.2aα=0.05时H0:µ≤µ0的接受区和否定区0.95α=0.05接受区否定区α=0.05否定区接受区0.95图4.2bα=0.05时H0:µ≥µ0的接受区和否定区第33页/共122页

实际应用中,如何选用两尾检验或一尾检验,应根据专业的要求在试验设计时就确定。一般情况下,若事先不知道与谁大谁小,只是为了检验与是否存在差异,则选用两尾检验;如果凭借一定的专业知识和经验推测 应小于(或大于)时,则选用一尾检验。

下一张

主页

退出

上一张

第34页/共122页

综上所述,从提出无效假设与备择假设,到根据小概率事件实际不可能性原理来否定或接受无效假设,这一过程实际上是应用所谓“概率性质的反证法”对样本所属总体所作的无效假设的统计推断。下一张

主页

退出

上一张

上述显著性检验利用了分布来估计出概率,所以称为检验.

第35页/共122页五、统计假设测验的两类错误

下一张

主页

退出

上一张

在显著性检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”,所以我们下的结论不可能有百分之百的正确。第36页/共122页假设测验的两类错误一、两类错误的概念如果无效假设是正确的,通过假设测验却否定了它,这样所犯的错误称第一类错误或Ⅰ型错误。由于犯Ⅰ型错误的概率不会超过显著水平α

,故又称为α错误。第37页/共122页

如果无效假设是错误的,但通过试验结果的假设测验却接受了它,这样所犯的错误称第二类错误或Ⅱ型错误。由于犯Ⅱ型错误的概率常记为β

,故又称为

β错误。第38页/共122页现用小麦品种一例来说明β值的计算。如果H0:μ=μ0=300㎏是错误的,正确的是μ=315㎏,并设两总体的标准误均为x_=15,则两平均数的分布如图4.6。σ第39页/共122页300315c1c2270.6329.4β=83%图4.6H0:µ=300

,而µ=315的β

值第40页/共122页那么β值的计算方法为:u1=270.6-31515=-2.96在=315总体中270.6对应的u值为:329.4对应的u值为:u2=329.4-31515=0.96第41页/共122页查附表2,P(u<-2.96)=0.0015,P(u<0.96)=0.8315。故有β=P(u<0.96)-P(u<-2.96)=0.8315-0.0015=0.83或83%。如果提高显著水平,即α

值取小些,则c1、c2线将向左和向右移动,因而β值会增大。如果假设新品种的μ=345㎏,离300㎏更远些(图4.7),则β=0.15=15%。第42页/共122页300345270.6329.4c1c2β=15%图4.7H0:µ=300

,而µ=345的β

值第43页/共122页在样本容量n一定时,提高显著水平,可以减少犯第一类错误的概率,但同时增大了犯第二类错误的概率。在n和显著水平相同的条件下,真正的总体平均数和假设的平均数0的相差越大,则犯第二类错误的概率越小。二、降低两类错误的措施第44页/共122页如显著水平一定,则改进试验技术和增加样本容量可以有效的降低犯两类错误的概率。第45页/共122页如第一节小麦产量一例,如n从25增至225,则-σx=75/√225=5㎏接受区间变为290.2㎏~309.8㎏。若μ=315㎏,则不能发现H0:µ=µ0为错误的概率β=0.1492=14.92%(图4.8)

。第46页/共122页300315c1c2290.2309.8β=14.92%图4.8H0:µ=300

,而µ=315,=5的β

值-σx第47页/共122页注意:

根据试验目的正确选用一尾或两尾测验;根据试验设计的不同,正确选用成对数据或成组数据的测验方法。

第48页/共122页

例如,经检验获得“差异显著”的结论,我们有95%的把握否定无效假设H0,同时要冒5%下错结论的风险;经检验获得“差异极显著”的结论,我们有99%的把握否定无效假设H0,同时要冒1%下错结论的风险;而经检验获得“差异不显著”的结论,在统计学上是指“没有理由”否定无效假设H0,同样也要冒下错结论的风险。下一张

主页

退出

上一张

第49页/共122页

显著性检验的两类错误归纳如下:下一张

主页

退出

上一张

表显著性检验的两类错误第50页/共122页

如经检验获得“差异显著”或“差异极显著”,我们有95%或99%的把握认为,与不相同,判断错误的可能性不超过5%或1%;

下一张

主页

退出

上一张

无效假设备择假设HA:µ≠µ0H0:µ=µ0第51页/共122页

若经检验获得“差异不显著”,我们只能认为在本次试验条件下,无效假设H0

未被否定,这有两种可能存在:或者是与确实没有差异,或者是与有差异而因为试验误差大被掩盖了。下一张

主页

退出

上一张

无效假设备择假设H0:µ=µ0HA:µ≠µ0第52页/共122页

因而,不能仅凭统计推断就简单地作出绝对肯定或绝对否定的结论。

“统计推断有很大的可靠性,但有一定的错误率”这是统计推断的基本特点。下一张

主页

退出

上一张

第53页/共122页下一张

主页

退出

上一张

第二节单个样本平均数的假设检验

检验一个样本平均数与已知的总体平均数是否有显著差异,即检验该样本是否来自某一总体。第54页/共122页下一张

主页

退出

上一张

如果总体未知、且为小样本(n≤30),则用t检验法。

t检验法,就是在显著性检验时利用t分布进行概率计算的检验方法。第55页/共122页下一张

主页

退出

上一张

【例4·3】

晚稻良种汕优63的千粒重=27.5g。现育成一高产品种协优辐819,在9个小区种植,得其千粒重为:

32.5、28.6、28.4、24.7、29.1、

27.2、29.8、33.3、29.7(g)

问新育成品种的千粒重与汕优63有无显著差异?第56页/共122页

下一张

主页

退出

上一张

1、提出假设:27.5g:27.5g第57页/共122页下一张

主页

退出

上一张

2、计算t值

第58页/共122页下一张

主页

退出

上一张

=29.255第59页/共122页下一张

主页

退出

上一张

第60页/共122页下一张

主页

退出

上一张

===0.862

所以

==2.036

第61页/共122页下一张

主页

退出

上一张

3、统计推断

由df=n-1=9-1=8查临界t值,得:

计算所得的=2.036<,故p>0.05,不能否定,表明新育成品种千粒重与当地良种汕优63的千粒重差异不显著。

第62页/共122页

下一张

主页

退出

上一张

第三节两个样本平均数的假设检验

由两个样本平均数之差来测验两个样本所属总体平均数是否存在显著差异,即测验两个处理的效果是否一样。测验方法因实验设计的不同分为两类:第63页/共122页

将试验单位随机分为两组,再随机各实施一处理,这样得到的数据称为成组数据,以组的平均数作为比较的标准。1.非配对设计两个样本平均数差异显著性检验两个样本平均数差数的抽样分布第64页/共122页由于在σ2已知的正态总体抽样或以n>30在σ2未知的总体抽样,样本平均数的差数的分布呈正态分布;故可用u分布测验H0。当n<30时,由于一般资料可假定两样本的总体方差相等,即σ12=σ22,故为增加误差估计的准确性,宜先算得两样本的合并均方值,通常用S2e表示。第65页/共122页sx1-x2--=√se2n1se2n2+--x2)(x1_st=-(μ1-μ2)x1-x2--服从df=n1+n2-2的t分布Se2=SS1+SS2df1+df2

Se称为两样本均方的加权平均值或合并均方。第66页/共122页【例】有一水稻施肥试验,处理为甲乙两种施肥方法,完全随机设计,试验结果见表。试测验两种施肥方法水稻产量有无显著差异。第67页/共122页

两种施肥方法水稻小区产量(㎏)x1(甲)x2(乙)8.29.68.78.99.48.510.711.29.210.911.110.8Σ=53.3Σ=63.9H0:µ1=µ2

,HA:µ1≠µ2,α=0.01-x161=×(8.2+…+8.5)=8.88(㎏)-x261=×(10.7+…+10.8)=10.65(㎏)SS1=(8.22+…+

8.52)-53.32/6=1.4283SS2=(10.72+…+

10.82)-63.92/6=2.695df1=df2=n-1=6-1=5两尾测验第68页/共122页se2=1.4283+2.6955+5=0.4123sx1-x2--=√se2n1se2n2+=√2se2n√2×0.41236==0.3707df=df1+df2=10查附表3,t0.01(10)=3.169,t=4.77>t0.01(10),故否定H0,接受HA,即甲乙两种施肥方法的水稻产量有极显著的差异。8.88-10.650.3707=-4.77--x2)(x1_st=-(μ1-μ2)x1-x2--=第69页/共122页【例】研究矮壮素使玉米矮化的效果,抽穗期测定喷施小区玉米8株、对照区9株,株高结果如表。试作测验。第70页/共122页

喷矮壮素与否的玉米株高(㎝)x1(喷矮壮素)x2(对照)160160200160200170150210170270180250270290270230170Σ=1410Σ=2100H0:µ1≥µ2

,HA:µ1<µ2,α=0.05-x1=176.3(㎝)-x2=233.3(㎝)SS1=3787.5SS2=18400se2=18400+3787.57+8=1479.17一尾测验第71页/共122页df=df1+df2=7+8=15查附表3,t0.1(15)=1.753,t=3.04>t0.1(15),故否定H0,接受HA。即认为玉米喷矮壮素后,株高显著矮于对照。176.3-233.318.688=-3.04=tsx1-x2--=√1479.17(+8191)=18.688一尾测验的t0.05=两尾测验的t0.1第72页/共122页

两总体方差并且又为n<30的小样本时,对两样本平均数的差异显著性进行测验,平均数差数的标准误不能用合并均方。第73页/共122页sx1-x2--=√s12n1s22n2+由此计算的标准化离差--x2)(x1_st′=x1-x2--不服从t分布因此只能用近似t测验法。只能由计算令第74页/共122页t′α=s2x2-tα(df2)tαs2x1-(df1)+x2-s2x1-s2+但n1=n2=n,t’α=

tα(df)近似df=n-1的t分布。如果t`>t’α,则在α水平上否定H0;反之接受H0第75页/共122页

根据局部控制的原理,把条件一致的两个供试单元配成一对,并设多个配对,再对每一配对两个单元随机独立实施一处理,这就是配对试验。从配对试验得到的数据称为成对数据。2.配对设计两个样本平均数差异显著性检验第76页/共122页(x11,x21)(x12,x22)(x13,x23)(x14,x24)第77页/共122页配对试验的观察值模型为:(x11,x21),

(

x12,

x22),……,(

x1n,

x2n)各对间供试单元的差异可由di=x1i-x2i消除.(x11,x21),

(

x12,

x22),……,(

x1n,

x2n)

d1d2dn第78页/共122页-μd)(d_st=d-sd-=√nsd遵从df=n-1的t分布。-sd=Σ(di-d)2n-1√√Σdi2–(Σdi)2/nn-1=差数的平均数:差数的标准差:差数平均数的标准误:由于成对数据资料通常为小样本,故用t测验:第79页/共122页

株号12345678∑

Ax1i9173118782010Bx2i1011181467175

差数di-16134113532【例】为测定A、B两种病毒对烟草的致病力,取8株烟草,每一株半叶接种A,另半叶接种B,以叶面出现枯斑数的多少作为致病力强弱的指标,见下表。试测验两种病毒致病力的差异显著性。第80页/共122页H0:µd=0,HA:µd≠0α=0.05d-328==4sd=(-1)2+62+…+52-322/88-1√=4.31sd=-4.31√8=1.52-μd)(d_st=d-4-01.52==2.632查附表3,t0.05(7)=2.365,t=2.632>t0.05(7),故否定H0,接受HA,即A、B两种病毒的致病力有显著差异。第81页/共122页成对数据的比较,差数的分布为正态分布,具有N(0,2);而每一配对的两个供试单位是彼此相关的。第82页/共122页成组数据的比较是假定两个样本皆来自于各自的正态总体,两个样本的各个供试单位都是彼此独立的,两个样本平均数的差数服从平均数为(1-2),方差为的正态分布。第83页/共122页np,nq小于5时,通过二项展开式计算概率;np,nq大于5,小于30时,可以进行u测验,但要作连续性矫正;

np,nq大于30时,可进行u测验,无需作连续矫正第四节百分率资料的假设测验第84页/共122页一、单个样本百分数的假设测验测验某一样本百分数所在总体的百分数P是否与某一理论值P0相同。样本百分数的标准误第85页/共122页若满足正态接近法的条件,则有服从N(0,1),故可对H0:P=P0作u测验。无需连续矫正需要连续矫正第86页/共122页H0:P=P0=0.75,HA:P≠P0α=0.05,u0.05=1.96[例]以紫花和白花的大豆品种杂交,在289个F2植株中,紫花208株,白花81株,问这一结果是否表明大豆花色受一对等位基因控制,即F2代紫花植株与白花植株的分离是否为3:1?第87页/共122页u=0.7197-0.750.0255=-1.19因u=1.19<u0.05,故P>0.05所以,不能否定H0,即认为大豆花色遗传符合一对等位基因的遗传规律。第88页/共122页二、两个样本百分数相比较的假设测验由两样本百分数之差推断两样本所属总体百分数P1和P2是否相同。

设两个样本某属性的百分数分别为

x1/n1,x2/n2,则x1,x2是服从二项分布的随机变量。第89页/共122页np,nq大于5,小于30时,可以进行u测验,但要作连续性矫正np,nq大于30时,可进行u测验,无需作连续矫正当两样本:第90页/共122页则样本百分数差数()的标准化离差:在总体百分数的方差已知时:第91页/共122页p_x1+x2n1+n2=在H0:P1=P2下,服从标准正态分布N(0,1)。合并百分数当总体百分数的方差未知时:第92页/共122页H0:P1=P2HA:P1≠P2α=0.05,u0.05=1.96

x1/n1=35/200=0.175x2/n2=30/150=0.200[例]调查两个小麦品种的抗散黑穗病能力,A品种200株中有35株发病,B品种150株中有30株感病。问两品种的抗病力是否有显著差异?第93页/共122页所以,不能否定H0,即认为A、B两品种抗散黑穗病能力差异不显著。u=0.175-0.2000.0420=-0.5952因u=0.5952<u0.05,故P>0.05=√0.1857(1-0.1857)(20011501+)=0.04235+30200+150==0.1857p_x1+x2n1+n2=第94页/共122页[例]在“长绒一号”棉的选育中,以绒长为目标进行严格的单株选择。第一年鉴定1787株,得绒长超过38㎜者406株;第三年种植长绒棉后裔,鉴定793株,得绒长超过38㎜者442株。问选择后长绒株率是否提高了25%以上?H0:(P2-P1)

≤0.25;HA:(P2-P1)>0.25第95页/共122页α=0.05,u0.05(一尾)=1.645406/1787=0.2272442/793=0.5574p_442+406793+1787==0.3287=√0.3287(1-0.3287)(793117871+)=0.020u=0.5574-0.2272-0.250.020=4.01因u=4.01>u0.05,故P<0.05所以,否定H0,接受HA。即选择后长绒株率确实提高了25%以上。第96页/共122页

由于抽样误差,不同样本有不同的统计数,究竟哪一个最能代表其相应参数是难以断定的。1、点估计以样本的统计数估计总体的相应参数。第五节参数的区间估计第97页/共122页2、区间估计在一定的概率保证下,估计出参数可能在内的一个范围或区间,使绝大多数该参数的点估计值能位于该区间内.第98页/共122页

参数估计就是用样本统计数来估计总体参数,有点估计和区间估计之分。

将样本统计数直接作为总体相应参数的估计值叫点估计。点估计只给出了总体参数的估计值,没有考虑试验误差的影响,也没有指出估计的可靠程度。第99页/共122页

区间估计是在一定概率保证下给出总体参数的可能范围,所给出的可能范围叫置信区间,给出的概率保证称为置信度或置信概率

。第100页/共122页一、正态总体平均数的置信区间

设有一来自正态总体的样本,包含个观测值,样本平均数,标准误,总体平均数为。第101页/共122页

因为服从自由度为-1的分布,两尾概率为时,有:

P(

在区间内取值的可能性为1-,即:第102页/共122页对变形得:即称上式为总体平均数置信度为1-的置信区间,第103页/共122页

L1=和L2=分别称为置信下限和置信上限;置信上、下限之差称为置信距,置信距越小,估计的精确度越高。第104页/共122页

总体平均数的95%和99%的置信区间如下:第105页/共122页

【例4·11】

测得某高产、抗病小麦品种的8个千粒重,计算得千粒重平均数 =45.2g,标准误。试求该品种小麦千粒重在置信度为95%的置信区间。第106页/共122页

查附表3,当df=(8-1)=7时,得,故95%的置信度区间为:

(45.2-2.365×0.58)g≤≤(45.2+2.365×0.58)g

43.828g≤≤46.572g

说明置信度为95%时,该高产、抗病小麦品种的千粒重在43.828—46.572g之间。第107页/共122页二、二项总体百分率的置信区间

利用正态近似法求总体百分率的置信区间

当,p

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论