交通运输试验设计与统计分析-3课件_第1页
交通运输试验设计与统计分析-3课件_第2页
交通运输试验设计与统计分析-3课件_第3页
交通运输试验设计与统计分析-3课件_第4页
交通运输试验设计与统计分析-3课件_第5页
已阅读5页,还剩123页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第5章假设测验TestsofSignificance第5章假设测验TestsofSignificance1Section5.1

PrincipleofSignificanceTests

假设测验的基本原理Section5.1

PrincipleofSign2一、假设测验的理论基础某人宣称自由球命中率有80%。命中率有80%的射手,实地投射只有8/20命中率的机会不大。实地投射结果显示投20球中8球。结论:命中率有80%的宣称不可信。命中率有80%的自由球射手投20球命中的次数应服从二项分布B(20,0.8)。命中的次数小于或等于8的概率约为0.0001。即重复实地投射20球10,000次只中8球以下的情形约只发生一次。一、假设测验的理论基础某人宣称自由球命中率有80%。3假设宣称的叙述为真(命中率有80%),可推得实验结果发生的可能性很低,则该实验结果的发生(实地投射20球中8球),即为宣称的叙述不真的好证据。“ProvebyContradiction”小概率原理一、假设测验的理论基础假设宣称的叙述为真(命中率有80%),可推得实验结果发生的4例某地区的当地小麦品种一般667m2产300kg,即当地品种这个总体的平均数=300(kg),并从多年种植结果获得其标准差=75(kg),而现有某新品种通过25个小区的试验,计得其样本平均产量为每667m2330kg,即

=330,问新品种产量与当地品种产量是否有显著差异?二、假设测验的步骤例某地区的当地小麦品种一般667m2产300kg,即当地品5(一)先假设新品种产量与当地品种产量无差异,记作

无效假设或零假设对立假设或备择假设

二、假设测验的步骤(一)先假设新品种产量与当地品种产量无差异,记6二、假设测验的步骤(二)在承认上述无效假设的前提下,获得平均数的抽样分布,计算假设正确的概率先承认无效假设,从已知总体中抽取样本容量为n=25的样本,该样本平均数的抽样分布具正态分布形状,平均数=300(kg),标准误=15(kg)。如果新品种的平均产量很接近300kg,应接受H0。如果新品种的平均产量与300相差很大,应否定H0。但如果试验结果与300不很接近也不相差悬殊,就要借助于概率原理,具体做法有以下两种:二、假设测验的步骤(二)在承认上述无效假设71.计算概率在假设

为正确的条件下,根据的抽样分布算出获得330kg的概率,或者说算得出现随机误差30(kg)的概率:在此,查附表,当u=2时,P(概率)界于0.04和0.05之间,即这一试验结果:30(kg),属于抽样误差的概率小于5%。

二、假设测验的步骤1.计算概率在假设为正确的条件下,根据的抽样分82.计算接受区和否定区在假设H0为正确的条件下,根据的抽样分布划出一个区间,如在这一区间内则接受H0,如在这一区间外则否定H0。由于

因此,在的抽样分布中,落在()区间内的有95%,落在这一区间外的只有5%。二、假设测验的步骤2.计算接受区和否定区在假设H0为正确的条件下,根据9如果以5%概率作为接受或否定H0的界限,则上述区间()为接受假设的区域,简称接受区(acceptanceregion);和为否定假设的区域,简称否定区(rejectionregion)。同理,若以1%作为接受或否定H0的界限,则()为接受区域,和为否定区域。二、假设测验的步骤如果以5%概率作为接受或否定H0的界限,则上10如上述小麦新品种例,

=300,,1.96=29.4(kg)。因之,它的两个2.5%概率的否定区域为

≤300-29.4和

≥300+29.4,即大于329.4(kg)和小于270.6(kg)的概率只有5%。图5%显著水平假设测验图示(表示接受区域和否定区域)二、假设测验的步骤如上述小麦新品种例,图5%显著水平假设11(三)根据“小概率事件实际上不可能发生”原理接受或否定假设当由随机误差造成的概率P小于5%或1%时,就可认为它不可能属于抽样误差,从而否定假设。如P<0.05,则称这个差数是显著的。如P<0.01,则称这个差数是极显著的。用来测验假设的概率标准5%或1%等,称为显著水平(significancelevel)。

一般以表示,如=0.05或=0.01。二、假设测验的步骤(三)根据“小概率事件实际上不可能发生”原理接受或否定12综合上述,统计假设测验的步骤可总结如下:(1)对样本所属的总体提出统计假设,包括无效假设和备择假设。(2)规定测验的显著水平值。(3)在为正确的假定下,根据平均数()或其他统计数的抽样分布,获得实际差数(如等)由误差造成的概率(P值)。或者根据已规定概率,如=0.05,划出两个否定区域如:和。(4)将规定的值和算得的P值相比较,或者将试验结果和否定区域相比较,从而作出接受或否定无效假设的推断。二、假设测验的步骤综合上述,统计假设测验的步骤可总结如下:二、假设测验的步骤13

如果统计假设为,则备择假设为,在假设测验时所考虑的概率为曲线左边一尾概率和右边一尾概率的总和。这类测验称为两尾测验(two-tailedtest),它具有两个否定区域。如果统计假设为,则其对应的备择假设必为。因而,这个对应的备择假设仅有一种可能性,而统计假设仅有一个否定区域,即曲线的右边一尾。这类测验称一尾测验(one-tailedtest)。一尾测验还有另一种情况,即,,这时否定区域在左边一尾.

三、两尾测验与一尾测验如果统计假设为140-1.96x+1.96x0.950.0250.025左尾右尾否定区否定区接受区双尾测验(two-sidedtest)三、两尾测验与一尾测验0-1.96x+1.96x0.950.0250.0150.950.950.050.051.64-1.64H0:≤0HA:>0假设:否定区H0:≥0HA:<0左尾测验右尾测验单尾测验(one-sidedtest)接受区接受区三、两尾测验与一尾测验0.950.950.050.051.64-1.64H0:16u0.05=1.64u0.01=2.33单尾测验分位数双尾测验分位数u0.05=1.96u0.01=2.5822否定区否定区否定区接受区接受区查表时,单尾概率等于双尾概率乘以2>三、两尾测验与一尾测验u0.05=1.64单尾双尾u0.05=1.9617假设测验的两类错误H0正确

H0错误否定H0错误()推断正确(1-)接受H0推断正确(1-)错误()第一类错误(typeIerror),又称弃真错误或错误;第二类错误(typeII

error),又称纳伪错误或错误第一类错误的概率为显著水平值。第二类错误的概率为值。四、假设测验的两类错误假设测验的两类错误第一类错误(typeIerror),又18关于两类错误的讨论可总结如下:(1)在样本容量n固定的条件下,提高显著水平(取较小的值),如从5%变为1%则将增大第二类错误的概率值。(2)在n和显著水平相同的条件下,真总体平均数和假设平均数的相差(以标准误为单位)愈大,则犯第二类错误的概率值愈小。(3)为了降低犯两类错误的概率,需采用一个较低的显著水平,如

=0.05;或适当增加样本容量。(4)如果显著水平已固定下来,则改进试验技术和增加样本容量可以有效地降低犯第二类错误的概率。四、假设测验的两类错误关于两类错误的讨论可总结如下:四、假设测验的两类错误19Section5.2

SignificanceTestsforMeans

平均数的假设测验Section5.2

SignificanceTes20一、t分布数据来自正态总体N(μ,σ2)的假设下,随机样本的均数服从正态N(μ,σ2/n)标准差σ未知,用样本标准差s估计以标准化后服从标准正态以标准化后则服从t分布

的标准差估计值又称为的标准误(standarderrorofmean,简记为

)一、t分布数据来自正态总体N(μ,σ2)的假设下,随机样本210标准正态分布t分布自由度9t分布自由度2一、t分布0标准正态分布t分布自由度9t分布自由度2一、t分布22t分布图形与正态分布图形相似都具有对称于零、单峰及钟形的特性t分布图形的散布(spread)比正态分布图形大,t分布图形的尾端具有较大的概率以替代来标准化,使得t分布有较大的变异性。t分布自由度越大图形越接近正态。样本容量越大s估计σ越可靠,估计值造成的额外变异性越小。一、t分布t分布图形与正态分布图形相似一、t分布23在自由度为的t分布曲线图下,右方与左方的面积和为a,则称为自由度为的t分布概率为a的双侧临界值。可查表。0面积为a/2面积为a/2一、t分布在自由度为的t分布曲线图下,右方与24在自由度为的t分布曲线图下,右方的面积为a,则称为自由度为的t分布概率为a的单侧临界值。可查表。0面积为a一、t分布在自由度为的t分布曲线图下,右方的面积为a25-tt0一、t分布-tt0一、t分布26t界值表1.8122.228-2.228tf(t)ν=10的t分布图t界值表1.8122.228-2.228tf(t)ν=27[例1]某春小麦良种的千粒重34g,现自外地引入一高产品种,在8个小区种植,得其千粒重(g)为:35.6、37.6、33.4、35.1、32.7、36.8、35.9、34.6,问新引入品种的千粒重与当地良种有无显著差异?这里总体为未知,又是小样本,故需用t测验;又新引入品种千粒重可能高于也可能低于当地良种,故需作两尾测验。测验步骤为:二、单个样本平均数的假设测验[例1]某春小麦良种的千粒重28H0:34g;对HA:34g。显著水平=0.05。测验计算:查附表,v=7时,t0.05=2.365。现实得|t|<=2.365,故P>0.05。推断:接受H0:34g,即新引入品种千粒重与当地良种千粒重指定值没有显著差异。二、单个样本平均数的假设测验H0:34g;对HA:34g。显著水平29由两个样本平均数的相差,以测验这两个样本所属的总体平均数有无显著差异。测验方法成组数据的平均数比较成对数据的比较三、两个样本平均数相比较的假设测验由两个样本平均数的相差,以测验这两个样本所属的30(一)成组数据的平均数比较如果两个处理为完全随机设计的两个处理,各供试单位彼此独立,不论两个处理的样本容量是否相同,所得数据皆称为成组数据,以组(处理)平均数作为相互比较的标准。在两个样本的总体方差和为未知,但可假定,而两个样本又为小样本时,用t测验。

三、两个样本平均数相比较的假设测验(一)成组数据的平均数比较如果两个处理为31从样本变异算出平均数差数的均方,其两样本平均数的差数标准误为:于是有:由于假设故自由度三、两个样本平均数相比较的假设测验从样本变异算出平均数差数的均方,其两样本平均数的32[例2]调查某农场每亩30万苗和35万苗的稻田各5块,得亩产量(单位:kg)于表1,试测验两种密度亩产量的差异显著性。表1两种密度的稻田亩产(kg)y1(30万苗)y2(35万苗)400450420440435445460445425420假设H0:两种密度的总体产量没有差异,即对显著水平=0.05

测验计算:=428kg=440kg

SS1=1930SS2=550

故三、两个样本平均数相比较的假设测验[例2]调查某农场每亩30万苗和35万苗的33查附表,v=4+4=8时,t0.05=2.306。现实得|t|=1.08<t0.05,故P>0.05。推断:接受假设

,两种密度的亩产量没有显著差异。三、两个样本平均数相比较的假设测验查附表,v=4+4=8时,t0.05=234(二)成对数据的比较若试验设计是将性质相同的两个供试单位配成一对,并设有多个配对,然后对每一配对的两个供试单位分别随机地给予不同处理,则所得观察值为成对数据。成对数据,由于同一配对内两个供试单位的试验条件很是接近,而不同配对间的条件差异又可通过同一配对的差数予以消除,因而可以控制试验误差,具有较高的精确度。在分析试验结果时,只要假设两样本的总体差数的平均数,而不必假定两样本的总体方差和相同。三、两个样本平均数相比较的假设测验(二)成对数据的比较若试验设计是将性质相35设两个样本的观察值分别为x1和x2,共配成n对,各个对的差数为d=x1-x2,差数的平均数为,则差数平均数的标准误为:它具有v=n-1。若假设

,则上式改为:即可测验三、两个样本平均数相比较的假设测验设两个样本的观察值分别为x1和x2,共配成36[例3]选生长期、发育进度、植株大小和其他方面皆比较一致的两株番茄构成一组,共得7组,每组中一株接种A处理病毒,另一株接种B处理病毒,以研究不同处理方法的饨化病毒效果,表2结果为病毒在番茄上产生的病痕数目,试测验两种处理方法的差异显著性。表2

A、B两法处理的病毒在番茄上产生的病痕数组别y1(A法)y2(B法)d11025-152131213814-64315-125512-762027-77618-12三、两个样本平均数相比较的假设测验[例3]选生长期、发育进度、植株大小和其他37假设:两种处理对饨化病毒无不同效果,即

;对

。显著水平

。查附表,v=7-1=6时,t0.01=3.707。实得现|t|>t0.01,故P<0.01。推断:否定

,接受

,即A、B两法对饨化病毒的效应有极显著差异。三、两个样本平均数相比较的假设测验假设:两种处理对饨化病毒无不同效果,即38成对数据和成组数据平均数比较的不同:(1)成对数据和成组数据平均数比较所依据的条件不同。前者是假定各个配对的差数来自差数的分布为正态的总体,具有N(0,);而每一配对的两个供试单位是彼此相关的。后者则是假定两个样本皆来自具有共同(或不同)方差的正态总体,而两个样本的各个供试单位都是彼此独立的。(2)在实践上,如将成对数据按成组数据的方法比较,容易使统计推断发生第二类错误,即不能鉴别应属显著的差异。故在应用时需严格区别。三、两个样本平均数相比较的假设测验成对数据和成组数据平均数比较的不同:三、两39Section5.3

SignificanceTestsforProportion

百分数的假设测验Section5.3

SignificanceTes40测验某一样本百分数所属总体百分数与某一理论值或期望值p0的差异显著性。由于样本百分数的标准误为:故由即可测验H0:p=p0。一、单个样本百分数(成数)的假设测验测验某一样本百分数所属总体百分数与某41[例4]以紫花和白花的大豆品种杂交,在F2代共得289株,其中紫花208株,白花81株。如果花色受一对等位基因控制,则根据遗传学原理,F2代紫花株与白花株的分离比率应为3∶1,即紫花理论百分数p=0.75,白花理论百分数q=1-p=0.25。问该试验结果是否符合一对等位基因的遗传规律?一、单个样本百分数(成数)的假设测验[例4]以紫花和白花的大豆品种杂交,在F42因为实得|u|<u0.05,故P>0.05。

推断:接受H0:p=0.75,即大豆花色遗传是符合一对等位基因的遗传规律的,紫花植株百分数=0.72和p=0.75的相差系随机误差。如果测验H0:p=0.25,结果完全一样。假设大豆花色遗传符合一对等位基因的分离规律,紫花植株的百分数是75%,即H0:p=0.75;对HA:p≠0.75。显著水平0.05,作两尾测验,u0.05=1.96。测验计算:一、单个样本百分数(成数)的假设测验因为实得|u|<u0.05,故P>0.05。推断43测验两个样本百分数和所属总体百分数p1和p2的差异显著性.设两个样本某种属性个体的观察百分数分别为和,而两样本总体该种属性的个体百分数分别为p1和

p2,则两样本百分数的差数标准差为:即可对H0:p1=p2作出假设测验。故由二、两个样本百分数(成数)的假设测验测验两个样本百分数和所属总体百分数p1和p2的44[例5]调查低洼地小麦378株(n1),其中有锈病株355株(x1),锈病率93.92%();调查高坡地小麦396株(n2),其中有锈病346株(x2),锈病率87.31%()。试测验两块麦田的锈病率有无显著差异?假设H0:两块麦田的总体锈病率无差别,即H0:p1

=p2;对HA:p1≠p2

。取

,两尾测验,u0.05=1.96。测验计算:二、两个样本百分数(成数)的假设测验[例5]调查低洼地小麦378株(n145实得|u|>u0.05,故P<0.05,推断:否定H0:p1

=p2

接受HA

:p1≠p2

,即两块麦田的锈病率有显著差异。二、两个样本百分数(成数)的假设测验实得|u|>u0.05,故P<0.05,推46Section5.4

EstimatingConfidenceInterval

区间估计Section5.4

EstimatingConfi47所谓参数的区间估计,是指在一定的概率保证之下,估计出一个范围或区间以能够覆盖参数。这个区间称置信区间(confidenceinterval),区间的上、下限称为置信限(confidencelimit),区间的长度称为置信距。一般以L1和L2分别表示置信下限和上限。保证该区间能覆盖参数的概率以P=(1-)表示,称为置信系数或置信度。一、什么是区间估计所谓参数的区间估计,是指在一定的概率保证之下48并有在总体方差为未知时置信区间为:上式中的为置信度P=(1-)时t分布的t临界值。二、单一总体平均数的置信区间并有在总体方差为未知时置信区间为:上式中的49[例6]例1已算得某春小麦良种在8个小区的千粒重平均数,。试估计在置信度为95%时该品种的千粒重范围。由附表查得v=7时

t0.05=2.365,故有,即推断:该品种总体千粒重在33.8~36.6g之间的置信度为95%。在表达时亦可写作形式,即该品种总体千粒重95%置信度的区间是35.2±(2.365×0.58)=35.2±1.4(g)

,即33.8~36.6g。二、单一总体平均数的置信区间[例6]例1已算得某春小麦良种50三、两总体平均数差数的置信区间(一)成组数据如果两总体方差未知,但相等,即,则的1-置信区间为:并有以上的为平均数差数标准误,是置信度为1-

,自由度为v=n1+n2-2时t分布的临界值。三、两总体平均数差数的置信区间(一)成组数据51[例7]试估计例2资料两种密度667m2产量差数在置信度为99%时的置信区间。在前面已算得:由附表查得v=8时,t0.01=3.355

故有L1=(428-440)-(3.355×11.136)=-

49.4,

L2=(428-440)+(3.355×11.136)=25.4(kg)。结果说明,667m2栽30万亩苗的产量可以比667m2栽35万苗的每亩少收49.4kg至每亩多收25.4kg,波动很大。所以这个例子是接受的.的。三、两总体平均数差数的置信区间[例7]试估计例2资料两种密度667m2产52(二)成对数据由可得的1-置信区间:并有为置信度为1-,v=n-1时t分布的临界t值。其中三、两总体平均数差数的置信区间(二)成对数据由可得的1-置信区间:53[例8]试求例3资料的99%置信限。在例3已算得:并由附表查得v=6时t0.01=3.707

于是有:L1=-8.3-(3.707×1.997)=-15.7(个),L2=-8.3+(3.707×1.997)=-0.9(个)。

或写作以上L1和L2皆为负值,表明A法处理病毒在番茄上产生的病痕数要比B法减小0.9~15.7个,此估计的置信度为99%。三、两总体平均数差数的置信区间[例8]试求例3资料的99%置54(一)单一总体百分数的置信区间在置信度P=1-

下,对总体p置信区间的近似估计为:并有以上式中四、百分数的置信区间(一)单一总体百分数的置信区间在置信度P=1-下,对55[例9]调查100株玉米,得到受玉米螟危害的为20株,即=20/100=0.2或=20。试计算95%置信度的玉米螟危害率置信区间。故L1=0.2-(1.96×0.04)=0.1216,L2=0.2+(1.96×0.04)=0.2784四、百分数的置信区间[例9]调查100株玉米,得到受玉米56(二)两个二项总体百分数差数的置信区间在1-

的置信度下,p1-p2的置信区间为:并有其中四、百分数的置信区间(二)两个二项总体百分数差数的置信区间在1-的置信度57[例10]例5已测知低洼地小麦的锈病率=93.92%(n1=378),高坡地小麦的锈病率=87.31%(n2=396),它们有显著差异。试按95%置信度估计两地锈病率相差的置信区间。由附表查得u0.05=1.96,而故有

L1=(0.9392-0.8731)-(1.96×0.02075)=0.0256,

L2=(0.9392-0.8731)+(1.96×0.02075)=0.1070,即低洼地的锈病率比高坡地高2.56~10.70%,此估计的置信度为95%。四、百分数的置信区间[例10]例5已测知低洼58Section5.5

RelationbetweenConfidenceIntervaland

SignificanceTests

区间估计与假设测验的关系Section5.5

Relationbetween59区间估计亦可用于假设测验。对参数所作假设若恰落在该范围内,则这个假设与参数就没有真实的不同,因而接受H0

;反之,如果对参数所作的假设落在置信区间之外,则说明假设与参数不同,所以应否定H0

,接受HA

。区间估计亦可用于假设测验。60[例11]例1已算得新引入春小麦品种的千粒重,故其95%置信区间的两个置信限为:L1=35.2-(2.365×0.58)=33.8(g)L2=35.2+(2.365×0.58)=36.6(g)曾经假设,此值落在上述置信区间内,所以不能认为新引入品种与当地原有良种的千粒重有显著差异,即接受。这和例1的结论完全相同。[例11]例1已算得新引入春小麦品种的千粒61[例12]在例3已求得两种不同处理的病毒,接种在番茄上产生的病痕数的相差,在1-

置信度下的区间为

(个)。

如果假设,则该区间内并不包括0值,所以,两种处理方法是有显著差异的,显著水平是0.05。其结论与例3同。[例12]在例3已求得两种不同处理的病毒62[例13]在例10已求得低洼地小麦锈病率与高坡地小麦锈病率的相差的95%置信区间为:

2.56%≤(p1-p2)≤10.7%。若假设H0:p1=p2,则该假设在上述置信区间外,故在=0.05水平上否定H0

,接受HA:p1-p2≠0。[例13]在例10已求得低洼地小麦锈病率与63区间估计与假设测验关系总结为以下几点:(1)若在1-

的置信度下,两个置信限同为正号或同为负号,则否定无效假设,而接受备择假设。(2)若在1-

置信度下,两个置信限为异号(一正一负),即其区间包括零值,则无效假设皆被接受。(3)若两个置信限皆为正号,则有一个参数大于另一个参数的结论成立。(4)若两个置信限皆为负号,则有一个参数小于另一个参数的结论成立。区间估计与假设测验关系总结为以下几点:(1)64第5章假设测验TestsofSignificance第5章假设测验TestsofSignificance65Section5.1

PrincipleofSignificanceTests

假设测验的基本原理Section5.1

PrincipleofSign66一、假设测验的理论基础某人宣称自由球命中率有80%。命中率有80%的射手,实地投射只有8/20命中率的机会不大。实地投射结果显示投20球中8球。结论:命中率有80%的宣称不可信。命中率有80%的自由球射手投20球命中的次数应服从二项分布B(20,0.8)。命中的次数小于或等于8的概率约为0.0001。即重复实地投射20球10,000次只中8球以下的情形约只发生一次。一、假设测验的理论基础某人宣称自由球命中率有80%。67假设宣称的叙述为真(命中率有80%),可推得实验结果发生的可能性很低,则该实验结果的发生(实地投射20球中8球),即为宣称的叙述不真的好证据。“ProvebyContradiction”小概率原理一、假设测验的理论基础假设宣称的叙述为真(命中率有80%),可推得实验结果发生的68例某地区的当地小麦品种一般667m2产300kg,即当地品种这个总体的平均数=300(kg),并从多年种植结果获得其标准差=75(kg),而现有某新品种通过25个小区的试验,计得其样本平均产量为每667m2330kg,即

=330,问新品种产量与当地品种产量是否有显著差异?二、假设测验的步骤例某地区的当地小麦品种一般667m2产300kg,即当地品69(一)先假设新品种产量与当地品种产量无差异,记作

无效假设或零假设对立假设或备择假设

二、假设测验的步骤(一)先假设新品种产量与当地品种产量无差异,记70二、假设测验的步骤(二)在承认上述无效假设的前提下,获得平均数的抽样分布,计算假设正确的概率先承认无效假设,从已知总体中抽取样本容量为n=25的样本,该样本平均数的抽样分布具正态分布形状,平均数=300(kg),标准误=15(kg)。如果新品种的平均产量很接近300kg,应接受H0。如果新品种的平均产量与300相差很大,应否定H0。但如果试验结果与300不很接近也不相差悬殊,就要借助于概率原理,具体做法有以下两种:二、假设测验的步骤(二)在承认上述无效假设711.计算概率在假设

为正确的条件下,根据的抽样分布算出获得330kg的概率,或者说算得出现随机误差30(kg)的概率:在此,查附表,当u=2时,P(概率)界于0.04和0.05之间,即这一试验结果:30(kg),属于抽样误差的概率小于5%。

二、假设测验的步骤1.计算概率在假设为正确的条件下,根据的抽样分722.计算接受区和否定区在假设H0为正确的条件下,根据的抽样分布划出一个区间,如在这一区间内则接受H0,如在这一区间外则否定H0。由于

因此,在的抽样分布中,落在()区间内的有95%,落在这一区间外的只有5%。二、假设测验的步骤2.计算接受区和否定区在假设H0为正确的条件下,根据73如果以5%概率作为接受或否定H0的界限,则上述区间()为接受假设的区域,简称接受区(acceptanceregion);和为否定假设的区域,简称否定区(rejectionregion)。同理,若以1%作为接受或否定H0的界限,则()为接受区域,和为否定区域。二、假设测验的步骤如果以5%概率作为接受或否定H0的界限,则上74如上述小麦新品种例,

=300,,1.96=29.4(kg)。因之,它的两个2.5%概率的否定区域为

≤300-29.4和

≥300+29.4,即大于329.4(kg)和小于270.6(kg)的概率只有5%。图5%显著水平假设测验图示(表示接受区域和否定区域)二、假设测验的步骤如上述小麦新品种例,图5%显著水平假设75(三)根据“小概率事件实际上不可能发生”原理接受或否定假设当由随机误差造成的概率P小于5%或1%时,就可认为它不可能属于抽样误差,从而否定假设。如P<0.05,则称这个差数是显著的。如P<0.01,则称这个差数是极显著的。用来测验假设的概率标准5%或1%等,称为显著水平(significancelevel)。

一般以表示,如=0.05或=0.01。二、假设测验的步骤(三)根据“小概率事件实际上不可能发生”原理接受或否定76综合上述,统计假设测验的步骤可总结如下:(1)对样本所属的总体提出统计假设,包括无效假设和备择假设。(2)规定测验的显著水平值。(3)在为正确的假定下,根据平均数()或其他统计数的抽样分布,获得实际差数(如等)由误差造成的概率(P值)。或者根据已规定概率,如=0.05,划出两个否定区域如:和。(4)将规定的值和算得的P值相比较,或者将试验结果和否定区域相比较,从而作出接受或否定无效假设的推断。二、假设测验的步骤综合上述,统计假设测验的步骤可总结如下:二、假设测验的步骤77

如果统计假设为,则备择假设为,在假设测验时所考虑的概率为曲线左边一尾概率和右边一尾概率的总和。这类测验称为两尾测验(two-tailedtest),它具有两个否定区域。如果统计假设为,则其对应的备择假设必为。因而,这个对应的备择假设仅有一种可能性,而统计假设仅有一个否定区域,即曲线的右边一尾。这类测验称一尾测验(one-tailedtest)。一尾测验还有另一种情况,即,,这时否定区域在左边一尾.

三、两尾测验与一尾测验如果统计假设为780-1.96x+1.96x0.950.0250.025左尾右尾否定区否定区接受区双尾测验(two-sidedtest)三、两尾测验与一尾测验0-1.96x+1.96x0.950.0250.0790.950.950.050.051.64-1.64H0:≤0HA:>0假设:否定区H0:≥0HA:<0左尾测验右尾测验单尾测验(one-sidedtest)接受区接受区三、两尾测验与一尾测验0.950.950.050.051.64-1.64H0:80u0.05=1.64u0.01=2.33单尾测验分位数双尾测验分位数u0.05=1.96u0.01=2.5822否定区否定区否定区接受区接受区查表时,单尾概率等于双尾概率乘以2>三、两尾测验与一尾测验u0.05=1.64单尾双尾u0.05=1.9681假设测验的两类错误H0正确

H0错误否定H0错误()推断正确(1-)接受H0推断正确(1-)错误()第一类错误(typeIerror),又称弃真错误或错误;第二类错误(typeII

error),又称纳伪错误或错误第一类错误的概率为显著水平值。第二类错误的概率为值。四、假设测验的两类错误假设测验的两类错误第一类错误(typeIerror),又82关于两类错误的讨论可总结如下:(1)在样本容量n固定的条件下,提高显著水平(取较小的值),如从5%变为1%则将增大第二类错误的概率值。(2)在n和显著水平相同的条件下,真总体平均数和假设平均数的相差(以标准误为单位)愈大,则犯第二类错误的概率值愈小。(3)为了降低犯两类错误的概率,需采用一个较低的显著水平,如

=0.05;或适当增加样本容量。(4)如果显著水平已固定下来,则改进试验技术和增加样本容量可以有效地降低犯第二类错误的概率。四、假设测验的两类错误关于两类错误的讨论可总结如下:四、假设测验的两类错误83Section5.2

SignificanceTestsforMeans

平均数的假设测验Section5.2

SignificanceTes84一、t分布数据来自正态总体N(μ,σ2)的假设下,随机样本的均数服从正态N(μ,σ2/n)标准差σ未知,用样本标准差s估计以标准化后服从标准正态以标准化后则服从t分布

的标准差估计值又称为的标准误(standarderrorofmean,简记为

)一、t分布数据来自正态总体N(μ,σ2)的假设下,随机样本850标准正态分布t分布自由度9t分布自由度2一、t分布0标准正态分布t分布自由度9t分布自由度2一、t分布86t分布图形与正态分布图形相似都具有对称于零、单峰及钟形的特性t分布图形的散布(spread)比正态分布图形大,t分布图形的尾端具有较大的概率以替代来标准化,使得t分布有较大的变异性。t分布自由度越大图形越接近正态。样本容量越大s估计σ越可靠,估计值造成的额外变异性越小。一、t分布t分布图形与正态分布图形相似一、t分布87在自由度为的t分布曲线图下,右方与左方的面积和为a,则称为自由度为的t分布概率为a的双侧临界值。可查表。0面积为a/2面积为a/2一、t分布在自由度为的t分布曲线图下,右方与88在自由度为的t分布曲线图下,右方的面积为a,则称为自由度为的t分布概率为a的单侧临界值。可查表。0面积为a一、t分布在自由度为的t分布曲线图下,右方的面积为a89-tt0一、t分布-tt0一、t分布90t界值表1.8122.228-2.228tf(t)ν=10的t分布图t界值表1.8122.228-2.228tf(t)ν=91[例1]某春小麦良种的千粒重34g,现自外地引入一高产品种,在8个小区种植,得其千粒重(g)为:35.6、37.6、33.4、35.1、32.7、36.8、35.9、34.6,问新引入品种的千粒重与当地良种有无显著差异?这里总体为未知,又是小样本,故需用t测验;又新引入品种千粒重可能高于也可能低于当地良种,故需作两尾测验。测验步骤为:二、单个样本平均数的假设测验[例1]某春小麦良种的千粒重92H0:34g;对HA:34g。显著水平=0.05。测验计算:查附表,v=7时,t0.05=2.365。现实得|t|<=2.365,故P>0.05。推断:接受H0:34g,即新引入品种千粒重与当地良种千粒重指定值没有显著差异。二、单个样本平均数的假设测验H0:34g;对HA:34g。显著水平93由两个样本平均数的相差,以测验这两个样本所属的总体平均数有无显著差异。测验方法成组数据的平均数比较成对数据的比较三、两个样本平均数相比较的假设测验由两个样本平均数的相差,以测验这两个样本所属的94(一)成组数据的平均数比较如果两个处理为完全随机设计的两个处理,各供试单位彼此独立,不论两个处理的样本容量是否相同,所得数据皆称为成组数据,以组(处理)平均数作为相互比较的标准。在两个样本的总体方差和为未知,但可假定,而两个样本又为小样本时,用t测验。

三、两个样本平均数相比较的假设测验(一)成组数据的平均数比较如果两个处理为95从样本变异算出平均数差数的均方,其两样本平均数的差数标准误为:于是有:由于假设故自由度三、两个样本平均数相比较的假设测验从样本变异算出平均数差数的均方,其两样本平均数的96[例2]调查某农场每亩30万苗和35万苗的稻田各5块,得亩产量(单位:kg)于表1,试测验两种密度亩产量的差异显著性。表1两种密度的稻田亩产(kg)y1(30万苗)y2(35万苗)400450420440435445460445425420假设H0:两种密度的总体产量没有差异,即对显著水平=0.05

测验计算:=428kg=440kg

SS1=1930SS2=550

故三、两个样本平均数相比较的假设测验[例2]调查某农场每亩30万苗和35万苗的97查附表,v=4+4=8时,t0.05=2.306。现实得|t|=1.08<t0.05,故P>0.05。推断:接受假设

,两种密度的亩产量没有显著差异。三、两个样本平均数相比较的假设测验查附表,v=4+4=8时,t0.05=298(二)成对数据的比较若试验设计是将性质相同的两个供试单位配成一对,并设有多个配对,然后对每一配对的两个供试单位分别随机地给予不同处理,则所得观察值为成对数据。成对数据,由于同一配对内两个供试单位的试验条件很是接近,而不同配对间的条件差异又可通过同一配对的差数予以消除,因而可以控制试验误差,具有较高的精确度。在分析试验结果时,只要假设两样本的总体差数的平均数,而不必假定两样本的总体方差和相同。三、两个样本平均数相比较的假设测验(二)成对数据的比较若试验设计是将性质相99设两个样本的观察值分别为x1和x2,共配成n对,各个对的差数为d=x1-x2,差数的平均数为,则差数平均数的标准误为:它具有v=n-1。若假设

,则上式改为:即可测验三、两个样本平均数相比较的假设测验设两个样本的观察值分别为x1和x2,共配成100[例3]选生长期、发育进度、植株大小和其他方面皆比较一致的两株番茄构成一组,共得7组,每组中一株接种A处理病毒,另一株接种B处理病毒,以研究不同处理方法的饨化病毒效果,表2结果为病毒在番茄上产生的病痕数目,试测验两种处理方法的差异显著性。表2

A、B两法处理的病毒在番茄上产生的病痕数组别y1(A法)y2(B法)d11025-152131213814-64315-125512-762027-77618-12三、两个样本平均数相比较的假设测验[例3]选生长期、发育进度、植株大小和其他101假设:两种处理对饨化病毒无不同效果,即

;对

。显著水平

。查附表,v=7-1=6时,t0.01=3.707。实得现|t|>t0.01,故P<0.01。推断:否定

,接受

,即A、B两法对饨化病毒的效应有极显著差异。三、两个样本平均数相比较的假设测验假设:两种处理对饨化病毒无不同效果,即102成对数据和成组数据平均数比较的不同:(1)成对数据和成组数据平均数比较所依据的条件不同。前者是假定各个配对的差数来自差数的分布为正态的总体,具有N(0,);而每一配对的两个供试单位是彼此相关的。后者则是假定两个样本皆来自具有共同(或不同)方差的正态总体,而两个样本的各个供试单位都是彼此独立的。(2)在实践上,如将成对数据按成组数据的方法比较,容易使统计推断发生第二类错误,即不能鉴别应属显著的差异。故在应用时需严格区别。三、两个样本平均数相比较的假设测验成对数据和成组数据平均数比较的不同:三、两103Section5.3

SignificanceTestsforProportion

百分数的假设测验Section5.3

SignificanceTes104测验某一样本百分数所属总体百分数与某一理论值或期望值p0的差异显著性。由于样本百分数的标准误为:故由即可测验H0:p=p0。一、单个样本百分数(成数)的假设测验测验某一样本百分数所属总体百分数与某105[例4]以紫花和白花的大豆品种杂交,在F2代共得289株,其中紫花208株,白花81株。如果花色受一对等位基因控制,则根据遗传学原理,F2代紫花株与白花株的分离比率应为3∶1,即紫花理论百分数p=0.75,白花理论百分数q=1-p=0.25。问该试验结果是否符合一对等位基因的遗传规律?一、单个样本百分数(成数)的假设测验[例4]以紫花和白花的大豆品种杂交,在F106因为实得|u|<u0.05,故P>0.05。

推断:接受H0:p=0.75,即大豆花色遗传是符合一对等位基因的遗传规律的,紫花植株百分数=0.72和p=0.75的相差系随机误差。如果测验H0:p=0.25,结果完全一样。假设大豆花色遗传符合一对等位基因的分离规律,紫花植株的百分数是75%,即H0:p=0.75;对HA:p≠0.75。显著水平0.05,作两尾测验,u0.05=1.96。测验计算:一、单个样本百分数(成数)的假设测验因为实得|u|<u0.05,故P>0.05。推断107测验两个样本百分数和所属总体百分数p1和p2的差异显著性.设两个样本某种属性个体的观察百分数分别为和,而两样本总体该种属性的个体百分数分别为p1和

p2,则两样本百分数的差数标准差为:即可对H0:p1=p2作出假设测验。故由二、两个样本百分数(成数)的假设测验测验两个样本百分数和所属总体百分数p1和p2的108[例5]调查低洼地小麦378株(n1),其中有锈病株355株(x1),锈病率93.92%();调查高坡地小麦396株(n2),其中有锈病346株(x2),锈病率87.31%()。试测验两块麦田的锈病率有无显著差异?假设H0:两块麦田的总体锈病率无差别,即H0:p1

=p2;对HA:p1≠p2

。取

,两尾测验,u0.05=1.96。测验计算:二、两个样本百分数(成数)的假设测验[例5]调查低洼地小麦378株(n1109实得|u|>u0.05,故P<0.05,推断:否定H0:p1

=p2

接受HA

:p1≠p2

,即两块麦田的锈病率有显著差异。二、两个样本百分数(成数)的假设测验实得|u|>u0.05,故P<0.05,推110Section5.4

EstimatingConfidenceInterval

区间估计Section5.4

EstimatingConfi111所谓参数的区间估计,是指在一定的概率保证之下,估计出一个范围或区间以能够覆盖参数。这个区间称置信区间(confidenceinterval),区间的上、下限称为置信限(confidencelimit),区间的长度称为置信距。一般以L1和L2分别表示置信下限和上限。保证该区间能覆盖参数的概率以P=(1-)表示,称为置信系数或置信度。一、什么是区间估计所谓参数的区间估计,是指在一定的概率保证之下112并有在总体方差为未知时置信区间为:上式中的为置信度P=(1-)时t分布的t临界值。二、单一总体平均数的置信区间并有在总体方差为未知时置信区间为:上式中的113[例6]例1已算得某春小麦良种在8个小区的千粒重平均数,。试估计在置信度为95%时该品种的千粒重范围。由附表查得v=7时

t0.05=2.365,故有,即推断:该品种总体千粒重在33.8~36.6g之间的置信度为95%。在表达时亦可写作形式,即该品种总体千粒重95%置信度的区间是35.2±(2.365×0.58)=35.2±1.4(g)

,即33.8~36.6g。二、单一总体平均数的置信区间[例6]例1已算得某春小麦良种114三、两总体平均数差数的置信区间(一)成组数据如果两总体方差未知,但相等,即,则的1-置信区间为:并有以上的为平均数差数标准误,是置信度为1-

,自由度为v=n1+n2-2时t分布的临界值。三、两总体平均数差数的置信区间(一)成组数据115[例7]试估计例2资料两种密度667m2产量差数在置信度为99%时的置信区间。在前面已算得:由附表查得v=8时,t0.01=3.355

故有L1=(428-440)-

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论