试验设计与分析园艺第三章统计推断_第1页
试验设计与分析园艺第三章统计推断_第2页
试验设计与分析园艺第三章统计推断_第3页
试验设计与分析园艺第三章统计推断_第4页
试验设计与分析园艺第三章统计推断_第5页
已阅读5页,还剩99页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

试验设计与分析园艺第三章统计推断第一页,共一百零四页,编辑于2023年,星期三第一节参数估计第二节统计假设测验的原理第三节样本平均数的显著性测验第四节统计假设测验的两类错误第二页,共一百零四页,编辑于2023年,星期三第一节参数估计统计推断的内容总体的参数估计总体的假设检验参数估计:总体参数未知时,需要从总体抽出一个样本对未知参数进行估计。分为点估计和区间估计。点估计是对参数真值的估计区间估计是对参数真值取值范围的估计第三页,共一百零四页,编辑于2023年,星期三一、参数的点估计(1)点估计的定义假设总体x

的分布函数的形式已知,但含有未知参数。x1、x2、…、xn为总体的一个样本,构造一个的统计量(如平均数),将所测得的样本值代入统计量,就会得到,那么就称为未知参数的估计值。第四页,共一百零四页,编辑于2023年,星期三(2)评价估计量优劣的标准无偏性:如果的数学期望值存在,且等于待估参数,就是的无偏估计。有效性:如果和都是的无偏估计,但的方差小于的方差,我们就说比有效。一致性:对任意小的正数ε,成立,则称是参数的一致估计量。第五页,共一百零四页,编辑于2023年,星期三二、参数的区间估计(1)点估计的缺点只给出了总体参数的估计值,没有考虑试验误差的影响,从总体中抽取不同的样本,可能得到不同的结果。没有指出估计的可靠程度。第六页,共一百零四页,编辑于2023年,星期三(2)区间估计相关概念区间估计:在一定概率保证下给出总体参数的可能范围置信区间:所给出的可能范围置信限:置信区间的上、下限,用L1和L2表示置信距:置信区间的长度置信度:所给出的概率保证,也称置信概率,用P=(1-α)表示第七页,共一百零四页,编辑于2023年,星期三(3)区间估计的原理置信度1-α反映了区间估计的可信度,常取0.90、0.95和0.99。置信距反映了区间估计的精确度。在保证置信度1-α的前提下,置信区间越短越好。第八页,共一百零四页,编辑于2023年,星期三(4)进行区间估计的一般步骤:首先,构造一个与待估计参数有关的统计量;其次,找出统计量的分布,在一定的置信度下,给出临界值;最后,计算总体参数的置信区间。第九页,共一百零四页,编辑于2023年,星期三三、正态总体平均数μ的置信区间(1)总体方差σ2已知时,μ的置信区间为其中,uα为正态分布下置信度为1-α时u的临界值。第十页,共一百零四页,编辑于2023年,星期三应用举例某棉花株行圃36个单行的皮棉平均产量为=4.1kg,已知σ=0.3kg,求99%置信度下该株行皮棉产量μ的置信区间。第十一页,共一百零四页,编辑于2023年,星期三置信度P=(1-α)=0.99,α=0.01,则u0.01=2.58由于置信区间为(4.1-2.58×0.05)≤μ≤(4.1+2.58×0.05),即3.971≤μ≤4.229推断:该株行圃皮棉平均产量在3.971~4.229kg之间,此估计值的可靠度有99%。α=0.05时,平均产量在4.002~4.198kg之间

第十二页,共一百零四页,编辑于2023年,星期三(2)总体方差σ2未知但为大样本时,用样本方差s2

代替σ2

,μ的置信区间为(3)总体方差σ2未知且为小样本时,用样本方差s2

估计σ2

,μ的置信区间为其中,tα为t分布下置信度为1-α时t的临界值。第十三页,共一百零四页,编辑于2023年,星期三t分布由样本平均数抽样分布的性质知道:若x~N(μ,σ2),则~N(μ,σ2/n)。将随机变量标准化:,则u~N(0,1)。当总体标准差σ未知时,如果为大样本,可以用样本标准差s直接代替σ使用。如果为小样本,那么用s代替σ所得到的统计数记为t,即。由于用s代替σ,t变量不再服从标准正态分布,而是服从自由度df=n-1的t分布,t的取值范围是(-∞,+∞)。附表5中数字为两尾临界t值。第十四页,共一百零四页,编辑于2023年,星期三应用举例某春小麦良种在8个小区的平均千粒重,。试估计在置信度为95%时该品种的千粒重范围。由附表4,t

0.05(7)=2.365,95%置信区间为(35.2-2.365×0.58)≤μ≤(35.2+2.365×0.58),即33.8≤μ≤36.6推断:该品种的千粒重范围在33.8~36.6g之间,此估计值的可靠度有95%。也可以写作35.2±2.356×0.58=35.2±1.4g,即33.8~36.6g。第十五页,共一百零四页,编辑于2023年,星期三四、两总体平均数差数(μ1-μ2)的

置信区间(1)两总体方差已知时,μ1-μ2在1-α置信度下的置信区间为(2)两总体方差未知但为大样本时,用s1、s2分别代替σ1、σ2,μ1-μ2在1-α置信度下的置信区间为第十六页,共一百零四页,编辑于2023年,星期三应用举例测两个甘薯品种单株平均产量,其中第一个品种测了332株,=15×50g,s1=5.3×50g;第二个品种测了282株,=12×50g,s2=3.7×50g。试估计这两个品种单株平均产量的相差在95%置信度下的置信区间。第十七页,共一百零四页,编辑于2023年,星期三由附表3查得置信度为95%时,u0.05=1.96,并且95%置信度下的置信区间为[(15-12)-1.96×0.36]≤μ1-μ2≤[(15-12)+1.96×0.36],即2.29≤μ1-μ2≤3.71。因此,第一个品种比第二个品种的单株平均产量多2.29×50g~3.71×50g,这个估计有95%的把握。第十八页,共一百零四页,编辑于2023年,星期三(2)两总体方差未知且为小样本时①如果两总体方差相等,即σ12=σ22

=σ2

。μ1-μ2在1-α置信度下的置信区间为:

其中,df=n1+n2-2第十九页,共一百零四页,编辑于2023年,星期三应用举例比较两种密度水稻的平均亩产量,每种密度各调查5个小区,结果=428kg,=440kg,

=11.136kg。试估计这两种密度水稻的平均亩产量差数在99%置信度下的置信区间。第二十页,共一百零四页,编辑于2023年,星期三由附表5查得df=8时置信度为99%时,t0.01=3.35599%置信度下的置信区间为[(428-440)-3.355×11.136]≤μ1-μ2≤[(428-440)+3.355×11.136],即-49.4≤μ1-μ2≤25.4。结果说明:第一种密度的平均亩产量可以比第二种密度少收49.4kg到多收25.4kg,波动很大。因此,这个例子说明μ1=μ2的。第二十一页,共一百零四页,编辑于2023年,星期三当μ1=μ2时,意味着两总体平均数相等,因此,可用两样本平均数的加权平均数作为对μ的估计:第二十二页,共一百零四页,编辑于2023年,星期三②如果两总体方差不相等,即σ12≠σ22

。μ1-μ2在1-α置信度下的置信区间为:

其中取其整数部分第二十三页,共一百零四页,编辑于2023年,星期三第二节统计假设测验的原理一、统计假设测验的概念二、统计假设测验的原理三、统计假设测验的步骤四、两尾测验和一尾测验第二十四页,共一百零四页,编辑于2023年,星期三一、统计假设测验的概念(1)为什么要进行统计假设测验一个试验相当于一个样本,由一个样本统计数可以对总体参数作出估计,但总体参数是固定的,而样本统计数会因样本不同而不同,即样本统计数存在误差。第二十五页,共一百零四页,编辑于2023年,星期三如:某地区主栽水稻品种的亩产量为550kg(总体),一新品种的多点试验结果为600kg的亩产量,试问这一新品种的亩产量是否真正高于主栽品种?(其它举例见教材P75)该新品种的亩产量比主栽品种高600-550=50kg,这是试验的表面效应,造成这种差异的可能原因有两个:一是新品种确实优于主栽品种二是试验误差第二十六页,共一百零四页,编辑于2023年,星期三(2)如何进行假设测验那么如何判断是哪一种原因?方法是将表面效应与误差作比较。如果表面效应并不大于误差,则无充分证据说明新品种确实优于主栽品种,表面效应是由试验误差造成的。如果表面效应大于误差,表面效应不完全是由试验误差造成的,说明新品种确实优于主栽品种。第二十七页,共一百零四页,编辑于2023年,星期三表面效应是否大于试验误差这个度怎么把握?我们可以根据抽样误差出现的概率而利用抽样分布来计算。只要设定一定的概率标准,如5%或1%,如果表面效应属于误差的概率不超过这个标准,我们就可以认为表面效应不完全是由试验误差造成的。第二十八页,共一百零四页,编辑于2023年,星期三(3)相关概念统计推断:把试验的表面效应与误差大小相比较并由表面效应可能属于误差的概率而作出推论的方法。统计假设测验:计算表面效应由误差造成的概率首先必须假设表面效应是由误差造成的(如假定新品种并不优于主栽品种)。有了这个事先的假设,才能计算概率。这种先作处理无效的假设(无效假设)再依据该假设概率大小来判断接受或否定该假设的过程称为统计假设测验。第二十九页,共一百零四页,编辑于2023年,星期三二、统计假设测验的原理(1)两个总体间的差异如何比较?一种方法是检验整个总体材料,获得全部结果,这种方法很准确,但实际上不可能进行。另一种方法是通过研究样本来研究其所代表的总体。如将新旧品种共同种植1~2年,取得其平均产量,然后由此推断“新旧品种无差异”的假设是否正确。如果发现假设和试验结果相符的可能性大,接受该假设;反之,否定该假设。第三十页,共一百零四页,编辑于2023年,星期三(2)相关概念统计假设:要进行统计假设测验,首先需要提出一个有关某一总体参数的假设,这种假设称为统计假设。无效假设:统计假设一般假设没有效应差异,即表面效应是由误差造成的,这种假设称为无效假设,记作H0

。备择假设:和无效假设相对应的是备择假设,记作HA

。如果否定了无效假设,就必须接受备择假设;如果接受了无效假设,也就否定了备择假设。第三十一页,共一百零四页,编辑于2023年,星期三(3)常见的统计假设类型单个平均数的假设:样本是从具有平均数μ0的总体中随机抽出的,记作H0:μ=μ0。如黄瓜新品种的亩产量和主栽品种相同,这是指新品种的产量是主栽品种产量的一个随机样本,其平均产量μ等于主栽品种产量μ0,故记为H0:μ=μ0。两个平均数相比较的假设:两个样本是从两个具有相等平均数的总体中随机抽出的,记为H0:μ1=μ2或μ1-μ2=0。如两个番茄品种亩产量相同或两种杀虫剂对于某种害虫的药效相等。第三十二页,共一百零四页,编辑于2023年,星期三三、统计假设测验的步骤(1)对所研究的总体及所抽取的样本首先提出一个无效假设和备择假设(2)在承认上述无效假设的前提下,获得平均数的抽样分布,计算该假设正确的概率(3)根据“小概率事件实际上不可能发生”原理接受或否定假设第三十三页,共一百零四页,编辑于2023年,星期三应用实例某地小麦主栽品种亩产300kg,即当地品种这个总体的平均数μ0=300kg,并从多年种植结果获得其标准差σ=75kg,而现有某新品种通过25个小区的试验,计得其样本平均亩产量为330kg,即=330,那么新品种样本所属总体与μ0=300kg的主栽品种这个总体是否有显著差异呢?第三十四页,共一百零四页,编辑于2023年,星期三(1)对所研究的总体首先提出一个无效假设通常无效假设常为所比较的两个总体间无差异。测验单个平均数,则假设该样本是从一已知总体中随机抽出的,即H0:μ=μ0,备择假设为HA:μ≠μ0

。假定新品种的总体平均数μ等于原品种的总体平均数μ0=300kg,而样本平均数和之间的差数:330-300=30kg属随机误差;如果测验两个平均数,则假设两个样本的总体平均数相等,即H0:μ1=μ2

,也就是假设两个样本平均数的差数属随机误差,并非真实差异;其备择假设为HA:μ1

≠μ2。第三十五页,共一百零四页,编辑于2023年,星期三(2)在承认上述无效假设的前提下,获得平均数的抽样分布,计算假设正确的概率先承认无效假设,从已知总体中抽取样本容量为n=25的样本,根据中心极限定理,该样本平均数的抽样分布服从正态分布,平均数=300kg,标准误=15(kg)。第三十六页,共一百零四页,编辑于2023年,星期三①计算概率在假设H0为正确的条件下,根据的抽样分布算出获得

=330kg的概率。将标准化:新品种产量有可能高于或低于主栽品种,用两尾概率。查附表2,当u=2时,P=0.0455,这说明-μ0=30kg属于随机误差的概率小于5%,即新品种总体与主栽品种总体没有差异的概率小于5%。第三十七页,共一百零四页,编辑于2023年,星期三这样有两种推论可以选择:A.新品种与主栽品种无明显差异,其概率小于5%。B.新品种与主栽品种有明显差异,其概率大于95%。那么我们是选择哪一种推论呢?第三十八页,共一百零四页,编辑于2023年,星期三②计算接受区和否定区在假设H0为正确的条件下,根据的抽样分布划出一个区间,如在这一区间内则接受H0,如在这一区间外则否定H0

。意思就是,如果在这个区间内,该差数就解释为随机误差;如果落在这个区间外,该差数就应该就解释为真实差异。如何确定这一区间呢?第三十九页,共一百零四页,编辑于2023年,星期三我们在讲正态分布的时候,知道:在的抽样分布中,落在(,)区间内的有95%,落在这一区间外(即和)的概率只有5%。如果以5%概率作为接受或否定H0的界限,那么前者称为接受假设的区域,简称接受区;后者为否定假设的区域,简称否定区。

1%概率的接受区和否定区各是多少?第四十页,共一百零四页,编辑于2023年,星期三在上面的例子中,95%的接受区域为(300-1.96×15,300+1.96×15),即(270.6,329.4)。第四十一页,共一百零四页,编辑于2023年,星期三(3)根据“小概率事件实际上不可能发生”原理接受或否定无效假设根据“小概率事件实际上不可能发生”原理,当无效假设成立的概率小于5%或1%时,我们就认为无效假设不可能成立,从而否定无效假设,接受备择假设。第四十二页,共一百零四页,编辑于2023年,星期三上例中,-μ=30kg是由随机误差造成的概率小于5%,因此可以否定H0,称这个差数是显著的,接受HA。如果差数由随机误差造成的概率小于1%,就称这个差数是极显著的,接受HA。用来测验假设的概率标准5%或1%等,称为显著水平,一般用α表示,如α=0.05或α=0.01。上例中算得u值的概率小于5%,说明差数30kg已经达到α=0.05显著水平。第四十三页,共一百零四页,编辑于2023年,星期三统计假设测验的步骤可总结如下:(1)对样本所属的总体提出统计假设,包括无效假设和备择假设。(2)规定测验的显著水平α值。(3)在无效假设为正确的假定下,根据统计数的抽样分布,如为正态分布的计算正态离差u值,或根据显著水平划出否定区域。(4)将显著水平和u值比较,或将试验结果和否定区域比较,作出接受或否定无效假设的推断。第四十四页,共一百零四页,编辑于2023年,星期三四、两尾测验和一尾测验我们在提出统计假设时,必有一个相对应的备择假设。备择假设是否定无效假设时必然要接受的假设。如果H0:μ=μ0,备择假设为HA:μ≠μ0。后者包括两种可能性,即μ>μ0和μ<μ0

。因而在假设测验时所考虑的概率为正态曲线左边一尾概率和右边一尾的总和,这类测验称为两尾测验,它具有两个否定区域。第四十五页,共一百零四页,编辑于2023年,星期三如果H0:μ≤μ0,备择假设为HA:μ>μ0。某种杀虫剂防虫效果达到90%才符合标准,那么其无效假设为H0:μ≤90%,备择假设为HA:μ>90%。对应的备择假设只有一种可能,无效假设只有一个否定区域,即正态曲线的右边一尾。这类测验称一尾测验。一尾测验还有一种情况,即H0:μ≥μ0,HA

:μ<μ0,这时,否定区域在正态曲线的左边一尾。使用某种杀菌剂后的发病率为10%,不使用时为50%,试测验该杀菌剂是否降低了发病率。那么H0:μ≥50%,HA:μ<50%。第四十六页,共一百零四页,编辑于2023年,星期三作一尾测验时,需将附表3列出的两尾概率乘以1/2,再查出其u值。如作α=0.05时的一尾测验,查附表的P=0.10一栏,u=1.64,其否定区域为或。当α=0.05时,两尾测验的|uα|

=1.96,而一尾测验的uα=1.64或uα=-1.64。所以,一尾测验容易否定假设。在试验之前应慎重考虑采用一尾测验还是两尾测验。第四十七页,共一百零四页,编辑于2023年,星期三第四十八页,共一百零四页,编辑于2023年,星期三第三节样本平均数的显著性测验一、样本平均数显著性测验的类型二、单个样本平均数的假设测验三、两个样本平均数相比较的假设测验四、二项资料百分数(成数)的假设测验第四十九页,共一百零四页,编辑于2023年,星期三一、样本平均数显著性测验的类型根据总体方差σ2是否已知和样本大小可分为以下几种测验。u测验:适用于总体方差已知或总体方差虽未知但为大样本的情况t测验:适用于总体方差未知且为小样本的情况第五十页,共一百零四页,编辑于2023年,星期三(1)u测验根据中心极限定理,从一个平均数为μ、方差为σ2的正态总体中抽样,或者在一个非正态总体里抽样,只要样本容量足够大,所得一系列样本平均数的分布必然趋向正态分布,即~

。经标准化后,服从标准正态分布N(0,1)。由试验结果计算出u值后,便可从附表3查出其相应的概率,测验H0:μ=μ0。这类测验称为u测验。第五十一页,共一百零四页,编辑于2023年,星期三应用举例如:苹果某品种的果实硬度μ0=15kg/cm2,进行喷Ca2+处理后,取100个果实,=15.6kg/cm2,s=0.5kg/cm2。问Ca2+处理能否提高苹果果实硬度?第五十二页,共一百零四页,编辑于2023年,星期三提出假设:H0:μ≤μ0,HA:μ>μ0。规定显著水平:α=0.05,u0.05=1.64。统计量计算:作出推断:u>u0.05,P<0.05,否定H0,接受HA。解释试验结果:Ca2+处理能显著提高苹果果实硬度。第五十三页,共一百零四页,编辑于2023年,星期三(2)t测验当总体标准差σ未知且为小样本时,以样本标准差s代替σ所得到的统计数记为t,。t变量不再服从标准正态分布,而是服从自由度df=n-1的t分布。按t分布进行的假设测验称为t测验。t测验的原理、步骤均同u测验。第五十四页,共一百零四页,编辑于2023年,星期三应用举例如:池塘水含氧量的标准是μ0

=4.5mL/L,现对某一池塘水进行含氧量检测,取10个点,含氧量分别为4.33、4.52、4.25、4.44、4.56、4.54、4.42、4.26、4.24和4.50mL/L。问该池塘的水含氧量是否达到标准?第五十五页,共一百零四页,编辑于2023年,星期三提出假设:H0:μ=μ0,HA:μ≠μ0

。规定显著水平:α=0.05,t0.05(9)=2.262。统计量计算:

=4.406,s=0.126

作出推断:|t|>t0.05(9),P<0.05,否定H0,接受HA。解释试验结果:此池塘的水含氧量没有达到标准。第五十六页,共一百零四页,编辑于2023年,星期三二、单个样本平均数的假设测验这是测验某一样本平均数所属总体是否和某一指定总体的平均数相同。上面的举例都属于单个样本平均数的假设测验。

如:某春小麦良种的千粒重μ0=34g,现自外地引入一高产品种,在8个小区种植,得其千粒重为:35.6、37.6、33.4、35.1、32.7、36.8、35.9、34.6g,问新引入品种的千粒重与当地良种有无显著差异?第五十七页,共一百零四页,编辑于2023年,星期三提出假设:H0:μ=μ0,HA:μ≠μ0

。规定显著水平:α=0.05,t0.05(7)=2.365。统计量计算:

=35.2g,s=1.64g

作出推断:t<

t0.05(9),P>0.05,接受H0,否定HA。推断:新引入品种千粒重与当地良种千粒重指定值没有显著差异。第五十八页,共一百零四页,编辑于2023年,星期三三、两个样本平均数相比较的假设测验这是由两个样本平均数的相差,测验这两个样本所属的总体平均数有无明显差异。两个黄瓜品种的产量是否相同。两种杀虫药剂对于辣椒疫病的防治效果是否相等。测验方法因试验设计的不同以下两种:(1)成组数据的平均数比较(2)成对数据的平均数比较第五十九页,共一百零四页,编辑于2023年,星期三(1)成组数据的平均数比较成组数据:如果两个处理为完全随机设计,各供试单位彼此独立,不论两个处理的样本容量是否相同,所得数据都称为成组数据。以组(处理)平均数作为相互比较的标准。根据两个样本所属总体的方差(σ12和σ22)是否已知、是否相等而采用不同的测验方法。

第六十页,共一百零四页,编辑于2023年,星期三①两个样本的总体方差σ12和σ22

已知由抽样分布的公式知,两样本平均数和的差数标准误,在σ12和σ22是已知时为:并有:在假设H0:μ1

=μ2

下,故可对两样本平均数的差异作出假设测验。第六十一页,共一百零四页,编辑于2023年,星期三应用举例某小麦品种产量的σ2=0.4(kg/m2)2。在该品种的一块地上用A、B两种方法取样。A法取12个点,产量为=1.2(kg/m2)2;B法8个点,产量为=1.4(kg/m2)2。问A、B两种取样方法的产量有无明显差异?第六十二页,共一百零四页,编辑于2023年,星期三H0:μ1=μ2,HA:μ1≠μ2。显著水平取α=0.05,u0.05=1.96。计算u值

σ12=σ22=σ2=0.4,n1=12,n2=8,作出推断:|u|<u0.05,P>0.05,接受H0,否定HA。说明:这两种取样方法的产量无明显差异。第六十三页,共一百零四页,编辑于2023年,星期三②两个样本的总体方差σ12和σ22

未知,但可假定σ12=σ22=σ2,且两个样本为小样本时,采用t测验

根据样本方差计算平均数差数的合并方差se2,作为对σ2的估计。由于假定σ12=σ22=σ2

,se2应为两个样本方差的加权平均值。并有:在假设H0:μ1

=μ2

下,故可对两样本平均数的差异作出假设测验,其df=df1+df2=n1+n2-2。第六十四页,共一百零四页,编辑于2023年,星期三应用举例调查某农场30万苗/亩和35万苗/亩的亩产量(kg),各调查5个田块(右表)。问两种栽培密度的亩产量有无明显差异。x1(30万苗)x2(35万苗)400450420440435445460445425420第六十五页,共一百零四页,编辑于2023年,星期三因为是小样本,所以用t测验。又由于不知道两种密度的亩产量谁高谁低,所以用两尾测验。H0:μ1=μ2,HA:μ1≠μ2。显著水平取α=0.05,t0.05(8)=2.306。x1x1-430(x1-430)2x2x2-440(x2-440)2400-3090045010100420-101004400043552544552546030900445525425-525420-20400Σ-101950Σ0550第六十六页,共一百零四页,编辑于2023年,星期三=430+(-10/5)=428,=440SS1=1950-(-10)2/5=1930,SS1=550-02/5=550由于|t|<t0.05(8),P>0.05,所以接受H0:μ1=μ2,两种密度的亩产量无显著差异。

第六十七页,共一百零四页,编辑于2023年,星期三③两个样本的总体方差σ12和σ22

未知,但σ12≠σ22时,采用近似t测验由于σ12≠σ22

,在计算差数标准误时需要用两个样本的方差s12和s22分别估计σ12和σ22。在计算t值时,不再是准确的t分布,只能进行近似的t测验。首先计算有效自由度df′,然后计算t′。t′近似于t分布,具有有效自由度df′

,可根据df′查t值表计算概率。取其整数部分第六十八页,共一百零四页,编辑于2023年,星期三应用举例测定小麦的蛋白质含量(%),品种A测了10次,=14.3,s12=1.621;品种B测了5次,=11.7,s22=0.135。问两个小麦品种的蛋白质含量有无明显差异。如果我们经过分析,得知两个小麦品种蛋白质含量的方差是显著不同的,因此采用近似t测验。第六十九页,共一百零四页,编辑于2023年,星期三H0:μ1=μ2,HA:μ1≠μ2。显著水平取α=0.05,由于查附表5,t

0.05(11)=2.201由于t>t0.05(11),P<0.05,所以,否定H0,肯定HA,说明两个小麦品种的蛋白质含量存在显著差异。第七十页,共一百零四页,编辑于2023年,星期三(2)成对数据的平均数比较成对数据:若试验设计是将性质相同的两个供试单位配成一对,并设有多个配对,然后对每一配对的两个供试单位分别随机地给予不同处理,则所得观察值为成对数据。在条件最为相似的两个小区或花盆、营养钵中进行两种不同的处理,在同一植株(或同一组织器官)的对称部位进行两种不同的处理,或在同一供试单位上进行处理前和处理后的对比等,都将获得成对比较的数据。半叶法测定光合速率第七十一页,共一百零四页,编辑于2023年,星期三成对数据,由于同一配对内两个供试单位的试验条件很是接近,而不同配对间的条件差异又可通过同一配对的差数予以消除,因而可以控制试验误差,具有较高的精确度。在分析试验结果时,只要假设两样本的总体差数的平均数μd=μ1-μ2=0

,而不必假定两样本的总体方差σ12和σ22相同。第七十二页,共一百零四页,编辑于2023年,星期三设两个样本的观察值分别为x1和x2

,共配成n对,各个对的差数为d=x1-x2

,差数平均数为,则差数平均数的标准误为:因而:其df=n-1若假设H0:μd=0,则上式改为:即可测验H0:μd=0。

第七十三页,共一百零四页,编辑于2023年,星期三应用举例选生长期、发育进度、植株大小和其他方面皆比较一致的两株番茄构成一组,共得7组,每组中一株接种A处理病毒,另一株接种B处理病毒,以研究不同处理方法的饨化病毒效果,试测验两种处理方法的差异显著性。组别x1(A法)x2(B法)1102521312381443155512620277618第七十四页,共一百零四页,编辑于2023年,星期三H0:μd=0,两种方法对钝化病毒效果相同,HA:μd≠0。显著水平α=0.05,t(0.05,6)=2.447。组别x1x2dd+7(d+7)211025-15-8642131218643814-6114315-12-5255512-70062027-7007618-12-525Σ-9179第七十五页,共一百零四页,编辑于2023年,星期三|t|>t0.05(6),P<0.01,所以,否定H0,接受HA,两种钝化病毒方法有极显著差异。第七十六页,共一百零四页,编辑于2023年,星期三作一尾测验的实例研究新肥料能否比原肥料皮棉亩产量增产5kg。选土壤和其它条件最相近的相邻小区组成一对,其中一区施新肥料,另一区施原肥料,共9对。试测验新肥料能否比原肥料每亩增产5kg以上皮棉?组别x1(新肥料)x2(对照)167.460.6272.866.6368.464.9466.061.8570.861.7669.667.2767.262.4868.961.3962.656.7第七十七页,共一百零四页,编辑于2023年,星期三H0:μd≤5,新肥料比原肥料亩产量增产不超过5kg;HA:μd>5kg显著水平取α=0.05,t0.05(8)(一尾)=t0.10(8)(两尾)=1.86。组别x1x2dd2167.460.66.846.24272.866.66.238.44368.464.93.512.25466.061.84.217.64570.861.79.182.81669.667.22.45.76767.262.44.823.04868.961.37.657.76962.656.75.934.81Σ50.5318.75第七十八页,共一百零四页,编辑于2023年,星期三t<t0.05,P>0.05,所以,接受H0,否定HA,新肥料比原肥料皮棉亩产量增产不超过5kg。第七十九页,共一百零四页,编辑于2023年,星期三(3)成对数据和成组数据平均数比较的不同成对数据是假定各个配对的差数来自差数分布为正态的总体,具有N(0,),并且每一配对的两个供试单位是彼此相关的。成组数据是假定两个样本都来自具有共同(或不同)方差的正态总体,并且两个样本的各个供试单位都是彼此独立的。如果将成对数据按成组数据的方法进行比较,有时不能鉴别应属差异的错误。所以在应用时要严格区别。第八十页,共一百零四页,编辑于2023年,星期三四、二项资料百分数(成数)的假设测验许多生物试验的结果是用成数或百分数表示的如结实率、发芽率、杀虫率以及杂种后代分离比例等。这些百分数由计数某一属性的个体数目计算,属间断性的计数资料,与前面连续性的测量资料不同。理论上,这类百分数的假设测验应按二项分布进行,但如果样本容量n足够大,并且np和nq都大于5时,二项分布趋近于正态分布,当np和nq都大于30时,可直接按正态分布处理,否则需要进行连续性矫正,再按正态分布处理。第八十一页,共一百零四页,编辑于2023年,星期三(1)单个样本百分数(成数)的假设测验这是测验某一样本百分数所属总体百分数与某一理论值或期望值p0的差异显著性。样本百分数的标准误为:根据可测验H0:p=p0。第八十二页,共一百零四页,编辑于2023年,星期三应用举例用紫花和白花的大豆品种杂交,F2代共有289株,其中紫花208株,白花81株。问该试验结果是否符合一对等位基因的遗传规律?如果花色由一对等位基因控制,则根据遗传学原理,F2代紫花株与白花株的分离比例应为3:1,即紫花株的理论百分数为p=0.75,白花株的理论百分数为q=0.25。第八十三页,共一百零四页,编辑于2023年,星期三H0:p=0.75,大豆花色遗传符合一对等位基因的分离规律;HA:p≠0.75。显著水平取α=0.05,作两尾测验,u0.05=1.96。|u|<u0.05,所以P>0.05,接受H0:p=0.75同样可对白花株的百分数H0:p=0.25进行测验,结果完全一样。第八十四页,共一百零四页,编辑于2023年,星期三上面的资料也可直接用次数进行假设测验。当二项资料用次数表示时,μ=np,。

np=289×0.75=216.75结果和上面一样第八十五页,共一百零四页,编辑于2023年,星期三(2)两个样本百分数相比较的假设测验这是测验两个样本百分数和所属总体百分数p1和p2的差异显著性。一般假定两个样本的总体方差相等,即。设两个样本某种个体的观察百分数分别为和,而两个样本所属总体该种个体百分数分别为p1和p2,则两个样本百分数的差数标准误为其中,q1=1-p1,q2=1-p2。这是两总体百分数为已知时的差数标准误公式。第八十六页,共一百零四页,编辑于2023年,星期三如果两总体百分数相同,即p1=p2=p,q1=q2

=q在两总体百分数p1和p2未知时,则在的假定下,可用两个样本百分数的加权平均值作为p1和p2的估计。两样本百分数的差数标准误为:由可对H0:p1=p2

作出假设测验第八十七页,共一百零四页,编辑于2023年,星期三应用举例调查西瓜品种A378株(n1),其中枯萎病株355株(x1),发病率93.92%();调查西瓜品种B396株(n1),其中枯萎病株346株(x1),发病率87.37%()。问两个西瓜品种枯萎病的发病率有无明显差异。第八十八页,共一百零四页,编辑于2023年,星期三H0:p1=p2

,两个西瓜品种枯萎病的发病率无明显差异,HA

:p1≠p2

。显著水平取α=0.05,作两尾测验,u0.05=1.96。u>u0.05,所以P<0.05,接受HA

:p1≠p2

两个西瓜品种枯萎病的发病率有明显差异第八十九页,共一百零四页,编辑于2023年,星期三应用举例杀虫剂A在1000头虫子中杀死657头,杀虫剂B在1000头虫子中杀死728头,问杀虫剂B的杀虫效率是否高于杀虫剂A。H0:p2≤p1,杀虫剂B的杀虫效率不高于杀虫剂A,HA:p2>p1。显著水平取α=0.01,作一尾测验,u0.01(一尾)

=u0.02(两尾)=

2.326。第九十页,共一百零四页,编辑于2023年,星期三|u|>u0.01,所以P<0.01,否定H0:p2≤p1,接受HA:p2>p1。杀虫剂B的杀虫效率极显著高于杀虫剂A。第九十一页,共一百零四页,编辑于2023年,星期三(3)二项样本假设测验时的连续性矫正二项总体的百分数是由某一属性的个体数计算出来的,在性质上属于间断性资料,其分布是间断性的二项分布。如果把它当作连续性的正态分布或t分布处理,结果会有些出人,一般容易将无差异检测为有差异。补救的办法是在假设测验时进行连续性矫正,这种矫正在<30时是必需的。经过连续性矫正的u值或t值,分别以uC

或tC表示。第九十二页,共一百零四页,编辑于2023年,星期三单个样本百分数的连续性矫正公式为两个样本百分数相比较的连续性矫正公式为如果为小样本时,可用连续性矫正后的t分布进行测验,单个样本百分数的df=n-1,两个样本百分数相比较的df=n1+n2-2。

第九十三页,共一百零四页,编辑于2023年,星期三应用举例一批果树种子的平均发芽率为0.75(p0),现随机取100粒(n),用福尔马林浸种,共发芽86粒

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论