第二章统计推断_第1页
第二章统计推断_第2页
第二章统计推断_第3页
第二章统计推断_第4页
第二章统计推断_第5页
已阅读5页,还剩93页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章统计推断第1页,课件共98页,创作于2023年2月2.1统计推断的一般原理下面通过一个例子来说明假设检验的基本原理和有关概念。例2.1用实验动物做实验材料,要求动物平均体重μ=200.00g,若μ<200.00g需再饲养,若μ>200.00g则应淘汰。动物体重是服从正态分布N(μ,σ2)的随机变量。已知总体标准差σ=0.40g,但总体平均数μ是未知的。为了得出对总体平均数的推断,从动物群体中,随机抽取含量为n的样本,通过样本平均数x推断总体平均数。第2页,课件共98页,创作于2023年2月2.1统计推断的一般原理2.1.1假设总体平均数是未知的,为了得到对总体平均数的推断,可以假设总体平均数等于某一给定的值μ0(μ=μ0)。或者说,μ与μ0差等于0(μ-μ0=0)。这样的假设通常称为零假设(nullhypothesis)。记为H0:μ=μ0或H0:μ-μ0=0。与零假设相对立的假设称为备择假设(alternativehypothesis)。从备择假设的名称上就可以看出,它是在拒绝的情况下,可供选择的假设。备择假设记HA。例如,HA:μ>μ0、HA:μ<μ0及HA:μ≠>μ0。第3页,课件共98页,创作于2023年2月2.1.2小概率原理它的基本内容是:小概率的事件,在一次试验中,几乎是不会发生的。若根据一定的假设条件计算出来该事件发生的概率很小,而在一次试验中,它竟然发生了,则可以认为假设的条件不正确。因此,否定假设。根据上述原理所建立起来的检验方法称为显著性检验(significancetest)。究竟概率小到什么程度算是小概率,要根据实际情况或实验要求而定,生物统计工作中,通常规定5%或1%以下为小概率。5%或1%(或其他的值)称为显著性水平(significancelevel),记为“α”。上述的统计量称为u检验统计量(teststatistic)。下面几种统计假设检验中还会遇到统计量t,统计量X2以及统计量F,它们都称为检验统计量。第4页,课件共98页,创作于2023年2月2.1.3单侧检验与双侧检验若备择假设为HA:μ>μ0,或HA:μ<μ0的检验称为单恻检验(one-sidedtest)。即在拒绝H0之后,或者接受HA:μ>μ0;或者接受HA:μ<μ0。。前者称为上尾检验(ppertailedtest);后者称为下尾检验(lowertailedtest)。单侧检验比双侧检验的辨别力更强些。这是因为在做单侧检验时利用了已知有一侧是不可能的这一条件,从而提高了它的辨别力。第5页,课件共98页,创作于2023年2月第6页,课件共98页,创作于2023年2月2.1.4显著性检验的基本程序如下:(l)假设:零假设是假设检验的基础。它可能有以下几个来源:①根据以往的经验或者是根据某些实验结果;②依据某种理论或某种模型;③根据预先所做的某种规定而提出来的。与零假设对立的是备择假设。备择假设是总体参数除去零假设以外的某些值。它可能有以下几个来源:①除零假设以外可能的值;②担心会出现的值;③希望出现的值;④有重要经济意义或其它意义的值。(2)显著性水平:根据问题的要求规定显著性水平,对于实验条件不易控制或容易产生较大误差的实验,如一些生化实验,可以将α定得宽一些,如α=0.05;对于容易产生严重后果的一些实验,如药物的毒性实验,α可以定得严一些,如α=0.01。第7页,课件共98页,创作于2023年2月(3)计算统计量:确定应该使用的检验方法,根据相应的统计量计算公式,计算统计量。例如,对平均数做检验,分为两种情况,σ2已知时用u检验,σ2未知时用t检验,标准差用X2(4)查表,确定临界值(5)建立在α水平上H0的拒绝域:若统计量的值落在拒绝域内,则拒绝H0而接受HA。在做单侧检验时,拒绝域只在零假设的一侧有一个区间。做双侧检验时,拒绝域在零假设的两侧各有一个区间。第8页,课件共98页,创作于2023年2月(6)对推断的解释::若统计量的值落在接受域内,决不是说总体参数一定等于零假设的值。对于接受θ=θ0这一零假设可以有以下几种解释:①零假设的值是真实的,并产生一个正如我们所见到的样本。②θ可能非常接近于θ0。③抽样结果符合零假设的值θ0,样本统计量的值与θ0之间的不符合是由于偶然因素造成的。第9页,课件共98页,创作于2023年2月第二节单个样本显著性检验显著性检验,是通过样本观测值对总体做推断。即推断该样本是否从零假设所提出的总体中得来的。如果确信样本是从假设的总体中得来的,假设的总体为真,它是可靠的,因此接受零假设。但是,若从零假设所提出的总体中,得到该样本的概率很小的话,则认为假设的总体是靠不住的,则拒绝零假设而接受某个备择假设。关于正态总体的μ和σ的检验中,平均数(μ)的检验有u检验和t检验,若σ已知,则用u检验,否则用t检验。方差(σ)的检验用X2检验。第10页,课件共98页,创作于2023年2月2.2.1在σ已知的情况下,单个平均数的显著性检验——u检验[u-test]检验的基本程序如下:(1)假定从σ已知的正态总体或近似正态总体中,随机抽取含量为n的样本。(2)零假设H0:μ=μ0备择假设可能是以下三种情况中的任何一种:①HA:μ>μ0,若已知μ不可能小于μ0。②HA:μ<μ0,若已知μ不可能大于μ0。③HA:μ≠μ0,包括μ>μ0和μ<μ0。第11页,课件共98页,创作于2023年2月(3)显著性水平,习惯上规定在α=0.05水平上拒绝H0,称为“差异显著”。而在α=0.01水平上拒绝H0,称为“差异极显著”。4)检验统计量:u=(X-μ0)/(σ/n1/2)(5)相应于2中各备择假设的H0的拒绝域分别为:①u>uα。②u<u1-α。③lul>Uα/2(双侧)

第12页,课件共98页,创作于2023年2月正态分布的分位数,可以用EXCEL中的函数中的统计函数中的NORMSINV函数查出。NORMSINV(probability)Probability

正态分布的概率值。对应于双尾检验的U分布P=1-α/2(上尾),或P=α/2(下尾)(6)根据以上所做的分析,得出结论,并给予的解释。第13页,课件共98页,创作于2023年2月第14页,课件共98页,创作于2023年2月例2.1已知豌豆籽粒重量(g)服从正态分布N(377.2,3.32)。在改善栽培条件后,随机抽取9粒,其籽粒平均重x=379.2,若标准差仍为3.3,问改善栽培条件是否显著提高了豌豆籽粒重量?H0:μ=μ0(377.2)HA:μ>μ0(377.2)α=0.05计算统计量u,分别输入有关数据。u=(μ-μ0)/(σ/n1/2)u=1.8182查表u0.05=1.6449,u>u0.05,拒绝H0假设,接受HA假设。因栽培条件的改善,显著地提高了豌豆的籽粒重量。α=0.01u0.01=2.3263单样本统计推断.xls第15页,课件共98页,创作于2023年2月例2.2已知玉米单交种群单101的平均穗重300克,标准差σ为9.5。喷药处理后,随机抽取9个玉米穗重分别为:308、311、298、315、312、300、323、294、319克,这种药物对玉米穗重量是否有影响?单样本统计推断.xls第16页,课件共98页,创作于2023年2月2.2.2σ未知时平均数的显著性检验--t检验(t-test)在统计中所遇到的绝大多数问题,总体标准差都是未知的,而平均数已知(μ0)。在σ未知时,平均数的显著性检验,一般广泛使用t检验。t检验的过程类似u检验,但统计量计算的不同,还必须计算样本的标准(偏)差s。s/n1/2通常记为SXt=(μ-μ0)/(s/n1/2)自由度为:df=n-1第17页,课件共98页,创作于2023年2月用EXCEL中的函数中的统计函数中的TINV函数查出临界值,TINV(probability,degrees_freedom)Probability

P=2α(上尾),或P=1-2α(下尾),双尾P=α或P=1-αDegrees_freedom

为分布的自由度。第18页,课件共98页,创作于2023年2月第19页,课件共98页,创作于2023年2月例2.3已知玉米单交种群单101的平均穗重300克。喷药处理后,随机抽取9个玉米穗重分别为:308、311、298、315、312、300、323、294、319克,喷药后与喷药前的玉米穗重差异是否显著?解:假设:H0:μ=μ0(300)HA:μ≠μ0(300)计算统计量t,分别输入有关数据。计算统计量平均值(X)和标准差s,可通过选择数据分析中的“描述统计”计算,在公式拦输入公式。t=2.5579单样本统计推断.xls第20页,课件共98页,创作于2023年2月用EXCEL中的函数中的统计函数中的TINV函数查出,t8,0.05/2=2.3060,t>t8,0.05/2,拒绝H0假设,接受HA假设。因喷药前后的玉米穗重差异显著。t8,0.01/2=3.3554例2.4某地区10年前普查13岁男孩的平均身高为1.51米,现抽查200个13岁男孩,身高平均为1.53米,标准差S=0.073米,问10年来该地区男孩身高是否明显增长?t=3.8649t0.05=1.6525t0.01=2.3452单样本统计推断.xls第21页,课件共98页,创作于2023年2月2.2.3变异性的显著性检验——X2检验(X2-testorchi-test)虽然在实际工作中,经常遇到的是对假设的总体平均数做检验,但是对假设的总体标准差做检验的情况也很多。对单个标准差做检验使用X2检验,X2检验是建立在X2分布基础上的。设X是服从正态分布N(μ,σ2)的随机变量,并从中获得含量为n的随机样本,计算出样本方差s2,则(n-1)s2/σ2服从n-1自由度的X2分布。统计量X2df=(n-1)S2/σ2假设:H0:σ=σ0HA:σ>σ0HA:σ<σ0HA:σ≠σ0第22页,课件共98页,创作于2023年2月但是对应于三个HA的假设,H0的拒绝域分别为:X2>Xα2,X2<X1-α2X2>Xα/22或X2<X1-α/22。可以用EXCEL中的函数中的统计函数中的CHIINV函数查出X2分布的上侧分位数。CHIINV(probability,degrees_freedom)Probability

P=α(上尾),P=1-α(下尾),双尾P=α/2(上尾),或P=1-α/2(下尾)Degrees_freedom

自由度。X2检验的原理与t检验基本相似。第23页,课件共98页,创作于2023年2月例2.5一个混杂的小麦品种,株高标准差为14cm,经过提纯以后随机抽出10株,它们的株高为90、105、101、95、100、100、101、105、93、97cm,考查提纯后的群体是否比原群体整齐?假设:H0:σ=σ0(14)HA:σ<σ0(14)单样本统计推断.xls第24页,课件共98页,创作于2023年2月例2.6已知玉米单交种群单101的平均穗重300克,标准差σ=9.5。喷药处理后,随机抽取9个玉米穗重分别为:308、311、298、315、312、300、323、294、319克,这种药物对玉米穗个体重量变异是否有影响?假设:H0:σ=σ0(9.5)HA:σ≠σ0(9.5)单样本统计推断.xls第25页,课件共98页,创作于2023年2月第26页,课件共98页,创作于2023年2月第27页,课件共98页,创作于2023年2月4大样本数据平均值的检验U检验用S代替σu=(X-μ0)/(S/n1/2)5样本频率的检验用U检验U=(p-p0)/σpp0总体频率,p样本频率σp频率的方差σp=(pq/n)1/2q=1-p当Max(np,nq)小于30时需要矫正。若p>p0则在分子中增加-0.5/n,反则+0.5/n检验过程类似单样本U检验第28页,课件共98页,创作于2023年2月例2.7有一批蔬菜种子的平均发芽率为0.85,现随机抽取500粒,用种衣剂进行浸种处理,结果有445粒发芽率,试检验种衣剂对种子发芽有无效果。假设H0:p=p0HA:p≠p0α=0.05U=(p-p0)/σp=(445/500-0.85)/(445/500(1-445/500)500)1/2=2.5U0.05/2=1.96U>U0.05/2接受HAα=0.01U0.01/2=1.5758U<U0.01/2接受H0种衣剂对种子发芽作用效果显著第29页,课件共98页,创作于2023年2月第30页,课件共98页,创作于2023年2月EXCEL中不同统计量的临界值UNORMSINV(probability)P=1-α(上尾),或P=α(下尾),双侧检验:P=1-α/2和P=α/2T

TINV(probability,degrees_freedom)Probability

为对应于双尾学生t分布的概率。P=2α(上尾),或P=1-2α(下尾),双侧检验:P=α和P=1-α/2Degrees_freedom

为分布的自由度。X2CHIINV(probability,degrees_freedom)P=α(上尾),或P=1-α(下尾),双侧检验:P=α/2和P=1-α/2第31页,课件共98页,创作于2023年2月第三节二样本数据的统计推断一、方差的检验二样本方差的检验通常用F检验,检验的步骤类似单样本,分为6个步骤.其统计量为:F=S12/S22例2.7分别测定20位青年和老年人的血压(见表),问老年人的血压波动是否高于青年人?第32页,课件共98页,创作于2023年2月解H0:σ1=σ2

HA:σ1>σ2

α=0.05F=S12/S22

双样本统计推断FINVα(df1,df2)上尾检验df1=n1-1第33页,课件共98页,创作于2023年2月3.2平均值的检验数据的类型成组数据资料的特点是指两个样本的各个变量是从各自总体中抽取的,两个样本之间的变量没有任何关联,即两个抽样样本彼此独立。这样,不论两样本的容量是否相同,所得数据皆为成组数据。成对数据资料的特点要求两样本间配偶成对,每一对除随机地给予不同处理外,其他试验条件应尽量一致。成对数据,由于同一配对内两个供试单位的试验条件非常接近,而不同配对间的条件差异又可以通过各个配对差数予以消除,因而,可以控制试验误差,具有较高精确度。第34页,课件共98页,创作于2023年2月3.2.1成组数据平均数比较的假设检验

成组数据资料的特点是指两个样本的各个变量是从各自总体中抽取的,两个样本之间的变量没有任何关联,即两个抽样样本彼此独立。这样,不论两样本的容量是否相同,所得数据皆为成组数据。当总体方差σ1和σ2已知,或总体方差σ1和σ2,但两个样本均为大样本时,采用U检验法检验两组平均数的差异显著性当总体方差σ1和σ2未知时用t检验,t检验根据方差相等是否相等可分为:等方差和异方差两种不同的检验方法。第35页,课件共98页,创作于2023年2月等方差σ1和σ2未知,但通过F检验确认σ1=σ2时,我们可以用等方差二样本的t检验:t=(X1-X2)/(((n1-1)S12+(n2-1)S22)/(n1+n2-2))(1/n1+1/n2)))1/2当MSe=((n1-1)S12+(n2-1)S22)/(n1+n2-2)时t=(X1-X2)/(Se(1/n1+1/n2))½当Sx1-x2=(MSe(1/n1+1/n2))½时t=(X1-X2)/Sx1-x2df=n1+n2-2合并方差Sx1-x2=(S12/n1+S22/n2)1/2(N>50时)第36页,课件共98页,创作于2023年2月例2.8用高蛋白和低蛋白两种饲料饲养一月龄大白鼠,在三个月时,测定两组大白鼠的增重量(g),两组的数据分别为:高蛋白组:134,146,106,119,124,161,107,83,113,129,97,123;低蛋白组:70,118,101,85,107,132,94试问两种饲料饲养的大白鼠增重量是否有差别?第37页,课件共98页,创作于2023年2月(1)F检验H0:σ1=σ2

HA:σ1>σ2

α=0.05F=S12/S22

=425.3333/258.7879

=1.6436F0.05=3.0946F<F0.05接受H0假设二样本方差差异不显著F检验双样本统计推断第38页,课件共98页,创作于2023年2月例2.9用两种不同的配合饲料饲养肉鸡,2个月后,体重分别见表,这两种饲料效果是否有差异?A:2.56,2.73,3.05,2.87,2.46,2.93,2.41,2.58,2.89,2.76B:3.12,3.03,2.86,2.53,2.79,2.80,2.96,2.68,2.89双样本统计推断第39页,课件共98页,创作于2023年2月(2)二样本等方差的t检验H0:X1=X2HA:X1>X2

α=0.05

t=(X1-X2)/Sx1-x2=1.5732t0.05=1.7396t<t0.05接受H0假设两种饲料饲养的大白鼠增重量差异不显著。第40页,课件共98页,创作于2023年2月异方差σ1和σ2未知,但通过F检验确认σ1≠σ2时,我们可以用异方差二样本的t检验:t=(X1-X2)/((S12/(n1-1)+S22/(n2-1))1/2df=1/(k2/(n1-1)+(1-k)2/(n2-1))K=(S12/n1)/(S12/n1+S22/n2)第41页,课件共98页,创作于2023年2月例2.10两小麦品种的千粒重调查结果如下表,试检验两品种的千粒重有无差异?A:50,47,42,43,39,51,43,38,44,37B:36,38,37,38,36,39,37,35,33,37(1)F检验(2)t检验检验双样本统计推断第42页,课件共98页,创作于2023年2月例2.11为检验一种新的饲料配方是否比原来的饲料配方对猪的增重效果更好,选取符合要求的猪20头,随机等量地分为2组,分别饲喂两种饲料,所得增重记录如下,试检验.配方132234841202953393040配方227303226312723293520双样本统计推断第43页,课件共98页,创作于2023年2月成对数据平均数比较的假设检验

成对数据的比较要求两样本间配偶成对,每一对除随机地给予不同处理外,其他试验条件应尽量一致。成对数据,由于同一配对内两个供试单位的试验条件非常接近,而不同配对间的条件差异又可以通过各个配对差数予以消除,因而,可以控制试验误差,具有较高精确度。在进行假设检验时,只要假设两样本的总体差数μd=μ1-μ2=0,而不必假定两样本的总体方差相同。第44页,课件共98页,创作于2023年2月假设二样本的变量分别为xi,yi,共有n对,每一对的差为di,则:D=∑di/n=∑(xi-yi)/n=(X-Y)/nt=D/(Sd2/n)df=n-1第45页,课件共98页,创作于2023年2月例2.9在研究饮食中缺乏维生素E与肝中维生素A的关系时,将试验动物按性别、体重等配成8对,并将每对中的两头试验动物用随机分配法分配在正常饲料组和维生素E缺乏组,然后将试验动物杀死,测定其肝中的维生素A的含量,其结果如下表,试检验两组饲料对试验动物肝中维生素A含量的作用是否有显著差异。

正常饲料组:3550,2000,3000,3950,3800,3750,3450,3050Ve缺乏组:2450,2400,1800,3200,3250,2700,2500,1750

第46页,课件共98页,创作于2023年2月H0:d=0HA:d>0

α=0.05d=(X1-X2)/(Sd/n)1/2=4.2015d0.05=1.8946d>d0.05接受HA假设α=0.01d0.01=2.9980d>d0.01接受HA假设两组饲料对试验动物肝中维生素A含量的作用差异极其显著双样本统计推断第47页,课件共98页,创作于2023年2月例2.13某猪场从10窝猪仔中随机抽取2头,并随机分配到两个饲料组,进行饲料对比试验,试验30天后,其增重结果如下,试检验两种饲料饲喂的仔猪平均增重差异是否显著?饲料110.011.212.110.511.19.810.812.512.09.9饲料210.510.511.89.512.08.89.711.211.09.0第48页,课件共98页,创作于2023年2月第49页,课件共98页,创作于2023年2月第50页,课件共98页,创作于2023年2月第四节参数的区间估计与点估计参数估计是统计推断的另一个方面,它是指由样本结果对总体参数在一定概率水平下所作出的估计。参数估计包括区间估计和点估计。点估计:利用样本构造一个统计量,用它来作为总体参数的估计值.点估计的方法很多,常用的矩估计法,最大似然法,最小二乘法等.当算术平均值:X=∑xi/nI=1,2,3,…,n,样本方差S2=∑(xi-X)2/(n-1)时,总体参数σ2=S2,μ=X为无偏估计.区间估计:是以一定置信度对参数真值得可能范围进行估计.1平均值μ的区间估计σ已知(X-Uα/2σ/n1/2,X+Uα/2σ/n1/2)σ未知(X-tα/2S/n1/2,X+tα/2S/n1/2)2方差σ2的区间估计((n-1)S2/X2

1-α/2,(n-1)S2/X2

α/2)第51页,课件共98页,创作于2023年2月例4.16用高蛋白和低蛋白两种饲料饲养一月龄大白鼠,在三个月时,测定两组大白鼠的增重量(g),两组的数据分别为:高蛋白组:134,146,106,119,124,161,107,83,113,129,97,123;低蛋白组:70,118,101,85,107,132,94。进行置信度为95%时两种蛋白饲料饲养的大白鼠增重的差数区间估计和点估计。双样本统计推断第52页,课件共98页,创作于2023年2月第五节非参数检验前面所介绍的样本平均数的U检验、t检验以及样本方差的同质性检验都是在已知总体参数值的情况下所进行的检验,因此,也叫参数检验法。参数检验法所要求的条件比较高,一般需要了解总体的分布。但在生物学研究中,有许多情况是不知道总体的分布特性的,这时,进行假设检验就需要采用非参数检验法。非参数检验比较简单、直观,且计算量较小,但灵敏度要低于参数检验,在精度要求不高时比较适用。第53页,课件共98页,创作于2023年2月一、符号检验法第54页,课件共98页,创作于2023年2月第55页,课件共98页,创作于2023年2月第56页,课件共98页,创作于2023年2月第57页,课件共98页,创作于2023年2月例424为了比较甲、乙两药剂治疗某种疾病的疗效,各进行10组试验,其治愈率(%)分别为:甲药剂:94,88,83,92,87,95,90,90,86,84;乙药剂:86,84,85,78,76,82,83,84,82,83。试比较两种药剂的疗效有无显著差异。第58页,课件共98页,创作于2023年2月二、秩和检验法符号检验法有许多优点,但也有不足之处,比如要求两样本的数据必须一一对应,另外符号检验只是简单地比较这些数的大小,而不管具体数字,因此必然损失了许多可利用的信息。秩和检验法从一定程度上克服了符号检验法的不足。第59页,课件共98页,创作于2023年2月设有容量分别为n1和n2的两个样本(n1<n2),我们希望检验这两个样本是否来自于同一个总体。首先将这两个样本合在一起按数字从小到大依次进行编号,共有n1+n2=n个序号,在秩和检验法中,每个序号就是它对应数据的秩。这样,我们就用秩1,2,…,n来代替原始的n个数据。如果两个样本所属总体的均值没有差异,那么对应于第一个样本的秩的和与对应于第二样本的秩的和应该大致相等。如果一个样本的秩和明显小于另一样本,这时,就需要计算P(秩和<=Q)=p0。假设H0:两总体的平均数相等,如果P0<a,则否定HO;如果P0>=a,则接受H0。下面通过具体例子来介绍秧和检验的程序。第60页,课件共98页,创作于2023年2月下面通过具体例子来介绍秩和检验的程序。例4.25用甲、乙两种方法进行对虾育苗试验,甲、乙两种方法均用5个小池,池子大小水体都相同,每池放卵均为250万粒,最后出池检查孵出的仔虾数目如下:方法甲(万尾):148,143,138,145,142;方法乙(万尾):139,136,141,133,140。试检验方法甲孵出的虾苗数是否明显超过方法乙。用秩和检验法来解此题。第61页,课件共98页,创作于2023年2月第62页,课件共98页,创作于2023年2月第63页,课件共98页,创作于2023年2月根据秩和检验表(附表7),查出秩和临界值T1和T2,进行比较,作出推断。如果T1<T<T2则接受H0;如果T<=T1,或T>=T2,则否定H0,接受HA。如上例中,T=18,在a=0.05下,当n1=5,n2=5时的秩和检验区间为(T1=19,T2=36),T<=T1,因此认为方法甲孵出仔虾数显著高于方法乙。第64页,课件共98页,创作于2023年2月在使用秩和检验表时,只适用n1<=10、n2<=10。当n1、n2都大于10时,其秩和分布,就很接近于正态分布,且具有平均数μT:第65页,课件共98页,创作于2023年2月例4.26为了比较A、B两种杀虫剂的杀虫效果,分别进行11和13次试验,各次试验的杀死害虫百分率为:A:68.2,70.4,77.6,74.5,72.6,75.5,764,71.3,69.2,73.8,80.6;B:80.0,784,82.6,77.5,75.4,84.5,80.7,862,765,79.4,85.3,81.6,80.5。试检验两种杀虫剂的杀虫效果是否有显著差异。由于两个样本容量n1、n2都大于10,可进行近似的u检验。采用双尾检验。(l)H0:Md1=Md2,即A、B两种杀虫剂的杀虫效果没有显著差异。对HA:不相等(2)取显著水平a=0.05;第66页,课件共98页,创作于2023年2月(3)检验计算:首先将A、B两样本数据由小到大混合排列,以样本容量较小的A样本的秩和为T,并在A样本数据和秩次下面划线:(4)推断:当a=0.05时,ua=1.96,u>ua,故否定H0,接受HA,推断A、B两种杀虫剂的效果有显著差异。第67页,课件共98页,创作于2023年2月例4.27调查水稻不同插秧期的每穗结实粒数如下:6月4日:31,84,71,38,46,46,54,44,88,24,45,89;6月17日:31,44,65,32,40,53,54,60,34,49,52。试检验两插秧期对水稻结实粒数有无影响?第68页,课件共98页,创作于2023年2月第69页,课件共98页,创作于2023年2月第70页,课件共98页,创作于2023年2月第71页,课件共98页,创作于2023年2月第72页,课件共98页,创作于2023年2月第73页,课件共98页,创作于2023年2月第六节X2检验

前章详细讲述了样本平均数和样本频率的假设检,这些都是针对计量资料即连续型资料来进行检验的。对计数资料和属性资料,即离散型资料的假设检验.通常都采用X2检验。计数资料和属性资料的X2检验,一般有两种类型。一类是适合性检验,这种方法是对样本的理论数先通过一定的理论分布推算出来,然后用实际观测值与理论数比较,从而得出实际观测值与理论数之间是否吻合,因此适合性检验也叫吻合度检验。另一类是独立性检验,是研究两个或两个以上属性的计数资料或属性资料间是相互独立的或是相互联系的,这时可以假设所观测的各属性之间没有关联,然后证明这种无关联的假设是否成立。第74页,课件共98页,创作于2023年2月1X2检验的原理与方法从前章中知道,X2的原意是从方差为σ2的正态总体中,随机抽取含量为n的样本,计算出样本方差S2。在研究样本方差的分布时,通常将它标准化,得到一个不带有任何单位的纯数:这是随自由度df=k-1而变化的连续型分布。第75页,课件共98页,创作于2023年2月对计数资料或属性资料进行X2检验,其基本原理是应用理论推算值与实际观测值之间的偏离程度来决定其X2值的大小。理论值与实际值之间偏差越大,越不符合,偏差越小,越趋于符合,若两值完全相等时,表明理论值与实际值完全符合。在计算理论推算值E与实际观测值O之间的符合程度时,最简单的方法是比较两者差数的大小,但由于O-E有正有负,则∑(O~E)趋近于零,不能真实地反映理论推算值与实际观测值差值的大小,故采用∑(O一E)2,这样就可以消除负号的影响。实际观测值与理论推算值相差越大,则∑(O—E)2也越大,反之亦然。由实际观测值与理论推算值差的平方和似乎可以度量观测值与理论值的相差程度,实际上这个绝对差异数还不足以表示相差程度。例如,在某动物育种实验中,F2代出现下面的分离:第76页,课件共98页,创作于2023年2月显然两次实验的∑(O-E)2都是16,但二者不能等量齐观。对于K组资料,采用差的平方和使其转化为相对比值,这个值便是X2值,即:式中,O为实际观测值,E为理论推算值。第77页,课件共98页,创作于2023年2月由公式可知,X2最小值为0,随着X2值的增大,观测值与理论值符合度越来越小,所以X2的分布是由0到无限大的变数。实际上其符合程度由X2概率决定。由X2值表可知,X2值与概率P成反比,X2值越小,P值越大;X2越大,P值越小。因此,可由X2分布对计数资料或属性资料进行假设检验。X2检验的步骤为:(1)提出无效假设H0:观测值与理论值的差异由抽样误差引起,即观测值=理论值。同时给出相应的备择假设HA:观测值与理论值的差值不等于0,即观测值与理论值不相等;(2)确定显著水平,一般可确定为0.05或0.01;(3)计算样本的X2;求得各个理论次数Ei,并根据各实际次数Oi,代入计算样本的X2。第78页,课件共98页,创作于2023年2月(4)进行统计推断。由于df=K-1,查表值Xa2。如果计算X2<Xa2,即表明P>a,应接受H0,否定HA,则表明在a显著标准下理论值与实际值差异不显著,二者之间的差异系由抽样误差引起。如果实得X2>Xa2,即表明P<a,应否定H0,接受HA,则表明在a显著标准下理论值与实际值差异是显著的,二者之间的差异是真实存在的。

第79页,课件共98页,创作于2023年2月由于X2分布是连续的,而计数资料是离散的,故所得的X2值是一个近似值。为了使离散型的计算结果适合于连续型分布给出的概率,在计算X2时应注意以下两个问题:(1)任何一组的理论次数Ei都必须大于5,如果Ei<=5,则需要并组或增大样本容量,以满足Ei>5;(2)在自由度df=1时,需进行连续性矫正,其矫正的Xc2为:对同一资料,进行矫正的Xc2值要比未矫正的X2值小。当自由度df>=2时,由于Xc2与X2相差不大,所以一般不再进行连续性矫正。第80页,课件共98页,创作于2023年2月2适合性检验比较观测数与理论数是否符合的假设检验叫适合性检验,也称吻合性检验。例如,在遗传学上,常用X2检验来测定所得的结果是否符合孟德尔分离规律、自由组合定律等。许多与已有理论比率进行比较的资料,也需用X2来作适合性检验。适合性检验是生产检验最常用的方法之一。作适合性检验时,可提出无效假设从:O—E=0,即认为观测数与理论数之间没有差异,再计算样本X2值,根据规定的显著性水平和自由度df从Xa2值表中查出Xa2,当X2>Xa2时,拒绝H0,接受HA;X2<Xa2时,接受HA。第81页,课件共98页,创作于2023年2月例5.1有一鲤鱼遗传试验,以荷包红鲤(红色)与湘江野鲤(青灰色)杂交,其F2代获得青灰色为1503,红色为99,问这一资料的实际观察值是否符合孟德尔的青:红=3:l的一对等位基因的遗传规律?本例为判断实际观察值与理论比率是否相符的问题,属于典型的两组数据的适合性检验问题。(1)H0:鲤鱼体色已分离符合3:1比率;HA:鲤鱼体色F2分离不符合3:1比率;(2)取显著水平a=0.05;(3)计算统计数X2:由于该资料只有K=2组,故自由度df=K-1=2-1=1,因而计算X2时需要进行连续性矫正。第82页,课件共98页,创作于2023年2月(4)查X2值表,当df=1时,Xa2=3.840。现实得Xc2=301.63,远大于Xa2,故应否定H0,接受HA;即认为鲤鱼体色F2分离不符合3:1比率。第83页,课件共98页,创作于2023年2月遗传学中,有许多显、隐性比率可以划分为两组的资料,如欲测其与某种理论比率。适合性,则X2值可用表5-3中的简式进行计算。第84页,课件共98页,创作于2023年2月例5-2进行大豆花色的遗传研究,共观测F2代289株,其中紫色208株,白色81,试检验大豆花色分离是否符合3:l的分离规律?(1)H0:大豆花色F2分离符合3:1比率;HA:大豆花色地分离不符合3:1比率;(2)取显著水平a=0.05;

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论