生物统计3-统计假设测验_第1页
生物统计3-统计假设测验_第2页
生物统计3-统计假设测验_第3页
生物统计3-统计假设测验_第4页
生物统计3-统计假设测验_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章统计假设测验第四章复习例1:一正态分布,已知P(u≤-1.17)=0.1210,请计算P(u≥1.17),P(-1.17≤u≤1.17),P(u≤1.17),P(u≥-1.17)和P(u≤-1.17)+P(u≥1.17)。例2:正态分布,求其分布中间有50%和95%观察值的全距。解:查附表3,正态离差u值表(两尾)。P=0.5时,u=0.67499,P=0.05时,u=1.96,因此全距分别为2.7和7.84。第五章统计假设测验引入:上章抽样分布是从总体到样本。在实际研究中,往往只知道样本,不知道总体。本章统计推断解决从样本到总体的问题。有两个问题:一是参数估计,包括点估计和区间估计,如由样本200蔸二化螟平均虫量推断整块田二化螟虫口密度就是点估计,推测总体虫口密度可能在某个范围变动就是区间估计。二是假设测验,如有多大的把握保证总体虫口密度落在该区间范围内;又如品种比较,新品种平均产量比旧品种高30kg/667m2统计假设测验的目的和定义目的:从田间试验所得的所有观察值既包含了处理的真实效应,又包含了许多非处理因素的偶然影响,两者混淆在一起,因此必须进行假设测验,将试验误差和处理的真实效应加以区别,才能对处理间的差异作出正确可靠的结论。定义:是确定不同质的事物的数量界限的一种数理方法,本质上讲就是将统计数的分布分为接受区和否定区,若试验结果落在接受区则接受Ho,反之否定Ho。统计假设测验的基本步骤例:某地当地小麦品种一般亩产300斤,既=300,多年种植知=75。现有一新品种,在该地种25个小区,某产=330斤。问新品种是否(显著)优于旧品种?思路:如果不优于也不劣于旧品种,则新品种可作为原总体的一个随机样本。其平均数服从抽样分布呈正态分布,则330偏离300有一个概率,如果出现的概率小于0.05,则依小概率的实际不可能性原理否定假设,既新品种所属总体不同于旧总体,因此新品种与旧品种有显著差异。对样本所属总体提出一个假设Ho:无效假设,既假设总体参数与某一指定值相等或假设两个总体参数相等,亦即假设其没有效应,差异是随机误差。HA:备择假设,又叫对应假设,即如果统计假设测验时否定Ho了则必须接受HA,如果接受了Ho则必须否定HA。本例:Ho:,即假定新品种所属总体平均数=原品种所属总体平均数=300,而样本平均数乃随机误差。HA:2、规定测验的显著水平,农业上常用=0.05或=0.01表示。3、在Ho为正确的前提下,计算样本平均数或其它统计数在抽样分布中发生的概率P。本例:=(330-300)/(75/5)=30/15=2因为Ho为:,而HA:,即新品种可能等于或不等于旧品种,而不等于中包括优于或劣于,因此用两尾测验。查附表3,u=2时,0.04<P<0.05,也就是说差数30属于随机误差的概率小于0.05,因此据小概率的实际不可能性原理:4、将算得的概率P和规定的显著水平相比较,如P<,则否定Ho,接受HA,即该差异在水平上是显著的,即有95%的把握认为新品种不同于旧品种。反之如P>,则接受Ho,也就是新品种与旧品种无显著差异,来源于同一个总体,差数30是随机误差。也可以按照下面这个更易理解的方法:Ho:,HA:=0.05查附表3,P==0.05时两尾u绝对值=1.96因,所以=270.6~329.4即在的抽样分布中,落在(~)即270.6~329.4区间的概率为95%,此为接受区域,现=330>329.4,而这种情况出现的概率只有0.025,按照小概率的实际不可能性原理,故否定Ho,接受HA,即新品种显著不同于旧品种。几个名词解释:显著水平:用来测验假设的概率标准,农业上常为0.05或0.01。否定区域:对于的抽样分布,如以显著水平作为接受或否定假设的界限,则以外的区域称之。接受区域:对于的抽样分布,如以显著水平作为接受或否定假设的界限,则以内的区域称之。假设测验的两尾测验和一尾测验1、两尾测验:当处理可能优于对照也可能劣于对照时,假设测验中所考虑的概率为正态曲线左边一尾概率和右边一尾概率之和,具两个否定区域。2、一尾测验:当处理仅可能优于对照或仅可能劣于对照时,假设测验中所考虑的概率仅为正态曲线左边一尾概率或仅为右边一尾概率,仅具一个否定区域。上例应采用两尾测验。又例:某种农药,规定杀虫效果达90%方合标准(指定值),则Ho:≤90%,HA:>90%。3、注意事项:1)试验前慎重考虑用一尾测验还是两尾测验。2)作一尾测验时将附表3的两尾概率除以2再查u值,或者将一尾概率乘以2再查u值。如一尾测验=0.05,则相当于查两尾测验=0.1所对应的u值,即1.64。3)当相同时,两尾测验的u绝对值大于一尾测验的u绝对值。如=0.05,对两尾测验u=1.96。对一尾测验,=0.1,u=1.64。假设测验的两类错误由样本结果通过假设测验而作出推断时,我们并没有100%把握肯定不发生错误,一般可能发生两类错误:第一类错误,又叫错误:假设本来是正确的(新旧品种间无显著差异,差数是随机误差),但通过假设测验却否定了它(新旧品种间有显著差异,差数是处理效应),即把试验误差看成是真实效应。犯该类错误的概率为=规定的显著水平。第二类错误,又叫错误:假设本来是错误的(认为新旧品种间有显著差异,差数是处理效应),但通过假设测验却接受了它(新旧品种间无显著差异,差数是随机误差),即把真实效应看成是试验误差。犯该类错误的概率为。上例:旧品种,新品种Ho:,HA:现在研究第二类错误,假设本来是错误的。因此新品种的真实总体,假定。对错误总体()的的接受区域是270.6~329.4对真实总体()的的接受区域是285.5~344.4以真实总体抽样分布正态曲线为标准:对真实总体而言,无论样本平均数为多少,都应该否定Ho。当样本平均数<270.6,用错误总体作出推断也否定了Ho,没有犯错误。当270.6<样本平均数<285.5,用错误总体作出推断接受了Ho,也就是假设本来是错误的,但通过假设测验却接受了它,犯了第二类错误。当285.5<样本平均数<329.4,用错误总体作出推断接受了Ho,也就是假设本来是错误的,但通过假设测验却接受了它,犯了第二类错误。当329.4<样本平均数<344.4,用错误总体作出推断否定了Ho,没犯错误。当样本平均数>344.4,用错误总体作出推断否定了Ho,没犯错误。因此,相对于真实总体,犯第二类错误的区间是“270.6<样本平均数<329.4”,对应的概率是u2=(329.4-315)/15=0.96,查附表2对应概率为0.8315。u1=(270.6-315)/15=-2.96,查附表2对应概率为0.0015。因此区间概率为0.83,即:当真实总体,假设总体,在=0.05时,将有83%的机会接受Ho:的错误结论。小结:1)n一定,数值下降(如从0.05变为0.01,实际上是显著水平升高),则犯第一类错误的概率降低,犯第二类错误的概率增加。因为数值下降,u绝对值升高,样本平均数的接受区域扩大,两分布的重叠多,占真实总体的概率增加。2)在n和固定时,真实总体和假设总体相差越大(以标准误为单位),则越小(两者重叠越少)。3)为了降低两类错误,要采用一个较低的,如0.05,保证犯第一类错误的概率小;同时适当增大n或减小或两者兼有之,使得样本平均数的接受区域变小,两分布的重叠少。平均数的假设测验对u测验,,只在总体方差已知,或者虽未知但n足够大(n30)可用直接作的估计值时采用。(因为,在正态总体中抽样,或非正态总体但n足够大,则抽样分布近于正态分布)。如何下结论,到底否定还是接受H0?当n不太大,如n30,未知,如用作的估计值,则其标准化离差的不呈正态分布,而作t分布,具自由度V=n-1。,是样本平均数的标准误。t分布是正态分布的近似分布,特别当n或V较大时更是如此,它单峰左右对称,以X轴为渐近线。t分布的平均数:(假定V>1)t分布的标准差:(假定V>2)同时复习二项总体分布,二项分布,潘松分布,正态分布,标准正态分布,u变数分布,抽样分布,t分布。本书的主要内容:3种分布即样本分布,理论分布(总体分布)和抽样分布;4种测验即u测验,t测验,F测验和测验。t分布曲线比正态曲线稍扁平,峰顶略低,尾部稍高,即t分布曲线的变异度大于正态分布。比较两者方差。t测验的基本步骤:1)Ho:,HA:2)=0.053),t实得值4)V=?5)查附表4,给定和V可得t临界值。6)将实得t值的绝对值与t临界值比较,如则P<,即差数为随机误差的概率小于,很可能是处理效应,所以应否定Ho。同样可以采用来设定接受区域和否定区域,从而进行t测验。判断题:在t值表中,V固定,P越大,t越小。P固定,V越大,t越小。(依公式来判断,V与n有关)1、单个样本平均数的假设测验测验某一样本平均数所属总体平均数是否和某一指定的总体平均数相同。例:小麦旧种千粒重=34g,引入新种,8个小区千粒重分别为35.6,37.6,33.4,35.1,32.7,36.8,35.9,34.6g,问新品种与旧品种有无显著差异?解:总体方差未知,n<30为小样本,用t测验。又新种可能优于也可能劣于旧种,用两尾测验。H0:,HA:,查附表4,V=n-1=7,时,因为,也就是差数35.2-34=1.2的概率大于0.05,不是小概率事件。所以,接受H0,即新种与旧种千粒重无显著差异。(如果按照接受区域和否定区域来计算,则结论不会下错,有时不记得到底该接受H0还是否定H0,可能反了。),342.365×0.58=32.6283~35.3717,现样本平均数为35.2,在接受区,故接受H0,即新种与旧种无显著差异。两个样本平均数比较的假设测验(成组数据):两处理为完全随机设计,而处理间(组间)的各供试单位彼此独立,所得数据为成组数据,以组平均数(处理平均数)作为比较标准。、未知,但可假设,小样本,用t测验例:研究矮壮素使玉米矮化的效果,处理A:喷;处理B:不喷,对照。现有一小块地共17株,完全随机设计,8株喷,9株未喷,株高cm如下表,问该矮壮素有无效果?X1喷160160200160200170150210-X2对照170270180250270290270230170、未知,但可假设(即喷或不喷其变异相似),小样本(小于30),t测验依,可令Se2为两样本均方的加权平均值,合并均方值。从上章两个正态总体抽出的独立样本平均数差数的分布知:现从样本估计,故有:对t测验,,现变数以代替,故有:Ho:,即两处理平均株高无差异。所以其自由度V=上例:Ho:;HA:显著水平: (一尾)=176.3,=233.3,SS1=3787.5,SS2=18400,Se2=1479.17=18.688t=-3.04查附表4,v=15时一尾t0.05=二尾t0.10=1.753现实得t绝对值=3.04大于t临界值=1.753,说明分子的差异很大。推断:否定Ho,接受HA;即:喷矮壮素后玉米株高显著矮于对照。例:两种密度的稻田各5块,亩产如下(斤),问两种密度对产量有无显著差异?密度田块12345X1低密度800840870920850X2高密度900880890890840两尾测验,t测验=856,=880,SS1=7720,SS2=2200,Se2=1240=22.271t=1.08查附表4,v=8时t0.05=2.306现实得t绝对值=1.08小于t0.05=2.306,说明分子的差异不大。推断:接受Ho,否定HA;即:两种密度产量无显著差异。(2)、已知,用u测验例:某小麦品种每平方米产量=0.4斤,今在该品种的一块地上用A、B两法抽样,A取12个平方米,=1.2斤;B取8个平方米,=1.4斤。问A、B两法有无显著差异?解:Ho:,HA: ,n1=12,n2=8查附表3,u0.05=1.96。实得u绝对值小于1.96,故接受Ho,即两法取样产量无差异。(3).、未知,且,不讲,也不考。3.成对数据两个样本平均数比较的假设测验:t测验成对数据:试验设计时将性质相同的两个供试单位配成一对,并设多个配对;然后对每一配对的两个供试单位分别随机地给予不同处理,所得观察值为成对数据。例:甘蓝结球始期受菜青虫危害对产量的影响。A处理:每株接3条虫;B处理:每株接1条虫。因为土壤肥力不均匀或苗子大小不一,70株甘蓝按长势可分为7组,每组10株,同一组内10株长势相当一致。将每组10株中随机取5株作A处理,另5株作B处理。收获时每一组内每处理5株甘蓝计产如下,问两种接虫量是否对产量有显著差异?组别A处理x1B处理x2d11025-152131213814-64315-125512-762027-77618-12各对差数:d=则=-8.3因为现在变量只有一个,就是d差数的个数n=7差数的方差:差数的标准差:前面已述:所以推知差数的标准误:=1.997采用t测验,前面已述:所以推知:因为Ho假设,所以:=-4.16用两尾测验,且v=n-1=6因所以否定Ho,接受HA,即两种接虫量对产量是有极显著影响的。注意两者区别:成对数据假定各个配对的差数来自差数的分布为正态的总体,而每一配对的两个供试单位是彼此相关的;成组数据则假定两个样本皆来自共同或不同方差的正态总体,而两样本的各个供试单位都是彼此独立的。因此,成对数据试验较成组数据试验精确度要高。如将成对数据按成组数据方法比较,易使统计推断发生第二类错误。上例采用成组数据方法分析:t=-0.75,v=12,t(0.05,12)=2.179,接受Ho:。假设本来是错误的,但通过测验却接受了它,即把真实效应看成是试验误差(第二类错误)。也可如下推论:成对数据试验精确度高,能识别较小的效应差异;现用成组数据处理,则不能识别较小的效应差异,易把真实效应看成是试验误差,易犯第二类错误。5、二项资料的百分数假设测验间断性变数,属二项分布,但当n较大,p不过小,np和nq均大于5时,趋近正态分布。单个样本百分数的假设测验:测验某一样本百分数与某一理论值或期望值P的差异显著性。例:大豆,紫花x白花,F2代289株,紫花208,白花81。如果花色受一对等位基因控制,据遗传学原理,F2代紫花:白花=3:1,即紫花P=0.75。现问该试验结果是否符合一对等位基因的遗传规律?解:Ho:P=0.75;HA:P0.75=0.05,两尾测验,u0.05=1.96=208/289=0.7197上章已述,对百分数或成数资料用二项总体的样本平均数分布(对次数资料用二项分布的样本平均数分布)。对二项总体,对二项总体的样本平均数分布:采用u测验:将替换成:因为,所以接受Ho,即大豆花色遗传符合一对等位基因的遗传规律。两个样本百分数相比较的假设测验:u测验一般假定,即两样本总体方差相等。对样本平均数:如果已知相应总体平均数:两样本百分数的差数标准误:如果不知相应总体平均数,但可假定,则可用两样本百分数的加权平均值作为对的估计:最后,因Ho假设p1=p2,故:例:低洼潮湿地小麦易得锈病,现低洼地小麦378株,有病株355;高坡地396株,有病株346,问两块地锈病率有无显著差异?Ho:p1=p2;HA:p1p2,两尾测验=378,=396,=355,=346,,推断:否定Ho,接受HA,即两块地锈病率有显著差异。6、参数的区间估计点估计:以样本的统计数直接估计总体的相应参数,如以估计。但由于抽样误差,两者一般不相等。故必

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论