生物统计第4章 统计推断_第1页
生物统计第4章 统计推断_第2页
生物统计第4章 统计推断_第3页
生物统计第4章 统计推断_第4页
生物统计第4章 统计推断_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

4.1单个样本的统计假设检验4.2两个样本的差异显著性检验第四章统计推断2023/2/6总体与样本之间的关系从总体到样本的研究。由样本推断总体:样本统计量的分布规律一般是正态分布、t分布、2分布和F分布。第四章统计推断2023/2/6对总体做统计推断的两种途径,应用时可互相参照使用先对所估计的总体做一假设,然后通过样本数据推断这个假设是否接受,这种途径称为统计假设检验(statisticaltestofhypothesis)通过样本统计量估计总体参数,称为总体参数估计(estimationofpopulationparameter)本章重点讲解统计推断的一般原理以及对总体平均数及标准差的推断。第四章统计推断(续)2023/2/64.1.1一般原理及两种类型的错误假设零假设,记为H0,如果假设总体的平均数μ等于某一给定的值μ0,即μ-μ0=0记为H0:μ-μ0=0备择假设—与零假设相对的假设记为HA它是在拒绝H0的情况下,可供选择的假设如HA:μ>μ0,HA:μ<μ0及HA:μ≠μ0。备择假设的选定视实际情况而定。4.1单个样本的统计假设检验2023/2/6在一次试验中,几乎是不会发生的,若根据一定的假设条件计算出来的该事件发生的概率很小,而在一次试验中它竟然发生了,则可认为原假设条件不正确,给予否定。在生物统计的显著性检验中,通常取5%或1%小概率为显著性水平,记为“”小概率原理2023/2/6例:用实验动物作实验材料,现从一批动物中抽取含量n

=10的样本并已经计算出平均值为10.23g。要求动物满足平均体重

=10.00g,

=0.4的正态分布总体,若<10.00g须再饲养,若>10.00g则应淘汰,问此批动物材料是否合适?

小概率原理用于显著性检验2023/2/6解:1样本平均数满足何种分布?小概率原理用于显著性检验(续)2从正态分布表查出P=0.03438<0.05,这是一个小概率事件,该样本几乎不可能抽自=10.00g的总体。

2023/2/6上尾检验(uppertailedtest):拒绝H0后,接受

>0,如下左图。下尾检验(lowertailedtest):拒绝H0后,接受

<0

,如下右图。单侧检测(one-sidedtest)2023/2/6双侧检验(two-sidedtest):拒绝H0后,接受

0,如下图。由于单侧检验时利用了已知有一侧是不可能的这一条件,从而提高了它的辨别力,所以单侧检验比双侧检验的辨别力更强些。双侧检验(two-sidedtest)实际应用时,要尽量选用单侧检验,但要根据实际情况而定。2023/2/6Ⅰ型错误:假设是正确的,却错误地拒绝了它。犯Ⅰ型错误的概率不会大于

。(以真为假)Ⅱ型错误:当

0但错误地接受了

=0的假设时所犯的错误。(以假为真)两种类型的错误2023/2/6当1越接近于0时,犯Ⅱ型错误的概率愈大;当1越远离0时,犯Ⅱ型错误的概率愈小。在样本含量和样本平均数都固定时,为了降低犯Ⅰ型错误的概率

(就应将图5-2中的竖线右移),必然增加犯Ⅱ型错误的概率。为了同时降低和就需增加样本含量。关于两种类型错误的三点解释2023/2/6通常把P<时拒绝H0称为差异是显著的。这一结论严格的说应当是“由样本推断出的总体平均数,与0之间的差异有统计学意义”即它们属于两个不同总体(冒风险)。统计推断的目的是由样本平均数推断其总体平均数是否等于0

,由样本平均数推断总体平均数与样本的含量有关的。太小的样本有可能检验不出总体之间真正存在的差异,太大时又会在人力物力上投入过多,因此如何确定合理的样本含量,是试验设计中应认真对待的问题。两点说明2023/2/6假设

零假设:根据经验或实验结果;依据某种理论或模型;依据预先的规定。

备择假设:除零假设以外的值;担心会出现的值;希望会出现的值;有重要意义或其他意义的值。显著性水平

=0.10试验条件下不易控制或易产生较大误差

=0.05

=0.01容易产生严重后果的一些试验4.1.2单个样本显著性检验的程序2023/2/6两种类型的错误

不宜定得太严,太严会增加

。尽量增加样本含量n确定检验方法:u检验、t检验、卡方检验、F检验等。建立在水平上的H0的拒绝域(注意单侧或双侧):单侧检验时,拒绝域只在零假设的一侧有一个区间。做双侧检验时,拒绝域在零假设的两侧各有一个区间。4.1.2单个样本显著性检验的程序(续)2023/2/6

6.对推断的解释:若统计量的值落在接受域内,决不是说总体参数一定等于零假设的值。对于接受=0。这一零假设可以有以下几种解释:①零假设的值是真实的,并产生一个正如我们所见到的样本。②可能非常接近于0。③抽样结果符合零假设的值0,样本统计量的值与0之间的不符合是由于偶然因素造成4.1.2单个样本显著性检验的程序(续)2023/2/6若统计量的值落在拒绝域内,则拒绝=0的假设。对于这种情况,可以有以下几种解释:①不可能很接近0。②若零假设是真实的,产生一个如我们所见到的样本的可能性很小。③抽样结果不符合零假设的值0

,样本统计量的值与0之间的不符合(在水平上),不能用偶然因素解释。4.1.2单个样本显著性检验的程序(续)2023/2/6

已知豌豆的重量(mg)服从正态分布N(377.2,3.32)

。在改善栽培条件后,随机抽取9粒,其籽粒平均重为379.2,若标准差仍为3.3,问改善栽培条件是否显著提高了豌豆籽粒重量?根据题意,本例应进行单侧检验,已知。1、提出无效假设与备择假设4.1.3已知单个平均数显著性检验:u检验2023/2/62、计算u值

3、建立H0的拒绝域:因HA:>0,故为上尾单侧检验,当>0.05时拒绝H0,=0.05的上侧分位数0.05=1.645。4、结论:因为>0.05所有拒绝H0,接受HA上述样本很可能不是抽自N(377.2,3.32)的总体,抽出样本的那个总体的平均数是大于377.2的某个值,即栽培条件的改善显著提高了豌豆籽粒重量。4.1.3已知单个平均数显著性检验:u检验(续)2023/2/6母猪的怀孕期为114天,今抽测10头母猪的怀孕期分别为116、115、113、112、114、117、115、116、114、113(天),试检验所得样本的平均数与总体平均数114天有无显著差异?根据题意,本例应进行双侧t检验。1、提出无效假设与备择假设4.1.4未知时平均数显著性检验:t检验2023/2/6

2、计算t值

3、查临界t值,作出统计推断由=9,查t值表(附表3)得t0.05(9)=2.262,因为|t|<t0.05,P>0.05,故不能否定H0:

=114,表明样本平均数与总体平均数差异不显著,可以认为该样本取自母猪怀孕期为114天的总体。4.1.4未知时平均数显著性检验:t检验(续)2023/2/6

一个混杂的小麦品种,株高标准差0

=14cm,经提纯后随机抽取10株,它们的株高为:90,105,101,95,100,100,101,105,93,97,考察提纯后的群体是否比原群体整齐?

1、小麦株高是服从正态分布的随机变量2、提出假设

关于备择假设的说明:小麦经提纯后只能变得更整齐,绝不会更离散,即只能小于0,因此HA:<0。4.1.5变异性的显著性检验:2检验2023/2/6

3、显著性水平规定=0.054、统计量的值:

5、建立的拒绝域:因HA:<0

,故为下尾单侧检验,当2<21-时拒绝H0,从附表6中可以查出29,0.99=2.096、结论,因2<29,0.99,拒绝H0,接受HA,提纯后株高比原株高整齐。4.1.5变异性的显著性检验:2检验(续)2023/2/6小结2023/2/6单个样本的显著性检验需要事先能够提出合理的参数假设值和对参数有某种意义的备择值。然而,实际工作中很难提出,故限制了实际应用。在实际应用时,常常选用两个样本,一个作为处理,一个作为对照,在这两个样本之间作比较,判定它们之间的差异是否用偶然性解释,若不能用偶然性解释时,则认为它们之间存在足够显著的差异,从而判断这两个样本来自两个不同的总体。4.2两个样本的显著性差异检验2023/2/6

假定从两个正态总体中,独立地抽取含量分别为n1和n2的两个随机样本,计算出s12和s22.总体平均数可以相等也可以不等.零假设H0:1=2.备择假设HA:12若已知1不可能小于2。HA

:12若已知1不可能大于2。HA

:12包括12和12。显著性水平:经常用=0.05和=0.01两个水平。4.2.1两个方差的检验(方差齐性分析)—F检验2023/2/6

统计检验量:Fdf1,df2=s12/s22,df1=n1-1df2=n2-1。建立H0的拒绝域:12,上尾单侧检验,FF时拒绝12,下尾单侧检验,FF1-时拒绝12,,双侧检验,FF/2

及FF1-/2时拒绝。作出结论并解释。4.2.1两个方差的检验(方差齐性分析)—F检验(续)2023/2/6测定了20位青年男子和20位老年男子的血压值(收缩压mmHg)如表5-2所示。问老年人血压值个体间的波动是否显著高于青年人?解:根据检验的基本程序:(1)人类血压值是服从正态分布的随机变量,而且上述两样本是独立获得的。(2)假设:H0:σ1=σ2

HA:σ1<σ2(由于老年人的血压值波动只会大于青年人,单侧)例题2023/2/6(3)显著性水平:根据问题的要求(是否显著),选α=0.05。(4)统计量的值:Fdf1,df2=S12/s22,根据表中数据计算可得S12=193.4,s22=937.7,故F=0.206。(5)建立H0的拒绝域:由于HA:σ1<σ2,故为下尾单侧检验,当F<F0.95时拒绝H0。查表可得F19,19,0.95=1/F19,19,0.05=0.459(6)结论:F<F0.95,所以结论是拒绝H0,接受HA。即老年人的血压值在个体间的波动高于青年人。

例题(续)2023/2/6例:调查两个不同渔场的马面鲀体长,每一渔场调查200条。平均体长分别为19.8cm和18.5cm。σ1=σ2=7.2cm。问在α=0.05水平上,第一渔场的马面鲀体长是否显著高于第二渔场的?解:根据检验的基本程序:(1)马面鲀体长是服从正态分布的随机变量,两样本是独立获得的。(2)假设:H0:μ1=μ2

HA:μ1>μ24.2.2标准差(σi)已知时,两个平均数间差异显著性的检验—u检验2023/2/6

(3)显著性水平:α=0.05。(4)计算统计量的值:u=1.80。(5)建立H0的拒绝域:因HA:μ1>μ2,故为上尾单侧检验。当u>u0.05时拒绝H0,由附表查出u0.05=1.645。(6)结论:因u>u0.05,所以接受H0。结论是第一渔场的马面鲀体长显著高于第二渔场的。4.2.2标准差(σi)已知时,两个平均数间差异显著性的检验—u检验(续)2023/2/6检验程序与5.2.2基本相同,只是所使用的统计量不同,当两个总体的标准差相等时,检验统计量t由下式给出。4.2.3标准差(σi)未知,但相等时,两个平均数间差异显著性的检验—成组数据t检验2023/2/6在H0:μ1=μ2下变为4.2.3标准差(σi)未知,但相等时,两个平均数间差异显著性的检验—成组数据t检验(续)在平均数检验中应用最为广泛。先做方差齐性检验(F-双侧检验)判断σi是否相等;按上式计算统计量t,进行t检验以判断两个平均数之间差异是否显著?2023/2/6例5.10研究两种激素类药物对肾组织切片的氧消耗的影响,结果是:研究第一种药物的样本数为9,平均数为27.92,样本方差为8.673。研究第二种药物的样本数为6,平均数为25.11,样本方差为1.843。问两种药物对肾组织切片氧消耗的影响差异是否显著?4.2.3标准差(σi)未知,但相等时,两个平均数间差异显著性的检验—成组数据t检验(续)2023/2/6

解:第一步,做方差齐性检验:

H0:σ1=σ2,HA:σ1≠σ2,α=0.05

F8,5=8.673/1.843=4.71,F8,5,0.025=6.757F8,5,0.975=1/4.817=0.208,F8,5,0.975<F<F0.025,结论是接受H0(σ1=σ2)第二步,做平均数之间差异的显著性检验:

H0:μ1=μ2,HA

:μ1≠μ2,α=0.05;计算统计量t=2.168。

t0.05(双侧)=2.160,t>t0.05,结论是在α=0.05水平上两种药物对肾组织切片氧消耗的影响刚刚达到显著。4.2.3标准差(σi)未知,但相等时,两个平均数间差异显著性的检验—成组数据t检验(续)2023/2/6若经F(双尾)检验,发现σ1≠σ2可用Aspin-Welch检验。检验程序类似5.2.3的成组数据t检验。该检验的临界值仍由t表查出,自由度由以下公式得出:4.2.4标准差(σi)未知且可能不相等时,两个平均数间差异显著性的检验2023/2/6t检验统计量见下式4.2.4标准差(σi)未知且可能不相等时,两个平均数间差异显著性的检验(续)t近似服从具有df自由度的t分布。若样本足够大,则可以认为在零假设下,上式为标准化的正态变量。2023/2/6例5.11两组类似的大鼠,一组做对照,另一组做药物处理,然后测定血糖。已知对照组的样本数为12,平均数为109.17,样本方差为97.430。经过催产素药物处理组的样本数为8,平均数为106.88,样本方差为7.268。问药物对大鼠血糖含量的影响是否显著?例题2023/2/6解:第一步,做方差齐性检验:H0:σ1=σ2,HA:σ1≠σ2

,α=0.05F11,7=97.430/7.268=13.41,F11,7,0.025=4.714(如何查?)F>F0.025,结论是方差不具齐性(σ1≠σ2)第二步,做平均数之间的差异显著性检验。

H0:μ1=μ2,HA:μ1≠μ2

,α=0.05;计算df=13.35,统计量t=0.76。用线性内插法(如何查?)可以求出t13.35,0.05(双侧)=2.15,t<t0.05(双侧)。结论是催产素药物对大鼠的影响是不显著的。例题(续)2023/2/6生物学试验中,为了减少试验误差,在有条件情况下尽可能把试验设计成若干对子,称为配对试验设计,例如:用高粱的若干父本与两个不同母本杂交,同一父本的两个杂交种是一个对子。或者用同窝的两只动物做不同处理,每一窝的两只动物是一个对子。或者在做药效实验时,测定实验动物服药前后的有关数值,服药前后的数值是一个对子。对这种设计做显著性检验的方法称为配对数据t检验。检验程序同5.1.4所述单个样本的t检验基本相同。4.2.5配对数据的显著性检验——配对数据的t检验2023/2/6(一)提出无效假设与备择假设配对数据的t检验基本步骤为两样本配对数据差值d总体平均数,它等于两样本所属总体平均数1与2之差,所设无效假设、备择假设相当于2023/2/6(二)计算t值,计算公式为配对数据的t检验基本步骤(三)查临界t值,作出统计推断2023/2/6用家兔10只试验某批注射液对体温的影响,测定每只家兔注射前后的体温,见下表。设体温服从正态分布,问注射前后体温有无显著差异?10只家兔注射前后的体温例题2023/2/6(一)提出无效假设与备择假设即假定注射前后体温无差异即假定注射前后体温有差异(二)计算t值,经过计算得df=n-1=10-1=9例题(续)2023/2/6由df=9,查t值表得:t0.01(9)=3.250,因为|t|>t0.01(9),P<0.01,否定H0,接受HA,表明家兔注射该批注射液前后体温差异极显著,这里表现为注射该批注射液可使体温极显著升高。(三)、查临界t值,作出统计推断例题(续)2023/2/6配对法比成组法更容易检出两组数据平均数之间的差异。平均数及样本含量均相同的条件下,s愈小则t值愈大4.2.6配对法与成组法的比较所以配对法比成组法更容易检出两组数据平均数之间的差异。在条件许可的情况下,尽量把实验安排成配对法做比较。2023/2/6小结2023/2/6结束5.4已知我国14

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论