第四章 统计推断_第1页
第四章 统计推断_第2页
第四章 统计推断_第3页
第四章 统计推断_第4页
第四章 统计推断_第5页
已阅读5页,还剩88页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章统计推断第1页,课件共98页,创作于2023年2月总体与样本之间的关系包括两个方面:从总体到样本的研究;由样本推断总体,它是以各种样本统计量的抽样分布为基础的,一般是正态分布、t分布、χ2分布和F分布。对总体做统计推断有两种途径,在实际应用时可互相参照使用首先对所估计的总体做一假设,然后通过样本数据推断这个假设是否接受,这种途径称为统计假设检验通过样本统计量估计总体参数,称为总体参数估计第2页,课件共98页,创作于2023年2月总体样本统计量(X)估计&检验第3页,课件共98页,创作于2023年2月总体抽样样本(实验结果)检验(抽样分布规律)接受拒绝小概率事件未发生小概率事件发生某种假设统计假设检验图解第4页,课件共98页,创作于2023年2月总体我相信人的平均血红蛋白含量是126g(零假设)

Mean

X=136随机样本

接受零假设!

拒绝备择!

4.1单个样本的统计假设检验一、一般原理及两种类型的错误基本思想抽样分布

P50第5页,课件共98页,创作于2023年2月m

=126H0我们能得到一个均值是136样本因而我们接受零假设

=126样本平均数136P=0.114第6页,课件共98页,创作于2023年2月假设零(无效)假设:记为H0,假设总体的平均数μ等于某一给定的值μ0,即μ-μ0=0,记为

H0:μ-μ0=0(零假设是针对实验考查的内容提出的,就是处理无效,在P50例子中考查的内容是:在这种药物下能否提高血红蛋白含量,所以在例子中零假设记为,H0:μ=μ0(126g)备择假设:与零假设相对的假设记为HA,它是在拒绝H0的情况下,可供选择的假设如HA:μ>μ0,HA:μ<μo及HA:μ≠μ0。备择假设的选定视实际情况而定。

在例子中备择假设记为,HA:μ≠μ0(126g)第7页,课件共98页,创作于2023年2月小概率原理小概率的事件是指在一次试验中,几乎是不会发生的事件。若根据一定的假设条件计算出来的该事件发生的概率很小,而在一次试验中它竟然发生了,则可认为原假设条件不正确,给予否定。根据小概率原理所建立起来的检验方法称为显著性检验。在生物统计工作中,通常规定5%或1%以下为小概率,称为显著性水平,记为“α”。检验统计量:u

t

χ2

F

等第8页,课件共98页,创作于2023年2月例4.1用实验动物作实验材料,现从一批动物中抽取含量n=10的样本并已经计算出平均值为10.23克。要求动物满足平均体重μ=10.00g,σ=0.4的正态分布总体,若μ<10.00g需再饲养,若μ>10.00g则应淘汰,问此批动物材料是否淘汰(显著性水平α=0.05)?

从正态分布表查出P=0.03438<0.05,或查α=0.05时的uα=1.645<1.82,表明这是一个小概率事件。结果:该样本几乎不可能抽自μ=10.00g的总体。结论?解:该样本平均数满足正态分布。零假设H0:μ=μ0=10.00(g)备择假设HA:μ>10.00(g)第9页,课件共98页,创作于2023年2月单侧检验(one-sidedtest)上尾检验:拒绝H0后,接受μ>μ0,如左图。下尾检验:拒绝H0后,接受μ<μ0,如右图。样本统计量样本统计量样本统计量临界值第10页,课件共98页,创作于2023年2月双侧检验

在生物学问题中,有时只要考虑μ是否等于μ0,并不关心究竟是大于还是小于μ0,这时就要使用双侧检验。在α水平上,H0的拒绝域由P(∣U∣>uα/2)=α

决定。拒绝域包括大于uα/2或小于-uα/2的区域,这两个尾区的曲线下面积之和为α。由于单侧检验时利用了已知有一侧是不可能的这一条件,从而提高了它的辨别力,所以单侧检验比双侧检验的辨别力更强些。实际应用时,要尽量选用单侧检验,但也要根据实际情况而定。第11页,课件共98页,创作于2023年2月两种类型的错误Ⅰ型错误(α错误):当μ=μ0时假设是正确的,却错误地拒绝了它。犯Ⅰ型错误的概率不会大于α。(以真为假——

弃真错误)Ⅱ型错误(β错误):当μ≠μ0但错误地接受了μ=μ0的假设时所犯的错误。(以假为真——

存伪错误)第12页,课件共98页,创作于2023年2月关于两种类型错误的三点解释为了同时降低α和β就需增加样本含量,当样本含量增加后,样本标准误降低,曲线就会变得陡峭,则犯两种错误的概率都会降低。样本含量不变时,你不能同时减少两类错误!

当μ1越接近于μ0时,犯Ⅱ型错误的概率愈大;当μ1越远离μ0时,犯Ⅱ型错误的概率愈小。在样本含量和样本平均数都固定时,为了降低犯Ⅰ型错误的概率α(就应将上图中的竖线右移),必然增加犯Ⅱ型错误的概率。第13页,课件共98页,创作于2023年2月两点说明通常把P<α时,拒绝Ho称为差异是显著的。这一结论严格的说应当是“由样本推断出的总体平均数μ与μo之间的差异有统计学意义”,即它们属于两个不同总体(冒α风险)。统计推断的目的:?因此,所谓μ和μ0之间的差异有统计学意义是指在给定的样本含量下推断出该总体的平均数μ与μ0来自不同总体。太小的样本有可能检验不出总体之间真正存在的差异,太大时又会在人力物力上投入过多,如何确定合理的样本含量,是试验设计中应认真对待的问题。nup结论第14页,课件共98页,创作于2023年2月二、单个样本显著性检验的程序1、假设零假设:根据经验或实验结果;依据某种理论或模型;依据预先的规定。备择假设:除零假设以外的值;担心会出现的值;希望会出现的值;有重要意义或其他意义的值。2、显著性水平α=0.10试验条件下不易控制或易产生较大误差α=0.05α=0.01容易产生严重后果的一些试验,如药物的毒性实验两种类型的错误:α不宜定得太严,太严会增加β。在条件许可的情况下尽量增加样本含量n3、确定检验方法:u检验、t检验、X2检验、F检验等。第15页,课件共98页,创作于2023年2月4、建立在α水平上的Ho的拒绝域(注意单侧或双侧)单侧检验时,拒绝域只在零假设的一侧有一区间;做双侧检验时,拒绝域在零假设的两侧各有一个区间。5、对推断的解释:若统计量的值落在接受域内,决不是说总体参数一定等于零假设的值。对于接受θ=θ0。这一零假设可以有以下几种解释:①零假设的值是真实的,并产生一个正如我们所见到的样本。②θ可能非常接近于θ0

。③抽样结果符合零假设的值θ0

,样本统计量的值与θ0之间的不符合是由于偶然因素造成。第16页,课件共98页,创作于2023年2月三、在σ已知情况下,单个平均数的显著性检验——u检验1、假设从σ已知的正态或近似正态总体中抽出含量为n的样本。零假设H0:μ=μ0

备择假设HA:①μ>μ0②μ<μ0③μ≠μ02、显著性水平在α=0.05水平上拒绝H0称为差异显著在α=0.01水平上拒绝H0称为差异极显著3、检验统计量4、得出结论并给予解释第17页,课件共98页,创作于2023年2月例4.3已知豌豆籽粒重量服从正态分布N(377.2,3.32)在改善栽培条件后,随机抽取9粒,其籽粒平均重为379.2,若标准差仍为3.3,问改善栽培条件是否显著提高了豌豆籽粒重量?解①假设:H0:μ=377.2

HA:μ>377.2②显著性水平:α=0.05③σ已知,使用u检验

④H0的拒绝域:因HA:μ>μ0,故为上尾检验,当u>u0.05时拒绝H0。u0.05=1.645。⑤结论:u>u0.05,即P<0.05,所以拒绝零假设。栽培条件的改善,显著地提高了豌豆籽粒重量。第18页,课件共98页,创作于2023年2月四、σ未知时平均数的显著性检验——

t检验1、假设从σ未知的正态或近似正态总体中抽出含量为n的样本。零假设:H0:μ=μ0

备择假设:HA:①μ>μ0②μ<μ0③μ≠μ02、显著性水平:在α=0.05水平上拒绝H0称为差异显著在α=0.01水平上拒绝H0称为差异极显著3、检验统计量:当σ未知时以s代替之,标准化的变量称为t,服从n-1自由度的t分布。4、相应于1中各备择假设之H0的拒绝域:①t>tα②t<-tα③|t|>tα/25、得出结论并给予解释。

t检验不如u检验精确第19页,课件共98页,创作于2023年2月例4.4已知某玉米种群的平均穗重μ0=300g,σ0=9.5g。喷药后,随机抽取9个果穗,其穗重为:308、305、311、298、315、300、321、294、320g。问喷药前后的果穗重差异是否显著?解:①假设:H0:μ=300HA:μ≠300

药物浓度适合时可促进生长,浓度过高反而会抑制生长,所以喷药的效果未知,需采用双侧检验。②显著性水平:α=0.05③σ未知应使用t检验,已计算出=308,s=9.62④H0的拒绝域:因HA:μ≠μ0,故为双侧检验,当|t|>t0.025时拒绝H0。t0.025=2.306。⑤结果:因|t|>t0.025,即P<0.05,所以拒绝零假设。喷药前后果穗重的差异是显著的。若规定α=0.01,t0.01/2=3.355,t<t0.005,因此喷药前后果穗重的差异尚未达到“极显著”。第20页,课件共98页,创作于2023年2月五、变异性的显著性检验-χ2检验

1、假设从正态总体中随机抽取含量为n的样本,计算出样本s2。零假设:H0:σ=σ0

备择假设:HA:①σ>σ0②σ<σ0③σ≠σ02、显著性水平:在α=0.05水平上拒绝H0称为差异显著在α=0.01水平上拒绝H0称为差异极显著3、检验统计量:4、相应于1中各备择假设之H0的拒绝域:①χ2>χ2α②χ2<χ21-α③χ2<χ21-α/2和χ2>χ2α/25、得出结论并给予解释。第21页,课件共98页,创作于2023年2月例4.5一个混杂的小麦品种,株高标准差σ0=14cm,经提纯后随机抽出10株,它们的株高为:90、105、101、95、100、100、101、105、93、97cm,考查提纯后的群体是否比原群体整齐?

解①株高服从正态分布,μ未知,对未知总体的方差做检验②假设:H0:σ=14cm

HA:σ<σ0

小麦经提纯后株高只能变得更整齐,因而使用下侧检验。③显著性水平:在α=0.01水平上做检验④检验统计量:

0.990.99⑤相应于备择假设HA:σ<σ0,H0的拒绝域为χ2<χ21-α,从附表4中可以查出χ20.99=2.09⑥结论:因χ2<χ20.99,即P<0.01,所以拒绝H0。结论是植株经提纯后变得非常整齐。第22页,课件共98页,创作于2023年2月单个样本的平均数、标准差的显著性检验小结:本节的显著性检验,是通过样本值对总体做推断,即推断该样本是否从零假设总体得出来,在小概率原理的基础上通过判定u

,t,χ2值是否具有显著性差异来得出结论。第23页,课件共98页,创作于2023年2月4.2两个样本的差异显著性检验单个样本的显著性检验需要事先能够提出合理的参数假设值和对参数有某种意义的备择值。然而,实际工作中很难提出,故限制了实际应用。在实际应用时,常常选用两个样本,一个作为处理,一个作为对照,在这两个样本之间作比较,判定它们之间的差异能否用偶然性误差解释,若不能用偶然性解释时,则认为它们之间存在足够显著的差异,从而判断这两个样本来自两个不同的总体。第24页,课件共98页,创作于2023年2月一、两个方差的检验(方差齐性分析)—F检验1、从两个正态或近似正态总体中,独立地抽取含量分别为n1和n2的两个随机样本,计算出s12和s22。与总体平均数μi无关。2、零假设:H0:σ1=σ2

备择假设:HA:①σ1>σ2②σ1<σ2③σ1≠σ23、显著性水平:在α=0.05水平上拒绝H0称为差异显著在α=0.01水平上拒绝H0称为差异极显著4、检验统计量:在抽样分布一章中已经给出F的定义在零假设σ1=σ2下,统计量F变为第25页,课件共98页,创作于2023年2月5、相应于2中各备择假设之H0的拒绝域:①相应于HA:σ1>σ2,做上尾单侧检验,当F>Fα时拒绝H0。

②相应于HA:σ1<σ2,做下尾单侧检验,当F<F1-α时拒绝H0,F的下侧分位数F1-α由下式给出一种变通的办法是把s

2中较大者称为s12(分子),这时只会用上侧检验,处理起来更方便些,对于结果无影响。③相应于HA:σ1≠σ2,应做双侧检验,当F>Fα/2和

F<F1-α/2时拒绝H0。6、得出结论并给予生物学解释。第26页,课件共98页,创作于2023年2月例4.6测定了20位青年男子和20位老年男子的血压值(收缩压mmHg)如表5-2所示。问老年人血压值个体间的波动是否显著高于青年人?解:1)人类血压值是正态分布的随机变量,而且两样本为独立获得。2)假设:H0:σ1=σ2

HA:σ1<σ2(老年人血压值的波动只会大于青年人,单侧)

以s

2较大者作为分子,备择假设则变为HA:σ2>σ1,成为上尾检验3)显著性水平:根据问题的要求(是否显著),选α=0.05。4)统计量的值:5)结论:F0.05=2.18,F>F0.05,P<0.05

,所以结论是拒绝H0,接受HA。即老年人的血压值在个体间的波动高于青年人。第27页,课件共98页,创作于2023年2月第28页,课件共98页,创作于2023年2月二.标准差(σi)已知时,两个平均数间差异显著性的检验1、从σ1和σ2已知的正态或近似正态总体中抽出含量分别为n1和n2的样本。2、零假设H0:μ1=μ2

备择假设HA:①μ1>μ2,若已知μ1不可能小于μ2;②μ1<μ2,若已知μ1不可能大于μ2;③μ1≠μ2,包括μ1>μ2和μ1<μ2。3、显著性水平在α=0.05水平上拒绝H0称为差异显著在α=0.01水平上拒绝H0称为差异极显著

第29页,课件共98页,创作于2023年2月4、检验统计量在σi已知时两平均数差的标准化变量:在H0:μ1=μ2下,检验统计量为:

上式的分母称为平均数差的标准误差,记为5、相应于2中各备择假设之H0的拒绝域①u>uα②u<-uα③|u|>uα/26、得出结论并给予生物学解释第30页,课件共98页,创作于2023年2月例4.7

调查两个不同渔场的马面鲀鱼的体长,每一渔场调查20条鱼。平均体长分别为:=19.8cm,=18.5cm。σ1=σ2=7.2cm。问在α=0.05水平上,第一号渔场的马面鲀鱼是否显著高于第二号渔场的马面鲀鱼的体长?解①马面鲀体长是服从正态分布的随机变量,σ1和σ2已知。②假设:H0:μ1=μ2

HA:μ1>μ2③显著性水平:已规定为α=0.05④统计量的值:

⑤建立H0的拒绝域:上尾单侧检验,当u>u0.05时拒绝H0。从表中查出u0.05=1.645.⑥结论:u<u0.05,即P>0.05,不能拒绝H0,第一号渔场马面鲀体长并不比第二号的长。第31页,课件共98页,创作于2023年2月三、标准差(σi)未知但相等时两平均数间差异显著性检验——成组数据t检验

先做方差齐性检验(F-双侧检验)判断σi

是否相等I.方差齐性检验:1、从两个正态或近似正态总体中,独立地抽取含量分别为n1和n2的两个随机样本,分别计算出s12和s22。2、零假设:H0:σ1=σ2

备择假设:HA:σ1≠σ23、显著性水平:α=0.054、检验统计量:5、建立H0的拒绝域:

对于方差齐性做双侧检验,当F>Fα/2和F<F1-α/2时拒绝H0。6、得出结论判断方差是否相等。第32页,课件共98页,创作于2023年2月Ⅱ.平均数差异显著性检验1、从σ1和σ2未知的正态或近似正态总体中抽出含量分别为n1和n2的样本。2、零假设:H0:μ1=μ2

备择假设:HA:①μ1>μ2;②μ1<μ2;③μ1≠μ23、显著性水平:在α=0.05水平上拒绝H0称为差异显著在α=0.01水平上拒绝H0称为差异极显著4、检验统计量:在标准差未知时,平均数差的标准化变量在抽样分布一章中已经给出。5、相应于2中各备择假设之H0的拒绝域:①t>tα;②t<-tα;③|t|>tα/26、得出结论并给予解释。第33页,课件共98页,创作于2023年2月例4.8两个小麦品种从播种到抽穗所需天数如下表,问两者所需的天数差异是否显著?解:I.方差齐性检验:使用双侧F检验。①小麦生长天数是服从正态分布的随机变量。

②假设:H0:σ1=σ2

HA:σ1≠σ2③显著性水平:α=0.05④检验统计量:⑤建立H0的拒绝域:

F9,9,0.025=4.026,F9,9,0.975=0.248⑥结论:F0.975<F<F0.025,即P>0.05。方差具齐性。两者所需的天数差异不显著。第34页,课件共98页,创作于2023年2月第35页,课件共98页,创作于2023年2月II.平均数差异显著性检验①小麦生长天数是服从正态分布的随机变量。②假设:H0:μ1=μ2

HA:μ1≠μ2③显著性水平:α=0.05④检验统计量:⑤建立H0的拒绝域:本例为双侧检验,当|t|>tα/2时拒绝H0,从附表4中查出t18,

0.025=2.10。⑥结论:t<t0.025,即P>0.05,接受H0。两个小麦品种从播种到抽穗所需天数差异不显著。第36页,课件共98页,创作于2023年2月例4.9

研究两种激素类药物对肾组织切片氧消耗的影响,研究第一种药物样本数为9,平均数为27.92,样本方差为8.673;第二种的样本数为6,平均数为25.11,样本方差为1.843。问两种药物对肾组织切片氧消耗的影响差异是否显著?

解I.方差齐性检验

H0:σ1=σ2,HA:σ1≠σ2;α=0.05F<F0.025,即P>0.05。可以接受σ1=σ2的假设,即方差齐性

II.平均数间差异显著性检验

H0:μ1=μ2

,HA:μ1≠μ2

;α=0.05t0.025=2.160,t>t0.025,

即P<0.05。结论:在α=0.05水平上,两种药物对肾组织切片氧消耗的影响差异显著。

第37页,课件共98页,创作于2023年2月四、标准差(σi)未知且可能不相等时,两个平均数间差异显著性的检验(Aspin-Welch检验,近似t检验)

若经F(双尾)检验得出的结论是σ1≠σ2,这时可用近似t检验判定平均数之间的差异显著性。检验程序类似成组数据t检验该检验的临界值仍由t表查出自由度由公式得出:t检验统计量公式:第38页,课件共98页,创作于2023年2月例4.10

两组类似的大鼠,一组对照,另一组药物处理,然后测定血糖。其中对照组样本数为12,平均数109.17,样本方差97.430。经催产素处理组的样本数为8,平均数为106.88,样本方差为7.268。问药物对大鼠血糖含量的影响是否显著?解:Ⅰ、方差齐性检验:

H0:σ1=σ2,HA:σ1≠σ2

;α=0.05F11,7=97.430/7.268=13.41,F11,7,0.025=4.714F>F0.025,结论是方差不具齐性,即σ1≠σ2

Ⅱ、平均数之间差异显著性检验

H0:μ1=μ2,HA:μ1≠μ2

,α=0.05;计算出k=0.899→df=13.35,

用线性内插法可以求出t13.35,0.05(双侧)=2.15,t<t0.05(双侧)。结论是催产素药物对大鼠的影响是不显著的。第39页,课件共98页,创作于2023年2月性质相同的两个供试单位配成一对,并设多个配对,然后对每一配对的两个供试单位分别随机地给予不同处理,所得的观察值为成对数据。每对材料其他各种条件尽可能一致,然后做不同处理例如:同一个人服药前后的数据;同一窝动物的不同处理检验的统计对象为每对材料测量值的差,作单样本检验检验程序同单个样本的t检验基本相同。五、配对数据的显著性检验-成对数据t检验第40页,课件共98页,创作于2023年2月

例下表为不同组合的杂种F1籽粒蛋白质含量父本母本(a)母本(b)d=(a)-(b)d2

玛纳斯红8.4787.9940.4840.234红菲特瑞他7.5127.1410.3710.138忻粱77.2228.267–1.0451.092平罗娃娃头8.0538.280–0.2270.052平顶冠7.6896.7400.9490.901洋大粒8.5287.6320.8960.803忻粱526.9725.9131.0591.121东海红公鸡7.7318.169–0.7980.637板农15.7607.570–1.8103.276歪脖黄7.9307.5690.3610.131千斤红7.2556.3220.9330.870忻粱716.7956.4170.3780.143总计1.5119.397第41页,课件共98页,创作于2023年2月1、配对数据,求出差以后即转变为单样本,其平均数为。2、零假设:H0:备择假设:HA:①;②;③3、显著性水平:在α=

0.05水平上拒绝H0称为差异显著在α=0.01水平上拒绝H0称为差异极显著4、检验统计量:标准化变量t

在零假设μ=0下,

t服从n-1自由度的t分布,其中的n为数据的对数。5、相应于2中各备择假设之H0的拒绝域:①t>tα;②t<-tα;③|t|>tα/26、得出结论并给予解释。上例的推断如下:H0:μd

=0,HA:μd

≠0;α=0.05

t11,0.025=2.201,|t|<t0.025,即P>0.05,接受H0。结论:用不同的母本所配成的高粱杂交种籽粒蛋白质含量差异不显著。第42页,课件共98页,创作于2023年2月配对法与成组法的比较配对法比成组法更容易检出两组数据平均数之间的差异。平均数及样本含量均相同的条件下,s愈小则t值愈大,从而拒绝H0的可能性越大(即差异显著)。而配对法比成组法的样本方差小,所以配对法比成组法更容易检出两组数据平均数之间的差异。用配对法比较时,可排除数据之间可能存在的相关,提高检验的能力,从而达到事半功倍的效果。第43页,课件共98页,创作于2023年2月两个样本间差异显著性检验的小结第44页,课件共98页,创作于2023年2月对总体参数的估计可分为点估计和区间估计。统计推断假设检验参数估计4.3参数估计第45页,课件共98页,创作于2023年2月

估计过程均值未知总体我有95%的置信度认为介于40和60之间

样本

随机样本均值

X

=50

第46页,课件共98页,创作于2023年2月一、点估计我们试验的目的就是希望获得有关试验处理总体的认识。用由样本数据所计算出来的单个数值对总体参数所做的估计称为点估计。样本平均数是总体平均数的估计值;样本百分数是总体百分数P的估计值二、区间估计点估计没有考虑抽样误差和试验误差的影响,也未指出这种估计的可靠程度。对总体平均数和总体百分数P更合理的估计是在一定概率保证下,给出总体平均数和标准差及总体百分数P的可能范围,这种估计方法叫区间估计,所给出的可能范围叫置信区间。第47页,课件共98页,创作于2023年2月

例如:要调查某市全体成人脉搏的平均数。

虽然不能知道某市全体成人脉搏均数的确切数值,但有95%的把握说该市全体成人脉搏均数在73.9次/分--75.1次/分之间,有99%的把握说该市全体成人脉搏均数在73.7次/分--75.3次/分之间。用样本推断总体平均数不能简单地以样本平均数单一值做为结论。第48页,课件共98页,创作于2023年2月1、在σ已知时,μ的1-α置信区间可由下式导出。三、μ的置信区间μ的置信区间依σ已知和未知而不同。第49页,课件共98页,创作于2023年2月2、σ未知,用s代替,得出μ的1-α置信区间3、区间估计与假设检验的关系假设检验中,零假设的参数值若不包含在1-α置信区间内,则在α水平拒绝H0。玉米喷药试验(例4.5)的有关数据n=9,=308,s=9.62,α=0.05(查表得t0.05(双)=2.306)代入上式,得出0.95置信区间为:300.6,315.4。这里不包括零假设的300,因而应当拒绝H0,与假设检验的结果是一致的。第50页,课件共98页,创作于2023年2月例4.5

已知某玉米种群的平均穗重μ0=300g。喷药后,随机抽取9个果穗,其穗重为:308、305、311、298、315、300、321、294、320g。问喷药前后的果穗重差异是否显著?解①σ未知②假设:H0:μ=300HA:μ≠300

药物浓度适合时可促进生长,浓度过高反而会抑制生长,所以喷药的效果未知,需采用双侧检验。③显著性水平:α=0.05④σ未知应使用t检验,已计算出=308,s=9.62⑤H0的拒绝域:因HA:μ≠μ0,故为双侧检验,当|t|>t0.025时拒绝H0。t0.025=2.306。⑥结论:因|t|>t0.025,即P<0.05,所以拒绝零假设。喷药前后果穗重的差异是显著的。第51页,课件共98页,创作于2023年2月四、σ的置信区间根据可以建立σ的1-α置信区间第52页,课件共98页,创作于2023年2月将小麦提纯试验(例4.6)的有关数据s=4.92,n=10及上下侧分位数(χ29,0.005=23.589,χ29,0.995=1.735)代入上式,得出σ的0.99置信区间为:3.04,11.21。

H0:σ=14不包含在置信区间内,应拒绝H0。在做假设检验时得出χ2=1.11,χ29,0.995=1.735,结论是拒绝H0。与区间估计的结论一致。第53页,课件共98页,创作于2023年2月例4.6

一个混杂的小麦品种,株高标准差σ0=14cm,经提纯后随机抽出10株,它们的株高为:90、105、101、95、100、100、101、105、93、97cm,考查提纯后的群体是否比原群体整齐?

解①株高服从正态分布,μ未知,对未知总体的方差做检验②假设:H0:σ=14cm0

HA:σ<σ0

小麦经提纯后株高只能变得更整齐,因而使用下侧检验。③显著性水平:在α=0.01水平上做检验

④检验统计量:

⑤相应于备择假设HA:σ<σ0,H0的拒绝域为χ2<χ21-α,从附表6中可以查出χ20.99=2.09⑥结论:因χ2<χ20.99,即P<0.01,所以拒绝H0。结论是植株经提纯后变得非常整齐。第54页,课件共98页,创作于2023年2月五、平均数差的置信区间

1σi已知由式导出μ1-μ2的1-α置信区间2σi未知但相等用类似的方法可以得到μ1-μ2的1-α置信区间

例:第四章例4.9将小麦播种天数例子中的有关数据及临界值代入上式,得出μ1-μ2的1-α置信区间为:-0.54,1.14。其中包括0(H0:μ1-μ2=0),应接受零假设。与假设检验的结果一致。第55页,课件共98页,创作于2023年2月例4.9

两个小麦品种从播种到抽穗所需天数如表,问两者所需的天数差异是否显著?

I.方差齐性检验:H0:σ1=σ2

HA:σ1≠σ2

,α=0.05

F9,9,0.025=4.026,结论:F<F0.025,即P>0.05。方差具齐性。

II.平均数差异显著性检验

H0:μ1=μ2

HA:μ1≠μ2

α=0.05

当|t|>tα/2时拒绝H0,从附表4中查出t18,

0.025=2.10。结论:t<t0.025,即P>0.05,接受H0。两个小麦品种从播种到抽穗所需天数差异不显著。第56页,课件共98页,创作于2023年2月3σi未知但不等可求出μ1-μ2的1-α的置信区间:例4.11将经两种处理方式的鼠血糖的数据带入上式,得出μ1-μ2的1-α置信区间为:(-4.185,8.765)。因为这两个界分别为正和负,即H0:μ1-μ2=0的假设包含在这两个界内,所以在α=0.05水平上接受零假设。与假设检验的结果一致。第57页,课件共98页,创作于2023年2月例4.11

两组类似的大鼠,一组对照,另一组药物处理,然后测定血糖。其中对照组样本数为12,平均数109.17,样本方差97.430。经催产素处理组的样本数为8,平均数为106.88,样本方差为7.268。问药物对大鼠血糖含量的影响是否显著?解:Ⅰ方差齐性检验:

H0:σ1=σ2,HA:σ1≠σ2

;α=0.05F11,7=97.430/7.268=13.41,F11,7,0.025=4.714F>F0.025,结论是方差不具齐性,即σ1≠σ2

Ⅱ平均数之间差异显著性检验

H0:μ1=μ2,HA:μ1≠μ2

,α=0.05;计算出k=0.899→df=13.35,

用线性内插法可以求出t13.35,0.05(双侧)=2.15,t<t0.05(双侧)。结论是催产素药物对大鼠的影响是不显著的。第58页,课件共98页,创作于2023年2月六、配对数据的置信区间:例:表4-3高粱蛋白质分析实验,将数据带入,得0.95置信区间为:-0.452,0.710,其中包含0,所以应接受H0:=0。七、方差比的置信区间

所以,σ1/σ21-α置信区间:

第59页,课件共98页,创作于2023年2月第60页,课件共98页,创作于2023年2月一、t分布的计算实例TDIST粘贴函数:单尾或双尾概率TINV粘贴函数:临界t值(二尾概率)4.4用到的EXCEL的统计功能第61页,课件共98页,创作于2023年2月用TDIST粘贴函数计算二尾概率本计算也可直接在编缉栏中输入TDIST(2,60,2)例如现要计算自由度等于60,t值与平均数相差2以上的2尾概率X:为需要计算分布的数字。第62页,课件共98页,创作于2023年2月用TINV粘贴函数计算临界值

请计算自由度为10且二尾概率为0.05时的临界t值本计算也可直接在编缉栏中为TINV(0.05,10)第63页,课件共98页,创作于2023年2月CHIDIST粘贴函数:计算单尾概率CHIINV粘贴函数:计算临界值CHIDIST函数积分公式为:

CHIINV函数积分公式为:

二、卡方分布第64页,课件共98页,创作于2023年2月用CHIDIST粘贴函数计算概率请计算自由度等于1及卡方值等于3.84时的右尾概率本计算在编缉栏中为CHIDIST(3.84,1)第65页,课件共98页,创作于2023年2月用CHIINV粘贴函数计算临界值请计算自由度为10及右尾概率为0.01时的

2临界值本计算在编缉栏中为CHIINV(0.01,10)第66页,课件共98页,创作于2023年2月FDIST粘贴函数:计算单尾概率FINV粘贴函数:计算临界值FDIST函数积分公式为:

FINV函数积分公式为:三、F分布第67页,课件共98页,创作于2023年2月用函数FDIST计算一尾概率请计算第一自由度等于2、第二自由度等于4及F值等于18时的右尾概率本计算在编缉栏中为FDIST(18,2,4)第68页,课件共98页,创作于2023年2月用函数FINV计算临界F值请计算df1=3,df2=10及右尾概率为0.05时的临界F值

本计算在编缉栏中为FINV(0.05,3,10)第69页,课件共98页,创作于2023年2月四、EXCEL电子表格的模拟运算功能模拟运算表是可以显示公式中某些值的变化对计算结果的影响。模拟运算表为同时求解某一运算中所有可能的变化值的组合提供了捷径,并且还可以将所有不同的计算结果同时显示在工作表中,便于查找和比较。模拟运算表有两种类型:单变量模拟运算表双变量模拟运算表第70页,课件共98页,创作于2023年2月例利用模拟运算计算临界t值表单变量模拟运算表:第71页,课件共98页,创作于2023年2月单变量模拟计算结果第72页,课件共98页,创作于2023年2月例利用模拟运算计算临界F值表双变量模拟运算表第73页,课件共98页,创作于2023年2月双变量模拟计算结果第74页,课件共98页,创作于2023年2月习题:小麦株高服从N(63.33,2.882),求下列概率(利用插入函数和模拟计算表)(1)株高小于60cm;(2)株高大于69cm;(3)株高在62—64cm之间;(4) 株高落在μ±1.96σ之间;(5) 株高在多少cm以上的占全体的95%?习题:小麦株高服从N(63.33,2.882),求下列概率(利用插入函数和模拟计算表)(1)株高小于60cm;0.123789511(2)株高大于69cm;0.024490833(3)株高在62—64cm之间;0.269868645(4) 株高落在μ±1.96σ之间;0.95000435(5) 株高在多少cm以上的占全体的95%?58.59282199第75页,课件共98页,创作于2023年2月5.6、利用Excel由样本推断总体利用Excel的几个函数组合,如求平均函数AVERAGE、标准差函数STDEV、T分布函数TINV等组合的使用可以构造出一个专门用于实现单样本推断总体的Excel工作表.一、推断置信区间例如:第76页,课件共98页,创作于2023年2月第77页,课件共98页,创作于2023年2月1.构造工作表。如上图:首先在各个单元格输入以下的内容,其中左边是变量名,右边是相应的计算公式。2.为表格右边的公式计算结果定义左边的变量名。选定A4:B6,A8:B8和A10:B15单元格(先选择第一部分,再按住CTRL键选取另外两个部分),选择“插入”菜单的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论