生物统计学抽样分布及应用㈠课件_第1页
生物统计学抽样分布及应用㈠课件_第2页
生物统计学抽样分布及应用㈠课件_第3页
生物统计学抽样分布及应用㈠课件_第4页
生物统计学抽样分布及应用㈠课件_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章抽样分布及其应用㈠第一节单个母总体抽样第二节显著性检验的原理第三节两个母总体抽样第四节检验两个样本平均数差异(含F分布、方差的齐性检验)第五节配对数据的显著性检验第二章要点提示抽样分布既是本课程的基础,又是本课程的难点,学习时①要注意抽样分布的特点及其与上一章正态分布的统一性;②要注意样本统计量如、Σy、、đ的概率分布类型(正态分布)及其参数与母总体概型及其参数的联系和区别(中心极限定理);③应充分理解显著性检验的原理和特点,熟悉两尾检验与一尾检验的异同;④重点掌握检验Ӯ和Ӯ1-Ӯ2时依据的抽样分布类型及标准误σӮ、SӮ和差数标准误σӮ1-Ӯ2、SӮ1-Ӯ2的计算公式,并与检验đ时依据的差数的抽样分布和计算差数平均数的标准误σđ、Sđ的公式相区别。涉及教材内容:第四章第六、七节,第五章第一、二、三节。作业布置:P56~P57T6、T7、T10、T11、T12、T13、T15、T16;教材P78T9、T11、T12。

第一节单个母总体抽样例2.1给定一有限总体{2,3,3,4},即N=4,μ=3,σ2=1/2;现从中以n=2进行复置抽样,则所有可能的样本数为Nn=16个,计算各样本的统计量并整理成右表。解视Ӯ为变量的衍生总体参数:μӮ=ΣӮ/Nn=48÷16=3σ2Ӯ=〔148–482÷16〕/16=1/4视Σy为变量的衍生总体参数:μΣy=Σ(Σy)/Nn=96÷16=6σ2Σy=〔592–962÷16〕/16=1以上两个衍生总体均由“一切可能的抽样观察结果组成”,并且实际应用中遇到的多为无限总体,可以想象得到,但“看不见,也摸不着”。2,3,3,42,22,32,32,43,23,33,33,4第一节单个母总体抽样前例可归纳出抽样研究的部分结论:⑴由Nn个Ӯ构成的衍生总体;Ӯ~N(μӮ,σ2Ӯ)且有:μӮ=μ,σ2Ӯ=σ2/n并有:u=(Ӯ-μӮ)÷σӮ⑵由Nn个Σy构成的衍生总体;Σy~N(μΣy,σ2Σy)且有:μΣy=nμ,σ2Σy=nσ2又有:u=(Σy-μΣy)÷σΣy⑴和⑵表明抽样分布的类型实质上还是正态分布,只是其变量特殊罢了。⑶只有以自由度n–1算得的样本方差

S2才是σ2的无偏估计值。(但S不是σ的无偏估计值)

(ΣS2/Nn=8÷16=1/2=σ2)第一节单个母总体抽样例2.2调查336个平方米的小地老虎虫危害结果,μ=4.73头,σ=2.63头。求抽样n=30时Ӯ≤4.37头的概率。解由上述结论⑴知,须先求标准误:

σӮ=σ/√n

=2.63÷√30=0.48头

u=(Ӯ-μ)÷σ/√n=

-0.75

=(4.37-4.73)÷0.48

P(Ӯ≤4.37)=Φ(-0.75)=0.2266查附表2表明本例所求结果实际为获得|-0.36|这种抽样误差的两尾概率(之和)为2×0.2266=0.4532。ӮfN(Ӯ)

n=1n=4n=9第一节单个母总体抽样

回眸例1.5求获得抽样误差的概率:

μ=43.5g,σ=4.65g,N=623;Ӯ=44.05g,S=4.523g,n=25解按惯例所求两尾概率即抽样误差的绝对值达到0.55的概率,因此有:σӮ=σ/√n

=4.65÷√25=0.93gu=0.55÷σ/√n=

0.59反查附表2或顺查附表1可得:P(|Ӯ–μ|≥0.55)=

P(|u|≥0.59)=2P(u≤-0.59)=2Φ(-0.59)=2×0.2776=0.5552≈0.56以上两例已由总体标准差σ深化到总体标准误σӮ,使连续性变量的概率分布研究从误差y–μ升华到抽样误差Ӯ-μӮ,即Ӯ–μ。但这还不够,历史上也没有因此避免正态分布在应用上的危机,因为要获得σ的准确数值,其难度比μ大得多。到1908年W.S.Gosset公开发表一篇论文才使抽样误差的研究走出应用上的困境。如例2.1中定义样本标准误SӮ=S/√n,则可将抽样误差转换成另一个标准化变量t=(Ӯ-μ)÷S/√n=0.55÷0.9=0.61

查附表3可知获得0.55的两尾概率当在0.5以上(n-1=24)。

第二节显著性检验的原理α=0.05也叫显著水平,是一个概率临界值,它是根据“小概率事件在当前这次试验(观察)中实际不可能发生”这种“道德确定性”、基于农业和生物学领域的行业要求而规定的小概率标准。α=0.05只能理解为否定Ho时容许犯错误的概率,本例获得27kg抽样误差的概率虽然很小,但尚未小到否定Ho时规定的显著水平,反过来讲就是没有95%以上的把握来认定其表面效应是“本质差别”而不是抽样误差;或者说表面效应虽然较大,但还没有大到有95%以上的把握来排除它是抽样误差的可能性。上述通过计算两尾概率评价其表面效应的做法通常针对的提问方式是:“新品种的单产与当地品种有无显著差异?”实际上评价表面效应还有一种问法:“新品种的单产是否高于当地品种?”解这样提问往往是根据专业方面的信息已明知新品种的单产不可能低于当地品种,于是检验方法由双侧检验变成单侧检验。1.仍假定表面效应是抽样误差;Ho:μ≤μo或μ≤300kg2.计算获此抽样误差的单侧概率;P(Ӯ–μ≥27)=P(Ӯ–μo≥27)=P(u≥9/5)=Φ(-1.8)=0.0363.根据小概率原理推断:Ho不成立。

第二节显著性检验的原理二、显著性检验的特点1.是一种概率反证法;先假定(单向)成立,再计算标准误,然后将表面效应转换成标准化变量后查算其属于抽样误差的概率是否为小概率,是则拒绝Ho;否则接受Ho。2.用了小概率原理;否定Ho有95%以上的把握,但不可能为100%,即表面效应只要大到视其为抽样误差时的双侧或单侧概率小到显著水平就能否定Ho,不然就暂且接受Ho,决不意味着接受Ho时有95%以上的把握。3.不同的场合依据不同的抽样分布。三、关于t分布定义:t=(Ӯ-μ)÷SӮ

其中SӮ=S/√n叫样本标准误参数:μt=0,σt=√〔ν/(ν-2)〕曲线特性:

以μt=0处的纵轴对称,并以之为曲线最高点位置,而后往两侧递降;不同的ν决定一条特异的t分布曲线;曲线形状随着ν的增加,峰顶由下往上朝标准

曲线的峰顶逼近,两尾由上往下朝标准曲线的两尾收拢;而当ν→∞(>120)时,t分布曲线与标准曲线N(0,1)重合。4.附表3与t分布的关系。第二节显著性检验的原理附表3所列为9种双侧概率对应的|t|,如右图所示,当n–1=9时,0.05和0.10栏目下的2.262和1.833就表明所得标准化变量t在n=10时绝对值超过2.262的概率(双侧面积)为0.05,超过1.833的概率(双侧面积)为0.10。按照显著性检验原理,计算获得某抽样误差的概率只是为了确认它是否为小概率,那反过来也就可以根据0.05的显著水平确定标准化变量u或t的“临界值”,再和抽样误差标准化的结果相比较就是了,由此而来的显著性检验步骤见下例。0.900.050.0250.0251.833↓2.262↓tf(t)←ν=9第二节显著性检验的原理四、显著性检验的步骤例2.3已知某品种母猪的怀孕期为μ0=114d,现抽查其10头母猪得怀孕期平均日数Ӯ=114.5d,S=1.581d,则检验所得样本的怀孕期是否显著超过114d的步骤为:

H0:μ≤μo或μ≤114d;SӮ=S/√n=1.581÷√10=0.50t=(Ӯ-μ)÷SӮ=0.5÷0.50=1.00按自由度ν=9查得:单侧t0.05=双侧t0.10=1.833推断:t<t0.05,H0

成立。即所得样本的怀孕期没有显著超过114d

本次测验的显著水平:α=0.05本例是按照题目要求进行单侧检验,实际应用中这种提问方式必须有所谓的“附加知识”为依据,即有来自专业方面的信息表明所得样本的怀孕期不可能低于114d,否则就只能用双侧检验。

H0:μ=μo或μ=114d;SӮ=S/√n=1.581÷√10=0.50t=(Ӯ-μ)÷SӮ=0.5÷0.50=1.00(3)按自由度ν=9查得两尾t0.05=2.262(4)推断:t<t0.05,

H0

成立。意即所得样本的怀孕期与114d无显著差异。

本例双侧检验对H0的态度与单侧检验相同,但实际研究中有不相同的。第二节显著性检验的原理例2.4按饲料配方规定,每1000kg某种饲料中维生素C不得少于μ0=247g,现从某工厂的产品中随机抽查12份样品得平均含量Ӯ=252g,S=9.115g,则检验所得样本的Vc含量是否显著超过247g的步骤为:

H0:μ≤μo或μ≤247g;SӮ=S/√n=9.115÷√12=2.631t=(Ӯ-μ)÷SӮ=5÷2.631=1.90按自由度ν=11查得:单侧t0.05=双侧t0.10=1.796推断:t>

t0.05,H0

不成立。即所得样本的Vc含量显著超过247g

本次检验的显著水平:α=0.05本例是按照题目要求进行单侧检验,实际应用中这种提问方式必须有所谓的“附加知识”为依据,即有来自生产方面的要求表明所得样本来自Vc含量不低于247g的总体,否则就只能用双侧检验。

H0:μ=μo或μ=247g;SӮ=S/√n=9.115÷√12=2.631t=(Ӯ-μ)÷SӮ=5÷2.631=1.90(3)按自由度ν=11查得双侧t0.05=2.201(4)推断:t<t0.05,

H0

成立。意即所得样本的Vc含量与247g无显著差异。

本例双侧检验对H0的态度与单侧检验截然不同,说明有“附加知识”时应用一尾测验有利于否定H0

。第三节两个母总体抽样例2.5假定第一总体{2,4,6},N1=3,μ1=4,σ12=8/3;第二总体{3,6},N2=2,μ2=4.5,σ22=9/4。现从中分别以n1=2和n2=3进行复置抽样,试研究Ӯ1-Ӯ2抽样分布。解来自两个母总体的Ӯ之差数Ӯ1-Ӯ2构成的衍生总体容量N1n1

×N2n2=9×8=72,其全部可能的取值及次数分布列表如右,按数据整理时用过的加权法计算其参数如下:μӮ1-Ӯ2=Σf(Ӯ1-Ӯ2)÷Σf=-36/72=μӮ1-μӮ2=

μ1-μ2=-0.5σ2Ӯ1-Ӯ2=Σf(Ӯ1-Ӯ2+0.5)2

/Σf=150/72=σ2Ӯ1+

σ2Ӯ2=σ12

/n1

+σ22

/n2

=8/3÷2

+

9/4÷3=25/12e=(Ӯ1-Ӯ2)

–μӮ1-Ӯ2=(Ӯ1-Ӯ2)

–(μ1-μ2)

第三节两个母总体抽样复置抽样时总体和随机样本的关系n=1n=2n=3第三节两个母总体抽样复置抽样后差数Ӯ1-Ӯ2构造衍生总体示意图第三节两个母总体抽样

由例2.5针对“平均数的差数”Ӯ1-Ӯ2进行的抽样研究结果,实际上也是中心极限定理内容之一:Ӯ1-Ӯ2~N(μӮ1-Ӯ2,σ2Ӯ1-Ӯ2),于是又有:u=〔(Ӯ1-Ӯ2)-μӮ1-Ӯ2〕÷σӮ1-Ӯ2=〔(Ӯ1-Ӯ2)-(μ1-μ2)〕/

可见,来自两个母总体的差数Ӯ1-Ӯ2与其真值μӮ1-Ӯ2的抽样误差e取值的概率分布也可以用正态分布来描述,当两个母总体的参数已知时,同样可以转化为用标准分布求算概率。只是因为实际应用中遇到的多为两个母总体参数未知的情况,所以差数的抽样误差无法转化成正态离差u而只能转化成另一个标准化离差t,即:t=〔(Ӯ1-Ӯ2)-μӮ1-Ӯ2〕÷SӮ1-Ӯ2,其中,SӮ1-Ӯ2叫差数的样本标准误,由S12

、S22算出,并且计算公式和差数的总体标准误相类似。

第四节检验两个样本平均数差异一、测验Ӯ1-Ӯ2例2.7某种猪场分别测定长白后备种猪和蓝塘后备种猪90kg时的背膘厚度,各获得n1=12和n2=11头猪的观察值,并算得Ӯ

1=1.202mm,SS1=0.11mm2;Ӯ2=1.817mm,SS2=0.151mm2,故检验两品种背膘厚度有无显著差异的步骤为:

(1)H0:μ1=μ2或μ1-μ2=0(2)F=S大2/S小2=0.151/10÷0.11/11=1.51ns

查得右尾F0.05,10,11=2.86,于是有:Se2=(SS1+SS2)/(ν1+ν2)=0.261÷21=(ν1S12+ν2S22)/(ν1+ν2)=0.0124S

Ӯ1-Ӯ2==0.0465t=〔(Ӯ1-Ӯ2)-μӮ1-Ӯ2〕÷SӮ1-Ӯ2

=〔(Ӯ1-Ӯ2)-(μ1-μ2)〕÷SӮ1-Ӯ2

=(1.202–1.817)/0.0465=-13.226(3)按ν=11+10=21查得两尾t0.05=2.080(4)推断:|t|>t0.05H0不成立

本例属于实际应用中普遍遇到的参数σ12及σ22未知的情形,不可能用u-test而只能用t-test,由于SӮ1-Ӯ通过合并均方Se2计算时必须以两样本均方经F-test证实无显著差异(齐性检验)为先决条件,

故要在用加权法合并两个样本方差前插入一个F-test过程。倘若经F-test证实有显著差异,表明σ12≠σ22,那就不能计算Se2而只能仿照中心极限定理有关结论计算:

S

Ӯ1-Ӯ2=,只是以它为分母转换出来的标准化变量已不再是严格意义上的“t”变量……先了解一下F分布。第四节检验两个样本平均数差异关于F的定义及其分布从一个母总体N(μ,σ2)中随机抽取两个独立样本,算得两个样本均方依次为S12、S22,则定义:F=S12/S22。抽样研究的结果证明,F是一个连续性随机变量,理论上存在着抽样分布,这就是F分布。它具有平均数为:μF=ν2/(ν2-2)㈠F分布是由自由度ν1、ν2决定的曲线系统,因为受F≮0的限制,任一条限于纵坐标右侧;㈡F分布曲线不对称往左倾斜,左倾程度随着ν1、ν2的一齐增加而减小,ν2→∞时,μF的取值从大于1的那边由右往左→1,曲线峰顶向上、向右往μF→1的垂线逼近;㈢附表4(右尾F临界值表)与F分布的关系。

第四节检验两个样本平均数差异Ff(F)←ν1=1,ν2=7←ν1=1,ν2=4←─ν1=1,ν2=25.59↓7.71↓↓18.51↓↓↓这里只显示ν1=1的反J型曲线,ν1=2时也是如此;当ν1≥3时,F分布曲线就转为偏态,呈现反S型。第四节检验两个样本平均数差异一、测验Ӯ1-Ӯ2例2.9某家禽研究所用粤黄鸡对A、B两种饲料的增重效果进行对比试验,时间60d,各获得8只鸡的观察值,算得Ӯ

1

=705.625g,SS1=2022g2;Ӯ

2=696.125g,SS2=967g2,检验增重效果有无显著差异的步骤为:(1)H0:μ1=μ2或μ1-μ2=0(2)F=S大2/S小2=2022/7÷967/7=2.09ns

查得右尾F0.05,7,7=3.76,于是有:Se2=(SS1+SS2)/(ν1+ν2)=2989÷14=(ν1S12+ν2S22)/(ν1+ν2)=213.5S

Ӯ1-Ӯ2==7.306t=〔(Ӯ1-Ӯ2)-μӮ1-Ӯ2〕÷SӮ1-Ӯ2

=〔(Ӯ1-Ӯ2)-(μ1-μ2)〕÷SӮ1-Ӯ2

=(705.625–696.125)/7.306=1.300(3)按ν=7+7=14查得两尾t0.05=2.145(4)推断:|t|

t0.05H0成立

本例属于实际应用中经常遇到的两样本观察值个数n1=

n2

=

n的情形,此时计算公式可简化:Se2=(SS1+SS2)/(ν1+ν2)=(ν1S12+ν2S22)/(ν1+ν2)=(S12+S22)/2S

Ӯ1-Ӯ2=

=即使经F-test证实有显著差异,表明σ12≠σ22时也是如此:

S

Ӯ1-Ӯ2=

=

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论