第7章-统计分析的基本原理_第1页
第7章-统计分析的基本原理_第2页
第7章-统计分析的基本原理_第3页
第7章-统计分析的基本原理_第4页
第7章-统计分析的基本原理_第5页
已阅读5页,还剩119页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章统计分析的基本原理§1事件及概率§2概率分布§3几个重要的概率分布§4平均数的抽样分布§5统计假设检验§6参数的区间估计§7方差分析原理第七章统计分析的基本原理

§1事件及概率

一、事件的类型:1、必然事件:在一定条件下一定会发生的事件。2、不可能事件:在一定条件下一定不会发生的事件3、随机事件:在一定条件下可能发生,也可能不发生。或者发生这样的结果也可能发生另一种结果。二、随机试验1、试验:通常我们把根据某一研究目的,在一定条件下对自然现象所进行的观察或试验统称为试验。2、随机试验的特性(1)试验可以在相同条件下多次重复进行;(2)每次试验的可能结果不止一个,并且事先知道会有哪些可能的结果;(3)每次试验总是恰好出现这些可能结果中的一个,但在每次试验之前却不能肯定这次试验会出现哪一个结果。第七章统计分析的基本原理§1事件及概率三、概率1、概率的定义:

例:一批种子的发芽试验:种子数n1020501002005001000发芽数m8174279164409816发芽率m/n0.80.850.840.790820.8180.816

在相同条件下进行n次重复试验,如果随机事件A发生的次数为m,那么m/n称为随机事件A的频率(frequency);当试验重复数n逐渐增大时,随机事件A的频率越来越稳定地接近某一数值p,那么就把p称为随机事件A的概率。第七章统计分析的基本原理§1事件及概率2、概率的基本性质:1)对于任何事件的概率,0≤P(A)≤1;2)必然事件的概率为1,即P(Ω)=13)不可能事件的概率为0,即P(ф)=0。4)随机事件的概率为大于0,小于1,即:0<P(A)<1

概率记作:记作:P(A)==第七章统计分析的基本原理§1事件及概率3、小概率事件:

若随机事件的概率很小,例如小于0.05、0.01、0.001,称之为小概率事件。4、小概率原理:如果事件的概率为0.05、0.01、0.001以至接近0时,这种小概率事件我们在一次试验中看成实际上不可能发生的事件。这被称为“小概率事件实际不可能性原理”。第七章统计分析的基本原理§1事件及概率§2概率分布一、随机变量

做一次试验,其结果有多种可能。每一种可能结果都可用一个数来表示,这个数称为随机变量,用x表示。1、离散型随机变量

(discreterandomvariable):

如果表示试验结果的变量x,其可能取值可以一一列举,这样的随机变量则称x为离散型随机变量。

2、连续型随机变量

(continuousrandomvariable):

如果表示试验结果的变量x,其可能取值为某范围内的任何数值,且不能一一列举,这样的随机变量称为连续型随机变量。1、概率分布意义:

例1、一粒种子的发芽试验,种子的发芽率为0.8X01P(x)0.20.8二、概率分布第七章统计分析的基本原理§2概率分布例2、一批种子检验其合格率为p=0.9,不合格率q=0.1,从中随机抽取5颗,其合格种子的概率分布=通式:∑

pxqn-x=(p+q)nX543210f(x)0.95*0.100.94*0.110.93*0.120.92*0.130.91*0.140.90*0.150.950.328050.07290.00810.000450.15第七章统计分析的基本原理§2概率分布概率分布的定义:对于确定的随机变量x可能取的值为:x1、x2、x3、……xn,与之对应的概率之间的任何一一对应的关系称为随机变量的概率分布。xx1x2

…xn

…pp1p2

…pn

…第七章统计分析的基本原理§2概率分布2、概率分布函数:

一组随机变量必定有一个概率分布,且是唯一确定的,并且这种概率可以用一个函数式来表示,这个函数式称为概率分布函数。f(x)=px·qn-xf(x)≥0第七章统计分析的基本原理§2概率分布§3几个重要的概率分布一、二项式分布1、二项式分布的意义:

设事件A和组成完备事件,事件A要么发生要么不发生,二者必居其一,且每次试验中事件A发生的概率为常数p,事件A不发生的概率为q=1-p,在n次独立重复试验中,用x表示n次试验中事件A发生的次数,所以x取值为0、1、2……n,这n+1种取值有各自对应的概率分布,这样的概率分布称为二项式分布。*从定义可以看出,二项式分布是非连续型随机变量的概率分布。2、二项式分布的函数1)分布函数(密度函数):2)累积函数:指x取值在某一范围内的概率之和。F(x)=P(m1≤x≤m2)=f(x)=F(x)=P(0≤x≤n)==1第七章统计分析的基本原理§3几个重要的概率分布3、二项式分布的平均数和标准差1)平均数:u=np2)标准差:σ=第七章统计分析的基本原理§3几个重要的概率分布4、二项式概率分布图像X543210f(x)0.590490.328050.07290.00810.000450.00005p=0.9q=0.1n=5Xf(x)第七章统计分析的基本原理§3几个重要的概率分布p=0.4,q=0.6,n=20的二项分布图示p=q=0.5,n=5的二项分布图示第七章统计分析的基本原理§3几个重要的概率分布(p+q)n=(0.1+0.9)n二项式分布图像二项式分布图像的特点:1)n很小,p≠q时,图像是偏峰的折线2)n很小,p=q时,图像是一个对称的折线3)若n充分大时,图像逐渐变成对称平滑的曲线。

(p+q)20二项式分布图像二、正态分布1.正态分布的定义:

若连续型随机变量x的概率分布密度函数为:

其中μ为平均数,σ2为方差,则称随机变量x服从正态分布(normaldistribution),记为x~N(μ,σ2)。累积函数为:

第七章统计分析的基本原理§3几个重要的概率分布2、正态分布图像:0.68260.95450.9973μ-3σμ-2σ

μ-1σμ

μ+1σμ+2σ

μ+3σxf(x)0.40.30.20.1第七章统计分析的基本原理§3几个重要的概率分布3、正态分布的性质:1)正态分布曲线是单峰,左右对称的钟形曲线,对称轴在x=μ处。

2)的绝对值愈大时,f(x)愈小,f(x)恒大于0;所以f(x)为正函数,曲线向x轴两端无限延伸,以x轴为渐近线。3)当x=u时,f(x)为最大。第七章统计分析的基本原理§3几个重要的概率分布4)x取值范围为整个x轴,即:-∞<x<+∞。所以曲线与x轴围成的面积等于1。即:

因此变量x取任何两个定值a,b之间的概率等于曲线下介于这两个定值间的面积占总面积的成数。即:

P(a≤x≤b)=第七章统计分析的基本原理§3几个重要的概率分布图4-4μ相同而σ不同的三个正态分布5)任何正态分布曲线都由两个参数u,和σ决定的。μ确定曲线在x轴上的位置;σ确定曲线峰的高低。图4-3σ相同而μ不同的三个正态分布6)x在下列取值区间时的累积概率X取值区间面积成数面积比例(u-1σ)≤x<(u+1σ)0.682768.27%(u-2σ)≤x<(u+2σ)0.954595.45%(u-3σ)≤x<(u+3σ)0.997399.73%(u-1.96σ)≤x<(u+1.96σ)0.9595%(u-2.576σ)≤x<(u+2.576σ)0.9999%-∞<x≤(u+1.645σ)0.9595%-∞<x≤(u+2.33σ)0.9999%P(a≤x≤b)=第七章统计分析的基本原理§3几个重要的概率分布4、正态分布的概率计算:1)一般正态分布的概率:P(x1≤x≤x2)=概率是阴影的面积正态分布的概率第七章统计分析的基本原理§3几个重要的概率分布2)标准的正态分布设随机变量x服从正态分布:即:x~N(μ

,σ2)令:U=◆密度函数式:

这个函数式中μ=0,σ=1

所以:U~N(0,1)这个函数称为标准的正态分布函数即:x~N(μ

,σ2)转换成U~N(0,1)变量x转换成UU称为标准正态变量第七章统计分析的基本原理§3几个重要的概率分布◆累积函数为:随机变量U服从标准正态分布,记作U~N(0,1)这样可以计算出U取任意值时的累积概率。累积概率见表2(p357页)第七章统计分析的基本原理§3几个重要的概率分布标准正态分布密度曲线Uf(x)0第七章统计分析的基本原理§3几个重要的概率分布标准正态分布的三个常用概率

U第七章统计分析的基本原理§3几个重要的概率分布

关于标准正态分布,以下几种概率应当熟记:

P(-1≤U<1)=0.6826P(-2≤U<2)=0.9545

P(-3≤U<3)=0.9973P(-1.96≤U<1.96)=0.95P(-2.58≤U<2.58)=0.99第七章统计分析的基本原理§3几个重要的概率分布

设u服从标准正态分布,则U在[U1,U2

)内取值的概率为:3)标准正态分布的概率计算=Φ(U2)-Φ(U1)而Φ(U1)与Φ(U2)可由附表1查得第七章统计分析的基本原理§3几个重要的概率分布

◆计算u所在一定区间的概率:例1:U

N(0,12)计算U取值在-2σ至+3σ区间的概率解:由题意可知:变量U所在总体的μ=0,σ=1变量U服从标准的正态分布,所以:

P(U-2σ≤U<U+3σ)=P(-2≤U<3)=P(-∞≤U<3)-P(-∞≤U<-2)=Φ(3)-Φ(-2)=0.99865-0.02275(查表得)=0.97889第七章统计分析的基本原理§3几个重要的概率分布◆计算x取值所在区间的概率例2、x~N(10,52)求x取值为15至25的概率解:依题意可知,变量x所在的总体的平均数μ=10,标准差σ=5,该总体不是服从标准的正态分布。所以必须先进行标准化,将x变量转换成u变量变量标准化转换:xU,变量u所在总体的μ=0,σ=1P(U+1σ≤U<U+3σ)=P(1≤U<3)=P(-∞≤U<3)-P(-∞≤U<1)=Φ(3)-Φ(1)=0.99865-0.84134(查表1)=0.15731第七章统计分析的基本原理§3几个重要的概率分布例3、P63页例4.4解:依题意:变量x~N(30,52)◆求小于26的概率P(-∞≤U<U-0.8σ

)=P(-∞

≤U<-0.8)=Φ(-0.8)=0.2119变量U所在总体的μ=0,σ=1◆

介于26至40区间的概率P(-0.8<U<2)=Φ(2)-Φ(-0.8)=0.97725-0.21186=0.76539第七章统计分析的基本原理§3几个重要的概率分布◆小于40的概率

U===2

P(-∞<U<2)=0.97725Φ(2)=F(40)=0.97725

求大于40的概率

P(U+2σ≤U<∞)=P(2≤U<∞)=Φ(∞)

-Φ(2)=1-0.97725

=0.02275

第七章统计分析的基本原理§3几个重要的概率分布作业:

桂花一年生苗木平均高35cm,标准差15cm,问这批苗木

(1)高于60cm苗木所占比例;

(2)在20cm至60cm之间的苗木所占比例;

(3)小于20cm的苗木所占比例。第七章统计分析的基本原理§3几个重要的概率分布§4平均数的抽样分布一、样本平均数二、样本平均数的概率分布三、“t”分布四、两个样本平均数差数的概率分布一、样本平均数:1、样本平均数:

……s1s2……sn第七章统计分析的基本原理§4平均数的抽样分布2、样本平均数的平均数:

样本平均数的平均数等于总体的平均数

即:

:总体平均数

:样本平均数的平均数

3、样本平均数的标准差(标准误)为:

其中::样本平均数的标准差;:总体的标准差;n为样本单元数

第七章统计分析的基本原理§4平均数的抽样分布

注意:标准差与标准误是既有联系又有区别的两个统计量,上式已表明了二者的联系。二者的区别在于:

样本标准差S是反映样本中各观测值,,…,变异程度大小的一个指标,它的大小说明了对该样本代表性的强弱。

样本标准误是样本平均数的标准差,它是抽样误差的估计值,其大小说明了样本间变异程度的大小及精确性的高低。第七章统计分析的基本原理§4平均数的抽样分布二、样本平均数的概率分布:

统计量(如,)随样本的不同而有所不同,因而样本统计量也是随机变量,也有其概率分布。我们把统计量的概率分布称为抽样分布。

从有限总体中作重复随机抽样,所有可能的样本数为Nn,其中N为总体容量,n为样本含量。例如:如果从N=4的总体中抽取n=2的样本,共可得42=16个样本;如果样本含量n为4,则一共可抽得44=256个样本。第七章统计分析的基本原理§4平均数的抽样分布例:设有一总体N=3,观察值为:2、4、6,每次抽取2个单元组成样本,

第一次抽取的数246第二次抽取的数246246246样本的和468681081012样本平均数234345456第七章统计分析的基本原理§4平均数的抽样分布各种不同样本容量的平均数()的抽样分布表(p67页表)n=1n=2n=4n=8f

f

f

f212121212.2582.542.5362.751123231032663.255043.5163.57843.7510164143419411074.2510164.5164.57844.755045251052665.251125.545.5365.72861616161总次数3981656144448/34/32/31/3例2:设有一总体N=3,观察值为:2、4、6,以样本容量n=1、n=2、n=4、n=8

(p67例4.7)N=3,n=1,k=31

,平均数概率分布图

N=3,n=2,k=32

,平均数概率分布图N=3,n=4,k=34

,平均数概率分布图

N=3,n=8,k=38,平均数概率分布图

第七章统计分析的基本原理§4平均数的抽样分布1、样本平均数的概率分布

不管原总体是否是正态分布,从中随机抽取样本,即使样本容量很小(n=4),样本平均数的分布却趋向于正态分布形式。随着样本容量n的增大,样本平均数的分布愈来愈从不连续趋向于连续的正态分布,当n>30时,的分布就近似正态分布了。样本平均数服从正态分布。记作:~N(,)第七章统计分析的基本原理§4平均数的抽样分布1)若随机变量x

服从正态分布x~N(μ,σ2),

x1、x2

、…、xn是由总体得来的随机样本,则统计量=∑x

/n的概率分布也是正态分布,

=μ,服从正态分布,

即:~

N(μ,σ2/n)。2、中心极限定律第七章统计分析的基本原理§4平均数的抽样分布2)若随机变量x

平均数是μ,方差是σ2的总体不是正态分布;,,…,是由此总体得来的随机样本,则统计量=Σx/n的概率分布,当n相当大时逼近正态分布,即:~N(μ,σ2/n)。第七章统计分析的基本原理§4平均数的抽样分布中心极限定理告诉我们:不论变量x是连续型还是离散型,也不论x服从何种分布,一般只要n>30,就可认为的分布是正态的。若x的分布不是很偏倚,在n>20时,的分布近似于正态分布。第七章统计分析的基本原理§4平均数的抽样分布1、t分布函数:(t-distribution)

由样本平均数抽样分布的性质知道:若x~N(μ,σ2),则~N(μ,σ2/n)。将随机变量标准化得:,则U~N(0,1)。

当总体标准差σ未知时,以样本标准差S代替σ将随机变量标准化,标准化的变量记为t。在计算时,由于采用S来代替σ,使得t

变量不再服从标准正态分布,而是服从t分布。三、“t”分布:第七章统计分析的基本原理§4平均数的抽样分布概率分布密度函数如下:t的取值范围是(-∞,+∞)

df=n-1为自由度。第七章统计分析的基本原理§4平均数的抽样分布2、分布曲线1)t分布受自由度的制约,每一个自由度都有一条t分布密度曲线。第七章统计分析的基本原理§4平均数的抽样分布

不同自由度的t分布密度曲线第七章统计分析的基本原理§4平均数的抽样分布2)t分布密度曲线以纵轴为对称轴,左右对称,且在t=0时,分布密度函数取得最大值。

3)与标准正态分布曲线相比,t分布曲线顶部略低,两尾部稍高而平。df越小这种趋势越明显。df越大,t分布越趋近于标准正态分布。当n>30时,t分布与标准正态分布的区别很小;n>100时,t分布基本与标准正态分布相同;n→∞时,t

分布与标准正态分布完全一致。第七章统计分析的基本原理§4平均数的抽样分布通俗地说:

◆在样本容量充分大(n≥30)时,或者总体的方差已知,样本的平均数就服从正态分布,即:~

N()

在样本容量比较小(n﹤30)时,而总体的方差未知,样本的平均数就服从df=n-1的t分布。第七章统计分析的基本原理§4平均数的抽样分布四、两个样本平均数的差数概率分布:

如果从一个总体随机抽取一个样本,样本容量为n1,总体平均数为μ1,方差为,从另一个总体随机抽取一个样本,样本容量为n2,总体平均数为μ2,方差为,根据数理统计推导,两个随机独立抽取的样本平均数间的差数()的抽样分布参数与两个总体间存在如下关系:第七章统计分析的基本原理§4平均数的抽样分布(1)差数的平均数等于两个总体平均数之差,即:(2)差数的方差为:第七章统计分析的基本原理§4平均数的抽样分布通俗地说:

◆在样本容量充分大(n≥30)时,或者总体的方差已知,两个样本的平均数的差数就服从正态分布,即:~

N()

在样本容量比较小(n1﹤30,n2

﹤30

)时,而两个总体的方差未知,两个样本的平均数差数就服从df=(n1-1)+(n2-1)的t分布。第七章统计分析的基本原理§4平均数的抽样分布

§5统计假设检验一、假设检验的基本原理1、几个基本概念:⑴假设检验:用一定标准检验样本的特征数与总体参数或两个样本特征数之间是否存在真正差异的一种统计方法叫假设检验,或差异显著测验。

样本统计量与总体参数的差异可能的原因:随机因素引起的,这是由于抽样所产生的,叫做抽样误差。两者本质上存在的差异引起的,样本的统计量与总体参数存在着本质的差异。◆假设检验又叫差异显著性检验(testofsignificance),其类型有:U检验t检验F检验

2检验等

第七章统计分析的基本原理§5统计假设检验⑵无效假设H0:假定样本来源的总体参数u与假设的总体参数u0没有真正的差异,

即H0

:u=u0

u为样本来自的总体参数,u0为假定的总体参数。⑶备择假设HA:假定样本来源的总体参数u与假设的总体参数u0间存在真正的差异,即HA

:u≠u0

⑷显著性水平(α):在假设检验中选用的概率标准,也就是对概率规定的数量界限,通常用α=0.05,α=0.01,α=0.001第七章统计分析的基本原理§5统计假设检验

引例:有5株水稻苗,属于2个品种,某人自称有鉴别能力,我们表示怀疑,怎样才能判断他有无鉴别能力?我们假设他没有鉴别能力,凭猜。检验一下他猜对的可能性大小。2、假设检验的原理

有2株是A品种,3株是B品种他是怎么知道的?这5株水稻,有几株是A品种,几株是B品种?32、假设检验的原理

小概率原理:概率很小(≤5%或1%)的事件,在一定试验(抽样)中是不可能会出现的,若真正出现,则认为无效假设不正确而推翻无效假设。

第七章统计分析的基本原理§5统计假设检验

样本平均数分布规律是:从总体中抽出100个样本,有95%的样本平均数在总体平均数左右各1.96个标准误差范围内,只有5%的样本平均数在总体平均数左右1.96个标准差范围以外,但是从总体中抽出一个样本时,一般是在总体平均数左右各1.96标准差范围之内,决不会在之外。

因此认为样本平均数与总体参数u之差(-u)不超过1.96个标准差,以95%的概率保证样本平均数与总体平均数不存在差异故接受H0,样本平均数与总体u0存在的差异是抽样误差。第七章统计分析的基本原理§5统计假设检验若从总体中抽一个样本时,它的平均数落在总体平均数1.96个标准误差范围以外,即5%的概率范围,这是不可能的。说明样本平均数与假定的总体u0存在的差异不是抽样误差,而是样本所在的总体与假定总体存在实质性的差异。即u≠u0,故接受HA。第七章统计分析的基本原理§5统计假设检验3、两种错误1)第一类错误是真实情况为H0成立,却否定了它,犯了“弃真”错误,也叫Ⅰ型错误。

Ⅰ型错误:就是把非真实差异错判为真实差异。

即:为真,却接受了。

第七章统计分析的基本原理§5统计假设检验2)第二类错误是H0不成立,却接受了它,犯了“纳伪”错误,也叫Ⅱ型错误。

Ⅱ型错误:就是把真实差异错判为非真实差异。即:为真,却接受了。第七章统计分析的基本原理§5统计假设检验客观事实否定H0接受H0H0成立犯Ⅰ型错误(概率为α)判断正确(概率为1-α)H0不成立判断正确(概率为1-β)犯Ⅱ型错误(概率为β)第七章统计分析的基本原理§5统计假设检验降低错误的措施:◆将α(小概率)值规定小一些◆增加试验的样本容量降低误差

=

第七章统计分析的基本原理§5统计假设检验4、一尾测验、两尾测验否定区间在分布曲线的两端称为两尾检验否定区间在分布曲线的一端,称为一尾测验。

两尾测验

一尾测验

第七章统计分析的基本原理§5统计假设检验5、差异显著性测验的基本方法1)建立无效假设H0,有一个备择假设HA;2)选取适当的检验显著性水平α,并确定是一尾还是两尾;3)确定统计量的分布,正态分布(大样本),t分布(小样本);4)计算样本的统计量U(t),同时列出自由度df;5)据U值(自由度)及α查表得临界值Uα(tα);6)统计推断:用计算的U(t)与查表得的Uα(tα)比较,判断接受H0或HA,

<Uα

或<tα

,则接受H0,否则接受HA。第七章统计分析的基本原理§5统计假设检验二、平均数差异显著性测验1、一个样本的显著性测验

假定总体X~N(u0,σ2)分布,样本容量为大样本,测验该样本是否来源于假定总体。1)建立无效假设H0:u=u0,

所在的总体u与总体u0没有差异;及备择假设HA:u≠u0;

2)选择α:α=0.05或α=0.01两尾或一尾第七章统计分析的基本原理§5统计假设检验3)计算统计量,U=

σ,U0:

假定总体标准差及平均数

n:样本容量4)依α查表3,得Uα值5)判断︱U︱>Uα,否定H0,则认为不属于总体u0。样本平均数所在的总体u与总体u0差异显著或极显著。第七章统计分析的基本原理§5统计假设检验

⑤推断

>U0.05

说明值落在1.96标准差以外,故否定H0,说明新品种与当地的品系存在着显著差异。

例:据测定某当地板栗品种一年生苗高110cm,标准差σ=8.8cm,今引进一个新品种40株,一年生苗高为100cm,试问这个新品种株高与当地品种是否存在显著性差异。①建立无效假设:H0:u=u0=110cm,HA

:u≠u0②选择α=0.05两尾测验

=-7.19③

计算U==④依α=0.05,查表3得U0.05=1.96(查正态分布表)(大样本,总体的σ已知)=

③计算样本平均数:=35.2g

例2(P82页5.1例)依题意:U0=34g,n=8①建立无效假设:H0:u=u0=34gHA:u≠u0②选择α=0.05

两尾测验④计算样本标准差:==1.64g⑤计算统计量:==0.58g⑥依据df=8-1=7,依α=0.05查表4,t0.05=2.365(P360)

判断:︱t︱<t0.05,接受假设H0

说明新引进的品种的千粒重与当地良种没有显著性差异。(小样本,总体的σ未知)t=

2、两个大样本平均数差异显著性测验

1)成组数据的平均数的比较:①两个大样本或总体方差已知时,用u检验(正态分布检验)的差数标准误为:

统计量:U==第七章统计分析的基本原理§5统计假设检验

例:(P83页5.2题)σ2

=0.4=1.2n1=12=1.4gn2=8

H0:A、B两种方法的产量相等,即:H0:===0.2887(kg)

=-0.69U0.05

=1.96(查表)U=︱U︱<U0.05

故接受H0,说明A、B两种方法的产量没有差异。HA:u1≠u2

u1-

u2

=0

σ2===0.4

第七章统计分析的基本原理§5统计假设检验~u1=~u2②两小样本平均数,而总体方差未知时差异显著性测验用t检验

建立无效假设H0

=确定显著性水平α(两样本差数标准差)计算统计量:t=

判断:依自由度df=(n1-1)+(n2-1)查t分布表得tα

<tα

则接受H0,否则接受HAHA

:u1≠u2

即:u1=u2第七章统计分析的基本原理§5统计假设检验=428kgn1=5=440kgn2=5

=482.5=137.5=11.136(kg)

==t=

=-1.08=df=(5-1)+(5-1)=8,查表tα=2.306<tα=2.306两种栽培密度的水稻产量没有差异。

例:P84页例5.3,依表计算得:第七章统计分析的基本原理§5统计假设检验2)成对数据的差异显著性测验建立无效假设H0

:u1=u2选择α计算统计量

=

t==依α与df=n-1查附表4得tα

与tα

比较

≤tα,则接受H0第七章统计分析的基本原理§5统计假设检验例:P87例5.6解H0

:u1=u2

选择:α=0.01计算,t值

=11.997==t=依α=0.01,df=7-1=6查表3得tα=3.707判断t>t0.01认为u1与u2有显著差异,说明A、B两种产量对钝化病毒的效果有极显著的差异。=-4.16

第七章统计分析的基本原理§5统计假设检验确定显著性水平α三、百分数的假设检验:1、单个样本百分数(成数)的假设检验检验的步骤:建立无效假设,即H0

:p=p0;备择假设HA:p≠p0

计算统计量

(样本标准差)=

U=判断:依查u分布表得Uα

<Uα

则接受H0

否则接受HA第七章统计分析的基本原理§5统计假设检验例:P88页5.8例

开紫花的大豆为=208÷289=0.7197,理论:p0=0.75选择显著性水平α=0.05计算统计量:

=0.0255

=-1.19U=

Uα=1.96(查表3)

<Uα接受H0,说明大豆的花色符合遗传的分离规律。

第七章统计分析的基本原理§5统计假设检验2、两个样本百分数相比较的假设检验:统计量:=

求两个样本百分数的平均数

=1-

==U=

第七章统计分析的基本原理§5统计假设检验例:(P89页5.9题,检查ppt)

=93.92%=87.37%n1=378n2=396p1=p2建立无效假设:H0:

选择显著性水平:α=0.05

计算统计量:=

=0.906

=1-0.906=0.094

===0.021

U===3.12

Uα=1.96

>Uα

否定H0,说明两个麦田锈病率有显著差异。

第七章统计分析的基本原理§5统计假设检验假设检验公式汇总表类型(标准误)标准化变换查表单个样本平均数与总体比较大样本或总体σ2已知

表3小样本而总体σ2未知

表4两个样本平均数比较大样本(或已知)

表3小样本成对资料

表4成组资料

(n1-1)+(n2-1)表4单个样本百分数(成数)的假设检验

表3两个样本百分数相比较的假设检验:

表3§6参数的区间估计

一、概念:1、参数估计:通过样本资料的统计量来估计总体参数的一种统计方法。2、点估计:用样本的统计量直接估计总体的参数的方法称为点估计。4、置信区间:估计参数所在的区间范围。

5、置信度(可靠性):保证参数在一定区间范围内的概率。3、区间估计:以样本的统计量,在一定的概率的保证下估计总体参数在一定的区间内,这样的估计方法称为区间估计。这个区间称为置信区间。区间的上、下限称为置信限。

第七章统计分析的基本原理§6参数的区间估计μ-1.96-μ≤-μ<μ+1.96-μ-1.96≤-μ<+1.96(每一项减

)二、区间估计的原理μ-1.96≤<μ+1.96(每一项减μ)--1.96≤-μ<-+1.96

(每一项除以-1)+1.96>μ≥-1.96

第七章统计分析的基本原理§6参数的区间估计P(μ-1.96≤<μ+1.96)=1-α=0.95下限为:L1=-1.96总体平均数μ在(-1.96,+1.96)区间内的概率为95%。

置信度为:P=1-α

上限为:L2=+1.96置信区间为:〔-1.96,+1.96〕第七章统计分析的基本原理§6参数的区间估计通式:

大样本:(-Uα

)≤μ≤(+Uα

)误差限为:±Uα

+tα(-tα)≤μ≤()小样本:误差限为:±tα第七章统计分析的基本原理§6参数的区间估计

=4.1(kg)σ=0.3(kg)

n=36置信度:P=1-α=99%α=0.01

查表3三、总体平均数μ的置信限:下限:L1=-Uα

上限:L2=+Uα例:(P92页5.13例)解:已知

4.1-2.58×0.05)≤μ≤(4.1+2.58×0.05)

=4.0≤μ≤4.2U0.01=2.58

===0.051、总体方差σ2已知第七章统计分析的基本原理§6参数的区间估计2、总体方差σ2未知下限:L1=(-tα

)上限:L2=(+tα

)依df=n-1,α查表4的tα值例:(P93页5.14例)解:已知=35.2(kg)=0.58

(kg)

n=8P=99%依df=n-1=8-1=7,查表t0.05=2.365L1=(35.2-2.365×0.58)=33.8L2=(35.2+2.365×0.58)=36.6第七章统计分析的基本原理§6参数的区间估计四、两个总体平均数差数(μ1-μ2)的置信限

1、两个总体方差已知或大样本(p93)

下限:L1=()-Uα

上限:L2=()+Uα

2、总体方差未知:

下限:L1=()-tα

上限:L2=()+tα

第七章统计分析的基本原理§6参数的区间估计区间估计公式汇总表区间估计类型

下限(L1)上限(L2)标准误查表Uα或tα总体方差σ2已知查表3总体方差σ2未知Df=n-1查表4两个总体方差已知或大样本查表3两个总体方差未知或小样本(n1-1)+(n2-1)查表4总体百分数p查表3两个百分数的差数查表3§7方差分析原理

t检验法适用于样本平均数与总体平均数及两样本平均数间的差异显著性检验,但在生产和科学研究中经常会遇到比较多个处理优劣的问题,即需进行多个平均数间的差异显著性检验。这时,若仍采用t检验就不适宜了。这是因为:

检验过程烦琐无统一的试验误差,误差估计的精确性和检验的灵敏性低推断的可靠性低,检验的I型错误率大第七章统计分析的基本原理§7方差分析原理一、方差分析的意义:

方差分析就是将试验的总的变异剖分为各个变异来源的相应部分,从而找出产生变异的主要原因,将总变异中各种产生变异的原因分析出来后剩余部分就是试验误差。然后以试验误差作为假设检验的依据,将其它原因的产生的变异与试验误差比较进行统计推断。

方差分析法是一种在若干能相互比较的资料组中,把产生变异的原因加以区分开来的方法与技术。

第七章统计分析的基本原理§7方差分析原理二、自由度和平方和的分解我们可以将平方和和自由度分别进行分解。平方和自由度S2

=第七章统计分析的基本原理§7方差分析原理k个处理每个处理有n个观测值的

数据模式

总变异有nk个观察值,总自由度有df=nk-1

第七章统计分析的基本原理§7方差分析原理

表示第i个处理n个观测值的和

表示全部观测值的总和表示第i个处理的平均数表示全部观测值的总平均数第七章统计分析的基本原理§7方差分析原理表中xij表示第i个处理的第j个观测值,(i=1,2,…,k;j=1,2,…,n)

称单因素试验的线性模型,

其中表示全试验观测值总体的平均数;

αi

是第i

个处理的效应;εij是试验误差。

第七章统计分析的基本原理§7方差分析原理也是单因素试验的数学模型的性质1)效应的可加性2)分布的正态性3)方差的同质性方差分析的前提或基本假定条件

第七章统计分析的基本原理§7方差分析原理试验结果的总平方和

SST=

令:C

=

C为校正系数

总平方和:SST=

第七章统计分析的基本原理§7方差分析原理1、平方和的分解:

总平方和=组内平方和(误差)+组间平方和(处理平方和)即:SST=SSe+SSk

SST

=

=

处理间平方和:SSk=

=误差平方和:SSe=SST-SSk

第七章统计分析的基本原理§7方差分析原理(P100,6.3)2、自由度的分解:

总自由度=组间自由度+组内自由度即:dfT=dfk+

dfe总自由度:dfT=nk-1处理间自由度:dfk=k-1误差自由度:dfe=dfT-dfk=k(n-1)其中:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论