统计推断包括参数估计和假设检验,即通过样本统计量来估_第1页
统计推断包括参数估计和假设检验,即通过样本统计量来估_第2页
统计推断包括参数估计和假设检验,即通过样本统计量来估_第3页
统计推断包括参数估计和假设检验,即通过样本统计量来估_第4页
统计推断包括参数估计和假设检验,即通过样本统计量来估_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 统计推断包括参数估计和假设检验,即通过统计推断包括参数估计和假设检验,即通过样本统计量来估计和检验总体的参数。统计推断样本统计量来估计和检验总体的参数。统计推断的目的在于认识未知的总体参数及其分布特征。的目的在于认识未知的总体参数及其分布特征。第六章第六章 参数估计与假设检验参数估计与假设检验 6.1 样本及其分布样本及其分布 6.2 点估计点估计 6.3 参数的区间估计参数的区间估计 6.4 样本容量的确定样本容量的确定 6.5 假设检验假设检验6.1 样本及其分布样本及其分布 参数估计的主要内容是研究参数估计的主要内容是研究如何通过样本提如何通过样本提供的信息估计总体的数字特征供的信息估

2、计总体的数字特征。 我们把被观察对象的全体称作我们把被观察对象的全体称作总体总体,把从总,把从总体中按照随机原则抽出的个体组成的小群体体中按照随机原则抽出的个体组成的小群体称为称为样本样本,而样本中所包含的个体数称为,而样本中所包含的个体数称为样样本容量本容量。1.总体和样本总体和样本1 12 2n n1 12 2n n设设X X是是一一个个随随机机变变量量,X X ,X X , ,. . . . . . ., ,X X 是是一一组组相相互互独独立立与与X X具具有有相相同同分分布布的的随随机机变变量量,称称X X为为总总体体. .X X ,X X , ,. . . . . . ., ,X X

3、 为为来来自自总总体体的的简简单单随随机机样样本本,简简称称,n n为为,称称样样本本观观察察值值样样为为本本样样本本容容量量样样本本值值。1 12 2n n1 12 2n n1 12 2n n由由于于按按随随机机原原则则取取样样,在在试试验验之之前前,人人们们无无法法预预言言试试验验的的结结果果,所所以以X X , ,X X , ,. . . .X X 是是一一组组,而而在在试试验验之之后后,得得到到X X , ,X X , ,. . . .X X 的的一一组组观观察察值值x x随随机机变变量量, ,x x , ,. . . . . .x x , ,则则确确定定为为一一组组的的数数值值。2.

4、抽样分布有关的几个定理:抽样分布有关的几个定理:11lim0,.)2 , 1()(,)(,.,1 . 61221niiniinXnPiXDXEXXX,有则对任意的数学期望和方差:有相同的有限的同分布的随机变量,且是独立设(切比雪夫大数定律)定理这个定理说明了:从总体中抽取的简单随这个定理说明了:从总体中抽取的简单随机样本得到的统计量机样本得到的统计量 ,其抽样分布的数,其抽样分布的数学期望等于总体分布的数学期望。学期望等于总体分布的数学期望。X1lim, 02 . 6pnmPApAnmn有对于任意的试验中发生的概率,则在每次是事件发生的次数,试验中事件次是(贝努里大数定律)设定理这个定理说明了

5、:当观察次数这个定理说明了:当观察次数n很大时,用很大时,用某随机现象在大量观察中发生的实际频率来某随机现象在大量观察中发生的实际频率来代替该现象发生的真实概率差别是很小的。代替该现象发生的真实概率差别是很小的。)(正态分布。即)的服从参数为(则其均值态分布且每个随机变量服从正是独立同分布变量,:设定理nNnXnNXXXniin221221,X,1X).,(.,3 . 6这个定理说明了:对于这个定理说明了:对于n个独立的且都服从相个独立的且都服从相同的正态分布的随机变量而言,它们的均值仍同的正态分布的随机变量而言,它们的均值仍然服从正态分布,所改变的只是分布的参数。然服从正态分布,所改变的只是

6、分布的参数。 定理定理6.3得出得出1111111()()()nnnniiiiiiiE XEXEXEXnnnn 22222111111()()()()nnniiiiiinD XDXDXD Xnnnnn 22iiii2i6.4,.,.011t2Lindeberg-LevyntixiXXxXnPxed1n定理()设X是独立同分布的随机变量,而且E(X )、D(X)存在,D(X) ,则对一切 有E(X )limD中心极限定n理(X)ii()(),D XE Xn这个定理说明了:当n充分大时, X近似服从参数为的正态分布。6.2 点估计点估计1 1. .若若参参数数的的估估计计量量满满足足E E(),

7、则则称称是是的的无无偏偏性性 无无偏偏估估计计。一、点估计量的评价准则一、点估计量的评价准则无偏性、有效性、最小均方误差、一致性无偏性、有效性、最小均方误差、一致性 简单随机样本的样本均值是总体期望的无偏估计简单随机样本的样本均值是总体期望的无偏估计.简单随机样本的样本方差是总体方差的无偏估计简单随机样本的样本方差是总体方差的无偏估计2221111()() )() 11nniiiiE SEXXEXXnn()D X22212,1()()()1()()nnininSXXE SD XnnE SD Xn如果统计量为则此时,1111()()()()()niniiiXE XEE XnE XE Xnnn12

8、()()EE1 1抽抽样样分分布布2 2抽抽样样分分布布估计量估计量总体参数总体参数12121212比比更更紧紧密密地地分分布布在在总总体体参参数数周周围围, , 比比有有效效. . 1 12 22 22 21 12 21 12 2: :若若参参数数, , 都都是是参参数数 的的估估计计量量,但但有有关关系系式式E E()E E()2 2. .有有效效,则则称称比比性性无无偏偏有有效效。评价估计量好坏的标准评价估计量好坏的标准 无偏比有偏好无偏比有偏好 方差小的好方差小的好1 12 21 12 2如如果果E E( () )= =, ,E E( () ), ,但但D D( () ) D D( (

9、) ) 怎么办?12121212如如果果E(E()=)=,E(,E() ), ,但但D(D() D() D(),),这这时时可可以以用用估估计计量量的的均均方方误误差差(MSEMSE)为为评评价价准准则则。具有最小的均方误差的估计量是最优的估计量具有最小的均方误差的估计量是最优的估计量( )2D2E(-E( )E()-)-(E( )MSE22=E -E( )+E( )-E()最小均方误差最小均方误差( )D22E() )-E2( )( )DBias3.最小均方误差MSE若有:若有:1222E() ()1的抽样分布(无偏估计量)2的抽样分布(有偏的估计量)33的抽样分布(Var()最小)1E(

10、)2E( )3E( )3()Bias估计量估计量总体参数总体参数132为无偏估计量,的方差最小,但MSE()最小4.一致性一致性0,lim 1xP当样本容量趋于无穷大时,若估计量依概率收敛于待估参数 ,即对任意有则称 为 的一致估计量。二、点估计方法二、点估计方法 如果在参数的估计中直接用样本估计量之数值作为如果在参数的估计中直接用样本估计量之数值作为待估总体参数的估计量,就是参数的点估计。待估总体参数的估计量,就是参数的点估计。 点估计方法:点估计方法:(1)极大似然估计)极大似然估计(MLE)(2)矩估计法)矩估计法求极大似然估计量的步骤求极大似然估计量的步骤:; );();,()();(

11、);,()( )(121121 niinniinxfxxxLLxpxxxLL或或写写出出似似然然函函数数一一; );(ln)(ln);(ln)(ln )(11 niiniixfLxpL或或取对数取对数二二极大似然估计法是由费舍尔引进的极大似然估计法是由费舍尔引进的., 0d)(lnd,d)(lnd )( 的的最最大大似似然然估估计计值值解解方方程程即即得得未未知知参参数数并并令令求求导导对对三三 LL 最大似然估计法也适用于分布中含有多个最大似然估计法也适用于分布中含有多个未知参数的情况未知参数的情况. 此时只需令此时只需令., 2 , 1, 0lnkiLi .), 2 , 1( ,iikik

12、 的的最最大大似似然然估估计计值值数数即即可可得得各各未未知知参参个个方方程程组组成成的的方方程程组组解解出出由由 对数似然方程组对数似然方程组对数似对数似然方程然方程矩估计法矩估计法2 21 12 2n n设设x x , ,x x . . . . . .x x 是是N N( (,) )的的一一个个样样本本,根根据据知知道道,因因此此用用样样本本的的,用用样样本本的的大大数数定定律律样样本本k k阶阶矩矩依依概概率率收收敛敛于于总总体体的的k k阶阶矩矩一一阶阶原原点点矩矩估估计计总总体体的的均均值值二二阶阶原原用用样样本本点点矩矩估估计计总总体体的的二二阶阶原原点点矩矩, ,L L, ,k

13、k阶阶原原点点矩矩估估计计总总体体的的的的k k阶阶原原点点矩矩。222221111,()nniiiixxxxxnn有有 与与的的估估 量量: : 011lim()1nkkiniPXXn PkkA 6.3 参数的区间估计参数的区间估计1,.,( ; )01,111nxxf xP 设设是是抽抽自自密密度度为为的的一一个个样样本本,对对给给定定的的如如能能求求得得统统计计量量 和和 ,使使 (),则则称称为为 的的置置信信度度为为的的。和和 均均是是样样本本估估计计量量 的的函函数数,被被称称为为 的的置置信信下下限限和和置置信信上上限限,表表示示区区间间估估计计的的可可靠靠程程度度,置置信信为为

14、显显为为置置信信区区度度间间著著性性水水平平。一、区间估计步骤一、区间估计步骤 1.确定待估参数和置信水平,置信度越高,置信区确定待估参数和置信水平,置信度越高,置信区间越大。间越大。 2.确定估计量,并找出估计量的抽样分布。估计量确定估计量,并找出估计量的抽样分布。估计量的方差越小,在相同置信水平下,置信区间越短,的方差越小,在相同置信水平下,置信区间越短,精度越高。精度越高。 3.利用估计量的抽样分布给出置信区间。利用估计量的抽样分布给出置信区间。二、总体期望值的区间估计二、总体期望值的区间估计 一、单个正态总体一、单个正态总体2 1 1. . 当当已已知知时时, 的的置置信信区区间间22

15、XZn的的1 1- -置信区间为:置信区间为:22(1)SXtnn的的1 1- -置信区间为:置信区间为:2 22 2. .当当未未知知时时,的的置置信信区区间间 置信度越高,置信区间越大。置信度越高,置信区间越大。 估计量的方差越小,在相同置信水平下,置信区间估计量的方差越小,在相同置信水平下,置信区间越短,精度越高。越短,精度越高。二、单个正态总体或总体分布未知二、单个正态总体或总体分布未知当当总总体体为为非非正正态态分分布布,或或不不知知总总体体分分布布形形式式时时,只只要要知知道道总总体体方方差差,根根据据Lindeberg-LevyLindeberg-Levy中中心心极极限限定定理理

16、,当当n n很很大大X-E(X)X-E(X)时时,统统计计量量近近似似服服从从正正态态分分布布D(X)D(X)n n例例6.15 6.15 设某金融机构共有设某金融机构共有80428042张应收帐单,根据过张应收帐单,根据过去记录,收有应收帐单的标准差为去记录,收有应收帐单的标准差为3033.43033.4元。现随元。现随机抽查了机抽查了250250张应收帐单,得平均收款为张应收帐单,得平均收款为33193319元,求元,求9898置信水平的平均应收款。置信水平的平均应收款。p205p2052 22 22 22 2解解:已已知知X X3 33 31 19 9元元,n n2 25 50 0,1

17、1- -0 0. .9 98 8, 3 30 03 33 3. .4 4X X近近似似服服从从正正态态分分布布, 置置信信 X X - -Z Z, ,X X区区间间为为:+ +Z Z n nn n三、两个正态总体均值之差的估计三、两个正态总体均值之差的估计12121212121212121212121212122222121222221212222212121 112122 21.1.两两个个正正态态总总体体,且且取取X -XX -X 作作为为 - -的的点点估估计计量量,有有E(X -X )=E(X -X )= - -,D(X -X )=+,D(X -X )=+nnnn(X -X )-(X

18、-X )- ( - -和和已已知知, ,)则则N(0, 1)N(0, 1)+ +nnnn1 12 22 22 22 22 21 12 21 12 21 12 21 12 22 22 21 12 21 12 2 - -置置信信区区间间为为:X X - - X X - - Z Z+ +, ,X X - - X X + + Z Z+ +n nn nn nn n2 22 21 12 22 2. .两两个个正正态态总总体体,总总体体方方差差未未知知,但但已已知知12121212121212121212w w1212取取X -XX -X 为为 - -的的点点估估计计量量,则则(X -XX -X ) - -

19、 ( - -)t(n +n -2)t(n +n -2)1111S+S+nnnn1212121212w12w2 21212121212w12w2 21212可可得得 - -的的置置信信区区间间为为:1111X -X -t (n +n -2)S+,X -X -t (n +n -2)S+,nnnn1111X -X +t (n +n -2)S+X -X +t (n +n -2)S+nnnn222112212(1)(1)2nSnSnnwS3.任意两个总体,且未知总体方差任意两个总体,且未知总体方差 此问题的解决方法是,增大样本容量,因为当样本容量此问题的解决方法是,增大样本容量,因为当样本容量足够大时,

20、统计量服从标准正态分布。足够大时,统计量服从标准正态分布。22111222()()SSXXnn近近似似服服从从标标准准正正态态分分布布四、总体比例的区间估计四、总体比例的区间估计样本比例的抽样分布样本比例的抽样分布已已知知在在n n重重贝贝努努里里试试验验中中,X X表表示示某某种种事事件件发发生生的的次次数数,X X即即为为事事件件在在n n次次试试验验中中出出现现的的频频率率,即即比比例例。n nX XX X服服从从二二项项分分布布,显显然然也也服服从从二二项项分分布布。n n2222X11X11可可以以得得到到数数学学期期望望和和方方差差:E( )=E(X)=nP = PE( )=E(X

21、)=nP = PnnnnnnX111X111D( )=D(X)=nP(1-P)=P(1-P)D( )=D(X)=nP(1-P)=P(1-P)nnnnnnnn1.单个总体比例的区间估计单个总体比例的区间估计N很大时,即很大时,即np5且且nq5时,二项分布可用正态分时,二项分布可用正态分布近似求解布近似求解.X X1 1所所以以: N N( (P P, , P P( (1 1- -P P) ) )n nn n当试验足够多次时,有样本比例p0,11ppZNppn 可以得到总体比例的置信区间可以得到总体比例的置信区间 由于在估计总体比例时,总体比例由于在估计总体比例时,总体比例P是未知数,可是未知数

22、,可以用样本比例代替。以用样本比例代替。22(1)(1),PPPPpZpZnn例例6.15 6.15 某电视台希望了解每日某电视台希望了解每日“晚间新闻晚间新闻”栏目的栏目的收视率,随机抽取了收视率,随机抽取了400400人进行调查,结果表明了有人进行调查,结果表明了有71.271.2的人观看了此节目,试估计该栏目收视率具有的人观看了此节目,试估计该栏目收视率具有9090可靠性的置信区间。可靠性的置信区间。2 22 2解解:因因为为n n4 40 00 0, p p = = 7 71 1. .2 2% %, ,n np p = = 2 28 88 8. .4 4 5 5且且n n( (1 1-

23、 - p p) )= =1 11 11 1. .6 6 5 5所所以以置置信信区区间间为为:p p( (1 1- - p p) )p p( (1 1- - p p) )p p- -Z Z, ,p p+ +Z Zn nn n= =( (0 0. .6 67 74 48 8, ,0 0. .7 74 49 92 2) )3.两个总体比例之差的区间估计两个总体比例之差的区间估计12121212121211221212121122121212,()()()(1)(1)()()()(1)(1)(,)PPPPPPE PPE PE PPPPPPPD PPD PD PnnPPPPPPN PPnn利用来估计总体

24、比例的分布为:11221212212112212212(1)(1)(,(1)(1)PPPPPPPPZnnPPPPPPZnn于是的置信区间为:2 21 1. .正正态态分分布布总总体体方方差差的的区区间间估估计计2 22 22 22 222222 21-1-222222222 222221-1-2222(n-1n-1)S S已已知知统统计计量量 (n-1),(n-1),对对于于给给定定的的置置信信度度1-1-, ,(n-1n-1)S S有有:P:P (n-1)(n-1) (n-1) =1-(n-1) =1-(n-1n-1)S S(n-1n-1)S SPP =1-=1-五、总体方差的区间估计五、总

25、体方差的区间估计22122.两正态总体方差比的区间估计221222122122212122221222SSFSSSS 1 11 12 22 2来来自自独独立立的的两两个个正正态态分分布布总总体体的的总总体体方方差差,和和样样本本方方差差和和,可可构构造造服服从从分分布布的的统统计计量量为为:( (n n - - 1 1) ) / /( (n n - - 1 1) )Y Y = =( (n n - - 1 1) ) / /( (n n - - 1 1) )22212212222111222222()()()()11()()SSSSSS 121212121-1-2222121212121-1-22

26、22121212121-1-2222P Fn -1, n -1YFn -1, n -1=1-P Fn -1, n -1YFn -1, n -1=1-所所以以:P Fn -1, n -1Fn -1, n -1P Fn -1, n -1Fn -1, n -1P=1-P=1-Fn -1, n -1Fn -1, n -1Fn -1, n -1Fn -1, n -12 22 21 12 2所所以以两两正正态态总总体体方方差差比比 的的置置信信区区间间为为:2211222211()()SSSS12121-22,Fn -1,n -1Fn -1,n -1()122F n-1,n -1()121-2Fn-1,n

27、-1()12F n -1,n -1126.4 样本容量的确定样本容量的确定如如果果估估计计的的可可靠靠程程度度( (1 1- -) ) , ,则则置置信信区区间间 ( (- - ) ) 抽抽样样误误如如果果要要使使抽抽样样误误差差- - ,则则可可靠靠程程度度抽抽样样误误差差- -,是是由由样样本本的的随随机机误误差差造造成成的的。在在样样本本容容量量n n确确定定的的情情况况下下: :所所以以可可靠靠程程度度( (1 1- -) )不不变变,而而抽抽样样误误差差差差( (- - , ,- - 则则样样1 1- -) ) , ,本本容容量量n n样本容量样本容量n的增大,要受到人力、物力、时间

28、及总体的增大,要受到人力、物力、时间及总体条件等因素限制条件等因素限制根据需要来确定最佳的样本容量。根据需要来确定最佳的样本容量。决定样本容量的因素决定样本容量的因素 总体变异程度总体变异程度 允许误差(允许误差( )大小)大小 可靠性高低可靠性高低其他条件不变的情况下,方差大的总体,选择大的样其他条件不变的情况下,方差大的总体,选择大的样本容量;方差小的总体,选择小的样本容量。本容量;方差小的总体,选择小的样本容量。高精确度估计,允许误差小,选择大的样本容量;低高精确度估计,允许误差小,选择大的样本容量;低精确度估计,允许误差大,选择小的样本容量;精确度估计,允许误差大,选择小的样本容量;可

29、靠性高,样本容量大;可靠性低,样本容量小可靠性高,样本容量大;可靠性低,样本容量小简单随机样本容量的确定简单随机样本容量的确定 1.估计总体均值时的样本容量估计总体均值时的样本容量X X2 22 2X X2 22 22 2X X设设 = = X X- -为为样样本本均均值值与与总总体体参参数数间间的的允允许许抽抽样样误误差差,则则已已知知总总体体方方差差,1 1- -置置信信度度时时,置置信信区区间间为为: X X- -Z Z X X+ +Z Zn nn n于于是是有有: = = X X- -Z Zn nZ Z 解解得得:n n()样本均值与总体参数样本均值与总体参数的抽样误差的抽样误差 以上

30、是假定抽样方式为放回抽样的计算公式,若以上是假定抽样方式为放回抽样的计算公式,若抽样为不放回抽样,则须考虑抽样为不放回抽样,则须考虑“修正因子修正因子” 此时的总体均值区间估计的极限误差为:此时的总体均值区间估计的极限误差为:n1NN/2,1NnrZNn22/2222/2()(1)()N ZnNrZ故样本容量为: 2.估计总体比例时的样本容量估计总体比例时的样本容量2P PP P2 22 22 2P P设设 = = p p- -P P 为为允允许许抽抽样样误误差差,则则1 1- -置置信信度度时时,P P( (1 1- -P P) )有有: = = p p- -P P = = Z Zn nZ Z P P( (1 1- -P P) )解解得得:n n()5.5 假设检验假设检验 单个总体均值和方差的假设检验单个总体均值和方差的假设检验 两个总体均值和方差的假设检验两个总体均值和方差的假设检验 总体比例的假设检验总体比例的假设检验第七章第七章 参数的假设检验参数的假设检验7.1 假设检验的基本原理和步骤假设检验的基本原理和步骤7.2 单个总体均值的假设检验单个总体均值的假设检验7.3 两个总体均值的假设检验两个总体均值的假设检验7.4 总体比例的假设检验总体比例的假设检验7.5 总体方差的假设检验总体方差的假设检验7.6 统计检验力统计检验力7.4 总体比例的假设检验总

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论