第6章抽样分布与参数估计课件_第1页
第6章抽样分布与参数估计课件_第2页
第6章抽样分布与参数估计课件_第3页
第6章抽样分布与参数估计课件_第4页
第6章抽样分布与参数估计课件_第5页
已阅读5页,还剩139页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第6章抽样分布与参数估计课件1第6章抽样分布与参数估计6.1抽样分布6.3单一总体参数的区间估计6.1.1总体、个体和样本6.3.1总体均值的区间估计

6.1.2大数定律和中心极限定理6.3.2总体比例的区间估

6.1.3三种分布6.3.3总体方差的区间估计

6.1.4样本均值的抽样分布6.4两个总体参数的区间估计

6.1.5样本比例的抽样分布6.4.1两个总体均值之差的6.1.6样本方差的抽样分布区间估计

6.1.7两个总体样本统计量的抽样分布6.4.2两个总体比例之差的

6.2参数估计的一般问题

区间估计

6.2.1估计量和估计值6.4.3两个总体方差比值的

6.2.2点估计区间估计

6.2.3点估计量的评价准则6.2.4区间估计/1:18AM11:33AM第6章抽样分布与参数估计6.1抽样分布2第6章抽样分布与参数估计

6.1抽样分布《统计学教程》卢小广第6章抽样分布与参数估计

6.1抽样分布《统计学教程》3《统计学教程》

第6章抽样分布与参数估计

6.1抽样分布6.1.1总体、个体和样本总体(Population)是指所研究的事物及其现象的全体,由该事物及其现象的全部个体组成。个体(ItemUnit)是指构成总体的元素。总体容量(PopulationSize)是指构成总体的全部个体的数量。样本(Sample)是指从总体抽取的若干个体构成的集合。抽样(Sampling)是指按照具体的抽样方法和抽样设计,从总体中抽取若干个体的过程。样本容量(Samplesize)是指构成样本的全部个体的数量。

/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计64《统计学教程》

第6章抽样分布与参数估计

6.1抽样分布6.1.1总体、个体和样本总体(Population)是指所研究的事物及其现象的全体,由该事物及其现象的全部个体组成。个体(ItemUnit)是指构成总体的元素。总体容量(PopulationSize)是指构成总体的全部个体的数量。样本(Sample)是指从总体抽取的若干个体构成的集合。抽样(Sampling)是指按照具体的抽样方法和抽样设计,从总体中抽取若干个体的过程。样本容量(Samplesize)是指构成样本的全部个体的数量。★讨论题请用经济管理中的实例,解释上述的总体、个体和样本等概念。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计65《统计学教程》

第6章抽样分布与参数估计

6.1抽样分布6.1.2大数定律和中心极限定理1.大数定律在对客观事物及其现象进行观测和实验中,随着观测或实验的次数增多,事件发生的频率和均值逐渐地趋于某个常数。(1)贝努利定理(BernoulliTheorem)(6.1)

贝努利定理表明事件发生的频率依概率收敛于事件发生的概率。从而以严格的数学形式表述了频率的稳定性特征,即n当很大时,事件发生的频率与概率之间出现较大的偏差的可能性很小。由此,在n充分大的场合,可以用事件发生的频率来替代事件的概率。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计66《统计学教程》

第6章抽样分布与参数估计

6.1抽样分布(2)车比雪夫定理(ChebyshevTheorem)设随机变量相互独立,且具有相同的有限的数学期望和方差,对于任意正整数有(6.2)称序列依概率收敛于总体均值。即当n充分大时,车比雪夫不等式几乎都是成立的;当n趋于无穷大时,n个随机变量的均值趋于总体均值。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计67《统计学教程》

第6章抽样分布与参数估计

6.1抽样分布2.中心极限定理在客观现实中,有许多随机变量是由大量的相互独立的随机因素的综合影响而形成的,任何一个因素在总的影响中的作用都是微小的,这种随机变量往往近似地服从正态分布。中心极限定理(CentralLimitTheorem)反映了随机变量近似地服从正态分布的特征。中心极限定理是大样本推断的理论基础。独立同分布的中心极限定理是应用最多的一种中心极限定理。设随机变量相互独立,服从同一分布,且具有相同的有限的数学期望和方差,则(6.3)/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计68《统计学教程》

第6章抽样分布与参数估计

6.1抽样分布2.中心极限定理在客观现实中,有许多随机变量是由大量的相互独立的随机因素的综合影响而形成的,任何一个因素在总的影响中的作用都是微小的,这种随机变量往往近似地服从正态分布。中心极限定理(CentralLimitTheorem)反映了随机变量近似地服从正态分布的特征。中心极限定理是大样本推断的理论基础。独立同分布的中心极限定理是应用最多的一种中心极限定理。设随机变量相互独立,服从同一分布,且具有相同的有限的数学期望和方差,则(6.3)★讨论题大数定律和中心极限定理对于参数估计的意义。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计69《统计学教程》

第6章抽样分布与参数估计

6.1抽样分布6.1.3三种分布1.总体分布总体分布(PopulationDistribution)是指由客观存在的,构成总体的个体所形成的频数分布,及其相关参数数值。例如,当研究某一企业职工收入情况时,该企业全体职工的收入状况的频数分布,以及反映该企业全体职工收入状况的均值、方差、偏态系数和峰度系数,从不同角度综合描述了这一总体的分布特征。我们往往是通过对构成总体的部分个体进行观察,即通过样本数据计算的统计量,例如样本均值、样本方差、样本偏态系数和样本峰度系数,以及样本的频数分布来推断总体参数,用样本分布来估计总体分布。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计610《统计学教程》

第6章抽样分布与参数估计

6.1抽样分布2.样本分布样本分布(SampleDistribution)是指由构成样本的个体所形成样本的频数分布,以及计算出来的相关统计量。样本中的个体都是来自于总体,具有总体的相关信息和基本特征,样本分布是总体分布的一个映象,一个缩影。当样本容量充分大时,样本分布趋近于总体分布。

样本分布是指某一个具体的样本中的个体数量特征。由于样本是随机抽取的,每一次抽取的样本中的个体不尽相同,每一个具体的样本分布也会与对应的总体分布存在或大或小的偏误,根据样本计算的统计量是随机变量。(随机抽取的)样本的分布与客观的总体分布之间的误差,需要借助抽样分布概念。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计611《统计学教程》

第6章抽样分布与参数估计

6.1抽样分布3.抽样分布抽样分布(SamplingDistribution)是指从同分布总体中,独立抽取的相同样本容量的样本统计量的概率分布。所以,抽样分布是样本分布的概率分布,抽样分布是抽样理论的研究对象。抽样分布反映了依据样本计算出来的统计量数值的概率分布,这是科学地进行统计推断的基础。例如,在大样本场合,由中心极限定理有样本均值趋于正态分布。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计612《统计学教程》

第6章抽样分布与参数估计

6.1抽样分布3.抽样分布抽样分布(SamplingDistribution)是指从同分布总体中,独立抽取的相同样本容量的样本统计量的概率分布。所以,抽样分布是样本分布的概率分布,抽样分布是抽样理论的研究对象。抽样分布反映了依据样本计算出来的统计量数值的概率分布,这是科学地进行统计推断的基础。例如,在大样本场合,由中心极限定理有样本均值趋于正态分布。★讨论题为什么说抽样分布是抽样理论研究的对象,解释三种分布之间的联系。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计613《统计学教程》

第6章抽样分布与参数估计

6.1抽样分布6.1.4样本均值的抽样分布1.大样本场合下的样本均值抽样分布在反复抽取容量相同的独立同分布样本条件下,所得到的样本均值的概率分布称为样本均值的抽样分布。在样本容量充分大的情况下,即大样本场合,样本均值依据中心极限定理趋于正态分布。所谓独立同分布样本为从无限总体中随机抽取的等概样本,或从有限总体中以放回方式,随机抽取的等概样本。所谓大样本是指能够满足中心极限定理要求,使样本均值趋于正态分布的样本容量。在统计实践中一般称样本容量大于30即为大样本这只是一个粗略的经验数值。有离散变量样本均值的计算公式(6.4)

/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计614《统计学教程》

第6章抽样分布与参数估计

6.1抽样分布在样本容量充分大的场合下,样本均值渐进地趋于数学期望为总体均值,方差为总体方差的n分之一的正态分布,即样本均值的数学期望为总体均值,表明从平均的观点来看,用样本均值估计总体均值不存在偏差,即具有无偏性;样本均值的方差为总体方差的n分之一,表明只要总体方差是有限的,那么随着样本容量的增大,样本均值的方差相应减小,用样本均值估计总体均值的误差也相应减小。同时可以由总体方差和样本容量,精确地计算出这一样本均值的方差,并且用这一样本方差度量使用样本均值估计总体均值的误差。通过对样本均值的标准化处理,在用样本均值估计总体均值时,可以使用标准正态分布来计算抽样误差出现的概率。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计615《统计学教程》

第6章抽样分布与参数估计

6.1抽样分布例6.1在一次研究某一企业职工收入情况的调查中,准备从该企业随机抽取100个职工个人的收入状况数据构成样本,以此推断该企业职工平均月收入。要求若该企业职工平均月收入的总体均值为2000元,总体标准差为为250元,试计算样本均值不小于1950元的概率。解根据中心极限定理,在样本容量充分大时,样本均值渐进地趋于数学期望为总体均值,方差为总体方差的n分之一的正态分布,有本例的样本均值渐进地趋于数学期望为2000元,标准差为25的正态分布,即。代入正态分布概率计算公式,得即样本均值不小于1950元的概率为97.7%。(查表,教材324页)

/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计616《统计学教程》

第6章抽样分布与参数估计

6.1抽样分布2.小样本场合下的样本均值抽样分布在小样本场合,不满足中心极限定理对于样本容量充分大的要求,样本均值不趋于正态分布,而是趋于t分布。统计学家戈斯特(W.S.Gosset1876-1936)在1908年以Student的笔名发表的一篇论文中,首次提出了t分布,从而这一小样本分布理论被称为Student分布,简称为t分布。设为来自正态分布总体的样本,有

(6.5)为T统计量,T统计量服从于自由度为n-1的t分布。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计617《统计学教程》

第6章抽样分布与参数估计

6.1抽样分布式(6.5)中的s2表示样本方差,有(6.6)式(6.6)存在着一个线性约束,T统计量服从自由度n-1为的t分布。t分布的形状也是一左右对称的钟形图形,比正态分布扁平,并且受到自由度数值大小的约束,自由度的数值越小,t分布越趋于扁平;自由度的数值越大,t分布扁平的程度越小,并且随着自由度的数值增大,t分布的形态逐渐趋于正态分布。t分布的应用条件是总体服从正态分布。在总体方差未知时,t分布是一种精确的估计方法,正态分布只是其近似的概率分布。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计618《统计学教程》

第6章抽样分布与参数估计

6.1抽样分布例6.2假定某一企业职工收入情况服从正态分布中,从该企业随机抽取了16个职工个人的收入状况数据构成样本,拟以此推断该企业职工平均月收入。要求若该企业职工平均月收入的总体均值为2000元,样本标准差为为250元,试计算样本均值不小于1950元的近似概率。解由于样本容量小于30,为小样本,此时的样本均值服从于t分布。并且,已知样本容量为16,因此本例的样本均值服从于自由度为15的t分布。有即在样本容量仅为16的小样本条件下,该次调查的样本均值不小于1950元的概率为78.19%。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计619《统计学教程》

第6章抽样分布与参数估计

6.1抽样分布6.1.5样本比例的抽样分布所谓的总体比例是指总体中具有某一属性的单位数与总体全部单位数的比例。样本比例抽样分布为在服从二项分布的总体中,重复抽取样本容量为的样本时,由样本比例的所有可能取值形成的相对频数分布。样本比例的抽样分布就是样本比例的所有可能取值的概率分布。在大样本场合,样本比例的抽样分布渐进地趋于正态分布。即

(6.7)样本比例的方差为

(6.8)即有,在大样本下样本比例渐进地服从于

/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计620《统计学教程》

第6章抽样分布与参数估计

6.1抽样分布6.1.6样本方差的抽样分布在反复抽取容量相同的独立同分布样本条件下,所得到的样本方差的概率分布称为样本方差的抽样分布。在服从正态分布的同分布总体中,样本方差与总体方差的比值服从于自由度n-1为的卡方分布。即(6.9)卡方分布仅在第一象限取值,所以分布的取值永远为正数。卡方分布一般为右偏态的偏峰分布,偏倚形态取决于其自由度的数值,自由度的数值越小,偏倚的程度越大,并且随着自由度的数值增大,分布的形态逐渐趋于对称,正态分布是卡方分布的极限分布。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计621《统计学教程》

第6章抽样分布与参数估计

6.1抽样分布6.1.7两个总体样本统计量的抽样分布1.两个样本均值之差的抽样分布在两个总体中,各自独立地反复抽取样本容量分别为和的独立同分布样本条件下,所得到的两个样本均值和之差的概率分布称为两个样本均值之差的抽样分布。在大样本场合,两个样本均值之差依据中心极限定理趋于正态分布。由于两个样本均值之差的数学期望为两个总体均值之差,即(6.10)

/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计622《统计学教程》

第6章抽样分布与参数估计

6.1抽样分布两个样本均值之差的方差为这两个样本均值方差之和,有

(6.11)因此,这样的两个样本均值之差的抽样分布为(6.12)

/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计623《统计学教程》

第6章抽样分布与参数估计

6.1抽样分布2.两个样本比例之差的抽样分布两个样本比例之差的抽样分布是指在两个服从二项分布的总体中,各自独立地反复抽取样本容量分别为和的独立同分布样本条件下,由所得到的两个样本比例和之差的所有可能取值形成的相对频数分布。在两个样本均为大样本的场合下,两个样本比例之差的抽样分布渐进地趋于正态分布。这时有两个样本比例之差的数学期望等于两个总体比例之差,即(6.15)方差为

(6.16)/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计624《统计学教程》

第6章抽样分布与参数估计

6.1抽样分布3.两个样本方差比值的抽样分布在两个正态总体中,各自独立地反复抽取样本容量分别为和的独立同分布样本条件下,所得到的两个样本方差和比值的概率分布称为两个样本方差比值的抽样分布。两个样本方差比值的抽样分布服从于F分布。F分布在形式上为两个独立的卡方分布除以各自自由度的比值。由式(6.9)可以给出两个样本方差和的卡方分布,再计算出这两者的比值,即得到F统计量。(6.17)

/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计625第6章抽样分布与参数估计

6.2参数估计的一般问题《统计学教程》卢小广第6章抽样分布与参数估计

6.2参数估计的一般问题《统26《统计学教程》

第6章抽样分布与参数估计

6.2参数估计的一般问题6.2.1估计量和估计值1.估计量估计量(Estimator)是指用于估计相关的总体参数的统计量。样本均值、样本比例和样本方差都是估计量。2.估计值估计值(Estimate)是指估计量的具体数值。例如,通过样本的数据,按照相关估计量的计算公式,所得出的样本均值、样本比例和样本方差的具体数值就是估计值。参数估计(ParameterEstimation)就是在样本数据的基础上,计算估计量的具体数值——估计值,去推断相关的总体参数的方法和过程。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计627《统计学教程》

第6章抽样分布与参数估计

6.2参数估计的一般问题6.2.2点估计点估计(PointEstimate)是指用估计量的数值直接作为总体参数的估计值的方法和过程。在总体分布形式为已知,从该总体中抽取一个样本,对未知参数所作的一个数值点的估计,称为参数的点估计。点估计的方法有矩估计法、顺序统计量法、最大似然法和最小二乘法等。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计628《统计学教程》

第6章抽样分布与参数估计

6.2参数估计的一般问题矩估计法矩估计法(MethodsofMomentEstimation)是指用样本的矩,估计总体的矩的参数估计方法。矩是在数学期望基础上定义的数字特征,可以分为k阶原点矩和k阶中心矩两类。(1)k阶原点矩(MomentofOrderKAbouttheOrigin)是指随机变量的k次方的数学期望,其中k为任意正整数,写为(6.18)一阶原点矩就是随机变量的数学期望.(2)k阶中心矩(CentredMomentofOrderk)是指随机变量与其数学期望之差的k次方的数学期望,其中k为任意正整数,写为(6.19)二阶中心矩就是随机变量的方差./1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计629《统计学教程》

第6章抽样分布与参数估计

6.2参数估计的一般问题6.2.3点估计量的评价准则在参数的点估计中,可以从一致性、无偏性和有效性三个方面对点估计量进行评价。1.一致性一致性(Consistency)是指当样本容量趋于无穷大时,估计量依概率收敛于总体参数。即

(6.25)则称为的满足一致性准则的估计量,一般称之为一致估计量。一致估计量随着样本容量的增大,其数值越来越接近被估计的总体参数。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计630《统计学教程》

第6章抽样分布与参数估计

6.2参数估计的一般问题2.无偏性无偏性(Unbiasedness)是指估计量的数学期望等于未知的总体参数真值。即

(6.26)则称为的满足无偏性准则的估计量,一般称之为无偏估计量。样本均值是总体均值的一个无偏估计量。

(6.27)/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计631《统计学教程》

第6章抽样分布与参数估计

6.2参数估计的一般问题2.无偏性无偏性(Unbiasedness)是指估计量的数学期望等于未知的总体参数真值。即

(6.26)则称为的满足无偏性准则的估计量,一般称之为无偏估计量。样本均值是总体均值的一个无偏估计量。

(6.27)★讨论题总体方差的最大似然估计量和矩估计量是否均为无偏估计量。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计632《统计学教程》

第6章抽样分布与参数估计

6.2参数估计的一般问题3.有效性有效性(Effectiveness)是指采用均方误差对估计量精确程度的测定,通常表现为两个估计量的均方误差之比。均方误差就是一个测定估计量本身的离散程度,以及估计量数学期望与总体相关参数的真值的偏倚程度的测度。均方误差(MeanSquareError)是估计量与总体参数真值的离差的平方的数学期望,有(6.28)若将估计量的数学期望与总体参数真值的离差记为,称为估计量的偏差,作为反映估计量与总体参数真值偏倚程度的测度。则可将式(6.23)写为

(6.29)/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计633《统计学教程》

第6章抽样分布与参数估计

6.2参数估计的一般问题均方误差是由估计量的方差和偏差两部分组成。其中估计量的方差反映的是估计量本身的离散程度;估计量的偏差反映的是估计量的数学期望与总体参数真值的偏倚程度。当两个估计量均为无偏估计量时,均方误差的式(6.29)中的第二项为0,只剩下第一项估计量的方差。这时只要比较估计量的方差就可以对其有效性进行评价。从计算均方误差的式(6.29)可知,对于一个估计量的评价,需要综合分析它对于相关总体参数的估计误差,不能简单地认为一个无偏的估计量就一定优于一个有偏的估计量,还要具体度量有偏估计量的偏倚程度,以及两个估计量的有效性。所以,有效性是评价估计量的一个综合性的重要的准则。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计634《统计学教程》

第6章抽样分布与参数估计

6.2参数估计的一般问题6.2.4区间估计区间估计(IntervalEstimate)是在点估计的基础上,给出在一定的置信程度下确定总体参数取值区间的方法和过程。在点估计中,总体参数估计量的具体取值为一数值点,而样本是从总体中随机地抽取出来的,其估计值是依抽样分布的随机变量,单一的数值点不能全面反映抽样分布的状态,及其样本估计量的随机分布特征,不能度量样本估计的精确程度,所以提出了区间估计问题。建立在点估计基础上的区间估计,在给出了相关总体参数真值的估计量的同时,还给出了一个通常以取值区间形式表述的数值范围,以及在这个数值区间内包含总体参数的可靠程度。这种形式的参数估计就称为区间估计。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计635《统计学教程》

第6章抽样分布与参数估计

6.2参数估计的一般问题/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计636《统计学教程》

第6章抽样分布与参数估计

6.2参数估计的一般问题在区间估计中,置信区间反映的是区间估计的精确程度,置信水平反映的是区间估计的可靠程度,对于某一样本容量已定的具体样本而言,这两方面是互为消长的。当通过缩小置信区间来提高对总体参数的估计精确程度时,就需要降低置信水平,降低对总体参数估计的可靠程度;若是要提高区间估计的可靠程度,势必会增大置信区间,降低对总体参数估计的精确程度。所以,需要根据具体情况和实际需要适当地选择置信水平的数值,进而确定置信区间。若既要提高区间估计的精确程度,又要提高区间估计的可靠程度,就需要采取增加样本容量,以及通过更有效的抽样和估计方法来实现。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计637第6章抽样分布与参数估计

6.3单一总体参数的区间估计《统计学教程》卢小广第6章抽样分布与参数估计

6.3单一总体参数的区间估计38《统计学教程》

第6章抽样分布与参数估计

6.3单一总体参数的区间估计6.3.1总体均值的区间估计1.在方差已知时,总体均值的区间估计在方差为已知时,样本均值服从于正态分布,因而构建Z统计量。有

(6.31)根据区间估计的定义,构造总体均值的双侧区间估计置信区间,对于给定的显著性水平,从式(6.30)和式(6.31)出发,有(6.32)/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计639《统计学教程》

第6章抽样分布与参数估计

6.3单一总体参数的区间估计则有总体均值的双侧区间估计置信区间为在对总体均值进行单侧区间估计时,有

(6.33)则总体均值的单侧区间估计置信区间为或者/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计640《统计学教程》

第6章抽样分布与参数估计

6.3单一总体参数的区间估计在式(6.32)和式(6.33)中出现的总体标准差与样本容量平方根的商,称为样本均值标准差,反映了样本均值分布的离散程度。有样本均值方差为

(6.34)样本均值方差含有总体方差和样本容量两个因素,它是在总体服从正态分布时,度量使用样本均值估计总体均值时精确程度的测度。由于样本均值标准差具有与变量一致的量纲,一般采用它作为度量估计量精确程度的测度。

/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计641《统计学教程》

第6章抽样分布与参数估计

6.3单一总体参数的区间估计例6.5在某一企业职工收入情况的调查中,从该企业随机抽取100个职工个人的收入状况数据构成样本,并且已知该企业职工平均月收入的总体标准差为250元,样本均值为1985元。要求试计算给定置信水平为95%的该企业职工平均月收入的总体均值的置信区间。解由本例给出的条件可知,这是一个双侧的区间估计问题。根据双侧区间估计的式(6.32),可计算得总体均值的置信区间为

即根据这次抽样调查的样本信息,可以认为该企业职工平均月收入的真实数值将依95%的概率落在1936元到2034元之间。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计642《统计学教程》

第6章抽样分布与参数估计

6.3单一总体参数的区间估计例6.6某地对在该地就业的本科生在毕业一年后的月工资情况进行了一次调查,搜集了36名同学的月工资数据,具体如表6.2所示。并已知在该地就业的本科生在毕业一年后的月工资的总体标准差为400元。表6.236名毕业一年本科生的月工资情况元由式(6.33),可计算得总体均值的置信区间为可以认为总体均值,即在该地就业的本科生在毕业一年后的月平均工资的真实数值依95%的概率落在2269.343元到2530.66元之间。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计643《统计学教程》

第6章抽样分布与参数估计

6.3单一总体参数的区间估计例6.7某进出口公司需要出口一批小型电机,其中有一个技术指标为电机工作时定子线圈的最高温度,已知供货厂家该厂电机工作时定子线圈最高温度的总体标准差为8℃,随机抽出49台电机进行实测,得到该厂电机工作时定子线圈最高温度的样本均值为110℃。要求试计算给定置信水平为99%的该厂电机工作时定子线圈最高温度的总体均值的置信区间。解采用式(6.33)计算在单侧区间估计下的置信水平为99%的总体均值的置信区间的上限。根据样本均值为110℃,可计算出该工厂单侧区间估计下的置信水平为99%的总体均值的置信区间的上限为可以认为总体均值,即该工厂电机工作时定子线圈的平均最高温度依99%的概率落在小于112.66℃的区间以内。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计644《统计学教程》

第6章抽样分布与参数估计

6.3单一总体参数的区间估计2.在总体方差未知时,总体均值的区间估计在总体服从正态分布,但是总体方差未知时,新的统计量是服从自由度为n-1的t分布的T统计量。有(6.35)由式(6.35)出发,则有在总体方差未知场合下,总体均值的双侧区间估计置信区间为以及在总体方差未知场合下,总体均值的单侧区间估计置信区间为或/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计645《统计学教程》

第6章抽样分布与参数估计

6.3单一总体参数的区间估计例6.8在一次对某品牌电视机的开关次数进行的破坏性测试中,随机抽取了9台电视机进行测试,具体数据为19050,18090,23098,18908,16896,20679,21567,17890,20456,试估计该品牌电视机开关次数的总体均值,及其在置信水平为95%下最低开关次数的单侧置信区间。可以得到总体均值的单侧区间估计置信区间为从而认为根据样本数据推断总体均值,即该品牌电视机的平均开关次数的真实数值将依95%的概率不低于18400次。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计646《统计学教程》

第6章抽样分布与参数估计

6.3单一总体参数的区间估计例6.9利用例6.6中36名同学的月工资数据,要求在总体方差未知情况下,估计该地就业的本科生毕业一年后的月平均工资在置信水平为95%下的置信区间。由式(6.35)可以得到总体均值的双侧区间估计置信区间为可以认为总体均值,即该地区毕业一年后的本科毕业生的月平均工资的真实数值将依95%的概率落在2262.32元到2537.68元之间。在总体方差未知的场合,当样本容量充分大时,可以采用式(6.31)建立统计量,对总体均值进行区间估计。假定样本均值已经服从正态分布的基础上,构造Z统计量,采用式(6.31)计算的总体均值的置信区间,要小于在样本均值服从t分布的基础上,采用式(6.35)计算的总体均值的置信区间。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计47《统计学教程》

第6章抽样分布与参数估计

6.3单一总体参数的区间估计6.3.2总体比例的区间估计在大样本场合,可以认为样本比例的抽样分布渐进地趋于正态分布。这时有样本比例渐进地服从于正态分布,其标准化后的随机变量渐进地服从标准正态分布。有(6.37)即有总体比例在显著性水平下的置信区间(6.38)一般采用样本比例替代总体比例来计算其在显著性水平下的置信区间。即

(6.39)

/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计648《统计学教程》

第6章抽样分布与参数估计

6.3单一总体参数的区间估计例6.10某公司为了分析新产品的电视广告效果,随机访问了100名用户,了解到其中有36人是通过电视广告了解该新产品的。要求试以95%的置信水平,估计通过电视广告了解该新产品的用户占全部用户的比例的置信区间。由式(6.37)得即通过电视广告了解该新产品的用户占全部用户的比例的置信区间,在95%的置信水平下为26.592%到45.408%。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计649《统计学教程》

第6章抽样分布与参数估计

6.3单一总体参数的区间估计6.3.3总体方差的区间估计在总体服从正态分布时,样本方差服从自由度为n-1的卡方分布,从而可以利用卡方分布来构造总体方差的置信区间,确定一个卡方值,使之对于给定的显著性水平,满足(6.40)则有(6.41)/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计650《统计学教程》

第6章抽样分布与参数估计

6.3单一总体参数的区间估计例6.11仍然利用例6.6中36名同学的月工资数据。要求估计该地就业的本科生在毕业一年后的月均工资标准差,在置信水平为95%下的置信区间。由式(6.41)可以得到总体方差的置信区间为可以认为该地就业的本科生在毕业一年后的月工资标准差将依95%的概率落在330.04元到530.79元之间。

/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计651第6章抽样分布与参数估计

6.4两个总体参数的区间估计《统计学教程》卢小广第6章抽样分布与参数估计

6.4两个总体参数的区间估计52《统计学教程》

第6章抽样分布与参数估计

6.4两个总体参数的区间估计6.4.1两个总体均值之差的区间估计1.两个总体方差已知情况下的估计在两个总体方差已知时,由两个这两个总体独立抽取的样本均值之差服从于正态分布,其标准差为(6.42)样本均值之差经标准化后,服从于标准正态分布。则有,两个总体均值之差在置信水平下的置信区间为(6.44)/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计653《统计学教程》

第6章抽样分布与参数估计

6.4两个总体参数的区间估计例6.12某进出口公司需要出口一批小型电机,在A、B两个备选的小型电机供货厂家进行了一次调查,在每家工厂随机抽出49台电机进行实测,并且A、B两厂电机工作时定子线圈最高温度的总体标准差数据为已知,其中A工厂为8℃,B工厂为6℃。要求试计算给定置信水平为99%的总体均值之差的置信区间。根据样本数据计算得样本均值分别为A工厂110℃,B工厂114℃。由式(6.44)可得即总体均值之差的置信区间为(-6.8,-1.2),即A、B两厂电机工作时定子线圈最高温度均值之差依95%的概率落在-6.8℃到-1.2℃以内。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计654《统计学教程》

第6章抽样分布与参数估计

6.4两个总体参数的区间估计2.两个相等总体方差未知情况下的估计在两个总体方差未知,但服从正态分布,并且方差相等,则利用两个随机样本的信息来联合计算这个相等而又未知的总体方差的估计量,为

(6.45)其总体均值之差在置信水平下的置信区间为(6.48)/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计655《统计学教程》

第6章抽样分布与参数估计

6.4两个总体参数的区间估计例6.13某市采取随机抽样方法,在全市抽取100户城镇家庭进行生活费支出调查,今年每户家庭生活费支出的样本均值为38900元,样本标准差为580元;上年每户家庭生活费支出的样本均值为35800元,样本标准差为570元。假定该市这两年城镇家庭生活费支出服从正态分布,并且方差相等。根据式(6.48),有

即总体均值之差在置信水平下的置信区间为(2939.64,3260.37)。该市这两年城镇家庭生活费支出均值之差,依95%的概率落在2939.64元到3260.37元的区间内。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计656《统计学教程》

第6章抽样分布与参数估计

6.4两个总体参数的区间估计3.两个总体方差不相等且未知情况下的估计若有两个均服从正态分布的总体,总体的方差未知,并且不相等,按照式(6.47)构造的统计量近似地服从于自由度为f的t分布。有(6.49)则有,两个服从正态分布的总体,总体方差未知且不相等,其总体均值之差在置信水平下的置信区间为(6.50)/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计657《统计学教程》

第6章抽样分布与参数估计

6.4两个总体参数的区间估计例6.14借用例6.13中的基本数据,只是假定该两市城镇家庭生活费支出服从正态分布,方差不相等。要求试计算该市这两年城镇家庭生活费支出均值之差,在95%置信水平下的置信区间。根据式(6.49),计算出样本均值之差近似地服从的t分布的自由度。即两个样本方差数值水平非常接近,所以计算出来的自由度与两个相等总体方差未知情况下的自由度基本一致,同为198。该市这两年城镇家庭生活费支出均值之差,在95%置信水平下的置信区间与例6.13在两个相等总体方差未知情况下计算的结果一致。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计658《统计学教程》

第6章抽样分布与参数估计

6.4两个总体参数的区间估计例6.15仍借用例6.13中的基本数据,但将该市上年每户家庭生活费支出的样本标准差改为410元,并且该市城镇家庭生活费支出服从正态分布,方差不相等。要求试求该市城镇家庭生活费支出均值之差的95%在置信水平下的置信区间。仍根据式(6.49),计算出样本均值之差近似地服从的t分布的自由度。即运用式(6.50),可得该市这两年城镇家庭生活费支出水平的均值之差,依95%的概率落在2959.83元到3240.17元的区间内。

/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计659《统计学教程》

第6章抽样分布与参数估计

6.4两个总体参数的区间估计在两个不相等的总体方差未知情况下,当样本容量和均很大时,不论总体是否服从正态分布,都可以依据中心极限定理,将两个样本方差和作为总体方差和的估计值,这时总体均值之差在置信水平下的置信区间近似为(6.51)例6.16采用例6.13中有关数据。要求试运用式(6.51),计算甲乙两市城镇家庭生活费支出均值之差,在95%置信水平下的置信区间。

甲乙两市城镇家庭生活费支出均值之差依95%的概率落在2940.62元到3259.38元的区间内。

/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计660《统计学教程》

第6章抽样分布与参数估计

6.4两个总体参数的区间估计6.4.2两个总体比例之差的区间估计在大样本的场合下,从两个服从二项分布的总体中得到的两个样本比例和之差的抽样分布渐进地趋于正态分布,其标准化后的随机变量渐进地服从标准正态分布。一般情况下,两个总体比例和为未知,采用样本比例替代总体比例,这时两个总体比例之差在显著性水平下的置信区间为(6.52)/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计661《统计学教程》

第6章抽样分布与参数估计

6.4两个总体参数的区间估计例6.17某公司为了分析新产品的电视广告效果,在A市随机访问了600名用户,其中有216人是通过电视广告了解该新产品的;在B市随机访问了500名用户,其中有120人是通过电视广告了解该新产品的。要求试以95%的置信水平估计A市与B市通过电视广告了解该新产品的用户占全部用户的比例之差的置信区间。由式(6.52)得即A市与B市通过电视广告了解该新产品的用户占全部用户比例之差的置信区间,在95%的置信水平下为6.64%到17.36%。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计662《统计学教程》

第6章抽样分布与参数估计

6.4两个总体参数的区间估计6.4.3两个总体方差比值的区间估计当这一比值趋近于1时,表明两个总体方差和的数值很接近;反之则表明两个总体方差和的数值存在较大差异。当两个均服从正态分布的总体的参数都为未知,有(6.53)可得出置信水平的两个总体方差比值的区间估计(6.55)/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计663《统计学教程》

第6章抽样分布与参数估计

6.4两个总体参数的区间估计例6.18假定某纺织厂织布车间停机台数服从正态分布。在工艺调整之前和调整之后,各抽取了容量为21和31的两个独立样本,计算得样本标准差为36和26。要求试计算工艺调整前后该企业织布车间停机台数方差之比,在置信水平为90%时的置信区间。由式(6.55)计算得

即该企业织布车间停机台数工艺调整前后方差之比依90%的概率落在0.9925到3.9093的区间内。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计664第6章抽样分布与参数估计

Excel应用《统计学教程》卢小广第6章抽样分布与参数估计

Excel应用《统计学教程》65《统计学教程》

第6章抽样分布与参数估计

Excel应用例6.19利用例6.6某地对在该地就业的本科生在毕业一年后的月工资情况的调查的数据中前18名毕业生的数值,进行相关的参数估计,假定该总体服从正态分布,具体数据如表6.2所示。表6.318名毕业一年本科生的月工资情况元要求(1)计算样本均值和样本标准差。(2)求给定置信水平为95%的总体均值的置信区间。(3)求给定置信水平为95%的总体方差的置信区间。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计E66《统计学教程》

第6章抽样分布与参数估计

Excel应用例6.20仍然利用例6.6某地对在该地就业的本科生在毕业一年后的月工资情况的调查的数据,假定前18名毕业生的数值和后18名毕业生的数值分别来自两个独立总体的样本,并且这两个总体均服从正态分布。要求

(1)假定这两个总体的方差相等,求给定置信水平为90%的两个总体均值之差的置信区间。(2)求给定置信水平为90%的两个总体方差之比的置信区间。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计E67第6章抽样分布与参数估计

小结与练习《统计学教程》卢小广第6章抽样分布与参数估计

小结与练习《统计学教程》68《统计学教程》

第6章抽样分布与参数估计

本章小结本章从抽样分布和参数估计两个角度,介绍了大数定律和中心极限定理,正态分布、t分布、卡方分布和F分布,总体参数的点估计和区间估计,以及点估计的一致性、无偏性和有效性,和不同条件下的区间估计方法。本章的重点是样本的抽样分布和总体参数的区间估计。本章的难点是大数定律和中心极限定理对于抽样分布和参数估计的意义,点估计量的评价准则和区间估计方法的正确运用。

/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计本69《统计学教程》

第6章抽样分布与参数估计

思考与练习

1、

什么是总体、样本、样本容量、估计量、估计值?2、

什么是点估计和区间估计?3、

什么是总体分布、样本分布和抽样分布?4、

什么是大数定律和中心极限定理?5、

样本均值和样本方差有那些分布?6、

什么是点估计的矩估计法和最大似然法?7、

什么是点估计量的一致性、无偏性和有效性?8、

解释置信区间和置信水平的联系。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计思70《统计学教程》

第6章抽样分布与参数估计

思考与练习

习题:教材160页9、12、13、15。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计思71谢谢各位!谢谢各位!72第6章抽样分布与参数估计课件73第6章抽样分布与参数估计6.1抽样分布6.3单一总体参数的区间估计6.1.1总体、个体和样本6.3.1总体均值的区间估计

6.1.2大数定律和中心极限定理6.3.2总体比例的区间估

6.1.3三种分布6.3.3总体方差的区间估计

6.1.4样本均值的抽样分布6.4两个总体参数的区间估计

6.1.5样本比例的抽样分布6.4.1两个总体均值之差的6.1.6样本方差的抽样分布区间估计

6.1.7两个总体样本统计量的抽样分布6.4.2两个总体比例之差的

6.2参数估计的一般问题

区间估计

6.2.1估计量和估计值6.4.3两个总体方差比值的

6.2.2点估计区间估计

6.2.3点估计量的评价准则6.2.4区间估计/1:18AM11:33AM第6章抽样分布与参数估计6.1抽样分布74第6章抽样分布与参数估计

6.1抽样分布《统计学教程》卢小广第6章抽样分布与参数估计

6.1抽样分布《统计学教程》75《统计学教程》

第6章抽样分布与参数估计

6.1抽样分布6.1.1总体、个体和样本总体(Population)是指所研究的事物及其现象的全体,由该事物及其现象的全部个体组成。个体(ItemUnit)是指构成总体的元素。总体容量(PopulationSize)是指构成总体的全部个体的数量。样本(Sample)是指从总体抽取的若干个体构成的集合。抽样(Sampling)是指按照具体的抽样方法和抽样设计,从总体中抽取若干个体的过程。样本容量(Samplesize)是指构成样本的全部个体的数量。

/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计676《统计学教程》

第6章抽样分布与参数估计

6.1抽样分布6.1.1总体、个体和样本总体(Population)是指所研究的事物及其现象的全体,由该事物及其现象的全部个体组成。个体(ItemUnit)是指构成总体的元素。总体容量(PopulationSize)是指构成总体的全部个体的数量。样本(Sample)是指从总体抽取的若干个体构成的集合。抽样(Sampling)是指按照具体的抽样方法和抽样设计,从总体中抽取若干个体的过程。样本容量(Samplesize)是指构成样本的全部个体的数量。★讨论题请用经济管理中的实例,解释上述的总体、个体和样本等概念。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计677《统计学教程》

第6章抽样分布与参数估计

6.1抽样分布6.1.2大数定律和中心极限定理1.大数定律在对客观事物及其现象进行观测和实验中,随着观测或实验的次数增多,事件发生的频率和均值逐渐地趋于某个常数。(1)贝努利定理(BernoulliTheorem)(6.1)

贝努利定理表明事件发生的频率依概率收敛于事件发生的概率。从而以严格的数学形式表述了频率的稳定性特征,即n当很大时,事件发生的频率与概率之间出现较大的偏差的可能性很小。由此,在n充分大的场合,可以用事件发生的频率来替代事件的概率。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计678《统计学教程》

第6章抽样分布与参数估计

6.1抽样分布(2)车比雪夫定理(ChebyshevTheorem)设随机变量相互独立,且具有相同的有限的数学期望和方差,对于任意正整数有(6.2)称序列依概率收敛于总体均值。即当n充分大时,车比雪夫不等式几乎都是成立的;当n趋于无穷大时,n个随机变量的均值趋于总体均值。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计679《统计学教程》

第6章抽样分布与参数估计

6.1抽样分布2.中心极限定理在客观现实中,有许多随机变量是由大量的相互独立的随机因素的综合影响而形成的,任何一个因素在总的影响中的作用都是微小的,这种随机变量往往近似地服从正态分布。中心极限定理(CentralLimitTheorem)反映了随机变量近似地服从正态分布的特征。中心极限定理是大样本推断的理论基础。独立同分布的中心极限定理是应用最多的一种中心极限定理。设随机变量相互独立,服从同一分布,且具有相同的有限的数学期望和方差,则(6.3)/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计680《统计学教程》

第6章抽样分布与参数估计

6.1抽样分布2.中心极限定理在客观现实中,有许多随机变量是由大量的相互独立的随机因素的综合影响而形成的,任何一个因素在总的影响中的作用都是微小的,这种随机变量往往近似地服从正态分布。中心极限定理(CentralLimitTheorem)反映了随机变量近似地服从正态分布的特征。中心极限定理是大样本推断的理论基础。独立同分布的中心极限定理是应用最多的一种中心极限定理。设随机变量相互独立,服从同一分布,且具有相同的有限的数学期望和方差,则(6.3)★讨论题大数定律和中心极限定理对于参数估计的意义。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计681《统计学教程》

第6章抽样分布与参数估计

6.1抽样分布6.1.3三种分布1.总体分布总体分布(PopulationDistribution)是指由客观存在的,构成总体的个体所形成的频数分布,及其相关参数数值。例如,当研究某一企业职工收入情况时,该企业全体职工的收入状况的频数分布,以及反映该企业全体职工收入状况的均值、方差、偏态系数和峰度系数,从不同角度综合描述了这一总体的分布特征。我们往往是通过对构成总体的部分个体进行观察,即通过样本数据计算的统计量,例如样本均值、样本方差、样本偏态系数和样本峰度系数,以及样本的频数分布来推断总体参数,用样本分布来估计总体分布。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计682《统计学教程》

第6章抽样分布与参数估计

6.1抽样分布2.样本分布样本分布(SampleDistribution)是指由构成样本的个体所形成样本的频数分布,以及计算出来的相关统计量。样本中的个体都是来自于总体,具有总体的相关信息和基本特征,样本分布是总体分布的一个映象,一个缩影。当样本容量充分大时,样本分布趋近于总体分布。

样本分布是指某一个具体的样本中的个体数量特征。由于样本是随机抽取的,每一次抽取的样本中的个体不尽相同,每一个具体的样本分布也会与对应的总体分布存在或大或小的偏误,根据样本计算的统计量是随机变量。(随机抽取的)样本的分布与客观的总体分布之间的误差,需要借助抽样分布概念。/1:18AM11:33AM《统计学教程》

第6章抽样分布与参数估计683《统计学教程》

第6章抽样分布与参数估计

6.1抽样分布3.抽样分布抽样分布(SamplingDistribution)是指从同分布总体中,独立抽取的相同样本容量的样本统计量的概率分布。所以,抽样分布是样本分布的概率分布,抽样分布是抽样理论的研究对象。抽样分布反映了依据样本计算出来的统计量数值的概率分布,这是科学地进行统计推断的基础。例如,在大样本场合,由中心极限定理有样本均值趋于正态分布。/1:18AM11:33AM《

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论