06-抽样分布与参数估计_第1页
06-抽样分布与参数估计_第2页
06-抽样分布与参数估计_第3页
06-抽样分布与参数估计_第4页
06-抽样分布与参数估计_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章 抽样分布与参数估计抽样分布、参数估计和假设检验是推断统计的三个中心内容第一节 抽样分布基本概念统计量:由样本构造出来,不依赖于任何总体参数的函数。参数:描述总体分布状况的数。抽样分布抽样分布:统计量的分布形式统计量的分布依赖于总体的分布,同时与抽样方式也存在相关。一般讨论统计量的抽样分布时,总是基于有放回的简单随机抽样。有放回简单随机抽样:从总体中抽出一个单位后,将其放回总体,再抽选下一个单位。有放回简单随机抽样的各个样本单位之间是相互独立的。抽样分布的实验使用1999年中国2159个县级行政区人口数资料进行实验。从所有县中,分别随机抽选10、30、100、200个县,计算其人口数的平

2、均数。将同一实验反复进行200次,观察平均数的分布规律。说明:为简化实验起见,在此进行的是无放回实验,结果与有放回的情况略有差异。样本均值的抽样分布特征N30时,样本均值服从正态分布。样本均值以总体均值为期望值样本均值的标准差为总体标准差除以样本量的平方根。样本均值分布与中心极值定理正态总体中,样本均值的分布仍为正态分布。非正态总体,根据中心极值定理样本均值抽样特征的推导无放回条件下的简单随机抽样无放回条件下抽样公式的简化f=n/N,称为抽样比由上述的推导可见,在总体单位数特别大的情况下,有放回与无放回抽样的效果是相同的。例题:关于扑克牌的游戏 从一副扑克牌(52张)中,有放回地抽出30张,其

3、平均点数的分布规律如何?如果以点数来赌胜负,什么区间的胜率是95%?第二节 参数估计主要讨论总体平均数的参数估计参数估计的一般问题参数估计:用样本统计量去估计总体的参数。估计量与估计值用于估计总体参数的样本统计量的名称叫估计量;根据一个具体样本计算出来的估计量的数值叫估计值。点估计与区间估计点估计是用样本统计量的某个取值直接作为总体参数的估计值。区间估计(Interval Estimate)是在点估计的基础上给出总体参数估计的一个区间范围。总体参数的估计区间,称为置信区间。置信度如果将构造置信区间的步骤重复多次,置信区间中包含总体真值的次数所占的比例称为置信水平(Confidence Leve

4、l)。也可称为置信度或置信系数(Confidence Coefficient)。置信度与置信区间的关系以正态分布为例,当置信度为P时,置信区间为-t,+t其中,为期望值,为标准差。T称为概率度,以下为对应关系评价估计量的标准无偏性(Unbiasedness)估计量的期望值等于总体参数值。有效性(Efficiency)估计量的标准差最小。一致性(Consistency)大样本获得的估计量比小样本更接近总体参数值。有放回条件下的简单随机抽样依据:样本平均数的分布特征1样本量n30时,样本平均数服从正态分布2样本平均数以总体平均数为期望值3样本平均数的方差为导入:估计样本平均数的范围某总体方差为10

5、0,平均值为40,抽出一个36个单位构成的样本,试在95的置信度水平下,估计样本平均数的范围。从前例逆推已知某总体方差为100,其一个由36个单位组成的样本的平均数为50,试在95的置信度水平下,估计总体平均数的置信区间。总体标准差的替代对总体均值进行估计时,需要使用到总体标准差的数值。当总体标准差未知时,可以使用样本标准差作为总体标准差的替代。例题:估计总体平均数一次调查中获得了36个样本的数据如下23 35 39 27 36 44 36 42 46 43 31 3342 53 45 54 47 24 34 28 39 36 44 4039 49 38 34 48 50 34 39 45 4

6、8 45 32试在95%的置信度水平下,估计总体平均数的置信区间。计算结果计算样本平均数:X=39.5计算样本标准差:s=7.7736令:总体标准差=样本标准差,计算抽样误差为 1.295695%置信度对应的T值为1.96得总体平均数的置信区间为:上限:39.5+1.961.2956=42.04下限:39.5-1.961.2956=36.96对计算结果的说明严格地说,在这个例子中,不应当根据正态分布进行估计,而应当使用T分布进行估计。如果使用T分布,自由度为35,95%置信度的概率度(t)是2.03,而非1.96。计算出来的置信区间比正态分布的情况要略大一些。置信区间略大的原因,在于使用S替代

7、总体标准差时,本身也包含了一定的误差。实践中,社会调查的样本量一般都比较大,正态分布与T分布的差异不明显,因此可以用正态分布进行近似分析。例如,当样本量为200时,T分布的95%概率度为1.9719,与正态分布的1.96已经没有太大区别了。第三节 常见的参数估计题型本章为选修内容,涉及到数理统计中较多知识,需要通过习题来加以掌握。估计中的要点参数估计是从统计量的抽样分布入手,利用统计量的分布特征,倒推出总体参数的置信区间。所有分布特征,都是基于统计量的抽样分布总体参数是常数,统计量是随机变量。在参数估计时,将统计量视为常数,总体参数视为变量。注意:这种说法是不严格的,因为总体参数是常数,不是随

8、机变量助记方法一个总体参数总体均值正态总体,方差已知;或非正态总体,大样本,方差已知。注意:Z取a/2的原因在于此时置信区间是最小的。一个总体参数总体均值正态总体,方差未知t分布以正态分布为渐近分布,一般当n大于30时,t分布与正态分布已经十分接近,可以使用正态分布来进行处理总体比例的区间估计在大样本的情况下,样本比例P的抽样分布为正态分布。可以利用正态分布进行区间估计。比例估计的标准差比例估计的情况下,如果未知总体方差,可以用样本方差替代。严格的计算公式应当为 在实践中,经常直接使用p(1-p)作为近似。一个总体总体方差正态总体的条件下,样本方差服从n-1个自由度的卡方分布。两个总体参数均值

9、之差两个总体均值之差:独立样本,大样本两个总体参数均值之差两个总体均值之差:独立样本,小样本两个总体的方差未知,但相等;两个总体的方差未知,不相等,但样本量相等;两个总体的方差未知,不相等,样本量不相等。均使用T分布,主要区别在于方差的计算方法和自由度。两个总体均值之差:匹配样本一个样本中的数据与另一样本相对应,可以直接计算对应样本的差的分布。大样本情况下:两总体均值之差服从正态分布。小样本情况下:假定均值之差服从正态分布,使用样本标准差代替总体标准差,计算T分布。两个总体参数比例之差比例之差:大样本下,服从正态分布。在估计时使用样本标准差替代。两个总体的方差比样本方差比的抽样分布为F分布。可

10、得:第四节 样本量的计算样本量的确定估计总体均值时样本量的确定总体标准差的确定根据以往的经验数值推算通过试访问推算采用序贯抽样方法在比例估计时,使用p(1-p)的最大值替代。比例估计时,方差为:p(1-p)可知,p(1-p)的最大值为0.25。比例估计时的样本量推算在校园内估计学生拥有手机的比例,希望在95%的置信水平下,估计的绝对误差不超过5个百分点(5%),求样本量思考题:收视率估计某电视台欲在95%的置信度水平下,对电视节目的收视率作为有效的估计,试考虑样本量应当为多少?问题:若确定估计绝对误差为5%,则样本为385户,是否可行?若考虑估计相对误差为10%,则样本量应当为多少?其他样本量

11、估计的情况估计样本比例时样本量的确定估计两个总体均值之差时样本量的确定估计两个总体比例之差时样本量的确定以上问题,均可通过参数估计的公式进行逆推求得。第五节 其他抽样方式的讨论分层抽样W:各层单位数所占比重2:层内方差整群抽样R与r:群的总数和样本群数量2:群间方差多阶段抽样F:抽样比 N和M:一级和二级单位的单位数S2:一级与二级单位的方差设计效应 当deff因子小于1时,说明抽样设计的效率高于SRS。 如果一个复杂抽样的deff因子可以估计,对应相同精度的简单随机抽样样本量n,复杂抽样设计的样本量n为:N=ndeff谢谢观看/欢迎下载BY FAITH I MEAN A VISION OF

12、GOOD ONE CHERISHES AND THE ENTHUSIASM THAT PUSHES ONE TO SEEK ITS FULFILLMENT REGARDLESS OF OBSTACLES. BY FAITH I BY FAITH内容总结第六章 抽样分布与参数估计。一般讨论统计量的抽样分布时,总是基于有放回的简单随机抽样。有放回简单随机抽样的各个样本单位之间是相互独立的。用于估计总体参数的样本统计量的名称叫估计量。根据一个具体样本计算出来的估计量的数值叫估计值。点估计是用样本统计量的某个取值直接作为总体参数的估计值。区间估计(Interval Estimate)是在点估计的基础上给出总体参数估计的一个区间范围。试在95%的置信度水平下,估计总体平均数的置信区间。计算出来

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论