抽样分布与参数估计总结课件_第1页
抽样分布与参数估计总结课件_第2页
抽样分布与参数估计总结课件_第3页
抽样分布与参数估计总结课件_第4页
抽样分布与参数估计总结课件_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章 抽样分布与参数估计抽样分布、参数估计和假设检验是推断统计的三个中心内容第六章 抽样分布与参数估计抽样分布、参数估计和假设检验是推断第一节 抽样分布第一节 抽样分布基本概念统计量:由样本构造出来,不依赖于任何总体参数的函数。参数:描述总体分布状况的数。基本概念统计量:由样本构造出来,不依赖于任何总体参数的函数。抽样分布抽样分布:统计量的分布形式统计量的分布依赖于总体的分布,同时与抽样方式也存在相关。一般讨论统计量的抽样分布时,总是基于有放回的简单随机抽样。有放回简单随机抽样:从总体中抽出一个单位后,将其放回总体,再抽选下一个单位。有放回简单随机抽样的各个样本单位之间是相互独立的。抽样分布

2、抽样分布:统计量的分布形式抽样分布的实验使用1999年中国2159个县级行政区人口数资料进行实验。从所有县中,分别随机抽选10、30、100、200个县,计算其人口数的平均数。将同一实验反复进行200次,观察平均数的分布规律。说明:为简化实验起见,在此进行的是无放回实验,结果与有放回的情况略有差异。抽样分布的实验使用1999年中国2159个县级行政区人口数资抽样分布与参数估计总结课件样本均值的抽样分布特征N30时,样本均值服从正态分布。样本均值以总体均值为期望值样本均值的标准差为总体标准差除以样本量的平方根。样本均值的抽样分布特征N30时,样本均值服从正态分布。样本均值分布与中心极值定理正态总

3、体中,样本均值的分布仍为正态分布。非正态总体,根据中心极值定理样本均值分布与中心极值定理正态总体中,样本均值的分布仍为正态样本均值抽样特征的推导样本均值抽样特征的推导抽样分布与参数估计总结课件抽样分布与参数估计总结课件抽样标准误在任何一项抽样中,统计量的标准差称为抽样标准误。在利用样本平均数估计总体平均数时,抽样标准误即为样本平均数的标准差,即前文中推导出来的抽样标准误在任何一项抽样中,统计量的标准差称为抽样标准误。无放回条件下的简单随机抽样无放回条件下的简单随机抽样无放回条件下抽样公式的简化f=n/N,称为抽样比由上述的推导可见,在总体单位数特别大的情况下,有放回与无放回抽样的效果是相同的。

4、无放回条件下抽样公式的简化f=n/N,称为抽样比由上述的推导例题:关于扑克牌的游戏 从一副扑克牌(52张)中,有放回地抽出30张,其平均点数的分布规律如何?如果以点数来赌胜负,什么区间的胜率是95%?例题:关于扑克牌的游戏 从一副扑克牌(52张)中,有放回地抽抽样分布与参数估计总结课件第二节 参数估计主要讨论总体平均数的参数估计第二节 参数估计主要讨论总体平均数的参数估计参数估计的一般问题参数估计:用样本统计量去估计总体的参数。估计量与估计值用于估计总体参数的样本统计量的名称叫估计量;根据一个具体样本计算出来的估计量的数值叫估计值。参数估计的一般问题参数估计:用样本统计量去估计总体的参数。点估

5、计与区间估计点估计是用样本统计量的某个取值直接作为总体参数的估计值。区间估计(Interval Estimate)是在点估计的基础上给出总体参数估计的一个区间范围。总体参数的估计区间,称为置信区间。点估计与区间估计点估计是用样本统计量的某个取值直接作为总体参置信度如果将构造置信区间的步骤重复多次,置信区间中包含总体真值的次数所占的比例称为置信水平(Confidence Level)。也称为置信度或置信系数(Confidence Coefficient)。置信度如果将构造置信区间的步骤重复多次,置信区间中包含总体真置信度与置信区间的关系以正态分布为例,当置信度为P时,置信区间为-t,+t其中,为

6、期望值,为标准差。T称为概率度,以下为对应关系置信度与置信区间的关系以正态分布为例,当置信度为P时,置信区评价估计量的标准无偏性(Unbiasedness)估计量的期望值等于总体参数值。有效性(Efficiency)估计量的标准差最小。一致性(Consistency)大样本获得的估计量比小样本更接近总体参数值。评价估计量的标准无偏性(Unbiasedness)有放回条件下的简单随机抽样依据:样本平均数的分布特征1样本量n30时,样本平均数服从正态分布2样本平均数以总体平均数为期望值3样本平均数的方差为有放回条件下的简单随机抽样依据:样本平均数的分布特征导入:估计样本平均数的范围某总体方差为10

7、0,平均值为40,抽出一个36个单位构成的样本,试在95的置信度水平下,估计样本平均数的范围。导入:估计样本平均数的范围某总体方差为100,平均值为40,抽样分布与参数估计总结课件从前例逆推已知某总体方差为100,其一个由36个单位组成的样本的平均数为50,试在95的置信度水平下,估计总体平均数的置信区间。从前例逆推已知某总体方差为100,其一个由36个单位组成的样抽样分布与参数估计总结课件抽样分布与参数估计总结课件总体标准差的替代对总体均值进行估计时,需要使用到总体标准差的数值。当总体标准差未知时,可以使用样本标准差作为总体标准差的替代。总体标准差的替代对总体均值进行估计时,需要使用到总体标

8、准差的例题:估计总体平均数一次调查中获得了36个样本的数据如下23 35 39 27 36 44 36 42 46 43 31 3342 53 45 54 47 24 34 28 39 36 44 4039 49 38 34 48 50 34 39 45 48 45 32试在95%的置信度水平下,估计总体平均数的置信区间。例题:估计总体平均数一次调查中获得了36个样本的数据如下计算结果计算样本平均数:X=39.5计算样本标准差:s=7.7736令:总体标准差=样本标准差,计算抽样误差为 1.295695%置信度对应的T值为1.96得总体平均数的置信区间为:上限:39.5+1.961.2956=

9、42.04下限:39.5-1.961.2956=36.96计算结果计算样本平均数:X=39.5对计算结果的说明严格地说,在这个例子中,不应当根据正态分布进行估计,而应当使用T分布进行估计。如果使用T分布,自由度为35,95%置信度的概率度(t)是2.03,而非1.96。计算出来的置信区间比正态分布的情况要略大一些。置信区间略大的原因,在于使用S替代总体标准差时,本身也包含了一定的误差。实践中,社会调查的样本量一般都比较大,正态分布与T分布的差异不明显,因此可以用正态分布进行近似分析。例如,当样本量为200时,T分布的95%概率度为1.9719,与正态分布的1.96已经没有太大区别了。对计算结果

10、的说明严格地说,在这个例子中,不应当根据正态分布进第三节 常见的参数估计题型本章为选修内容,涉及到数理统计中较多知识,需要通过习题来加以掌握。第三节 常见的参数估计题型本章为选修内容,涉及到数理统计中估计中的要点参数估计是从统计量的抽样分布入手,利用统计量的分布特征,倒推出总体参数的置信区间。所有分布特征,都是基于统计量的抽样分布总体参数是常数,统计量是随机变量。估计中的要点参数估计是从统计量的抽样分布入手,利用统计量的分一个总体参数总体均值正态总体,方差已知;或非正态总体,大样本,方差已知。注意:Z取a/2的原因在于此时置信区间是最小的。一个总体参数总体均值正态总体,方差已知;注意:Z取a/

11、2的一个总体参数总体均值正态总体,方差未知t分布以正态分布为渐近分布,一般当n大于30时,t分布与正态分布已经十分接近,可以使用正态分布来进行处理一个总体参数总体均值正态总体,方差未知t分布以正态分布为渐T分布概率密度函数T分布概率密度函数T分布曲线T分布曲线例题:T分布已知某产品的使用寿命服从正态分布,现随机抽取16件,计算平均寿命为1490小时,样本标准差为24.77小时,试估计这批产品寿命的95%置信区间由设产品平均寿命为,由题意可知查表,15个自由,双侧概率0.05的T值为2.13=TINV(0.05,15)由-2.13t2.13,可以求出的置信区间为(1476.8,1503.2)例题

12、:T分布已知某产品的使用寿命服从正态分布,现随机抽取16总体比例的区间估计在大样本的情况下,样本比例P的抽样分布为正态分布。可以利用正态分布进行区间估计。总体比例的区间估计在大样本的情况下,样本比例P的抽样分布为正比例估计的标准差比例估计的情况下,如果未知总体方差,可以用样本方差替代。严格的计算公式应当为 在实践中,经常直接使用p(1-p)作为近似。比例估计的标准差比例估计的情况下,如果未知总体方差,可以用样一个总体总体方差当总体为正态分布时,样本方差与总体方差之比以以下的方式服从n-1个自由的卡方分布一个总体总体方差当总体为正态分布时,样本方差与总体方差之比卡方分布的密度函数卡方分布的密度函

13、数卡方分布卡方分布例题:卡方分布已知一批食品的重量服从正态分布,从总体中抽选25袋,计算样本方差为93.21,试在95%的置信度水平下,估计总体的方差假定总体方差为2,可知查表,24个自由度的卡方值分别为CHIINV(0.025,24)=39.36CHIINV(0.975,24)=12.40由12.40K39.36,可得2的置信区间为(56.83,180.39)例题:卡方分布已知一批食品的重量服从正态分布,从总体中抽选2两个总体参数均值之差两个总体均值之差:独立样本,大样本两个总体参数均值之差两个总体均值之差:独立样本,大样本两个总体参数均值之差两个总体均值之差:独立样本,小样本两个总体的方差

14、未知,但相等;两个总体的方差未知,不相等,但样本量相等;两个总体的方差未知,不相等,样本量不相等。均使用T分布,主要区别在于方差的计算方法和自由度(略)。两个总体参数均值之差两个总体均值之差:独立样本,小样本两个总体均值之差:匹配样本一个样本中的数据与另一样本相对应,可以直接计算对应样本的差的分布。大样本情况下:两总体均值之差服从正态分布。小样本情况下:假定均值之差服从正态分布,使用样本标准差代替总体标准差,计算T分布。两个总体均值之差:匹配样本一个样本中的数据与另一样本相对应,两个总体参数比例之差比例之差:大样本下,服从正态分布。在估计时使用样本标准差替代。两个总体参数比例之差比例之差:大样

15、本下,服从正态分布。两个总体的方差比样本方差比的抽样分布为F分布其中第一自由度为n1-1,第二自由度为n2-1两个总体的方差比样本方差比的抽样分布为F分布F分布的密度函数F分布的密度函数F分布F分布第四节 样本量的计算第四节 样本量的计算样本量的确定估计总体均值时样本量的确定样本量的确定估计总体均值时样本量的确定总体标准差的确定根据以往的经验数值推算通过试访问推算采用序贯抽样方法在比例估计时,使用p(1-p)的最大值替代。比例估计时,方差为:p(1-p)可知,p(1-p)的最大值为0.25。总体标准差的确定根据以往的经验数值推算序贯抽样Sequential Sampling 在抽样时不预先指定

16、子样容量,而是要求给出一组停止采样的规则,每新抽一个子样后立即按此规则考察一下,是停止采样还是继续采样。如果采样一旦停止,就按此时所给出的观察值作为一个固定子样容量进行统计推断。 序贯抽样Sequential Sampling 比例估计时的方差推导定义X如下:X=1,当样本具有某项属性时;X=0,当样本不具有某些属性时可以证明,具有某项属性的样本比例P满足比例估计时的方差推导定义X如下:比例估计时的样本量推算在校园内估计学生拥有手机的比例,希望在95%的置信水平下,估计的绝对误差不超过5个百分点(5%),求样本量比例估计时的样本量推算在校园内估计学生拥有手机的比例,希望在思考题:收视率估计某电视台欲在95%的置信度水平下,对电视节目的收视率作为有效的估计,试考虑样本量应当为多少?问题:若确定估计绝对误差为5%,则样本为385户,是否可行?若考虑估计相对误差为10%,则样本量应当为多少?思考题:收视率估计某电视台欲在95%的置信度水平下,对电视节其他样本量估计的情况估计样本比例时样本量的确定估计两个总体均值之差时样本量的确定估计两个总体比例之差时样本量的确定以上问题,均可通过参数估计的公式进行逆推求得。其他样本量估计的情况估计样本比例时样本量的确定第五节 其他抽样方式的误差第五节

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论