第6章抽样分布与参数估计_第1页
第6章抽样分布与参数估计_第2页
第6章抽样分布与参数估计_第3页
第6章抽样分布与参数估计_第4页
第6章抽样分布与参数估计_第5页
已阅读5页,还剩114页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第 6 章 抽样与参数估计统计学第 6章 抽样与参数估计6.1 抽样与抽样分布抽样与抽样分布6.2 参数估计的基本方法参数估计的基本方法 6.3 一个总体参数的一个总体参数的区间估计区间估计6.4 两个总体参数的两个总体参数的区间估计区间估计6.5 样本容量的确定样本容量的确定学习目标理解抽样方法与抽样分布理解抽样方法与抽样分布估计量与估计值的概念估计量与估计值的概念点估计与区间估计的区别点估计与区间估计的区别总体均值的区间估计方法总体均值的区间估计方法总体比例的区间估计方法总体比例的区间估计方法样本容量的确定方法样本容量的确定方法参数估计在统计方法中的地位参数估计参数估计假设检验假设检验o统

2、计方法统计方法描述统计描述统计推断统计推断统计6.1 抽样与 抽样分布什么是抽样推断什么是抽样推断概率抽样方法概率抽样方法抽样分布抽样分布统计量统计量与正态分布有关的几个分布与正态分布有关的几个分布一、统计推断的过程二、抽样方法抽样方法简简单单随随机机抽抽样样分分层层抽抽样样整整群群抽抽样样系系统统抽抽样样多多阶阶段段抽抽样样概概率率抽抽样样方方便便抽抽样样判判断断抽抽样样自自愿愿样样本本滚滚雪雪球球抽抽样样配配额额抽抽样样非非概概率率抽抽样样抽抽样样方方式式三、抽样分布在重复选取容量为n的样本时,由每一个样本算出的该统计量数值的相对频数分布或概率分布 是一种理论分布随机变量是 样本统计量样本

3、统计量n样本均值, 样本比例,样本方差等结果来自容量相同的所有可能样本提供了样本统计量长远稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据 抽样分布 (sampling distribution)抽样分布 (sampling distribution)样本均值的抽样分布容量相同的所有可能样本的样本均值的概率分布一种理论概率分布进行推断总体均值的理论基础样本均值的抽样分布样本均值的抽样分布(例题分析)5 .21NxNii25. 1)(122NxNii样本均值的抽样分布 (例题分析)3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,

4、21,11第二个观察值第二个观察值第一个第一个观察值观察值所有可能的所有可能的n = 2 的样本(共的样本(共16个)个)样本均值的抽样分布 (例题分析)3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第二个观察值第一个第一个观察值观察值16个样本的均值(个样本的均值(x)样本均值的分布与总体分布的比较 (例题分析)5 . 2X625. 02X样本均值的抽样分布与中心极限定理X5x50 x5 . 2x中心极限定理(central limit theorem) xn x 抽样分布与总体分布的关系正态分布正态分布非正态分布

5、非正态分布正态分布正态分布正态分布正态分布非正态分布非正态分布样本均值的数学期望样本均值的方差n重复抽样n不重复抽样样本均值的抽样分布(数学期望与方差)(XEnX22122NnNnX样本均值的抽样分布(数学期望与方差)为样本数目MnMXnixiX222122625. 016)5 . 20 . 4()5 . 20 . 1 ()(5 . 2160 . 45 . 10 . 11MXniiX样本比例的抽样分布总体(或样本)中具有某种属性的单位与全部单位总数之比n不同性别的人与全部人数之比n合格品(或不合格品) 与全部产品总数之比总体比例可表示为样本比例可表示为比例(proportion)NNNN101

6、或nnPnnP101或容量相同的所有可能样本的样本比例的概率分布当样本容量很大时,样本比例的抽样分布可用正态分布近似 一种理论概率分布推断总体总体比例的理论基础样本比例的抽样分布样本比例的数学期望样本比例的方差n重复抽样n不重复抽样样本比例的抽样分布(数学期望与方差)(PEnP)1 (21)1 (2NnNnP抽样平均误差的计算注意事项抽样平均误差的计算注意事项在实际工作中,在实际工作中, 和和P均不可知,因此,一般均不可知,因此,一般,或者,或者则抽样平均误差则抽样平均误差的最终计算公式:的最终计算公式:o1.重复抽样条件下:重复抽样条件下:nsx2nppp)1 ( o2.不重复抽样条件下:不

7、重复抽样条件下:)1-(2NnNnsx)1()1 (NnNnppp抽样平均误差的计算抽样平均误差的计算例例1:某灯泡厂对某灯泡厂对10000个产品进行使用寿命个产品进行使用寿命检验,随机抽取检验,随机抽取2%的产品进行测试,得到的产品进行测试,得到资料如表所示:资料如表所示:o试按上述资料,计算:试按上述资料,计算:o(1)产品平均寿命的抽样误差)产品平均寿命的抽样误差o(2)若寿命在)若寿命在1000小时以上为合格品,小时以上为合格品,求合格品率的抽样误差。求合格品率的抽样误差。使用时间(小时)使用时间(小时)x x产品数量产品数量f f 900以下以下 900950 9501000 100

8、01050 10501100 11001150 11501200 1200以上以上 2 4 11 71 84 18 7 3合 计200四、统计量(statistic)设X1,X2,Xn是从总体X中抽取的容量为n的一个 样 本 , 如 果 由 此 样 本 构 造 一 个 函 数T(X1,X2,Xn),不依赖于任何未知参数,则称函数T(X1,X2,Xn)是一个统计量n样本均值、样本比例、样本方差等都是统计量统计量是样本的一个函数统计量是统计推断的基础次序统计量一组样本观测值X1,X2,Xn由小到大的排序o X(1)X(2) X(i) X(n) 后,称X(1),X(2),X(n)为次序统计量 中位数

9、、分位数、四分位数等都是次序统计量五、与正态分布有关的几个分布由阿贝(Abbe) 于1863年首先给出,后来由海尔墨特(Hermert)和卡皮尔逊(KPearson) 分别于1875年和1900年推导出来设 ,则令 ,则 Y 服从自由度为1的2分布,即 当总体 ,从中抽取容量为n的样本,则2分布(2 distribution),(2NX) 1 , 0( NXz2zY ) 1 (2Y),(2NX) 1()(2212nxxnii分布的变量值始终为正 分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称 期望为:E(2)=n,方差为:D(2)=2n(n为自由度)

10、可加性:若U和V为两个独立的2分布随机变量,U2(n1),V2(n2),则U+V这一随机变量服从自由度为n1+n2的2分布 2分布(性质和特点)2分布(图示)t 分布t 分布图示由统计学家费希尔(R.A.Fisher) 提出的,以其姓氏的第一个字母来命名设若U为服从自由度为n1的2分布,即U2(n1),V为服从自由度为n2的2分布,即V2(n2),且U和V相互独立,则称F为服从自由度n1和n2的F分布,记为F分布(F distribution)21nVnUF ),(21nnFFF分布(图示)6.2 参数估计的基本方法估计量与估计值估计量与估计值点估计与区间估计点估计与区间估计估计量与估计值估计

11、量:用于估计总体参数的随机变量n如样本均值,样本比例、样本方差等n例如: 样本均值就是总体均值 的一个估计量参数用 表示,估计量用 表示估计值:估计参数时计算出来的统计量的具体值n如果样本均值 x =80,则80就是的估计值估计量与估计值 (estimator & estimated value)点估计与区间估计参数估计的方法估估 计计 方方 法法点点 估估 计计区间估计区间估计点估计 (point estimate)用样本的估计量直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估计例如:用两个样本均值之差直接作为总体均值之差的估计2.没有给出估计值接近总体参数程度的信息点估

12、计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等区间估计 (interval estimate)在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样误差而得到的根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量n比如,某班级平均分数在7585之间,置信水平是95% 区间估计的图示XXzX2将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 表示为 (1 - n 为是总体参数未在区间内的比例 常用的置信水平值有 99%, 95%, 90%n相应的相应的 为0.01,0.05,0.10置信水平 由样本统计

13、量所构造的总体参数的估计区间称为置信区间统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间 用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值n我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个置信区间 (confidence interval)置信区间与置信水平 xxX影响区间宽度的因素1.总体数据的离散程度,用 来测度样本容量,2.置信水平 (1 - ),影响 z 的大小nX6.3 总体均值的区间估计正态总体且方差已知,或正态总体且方差已知,或 非正态总体,

14、方差非正态总体,方差未知未知,大样本大样本正态总体,方差未知、小样本正态总体,方差未知、小样本6.3 一个总体参数的区间估计总体参数总体参数符号表示符号表示样本统计量样本统计量均值比例方差2XP2S总体均值的区间估计 (正态总体、已知,或非正态总体、大样本)总体均值的区间估计o1.假定条件n总体服从正态分布,且方差() 已知n如果不是正态分布,可由正态分布来近似 (n 30)2.总体均值 在1-置信水平下的置信区间为)(22未知或nszxnzx)(1122未知或NnNnszxNnNnzx总体均值的区间估计(例题分析)915. 096. 14 .212nzx总体均值的区间估计(例题分析)28.1

15、09,44.10192.336.105251096.136.1052nzx36.105x总体均值的区间估计(例题分析)36个投保人年龄的数据个投保人年龄的数据 233539273644364246433133425345544724342839364440394938344850343945484532总体均值的区间估计(例题分析)63.41,37.3713.25 .393677.7645.15 .392nszx5 .39x77. 7s总体均值的区间估计 (正态总体、未知、小样本)总体均值的区间估计 (小样本)1.假定条件n总体服从正态分布,且方差() 未知n小样本 (n 30)2.使用 t

16、分布统计量)1(ntnSXtnStX2t 分布总体均值的区间估计(例题分析)16灯泡使用寿命的数据灯泡使用寿命的数据 1510152014801500145014801510152014801490153015101460146014701470总体均值的区间估计(例题分析)2 .1503, 8 .14762 .1314901677.24131.214902ntx1490 x77.24s总体比例的区间估计大样本重复抽样时的估计方法大样本重复抽样时的估计方法大样本不重复抽样时的估计方法大样本不重复抽样时的估计方法总体比例的区间估计总体比例的区间估计o1.假定条件n总体服从二项分布n可以由正态分布

17、来近似2.使用正态分布统计量) 1 , 0()1 (NnPPPZ)()-1 ()1 (22未知时或nPPzPnzP总体比例的区间估计(例题分析)%35.74%,65.55%35. 9%65100%)651%(6596. 1%65)1 (2nppzp总体方差的区间估计总体方差的区间估计o1.估计一个总体的方差或标准差o2.假设总体服从正态分布3.总体方差 2 的点估计量为s2,且11222nsn111122122222nsnnsn总体方差的区间估计(图示)总体方差的区间估计(例题分析)25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.01

18、08.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3总体方差的区间估计(例题分析)4011.12)24() 1(2975. 0212n3641.39)24() 1(2025. 022n39.18083.564011.1221.931253641.3921.9312522一个总体参数的区间估计(小结)均值均值比例比例方差方差大样本大样本小样本小样本大样本大样本 2 2分布分布 2 2已知已知 2 2已知已知Z Z分布分布 2 2未知未知Z Z分布分布Z Z分布分布Z Z分布分布 2

19、 2未知未知t t分布分布6.4 两个总体参数的区间估计6.4.1 两个总体均值之差的区间估计两个总体均值之差的区间估计6.4.2 两个总体比例之差的区间估计两个总体比例之差的区间估计6.4.3 两个总体方差比的区间估计两个总体方差比的区间估计两个总体参数的区间估计总体参数总体参数符号表示符号表示样本统计量样本统计量均值差比例差方差比2121222121xx 21pp 2221ss两个总体均值之差的区间估计(独立大样本)两个总体均值之差的估计(大样本)o1.假定条件两个总体都服从正态分布,1、 2已知若不是正态分布, 可以用正态分布来近似(n130和n230)两个样本是独立的随机样本使用正态分

20、布统计量 z) 1 , 0()()(2221212121Nnnxxz两个总体均值之差的估计 (大样本)o1.1, 2已知时,两个总体均值之差1-2在1- 置信水平下的置信区间为222121221)(nnzxx222121221)(nsnszxx两个总体均值之差的估计(例题分析) 两个样本的有关数据两个样本的有关数据 中学中学1中学中学2n1=46n1=33S1=5.8 S2=7.2861x782x两个总体均值之差的估计(例题分析)97.10,03. 5(97. 28332 . 7468 . 596. 1)7886()(22222121221nsnszxx两个总体均值之差的区间估计(独立小样本)

21、两个总体均值之差的估计(小样本: 12 22 )o1.假定条件两个总体都服从正态分布两个总体方差未知但相等:1=2两个独立的小样本(n130和n230)总体方差的合并估计量2) 1() 1(212222112nnsnsnsp21221211nnsnsnsppp两个总体均值之差的估计(小样本: 1222 )两个样本均值之差的标准化)2(11)()(21212121nntnnsxxtp21221221112nnsnntxxp两个总体均值之差的估计(例题分析)两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.029

22、.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.5两个总体均值之差的估计(例题分析)5 .321x996.1521s8 .282x358.1922s677.1721212358.19) 112(996.15) 112(2ps56. 37 . 3121121677.170739. 2)8 .285 .32(两个总体均值之差的估计(小样本: 12 22 )o1.假定条件两个总体都服从正态分布两个总体方差未知且不相等:12两个独立的小样本(n130和n230)使用统计量)()()(2221212121vtnsnsxxt两个总体

23、均值之差的估计(小样本: 1222 )o两个总体均值之差1-2在1- 置信水平下的置信区间为222121221)(nsnsvtxx1222221121212222121nnsnnsnsnsv两个总体均值之差的估计(例题分析)两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.2两个总体均值之差的估计(例题分析)5 .321x996.1521s875.272x014.2322s13188.13188014.231121

24、2996.158014.2312996.15222v433. 4625. 48014.2312996.151604. 2)875.275 .32(两个总体均值之差的区间估计(匹配样本)两个总体均值之差的估计(匹配大样本)假定条件两个匹配的大样本(n1 30和n2 30)两个总体各观察值的配对差服从正态分布两个总体均值之差d =1-2在1- 置信水平下的置信区间为nzdd2两个总体均值之差的估计(匹配小样本)假定条件两个匹配的小样本(n1 30和n2 30)两个总体各观察值的配对差服从正态分布 两个总体均值之差d=1-2在1- 置信水平下的置信区间为nsntdd) 1(2两个总体均值之差的估计(

25、例题分析) 10名学生两套试卷的得分名学生两套试卷的得分 学生编号学生编号试卷试卷A试卷试卷B差值差值d17871726344193726111489845691741754951-27685513876601698577810553916两个总体均值之差的估计(例题分析)11101101dniindd53. 61)(12dniidndds67. 4111053. 62622. 211) 1(2nsntdd两个总体比例之差区间的估计o1.假定条件两个总体服从二项分布可以用正态分布来近似两个样本是独立的o2.两个总体比例之差1- 2在1- 置信水平下的置信区间为两个总体比例之差的区间估计2221

26、11221)1 ()1 (nppnppzpp两个总体比例之差的估计(例题分析)两个总体比例之差的估计 (例题分析)%32.19,%68. 6%32. 6%13400%)321 (%32500%)451 (%4596. 1%32%45两个总体方差比的区间估计两个总体方差比的区间估计o1.比较两个总体的方差比用两个样本的方差比来判断如果S12/ S22接近于1,说明两个总体方差很接近如果S12/ S22远离1,说明两个总体方差之间存在差异2.总体方差比在1-置信水平下的置信区间为212221222122221FssFss),(1),(1222121nnFnnF两个总体方差比的区间估计(图示)两个总体方差比的区间估计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论