应用统计chapter7_第1页
应用统计chapter7_第2页
应用统计chapter7_第3页
应用统计chapter7_第4页
应用统计chapter7_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、应用统计第七章第七章 参数估计参数估计参数估计在统计方法中的地位参数估计在统计方法中的地位假设检验假设检验统计方法描述统计描述统计推断统计推断统计参数估计参数估计统计推断的过程统计推断的过程参数估计的方法参数估计的方法估估 计计 方方 法法点点 估估 计计区间估计区间估计7.1 参数估计的基本原理参数估计的基本原理7.1.1 估计量与估计值估计量与估计值7.1.2 点估计与区间估计点估计与区间估计7.1.3 评价估计量的标准评价估计量的标准估计量与估计值估计量与估计值 (estimator & estimated value)1. 估计量:用于估计总体参数的随机变量估计量:用于估计总体

2、参数的随机变量如样本均值,样本比例如样本均值,样本比例, 样本方差等样本方差等例如例如: 样本均值就是总体均值样本均值就是总体均值 的一个估计量的一个估计量2. 参数用参数用 表示,估计量表示,估计量用用 表示表示3. 估计值:估计参数时计算出来的统计量的估计值:估计参数时计算出来的统计量的具体值具体值如果样本均值如果样本均值 x =80,则,则80就是就是 的估计值的估计值点估计点估计 (point estimate)1. 用样本的估计量直接作为总体参数的估计用样本的估计量直接作为总体参数的估计值值例如:用样本均值直接例如:用样本均值直接作为作为总体均值的估计总体均值的估计例如:用两个样本均

3、值之差直接例如:用两个样本均值之差直接作为作为总体均总体均值之差的估计值之差的估计2. 没有给出估计值接近总体参数程度的信息没有给出估计值接近总体参数程度的信息点估计点估计 (point estimate)虽然在重复抽样条件下,点估计的均值可望等于虽然在重复抽样条件下,点估计的均值可望等于总体真值,但由于样本是随机的,抽出一个具体总体真值,但由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值的样本得到的估计值很可能不同于总体真值一个点估计量的可靠性是由它的抽样标准误差来一个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无法给出估衡量的,这表明一个具体的

4、点估计值无法给出估计的可靠性的度量计的可靠性的度量 3. 点估计的方法有矩估计法、顺序统计量法、点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法、贝叶斯法等最大似然法、最小二乘法、贝叶斯法等评价估计量的标准评价估计量的标准 无偏性无偏性(unbiasedness) 估计量抽样分布的数学期望等于被估计的总体估计量抽样分布的数学期望等于被估计的总体参数,即:参数,即:( )E评价估计量的标准评价估计量的标准 有效性有效性(efficiency)121212()(),()(),EE 则则比比更更有有效效。评价估计量的标准评价估计量的标准 一致性一致性(consistency) 随着样本容

5、量的增大,估计量的值越来越接近随着样本容量的增大,估计量的值越来越接近被估计的总体参数被估计的总体参数区间估计区间估计 (interval estimate)1.在点估计的基础上,给出总体参数估计的一个区间在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样误差而得到的范围,该区间由样本统计量加减抽样误差而得到的2.根据样本统计量的抽样分布能够对样本统计量与总根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量体参数的接近程度给出一个概率度量比如,某班级平均分数在比如,某班级平均分数在7585之间,置信水平是之间,置信水平是95% 区间估计的图示

6、区间估计的图示由所有样本容量为n的样本均值构成区间估计的图示区间估计的图示12xx 12xx 22xx 22xx 32xx 32xx 置信区间置信区间 (95%的置信区间的置信区间)置信水平置信水平1. 将构造置信区间的步骤重复很多次,置信将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例区间包含总体参数真值的次数所占的比例称为置信水平称为置信水平 2. 表示为表示为 100(1 - 为总体参数为总体参数未在未在区间内的比例区间内的比例 3. 常用的置信水平值有常用的置信水平值有 99%, 95%, 90%相应的相应的 为为0.01,0.05,0.10置信区间置信区间 (

7、confidence interval)1.由样本统计量所构造的总体参数的估计区间称由样本统计量所构造的总体参数的估计区间称为置信区间为置信区间2.统计学家在某种程度上确信这个区间会包含真统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间正的总体参数,所以给它取名为置信区间 3.用一个具体的样本所构造的区间是一个特定的用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值否包含总体参数的真值我们只能是希望这个区间是大量包含总体参数真值的我们只能是希望这个区间是大量包含总体参数真值的区

8、间中的一个,但它也可能是少数几个不包含参数真区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个值的区间中的一个置信区间与置信水平置信区间与置信水平7.2 一个总体参数的区间估计一个总体参数的区间估计7.2.1 总体均值的区间估计总体均值的区间估计7.2.2 总体比例的区间估计总体比例的区间估计7.2.3 总体方差的区间估计总体方差的区间估计一个总体参数的区间估计总体参数符号表示样本统计量均值比例方差总体均值的区间估计总体均值的区间估计 正态总体、正态总体、 已知,或非正态总体、大样本已知,或非正态总体、大样本 假定条件假定条件 总体服从正态分布总体服从正态分布, ,且方差且方差(

9、) 已已知知 如果不是正态分布,可由正态分布来近似如果不是正态分布,可由正态分布来近似 (n 30) 使用正态分布统计量使用正态分布统计量 z总体均值的区间估计总体均值的区间估计(例题分析例题分析)25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3总体均值的区间估计总体均值的区间估计(例题分析例题分析)总体均值的区间估计总体均值的区间估计(例题分析例题分析)36个投保

10、人年龄的数据 233539273644364246433133425345544724342839364440394938344850343945484532总体均值的区间估计总体均值的区间估计(例题分析例题分析)总体均值的区间估计总体均值的区间估计 有限总体,无退还抽样有限总体,无退还抽样总体均值的区间估计总体均值的区间估计(例题分析例题分析)9010002000.60110001200 xNnNn 所以,我们有所以,我们有90的把握说,总体平均值处在的把握说,总体平均值处在7779之间。之间。总体均值的区间估计总体均值的区间估计(例题分析例题分析)【例【例】某大学为了解学生每天上网的时间,

11、在全校某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取名学生中采取不重复抽样方法随机抽取36人,调查他们人,调查他们每天上网的时间(单位:小时)每天上网的时间(单位:小时) ,得到的数据如下表:,得到的数据如下表:求该校大学生平均上网时间的置信区间,置信概率分别求该校大学生平均上网时间的置信区间,置信概率分别为为90%、95%和和99%。 3.33.16.25.82.34.15.44.53.24.425.42.66.41.83.55.72.32.11.91.25.14.34.23.60.81.54.71.41.22.93.52.40.53.62.5上网时间上网时

12、间例题分析例题分析 Confidence Interval Estimate for the MeanDataSample Standard Deviation1.60934769Sample Mean3.31666667Sample Size36Confidence Level90%Standard Error of the Mean0.26822462Degrees of Freedom35t Value1.68957285Interval Half W idth0.45318503Interval Lower Limit2.86Interval Upper Limit3.77Interm

13、ediate CalculationsConfidence IntervalConfidence Interval Estimate for the MeanDataSample Standard Deviation1.60934769Sample Mean3.31666667Sample Size36Confidence Level95%Standard Error of the Mean0.26822462Degrees of Freedom35t Value2.03011041Interval Half Width0.54452558Interval Lower Limit2.77Int

14、erval Upper Limit3.86Intermediate CalculationsConfidence IntervalConfidence Interval Estim ate for the M eanDataSam ple Standard Deviation1.60934769Sam ple M ean3.31666667Sam ple Size36Confidence Level99%Standard Error of the M ean0.26822462Degrees of Freedom35t Value2.7238093Interval Half W idth0.7

15、305927Interval Lower Lim it2.59Interval Upper Lim it4.05Interm ediate CalculationsConfidence Interval总体均值的区间估计总体均值的区间估计 (小样本小样本) 假定条件假定条件 总体服从正态分布总体服从正态分布, ,且方差且方差( ) 未知未知 小样本小样本 (n 30) 使用使用 t 分布统计量分布统计量 总体均值 在1-置信水平下的置信区间为总体均值的区间估计总体均值的区间估计(例题分析例题分析)16灯泡使用寿命的数据 1510152014801500145014801510152014801

16、490153015101460146014701470总体均值的区间估计总体均值的区间估计(例题分析例题分析)总体均值的区间估计总结总体均值的区间估计总结总体分布总体分布样本容量样本容量 已知已知 未知未知正态分布正态分布大样本大样本(n 30)小样本小样本(n30)非正态分布非正态分布大样本大样本(n 30)2xzn 2xzn 2Sxzn 2Sxtn 2xzn 2Sxzn 总体比率的区间估计总体比率的区间估计 假定条件假定条件 总体服从二项分布总体服从二项分布 可以由正态分布来近似可以由正态分布来近似 使用正态分布统计量使用正态分布统计量 z总体比率的区间估计总体比率的区间估计(例题分析例题

17、分析)总体比率的区间估计总体比率的区间估计(例题分析例题分析)解:解:由于样本容量很大由于样本容量很大150,45/1500.3,5, (1)5npnpnp 故可用正态分布逼近,且故可用正态分布逼近,且0.0750.5nN故需用有限总体校正系数计算故需用有限总体校正系数计算s2(1)10.3(10.3)20001500.32150200010.30.072(0.228,0.372)ppNnpznN 我们有我们有95.5的把握说,该公司具有大的把握说,该公司具有大专以上学历的人员中,有专以上学历的人员中,有22.8%37.2%的人专业不对口的人专业不对口总体方差的区间估计总体方差的区间估计 总体

18、方差的区间估计总体方差的区间估计(图示图示)总体方差的区间估计总体方差的区间估计(例题分析例题分析)25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3总体方差的区间估计总体方差的区间估计(例题分析例题分析)22210.975(1)(24)12.4011n 2220.025(1)(24)39.3641n 均值均值比例比例方差方差大样本大样本小样本小样本大样本大样本 2

19、2分布分布 2 2已知已知 2 2已知已知Z Z分布分布 2 2未知未知Z Z分布分布Z Z分布分布Z Z分布分布 2 2未知未知t t分布分布7.3 两个总体参数的区间估计两个总体参数的区间估计7.3.1 两个总体均值之差的区间估计两个总体均值之差的区间估计7.3.2 两个总体比例之差的区间估计两个总体比例之差的区间估计7.3.3 两个总体方差比的区间估计两个总体方差比的区间估计两个总体参数的区间估计两个总体参数的区间估计总体参数符号表示样本统计量均值之差均值之差比例之差比例之差方差比方差比两个总体均值之差的估计两个总体均值之差的估计(独立,大样本独立,大样本) 假定条件假定条件v两个两个总

20、体都服从正态分布,总体都服从正态分布, 1、 2已知已知v若不是正态分布若不是正态分布, 可以用正态分布来近似可以用正态分布来近似(n1 30和和n2 30)v两个样本是独立的随机样本两个样本是独立的随机样本 使用正态分布统计量使用正态分布统计量 z两个总体均值之差的估计两个总体均值之差的估计(独立,大样本独立,大样本)1. 1, 2已知时,已知时,两个总体均值之差两个总体均值之差 1- 2在在1- 置信水平下的置信区间为置信水平下的置信区间为两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析) 两个样本的有关数据 中学1中学2n1=46n2=33S1=5.8 S2=7.2861x

21、782x两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)两个总体均值之差的估计两个总体均值之差的估计(独立,小样本独立,小样本: 1 12 2 2 22 2 )1.假定条件假定条件两个两个总体都服从正态分布总体都服从正态分布两个总体方差未知但相等:两个总体方差未知但相等: 1= 2两个独立的小样本两个独立的小样本(n130和和n230)2.总体方差的合并估计量总体方差的合并估计量两个总体均值之差的估计两个总体均值之差的估计(独立,小样本独立,小样本: 1 12 2 2 22 2 )1.两个样本均值之差的标准化两个样本均值之差的标准化两个总体均值之差的估计两个总体均值之差的估计(

22、例题分析例题分析)两个方法组装产品所需的时间 方法1方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.5两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)两个总体均值之差的估计两个总体均值之差的估计(小样本小样本: 1 12 2 2 22 2 )1. 假定条件假定条件两个两个总体都服从正态分布总体都服从正态分布两个总体方差未知且不相等:两个总体方差未知且不相等: 1 2两个独立的小样本两个独立的小样本(n130和和n230)2. 使用统

23、计量使用统计量两个总体均值之差的估计两个总体均值之差的估计(小样本小样本: 1 12 2 2 22 2 )两个总体均值之差两个总体均值之差 1- 2在在1- 置信水平下的置信水平下的置信区间为置信区间为 2221212222211221112ssnnvsnsnnn 自由度自由度两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)两个方法组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.2两个总体均值之差的估计两个总体均值之差的估计(例题

24、分析例题分析)两个总体均值之差的估计两个总体均值之差的估计(匹配大样本匹配大样本)1. 假定条件假定条件两个匹配的大样本两个匹配的大样本(n1 30和和n2 30)两个总体各观察值的配对差服从正态分布两个总体各观察值的配对差服从正态分布2. 两个总体均值之差两个总体均值之差 d = 1- 2在在1- 置信水置信水平下的置信区间为平下的置信区间为两个总体均值之差的估计两个总体均值之差的估计(匹配小样本匹配小样本)1. 假定条件假定条件两个匹配的小样本两个匹配的小样本(n1 30和和n2 30)两个总体各观察值的配对差服从正态分布两个总体各观察值的配对差服从正态分布 2. 两个总体均值之差两个总体

25、均值之差 d= 1- 2在在1- 置信水置信水平下的置信区间为平下的置信区间为两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析) 10名学生两套试卷的得分 学生编号试卷A试卷B差值d17871726344193726111489845691741754951-27685513876601698577810553916两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)两个总体比例之差的区间估计两个总体比例之差的区间估计 假定条件假定条件 两个两个总体服从二项分布总体服从二项分布 可以用正态分布来近似可以用正态分布来近似 两个样本是独立的两个样本是独立的 两个总体比例之

26、差两个总体比例之差 1- 2在在1- 置信水平下的置置信水平下的置信区间为信区间为两个总体比例之差的估计两个总体比例之差的估计(例题分析例题分析)两个总体比例之差的估计两个总体比例之差的估计 (例题分析例题分析)两个总体方差比的区间估计两个总体方差比的区间估计1.比较两个总体的方差比比较两个总体的方差比2.用两个样本的方差比来判断用两个样本的方差比来判断如果如果S12/ S22接近于接近于1,说明两个总体方差很接近说明两个总体方差很接近如果如果S12/ S22远离远离1,说明两个总体方差之间存在差异说明两个总体方差之间存在差异3.总体方差比在总体方差比在1- 置信水平下的置信区间为置信水平下的置信区间为两个总体方差比的区间估计两个总体方差比的区间估计(图示图示)两个总体方差比的区间估计两个总体方差比的区间估计(例题分析例题分析)两个总体方差比的区间估计两个总体方差比的区间估计 (例题分析例题分析)两个总体参数的区间估计两个总体参数的区间估计(小结

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论