第4章-2zxy 参数估计_第1页
第4章-2zxy 参数估计_第2页
第4章-2zxy 参数估计_第3页
第4章-2zxy 参数估计_第4页
第4章-2zxy 参数估计_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四节第四节2n实际工作:由样本推断总体实际工作:由样本推断总体n统计推断统计推断: 根据样本提供的信息,以一定的根据样本提供的信息,以一定的概率推断总体的性质。概率推断总体的性质。 统计推断统计推断参数估计参数估计假设检验假设检验3第四节:参数的区间估计与点估计第四节:参数的区间估计与点估计一、原理一、原理三、两个总体平均数差数的区间估计与点估计三、两个总体平均数差数的区间估计与点估计二、总体平均数的区间估计与点估计二、总体平均数的区间估计与点估计四、总体频率、两个总体频率差数的区间估计与点估计四、总体频率、两个总体频率差数的区间估计与点估计4n参数估计参数估计点估计:结果出现的条件下该参数

2、可能点估计:结果出现的条件下该参数可能性最大的取值。性最大的取值。区间估计:给出一个区间,并给出指定区间估计:给出一个区间,并给出指定参数落入这一区间的概率。参数落入这一区间的概率。n参数估计与假设检验所依据的统计参数估计与假设检验所依据的统计学理论相同,区别是以不同形式给学理论相同,区别是以不同形式给出结果。出结果。5区间估计区间估计n按一定的概率按一定的概率 (1- )用一个区间估计总用一个区间估计总体参数所在范围体参数所在范围。这种估计方法称为区间。这种估计方法称为区间估计。估计。 6n区间估计是在一定概率保证下指出总体参数区间估计是在一定概率保证下指出总体参数的可能范围,所给出的可能范

3、围叫的可能范围,所给出的可能范围叫 置信区间,置信区间,(称作置信度为(称作置信度为1- 的置信区间)的置信区间)n置信上、下限之差称为置信距,置信距越小,置信上、下限之差称为置信距,置信距越小,估计的精确度就越高。估计的精确度就越高。 7 00.950.95(接受区)(接受区)0.0250.025临界值临界值接受区接受区 0-1.96 x 0+1.96 xxu8置信区间的两个要素置信区间的两个要素 n可靠性可靠性 反映为可信度反映为可信度1- 的大小的大小 n精确性精确性 用区间长度衡量用区间长度衡量 9点估计点估计 n直接用样本统计量作为总体参数的估计值直接用样本统计量作为总体参数的估计值

4、 方法简单,但未考虑抽样误差的大小方法简单,但未考虑抽样误差的大小在实际问题中,总体参数往往是未知的,但它们是固定的在实际问题中,总体参数往往是未知的,但它们是固定的值,并不是随机变量值。而样本统计量随样本的不同而值,并不是随机变量值。而样本统计量随样本的不同而不同,属随机的。不同,属随机的。 10一、参数区间估计与点估计的原理一、参数区间估计与点估计的原理理论基础理论基础由中心极限定理和大数定律,只要抽样为大样本,由中心极限定理和大数定律,只要抽样为大样本,不论其总体是否为正态分布,其样本平均数都近似不论其总体是否为正态分布,其样本平均数都近似服从正态分布服从正态分布N(N(,2 2/n)/

5、n)。1195. 0)96. 196. 1(xxxP99. 0)58. 258. 2(xxxP95. 0)96. 196. 1(xxxxP99. 0)58. 258. 2(xxxxP12区间估计的图示131)(xxuxuxPu:正态分布下置信度:正态分布下置信度 P=1- 时的时的 u 临界值临界值1-1-:置信水平:置信水平1- 1- 置信区间、置信距置信区间、置信距),(xxuxux14),(21xxuxLuxL 为样本平均数为样本平均数 x 对总体平均数对总体平均数的置信度为的置信度为P=1-的区间估计。的区间估计。L1、L2 xuxL用样本平均数用样本平均数 x 对总体平均数对总体平均

6、数的置信度为的置信度为 P=1-的点估计。的点估计。15一、参数区间估计与点估计的原理一、参数区间估计与点估计的原理无论区间估计还是点估计,都与概率显著水平无论区间估计还是点估计,都与概率显著水平的大小联系在一起。的大小联系在一起。小,相应的置信区间就越大小,相应的置信区间就越大用样本平均数对总体平均数估计的可靠程度高,用样本平均数对总体平均数估计的可靠程度高,估计的精度降低。估计的精度降低。在实际应用中,应合理选取概率显著水平在实际应用中,应合理选取概率显著水平的的大小,不能认为大小,不能认为取值越小越好。取值越小越好。16一、参数区间估计与点估计的原理一、参数区间估计与点估计的原理参数的区

7、间估计也可用于假设检验。参数的区间估计也可用于假设检验。参数所进行的假设落在区间之外,就说明假设与真参数所进行的假设落在区间之外,就说明假设与真实情况有本质的不同,否定零假设,接受备择假设。实情况有本质的不同,否定零假设,接受备择假设。参数所进行的假设落在区间内,说明假设与真实情参数所进行的假设落在区间内,说明假设与真实情况相同,可以接受零假设。况相同,可以接受零假设。17n例:例:男性矽肺患者的血红蛋白(男性矽肺患者的血红蛋白(g/dlg/dl)的均数为)的均数为12.5912.59(g/dlg/dl),标准差为),标准差为1.631.63(g/dlg/dl),已知男性健),已知男性健康成人

8、的血红蛋白正常值为康成人的血红蛋白正常值为14.0214.02(g/dlg/dl),问),问矽肺患者的血红蛋白是否与健康人不同。矽肺患者的血红蛋白是否与健康人不同。 参数区间估计与假设检验的一致性参数区间估计与假设检验的一致性18n假设检验假设检验l先假设先假设 等于等于 0 0,再判断样本提供的信,再判断样本提供的信息是否支持这种假设,若不支持,则可息是否支持这种假设,若不支持,则可推断该样本并非来自已知均数的总体。推断该样本并非来自已知均数的总体。 n区间估计区间估计l判断样本信息估计的总体均数判断样本信息估计的总体均数 之可之可信区间是否覆盖已知的总体均数信区间是否覆盖已知的总体均数 0

9、 0 ?若不覆盖,则可推断该样本并非来自已若不覆盖,则可推断该样本并非来自已知均数的总体。知均数的总体。 解决思路:解决思路:19H0: 14.02,矽肺患者的血红蛋白与健康人相同;,矽肺患者的血红蛋白与健康人相同;H1: 14.02,矽肺患者的血红蛋白与健康人不同矽肺患者的血红蛋白与健康人不同。 =0.05=0.05 t t t t0.05,90.05,9=2.262 =2.262 P P 0.050.05 按按 =0.05=0.05的水准,拒绝的水准,拒绝H H0 0,接受,接受H H1 1,差别有统计学意义。,差别有统计学意义。认为认为矽肺患者的血红蛋白与健康人不同矽肺患者的血红蛋白与健

10、康人不同。 2 2. .7 77 74 43 31 10 01 1. .6 63 31 14 4. .0 02 21 12 2. .5 59 9n ns sX Xt t0 02010例男性矽肺患者的血红蛋白(例男性矽肺患者的血红蛋白(g/dl)的均数为)的均数为12.59(g/dl),标),标准差为准差为1.63(g/dl),已知男性健康成人的血红蛋白正常值为),已知男性健康成人的血红蛋白正常值为14.02(g/dl) 本例自由度本例自由度dfdf=10-1=9=10-1=9,经查表得,经查表得t t0.05,90.05,9=2.262=2.262,则,则矽肺患者的血红蛋白总体均数的矽肺患者的

11、血红蛋白总体均数的95%95%置信区间为置信区间为: : (11.424,13.756)g/dl(11.424,13.756)g/dl,不包括男性健康成人的血红蛋白的总体,不包括男性健康成人的血红蛋白的总体均数均数14.0214.02(mg/dlmg/dl),所以说矽肺患者的血红蛋白与健康人不),所以说矽肺患者的血红蛋白与健康人不同。同。)/(4240.1110/63. 1262. 259.129 ,05. 0dlgstXXd dl l) )1 13 3. .7 75 56 60 0( (g g/ /1 10 01 1. .6 63 3/ /2 2. .2 26 62 21 12 2. .5

12、59 9s sX X9,05. 0tX21二、总体平均数二、总体平均数的区间估计和点估计的区间估计和点估计 1. 当为大样本时,不论总体方差当为大样本时,不论总体方差2为为已知或未知,可以利用样本平均数已知或未知,可以利用样本平均数x和总体方和总体方差差2作出置信度为作出置信度为P1-的中体平均数的区的中体平均数的区间估计为:间估计为:),(21xxuxLuxL22xuxL1xuxL2其置信区间的下限其置信区间的下限L1和上限和上限L2为为总体平均数的点估计总体平均数的点估计L为为xuxL23 2. 当样本为小样本且总体方差当样本为小样本且总体方差2未未知时,知时, 2需由样本方差需由样本方差

13、s2来估计,于是来估计,于是置信度为置信度为P1-的总体平均数的总体平均数的置信的置信区间可估计为区间可估计为),(xxstxstx24其置信区间的下限其置信区间的下限L1和上限和上限L2为:为:),(21xxstxLstxL总体平均数的点估计总体平均数的点估计L为:为: xstxLt为正态分布下置信度为正态分布下置信度P1-时的时的 t 临界值临界值25n 25个小麦样本平均蛋白含量个小麦样本平均蛋白含量x14.5,已知已知2.5,求,求95置信度下蛋白质含置信度下蛋白质含量的点估计量的点估计98. 05 .1450. 096. 15 .14xuxL50. 02550. 2nx26例题例题

14、从某渔场收对虾的总体中,随机取从某渔场收对虾的总体中,随机取20尾尾对虾,测的平均体长对虾,测的平均体长 x120mm,标准差,标准差s15mm,试估计置信度为,试估计置信度为99的对虾总体平均的对虾总体平均数数本例中,由于总体方差本例中,由于总体方差2 2未知,需用未知,需用s s2 2估计估计2,当当df20119时,时,t0.012.861。具体计算如。具体计算如下下354.32015nssx27于是对虾体长的区间估计为于是对虾体长的区间估计为)( 6 .129354. 3861. 21202mmstxLx)( 4 .110354. 3861. 21201mmstxLx对虾体长的点估计为

15、:对虾体长的点估计为:)( 6 . 9120354. 3861. 2120mmstxLx说明对虾体长有说明对虾体长有99把握落在把握落在110.4mm129.6mm区间里区间里28三、两个总体平均数差数的区间估计与点估计三、两个总体平均数差数的区间估计与点估计1. 两个总体方差两个总体方差1 12 2和和2 22 2为已知,总体为已知,总体方差方差12和和22未知但为大样本时,在置信度为未知但为大样本时,在置信度为P1- 下,两个总体平均数差数下,两个总体平均数差数1 1- -2 2的区间的区间估计为:估计为:2121)( ,2121xxxxuxxuxx292121xxuxxL两个总体平均数差

16、数两个总体平均数差数 1 1-2 2的点估计为的点估计为其置信区间的下限其置信区间的下限1和上限和上限L2为:为:2121)(,212211xxxxuxxLuxxL302. 两个样本为小样本,总体方差两个样本为小样本,总体方差12和和22未知,未知,当当两总体方差具有同质性两总体方差具有同质性,即,即12 22 2时,可由时,可由两样本方差两样本方差s12和和s22估计总体方差估计总体方差12和和22,在置信度为在置信度为P1- 下,两总体平均数差数下,两总体平均数差数 1 1-2 2的区间估计为:的区间估计为:2121)( ,2121xxxxstxxstxx31两个总体平均数差数两个总体平均

17、数差数 1 1-2 2的点估计为:的点估计为:2121xxstxxL其置信区间的下限其置信区间的下限1和上限和上限L2为:为:2121)(,212211xxxxstxxLstxxL32两个总体平均数差数两个总体平均数差数1-2的点估计为:的点估计为:21,21xxdfstxxLt,df 为置信度为为置信度为P=1- 时自由度为时自由度为df 的的t临界值。临界值。33用高蛋白和低蛋白两种饲料饲养一月龄大白鼠,在用高蛋白和低蛋白两种饲料饲养一月龄大白鼠,在三个月时,测定两组大白鼠的增重重量(三个月时,测定两组大白鼠的增重重量(g),两组),两组的数据分别为:的数据分别为: 高蛋白组:高蛋白组:1

18、34,146,106,119,124,161, 107, 83,113,129,97,123 , 低蛋白组:低蛋白组:70,118,101,85,107,132,94 试进行置信度为试进行置信度为95时两种蛋白饲料饲养的大白鼠时两种蛋白饲料饲养的大白鼠增重的差数区间估计和点估计。增重的差数区间估计和点估计。例题例题34005.1021 xxsgxgx00.101,17.12021110.2,1705.0tdf其置信度为其置信度为95时两种蛋白饲料饲养的大白鼠时两种蛋白饲料饲养的大白鼠增重的差数区间估计为:增重的差数区间估计为:)(94.1005.10110.2)00.10117.120(212

19、1gstxxLxx)(284.40005.10110.2)00.10117.120(2121gstxxLxx已算得已算得35两种蛋白质饲料饲养的大白鼠增重的差数点估计为:两种蛋白质饲料饲养的大白鼠增重的差数点估计为:)(11.2117.19005.10110. 2)00.10117.120(2121gstxxLxx36当两样本为成对资料时,在置信度为当两样本为成对资料时,在置信度为P1- 时,两总体平均数差数时,两总体平均数差数1-2的置信区间可估的置信区间可估计为:计为:其置信区间的下限其置信区间的下限1和上限和上限L2为:为:ddstdstd,ddstdLstdL21,两个总体平均数差数两

20、个总体平均数差数1-2的点估计为:的点估计为:dstdL37EAEA对其进对其进行置信度为行置信度为99的区间的区间估计和点估计。估计和点估计。38于是,两种饲料饲养下动物肝脏中维生素于是,两种饲料饲养下动物肝脏中维生素A含量差数的区间含量差数的区间估计为:估计为:)g(IU.dstdL17413613193499358121)(26.148813.193499. 35 .81221gIUstdLd已算得已算得499. 3, 713.193,5 .81201. 011tdfgIUsgIUdd 说明两种饲料饲养下动物肝脏中维生素说明两种饲料饲养下动物肝脏中维生素A含量差数有含量差数有99的的把握

21、落在把握落在136.74IUg-11488.26 IUg-1的区间里。的区间里。39两种饲料饲养下动物肝脏中维生素两种饲料饲养下动物肝脏中维生素A含含量差数的点估计为:量差数的点估计为:)(76.6755 .81213.193499. 35 .8121gIUstdLd40四、总体频率、两总体频率差四、总体频率、两总体频率差数的区间估计和点估计数的区间估计和点估计在置信度在置信度1- 下,对一下,对一个总体频率个总体频率P的区间估计为:的区间估计为:ppupup,41总体频率总体频率p的点估计的点估计L为:为:pupL其置信区间的下限其置信区间的下限1和上限和上限L2为:为:ppupLupL21

22、,42当样本容量较小或者当样本容量较小或者np、nq远小于远小于30时,时,对总体频率对总体频率p进行的区间估计和点估计,需进行的区间估计和点估计,需要做连续性校正,其校正公式为:要做连续性校正,其校正公式为:nupLnupLpp5 . 0,5 . 021总体频率总体频率p的点估计为:的点估计为:nupLp5 . 043在进行两个总体频率在进行两个总体频率p1-p2的的区间估计和点估计时,一般应明区间估计和点估计时,一般应明确两个频率有显著差异才有意义。确两个频率有显著差异才有意义。在置信度为在置信度为P1-下,两总体下,两总体频率差数频率差数p1-p2的区间估计为的区间估计为) ( ,)(2

23、1212121ppppuppupp44其置信区间的下限其置信区间的下限1和上限和上限L2为:为:)(,)(2121211211ppppuppLuppL两总体频率差数两总体频率差数p1-p2的点估计的点估计L为:为:2121) (ppuppL45例例 调查调查100株玉米株玉米,得到受玉米螟危害的为得到受玉米螟危害的为20株,即株,即p0.2或或np20。试进行置信度为。试进行置信度为95的玉米螟为害率的区间估的玉米螟为害率的区间估计和点估计。计和点估计。04. 0100)20. 01 (20. 0)1 ( nppp0.05,0.051.96于是,置信度为于是,置信度为95的玉米螟为害率的区间估

24、计为:的玉米螟为害率的区间估计为:1216. 004. 096. 12 . 01pupL2784. 004. 096. 12 . 02pupL46玉米螟为害率的点估计为:玉米螟为害率的点估计为:0784.02 .004.096.12 .0pupL47试进行置信度为试进行置信度为99的两块麦田锈病发病率差数的的两块麦田锈病发病率差数的区间估计和点估计。区间估计和点估计。计算得计算得790.0,905.021pp026. 021pps由于由于np、nq均大于均大于30,故可以用,故可以用2121pppps估计例例:研究地势对小麦锈病发病的影响:研究地势对小麦锈病发病的影响低洼地麦田低洼地麦田378378株,其中锈病株株,其中锈病株342342株株高坡地麦田高坡地麦田396396株,其中锈病株株,其中锈病株313313株株48当当P0.99时,时, 0.01

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论