c可信区间演示文稿_第1页
c可信区间演示文稿_第2页
c可信区间演示文稿_第3页
c可信区间演示文稿_第4页
c可信区间演示文稿_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

c可信区间演示文稿现在是1页\一共有41页\编辑于星期日优选c可信区间现在是2页\一共有41页\编辑于星期日2023/4/213主要内容

可信区间的概念均数的可信区间率的可信区间事件数的可信区间现在是3页\一共有41页\编辑于星期日基本概念回顾总体个体、个体变异总体参数未知样本代表性、抽样误差随机抽样样本统计量已知统计推断风险现在是4页\一共有41页\编辑于星期日2023/4/215统计推断的内容参数估计(parameterestimation)假设检验(hypothesistest)现在是5页\一共有41页\编辑于星期日2023/4/216参数估计由样本统计量估计总体参数

点估计(pointestimation)区间估计(intervalestimation)现在是6页\一共有41页\编辑于星期日2023/4/217参数估计之一:点估计用样本统计量作为总体参数的估计

例如:用样本均数作为总体均数的一个估计现在是7页\一共有41页\编辑于星期日2023/4/218点估计的缺陷m=?cm,s=?cmx1,x2,x3,x4……

N

=143.37

s=5.23x1,x2,x3…x10

=144.07s=4.72x1,x2,x3…x10

=142.72

s=9.2473x1,x2,x3…x10样本含量n=10现在是8页\一共有41页\编辑于星期日2023/4/219点估计直接用样本统计量作为总体参数的估计值方法简单,但未考虑抽样误差的大小在实际问题中,总体参数往往是未知的,但它们是固定的值,并不是随机变量值。而样本统计量随样本的不同而不同,属随机的。

现在是9页\一共有41页\编辑于星期日2023/4/2110区间估计按一定的概率或可信度(1-)用一个区间估计总体参数所在范围,这个范围称作可信度为1-的可信区间(confidenceinterval,CI),又称置信区间。这种估计方法称为区间估计。现在是10页\一共有41页\编辑于星期日2023/4/2111可信区间的两个要素可信度(1-),可靠性一般取90%,95%。可人为控制。精确性是指区间的大小(或长短)兼顾可靠性、精确性现在是11页\一共有41页\编辑于星期日2023/4/21124.2均数的可信区间基础:抽样误差理论从正态分布总体中随机抽取一个样本,则t值接近于0的可能性较大,远离0的可能性较小,出现太大的t值和太小的t值的可能性更小,根据t分布的性质,现在是12页\一共有41页\编辑于星期日2023/4/2113均数的可信区间

总体均数的(1-)可信区间定义为:

现在是13页\一共有41页\编辑于星期日2023/4/2114影响可信区间大小的因素可信度可信度越大,区间越宽个体变异变异越大,区间越宽样本含量样本含量越大,区间越窄现在是14页\一共有41页\编辑于星期日2023/4/2115当样本含量较大时,例如n>100,t分布近似标准正态分布,此时可用标准正态分布代替t分布,作为可信区间的近似计算。相应的100(1-)%可信区间为:

现在是15页\一共有41页\编辑于星期日2023/4/2116例4.1随机抽取12名口腔癌患者,检测其发锌含量,得均数为253.05g/g,标准误为27.18g/g,求发锌含量总体均数95%的可信区间。现在是16页\一共有41页\编辑于星期日2023/4/2117-tt0自由度n概率,P单侧0.250.200.100.050.0250.010.0050.00250.0010.0005双侧0.500.400.200.100.050.020.010.0050.0020.00111.0001.3763.0786.31412.70631.82163.657127.321318.309636.61920.8161.0611.8862.9204.3036.9659.92514.08922.32731.59930.7650.9781.6382.3533.1824.5415.8417.45310.21512.92440.7410.9411.5332.1322.7763.7474.6045.5987.1738.61050.7270.9201.4762.0152.5713.3654.0324.7735.8936.86960.7180.9061.4401.9432.4473.1433.7074.3175.2085.95970.7110.8961.4151.8952.3652.9983.4994.0294.7855.40880.7060.8891.3971.8602.3062.8963.3553.8334.5015.04190.7030.8831.3831.8332.2622.8213.2503.6904.2974.781100.7000.8791.3721.8122.2282.7643.1693.5814.1444.587110.6970.8761.3631.7962.2012.7183.1063.4974.0254.437120.6950.8731.3561.7822.1792.6813.0553.4283.9304.318130.6940.8701.3501.7712.1602.6503.0123.3723.8524.221140.6920.8681.3451.7612.1452.6242.9773.3263.7874.140150.6910.8661.3411.7532.1312.6022.9473.2863.7334.073附表2t界值表现在是17页\一共有41页\编辑于星期日2023/4/21柏建岭讲稿18本例自由度n=12-1=11,经查表得t0.05,11=2.201,则即口腔癌患者发锌含量总体均数的95%可信区间为:193.23~321.87(g/g)。用该区间估计口腔癌患者发锌含量总体均数的可信度为95%。例4.1现在是18页\一共有41页\编辑于星期日2023/4/2119例4.2某地120名12岁男孩身高均数为142.67cm,标准误为0.5477cm,计算该地12岁男孩身高总体均数90%的可信区间。现在是19页\一共有41页\编辑于星期日2023/4/2120-tt0自由度n概率,P单侧0.250.200.100.050.0250.010.0050.00250.0010.0005双侧0.500.400.200.100.050.020.010.0050.0020.00111.0001.3763.0786.31412.70631.82163.657127.321318.309636.61920.8161.0611.8862.9204.3036.9659.92514.08922.32731.59930.7650.9781.6382.3533.1824.5415.8417.45310.21512.92440.7410.9411.5332.1322.7763.7474.6045.5987.1738.61050.7270.9201.4762.0152.5713.3654.0324.7735.8936.86960.7180.9061.4401.9432.4473.1433.7074.3175.2085.95970.7110.8961.4151.8952.3652.9983.4994.0294.7855.40880.7060.8891.3971.8602.3062.8963.3553.8334.5015.04190.7030.8831.3831.8332.2622.8213.2503.6904.2974.781100.7000.8791.3721.8122.2282.7643.1693.5814.1444.587110.6970.8761.3631.7962.2012.7183.1063.4974.0254.437120.6950.8731.3561.7822.1792.6813.0553.4283.9304.318130.6940.8701.3501.7712.1602.6503.0123.3723.8524.221140.6920.8681.3451.7612.1452.6242.9773.3263.7874.140150.6910.8661.3411.7532.1312.6022.9473.2863.7334.0731.64491.96002.5758附表2t界值表现在是20页\一共有41页\编辑于星期日2023/4/2121例4.2n=120>100,标准正态分布代替t分布,u0.10=1.64即该地12岁男孩平均身高的90%可信区间为:141.77~143.57(cm),可认为该地12岁男孩平均身高在141.77~143.57(cm)之间。现在是21页\一共有41页\编辑于星期日2023/4/21224.2.2均数之差可信区间的计算

正常组肝炎组2=?均数:235.21ug/dL标准差:14.39ug/dL1=?均数:271.89ug/dL标准差:10.38ug/dL1-2

=?现在是22页\一共有41页\编辑于星期日2023/4/2123与均数之差有关的抽样分布

“均数之差”与“均数之差的标准误”之比,服从自由度=n1+n2-2的t分布。样本含量较大时,服从标准正态分布。现在是23页\一共有41页\编辑于星期日2023/4/2124合并方差与均数之差的标准误合并方差(方差的加权平均)均数之差的标准误现在是24页\一共有41页\编辑于星期日2023/4/2125计算现在是25页\一共有41页\编辑于星期日4.3率的可信区间1、率的抽样误差及标准误

2、总体率的区间估计

3、两总体率之差1-2的区间估计

现在是26页\一共有41页\编辑于星期日总体率的区间估计

正态近似法当样本例数n足够大,且样本率

p和(1-p)都不太小时,即np和n(1-p)均大于5时,样本率p的抽样分布近似正态分布。现在是27页\一共有41页\编辑于星期日例4.4从某地人群中随机抽取144人,检查乙型肝炎表面抗原携带状况,阳性率为9.20%,求该地人群的乙型肝炎表面抗原阳性率的95%可信区间。本例n=144,p=9.20%,可用近似正态法计算可信区间。先计算:95%可信限为:9.20%±1.96×2.41%,4.48%~13.92%。现在是28页\一共有41页\编辑于星期日精确概率法当样本例数n较小时,特别是当p接近

0或1时,应根据二项分布的原理确定总体率的可信区间。

查表法(附表6)back7现在是29页\一共有41页\编辑于星期日两总体率之差1-2的区间估计如果n1p1,n1(1-p1),n2p2,n2(1-p2)均大于5,则正态近似的方法可用于求总体率之差的可信区间:现在是30页\一共有41页\编辑于星期日2023/4/21314.6正确理解可信区间的涵义

可信区间一旦形成,它要么包含总体参数,要么不包含总体参数,二者必居其一,无概率可言。所谓95%的可信度是针对可信区间的构建方法而言的。以均数的可信区间为例,其涵义是:如果重复100次抽样,每次样本含量均为n,每个样本均按构建可信区间,则在此100个可信区间内,理论上有95个包含总体均数,而有5个不包含总体均数。现在是31页\一共有41页\编辑于星期日2023/4/213295%可信区间的含义

按这种方法构建的可信区间,理论上平均每100次,有95次可以估计到总体参数。现在是32页\一共有41页\编辑于星期日2023/4/2133正确理解可信区间的涵义在区间估计中,总体参数虽未知,但却是固定的值(且只有一个),而不是随机变量值。现在是33页\一共有41页\编辑于星期日2023/4/2134下列说法正确吗?算得某95%的可信区间,则:总体参数有95%的可能落在该区间。有95%的总体参数在该区间内。该区间包含95%的总体参数。该区间有95%的可能包含总体参数。该区间包含总体参数,可信度为95%。现在是34页\一共有41页\编辑于星期日2023/4/2135可信区间与参考值范围的区别

可信区间用于估计总体参数,总体参数只有一个。参考值范围用于估计变量值的分布范围,变量值可能很多甚至无限。95%

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论