卫生统计学专题六:总体均数与总体率的估计_第1页
卫生统计学专题六:总体均数与总体率的估计_第2页
卫生统计学专题六:总体均数与总体率的估计_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题六总体均数与总体率的估计样本均数〔或样本率〕不能直接作为总体均数〔或总体率〕的估计,而应该考虑抽样误差的存在,借助抽样分布对总体均数〔或总体率〕做出估计。一、均数的抽样误差由个体变异产生的,随机抽样引起的样本统计量与总体参数之间的差异称为抽样误差。在抽样研究中,抽样误差是不可防止的。二、样本均数的分布及标准误⒈样本均数的分布:服从正态分布,样本均数大局部分布在总体均数的左右,中间多,两边少,左右根本对称。⒉标准误样本均数的标准差标准误σxσx说明个样本均数围绕总体均数的离散程度,可用来反映样本均数的抽样误差的大小。在抽样研究中,总体标准差常常未知,一般用样本标准差作为总体标准差的估计值。理论公式: x n

s实际公:s x n注:⒈σx性越小。σx靠性越大。⒉标准差与标准误的区别:①标准差表示个体差异的大小;标准误描述样本均数的变异程度,说明抽样误差的大小。②标准差描述资料的频数分布状况,可用于制定医学参考值范围;而标准误用于总体均数的区间估计和假设检验。n〔μ,σN〔μ,σx⒋标准误的大小与标准差σn的平方根成反比。在实际工作中,可通过适当增加样本含量来减小抽样误差。三、t分布根据数理统计和中心极限定理:从均数为μ,标准差为σnx均数为μ,标准差为σ/n的正态分布;即使从均数为μ,标准差为σ的偏态总体中随机抽样,当样本含量足够大时,样本均数的分布逐渐逼近于均数为μ,标准差为σx的正态分布。xxzN〔μ,σxN〔0,1z变换而是t变换。理论证明该统计量服从自由度为n-1的t分布。⒈t分布曲线与分布的特征如右图,t分布的特征有:

xt= sx

xu= sn

υ=n-1⑴单峰分布,在t=0处最高,且以0为中心左右对称。⑵不同自由度对应不同的t分布,t分布曲线是一簇曲线。⑶υ越小,t值越分散,曲线越平阔,尾部越高;随着υ增大,t值越集中,曲线越尖峭,尾部越低。⑷υ趋于∞时,t分布逼近标准正态分布〔z分布〕。【说明】⒈t分布的极限分布为z分布。⒉t分布不是一条曲线,是一簇曲线,不同ν曲线下面积的分布是不同的,tt同面积。⒊t分布中,无论自由度为多少时,t分布曲线下的面积都为1。⒉t界值表t分布曲线下的尾部面积〔即概率P〕与横轴tt4t界值表:横标目为自由度υ,纵标目为概率P。t界值:表中数字表示当υ和P确定时,单侧或双侧尾部面积Pt假设P等于某预指定的α,那么:单侧尾端概率(one-tailedprobability)t界值,即单侧尾部面积Pt界值用tα,υ表示。(two-tailedprobability)t界值,即两侧尾部面积Pt界值用tα/2,υ表示。⒊t分布规律单侧:P〔t≤-tα,υ〕=α或P〔t≥tα,υ〕=α。双侧:P〔t≤-tα/2,υ〕+P〔t≥tα/2,υ〕=α,那么图中非阴影局部面积的概率为P〔-tα/2,υ<t<tα/2,υ〕=1-α从t界值表可以看出:⑴自由度相同时,t界值越大其对应的P值越小,反之亦然。⑵概率P〔或尾部面积〕相等时,υ越大,t界值越小。⑶t界值相等时,双侧概率为单侧概率的两倍。⑷υtz界值。例如,t0.05/20.05/2=1.96四、总体均数的估计统计推断的内容:参数估计〔包括点估计与区间估计〕和假设检验。参数估计:指用样本指标〔统计量〕估计总体指标〔参数〕。⒈点估计●方法:将样本统计量直接作为总体参数的估计值。●缺点:未考虑抽样误差的影响,估计的正确程度很难评价。⒉区间估计●方法:按事先给定的概率〔1-αCI〔1-α〕:可信度或置信度,也可表示为100〔1-α〕%,常取95%可信区间通常由两个可信限或置信限表示,较小者称为下限〔U⒊总体均数可信区间的计算⑴z分布法①σ时

x

/ nN〔0,1/ n

<z<z

〕=1-α,代入z通过推导可得:α/2 α/2总体均数μ双侧可信区间为〔xz ,xz 〕或简写为xz /2 x /2 x /2 x单侧可信区间为:μ>xz 或μ<xz x x②σ未知时,但n足够大〔n>50〕时,s 接近 ,t分布逼近z分布,那么x x总体均数μ双侧可信区间为〔xz s,xz s〕或简写为xz s/2x /2x /2x单侧可信区间为:μ>xzsx或μ<xzs x⑵t分布法

x t tσ未知时,t= sx

n-1t分布,此时P〔-

α/2,υ〕=1-α,代入t通过推导可得:总体均数μ双侧可信区间为〔xt s,xt s〕或简写为xt s/x /x /2, x单侧可信区间为:μ>xt s, x

或μ<xt s, x【说明】当σ未知时,无论n是否足够大,可信区间均可采用t分布法计算,采用t界值计算的可信区间更加确切。⒋总体均数的95%可信区间的含义95%95%五、二项分布对于n次独立的试验,如果每次试验结果出现且只出现对立事件A与A之一,在每次试验中出现A的概率是常数π〔0<π<1〕,因而出现对立事件A的概率是1-π,那么称这一串重复的独立试验为n重贝努力试验,简称Bernolli试验。Bernolli试验条件:①每次试验只有两种互斥的结果;②在相同条件下独立重复n次试验,所谓“独立〞即各次实验结果互不影响;③每次试验中A发生的概率都相同,各次试验条件相同。⒈二项分布的概念nxAx0,1,2,…,n概率函数为P〔x=k〕=C

kk)nk k=0,1,2,…,n n

n!k!n (nk)!k!X服从参数为n和π的二项分布,记为X~Bn,π⒉二项分布的概率⑴二项分布是一种离散型概率分布。 ⑵二项分布的概率之和等于1,即k0

kk)nk=[π+〔1-πn⑶单侧累积概率:m例阳性:P〔〕

mk

Ckk)nkn至少m例阳性:P〔x≥m〕=1-P〔x≤m-1〕⒊二项分布的均数与标准差设X~B〔n,π〕,那么有阳性结果发生数X的总体均数μ=nπ;总体方差2n) 总体标准差 n根据中心极限定理,n较大,nπ与n1-π〕较接近时,二项分布接近于正态分布;⑵当n→∞时,二项分布B〔n,π〕的极限分布是总体均数位nπ,总体方差为nπ〔1-π〕的正态分布N[nπ,nπ〔1-π〕]。六、Poisson分布⒈Poisson分布的概念 k假设随机变量X的可能取值为0,1,2,…,其概率分布为〔x=k= e

,k=0,1,2,…;那么称x服从参数为μ的Poisson分布,记为X~Ⅱ〔μ。 k!k为观察单位中某稀有时间发生的次数;μ>0,为某一常数;e=2.7182…是自然对数的底数。⒉Poisson分布的应用泊松分布是一种重要的离散型概率分布,用于描述在单位时间或空间内随机事件发生的次数。特点:罕见事件〔发生概率很小〕而观察例数n很大的二项分布,可将较难计算的二项分布转换为泊松分布去处理。μ为泊松分布所依赖的唯一参数,表示单位时间〔或单位面积、单位空间〕内某随机事件平均发生数,即总体均数。⒊Poisson分布的图形μ=nπμ值越小,分布越不对称,随μ的增大,Poisson注:当μ=20时,泊松分布接近于正态分布,在实际工作中,当μ≥20时,就可以用正态分布来近似地处理泊松分布的问题。⒋Poisson分布的特征⑴总体均数与总体方差相等。⑵可加性:m个互相独立的随机变量X1,X2,…,Xm分别服从μ1,μ2,…,μm的泊松分布,那么其和x1+x2+…+xm也服从均数为μ1+μ2+…+μm的泊松分布。可加性的应用:将假设干个相互独立的小观察单位合并成一个大的观察单位,从而使均数μ≥20,以便将服从泊松分布的资料按正态分布近似处理。七、总体率的估计抽样资料计算样本率不能直接代替总体

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论