卫生统计学重点笔记_第1页
卫生统计学重点笔记_第2页
卫生统计学重点笔记_第3页
卫生统计学重点笔记_第4页
卫生统计学重点笔记_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医师资格测试蓝宝书-预防医学医学统计学方法第一节根本概念和根本步骤非常重要一、统计工作的根本步骤设计最关键、决定成败、搜集资料、整理资料、分析资料.总体:根据研究目的决定的同质研究对象的全体,确切地说,是性质相同的所有 观察单位某一变量值的集合. 总体的指标为参数.实际工作中,经常是从总体中随机抽取一定数量的个体,作为样本,用样本信息来推断总体特征.样本的指标为统计量.由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一局部个体, 这种由抽样引起的差异称为抽样误差. 抽样误差愈小,用样本推断总体的精确度愈高; 反之,其精确度愈低.某事件发生的可能性大小称为概率, 用P表示,在01之间

2、,0和1为肯定不发 生和肯定发生,介于之间为偶然事件,0.05或0.01为小概率事件.二、变量的分类变量:观察单位的特征,分数值变量和分类变量.第二节数值变量数据的统计描述重要考点一、描述计量资料的集中趋势的指标 有1 .均数 均数是算术均数的简称,适用于正态或近似正态分布.2 .几何均数 适用于等比资料,尤其是对数正态分布的计量资料.对数正态分布 即原始数据呈偏态分布,经对数变换后用原始数据的对数值lgX代替X服从正态分布,观察值不能为0,同时有正和负.3,中位数一组按大小顺序排列的观察值中位次居中的数值.可用于描述任何分 布,特别是偏态分布资料的集中位置,以及分布不明或分布末端无确定数据资

3、料的中 心位置.不能求均数和几何均数,但可求中位数.百分位数是个界值,将全部观察值 分为两局部,有X%比小,剩下的比大,可用于计算正常值范围.二、描述计量资料的离散趋势的指标1,全距和四分位数间距.3 .方差和标准差 最为常用,适于正态分布,既考虑了离均差观察值和总体均 数之差,又考虑了观察值个数,方差使原来的单位变成了平方,所以开方为标准差. 均为数值越小,观察值的变异度越小.4 .父异系数多组间单位不同或均数相假设较大的情况.变异系数计算公式为: CV=S/XX100%,公式中s为徉本标准差,X为样本均数.三、标准差的应用表示观察值的变异程度或离散程度.在两组或几组资料均数相近、度量单位相

4、同的条件下,标准差大,表示观察 值的变异度大,即各观察值离均数较远,均数的代表性较差;反之,表示各观察值多 集中在均数周围,均数的代表性较好.常考!四、医学参考值的计算方法,单双侧问题,医学为 95%医学参考值是指正常人体或动物体的各种生理常数,由于存在变异,各种数据不 仅因人而异,而且同一个人还会随机体内外环境的改变而改变,因而需要确定其波动 的范围,即正常值范围._ 医学参考值的计算公式:正态分布资料 95%医学参考值:x± 1.96s 双侧; x +1.645s或x-1.645s 单侧,s为标准差.百分位数法 国 和P97.5 双侧;P5 或P95 单侧.第三节数值变量数据的统

5、计推断重要考点一、标准误,标准误与标准差和样本含量的关系标准差和标准误的区别.样本标准误等于样本标准差除以根号下样本含量.标准误与标准差成正比;与样 本含量的平方根成反比.因此.为减少抽样误差,应尽可能保证足够大的样本含量.样本标准差与样本标准误是既有联系又有区别的两个统计量,二者的联系是公式:二者的区别在于:样本标准差是反映样本中各观测值X1, %,Xn变异程度大小的一个指标,它的大小说明了对该样本代表性的强弱.样本标准误是样本平均数1, 2,的标准差,它是抽样误差的估计值,其大小说明了样本间变异程度的大小及精确性的上下.掌握!二、t分布和标准正态u分布关系均以0为中央左右两侧完全对称的分布

6、,只是 t分布曲线顶端较u分布低,两端 翘.v逐渐增大,t分布逐渐逼近u分布.正态分布的特点:以均数为中央左右两侧完全对称分布;两个参数,均数 u 位置参数和s 变异参数;对称均数的两侧面积相等.三、总体均数的估计样本统计量推算总体均数有两个重要方面:区间估计和假设检验.样本均数估计 总体均数称点估计.总体均数区间估计可信区间 的概念:按一定的可信度估计未知总体均数所在 范围.其统计上习惯用95% 或99%可信区间表示总体均数w有 95% 或99% 的可能在某一范围.可信区间的两个要素,一为准确度,反映在可信度1- %的大小,即区间包含总体均数的概率大小,当然愈接近1愈好;二是精度,反映在区间

7、的长度, 当然长度愈小愈好.在样本例数确定的情况下,二者是矛盾的,需要兼顾.总体均数可信区间的计算方法:1 .当n小按t分布的原理用式计算可信区间为:X 土t a/2, vSx2 .当n足够大 因n足够大时,t分布逼近w分布,按正态分布原理.用式估计 可信区间为:X ± a/2S- X可信区间与医学参考值范围的区别:二者的意义和算法不同.四、假设检验的步骤1 .建立假设:H 无效,两样本代表的总体均数相同,H 备择,两样本来自不 同总体,当拒绝H0就接受H,不拒绝就不接受H.2 .确定显著性水平:区分大概率和小概率事件的标准,通常取 =0.05.3 .计算统计量:根据资料类型和分析目

8、的选择适当的公式计算.4 .确定概率P值:将计算得到的t值或u值查界值表得到P值和值比较.5 .做出推断结论.I t 1值、P值与统计结论aI t |值P值统计结论0.05<t0.05 (v)>0.05不拒绝H0,差异无统计学意义0.05>t0.05 (v)<0.05拒绝接受H,差异有统计学意义0.01>t0.01 (v)<0.01拒绝接受H,差异由高度统计学意义五、两均数的假设检验常考!1 .样本均数与总体均数比较 u检验和t检验用于样本均数与总体均数的比较.理论上要求样本来自正态分布总体实际中,只要样本例数n较大,或n小但总体标准差",就选用u

9、检验.n较小且0未知时,用于t检验.两样本均数比较时还要 求两总体方差等.以算得的统计量t,按表所示关系作判断2 .配对资料的比较 在医学研究中,常用配对设计.配对设计主要有四种情况: 同一受试对象处理前后的数据;同一受试对象两个部位的数据;同一样品用两 种方法仪器等检验的结果;配对的两个受试对象分别接受两种处理后的数据. 情况的目的是推断其处理有无作用;情况、的目的是推断两种处理方法 等的结果有无差异.t d 0dSd Sd/ nv=对子数-1 ;如处理前后或两法无差异,那么其差数 d的总体均数应为0,可看作 样本均数d和总体均数0的比较.d为差数的均数;sd为差数均数的标准误,S为差 数的

10、标准差;n为对子数.因计算的统计量是t,按表所示关系作判断.3,完全随机设计的两样本均数的比较亦称成组比较.目的是推断两样本各自代表的总体均数w i与.是否相等.根据样本含量n的大小,分u检验与t检验.t检验用于两样本含量ni、件较小时,且要求两总体方差相等,即方差齐.假设被 检验的两样本方差相差显著那么需用t '检验.u检验:两样本量足够大,n>50.t 一 一 SXi再Q Q2 nl " 2 %.%( n1n2)S2 S2(ni-1) S2(ni-1)n1 n2 - 2v=(ni-1)+(n 2-1)=n 1+n2-2式中s彳=,为两样本均数之差的标准误,Sc2为合

11、并估计方差(combined estimate 人1 X2variance ).算得的统计量为t,按表所示关系做出判断.4 . I型错误和II型错误弃真,拒绝正确的H0为I型错误表示,假设显著性水平口定为0.05,那么犯I型错误的概率0.05;接受错误的H0为II型错误,概率用(3表示, B值的大小很难确切估计.当样本含量一定时,两者反比,增大 n,当口 一定时,可 减少(3.1- B称为检验效能或把握度,其统计意义是假设两总体确有差异,按口水准能 检出其差异的水平.客观实际拒绝H0不拒绝H)H0成立I型错误(0c)推断正确1- %H0不成立推断正确1- B II型错误B 5 .假设检验本卷须

12、知 保证组间可比性;根据研究目的、资料类型和设计类型选 用适当的检验方法,熟悉各种检验方法的应用条件;“显著与否是统计学术语,为“有无统计学意义,不能理解为“差异是不是大;结论不能绝对化.第四节 分类变量资料的统计描述一般考点相对数是两个有关联事物数据之比. 常用的相对数指标有构成比、率、相比照等.一、构成比表示事物内部各个组成局部所占的比重, 通常以100为例基数,故又称为百分比其公式如下:构成比=x 100%事物内部某一构成局部 的个体数事物内部各构成局部的个体数总和该式可用符号表达如下:构成比=A bAc S构成比有两个特点:1各构成局部的相对数之和为100%.2某一局部所占比重增大,其

13、他局部会相应地减少二、率用以说明某种现象发生的频率或强度,故又称频率指标,以 100, 1000, 10000或100000为比例基数K均可,原那么上以结果至少保存一位整数为宜,其计算公式为:率和构成比不同之处:率的大小仅取决于某种现象的发生数和可能发生该现象的总数,不受其他指标的影响,并且各率之和一般不为1.率=某现象实际发生例数可能发生某现象的总数该式亦可用符号表达如下A,、阳性率=x K 假设算阴性率那么分子为 A-A A'/式中A+为阳性人数,A-为阴性人数.三、相比照表示有关事物指标之比照,常以百分数和倍数表示,其公式为:相比照:甲指标/乙指标或X 100%或用符号表示为:A

14、/BXK四、本卷须知构成比和率的不同,不能以比代率;计算相对数时,观察例数不宜过小; 率的比较注意可比性,特别是混杂因素的问题,有的话,可用标准化法和分层分析消 除;观察单位不同的几个率的平均率不等于几个率的算术均数;样本率或构成比的比较应做假设检验第五节分类变量资料的统计推断非常重要一、率的抽样误差用抽样方法进行研究时,必然存在抽样误差.率的抽样误差大小可用率的标准误 来表示,计算公式如下:T p=兀1兀n式中:op为率的标准误,兀为总体阳性率,n为样本含量.由于实际工作中很难 知道总体阳性率兀,故一般采用样本率 P来代替,而上式就变为Sp=P1P:n二、总体率的可信区间由于样本率与总体率之

15、间存在着抽样误差,所以也需根据样本率来推算总体率所 在的范围,根据样本含量n和样本率P的大小不同,分别采用以下两种方法:一正态近似法常考!当样本含量n足够大,且样本率P和1-P均不太小,如nP或n 1-P均n 5 时,样本率的分布近似正态分布.那么总体率的可信区间可由以下公式估计:总体率兀的95%可信区间:p± 1.96s p总体率兀的99%可信区间:p± 2.58s p二查表法 当样本含量n较小,如nW 50,特别是P接近0或1时,那么按二 项分布原理确定总体率的可信区间,其计算较繁,读者可根据样本含量n和阳性数x参照专用统计学介绍的二项分布中 95 %可信限表.三、u检

16、验非常重要!当样本含量n足够大,且样本率P和1-P均不太小,如nP或n 1-P均n 5 时,样本率的分布近似正态分布.样本率和总体率之间、两个样本率之间差异的判断 可用u检验.6 .样本率和总体率的比较公式 u= | P-兀| / T P= | P-兀| / J兀1兀n ;7 .两样本率比较公式 u= I P1-P2 I /Sp1-P2= I P1-P2 I / v,pc1 pc1/n1 1/n2也可用X 2检验,两者相等.四、X2检验非常重要!可用于两个及两个以上率或构成比的比较;两分类变量相关关系分析.其数据构 成,一定是相互对立的两组数据,四格表资料自由度V永远=1.四格表X 2检验各种

17、公式适用条件,n>40且每个格子T>5,可用根本公式或专用 公式,不用校正.根本公式:X 2=万(A-T) 2/T专用公式:/ 2=E (ad-bc) 2n/ (a+b) (c+d) (a+c) (b+d)只要有一个格子T在15之间,需校正.校正公式:根本公式:x 2=汇(| A-T | -0.5 ) 2/T专用公式:/ 2=E ( | ad-bc | -n/2 ) 2n/ (a+b) (c+d) (a+c) (b+d)n<40或T<1,用确切概率法.五、行X列表 2检验当行数或列数超过2时,称为行X列表.行X列表 2检验是对多个样本率(或 构成比)的检验.适用条件:一

18、般认为行X列表中不宜有1/5以上格子的理论数小于5,或有小于1的理论数.1 .当理论数太小可采取以下方法处理增加样本含量以增大理论数; 删去上述理论数太小的行和列;将太小理论数所在组与性质相近的组合并,使重新计算的 理论数增大.由于后两法可能会损失信息,损害样本的随机性,不同的合并方式有可 能影响推断结论,故不宜作常规方法.另外,不能把不同性质的实际数合并,如研究 血型时,不能把不同的血型资料合并.2 .如检验结果拒绝检验假设,只能认为各总体率或总体构成比之间总的来说有差 别,但不能说明它们彼此之间都有差异,或某两者间有差异.3,关于单向有序行列表的统计处理在比较各处理组的效应有无差异时, 宜

19、用秩和检验法,如作x 2检验只说明各处理组的效应在构成比上有无差异.六、配对计数资料的x 2检验同一样品用两种方法处理,观察阳性和阴性个数.判断两种处理方法是否相同.当 b+c>40 时,x 2= (b-c) 2/b+c ; b+c<40 时,校正公式:/ 2= ( | b-c | -1 ) 2/b+c第六节直线相关和回归(一般考点)一、直线相关分析的用途、相关系数及其意义相关分析是研究事物或现象之间有无关系、关系的方向和密切程度.相关系数:是定量表示两个变量(X, Y)之间线性关系的方向和密切程度的指标, 用r表示,r=lxy/ %ixxlxy ,其值在-1至+1间,r没有单位.

20、r呈正值,两变量间呈正 相关,即两者的变化趋势是同向的,r=1时为完全正相关;如r呈负值,两变量呈负 相关,即两者的变化趋势是反向的,r=-1时为完全负相关.r的绝对值越接近1,两 变量间线性相关越密切;越接近于 0,相关越不密切.当r=0时,说明X和Y两个变 量之间无直线关系.二、直线回归分析的作用、回归系数及其意义直线回归分析的任务在于找出两个变量有依存关系的直线方程,以确定一条最接近于各实测点的直线,使各实测点与该线的纵向距离的平方和为最小.这个方程称为直线回归方程,据此方程描绘的直线就是回归直线.直线同归方程式的一般表达式Y=a+bX式中a为回归直线在Y轴上的截距,即a>0表示直线与Y轴的交点在原点上方, <0在原点下方,a=0过原点.b为样本回归系数,即回归直线的斜率,表示当X变动一个单位时,Y平均变动b 个单位.b>0:表示Y随X增大而增大b<0:表示Y随X增大而减少b=0:表示Y不随X变化而变化第七节统计表和统计图重要考点一、统计表原那么:结构简单、层次清楚、内容安排合理、重点突出、数据准确.1 .标题 简练

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论