卫生统计学重点笔记_第1页
卫生统计学重点笔记_第2页
卫生统计学重点笔记_第3页
卫生统计学重点笔记_第4页
卫生统计学重点笔记_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

创作时间:二零二一年六月三十天医师资格考试蓝宝书-预防医学之答禄夫天创作创作时间:二零二一年六月三十天医学统计学方法第一节基本观点和基本步伐(特别重要)一、统计工作的基本步伐设计(最要点、决定成败)、收集资料、整理资料、剖析资料.整体:依据研究目的决定的同质研究对象的全体,切实地说,是性质同样的所有察看单元某一变量值的会合.整体的指标为参数.实质工作中,常常是从整体中随机抽取必定数量的个体,作为样本,用样本信息来推测整体特色.样本的指标为统计量.因为整体中存在个体变异,抽样研究中所抽取的样本,只包括整体中一部份个体,这类由抽样惹起的不一样称为抽样偏差.抽样偏差愈小,用样本推测整体的精准度愈高;反之,其精准度愈低.小概率事件.二、变量的分类变量:察看单元的特色,分数值变量和分类变量.第二节数值变量数据的统计描述(重要考点)一、描述计量资料的集中趋向的指标有1.均数均数是算术均数的简称,合用于正态或近似正态分创作时间:二零二一年六月三十天创作时间:二零二一年六月三十天布.2.几何均数合用于等比资料,特别是对数正态散布的计量资料.对数正态散布即原始数据呈偏态散布始数据的对数值lgX代替X)听从正态散布时有正和负.

经对数变换后(用原察看值不可以为0,同3.中位数一组按大年夜小次序摆列的察看值中位次居中的数值.可用于描述任何散布,特别是偏态散布资料的集中地点,以及散布不明或散布尾端无确立数据资料的中心地点.不可以求均数和几何均数,但可求中位数.百分位数是个界值,将所有察看值分为两部份,有X%比小,剩下的比大年夜,可用于计算正常值范围.二、描述计量资料的失散趋向的指标全距和四分位数间距.方差和标准差最为常常使用,适于正态散布,既考虑了离均差(察看值和整体均数之差),又考虑了察看值个数,方差使本来的单元酿成了平方,所以开方为标准差.均为数值越小,观察值的变异度越小.变异系数多组间单元分歧或均数相差较大年夜的状况.变异系数计算公式为:CV=s/X×100%,公式中s为样本标准差,X为样本均数.三、标准差的应用示意察看值的变异水平(或失散水平).在两组(或几组)资料均数邻近、怀抱单元同样的条件下,标准差大年夜,示意察看值的变异度大年夜,即各察看值离均数较远,均数的代表性较差;反之,示意各察看值多集中在均数四周,均创作时间:二零二一年六月三十天创作时间:二零二一年六月三十天数的代表性较好.(常考!)四、医学参照值的计算方法,单双侧问题,医学为95%医学参照值是指正凡人体或植物体的各样生理常数,因为存在变异,各样数据不但因人而异,并且同一个人还会随机体内外环境的改变而改变,因此需要确立其挥动的范围,即正常值范围.医学参照值的计算公式:①正态散布资料95%医学参照值:±1.96s(双侧);XX-1.645s(单侧),s为标准差.②百分位数法P和P(双侧);P5或P95(单侧).第三节数值变量数据的统计推测(重要考点)一、标准误,标准误与标准差和样本含量的关系标准差和标准误的差别.样本标准误即是样本标准差除以根号下样本含量.标准误与标准差成正比;与样本含量的平方根成反比.所以.为减少抽样偏差,应尽可能保证足够大年夜的样本含量.样本标准差与样本标准误是既有联系又有区此外两个统计量,二者的联系是公式:二者的差别在于:样本标准差是反应样本中各观察值X1,X2,,Xn变异水平大年夜小的一个指标,它的大年夜小说了然对该样本代表性的强弱.样本标准误是样本均匀数1,2,的标准差,它是抽样偏差的预计值,其大年夜小说了然样本间变异水平的大年夜小及精准性的高低.(掌握!)二、t散布和标准正态u散布关系均以0为中心左右双侧完整对称的散布,不过t散布曲线顶端较u散布低,两头翘.(v渐渐增大年夜,t散布渐渐逼近u散布).创作时间:二零二一年六月三十天创作时间:二零二一年六月三十天正态散布的特色:①以均数为中心左右双侧完整对称散布;②两个参数,均数u(地点参数)和s(变异参数);③对称均数的两正面积相等.三、整体均数的预计样本统计量计算整体均数有两个重要方面:区间预计和假定查验.样本均数预计整体均数称点预计.整体均数区间预计(可信区间)的观点:按必定的可信度估计未知整体均数所在范围.其统计上习习用95%(或99%)可信区间示意整体均数μ有95%(或99%)的可能在某一范围.可信区间的两个因素,一为正确度,反应在可信度1-α的大年夜小,即区间包含整体均数的概率大年夜小,诚然愈靠近1愈好;二是精度,反应在区间的长度,诚然长度愈小愈好.在样本例数确立的状况下,二者是矛盾的,需要兼备.整体均数可信区间的计算方法:1.当n小按t散布的原理用式计算可信区间为:X±tα/2,vSX2.当n足够大年夜因n足够大年夜时,t散布逼近μ散布,按正态散布原理.用式预计可信区间为:X±μα/2SX可信区间与医学参照值范围的差别:二者的意义和算法分歧.四、假定查验的步伐1.成立假定:H0(无效,两样本代表的整体均数同样),H1(备择,两样本来自分歧整体),当拒绝H0就接受H1,不拒绝就创作时间:二零二一年六月三十天创作时间:二零二一年六月三十天不接受H1.2.确立明显性水平:划分大年夜概率和小概率事件的标准,通常取α=0.05.计算统计量:依据资料种类和剖析目的选择适合的公式计算.4.确立概率P值:将计算获取的t值或u值查界值表获取P值和α值比力.做出推测结论.|t|值、P值与统计结论α|t|值P值统计结论<t0.05(v)不拒绝H0,分歧无统计学意义≥t0.05(v)≤拒绝H0,接受H1,分歧有统计学意义≥t0.01(v)≤拒绝H0,接受H1,分歧有高度统计学意义五、两均数的假定查验(常考!)样本均数与整体均数比力u查验和t查验用于样本均数与整体均数的比力.理论上要求样本来自正态散布整体实质中,只要样本例数n较大年夜,或n小但整体标准差σ已知,就采用u检验.n较小且σ未知时,用于t查验.两样本均数比力时还要求两整体方差等.以算得的统计量t,按表所示关系作判断.配对资料的比力在医学研究中,常常使用配对设计.配对设计主要有四种状况:①同一受试对象处理前后的数据;②同一受试对象两个部位的数据;③同同样品用两种方法(仪器等)检验的结果;④配对的两个受试对象分别接受两种处理后的数据.情创作时间:二零二一年六月三十天创作时间:二零二一年六月三十天况①的目的是推测其处理有无作用;状况②、③、④的目的是推断两种处理(方法等)的结果有无分歧.v=对子数-1;如处理前后或两法无分歧,则其差数d的整体均数应为0,可看作样本均数d和整体均数0的比力.d为差数的均数;Sd为差数均数的标准误,Sd为差数的标准差;n为对子数.因计算的统计量是t,按表所示关系作判断.完整随机设计的两样本均数的比力亦称成组比力.目的是推测两样本各自代表的整体均数μ1与μ2能否相等.依据样本含量n的大年夜小,分u查验与t查验.查验用于两样本含量n1、n2较小时,且要求两整体方差相等,即方差齐.若被查验的两样本方差相差明显则需用t′查验.u查验:两样本量足够大年夜,n>50.S=SC2(n1n2)X1X2n1n2v=(n1-1)+(n2-1)=n1+n2-2式中SXX,为两样本均数之差的标准误,Sc2为归并预计方差12(combinedestimatevariance).算得的统计量为t,按表所示关系做出判断.4.Ⅰ型缺点和Ⅱ型缺点弃真,拒绝正确的H0为Ⅰ型缺点α示意,若明显性水平α定为0.05,则犯Ⅰ型缺点的概率0.05;接受缺点的H为Ⅱ型缺点,概率用β示意,β值的大年夜小很难切实0预计.当样本含量一准时,二者反比,增大年夜n,当α一准时,可减少β.1-β称为查验效能或掌控度,其统计意义是若两整体确有创作时间:二零二一年六月三十天创作时间:二零二一年六月三十天分歧,按α水平能检出其差此外能力.客观实质拒绝H不0拒绝H00成立Ⅰ型缺点(α)推测正H确1-αH0不可立推测正确(1-β)Ⅱ型缺点(β)5.假定查验注意事项保证组间可比性;依据研究目的、资料种类和设计种类采用适合的查验方法,熟习各样查验方法的应用条件;“明显与否”是统计学术语,为“有无统计学意义”,不可以理解为“分歧能否是大年夜”;结论不可以绝对化.第四节分类变量资料的统计描述(一般考点)相对数是两个有关系事物数据之比.常常使用的相对数指标有构成比、率、对比较等.一、构成比示意事物内部各个构成部份所占的比重,往常以100为例基数,故又称为百分比.其公式以下:构成比=事物内部某一构成部分的个体数×100%事物内部各构成部分的个体数总和该式可用符号表达以下:构成比=构成比有两个特色:

×100%ABC(1)各构成部份的相对数之和为100%.创作时间:二零二一年六月三十天创作时间:二零二一年六月三十天(2)某一部份所占比重增大年夜,其余部份会相应地减少.二、率用以说明某种现象发生的频次或强度,故又称频次指标,以100,1000,10000或100000为比率基数(K)均可,原则上以结果起码保存一位整数为宜,其计算公式为:率和构成比分歧之处:率的大年夜小仅取决于某种现象的发生数和可能发生该现象的总数,不受其余指标的影响,并且各率之和一般不为1.率=该式亦可用符号表达以下

某现象实质发生例数×K可能发生某现象的总数阳性率=A()×K(若算阴性率则分子为A(-))A()A()式中A(+)为阳性人数,A(-)为阴性人数.三、对比较示意有关事物指标之比较,常以百分数和倍数示意,其公式为:对比较:甲指标/乙指标(或×100%)或用符号示意为:A/B×K四、注意事项①构成比和率的分歧,不可以以比代率;②计算相对数时,观察例数不宜过小;③率的比力注意可比性,特别是混淆因素的问题,有的话,可用标准化法和分层剖析除去;④察看单元分歧的几个率的均匀率不即是几个率的算术均数;⑤样本率或构成比的创作时间:二零二一年六月三十天创作时间:二零二一年六月三十天比力应做假定查验.第五节分类变量资料的统计推测(特别重要)一、率的抽样偏差用抽样方法进行研究时,必定存在抽样偏差.率的抽样偏差大年夜小可用率的标准误来示意,计算公式以下:σπ(1π)p=n式中:σp为率的标准误,π为整体阳性率,n为样本含量.因为实质工作中很难知道整体阳性率π,故一般采用样本率P来取代,而上式就酿成Sp=P(1P)n二、整体率的可信区间因为样本率与整体率之间存在着抽样偏差,所以也需依据样本率来计算整体率所在的范围,依据样本含量n和样本率P的年夜小分歧,分别采用以下两种方法:(一)正态近似法(常考!)当样本含量n足够大年夜,且样本率P和(1-P)均不太小,如nP或n(1-P)均≥5时,样本率的散布近似正态散布.则整体率的可信区间可由以下公式预计:整体率(π)的95%可信区间:p±p整体率(π)的99%可信区间:p±p(二)查表法当样本含量n较小,如n≤50,特别是P接创作时间:二零二一年六月三十天创作时间:二零二一年六月三十天近0或1时,则按二项散布原理确立整体率的可信区间,其计算较繁,读者可依据样本含量n和阳性数x参照专用统计学介绍的二项散布中95%可信限表.三、u查验(特别重要!)当样本含量n足够大年夜,且样本率P和(1-P)均不太小,如nP或n(1-P)均≥5时,样本率的散布近似正态散布.样本率和整体率之间、两个样本率之间差此外判断可用u查验.1.样本率和整体率的比力公式u=|P-π|/σP=|P-π|π(1π)/n;两样本率比力公式u=|P1-P2|/Sp1-P2=|P1-P2|/pc(1pc)(1/n11/n2)也可用χ2查验,二者相等.四、χ2查验(特别重要!)可用于两个及两个以上率或构成比的比力;两分类变量有关关系剖析.其数据构成,必定是互相对峙的两组数据,四格表资料自由度v永久=1.四格表χ2查验各样公式合用条件,n>40且每个格子T>5,可用基本公式或专用公式,不用校订.基本公式:χ2=∑(A-T)2/T专用公式:χ2=∑(ad-bc)2n/(a+b)(c+d)(a+c)b+d)只需有一个格子T在1~5之间,需校订.校订公式:创作时间:二零二一年六月三十天创作时间:二零二一年六月三十天基本公式:χ2=∑(|A-T|-0.5)2/T专用公式:χ2=∑(|ad-bc|-n/2)2n/(a+b)(c+d)a+c)(b+d)n<40或T<1,用切实概率法.五、行×列表χ2查验当行数或列数超越2时,称为行×列表.行×列表χ2查验是对多个样本率(或构成比)的查验.合用条件:一般以为行×列表中不宜有1/5以上格子的理论数小于5,或有小于1的理论数.1.当理论数太小可采用以下方法处理①增添样本含量以增大年夜理论数;②删去上述理论数太小的行和列;③将太小理论数所在组与性质邻近的组归并,使从头计算的理论数增大年夜.因为后两法可能会损失期息,伤害样本的随机性,分歧的归并方式有可能影响推测结论,故不宜作老例方法.此外,不可以把分歧性质的实质数归并,如研究血型时,不可以把分歧的血型资料归并.如查验结果拒绝查验假定,只好以为各整体率或整体构成比之间总的来说有分歧,但不可以说明它们相互之间都有分歧,或某二者间有分歧.3.对于单向有序队列表的统计处理在比力各处理组的效应有无分歧时,宜用秩和查验法,如作χ2查验只说明各处理组的效应在构成比上有无不一样.六、配对计数资料的χ2查验创作时间:二零二一年六月三十天创作时间:二零二一年六月三十天同同样品用两种方法处理,察看阳性和阴性个数.判断两种处置方法能否同样.当b+c>40时,χ2=(b-c)2/b+c;b+c<40时,校订公式:χ2=(|b-c|-1)2/b+c第六节直线有关和回归(一般考点)一、直线有关剖析的用途、有关系数及其意义有关剖析是研究事物或现象之间有没关系、关系的方向和密切水平.有关系数:是定量示意两个变量(X,Y)之间线性关系的方向和亲密水平的指标,用r示意,r=lxy/lxxlxy,其值在-1至+1间,r没有单元.r呈正当,两变量间呈正有关,即二者的改动趋向是同向的,r=1时为完整正有关;如r呈负值,两变量呈负有关,即二者的改动趋向是反向的,r=-1时为完整负有关.r的绝对值越靠近1,两变量间线性有关越亲密;越靠近于0,有关越不密切.当r=0时,说明X和Y两个变量之间无直线关系.二、直线回归剖析的作用、回归系数及其意义直线回归剖析的任务在于找出两个变量有依存关系的直线方程,以确立一条最靠近于各实测点的直线,使各实测点与该线的纵向距离的平方和为最小.这个方程称为直线回归方程,据此方程描述的直线就是回归直线.直线同归方程式的一般表达式Y=a+bX式中a为回归直线在Y轴上的截距,即a>0示意直线与Y轴创作时间:二零二一年六月三十天创作时间:二零二一年六月三十天的交点在原点上方,<0在原点下方,a=0过原点.b为样本回归系数,即回归直线的斜率,示意当X改动一个单元时,Y均匀改动b个单元.b>0:示意Y随X增大年夜而增大年夜b<0:示意Y随X增大年夜而减少b=0:示意Y不随X改动而改动第七节统计表和统计图(重要考点)一、统计表原则:构造简单、头头是道、内容安插合理、要点突出、数据正确.题目精练表达表的中心内容,地点在表的上方.标目有横标和纵标目,横标目往常位于表内左边;纵标目

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论