医学统计学章节重点归纳_第1页
医学统计学章节重点归纳_第2页
医学统计学章节重点归纳_第3页
医学统计学章节重点归纳_第4页
医学统计学章节重点归纳_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医学统计学章节重点归纳第一节概述1、主要内容:a、卫生统计学的基本原理和方法(研究设计和数据处理中的统计理论和方法)b、健康统计(医学人口统计、疾病统计和生长发育统计)c、卫生服务统计(卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理中的统计问题)。2、卫生统计工作的步骤:设计、资料的搜集、资料的整理、资料的分析3、医学统计资料主要四个方计报表、报告卡(单)、日常医疗卫生工作记录,专题研究或实验。4、观察单位:是获得数据的最小单位,观察单位是根据研究目的确定的,观察单位可以是人、标本、家庭、国家等。5、变异:是指客观事物的多样性和不确定性。6、变量:观察单位的某种特征,称为变量。a、数值

2、变量(定量变量)b、分类变量(定型变量或字符变量)。7、总体:根据研究目的所确定的同质研究对象的全体。确切的说是性质相同的所有观察单位的某种变量的集合。8、样本:从总体中随机抽取部分观察单位,其变量值就构成样本,通过样本信息来推断总体特征。9、概率:事件发生的可能性大小的量度,通常以符号P表示。10、误差:测量值与真值之差或样本指标和总体指标之差。分为随机误差和系统误差。第二节数值资料的统计描述1、频数分布就是观察值在所取得范围内分布的情况。重要特征:集中趋势和离散趋势。2、频数分布类型:正态分布型频数、正偏态分布型频数,负偏态分布型频数。3、集中趋势指标:算术平均数(均数)、几何均数、中位数

3、。Oi使用条件计算公式算术平均数适用于正态或近似正态分布'"的数值变量资料x=2-=乙*一匕内陷X=,名"4=三生仁川+%+-九£/几何均数对数正态分布,即数据经过对数变换后呈正态分布的资料;等比级数资料,即观察值之间呈倍数或近似倍数变化的资料。Lr=1g(=1g(中位数非正态分布资料(对数正态分布除外);频数分布的一端或两端无确切数据的资料总体分布不清楚的资料。71+Zj+42/君为奇数,时=占出+中厘_/一+内为偶数,2,Jmd4、离散型趋势指标:极差、标准差和变异系数指标计算公式主要优缺点极差R=Xmax-Xmin计算简单,便于理解;只考虑最大值与最

4、小值之差异,不能反映组内其它观察值的变异度,不稳定,受样本量影响很大。离均差平方和反映了各变重(=为充易之口的变异情况,但单位是原观察值单位的平I褊寸又受观察值个数的影响,不利于比较。N方差标准差变异系数xioo%反映了各变量值之间的变异情况,不受观察值个数的影响,单位与原观察值单位相同,是最常用的离散程度指标之一,但在两组合多组资料比较时,常受到计量单位不同和均数相差很大的影响而不能比较和不便于比较。反映了各变量值之间的变异情况,不受观察值个数的影响,没有单位,用于比较度量衡单位不同或均数相差悬殊的多组资料的变异度。5、正态分布下面积分布规律标准正态分布时区间(-1,1)或正态分布时区间(卢

5、16四+10T)的面积占总面积的68.27%;标准正态分布时区间(-1.96,1.96)或正态分布时区间(:1.966吠1.96吊的面积占总面积的95%;标准正态分布时区间(-2.58,2.58)或正态分布时区间(佑2.58q吐2.58b)的面积占总面积的99%。6、正态分布的应用。a、医学参考值范围b、质量控制c、正态分布是其他一些理论分布的极限形式。第三节总体均数的估计和t检验1、均数的抽样误差:由抽样引起的样本均数与总体均数之差。均数的抽样误差大小用标准误来描述。标准误°sX=。一般不知道总体均数(T,可用样本标准差S来代替:SX=子。2、标准差与标准误的区别与联系:区别:标准

6、差S(b):意义:描述个体观察值变异程度的大小。标准差小,均数对一组观察值得代表性好;应用:与X结合,用以描述个体观察值的分布范围,常用于医学参考值范围的估1t;与n的关系:n越大,S越趋于稳定;标准误S-(b7):意义:描述样本均数变异程XX度及抽样误差的大小。标准误小,用样本均数推断总体均数的可靠性大;应用于X结合,用以估计总体均数可能出现的范围以及对总体均数作假设检验;与n的关系:n越大,S越小。联系:都是描述变异程度的指s标;由S7=三可知,S与S正比。n一定时,XX,ns越大,S-越大。X3、t分布:当X服从均数为科的正态分布时,统计量tXL服从自由度为v=n-1的t分布,是小样本总

7、体均sn反映了各变量值之间的变异情况,不受观察值个数的影响,但单位是原观察值单位的平方,不易理解。数的区间估计及假设检验的理论基础。4、t分布的图形特征:t值得分布于自由度有关。t分布只有一个参数即Vo特征:单山|分布,以0为中心,左右对称;v越小,t值越分散,曲线的峰部越矮,尾部越高;随着v逐渐增大,t分布逐渐接近标准正态分布;当V趋向8时,t分布趋近标准正态分布,故标准正态分布是t分布的特例;t分布是一簇曲线。5、般正态分布转化为标准正态分布就是将变量X转变为标准正态变量Z值。Z=(X-X)/So6、小样本均数可信区间:总体均数科的双侧(-8,X+taVS-)o95%勺可信区间:a,vX1

8、-“)置信区间为X±ta/2vSx;单侧(X-tavSX,皿)或Xx,xX±t“5,vS-;科99%勺可信区间:X±t“1,vS-7、大样本均数可信区间估计:科95%勺可信区间:X+1.96S-;科99%勺可信区间:X±2.58SX8、t检验主要用于两组均属的比较,它能够判断进行比较的两个均数的差别是由于抽样误差引起,还是来自不2同总体。9、t检验应用条件:资料是数值资料分析目的是对两均数进行比较样本例数较少时,资料服从正态分布,做两样本均数比较时,要求两总体方差齐。10、样本均数与总体均数比较的t检验:d11、配对设计的t检验:t-dd0dSdSd/n

9、Sd/n12、两样本均数比较的u检验,两样本均数比较时,如ni和n2均大于100,可用Z检验。S12S2n1X1X2第四节方差分析1、方差分析应用:a、两个或多个样本均数的比较b、分离各有关因素并分别估计其效应c、分析两因素或多因素的交互作用d、方差齐性检验2、方差分析包括:a、完全随机设计的方差分析b、随机区组(配伍组)设计资料的方差分析c、均数间的两两比较。3、方差分析表变异来源自由度均方F值总变异一一2EExij-CN-1F=MS组间/MS组内组间变异汇(Ex)-cK-1SS组间/v组间组内变异SS组内SS总SS组间N-KSS组内/v组内C=(EEXij)2/ni1、方差分析基本条件:a

10、、独立性各样本是相互独立的随机样本b、方差齐性各组实验结果变异程度一致c、正态性各组实验结果都服从正态分布第四节分类资料的统计描述1、常用相对数包括:率、构成比、相对比,玄.发生某现象的观察单位数100%2、罕:率可能发生某现象的观察单位总数率又称频率指标,说明某现象发生的频率或强度,常以100%1000%0等表示。3、构成比又称构成指标,说明某一事物内部各组成部分所占的比重或分布。常以百分数表示。构成比某一组成部分的观察单位数同一事物各组成部分的观察单位总数04、相对比,是A、B两个有关指标之比,说明两者的对比水平,常以倍数或百分数表示,其公式为:相对比指标/乙指标(或100衿5、动态数列常

11、用指标:绝对增减量、发展速度、增减速度、平均发展速度、平均增减速度。6、标化率:在进行几个总率比较时,由于内部构成不同并影响了相互比较的结论时,采用统一的标准对几个总率的内部构成进行矫正后在比较。校正后的总率称标化率或调整率。第六节二项分布及其应用1、二项分布是一种离散型随机变量的分布类型。如果每个观察对象阳性结果的发生概率为兀,阴性结果的发生概率为(1-兀);而且每个观察对象的结果是相互对立的,那么,重复观察n个人,发生阳性结果的人数X的概率分布为而二项分布,记作B(n,兀)。2、二项分布的概率函数P(X)=Cnx兀x(1-兀)n-x3、二项分布适用条件:每次实验只有两种互斥的结果;各次实验

12、互相独立;发生成功事件的概率恒定。4、分布特征:二项分布的特征由二项分布的参数兀以及观察的次数n决定。图形分布特征:二项分布图的高峰在=n兀处或附近;兀=0.5时,图形对称;对于同一兀,随着n的增大,分布趋于对称。兀金0.5时,分布不对称,且对同一n,兀离0.5愈远,对称性愈差。当n-8时,只要兀不太靠近0或1(特别是当n兀和n(1-兀)均大于5时),二项分布趋于对称。5、二项分布的均数和标准差:若X服从二项分布B(n,兀),则X的总体均数为科刃兀,总体方差为b2=n兀(1-兀)第七节泊松分布及其应用1、Poisson分布:是一种离散型随机变量的分布类型,是二项分布的特例,用以描述单位时间、空

13、间、面积等的罕见事件发生次数的概率分布。一般记作P(入),入是Poisson分布的唯一参数。总体均数为入刃兀。前提条件:互斥、独立、恒定。2、概率函数为:P(X)=e-入,X为观察单位内稀有事件的发生次数,e=2.71828o3、分布特性:Poisson分布是非对称的,总体参数入值越小,分布越偏;随着入-8,分布趋于对称,当入n20时,Poisson分布资料可按正态分布处理。4、Poisson分布总体均数与总体方差相等,均为入5、Poisson分布的观察结果可加性,即对于服从Poisson分布的m歌互相独立的随机变量X1、X2Xm,它们的和也服从Poisson分布,其均数为这个m随机变量的均数

14、之和。6、三种常用分布之间的关系:二项分布与Poisson分布的关系:当n很大,发生概率兀(或1-兀)很小,二项分布B(n,兀)近似于Poisson分布P(nn);二项分布与正态分布的关系:当n较大,兀不接近0或1(特别是当n兀和n(1-兀)均大于5时),二项分布B(n,兀)近似于正态分布N(nn,nu(1-兀);Poisson分布与正态分布的关系:当入A20时,Poisson分布渐进正态分布N(入,入)。7、二项分布与Poisson分布的区别:相同点:都是离散型随机变量的常见分布;区别:a、取值不同。服从二项分布的随机变量有n+1个不同的取值;Poisson分布的随机变量的可能去只有无限多个

15、,即非负整数0,1,2;b、随机变量的概率不同:二项分布P(X=k)=,Poisson分布P(X=k)=e-入;c、描述的随机变量不同。二项分布描述的是一次试验只会出现两种对立的结果之一,n次独立重复试验中某种结果出现次数的概率分布。Poisson分布描述的是在单位时间、面积、空间等范围中某种事件发生数的概率分布。第八节卡方检验1、检验用途:常用于分类变量资料的统计推断,主要用途包括:单样本分布的拟合优度;比较两个或多个独立样本频率分布;比较配对设计两样本频率和两频率分布;推断两个变量或特征之间有无关联性。分为四格表卡方本验、行*列表卡方检验、配对资料卡方检验。2、四格表资料的卡方检验:公式:

16、3、四格表次来哦在下列情况四格表资料中有任何一个格子的理论数TV1或n<40;四格表卡方检验,所得P值十分临近检验水准时,可以直接计算其概率做出判断。4、行*列表卡方检验要求:理论频数不宜太小,一般不宜有1/5以上的格子的理论频数小于5,或不宜有一个理论频数小于1,否则可能会产生偏性。如果不满足此要求,处理方法有:增加样本含量(首选);结合专业知识考虑是否可以将该格所在行或列与别的行和列合并,要根据样本特性来确定,但会损失信息;改用RXC表Fisher精确概率法,可以用计算机软件实现。5、配对设计资料的X2检验:公式:第九节非参数统计1、非参数统计使用:a、资料不服从正态分布或分布未知b

17、、只能以严重程度、优劣等级、效果大小、名词先后来综合判断的有序分类资料。2、秩和检验目的:是推断连续型变量资料或有序变量资料的两个独立样本代表的两个总体分布是否有差别。3、方法要点:将两组数据由小到大同一编秩,以样本列数小者为n1,其秩和为T,查T界值表确定P值;正态近似法:当n1>10或n2-n1>10时,T分布接近均数为n1(N+1)/2,方差为n1n2(N+1)/2的正态分布,可用Z检验。4、注意事项:编秩中若有相同的数据在同一组则依次编秩;若相同数值在不同组内,求平均秩次;当相持出现较多时(超过25%),需使用校正公式。5、基本思想:假设含量为n1与n2的两个样本(且n1W

18、n2),来自同一总体或分布相同的两个总体,则n1样本的秩和T1与其理论秩和n1(N+1)/2相差不大,即T-n1(N+1)/2仅为抽样误差所致。当二者相差悬殊,超4出抽样误差可解释的范围时,则有理由怀疑该假设,从而拒绝H0o第十节直线相关与回归1、直线相关又称简单相关,用于双变量正态分布资料,它是从数量上研究两随机变量间相互关系密切程度的一种统计方法。2、相关系数是线性相关条件下用来说明两个变量间相关关系的密切程度和方向的一个统计指标。R=3、直线回归又称简单回归,它是描述与分析两变量间线性依存关系的一种统计方法。4、直线回归方程:F=a+bX5、回归系数假设检验:F=6、回归剩余标准差:Sy

19、,x=7、回归系数标准误:Sb=8、不要把相关关系都说成是因果关系。(伴随关系)9、不要把相关的显著性程度误解为密切程度。10、线性回归模型的适用条件:线性:因变量Y与自变量X称线性关系;独立:每个个体观察值之间互相独立;正态性:任意给定X值,对应的随机变量Y都服从正态分布;等方差性:在一定范围内不同的X值所对应的随机变量Y的方差相等。简记为LINE。11、线性回归的应用:用于计算总体条件均数的置信区间以及总体回归线的置信带;用于计算个体Y预测值及其预测区间。线性回归常用于统计预测和统计推断。12、线性回归与线性相关的区别与联系:区别:单位:相关系数r没有单位,回归系数b有单位;所以,相关系数

20、与单位无关,回归系数与单位有关;应用目的:说明两变量间的关联性用相关分析,说明两者依存变化的数量关系则用回归分析;对资料的要求不同:线性回归要求应变量Y是服从正态分布的随机变量;线性相关要求两个变量X和Y为服从双变量正态分布的随机变量。取值范围:-oo<b<+oo,-1ww1;意义:回归系数b表示X每增(减)一个单位时,Y平均改变b个单位;相关系数r说明具有线性关联的两个变量间关系的密切程度与相关方向;联系:方向一致:r与b的正负号一致;假设检验等价:tr=tb;;用回归解释相关决定系数(coefficientofdetermination):,回归平方和越接近总平方和,则r2越接

21、近1,相关性越好。第十二节调查设计1、调查设计是对调查研究所作的周密计划,包括资料收集、整理和分析全过程的设想和安排。2、调查设计包括内容:确定调查目的和指标、确定调查对象和观察单位、确定调查方法、确定资料收集方式、拟定调查项目和调查表、估计样本含量。3、组织计划:调查员的挑选和调查员的培训。4、整理计划步骤:问卷接受、问卷核查、数据编码、数据录入、拟定整理表、归纳汇总等。5、常用的调查方法有:直接观察法、采访法、报告法等。6、各种抽样方法的抽样误差一般是:整群抽样R单纯抽样R系统抽样R分层抽样。第十三节实验设计1、根据研究者是否人为地设置处理因素,即是否给予干预措施,可将医学研究分为调查研究

22、和实验研究两类。调查研究:又称观察性研究或非实验性研究,确切的说应是非随机化对比研究。它对研究对象不施加任何干预措施,是在完全“自然状态”下对研究对象的特征进行观察、记录,并对观察结果进行描述和对比研究。实验研究:又称干预性研究,是对研究对象人为给予干预措施的研究。2、实验设计的基本要素:受试对象、实验因素、实验效应。受试对象:是处理因素作用的客体,根据受试对象不同,实验可以分为三类:动物实验、临床试验、现场试验。实验因素:是研究者根据研究目的而施加的特定的实验措施,又称为受试因素。实验效应:是处理因素作用下,受试对象的反应或结局,它通过观察指标来体现。3、选择观察指标时,应当注意:a客观性:

23、客观指标具有较好的真实性和可靠性;b精确性:包括准确度和精密度两层含义。准确度指观察值与真值的接近程度,主要受系统误差的影响。精密度指相同条件下对同一对象的同一指标进行重复观察时,观察值与其均数的接近程度,其差值受随机误差的影响。c灵敏性和特异性:指标的灵5敏度反映其检出真阳性的能力,灵敏度高的指标能将处理因素的效应更好地显示出来;指标的特异度反映其鉴别真阴性的能力,特异度高的指标不易受混杂因素的干扰。4、实验设计的基本原则:对照、随机化和重复。对照的形式:安慰剂对照:目的:在于克服研究者、受试对象等由心理因素导致的偏倚。空白对照:即对照组不接受任何处理,在动物实验和实验方法研究中最常见,常用

24、于评价测量方法的准确度,评价实验是否处于正常状态等。实验对照;标准对照:用现有标准方法或常规方法作为对照;自身对照:对照与实验在同一受试对象身上进行。a随机化体现在三方面:随机抽样:总体中每一个体都有相同机会被抽到样本中来;随机分配:每个受试对象被分配到各组的机会相等,保证大量难以控制的非处理因素在对比组间尽可能均衡,以提高组间的可比性;实验顺序随机:每个受试对象先后接受处理的机会相等,它使实验顺序的影响也达到均衡。b在实验设计中常通过随机数来实现随机化。获得随机数的常用方法有:随机数字表和计算机的伪随机数发生器。随机数字表常用于抽样研究及随机分组。c常用的两种随机化分组的方法:完全随机化和分

25、层随机化(配对随机化和区组随机化可看成是分层随机化的实际应用)。重复包括三种情形:整个实验的重复;用多个受试对象进行重复;同一受试对象的重复观察。重复的主要作用:估计变异的大小;降低变异大小。5、常用的实验设计方案:完全随机设:又称简单随机设计,是最为常见的一种考察单因素两水平或多水平效应的实验设计的方法,它是采用完全随机分组的方法将同质的受试对象分配到各处理组,观察其实验效应。配对设计:是将受试对象按一定条件配成对子,再将每对中的两个受试对象随机分配到不同的处理组。据以配对的因素应为可能影响实验结果的主要混杂因素。配对设计主要有以下情形:将两个条件相同或相近的受试对象配成对子,通过随机化,使

26、对子内个体分别接受两种不同的处理;同一受试对象的两个部分配成对子,分别速记地接受两种不同的处理;自身前后配对,即同一受试对象,接受某种处理之前和接受该处理后视为配对。配伍组设计:实际上是配对设计的扩展。通常是将受试对象按性质相同或相近分为b个区组(或称单位组、配伍组),再将每个区组中的k个受试对象随机分配到k个处理组。设计应遵循“区组间差别越大越好,区组内差别越小越好”的原则。6、样本含量的估算:确定样本含量的原则:在保证研究结论有一定可靠性的前提下,估算最少需要多少受试对象。假设检验所需样本含量取决于四个要素:第一类错误概率”的大小:a越小,所需样本量越大;第二类错误概率3或检验功效(1-3)的大小:第二类错误的概率越

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论