




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、医学统计学总结绪论1、随机现象:在同一条件下进行试验,一次试验结果不能确定,而在一定数量的重复试验之 后呈现统计规律的现象。2、同质:统计学中对研究指标影响较大的,可以控制的主要因素。3、变异:同质基础上各观察单位某变量值的差异。广数值变量:变量值是定量的,由此而构成的资料称为数值变量资料或计量资料, 其数 值是连续性的,称之为连续型变量。变量r无序分类变量:所分类别或属性之间无顺序和程度上的差异分类变量:定性变量有序分类变量:有顺序和程度上的差异4、总体:根据研究目的确定的同人研究对象中所有观察单位某变量值的集合。可以分为有限 总体和无限总体。5、样本:是按随机化原则从同质总体中随机抽取的部
2、分观察单位某变量值的集合。样本代表 性的前提:同质总体,足够的观察单位数,随机抽样。统计学中,描述样本特征的指标称为统计量,描述总体特征的指标称为参数。6、概率:描述随机事件发生的可能性大小的一个度量。若P (A) =1,则称A为必然事件;若P (A) =0,则称A为不可能事件;随机事件 A的概率为0P 1.小概率事件:若随机事件 A的概率P&a,则称随机事件A为小概率事件,其统计学意义为: 小概率事件在一次随机试验中认为是不可能发生的。统计描述1、频数分布有两个重要的特征:集中趋势和离散程度。频数分布有对称分布和偏态分布之分。 后者是指频数分布不对称,集中趋势偏向一侧,如偏向数值小的一侧为正
3、偏态分布, 如偏向数 值大的一侧为负偏态分布。2、常用的集中趋势的描述指标有:均数,几何均数,中位数等。均数:适用于正态或近似正态的分布的数值变量资料。样本均数用表示,总体均数用以表小0几何均数:适用于等比级数资料和对数呈正态分布的资料。注意观察值中不能有零,一组 观察值中不能同时有正值和负值。中位数:适用于偏态分布资料以及频数分布的一端或两端无确切数据的资料。3、常用的离散程度的描述指标有:全距,四分位数间距,方差,标准差,变异系数。全距:任何资料,一组中最大值与最小值的差。四分位数间距:适用于偏态分布以及分布的一端或两端无确切数据资料。方差和标准差:正态分布资料。标准差表示观察值的变异度的
4、大小。变异系数:比较度量单位不同或均数相差悬殊的两组资料的变异度。4、标准正态分布:对正态分布的(X-N)/进行u的变换,u= (X-N)/,则正态分布变换为N =0, (7=1的标准正态分布,亦称u分布。u被称为标准正态变量或标准正态离差。两个参数:N是位置参数,(T是形状参数。用N (0,1 )表示标准正态分布。常用估计医学参考值范围的方法有:(1)正态分布方法:适用于正态或近似正态分布的资料。双侧界值:X u“2S单侧上界:X+u, S,或单侧下界:X-u.S(2)对数正态分布方法:适用于对数正态分布资料。双侧界值:Lg1 (X lgx U2s lgx )单侧上界:Lg1 (X Igx
5、+u bS lgx),或单侧下界:Lg-1 (X lgx -u 6 lgx)(3)百分位数法:用于偏态分布资料以及资料中一端或两端无确切数值的资料。双侧上界:P2.5和P97.5;单侧上界:P95,或单侧下界:P5常用的U值表参考值范围(%1m800.8421.282901.2821.645951.6451.96992.3262.5765、分类变量资料的统计描述:常用相对数指标描述,包括:率,构成比,相对比。率:说明某现象发生的频率或强度。(病死率不等于死亡率)构成比:说明某现象内部组成部分所占的比重或分布,常以百分数表示。相对比:亦称比,是A、B 2个有关指标之比,说明A为B的若干倍或百分之
6、几。两个指 标可以性质相同,也可以性质不同。应用相对数时的注意事项:1 、计算相对数的分母不宜过小;2、分析时不能以构成比代替率;3、对观察单位数不等 的几个率,不能直接相加求其平均率;4、比较相对数时应注意其可比性;5、对样本率(或构 成比)的比较应遵循随机抽样,并做假设检验。6、标准化法:标准化的目的在于消除混杂因素对结果的影响,使资料更具有可比性。其基本 思想是:将所比较的两组或多组资料的构成按统一的“标准”调整后,计算标化率,使其更具 有可比性。标准化率的计算方法:亦称标化率,直接法用于已知被标化组的年龄别率, 以及已知标准组的 年龄别人口数或年龄别人口构成比时;间接法用于已知被标化组
7、的年龄别人口数与发病 (死亡) 总数,但年龄别率未知,以及已知标准组年龄别发病(死亡)率与总发病(死亡)率时。通常可从下列3种方法选用标准组:以两组资料中任一组的年龄别人口数或构成比作为标准 组;以两组资料合并的各年龄组的人口数或构成比作为标准组;以公认的或便于与他人资料比较的标准作为标准组。7、统计表:结构:由标题、标目、线条和数字构成。编制统计表的要求:标题:概括表的内容,列于表的上方居中,应注明时间和地点;标目:主语和谓语分别列于横、纵标目,文字简明,层次清楚。横标目列于表的左侧,通常 为被研究的事物,纵标目列于表的上端,为说明横标目的统计指标。线条:通常,除表的顶线、底线、纵标目下以及
8、合计上的横线外,其余线条均省去,顶线和底线应略粗些,表的左上角不宜用斜线。数字:用阿拉伯数字表示,同一指标的小数位数要一致并对齐, 数字暂缺或无数字者分别用 “”或-”表示,数字为0者要记作“ 0”,不应空项,为方便核实和分析,应有合计。备注:一般不列入表内,必要时可用“i标出,列于表下。8、统计图:条图:用于相互对比关系的资料;圆图与百分条图:适用于百分构成比资料,表示事物各组成部分所占的比重或构成;线图:用于连续性资料,用于说明事物在时间上的发展变化, 或某现象随另一现象而变动的 情况;直方图:表示连续性资料的频数分布;散点图:适用于直线相关分析,说明两个变量间的数量关系和变化趋势。抽样分
9、布与参数估计抽样研究的目的是用样本信息来推断总体特征,即统计推断,包括两个内容:一是总体参数的估计,二是假设检验。1、抽样误差:由于变异的存在,抽样研究所造成的样本统计量与总体参数之间的差异或各样 本统计量之间的差异称为抽样误差。常用标准误x反映均数抽样误差的大小;用率的标准误6p反映率的抽样误差的大小;用Possion计数的标准误V7反映其抽样误差的大小。2、中心极限定理和正态分布推理:从正态分布 N(p ,63、t分布:将x看成变量值,那么可将正态变量进行 u变换(u=x-仙/)后,也可将N(j2x)变换成标准正态分布N (0, 1)。常用s作为6的估计值,统计量为t,此分布为t分布。统计
10、量t= t曲线的形态变化与自由度v的大小有关。v越小,t值越分散,曲线越低 sx平,v逐渐增大时,则t分布逐渐逼近正态分布,当丫=无穷大时,t分布即为u分布。4、总体均数的估计有两种方法:一种是点估计,即用统计量 x估计总体均数 ;二是区间估计,亦称可信区间。 (T 未知且 n 小:x-t a/2, V s x N x+t a/2, V s x (2)(T未知,但n足够大,t分布逼近u分布:x-u -2sx n x+u/2sx (T 已知: x -u a/2 CT x N x +u/2 CT x)总体中以固定n随机抽取样本,样本均数x的分布仍服从正态分布,即使是从偏态分布总体中随机抽样,只要n
11、足够大,x的分布也近似正态分布。样本均数的均数仍为N ,样本均数的标准差为-0样本均数的抽样误差 x (简称标准误)是反映均数抽样误差大小的指标。x =9用样本均数S作为6的估计值,则sx=-S,nn标准差标准差和标准误的比较标准误S=-2(x x)n 1表示观察值的变异程度大小s%1 n估计均数的抽样误差大小计算变异系数CV=s 100% x估计总体均数可信区问确定医学参考值的范围 计算标准误X t a /2 , v S x 仙 1.96,则P0 0.05,此为小概率事件, 依据“小概率事件在一次随机试验中认为是不可能发生的” 的定理,可认为此样本不是来自该 总体。2、步骤:建立假设和确定检
12、验水准;假设有两种,一种是检验假设,常称 无效假设或零假 设,记为代,假设样本所代表的总体参数与已知总体参数相等;另一种是 备择假设,记为H, 是与H0相联系且对立的假设;检验水准,亦称显著性水准,是判断拒绝或不拒绝 代,也是允 许犯I型错误的概率,通常用0.05。选定检验方法和计算统计量确定 P值,做出推断结论。P值是指从H0所规定的总体中随机 抽样时,获得等于及大于现有样本统计量的概率。3、t检验:适用于:样本均数与总体均数比较(6未知且n50或n30);成组设计的两小样本均数的比较(m, n2均小于30或50);配对设计的两样本均数比较。应用条件:当样本含量较小(n50或n30)时,要求
13、样本来自正态分布总体;用于成组设计的两样本均数比较时,要求两样本来自总体方差相等的总体。4、单样本t检验:用于样本均数与已知总体均数的比较,研究目的是推断样本所代表的总体均数以与已知总体均数以0有无差别。统计量t= 土W v=n-1s/ n5、配对t检验:用于配对设计资料的 两均数的比较。其研究目的是推断某种处理有无作用, 或两种处理的效果有无差别。配对设计类型有3种:先将受试对象按配比条件配对,然后用随机分组方法将各对中的2个受试对象分别分配到不同的处理组;同一对象分别接受2种不同处理;同一对象处理前后。t=一d-=(d是差值的样本均数)v=n-1sd / . n6、两样本t检验:用于完全随
14、机设计的两样本均数的 比较,两个样本来自两个总体,具研究 目的是推断两样本所分别代表的总体均数是否相等。XiX1X2-2 ,1、2 ,s1 (n1 1) s2(n2t=LXSXiv=n i+n2-2n1n2 21)(11)ni n27、单样本u检验:用于样本均数与已知总体均数比较,其研究目的同 t检验。研究目的是推断样本所代表的总体均数以与已知总体均数小。有无差别。其统计量u=x No s/ . n8、两样本的u检验:用于完全随机设计的两样本均数的比较,两个样本来自两个总体,具研 究目的是推断两样本所分别代表的总体均数是否相等。其统计量为:Xi X2 u=s-Xi X2Xi X2S2 / n1
15、 s2 /n29、正态性检验和方差齐性检验:资料在做假设检验之前首先应该检验资料是否来自正态总体, 并且它们的方差是否齐。1。、两类错误:I型错误:拒绝了实际上成立的H0,即样本来自以=-的总体,由于抽样的偶然性,按a=0.05 检验水准拒绝了 H0,接受H。这类在假设检验中拒绝了原本正确的H0的错误称为I型错误。,理论上犯I型错误的概率为a , a值得大小视研究目的而定。通常设a =0.05。R型错误:不拒绝了实际上不成立的 H0,即样本来自。的总体,由于抽样的偶然性,按 a =0.05检验水准不拒绝H,这类在假设检验中不拒绝原本不正确的 H的错误称为II型错误。 犯H型错误的概率为B ,它
16、只有与特定的 H结合起来才有意义。同时减少a和B的方法是 增加样本含量。1- B称为检验效能或把握度,即两总体确有差别时, 按a水准能识别该差别的能力。 如1- B =0.95表示:若两总体确有差别,理论上平均100次抽 样中,有95次能得出两总体有差别的结论。11、假设检验时应注意的事项:要有严密的抽样研究设计一假设检验的前提正确选用检验方法:完全随机的设计的两数值变量资料比较时, 若n小且方差齐,则选用两 样本t检验;若方差不齐,则选用t检验或成组设计的两样本比较的秩和检验;若 m, n2均大 于50,则选用两样本u检验。正确理解“显著性”的含义对差别有无统计学意义的判断不能绝对化。方差分
17、析1、基本思想:按研究目的和设计类型,将总变异的离均差平方和SS和自由度v分别分解成若干部分,并求得各相应部分的变异。其中的组内变异或误差主要反映个体差异或抽样误差, 其它部分的变异与之比较得出统计量 F值,由F值的大小确定P值,并作出推断,从而了解 该因素对观测指标有无影响。组内变异主要由个体差异所致,组间变异可能由两种原因所致:一是抽样误差,二是由于接 受的处理不同。2、总离均差平方和SS和自由度vk ni_ 2SS总二(Xij x) = X2 ( x) 2 / nv 总n-l3、组间离均差平方和SS组间,自由度v组间和均方MS且间nik (. xj)2 ( x)2SS、oo 一 j 总变
18、异x2 C n-1bk(Xij)2处理组j C k-1 SS处理/v处理 MS处理/MS误差 i b k b(Xj)2配伍组 C b-1SS配伍/v配伍MS配伍/MS误差j i k误差SS总-SS处壬i-SS配伍(k-1) (b-1)SS误差/v误差出同SS组间= V 组间一K-l MS 组间=i ininv组间4、组内离均差平方和 SS组内,自由度v组内和均方MS且内SS组内-SS总-SS 组间 v 组内 =n-k MS 组内 =SS组内/v 组内多样本均数比较的方差分析的应用条件:各样本是相互独立的随机样本;各样本来自正态 分布总体;各总体方差相等,即方差齐。5、完全随机设计资料的方差分析
19、:亦称单因素的方差分析,可用于完全随机设计的多个样本 均数比较的资料,研究目的是推断各个样本所代表的总体均数是否相等。单因素方差分析的计算公式变异来源SSvMSF总变异x2 Cn-1组间变异nik( xij)2 j 1Ck-1SS且间MS组间i 1niv组间MS组内组内变异SS总-SS组间n-kSS组内/v组内*C为校正系数C= ( x)2/n6、配伍组设计资料的方差分析:亦称两因素的方差分析,用于配伍组设计的多个样本均数比较的资料,其研究目的是推断各样本所代表的总体均数是否相等, 但考虑了个体差异对试验 效 应的影响。两因素方差分析的计算公式 变异来源SS v MS F*C为校正系数 C=
20、( x)2/n b为配伍组数分类资料的假设检验1、二项分布:应用条件:各观察单位只能具有两种相互对立的结果已知发生某结果的概率为冗,其对立结果的概率为 1-九n次试验是在相同的条件下进行的。性质:=n:t0- = nn it 11fT若均数和标准差用率表示,则pp=兀p p=如(1 冗)/ n冗未知时,用样本率P作为冗的估计值,则 Sp=Jp(1 p)/n总体率的估计:正态近似法:当样本含量n足够大,且样本率p或1-p均不太小,如np与n(1-p)均大于5时样本率p的抽样误差分布近似正态分布,可信区间为:(p-u /2Sp, p+u/2Sp)2、Poisson分布:对于二项分类变量,若某结果发
21、生的概率很小,如冗0.05时,单位时间、人群、空间内“阳性”发生次数x (x=0, 1, 2,)的概率可用Poisson分布概率函数来描述:_g , x 、P(X)=e(U /x!)递推公式:P (0) =e C /、 P (x 1) HP (x) =应用条件:兀 0.05外,其余同二项分布。分布的性质:(1)、Poisson分布式一种单参数的离散型分布,其参数为表示单位时间、人群、空间内 某事件平均发生的次数。(2)、Poisson分布的方差J与均数相等。(3)、Poisson分布可以看成是二项分布的极限形式。(4)、Poisson分布的极限形式也是二项分布,一般当 n20时,可按正态分布处
22、理,当冗&0.01时,二项分布可以当作 Poisson分布来处理。(5)、Poisson分布具有 可加性。总体均数的估计:(正态近似法)x 1 , Jx , x | ,_Vx U a/ 27U a / 23、服从二项分布资料的假设检验:(1)样本率和总体率的估计:k直接计算法:最多有k例阳性的概率:P(xk) = P(x)=1-P(x)k0(1-兀0)5 时,正态近似法:当兀0不太靠近0或1,且样本含量n足够大;或n兀05且nP 九0x n九0二项分布接近正态分布u=曲o(1九0) n/冗0(1冗0)(2)两样本率的比较:目的是推断两个样本各自代表的两总体率是否相等,当两个样本率均 满足正态近
23、似条件时,可用u检验。其公式为:u= p1 p2 =p1 p2s【Pc(1 Pc)C n12)pc为合并阳性率, p =(X1+X2)/(nl+n2)X1,X2为两个样本的阳性例数。4、服从Poisson分布的假设检验:对于Poisson分布的假设检验,对于总体均数可以用乘法将 小单位化大,也可以用除法将大单位化小,对于样本均数,只能用除法将大单位化小,而不能 用乘法将小单位化大。(1)样本均数与总体均数的比较:适用于仙020,且样本阳性数X较小作单侧检验时。k直接计算法:最多有k例阳性的概率:P(xk) = P(x)=1- P(x)k0正态近似法:当20时,Poisson分布逼近正态分布。u
24、=(x n0)/J阿(2)两样本阳性数的比较:目的是推断两样本各自代表的两总体平均数是否相等。当两样本 阳性数X1, X2均大于20时,可用u检验。其计算用两种情况:两样本观察单位(时间、面积、容积等)相同时: u= ;X2 =;12XX2 X1X2两样本观察单位(时间、面积、容积等)不同时: u=X1 X1 = X1 1X2 n22。2,.、一2.5、 检验:是一种连续型分布,u分布的平方即为分布。对于同一份资料,检验的检验统计量为2,其基本公式为:22(A/,自由度 v=(行数-1)(列数-1). . . . . . n - * ric.式中A为实际频数,T为理论频数。理论频数T的计算公式
25、为:Trc比上 丁为第R n 1 RC行第C列的理论频数,nR为相应行的合计,nC为相应列的合计,n为总例数。自由度v= (R-1)(C-1).2反映了实际频数与理论频数的吻合程度。只有考虑了自由度v的影响,2值才能正确地反应实际频数A和理论频数T的吻合程度6、四格表资料的检验:最小理论频数丁的判断,R行与C列中,行合计数中的最小值与 T RC列合计数中的最小值所对应的理论频数最小。(1)四个表资料 2检验的专用公式:2(2)四个表资料检验的校正公式:(ad bc)2n(a b)(c d)(a c)(b d)2(|A T| 0.5)2T2 (ad bc n 2)2nc (a b)(c d)(a c)(b d)在实际工作中,对于四个表资料,通常规定为:2(1)当n40且所有的T5时,用检验的基本公式或四个表资料2检验的专用公式;当P= a时,改用四个表资料的 Fisher确切概率法。,2,1,,(2)当 240,但1WT&5时,用四格表资料的检验的校正公式;或改用四个
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论