流行病学的常用指标_第1页
流行病学的常用指标_第2页
流行病学的常用指标_第3页
流行病学的常用指标_第4页
流行病学的常用指标_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、流行病学的常用指标作者:日期:流行病学的常用指标ce rat e) ra t e) ce r a te)r at e)疾病发病频率测量指标 发病率(inc i d en罹患率(a ttack 患病率(pr e vale n 感染率(infection 续发率(seconda r y a t tack rate , SAR) 病残率(d i sablil i ty r ate)生存率(su rv ival ra t e)发病率(in ci dence rate ):表示在一定期间内,一定人群中某病新病例出现的频率 是用来衡量某时期一个地区人群发生某病的危险性大小的指标。一定期间内某人群中某病新病

2、例数发病率=同期暴露人口数K= ( 100%, 1 00 0/千,或 100 0 0 /万)。在观察期内。观察时间多以年表示。指可能会发生该病的人群。分子是一定期间的新发病例,若在观察期间内一个人可多次患病时,则发病率的准确性取决于疾病报告,登记制度以及诊断的正确 计算发病率时,要考虑的几个因素: 发病时间 观察时间暴露人口数 新发病例数)分别计算,此即发病专率。,也是测量新发病例的指标。应分别计为新发病例数,如腹泻,流感等。 发病率可按不同特征(如年龄、性别、职业、民族等 罹患率(attac k rate):与发病率一样观察期间的新病例罹患率'= X 100同期暴露人口数观察时间可以

3、日、周、旬、月为单位。适 其优点是可以根常用于较小范围或短期间的疾病流行。用于局部地区疾病的爆发,食物中毒、传染病及职业中毒等爆发流行情况。据暴露程度精确的测量发病机率。患病率(pr eva le nee rate):也称现患率。指某特定时间内总人口中某病新旧病例 所占比例。可按观察时间的不同分为期间患病率和时点患病率。某一时点一定人群中现患某病新旧病例数X KH寸*1点*J=该时点人口数 X K某观察期间一定人群中现患某病新旧病例数 期间患病率=-同期的平均人口数K= 1 0 0 %, 1000/千,或 10 0 00/万等期间患病率实际上等于某一特定期间开始时患病率加上该期间内的发病率。

4、患病率升高或降低的原因:影响升高的因素: 病程延长, 未治愈者的寿命延长, 新病例增加(即发病率增), 病例迁入, 健康者迁出, 易感者迁入, 诊断水平提高, 报告率提高。影响降低的因素: 病程缩短, 病死率高, 新病例减少(发病率下降), 健康者迁入, 病例迁出, 治愈率提高感染率(in f ecti o n ra te):是指在某个时间内能检查的整个人群样本中,某病现有感染者人数所占的比例。调查时某病感染人数感染率=X 100%调查时受检人数感染率常用于研究某些传染病或寄生虫病的感染情况和分析防治工作的效果,估计某病的流行势态,为制定防治措施提供依据。特别是对隐性感染、病原携带及轻型和不典

5、型 病例的调查较为有用。如乙型肝炎、乙型脑炎、脊髓灰质炎、结核、寄生虫等。续发率(secondary att a ck rat e,S A R ):指在某些 传染病最短潜伏期到最长潜 伏期之间,易感接触者中发病的人数占所有易感接触者总数的百分率。一个潜伏期内易感接触者中发病人数续发率=XI 00%易感接触者总人数,在该多指在一个家庭内、病房、集体宿舍、托儿所、幼儿园班组中第一个病例发生后 病最短与最长潜伏期之间出现的病例称续发病例。也称二代病例。计算时,须将原发病例从分子及分母中去除。对那些在同一家庭中来自家庭外感染 或短于最短潜伏期、或长于最长潜伏期者均不应计入原发病例。续发率可以用于比较传

6、染病传染力的强弱,用于分析传染病流行因素,包括不同条件对传染病传播的影响(如年龄、性别、家庭中儿童数、家庭人口数、经济条件等)及评价卫 生防疫措施的效果(如对免疫接种、隔离、消毒等措施的评价)。病残率(d isa blil i ty r 万)人中实际存在的病残人数。 调查人数之比。病残人数残率=XKate):某一人群中,在一定期间内每百(或千、万、十 是指通过调查询问或健康调查,确诊的病残人数与调查人数(K= 1 00 % , 1000/千,或 1 0 000/万,等)病残率可以说明病残在人群中发生的频率,是作为人群健康状况的评价指标之一。(mort a li t y r ate)(fa t

7、al ity r at e)(surv i val rate)(mort al i t y rat e ):是某人群在一定期间(一般为一年)的死亡人数与该疾病死亡频率测量指标:死亡率病死率生存率死亡率人群同期人口数之比。表示在一定时期内,死于某病(或死于所有原因)的频率。某人群某年总死亡人数粗死亡率=-一 X K该人群同年平均人口数死亡专率=某期间内(因某病)死亡总数XK同期平均人口数(K= 1 00% , 1000/千,或 10000/万,等)死亡率是测量人群死亡危险性大小最常用的指标。病死率(fata l ity rate):表示在一定时间内(通常为1年),患某病的病人中因该病而死亡者的比

8、例。X 1 0 0%同期确认的某病病例数某时期内因某病死亡人数病死率=一病死率表示某病确诊后发生死亡的概率,它受疾病的严重程度、早期诊断和治疗水平的影响。生存率(survi V al ra te):指在接受某种治疗的病人或患某病的人中,经若干年随访(通常为1 , 3 ,5年)后,尚存活的病人数所占的比例。随访满n年尚存活的病例数生存率=X1 00G随访满n年的病例数生存率反应了疾病对生命的危害程度,也是考核治疗措施效果的指标。率和比?率(rat e ):指在某一确定人群中某些事件发生的频率。一个率由分子 (发 生数)、分母(可能发生的总数)、事件发生的特定时间和乘数组成。大多数率是构成 比。

9、比(rati 0 ):是两个变量的数值之商,表示分子和分母之间的数量关系。 比例(P ro po r t ion):是表示同一事物局部与总体之间数量上的比值,分子和分母的单位相同,而且分子包含与分母之中。常用P= a/a + b表示。有两类,一、反映事物静止状态内部构成成分占全体的比重, 也称构成比例,二、与动态的发生变化概率密切相关的发生频率 比例,它反映一定时间内,发生某种变化者占全体的比例。率与比的区别 率 分子是分母的一部分,分子和分母代表的应该是同一人群;如果分子被限定在某一年龄、性别或种族组内,分母也应该有同样的限定可以取任何值,是反映动态过程的一个参数。比;可以是两个彼此分离的互

10、不相重叠或包含的不管分子和分母所来自的总体如何量;分子和分母本身可以是绝对数,也可以是率、比例或比;构成比取值仅在0到1之间,是变量在一定期间内发生变化的概率 疾病残疾失能指标:潜在减寿年数(pot en ti a l years of life los t , PY L L)伤残调整寿命年潜在减寿年数(P 0 tent i al years o f life lo s t, P YLL):是指某病某年龄组人 群死亡者的期望寿命与实际死亡年龄之差的总和。即死亡所造成的寿命损失。潜在减寿年数是评价人群健康水平的一个重要指标;也是评价人群健康水平的一个重要指标可以用于衡量某种死因对一定年龄组人群的

11、危害程度。可以反映出对各年龄组人群的危害大小。伤残调整寿命年(d is a bi li ty adj u sted li fe y ea r, DA LY):是指从发病 到死亡所损失的全部健康寿命年,包括因早死所致的寿命损失年(YLL)和疾病所致伤残引起的健康寿命损失年(Y L D)两部分。DAL Y是生命数量和生命质量以时间为单位的综合度量。DA L Y是一个定量的计算因各种疾病造成的早死与残疾对健康寿命年损失的综合指 标。是将由于早死(实际死亡年数与低死亡人群中该年龄的预期寿命之差 残造成的健康损失二者结合起来加以测算的。)造成的损失和因伤,研究制定防 ,在1 980年以前, D ALY的

12、概念还没有提出,疾病负担的评价指标主要是 发病率、死亡率等传统指标。随着医 学模式的转变,传统的指标越来越不适应现代医学模式的要求,1988年,为了量化失去健康生命的全部损失,哈佛大学和世界卫生组织的专家进行了DALY的研究,并成功地应用于GD B 的分析。 DALY 是目前应用最多的、最具代表性的疾病经济负担评价和测量指标。表示流行强度的术语有:散发(sp 0 radic) 暴发(0 U tb r ea k) 流行(ep id e mi c ) 大流行(pandemi c散发(s po radi c):是指某病在一定地区的发病率呈历年来一般水平, 发病时间和地点方面无明显联系,表现为散在发生

13、。确定某病在某地区是否属于散发,应参照当地前3年该病的发病率,如当年发病率未显著 超过既往一般发病率,则称为散发。不同病种、不同时期散发水平不同。一般多用于区、县以上范围,不适于小范围的人群,如一个托儿所、工厂和学校等。各病例间在流行病学是从宏观的高度和群体的角度来认识疾病和健康状况的分布及其机制 治对策及评价其效果。 D A LY的出现是疾病 经济负担研究 的划时代变化疾病分布呈散发形式的主要原因: 该病常年流行,人群有一定免疫力或因疫苗接种维持着人群的免疫水平,如麻疹。 隐性感染为主的传染病,如脊髓灰质炎、病毒性肝炎等。 传播机制难以实现的传染病 ,如流行性回归热。 潜伏期较长的传染病,如

14、麻风病、炭疽。暴发(0U tbrea k)是指在局限的区域范围或集体单位中,短时间内突然发生很多相 同的病人,病人之间有相同的传染源或传播途径。如食物中毒、托幼机构的麻疹, 流脑等容易发生暴发。暴发的几个类型: 点源暴发 易感人群在一个相同的短时间内暴露于共同的传播因素而引起的流行。 重复暴露同源暴发易感人群在一定期间内重复 (多次)暴露于共同的传播因素而引起的流行,流行曲线呈多峰或不规则型。 蔓延暴发是指通过宿主间传播或人传人所引起的流行。流行(epidemic):流行是指一个地区某病发病率明显超过历年的散发发病率水平称为 流行。流行与散发是相对的,各地应根据不同时期、不同病种等作出判断。有

15、时在实际工作中用暴发流行一词。它表示在一个地区某病病例突然大量增多,发病率常超过一般流行的发病率水平, 来势较迅猛,流行持续时间往往超过该病的最长潜伏期。这个词仅仅是实际工作中使用的 ,它和流行病学中的暴发之词不同。有些传染病隐性感染占大多数。当它流行时临床症状明显病例可能不多,而实际感染 率却很高,这种现象称为隐性流行。如流行性乙型脑炎和脊髓灰质炎常具有这种现象。大流行(pan demic):大流行即疾病蔓延迅速,涉及地域广,往往在比较短的期间内越 过省界、国界、甚至洲界,而形成大流行。如流行性感冒、霍乱,历史上曾发生过 多次世界性流行。当前艾滋病的流行也是呈世界性的。筛检 (sere en

16、 ing):是在大量人群中通过快速的试验和其他方法,从外表健康的人群中查出某病的可疑患者的一种预防性措施。筛检不是诊断试验,它是把健康人和病人(疑似病人、有缺陷的人)区别开来的方法,它仅是初步检查,是早期发现病人的一种方法。对筛检试验阳性还应进一步确诊。对某种疾病来说,在一般人群中包括三种人,一种是无该病的健康人,一种是可疑有该病但实 际无该病的人,一种是有该病的人,这三种人混杂存在。筛检的工作即是将健康人与其他两类人区别开来。 然后用更完善的诊断方法,将可疑患 该病但实际无该病的人与实际患该病的人区别开来。第三步为对有该病的人进行治疗, 使之恢复。因此,筛检是第一步,诊断试验是第二步,治疗是

17、第三步。筛检试验评价筛检试验金标准合计患者非患者阳性真阳性 A假阳性BR1阴性假阴性 C真阴性DR2C1合计筛检的评价指标:1.真实性(va 1 id ity ),亦称效度,指测量值与实际值相符合的程度,故又称准确性 (ac cu r ac y)。用于评价真实性的指标有:灵敏度与假阴性率、特异度与假阳性率、正确指数、似然比和 符合率。 灵敏度与假阴性率灵敏度(sensi ti v i ty ),又称真阳性率(t rue pos i tiv e r a te),即实际有病而按该筛检试 验的标准被正确地判为有病的百分比。它反映了筛检试验发现病人的能力。100%灵敏度AAC假阴性率(fa 1 sen

18、eg a ti v e rate),又称漏诊率病的百分比。它反映的是筛检试验漏诊病人的情况。C A,指实际有病,根据筛检试验被确定为无假阴性率100%假阳性率(f a l se 百分比。假阳性率_B_B D100 %灵敏度与假阴性率之间为互补关系:灵敏度=1-假阴性率即灵敏度越高,假阴性率越低,反之亦然。特异度与假阳性率特异度(S P eci fi c i t y),又称真阴性率(tru enegati v e rate),即实际无病按该诊断标准被正确地判为无病的百分比。它反映了筛检试验确定非病人的能力。特异度100%B DP ositive rate),又称误诊率,即实际无病,但根据筛检被判

19、为有病的特异度与假阳性率之间为互补关系:特异度=1 -假阳性率即特异度越高,假阳性率越低,反之亦然。'in dex),是灵敏度与特异度之和减去1,表示筛检方 正确指数的范围在 01之间。指数越大,其真实性越高。-1正确指数正确指数也称约登指数(You d en 法发现真正病人与非病人的总能力。假阳性)正确指数 =(灵敏度+特异度) =1-(假阴性+似然比(likeli ho od ratio, LR)属于同时反映灵敏度和特异度的复合指标,即有病者中得出某一筛检试验结果的概率与无病者得出这一概率的比值。,不受患全面反映了筛检试验的诊断价值,非常稳定。它的计算只涉及灵敏度与特异度 病率的影

20、响。检验结果有阳性与阴性之分,故似然比相应地区分为:阳性似然比(po siti V e 1 ikel i hoo d r a t io,+ L R )阴性似然比(neg a t i ve li k el i hood ra t io, LR )阳性似然比是筛检结果的真阳性率与假阳性率之比。该指标反映了筛检试验正确判断阳性的可能性是错误判断阳性可能性的倍数。比值越大,试验结果阳性时为真阳性的概率越大。真阳性率 灵敏度LR 假阳性率1特异度阴性似然比是筛检结果的假阴性率与真阴性率之比。该指标表示错误判断阴性的可能性是正确判断阴性可能性的倍数。比值越小,试验结果阴性时为真阴性的可能性越大。假阴性率

21、1灵敏度LR 真阴性率 特异度阳性似然比越大,筛检试验的诊断价值越高;阴性似然比越小,筛检试验的诊断价值也越高。因此,在选择筛检试验时应选择阳性似然比高的方法。特异度島100% 90.1%人群某病患病状况与筛检结果的关系筛检试验金标准诊断结果患者非患者-合计阳性165A80 B2 4 5R1阴性4 5 C730D7 75R2合计2 1 0C 1810 C 21 02 0 N165灵敏度100% 78.6%165 45假阴性率 45100%165 4521.4%假阳性率80正确指数 78.6%阳性似然比90.1% 10.699.9%80 73078.6%7.949.9%阴性似然比21.4%0.2

22、490.1%可靠性(re liability)也称信度、精确度(P recision)或可重复性(r e peata-bi 1 i t y),是指在相同条件下用某测量工具(如筛检试验)重复测量同一受试者时获得相同结果的稳定程度。评价筛检试验可靠性的方法和指标有下面一些方法:标准差和变异系数当某试验是做定量测定时,可用标准差和变异系数(coe f fi c ien tV ar i an ce, CV)来表示可靠性。标准差和变异系数的值越小,表示可重复性越好,精密度越高。反之,可重复性就越差,精密度越低。变异系数为标准差与算术均数之比。变异系数(CV)=(标准差/算术均数)X 100%符合率(ag

23、 re eme nt rate , con sist en cy ra t e)与K app a值符合率又称一致率,是筛检试验判定的结果与标准诊断的结果相同的数占总受检人数的比 例。符合率可用于比较两个医师筛检诊断同一组病人,或同一医师两次筛检诊断同一组病人的结果。"亠A D致率 100%A B C D影响筛检试验可靠性的因素有: 受试对象生物学变异由于个体生物周期等生物学变异,使得同一受试对象在不同时间获得的临床测量值有所波动。例如,血压在一天内不同时间的测量值存在变异。 观察者由于测量者之间、同一测量者在不同时间的技术水平不一,认真程度不同,生物学感觉差异,预期偏倚等均可导致重复

24、测量的结果不一致。例如,血压测量者的不一致性,X线读片与化验结果判断的不一致性等。 实验室条件重复测量时,测量仪器不稳定,试验方法本身不稳定,不同厂家、同一厂家生产的不同批号的试剂盒的纯度、有效成份的含量、试剂的稳定性等均有不同,由此可能引起测量误差。预测值(predictive valu e )根据筛预测值是反映应用筛检结果来估计受检者患病和不患病可能性的大小的指标。检的阳性与阴性结果进行的估计分别称为阳性预测值和阴性预测值。阳性预测值(p 0 si t i V e pr edictive value, P PV)是指筛检试验阳性者患目标疾病 的可能性。阳性预测值A100% A B阴性预测值

25、(negati V e predi c tive valu e , NPV)是指筛检试验阴性者不患目标疾病的可能性。阴性预测值CDD 100%灵敏度患病率 (1患病率)(1特异度)阴性预测值特异度(1患病率)特异度(1患病率)(1灵敏度)患病率筛检试验的灵敏度越高,阴性预测值越高;筛检试验的特异度越高,阳性预测值越高。预测值还与受检人群目标疾病患病率(P)的高低密切相关阳性预测值灵敏度患病率人群在不同患病率、灵敏度与特异度的情况下,阳性预测值与阴性预测值的变化。当灵敏度与特异度一定,疾病患病率降低时,阳性预测值降低,阴性预测值升高; 当患病率不变,降低灵敏度 ,特异度将提高,此时阳性预测值将升

26、高,阴性预测值将下降。在灵敏度、特异度和患病率不同水平时某人群糖尿病筛检的结果患病率 灵敏度 特异度 筛检金标准阳性预 阴性预-人计(%)(%)(%)结果 患者非患者 口 测值(%)测值(%)505 05 0+合计25 025025 025050 050 0505 050 05001000205050+10040 050020-10040 050080合计2 0 0800100 02 09 05 0+一2040 042095合计20 080010002 05090+100801 805 6一1007208 2088合计20 0800100 0卫生统计学常用指标分析与图表制作总体:是根据研究目的

27、确定的同质研究对象的全体。按研究对象来源又分目标总体 和研究总体。样本:是指从研究总体中抽取的一部分有代表性的个体。同质是指同一总体中个体的性质、影响条件和背景相同或非常相近;变异是指同质的个体之间存在的差异。变量:每个观察单位的某项特征 资料:对变量的测得值称为变量值或观察值,亦称为资料资料的两种类型定量资料(计量资料)连续定性资料(分类资料)多项分类有序(等级资料)无序二项分类根据变量取值特点,计量资料分为:连续性资料:变量值可以在实数轴上连续变动。如年龄、身高、体重。离散型资料:变量取值能一一列举。只能取整数。如毒性试验小鼠死亡只数。习题:某人记录了 50名病人体重的测定结果:小于50

28、kg的1 3人,介于50k g和70kg间的2 0人,大于7 0kg的17人,此种资料属于:E:名义变量资料A :定量资料 B:分类资料C :有序资料D:二分类资料概率概率是描述随机事件发生的可能性大小的数值,用P表示。随机事件概率的大小在 0和1之间,即0W P W 1,常用小数或百分数表示。P越接近1,表示某事件发生的可能性越大 ,P越接近0,表示某事件发生的可能性越小。P < 0.05,称为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,可以视为很可能不发生。二、统计分析的内容统计描述统计推断:包括参数估计和假设检验统计资料的描述列表描述:频数分布表、一览表 图形描述:频

29、数分布图、趋势图 指标描述定量资料集中位置:算术均数、几何均数、中位数离散程度:极差、四分位数间距、方差、标准差、变异系数 定性或等级资料相对数指标:率、构成比、比集中趋势的描述广义的平均数包含各种表示数据分布集中位置的指标。卫生领域最常用的三种平均数指标:算术均数、几何均数、中位数定量资料的集中趋势指标平均数意义应用算术均数平均数量水平对称分布,特别是正态分布或近似正态分布 的资料几何均数平均增(减)倍数 (对于等比资料)等比资料;对数正态分布资料中位数位次居中的观察值水平偏态分布;两端无确切值;分布不明确的资料算术平均数算术平均数是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或

30、均数。算术平均数可根据样本大小及分组情况而采用直接法或加权法计算。(一)直接法主要用于样本含量 n < 3 0以下、未经分组资料平均数的计算。设某一资料包含 n个观测值:Xi、x2、xn,则样本平均数可通过下式计算:XiX2XnXii 1n其中,2为总和符号;表示从第一个观测值在意义上已明确时,可简写为2 X ,(3-1)式可改写为:nX1累加到第n个观测值 Xn。当加权法对于样本含量 n>30以上且已分组的资料,可以在次数分布表的基础上采用 加权法计算平均数,计算公式为X fN£2X2Xf1f2kfi Xii 1kfii 1fx第i组的组中值;第i组的次数;分组数第i组

31、的次数fi是权衡第i组组中值Xi在资料中所占比重大小的数量,因此将 f i称为是Xi的权”加权法也由此而得名(三)平均数的基本性质1、样本各观测值与平均数之差的和为零,即离均差之和等于零。式中:或简写成n(Xii 1X) 0(X X) 0,即离均差平方和为最小。 (常数a工)NXii 12、样本各观测值与平均数之差的平方和为最小(X i -)2<(Xi a)2或简写为:V对于总体而言,通常用卩表示总体平均数,有限总体的平均数为:中位数,称为中位数,记为 Md。将资料内所有观测值从小到大依次排列,位于中间的那个观测值当观测值的个数是偶数时,则以中间两个观测值的平均数作为中位数。当所获 得的

32、数据资料呈偏态分布时,中位数的代表性优于算术平均数。中位数的计算方法因资料是否分组而有所不同。某犬场发生犬瘟热,观察得10只仔犬发现症状到死亡分别为1 3、14、1 4天,求其中位数。此例n =10,为偶数,则:【习题】12、 12、7、8、8、 9、11、(天 )即10只仔犬从发现症状到死亡天数的中位数为11 .5天。几何均数几何均数适用于原始数据分布不对称,但经对数转换后呈对称分布的资料。医学上血清滴度资料常用几何均数描述其分布的集中趋势。n个观测值相乘之积开n次方所得的方根,称为几何平均数,记为畜牧业、水产业的生产动态分析,畜禽疾病及药物效价的统计分析,的增长率,抗体的滴度,药物的效价,

33、畜禽疾病的潜伏期等 更能代表其平均水平。其计算公式如下:G。它主要应用于 。 如畜禽、水产养殖 ,用几何平均数比用算术平均数G nX X2 为Xi(X1 冷怡描述定量变量的指标的正确选择正态或近似正态分布的资料 均数和标准差偏态分布的资料中位数和四分位数间距等比级数或对数正态分布的资料几何均数离散程度的指标极差:描述单峰对称分布小样本资料的变异程度,或用于初步了解资料的变异程度。若样本含 量相差较大,不宜用极差来比较资料的离散程度。四分位数间距:描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。标准差、方差:常用于描述对称分布,特别是正态分布或近似正态分布资料的离散程度。 变异系数:适

34、用于比较计量单位不同或均数相差悬殊的几组资料的离散程度。全距(极差)是表示资料中各观测值变异程度大小最简便的统计量。但是全距只利用了资料 中的最大值和最小值,并不能准确表达资料中各观测值的变异程度,比较粗略。当资料很多而又要迅速对资料的变异程度作出判断时,可以利用全距这个统计量。标准差一、标准差的意义用平均数作为样本的代表,其代表性的强弱受样本资料中各观测值变异程度的影 响。仅用平均数对一个资料的特征作统计描述是不全面的,还需引入一个表示资料中观测 值变异程度大小的统计量。为了准确地表示样本内各个观测值的变异程度,首先会考虑到以平均数为标准,求出各个观测值与平均数的离差,(X X ),称为离均

35、差。虽然离均差能表示一个观测值偏离平均数的性质和程度,但因为离均差有正、有负,离均差之和为零,即(X X)= 0 ,因而不能用离均差之和()来表示 资料中所有观测值的总偏离程度。我们还可以采用将离均差平方的办法来解决离均差有正、有负,离均差之和为零的问题。即变,为即先将各 个离均差平方,X即()2,再求离均差平方X和 ,简称平方和,记为SS;由 于离差平方和常 随样本大小而改了消除样 本大小 的影响,用平方和(X除乂以/n羊本大小, ,求出离均差平方和的平均数;相应的总体参数叫总体方差,记为b 2O对于有限总体而言,b 2的计算公式为:由于样本方差带有原观测单位的 而不作其它分析时方差的平方根

36、。统计学上把样本方差(X X)2/N平方单位,在仅表示一个资料中各观测值的变异程度,常需要与平均数配合使用,这 时应 将平方单位还原,即应求出样本S2的平方根叫做样本标准差,记为S,即:相应的总体参数叫总体标准差,记为boI (X X)2 n 1对于有限总体而言,b的计算公式为:V (X )2/N在统计学中,常用样本标准差S估计总体标准差bo标准差的特性? 标准差的大小,受资料中每个观测值的影响,如观测值间变异大,求得的标准差也 大,反之则小。? 在计算标准差时,在各观测值加上或减去一个常数,其数值不变。? 当每个观测值乘以或除以一个常数a,则所得的标准差是原来标准差的a倍或1/a倍。变异系数

37、变异系数是衡量资料中各观测值变异程度的另一个统计量 标准差与平均数的比值称为 变异系数,记为 CVO变异系数可以消除单位和(或)平 均数不同对两个或多个资料变异程度比较的影响。变异系数的计算公式为:SC V - 100%x1、比较度量衡单位不同的多组资料的变异度如某地20岁男子100人,其身高均数为166.0 6cm,标准差为4. 9 5cm;其体重均数为53.72k g, 标准差为4 .96kg。欲比较身高与体重的变异何者为大,由于度量单 位不同,不能比较其标准差而应比较其变异系数。由于,身高的变异系数:C V4.95Cm 100% 2.98%166.06cm体重的变异系数:,CCC V -

38、 100%9.23%53.72kg因而在利用变异系数表所以,该地20岁男子体重的变异大于身高的变异。年龄组人数均数标准差变异系数()3-3.5 岁10096.13.13. 23 0 -35 岁1 001 70. 25. 00 .3注意,变异系数的大小,同时受平均数和标准差两个统计量的影响, 示资料的变异程度时,最好将平均数和标准差也列出。2、比较均数相差悬殊的多组资料的变异度某地不同年龄组男子身高的变异程度正态分布对称分布:以正态分布较为常见非对称分布:偏态分布正偏态:集中位置偏向左侧 均数中位数负偏态:集中位置偏向右侧 均数 中位数正态分布的特征? 单峰分布,高峰位于中央(均数所在处? 以均

39、数为中心,左右完全对称? 不与横轴相交的钟型光滑曲线? 正态分布有两个参数:均数与标准差? 某些指标经变换后服从正态分布? 正态曲线下的面积分布有一定的规律向右侧拖尾?向左侧拖尾iF恋曲纯卜面駅TTft帕0 5%O.#H正态曲线下的面积特点正态分布是一种对称分布,其对称轴为直线X = 面积是相等,各占 50%,靠近X = 在 在 在 在标准正态分布,X>与X< ,范围内曲线下的 处曲线下的面积较集中,两边逐渐减少。范围内,即- +范围内曲线下的面积等于0.68271.64范围内曲线下的面积等于0.90901.9 6范围内曲线下的面积等于0.950 02. 5 8范围内曲线下的面积等

40、于0.99 0 0若 X服从正态分布 N ( , 2) , ?则Z就服从均数为0、标准差为1的正态分布,?这种 正态分布称为标准正态分布或U分布,?记为 N ( 0,1) ,Z称为标准正态变量,这一变换也称为标准化变换。正态分布的应用医学参考值范围的估计? 参数估计是指用样本指标(统计量)估计总体指标(参数)。? 有点估计和区间估计四、总体均数的估计(一)标准误(二)均数的置信区间 标准差与标准误均数可信区间与参考值范围均数的可信区间参考值范围区别点按一定的概率1-指所谓“正常人”的解剖、生理、概念估计的总体均数的生化等指标的波动范围。计算公式用途范围称可信区间X tSx2SX2X US估计总

41、体均数判断观察对象的某项指标正常否常用统计图表统计表和统计图是重要的统计描述方法。它们具有简单、明了、易于理解和接受的 优点,而且便于比较和分析。同样的事实,用文字叙述可能需要进行长篇大论的解释,而且还受语言不同的限制,而用统计表或统计图则可一目了然。统计表概念统计表就是以表格的形式,表达被研究 对象的特征、内部构成及研究项目分组 之间的数量关系。统计表的结构统计表的基本结构包括:标题、标目、 线条、数字以及备注。标题是表格的总名称,置于表正上方 标目分为横标目和纵标目说明每一列中数字的属性,位于表格的第一横行 三线(顶线、底线、纵标目下横线),合计及两重纵标目时的短横线表内不留空项 写在表的

42、下方横标目说明每一行中数字的属性,位于表格的左侧纵标目线条数字备注表11.某年某地不同性别意外死匸构成死因*纵标目橫目车祸8449.70383167纵标目跌落2917J632下横线26.66溺水21也43数宇2319.17£011.831714J7n它1&8.88108.33169100.00120100.00构成比()妊数构成比(I *本表至葵调查四种死因騎构嚴情况! 备注底线统计表的绘制原则重点突出层次清楚简单明了不要包罗万象避免层次过多和结构混乱文字、线条、数字一切从简统计图统计图就是以点、线、面等各种几何图形表达统计数据和分析结果 统计图的结构置于图的下下方分为横标目

43、和纵标目,说明横轴和纵轴数字刻度的意义 纵、横轴比例一般为5: 7或7: 5说明统计图中各种图形所代表的事物统计图的基本结构包括:标题、标目、刻度和图例 标题标目刻度图例常用的统计图条图百分比条图、圆图线图直方图散点图箱式图统计地图统计图类型适用条件条图适用于比较相互独立的统计指标的数值大小圆图、百分比条 图描述分类变量各类别所占构成比,后者特别适合多个构成比 的比较线图描述某统计量随另一连续性数值变量变化而变化的趋势直方图描述数值变量的频数分布箱式图描述数据的分布特征统计地图描述某指标在地理区域的分布条图用等宽直条的长短来表示各个相互独立的指标大小的图形比较、分析相互独立的多个组或者多个资料

44、(资料有明确分组)分为单式和复式两种。单式适用于只有一个分组因素,复式适用于两个分组因素习题:请用统计图描述温州市10家哨点医院2009-2 0 11年呼吸道病例数比较各家哨点医院三年呼吸道病例数的变化S甲地区 H乙地区 園丙地区年份图三地区肺结核各年发病数的比较67J堆积柱形图例实验室诊断010-410-7 10-10 10-13 10-16 10-19 10-22 10-25 10-28衣病日期68以一个圆面积为100%,用圆内各扇形面积所占的百分比来表示各部分所占的构成比例 适用于构成比资料线图以线段的上升或下降来表示事物在时间上的发展变化或一种现象随另一种现象变迁 的情况适用于连续性资

45、料,反映事物的动态变化规律根据纵轴尺度分为普通线图和半对数线图。普通线图描述绝对变化趋势;半对数线 图描述相对变化趋势,可用于比较。箱式图适用于定量资料,描述数据的分布特征,也可用于多组数据分布的直观分析比较百分比条图以长条面积为100%,用长条内各段面积所占的百分比来表示各部分在全体中所占的比例适用于构成比资料百分比条图特别适合作多个构成比的比较假设检验的步骤及有关概念总体间差异:1.个体差异,抽样误差所致;2.总体间固有差异判断差别属于哪一种情况的统计学检验,就是假设检验(test of hypo t hesi s )。t检验是最常用的一种假设检验之一。小概率思想:P<0.05 (或

46、P<0. 0 1)< a (0 .0 5 )样本差别有统计学意义;是小概率事件。在一次试验中基本上不会发生。P > a (0 .05)样本差别无统计学意义t检验(Student sit e st),主要用于样本含量较小(例如nT检验,亦称st U de n t t检验< 30),总体标准差 b未知的 正态分布 资料。两总体方差未知但相同,用以两平均数之间差异显著性的检验。 样本均数与总体均数的比较配对资料的比较两样本均数的比较大样本均数比较的 u检验正态性检验与两方差齐性检验假设检验是通过两组或多组的样本统计量的差别或样本统计量与总体参数的差异来 推断他们相应的总体参数

47、是否相同;医疗卫生实践中最常见的是计量资料两组比较的问题样本均数与总体均数的比较推断样本所代表的未知总体均数与已知总体均数有无差别。t |X 0I |X 0ISX已知总体均数一般为理论值、标准值或经大量观察所得的稳定值。 统计量t的计算公式:例3-7难产儿出生体重n =35, X = 3. 42) S =0. 40,一般婴儿出生体重0=3 .3 0(大规模调查获得),问相同否? 解:1 .建立假设、确定检验水准at ern ative h yp ot he si s,) = 0.0 5Ho:0 (无效假设,n U II hy p othesis)Hl:0 (备择假设,al双侧检验,检验水准:a

48、2.计算检验统计量丄 3.423.30, “135 134t 产 1.77 ,0.40/J353 .查相应界值表,确定P值,下结论查附表 2)t0.05/2,342.032 , t 1 0.05/2,34 , P >0.0 5)按口 = 0.05水准,不拒绝H0,两者的差别无统计学意义附表2 t界值表附表2 t界值表概率復p曰田辰a单侧:0.25双侧:0. 500, 050. 10a 025O 050,010. 020. 0050. 010O 00250. 00501L 0006. 314L2.7063L 82163. 657127. 32120. 8102. 9204303氐9659.

49、 92514. 08930. 7652. 35331824, 5405. 84 L7. 45340, 7412. L3227763, 7474. 6045, 59731O 6S3L. 69620402, 4532. 了443. 022320. 682L. 6942037£ 4492. 738左0L5340, 682L. 69120322, 4412. 7283, 002n rI rrTrnr1 rQO0. 67451. 6449L. 96002. 32632. 57582. 8070二、配对资料的比较两种情况:1.随机配对设计是将受试对象按某些混杂因素 (如性别、年龄、窝别等) 配成

50、对子,每对中的两个个体随机分配给两种处理(如处理组与对照组);2.或者同一受试对象作两次不同的处理(自身对照)。优点:配对设计减少了个体差异。 特点:资料成对,每对数据不可拆分。两样本均数的比较完全随机设计(co mp let ely random design ):把受试对象完全随机分为两组,分别给 予不同处理,然后比较独立的两组样本均数。各组对象数不必严格相同。目的:比较两总体均数是否相同。条件:假定资料来自正态总体,计算公式:计算公式:t X1-X2SX1-X2n1 -1 n2 -1 n1 n2 -2-X2其中,均数差的标准误ScEXi2-(EXi)2/ni 022-(02)2/n22

51、2(n1-1)S1(n2-1)S2m -1 n2 -1n1n2 - 2例3- 916.9白血病组(X1):12 . 3 13. 21 3 .7 15. 2 1 5 .41 5.8正常组(X2):1 0. 8 11.6 12 . 3 12.7 13.5 13.5 14.8S1 =1. 6 2, n2 =7, X2 = 12. 74, S2问正常鼠和白血病鼠脾脏中 DNA平均含量(mg/g)是否不同? 解:本例:n 1=7, X1 = 14.6 4 ,1 .331. 建立假设、确定检验水准a = 0. 0 5Ho:12 H2. 计算检验统计量。S 2(71) 1.622(71) 1.3321X1 X2I7 7 2|14.6

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论