流行病学的常用指标_第1页
流行病学的常用指标_第2页
流行病学的常用指标_第3页
流行病学的常用指标_第4页
流行病学的常用指标_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、疾病发病频率测量指标发病率(incidence rate )罹患率(attack rate )患病率(prevalence rate )感染率(infection rate )续发率(secondary attack rate , SAR病残率(disablility rate)生存率(survival rate)发病率(incidence rate ):表示在一定期间内,一定人群中某病新病例出现的频率,是用来衡量某时期一个地区人群发生某病的危险性大小的指标。一定期间内某人群中某病新病例数发病率= X K同期暴露人口数K=( 100%, 1000/ 千,或 10000/万)。发病率的准确性取决

2、于疾病报告,登记制度以及诊断的正确计算发病率时,要考虑的几个因素:发病时间在观察期内。观察时间观察时间多以年表示。暴露人口数指可能会发生该病的人群。新发病例数 分子是一定期间的新发病例,若在观察期间内一个人可多次患病时,则应分别计为新发病例数,如腹泻,流感等。发病率可按不同特征(如年龄、性别、职业、民族等)分别计算,此即发病专率。罹患率(attack rate ):与发病率一样,也是测量新发病例的指标。观察期间的新病例罹患率= X 100同期暴露人口数常用于较小范围或短期间的疾病流行。观察时间可以日、周、旬、月为单位。适用于局部地区疾病的爆发,食物中毒、传染病及职业中毒等爆发流行情况。其优点是

3、可以根据暴露程度精确的测量发病机率。患病率(prevalence rate ):也称现患率。指某特定时间内总人口中某病新旧病例 所占比例。可按观察时间的不同分为期间患病率和时点患病率。某一时点一定人群中现患某病新旧病例数时点患病率= x K该时点人口数某观察期间一定人群中现患某病新旧病例数期间患病率= x K同期的平均人口数K= 100%, 1000/千,或 10000/万等期间患病率实际上等于某一特定期间开始时患病率 加上该期间内的发病率。患病率升高或降低的原因:影响升高的因素:病程延长,未治愈者的寿命延长,新病例增加(即发病率增),病例迁入,健康者迁出,易感者迁入,诊断水平提高,报告率提高

4、。影响降低的因素:病程缩短,病死率高,新病例减少(发病率下降),健康者迁入,病例迁出,治愈率提高感染率(infection rate ):是指在某个时间内能检查的整个人群样本中,某病现有感染者人数所占的比例。调查时某病感染人数感染率= X 100%调查时受检人数感染率常用于研究某些传染病或寄生虫病的感染情况和分析防治工作的效果,估计某病的流行势态,为制定防治措施提供依据。特别是对隐性感染、病原携带及轻型和不典型病 例的调查较为有用。如乙型肝炎、乙型脑炎、脊髓灰质炎、结核、寄生虫等。续发率(secondary attack rate , SAR :指在某些传染病最短潜伏期到最长潜伏期之间,易感接

5、触者中发病的人数占所有易感接触者总数的百分率。一个潜伏期内易感接触者中发病人数续发率= X 100%易感接触者总人数多指在一个家庭内、病房、集体宿舍、托儿所、幼儿园班组中第一个病例发生后,在该 病最短与最长潜伏期之间出现的病例称续发病例。也称二代病例。计算时,须将原发病例从分子及分母中去除。对那些在同一家庭中来自家庭外感染或短于最短潜伏期、或长于最长潜伏期者均不应计入原发病例。续发率可以用于比较传染病传染力的强弱,用于分析传染病流行因素,包括不同条件对传染病传播的影响(如年龄、性别、家庭中儿童数、家庭人口数、经济条件等)及评价卫 生防疫措施的效果(如对免疫接种、隔离、消毒等措施的评价)。病残率

6、(disablility rate):某一人群中,在一定期间内每百(或千、万、十万)人中实际存在的病残人数。是指通过调查询问或健康调查,确诊的病残人数与调查人数之比。病残人数病残率=调查人数(K= 100%, 1000/千,或 10000/ 万,等)病残率可以说明病残在人群中发生的频率,是作为人群健康状况的评价指标之一。疾病死亡频率测量指标:死亡率(mortality rate)病死率(fatality rate)生存率(survival rate)死亡率(mortality rate):是某人群在一定期间(一般为一年)的死亡人数与该人群同期人口数之比。表示在一定时期内,死于某病(或死于所有原

7、因)的频率。某人群某年总死亡人数粗死亡率= x k该人群同年平均人口数某期间内(因某病)死亡总数死亡专率= X K同期平均人口数(K= 100% , 1000/千,或 10000/万,等)死亡率是测量人群死亡危险性大小最常用的指标。病死率(fatality rate):表示在一定时间内(通常为1年),患某病的病人中因该病而死亡者的比例。某时期内因某病死亡人数病死率= X 100%同期确认的某病病例数病死率表示某病确诊后发生死亡的概率,它受疾病的严重程度、早期诊断和治疗水平的 影响。生存率(survival rate):指在接受某种治疗的病人或患某病的人中,经若干年随访(通常为1,3,5年)后,

8、尚存活的病人数所占的比例。随访满n年尚存活的病例数生存率= x 100%随访满n年的病例数生存率反应了疾病对生命的危害程度,也是考核治疗措施效果的指标。率和比率(rate ):指在某一确定人群中某些事件发生的频率。一个率由分子(发生数)、分母(可能发生的总数)、事件发生的特定时间和乘数组成。大多数率是构成比。比(ratio ):是两个变量的数值之商,表示分子和分母之间的数量关系。比例(proportion ):是表示同一事物局部与总体之间数量上的比值,分子和分母的单位相同,而且分子包含与分母之中。常用 P= a/a+b表示。有两类,一、反映事物静止状态内部构成成分占全体的比重,也称构成比例,二

9、、与动态的发生变化概率密切相关的发生频率比例,它反映一定时间内,发生某种变化者占全体的比例。率与比的区别率分子是分母的一部分,分子和分母代表的应该是同一人群;如果分子被限定在某一年龄、性别或种族组内,分母也应该有同样的限定;可以取任何值,是反映动态过程的一个参数。比不管分子和分母所来自的总体如何;可以是两个彼此分离的互不相重叠或包含的量;分子和分母本身可以是绝对数,也可以是率、比例或比;构成比取值仅在 0到1之间,是变量在一定期间内发生变化的概率 疾病残疾失能指标:潜在减寿年数(potential years of life lost, PYLL) 伤残调整寿命年潜在减寿年数(potentia

10、l years of life lost, PYLL):是指某病某年龄组人群死亡者的期望寿命与实际死亡年龄之差的总和。即死亡所造成的寿命损失。潜在减寿年数是评价人群健康水平的一个重要指标;也是评价人群健康水平的一个重要指标;可以用于衡量某种死因对一定年龄组人群的危害程度。可以反映出对各年龄组人群的危害大小。伤残调整寿命年(disability adjusted life year, DALY):是指从发病到死亡所损失的全部健康寿命年,包括因早死所致白寿命损失年 (YLL)和疾病所致伤残引起的 健康寿命损失年(YLD)两部分。DALY是生命数量和生命质量以时间为单位的综合度 量。DALY 是一个

11、定量的计算因各种疾病造成的早死与残疾对健康寿命年损失的综合指标。是将由于早死(实际死亡年数与低死亡人群中该年龄的预期寿命之差)造成的损失和因伤残造成的健康损失二者结合起来加以测算的。流行病学是从宏观的高度和群体的角度来认识疾病和健康状况的分布及其机制,研究制定防治对策及评价其效果。DALY的出现是疾病经济负担研究的划时代变化,在1980年以前,DALY 的概念还没有提出,疾病负担的评价指标主要是发病率、死亡率等传统指标。随着医学模式 的转变,传统的指标越来越不适应现代医学模式的要求,1988年,为了量化失去健康生命的全部损失,哈佛大学和世界卫生组织的专家进行了DALY的研究,并成功地应用于GD

12、B的分析。DALW目前应用最多的、最具代表性的疾病经济负担评价和测量指标。表示流行强度的术语有:散发(sporadic )暴发(outbreak ) 流行(epidemic ) 大流行(pandemic散发(sporadic ):是指某病在一定地区的发病率呈历年来一般水平,各病例间在发病时间和地点方面无明显联系,表现为散在发生。确定某病在某地区是否属于散发,应参照当地前3年该病的发病率,如当年发病率未显著超过既往一般发病率,则称为散发。不同病种、不同时期散发水平不同。一般多用于区、县以上范围,不适于小范围的人群,如一个托儿所、工厂和学校等。 疾病分布呈散发形式的主要原因:该病常年流行,人群有一

13、定免疫力或因疫苗接种维持着人群的免疫水平,如麻疹。隐性感染为主的传染病,如脊髓灰质炎、病毒性肝炎等。传播机制难以实现的传染病,如流行性回归热。潜伏期较长的传染病,如麻风病、炭疽。暴发(outbreak)是指在局限的区域范围或集体单位中,短时间内突然发生很多相同 的病人,病人之间有相同的传染源或传播途径。如食物中毒、托幼机构的麻疹,流 脑等容易发生暴发。暴发的几个类型:点源暴发 易感人群在一个相同的短时间内暴露于共同的传播因素而引起的流行。重复暴露同源暴发易感人群在一定期间内重复(多次)暴露于共同的传播因素而引起的流行,流行曲线呈多峰或不规则型。蔓延暴发 是指通过宿主间传播或人传人所引起的流行。

14、流行(epidemic ):流行是指一个地区某病发病率明显超过历年的散发发病率水平称为流行。流行与散发是相对的,各地应根据不同时期、不同病种等作出判断。有时在实际工作中用暴发流行一词。 它表示在一个地区某病病例突然大量增多, 发病率 常超过一般流行的发病率水平, 来势较迅猛,流行持续时间往往超过该病的最长潜伏期。这个词仅仅是实际工作中使用的,它和流行病学中的暴发之词不同。有些传染病隐性感染占大多数。当它流行时临床症状明显病例可能不多,而实际感染率却很高,这种现象称为隐性流行。如流行性乙型脑炎和脊髓灰质炎常具有这种现象。大流行(pandemic):大流行即疾病蔓延迅速,涉及地域广,往往在比较短的

15、期间内 越过省界、国界、甚至洲界,而形成大流行。如流行性感冒、霍乱,历史上曾发生 过多次世界性流行。当前艾滋病的流行也是呈世界性的。筛检 (screening ):是在大量人群中通过快速的试验和其他方法,从外表健康的人群中查出某病的可疑患者的一种预防性措施。筛检不是诊断试验, 它是把健康人和病人 (疑似病人、有缺陷的人)区别开来的方法, 它仅是初步检查,是早期发现病人的一种方法。对筛检试验阳性还应进一步确诊。对某种疾病来说,在一般人群中包括三种人,一种是无该病的健康人, 一种是可疑有该病但实际无该病的人,一种是有该病的人,这三种人混杂存在。筛检的工作即是将健康人与其他两类人区别开来。然后用更完

16、善的诊断方法,将可疑 患该病但实际无该病的人与实际患该病的人区别开来。第三步为对有该病的人进行治疗,使之恢复。因此,筛检是第一步,诊断试验是第二步,治疗是第三步。筛检试验评价筛检试验金标准合计患后非患后:日性真阳性A假阳性BR1“性假阴性C真阴性DR2合计C1C2N筛检的评价指标:1 .真实性(validity ),亦称效度,指测量值与实际值相符合的程度,故又称准确性 (accuracy )。用于评价真实性的指标有:灵敏度与假阴性率、特异度与假阳性率、正确指数、似然比和符合率。灵敏度与假阴性率灵敏度(sensitivity ),又称真阳性率(true positive rate ),即实际有病

17、而按该筛检试 验的标准被正确地判为有病的百分比。它反映了筛检试验发现病人的能力。假阴性率(false negative rate ),又称漏诊率,指实际有病,根据筛检试验被确定为无病 的百分比。它反映的是筛检试验漏诊病人的情况。灵敏度与假阴性率之间为互补关系:灵敏度=1 -假阴性率即灵敏度越高,假阴性率越低,反之亦然。特异度与假阳性率特异度(specificity ),又称真阴性率(true negative rate ),即实际无病按该诊断标 准被正确地判为无病的百分比。它反映了筛检试验确定非病人的能力。特异度一 100%B D假阳性率(false positive rate ),又称误诊率

18、,即实际无病,但根据筛检被判为有病的百 分比。特异度与假阳性率之间为互补关系:特异度=1 - 假阳性率即特异度越高,假阳性率越低,反之亦然。正确指数正确指数也称约登指数(Youden' s index ),是灵敏度与特异度之和减去 1,表示筛检方法 发现真正病人与非病人的总能力。正确指数的范围在 01之间。指数越大,其真实性越高。正确指数=(灵敏度+特异度)-1=1-(假阴性+假阳性)似然比(likelihood ratio, LR )属于同时反映灵敏度和特异度的复合指标,即有病者中得出某一筛检试验结果的概率与无病者得出这一概率的比值。全面反映了筛检试验的诊断价值,非常稳定。它的计算只

19、涉及灵敏度与特异度,不受患病率的影响。检验结果有阳性与阴性之分,故似然比相应地区分为:阳性似然比(positive likelihood ratio,+ LR)LR)阴性似然比(negative likelihood ratio,阳性似然比是筛检结果的真阳性率与假阳性率之比。该指标反映了筛检试验正确判断阳性的可能性是错误判断阳性可能性的倍数。比值越大,试验结果阳性时为真阳性的概率越大。真阳性率灵敏度假阳性率1特异度阴性似然比是筛检结果的假阴性率与真阴性率之比。该指标表示错误判断阴性的可能性是正确判断阴性可能性的倍数。比值越小,试验结果阴性时为真阴性的可能性越大。假阴性率 1灵敏度LR 真阴性率

20、 特异度阳性似然比越大,筛检试验的诊断价值越高; 阴性似然比越小,筛检试验的诊断价值也越高。 因此,在选择筛检试验时应选择阳性似然比高的方法。人群某病患病状况与筛检结果的关系筛检试验金标准诊断结果合计患后非患后:日性165A80B245R1阴性45C730D775R2合计210C1810C21020N730灵敏度6165 45100% 78.6%特异度 一30 100% 90.1% 80 730正确指数 78.6% 90.1% 1 0.69可靠性(reliability )也称信度、精确度(precision )或可重复性(repeata-bility ),是指在相同条件下用某测量工具(如筛检

21、试验)重复测量同一受试者时获得相同结果的稳定程度。评价筛检试验可靠性的方法和指标有下面一些方法:标准差和变异系数当某试验是做定量测定时,可用标准差和变异系数( coefficientvariance, CV)来表示可靠性。标准差和变异系数的值越小,表示可重复性越好,精密度越 高。反之,可重复性就越差,精密度越低。变异系数为标准差与算术均数之比。变异系数(CV)=(标准差/算术均数)X 100%符合率(agreement rate, consistency rate )与 Kappa 值符合率又称一致率,是筛检试验判定的结果与标准诊断的结果相同的数占总受检人数的比或同一医师两次筛检诊断同一组病人

22、例。符合率可用于比较两个医师筛检诊断同一组病人, 的结果。A D致率 100%A B C D影响筛检试验可靠性的因素有:受试对象生物学变异由于个体生物周期等生物学变异,使得同一受试对象在不同时间获得的临床测量值有所波动。例如,血压在一天内不同时间的测量值存在变异。观察者由于测量者之间、同一测量者在不同时间的技术水平不一,认真程度不同,生物学感觉差异,预期偏倚等均可导致重复测量的结果不一致。例如,血压测量者的不一致性,X线读片与化验结果判断的不一致性等。实验室条件 重复测量时,测量仪器不稳定,试验方法本身不稳定,不同厂家、同一厂家生产的不同批号的试剂盒的纯度、 有效成份的含量、试剂的稳定性等均有

23、不同,由此可能引 起测量误差。预测值(predictive value)预测值是反映应用筛检结果来估计受检者患病和不患病可能性的大小的指标。根据筛检 的阳性与阴性结果进行的估计分别称为阳性预测值和阴性预测值。阳性预测值(positive predictive value, PPV )是指筛检试验阳性者患目标疾病的可 能性。阳性预测值A 100%A B阴性预测值(negative predictive value, NPV是指筛检试验阴性者不患目标疾病的可能性。阴性预测值一吐100% C D筛检试验的灵敏度越高,阴性预测值越高;筛检试验的特异度越高,阳性预测值越高。预测值还与受检人群目标疾病患病

24、率(P)的高低密切相关:阳性预测值阴性预测值灵敏度 患病率灵敏度患病率 (1患病率)(1特异度)特异度(1患病率)特异度(1患病率)(1灵敏度)患病率人群在不同患病率、灵敏度与特异度的情况下,阳性预测值与阴性预测值的变化。当灵敏度与特异度一定,疾病患病率降低时,阳性预测值降低,阴性预测值升高;当患病率不变,降低灵敏度,特异度将提高,此时阳性预测值将升高,阴性预测值将下降。 在灵敏度、特异度和患病率不同水平时某人群糖尿病筛检的结果患病率灵敏度特异度筛检金标准一入什阳性预阴性预(%)(%)(%)结果患后非患后i-i TT测值(%)测值(%)505050十25025050050一合计25025050

25、0505005001000205050十10040050020一10040050080合计20080010002090502040042095合计2008001000205090十1008018056一10072082088合计2008001000卫生统计学常用指标分析与图表制作总体:是根据研究目的确定的同质研究对象的全体。按研究对象来源又分目标总体 和研究总体。样本:是指从研究总体中抽取的一部分有代表性的个体。同质是指同一总体中个体的性质、影响条件和背景相同或非常相近;变异是指同质的个体之间存在的差异。变量:每个观察单位的某项特征资料:对变量的测得值称为变量值或观察

26、值,亦称为资料资料的两种类型1定量资料(计量资料)r连续L离散定性资料(分类资料)无序二项分类多项分类L有序(等级资料)根据变量取值特点,计量资料分为:连续性资料:变量值可以在实数轴上连续变动。如年龄、身高、体重。离散型资料:变量取值能一一列举。只能取整数。如毒性试验小鼠死亡只习题:某人记录了 50名病人体重的测定结果:小于50kg的13人,介于50kg和70kg间的20人,大于70kg的17人,此种资料属于:A:定量资料 B :分类资料 C:有序资料D:二分类资料 E :名义变量资料概率概率是描述随机事件发生的可能性大小的数值,用P表示。随机事件概率的大小在 0和1之间,即0WP <1

27、,常用小数或百分数表示。P越接近1,表示某事件发生的可能性越大,P越接近0,表示某事件发生的可能性越小。P<,称为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,可以 视为很可能不发生。二、统计分析的内容统计描述统计推断:包括参数估计和假设检验统计资料的描述列表描述:频数分布表、一览表图形描述:频数分布图、趋势图指标描述定量资料集中位置:算术均数、几何均数、中位数离散程度:极差、四分位数间距、方差、标准差、变异系数 定性或等级资料相对数指标:率、构成比、比集中趋势的描述广义的平均数包含各种表示数据分布集中位置的指标。 卫生领域最常用的三种平均数指标:算术均数、几何均数、中位数定

28、量资料的集中趋势指标平均数意 义应用算术均数平均数量水平对称分布,特别是正态分布或近似正态分布 的资料几何均数平均增(减)倍数 (对于等比资料)等比资料;对数正态分布资料中位数位次居中的观察值水平偏态分布;两端无确切值;分布不明确的资 料算术平均数算术平均数是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数。 算术平均数可根据样本大小及分组情况而采用直接法或加权法计算。(一)直接法主要用于样本含量 nw30以下、未经分组资料平均数的计算。设某一资料包含 n个观测值:xi、x2、xn, 则样本平均数可通过下式计算:xnx1x2其中,2为总和符号;在意义上已明确时,可简写为2n表示从

29、第一个观测值x, (3-1 )式可改写为:nx1累加到第 n个观测值xn。当加权法对于样本含量 n>30 权法计算平均数,计算公式为:以上且已分组的资料,可以在次数分布表的基础上采用加, f1x1 f2x2x fif2fkxk fkkfiXi 1kfii 1fx式中:第i组的组中值;一第i组的次数;一分组数第i组的次数fi是权衡第i组组中值 fi称为是xi的“权”,加权法也由此而得名 (三)平均数的基本性质xi在资料中所占比重大小的数量,因此将、样本各观测值与平均数之差的和为零,即离均差之和等于零。 或简写成n(xix) 0i 1(x X) 0、样本各观测值与平均数之差的平方和为最小,即

30、离均差平方和为最小。xi- )2 <或简写为:( xi- a )2<(常数aw)对于总体而言,通常用科表示总体平均数,有限总体的平均数为:Nxi中位数将资料内所有观测值从小到大依次排列,位于中间的那个观测值,称为中位数,记为Md当观测值的个数是偶数时,则以中间两个观测值的平均数作为中位数。当所获得 的数据资料呈偏态分布时,中位数的代表性优于算术平均数。中位数的计算方法因资料是否分组而有所不同。【习题】某犬场发生犬瘟热,观察得10只仔犬发现症状到死亡分别为7、8、8、9、11、12、12、13、14、14天,求其中位数。此例r=10,为偶数,则:(天)即10只仔犬从发现症状到死亡天数

31、的中位数为天。几何均数几何均数适用于原始数据分布不对称,但经对数转换后呈对称分布的资料。医学上血清滴度资料常用几何均数描述其分布的集中趋势。r个观测值相乘之积开 r次方所得的方根,称为几何平均数,记为G它主要应用于畜牧业、水产业的生产动态分析,畜禽疾病及药物效价的统计分析。如畜禽、水产养殖的增长率,抗体的滴度,药物的效价,畜禽疾病的潜伏期等,用几何平均数比用算术平均数更 能代表其平均水平。其计算公式如下:rK & 均Xr(K &均1)r描述定量变量的指标的正确选择正态或近似正态分布的资料均数和标准差偏态分布的资料中位数和四分位数间距等比级数或对数正态分布的资料几何均数离散程度的

32、指标极差:描述单峰对称分布小样本资料的变异程度,或用于初步了解资料的变异程度。若样本含 量相差较大,不宜用极差来比较资料的离散程度。四分位数间距:描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。标准差、方差:常用于描述对称分布,特别是正态分布或近似正态分布资料的离散程度。变异系数:适用于比较计量单位不同或均数相差悬殊的几组资料的离散程度。全距(极差)是表示资料中各观测值变异程度大小最简便的统计量。但是全距只利用了资 料中的最大值和最小值,并不能准确表达资料中各观测值的变异程度,比较粗略。当资料 很多而又要迅速对资料的变异程度作出判断时,可以利用全距这个统计量。标准差一、标准差的意义用

33、平均数作为样本的代表,其代表性的强弱受样本资料中各观测值变异程度的 影响。仅用平均数对一个资料的特征作统计描述是不全面的,还需引入一个表示资料中观 测值变异程度大小的统计量。为了准确地 表示样本内各个观测值的变异程度,首先会考虑到以平均数为标准,求出各个观测值与平均数的离差,(x X ),称为离均差。虽然离均差能表示一个观测值偏离平均数的性质和程度,但因为离均差有正、有负,离均差之和为零,即( x X )=0,因而不能用离均差之和2 ( x X ) 来表示 资料中所有观测值的总偏离程度。我们还可以采用将离均差平方的办法来解决离均差有正、有负,离均差之和为零的问题。先将各个离均差平方,即又)2

34、,再求离均差平(X板)2,即,简称平方和,记为 SS;由于离差平方和 常随样本大小而改变,为了消除样本大小的影响, 用平方和(嫄x)2/rt羊本大小, 即,求出离均差平方和的平均数;相应的总体参数叫 总体方差,记为b 2。对于有限总体而言,b 2的计算公式为:2 (x x)2/N由于样本方差带有原观测单位的平方单位,在仅表示一个资料中各观测值的变异程度而 不作其它分析时,常需要与平均数配合使用,这时应将平方单位还原,即应求出样本方差的平方根。统计学上把样本方差S2的平方根叫做样本标准 差,记为S,即:S n 1相应的总体参数叫总体标准差,记为人 对于有限总体而言,b的计算公式为:(x )2/N

35、在统计学中,常用样本标准差 S估计总体标准差b。标准差的特性标准差的大小,受资料中每个观测值的影响,如观测值间变异大,求得的标准差也 大,反之则小。在计算标准差时,在各观测值加上或减去一个常数,其数值不变。当每个观测值乘以或除以一个常数a,则所得的标准差是原来标准差的a倍或1/a倍。变异系数变异系数是衡量资料中各观测值变异程度的另一个统计量。标准差与平均数的比值称为变异系数,记为 C-V。变异系数可以消除单位 和(或)平 均数不同对两个或多个资料变异程度比较的影响。变异系数的计算公式为:SC V - 100%1、比较度量衡单位不同的多组资料的变异度如某地20岁男子100人,其身高均数为,标准差

36、为;其体重均数为,标准差为。欲 比较身高与体重的变异何者为大,由于度量单位不同,不能比较其标准差而应比较 其变异系数。由于,身高的变异系数:C V4.95cm 100% 2.98%166.06cm体重的变异系数:4.96kqC V - 100% 9.23%53.72kg所以,该地20岁男子体重的变异大于身高的变异。注意,变异系数的大小,同时受平均数和标准差两个统计量的影响,因而在利用变异系数表示资料的变异程度时,最好将平均数和标准差也列出。2、比较均数相差悬殊的多组资料的变异度 某地不同年龄组男子身高的变异程度年龄组人数均数标准差变异系数(。%岁10030-35 岁100正态分布对称分布:以正

37、态分布较为常见非对称分布:偏态分布正偏态:集中位置偏向左侧向右侧拖尾均数 > 中位数负偏态:集中位置偏向右侧向左侧拖尾均数 < 中位数正态分布的特征? 单峰分布,高峰位于中央(均数所在处)? 以均数为中心,左右完全对称? 不与横轴相交的钟型光滑曲线? 正态分布有两个参数:均数与标准差? 某些指标经变换后服从正态分布? 正态曲线下的面积分布有一定的规律正态曲线下的面积特点正态分布是一种对称分布,其对称轴为直线 下的面积是相等,各占 50%靠近X=X= , X> 与X< ,范围内曲线 处曲线下的面积较集中,两边逐渐减少。范围内,即-+范围内曲线下的面积等于范围内曲线下的面积

38、等于在范围内曲线下的面积等于在范围内曲线下的面积等于标准正态分布X若X服从正态分布 N (,2),则Z就服从均数为0、标准差为1的正态分布,这种正态分布称为标准正态分布或u分布,记为N (0 , 1), Z称为标准正态变量,这一变换也称为标准化变换。正态分布的应用医学参考值范围的估计参数估计是指用样本指标(统计量)估计总体指标(参数) 。有点估计和区间估计四、总体均数的估计(一)标准误(二)均数的置信区间标准差与标准误常用统计图表统计表和统计图是重要的统计描述方法。它们具有简单、明了、易于理解和接受的优点,而且便于比较和分析。同样的事实,用文字叙述可能需要进行长篇大论的解释,而且还受语言不同的

39、限制,而用统计表或统计图则可一目了然。标题是表格的总名称,置于表正上方标目分为横标目和纵标目横标目 说明每一行中数字的属性,位于表格的左侧纵标目说明每一列中数字的属性,位于表格的第一横行线条 三线(顶线、底线、纵标目下横线),合计及两重纵标目时的短横线数字表内不留空项备注写在表的下方统计表的绘制原则重点突出不要包罗万象层次清楚避免层次过多和结构混乱简单明了 文字、线条、数字一切从简统计图统计图就是以点、线、面等各种几何图形表达统计数据和分析结果统计图的结构统计图的基本结构包括:标题、标目、刻度和图例标题置于图的下下方标目 分为横标目和纵标目,说明横轴和纵轴数字刻度的意义刻度 纵、横轴比例一般为

40、 5: 7或7: 5图例 说明统计图中各种图形所代表的事物常用的统计图条图百分比条图、圆图线图直方图散点图箱式图统计地图统计图类型适用条件条图适用于比较相互独立的统计指标的数值大小圆图、百分比条描述分类变量各类别所占构成比,后者特别适合多个构成比图的比较线图描述某统同随另一连续性数值变量变化而变化的趋势直方图描述数值变量的频数分布箱式图描述数据的分布特征统计地图描述某指标在地理区域的分布条图用等宽直条的长短来表示各个相互独立的指标大小的图形比较、分析相互独立的多个组或者多个资料(资料有明确分组)分为单式和复式两种。单式适用于只有一个分组因素,复式适用于两个分组因素习题:请用统计图描述温州市10

41、家哨点医院2009-2011年呼吸道病例数比较各家哨点医院三年呼吸道病例数的变化圆图以一个圆面积为100%用圆内各扇形面积所占的百分比来表示各部分所占的构成比 例适用于构成比资料线图以线段的上升或下降来表示事物在时间上的发展变化或一种现象随另一种现象变迁的情况适用于连续性资料,反映事物的动态变化规律根据纵轴尺度分为普通线图和半对数线图。普通线图描述绝对变化趋势;半对数线图描述相对变化趋势,可用于比较。箱式图适用于定量资料,描述数据的分布特征,也可用于多组数据分布的直观分析比较百分比条图以长条面积为100%,用长条内各段面积所占的百分比来表示各部分在全体中所占的 比例适用于构成比资料百分比条图特

42、别适合作多个构成比的比较假设检验的步骤及有关概念总体间差异:1.个体差异,抽样误差所致;2.总体间固有差异判断差别属于哪一种情况的统计学检验,就是假设检验( test of hypothesis )。t 检验是最常用的一种假设检验之一。小概率思想:*(或P<)是小概率事件。在一次试验中基本上不会发生。PW “ 样本差别有统计学意义;P >a样本差别无统计学意义t检验T检验,亦称student t 检验(Student 's t test ),主要用于样本含量较小(例 如n<30),总体标准差b未知的正态分布资料。两总体方差未知但相同,用以两平均数之间差异显著性的检验。

43、样本均数与总体均数的比较配对资料的比较两样本均数的比较大样本均数比较的 u检验正态性检验与两方差齐性检验假设检验是通过两组或多组的样本统计量的差别或样本统计量与总体参数的差异来推断他们相应的总体参数是否相同;医疗卫生实践中最常见的是计量资料两组比较的问题样本均数与总体均数的比较推断样本所代表的未知总体均数科与已知总体均数科0有无差别。已知总体均数 科0一般为理论值、标准值或经大量观察所得的稳定值。统计量t的计算公式:tIX.I,口 1SxS n例3-7 难产儿出生体重n=35, X=, S =, 一般婴儿出生体重0=(大规模调查获得),问相同否 解:1.建立假设、确定检验水准H):o (无效假

44、设,null hypothesis )H:0 (备择假设,alternative hypothesis ,)双侧检验,检验水准:% =2 .计算检验统计量t 3.42 3.30 1.77, n 1 35 1 340.40 八 353 .查相应界值表,确定P值,下结论查附表 2, t0.05/2,34 2.032 , t 10.05/2,34 , P >,按 =水准,不拒绝h,两者的差别无统计学意义二、配对资料的比较两种情况:1.随机配对设计是将受试对象按某些混杂因素(如性别、年龄、窝别等)配成对子,每对中的两个个体随机分配给两种处理(如处理组与对照组);2.或者同一受试对象作两次不同的处

45、理(自身对照)。优点:配对设计减少了个体差异。特点:资料成对,每对数据不可拆分。两样本均数的比较完全随机设计(completely random design):把受试对象完全随机分为两组,分别给予不同处理,然后比较独立的两组样本均数。各组对象数不必严格相同。目的:比较两总体均数是否相同。条件:假定资料来自正态总体,(T 12=(t 22计算公式:计算公式:X1 -X2 t SOX1-X2n1 -1 n2 -1 n1 n2 -2其中,均数差的标准误SX1-TX2SR1) n2Sc2Z>12-( Z>1)2/n1 Z>22-( Z>2)2/n2_ 2_ 2(n1-1)S1

46、(n2-1)S2n1 -1 n2 -1n1n2 - 2例3-9白血病组(Xi): 正常组 (X2):问正常鼠和白血病鼠脾脏中 DNWF均含量(mg/g)是否不同解:本例:01=7, X1=, S1=,1 .建立假设、确定检验水准H:12 H 1:12 .计算检验统计量。%=7,a 。2(7 1) 1.62(7 1)1.33202|X X2I7 7 2114.64 12.74|2.39)2.207 7 2 121 12.20 (7 7)3.查相应界值,确定P值,下结论查表 to.05/2,122.179 , tto.05/2,12 ,不拒绝HO,大样本均数比较的u检验两样本均数比较时当每组样本量大于30 (或优点:简单,u界值与自由度无关,50)时,可采用u检验;但只是近似方法。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论