L4-1分类变量的描述性统计_第1页
L4-1分类变量的描述性统计_第2页
L4-1分类变量的描述性统计_第3页
L4-1分类变量的描述性统计_第4页
L4-1分类变量的描述性统计_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、定性资料的统计描述定性资料的统计描述婚姻状况频数单身 3已婚 5离异 2分居 4合计14 14名成人的婚姻状况名成人的婚姻状况编号性别身高婚姻状况1男175单身2女167单身3男187单身4女176已婚5男167已婚6女178已婚7男174已婚8女170已婚9男167离异10女186离异11男182分居12女159分居13男167分居14女182分居14名成人的原始数据名成人的原始数据婚姻状况性别男女单身21已婚23离异11分居22不同性别的婚姻状况不同性别的婚姻状况编号性别身高婚姻状况1男175单身2女167单身3男187单身4女176已婚5男167已婚6女178已婚7男174已婚8女170

2、已婚9男167离异10女186离异11男182分居12女159分居13男167分居14女182分居14名成人的原始数据名成人的原始数据绝对数: 资料整理后各组的例数相对数: 两个绝对数之比中得到的一种数值v甲地区流脑流行比乙地区严重 v如已知小学生总人数:甲地区50051人,乙地区14338人,可算出两个发病率: v甲地区流脑发病率:63/500511000=1.26v 乙地区流脑发病率:35/14338 1000=2.44 v乙地区流脑流行比甲地区严重乙地区流脑流行比甲地区严重1. 率:率:速率(速率(rate):与时间有关,如某年某病发病率、死亡率。):与时间有关,如某年某病发病率、死亡率

3、。比率(比率(proportion):与时间无关,如某病治愈率。):与时间无关,如某病治愈率。2. 比:比:构成比(构成比(constituent ratio):部分与全部之比):部分与全部之比相对比(相对比(relative ratio):两指标之比):两指标之比又称强度相对数或频率反映某现象出现的频率或强度。 某现象的发生数率= 比例基数 可能发生某现象的总数比例基数:100%、1000 、10000/万等选取原则:习惯用法、数值大小 例例 1999年某幼儿园有年某幼儿园有36名儿童患了腮腺炎,名儿童患了腮腺炎,该幼儿园共有该幼儿园共有200名儿童(其中名儿童(其中25名儿童以前患名儿童以

4、前患过),求该幼儿园过),求该幼儿园1999年腮腺炎的发病率。年腮腺炎的发病率。 腮腺炎发病率腮腺炎发病率= %57.20%1002520036 某医生研究了慢性阻塞性肺病(COPD)病人的吸烟情况,自19982000年收治COPD病人356人,其中231人有三十年及以上的经常吸烟史(日平均1支以上),在本院其它科室收治的同年龄组段的非COPD病人(无其它呼吸系统疾患)479人,其中有三十年及以上的经常吸烟史的183人,试计算并比较两组病人的吸烟率。 表 慢性阻塞性肺病(COPD)病人的吸烟情况表3-2 COPD病人与非病人的吸烟情况资料 有吸烟史 无吸烟史 合计 吸烟率 COPD病人 231

5、 125 356 64.89% 非病人 183 296 479 38.02% 合 计 414 421 835 49.58% 速率速率 (rate) 速率速率 (rate)是反映单位时间内某事件出现的可是反映单位时间内某事件出现的可能性大小,多用于面向人群的出生、死亡和发病资料能性大小,多用于面向人群的出生、死亡和发病资料的统计的统计.人口出生率人口出生率=(某年中活产总数某年中活产总数/该年平均人口数该年平均人口数) 100% 调查时某病患病人数调查时某病患病人数(1)某病患病率某病患病率100 调查人数调查人数 一定期间内某病新病例数一定期间内某病新病例数(2)某病发病率某病发病率1000同

6、期平均人口数同期平均人口数l 某病死亡人数某病死亡人数(3)某病病死率某病病死率100l 某病患病人数某病患病人数l l 某期间某病死亡人数某期间某病死亡人数(4)某病死亡率某病死亡率1000l同期平均人口数同期平均人口数 l 某病治愈人数某病治愈人数 (5)某病治愈率某病治愈率100l治疗某病人数治疗某病人数 l 错误诊断人数错误诊断人数 (6)误诊率误诊率100l 诊断某病人数诊断某病人数 l 漏诊人数漏诊人数(7)漏诊率漏诊率 100l某病患病人数某病患病人数 l带某病原体带某病原体(阳性结果阳性结果)人数人数(8)感染阳性率感染阳性率100l检查人数检查人数 率的正确使用需要注意以下几

7、点:率的正确使用需要注意以下几点: (1)分子为阳性数,分母为(阳性)分子为阳性数,分母为(阳性+阴性数)。阴性数)。 (2)当计算麻疹这样具有终生免疫力的传染病)当计算麻疹这样具有终生免疫力的传染病发病率时,分母不应该包括已患过麻疹或腮腺炎发病率时,分母不应该包括已患过麻疹或腮腺炎的那部分人。的那部分人。 (3)率只与本身的频率或强度有关,而不受其)率只与本身的频率或强度有关,而不受其它数据的影响。如某地红眼病的流行不会导致该它数据的影响。如某地红眼病的流行不会导致该地肝癌死亡率下降或上升。地肝癌死亡率下降或上升。 l分子和分母都是计数值,从定义上来看,分子应为分母的一部分,但在实际应用中一

8、些率的指标可能并不符合率的定义,但它们是约定俗成、沿习使用的。l根据频率的稳定性,分母较大时,可以用率作为该事件发生机会(即概率)的近似值。例如:医治100例病人,90例痊愈,则:治愈率=90/100=90%。它近似的反映了病人治愈机会的大小。K该时点人口数现患病人总数观察时点内发现的某病某病患病率l0 rate1l率常以百分率(%)、千分率()、万分率(1万)、十万分率(l10万)等表示。 l比例基数(K )可以是100、1000、,其选取是根据习惯用法和需要选用,主要使算得的率至少保留12位整数,便于阅读。 患病率、发病率、感染率 :百分率(%)人口出生率与死亡率:千分率()肿瘤死亡率:十

9、万分率(l10万)(1)构成比(百分比、结构相对数) 表示某现象内部各个构成部分所占的比重。 某一构成部分的数量构成比= 100% 各构成部分数量之和 %100%100%1002%100121212211 个构成比的合计为构成比构成比构成比KAAAAKAAAAAAAAkKkkl同一事物内部的同一事物内部的k个组成部分构成比总和为个组成部分构成比总和为100%。l各部分构成比之间是相互影响的,某一部分比各部分构成比之间是相互影响的,某一部分比重的变化受到两方面因素的影响:其一是这个重的变化受到两方面因素的影响:其一是这个部分自身数值的变化,其二受其他部分数值变部分自身数值的变化,其二受其他部分数

10、值变化的影响。化的影响。表3-1 吸毒与非吸毒人群职业构成对比分析 吸毒组 非吸毒组 职业 人数(n) 构成比(%) 人数(n) 构成比(%) 学生 4 1.29 23 6.44 无业 183 59.03 50 14.01 个体 54 17.42 27 7.56 工人 53 17.10 125 35.01 司机 3 0.97 2 0.56 其它 13 4.19 130 36.42 合计 310 100.00 357 100.00 表 某市工人中冠心病调查资料年龄 检查人数 病人数 病人数百分比(%)患病率(%)30- 850 9 40- 800 2750- 750 54 60- 195 25合

11、计合计 2595 115 7.8 1.1 23.5 3.4 47.0 7.2 21.7 12.8100.0 4.4率率构成比构成比概念概念发生的频率或发生的频率或强度强度各组成部分所占各组成部分所占的比重的比重强调点强调点随机发生事件随机发生事件各部分的构成各部分的构成资料获得资料获得较难较难容易容易特点特点不一定不一定合计为合计为100100l相对比相对比(ratio) ,是,是 A、B两个有关指标之比。两个有关指标之比。 v说明说明A为为B的若干倍或百分之几,它是对比的的若干倍或百分之几,它是对比的最简单形式。最简单形式。A、B两个指标可以是绝对数,两个指标可以是绝对数,也可以是相对数;可

12、以性质相同,也可以性质也可以是相对数;可以性质相同,也可以性质不同;可以是定性资料,也可以是定量资料。不同;可以是定性资料,也可以是定量资料。 BA相对比l受精时性别比受精时性别比(第一性比例第一性比例)一般为一般为110 170,平均,平均120;出生时性别比出生时性别比(第二性比例第二性比例)绝大多数国家为绝大多数国家为103 107,平,平均均106;婚龄期性别比;婚龄期性别比(第三性比例第三性比例)约为约为100; 100女性人口数男性人口数性别比性别比性别比(sex ratio) 又称性比例,是指男性人口与女性人又称性比例,是指男性人口与女性人口的比值。口的比值。 l2.2.两个率之

13、比两个率之比 l某地某年龄组男性吸烟和非吸烟的冠心某地某年龄组男性吸烟和非吸烟的冠心病死亡资料下表所示病死亡资料下表所示, ,试分析其相对危害试分析其相对危害度。度。 12PRP= 分组分组死亡数死亡数 观察人年数观察人年数 死亡率(死亡率(1/101/10万人年)万人年)吸烟组吸烟组 104 43248 240.5104 43248 240.5 非吸烟组非吸烟组 12 10673 112.412 10673 112.4RRRR = 240.5 = 240.5112.4 = 2.139 112.4 = 2.139 说明男性吸烟的冠心病死亡率是不吸说明男性吸烟的冠心病死亡率是不吸烟的死亡率的烟的

14、死亡率的2.1392.139倍。这种指标在流行倍。这种指标在流行病学研究中称为相对危险度病学研究中称为相对危险度(relative (relative riskrisk简写为简写为RR RR ) )。 l3.3.两个相对比之比两个相对比之比 l 临床医生欲探索某病的病因,在以医院病例为基础作病例对临床医生欲探索某病的病因,在以医院病例为基础作病例对照研究时,一般不能计算出照研究时,一般不能计算出RRRR,但可以计算出疾病组暴露比数与,但可以计算出疾病组暴露比数与对照组暴露比数之比,称之为比数比或优势比(对照组暴露比数之比,称之为比数比或优势比(odds ratioodds ratio简写简写为

15、为OROR)l服用反应停与肢体缺陷关系病例对照研究服用反应停与肢体缺陷关系病例对照研究服用反应停畸型儿组对 照 组合计 使 用 未使用 34(a)16 (c) 2(b) 88(d) 36 104 合 计 50 90 140/a cadORb dbc=疾病组的暴露比数对照组的暴露比数本例本例 348893.52 16OR=l计算相对数的分母不宜过小计算相对数的分母不宜过小 例数较少,相对数波动较大。如:0/2,1/2,2/2例数较少时,宜用绝对数表示,必须用相对数时,可同时列出其可信区间。l分析时不能以构成比代替率分析时不能以构成比代替率率反映的是频率或者强度构成比反映的是比重或分布l正确计算合

16、并率正确计算合并率对观察单位数不等的几个率,不能直接相加对观察单位数不等的几个率,不能直接相加求其平均率求其平均率(或称总率或称总率) 例如用某疗法治疗肝炎,第一次治疗例如用某疗法治疗肝炎,第一次治疗150150人,治愈人,治愈3030人,治愈率人,治愈率20%20%;第二次治疗;第二次治疗100100人,治愈人,治愈3030人,人,治愈率治愈率30%30%。试计算两批的合并治愈率。试计算两批的合并治愈率。l计算率时要注意资料的同质性计算率时要注意资料的同质性l对比分析时应注意资料的可比性对比分析时应注意资料的可比性 v所谓可比,就是说除了要对比的因素外(如不同药物),其余的影响因素应尽可能的

17、相同、相似或接近。观察对象同质,研究方法相同,观察时间相等,以及地区、周围环境、风俗习惯和经济条件应一致或相近。观察对象内部构成内部构成是否相同,若两组资料的年龄、性别构成不同,可以分组或进行标准化后再作比较。 l样本率或构成比比较时,不能仅凭表面上的数值大小下结论,应考虑到其抽样抽样误差误差,进一步作统计学处理 。l填补空白;填补空白;l对(对(5 5)()(6 6)()(7 7)栏做简要分析;)栏做简要分析;l比较比较2020岁于岁于4040岁年龄组死亡率由无差别?岁年龄组死亡率由无差别?年龄年龄 人口数人口数 死亡总数死亡总数 恶性肿瘤恶性肿瘤 恶性肿瘤死亡恶性肿瘤死亡 恶性肿瘤死亡恶性

18、肿瘤死亡 年龄别死亡年龄别死亡(1) (2) (3) 死亡总数死亡总数 占总死亡的占总死亡的% 率(率(1/10万)万) 率(率( ) (4) (5) (6) (7) 0- 82920 138 4 2.90 4.82 1.6620- 46638 63 12 19.05 25.73 1.3540- 28161 172 42 24.42 149.14 6.1160- 9371 342 32 9.36 341.48 36.50合计合计 167090 715 90 12.59 53.86 4.28某地各年龄组恶性肿瘤死亡情况某地各年龄组恶性肿瘤死亡情况年龄年龄 人口数人口数 死亡总数死亡总数 恶性肿瘤

19、恶性肿瘤 恶性肿瘤死亡恶性肿瘤死亡 恶性肿瘤死亡恶性肿瘤死亡 年龄别死亡年龄别死亡(1) (2) (3) 死亡总数死亡总数 占总死亡的占总死亡的% 率(率(1/10万)万) 率(率( ) (4) (5) (6) (7) 0- 82920 138 4 2.90 4.82 1.6620- 46638 63 12 19.05 25.73 1.3540- 28161 172 42 24.42 149.14 6.1160- 9371 342 32 9.36 341.48 36.50合计合计 167090 715 90 12.59 53.86 4.28某地各年龄组恶性肿瘤死亡情况某地各年龄组恶性肿瘤死亡情

20、况目的:目的: 用用统一的标准统一的标准(如年龄别人口(如年龄别人口数、年龄别人口构成比、年龄别人死数、年龄别人口构成比、年龄别人死亡率),消除亡率),消除内部构成不同内部构成不同对平均率对平均率所产生的影响,使两组平均率具有所产生的影响,使两组平均率具有可可比性比性。 1. 直接法:各小组率已知,各小组观直接法:各小组率已知,各小组观察数或构成作为标准察数或构成作为标准 2. 间接法:各小组观察数或构成,以间接法:各小组观察数或构成,以及平均率已知,以各小组率作为标及平均率已知,以各小组率作为标准准 1 选一个具有代表性的、内部构成相选一个具有代表性的、内部构成相对稳定的较大人群作为标准对稳

21、定的较大人群作为标准 2. 将要比较的两组资料内部各相应小将要比较的两组资料内部各相应小组的观察单位数相加作为标准组的观察单位数相加作为标准 3. 从要比较的两组中任选一组作为标从要比较的两组中任选一组作为标准。准。表表 3 3- - 5 5 按 式按 式 ( (3 3- - 8)8)直 接 法直 接 法 计 算 甲 乙 两 院 的 标 准 化 率计 算 甲 乙 两 院 的 标 准 化 率 (%)(%) 科 室科 室 标 准 组标 准 组 甲 院甲 院 乙 院乙 院 出 院 人 数出 院 人 数 原 治 愈 率原 治 愈 率 ( %)( %) 预 期 治 愈 数预 期 治 愈 数 原 治 愈

22、率原 治 愈 率 (% ) (% ) 预 期 治 愈 数预 期 治 愈 数 Ni pi Nipi pi Nipi = = = = 内 科内 科 9 05 30 .71 9 05 30 .71 277 .9 277 .9 6 6 3 1.65 2 86.4 3 1.65 2 86.4 4 4 妇 科妇 科 9 42 87 .28 822 .18 8 4.77 7 98.5 9 42 87 .28 822 .18 8 4.77 7 98.5 7 7 小 儿 科小 儿 科 4 91 91 .63 449 .9 4 91 91 .63 449 .9 1 1 9 0.48 4 44.2 9 0.48 4

23、 44.2 4 4 外 科外 科 9 03 96 .58 872 .1 9 03 96 .58 872 .1 7 7 9 5.56 8 62.9 9 5.56 8 62.9 0 0 合 计合 计 3 241 64 .65 2 422 .3 241 64 .65 2 422 . 2 22 2 8 3.19 2 392.1 8 3.19 2 392.1 5 5 甲 院 标 准 化 治 愈 率 p(%)=2422.22/3241=74.74% 乙 院 标 准 化 治 愈 率 p(%)=2392.15/3241=73.81% 表表 3 3 6 6 按 式按 式 ( ( 3 3 - - 9 )9 ) 直

24、 接 法 计 算 甲 乙 两 院 的 标 准 化 率直 接 法 计 算 甲 乙 两 院 的 标 准 化 率 ( % )( % ) 科 室科 室 标 准 组 出 院标 准 组 出 院 甲 院甲 院 乙 院乙 院 病 人 构 成 比病 人 构 成 比 原 治 愈 率原 治 愈 率 ( % ) ( % ) 分 配 治 愈 率分 配 治 愈 率 ( % )( % ) 原 治 愈 率原 治 愈 率 ( % ) ( % ) 分 配 治 愈 率分 配 治 愈 率 ( % )( % ) Ni/ N pi ( Ni/ N ) pi pi ( Ni/ N ) pi = = = = 内 科内 科 0 . 2 7 9

25、 2 3 0 . 7 1 8 . 5 7 4 2 3 1 . 6 5 8 . 8 3 6 7 0 . 2 7 9 2 3 0 . 7 1 8 . 5 7 4 2 3 1 . 6 5 8 . 8 3 6 7 妇 科妇 科 0 . 2 9 0 7 8 7 . 2 8 2 5 . 3 7 2 3 8 4 . 7 7 2 4 . 6 4 2 6 0 . 2 9 0 7 8 7 . 2 8 2 5 . 3 7 2 3 8 4 . 7 7 2 4 . 6 4 2 6 小 儿 科小 儿 科 0 . 1 5 1 5 9 1 . 6 3 1 3 . 8 8 1 9 9 0 . 4 8 1 3 . 7 0 7 7

26、 0 . 1 5 1 5 9 1 . 6 3 1 3 . 8 8 1 9 9 0 . 4 8 1 3 . 7 0 7 7 外 科外 科 0 . 2 7 8 6 9 6 . 5 8 2 6 . 9 0 7 2 9 5 . 5 6 2 6 . 6 2 3 0 0 . 2 7 8 6 9 6 . 5 8 2 6 . 9 0 7 2 9 5 . 5 6 2 6 . 6 2 3 0 合 计合 计 1 . 0 0 0 0 6 4 . 6 5 7 4 . 7 3 1 1 8 3 . 1 9 7 3 . 8 1 0 0 1 . 0 0 0 0 6 4 . 6 5 7 4 . 7 3 1 1 8 3 . 1 9

27、 7 3 . 8 1 0 0 l标准化率的应用价值标准化率的应用价值仅限于相互比较,不反映具体的实际水平。 要反映实际情况,则需用未标化前的率。 l标准化率的适用范围标准化率的适用范围仅适用于某因素两组内部构成不同,并有可能影响两组总率的比较,对于因其他条件不同而产生的不可比性问题,标准化率不能解决。l标准化率也有抽样误差标准化率也有抽样误差两样本标准化率作比较时,当样本含量较小时,还应作假设检验表表 两矿工人尘肺患病比较两矿工人尘肺患病比较工龄工龄(年)(年)甲甲矿矿乙乙矿矿检查检查 人数人数尘肺尘肺 人数人数患病率患病率(%)检查检查 人数人数尘肺尘肺 人数人数患病率患病率(%)61402

28、61200.86 99220.20610 428525421683163.9212.431905101481170.4211.54合计合计208566042.9039111273.25l动态数列(动态数列(dynamic seriesdynamic series):一系列):一系列按时间顺序排列起来的统计指标,用以按时间顺序排列起来的统计指标,用以观察和比较该事物在时间上的变化和发观察和比较该事物在时间上的变化和发展趋势。展趋势。常用指标:常用指标:增长量增长量:分为累积增长量、逐年增长量:分为累积增长量、逐年增长量:统一用某个时间的指标作基数以:统一用某个时间的指标作基数以各时间的指标分别与之对比。各时间的指标分别与之对比。:依次用前一个时间的指标作基数,:依次用前一个时间的指标作基数,以相邻的后一个时间的指标与

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论