分类变量描述性统计_第1页
分类变量描述性统计_第2页
分类变量描述性统计_第3页
分类变量描述性统计_第4页
分类变量描述性统计_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、关于分类变量的描述性统计第1页,共54页,2022年,5月20日,11点26分,星期四分类变量的整理(1)婚姻状况频数单身 3已婚 5离异 2分居 4合计14 14名成人的婚姻状况编号性别身高婚姻状况1男175单身2女167单身3男187单身4女176已婚5男167已婚6女178已婚7男174已婚8女170已婚9男167离异10女186离异11男182分居12女159分居13男167分居14女182分居14名成人的原始数据第2页,共54页,2022年,5月20日,11点26分,星期四分类变量的整理(2)婚姻状况性别男女单身21已婚23离异11分居22不同性别的婚姻状况编号性别身高婚姻状况1男1

2、75单身2女167单身3男187单身4女176已婚5男167已婚6女178已婚7男174已婚8女170已婚9男167离异10女186离异11男182分居12女159分居13男167分居14女182分居14名成人的原始数据第3页,共54页,2022年,5月20日,11点26分,星期四一 常用的比例指标绝对数: 资料整理后各组的例数相对数: 两个绝对数之比中得到的一种数值第4页,共54页,2022年,5月20日,11点26分,星期四例:调查得某年小学生中流脑发病:甲地区63例,乙地区35例。 甲地区流脑流行比乙地区严重 如已知小学生总人数:甲地区50051人,乙地区14338人,可算出两个发病率:

3、 甲地区流脑发病率:63/500511000=1.26 乙地区流脑发病率:35/14338 1000=2.44 乙地区流脑流行比甲地区严重第5页,共54页,2022年,5月20日,11点26分,星期四1. 率:速率(rate):与时间有关,如某年某病发病率、死亡率。比率(proportion):与时间无关,如某病治愈率。2. 比:构成比(constituent ratio):部分与全部之比相对比(relative ratio):两指标之比常用的比例指标及其意义第6页,共54页,2022年,5月20日,11点26分,星期四1.率又称强度相对数或频率反映某现象出现的频率或强度。 某现象的发生数率=

4、 比例基数 可能发生某现象的总数比例基数:100%、1000 、10000/万等选取原则:习惯用法、数值大小第7页,共54页,2022年,5月20日,11点26分,星期四 例 1999年某幼儿园有36名儿童患了腮腺炎,该幼儿园共有200名儿童(其中25名儿童以前患过),求该幼儿园1999年腮腺炎的发病率。 腮腺炎发病率= 第8页,共54页,2022年,5月20日,11点26分,星期四 某医生研究了慢性阻塞性肺病(COPD)病人的吸烟情况,自19982000年收治COPD病人356人,其中231人有三十年及以上的经常吸烟史(日平均1支以上),在本院其它科室收治的同年龄组段的非COPD病人(无其它

5、呼吸系统疾患)479人,其中有三十年及以上的经常吸烟史的183人,试计算并比较两组病人的吸烟率。 表 慢性阻塞性肺病(COPD)病人的吸烟情况第9页,共54页,2022年,5月20日,11点26分,星期四速率 (rate) 速率 (rate)是反映单位时间内某事件出现的可能性大小,多用于面向人群的出生、死亡和发病资料的统计.人口出生率=(某年中活产总数/该年平均人口数) 100% 第10页,共54页,2022年,5月20日,11点26分,星期四常见的几种率 调查时某病患病人数(1)某病患病率100 调查人数 一定期间内某病新病例数(2)某病发病率1000同期平均人口数第11页,共54页,202

6、2年,5月20日,11点26分,星期四 某病死亡人数(3)某病病死率100 某病患病人数 某期间某病死亡人数(4)某病死亡率1000同期平均人口数 第12页,共54页,2022年,5月20日,11点26分,星期四 某病治愈人数 (5)某病治愈率100治疗某病人数 错误诊断人数 (6)误诊率100 诊断某病人数 第13页,共54页,2022年,5月20日,11点26分,星期四 漏诊人数(7)漏诊率 100某病患病人数 带某病原体(阳性结果)人数(8)感染阳性率100检查人数 第14页,共54页,2022年,5月20日,11点26分,星期四 率的正确使用需要注意以下几点: (1)分子为阳性数,分母

7、为(阳性+阴性数)。 (2)当计算麻疹这样具有终生免疫力的传染病发病率时,分母不应该包括已患过麻疹或腮腺炎的那部分人。 (3)率只与本身的频率或强度有关,而不受其它数据的影响。如某地红眼病的流行不会导致该地肝癌死亡率下降或上升。 第15页,共54页,2022年,5月20日,11点26分,星期四关于率的几点说明(一)分子和分母都是计数值,从定义上来看,分子应为分母的一部分,但在实际应用中一些率的指标可能并不符合率的定义,但它们是约定俗成、沿习使用的。根据频率的稳定性,分母较大时,可以用率作为该事件发生机会(即概率)的近似值。例如:医治100例病人,90例痊愈,则:治愈率=90/100=90%。它

8、近似的反映了病人治愈机会的大小。第16页,共54页,2022年,5月20日,11点26分,星期四关于率的几点说明(二)0 rate1率常以百分率(%)、千分率()、万分率(1万)、十万分率(l10万)等表示。 比例基数(K )可以是100、1000、,其选取是根据习惯用法和需要选用,主要使算得的率至少保留12位整数,便于阅读。 患病率、发病率、感染率 :百分率(%)人口出生率与死亡率:千分率()肿瘤死亡率:十万分率(l10万)第17页,共54页,2022年,5月20日,11点26分,星期四2.比(1)构成比(百分比、结构相对数) 表示某现象内部各个构成部分所占的比重。 某一构成部分的数量构成比

9、= 100% 各构成部分数量之和 第18页,共54页,2022年,5月20日,11点26分,星期四设某事物个体数的合计由A1,A2,Ak个部分组成,构成比计算为:第19页,共54页,2022年,5月20日,11点26分,星期四构成比的特点:同一事物内部的k个组成部分构成比总和为100%。各部分构成比之间是相互影响的,某一部分比重的变化受到两方面因素的影响:其一是这个部分自身数值的变化,其二受其他部分数值变化的影响。第20页,共54页,2022年,5月20日,11点26分,星期四第21页,共54页,2022年,5月20日,11点26分,星期四第22页,共54页,2022年,5月20日,11点26

10、分,星期四例 资料见表 ,计算患病率及病人数百分比。 表 某市工人中冠心病调查资料年龄 检查人数 病人数 病人数百分比(%)患病率(%)30- 850 9 40- 800 2750- 750 54 60- 195 25合计 2595 115 7.8 1.1 23.5 3.4 47.0 7.2 21.7 12.8100.0 4.4第23页,共54页,2022年,5月20日,11点26分,星期四率与构成比率构成比概念发生的频率或强度各组成部分所占的比重强调点随机发生事件各部分的构成资料获得较难容易特点不一定合计为100第24页,共54页,2022年,5月20日,11点26分,星期四(2)相对比相对

11、比(ratio) ,是 A、B两个有关指标之比。 说明A为B的若干倍或百分之几,它是对比的最简单形式。A、B两个指标可以是绝对数,也可以是相对数;可以性质相同,也可以性质不同;可以是定性资料,也可以是定量资料。 第25页,共54页,2022年,5月20日,11点26分,星期四人口统计中常用的比的指标受精时性别比(第一性比例)一般为110170,平均120;出生时性别比(第二性比例)绝大多数国家为103107,平均106;婚龄期性别比(第三性比例)约为100; 性别比(sex ratio) 又称性比例,是指男性人口与女性人口的比值。 第26页,共54页,2022年,5月20日,11点26分,星期

12、四相对比的种类2.两个率之比 某地某年龄组男性吸烟和非吸烟的冠心病死亡资料下表所示,试分析其相对危害度。 分组死亡数 观察人年数 死亡率(1/10万人年)吸烟组 104 43248 240.5 非吸烟组 12 10673 112.4第27页,共54页,2022年,5月20日,11点26分,星期四RR = 240.5112.4 = 2.139 说明男性吸烟的冠心病死亡率是不吸烟的死亡率的2.139倍。这种指标在流行病学研究中称为相对危险度(relative risk简写为RR )。 第28页,共54页,2022年,5月20日,11点26分,星期四相对比的种类3.两个相对比之比 临床医生欲探索某病

13、的病因,在以医院病例为基础作病例对照研究时,一般不能计算出RR,但可以计算出疾病组暴露比数与对照组暴露比数之比,称之为比数比或优势比(odds ratio简写为OR)服用反应停与肢体缺陷关系病例对照研究服用反应停畸型儿组对 照 组合计 使 用 未使用 34(a)16 (c) 2(b) 88(d) 36 104 合 计 50 90 140第29页,共54页,2022年,5月20日,11点26分,星期四本例 第30页,共54页,2022年,5月20日,11点26分,星期四正确应用相对数(一) 计算相对数的分母不宜过小 例数较少,相对数波动较大。如:0/2,1/2,2/2例数较少时,宜用绝对数表示,

14、必须用相对数时,可同时列出其可信区间。二 相对数使用应注意的问题第31页,共54页,2022年,5月20日,11点26分,星期四分析时不能以构成比代替率率反映的是频率或者强度构成比反映的是比重或分布正确应用相对数(二) 第32页,共54页,2022年,5月20日,11点26分,星期四正确应用相对数(三)正确计算合并率对观察单位数不等的几个率,不能直接相加求其平均率(或称总率) 例如用某疗法治疗肝炎,第一次治疗150人,治愈30人,治愈率20%;第二次治疗100人,治愈30人,治愈率30%。试计算两批的合并治愈率。第33页,共54页,2022年,5月20日,11点26分,星期四正确应用相对数(四

15、)计算率时要注意资料的同质性对比分析时应注意资料的可比性 所谓可比,就是说除了要对比的因素外(如不同药物),其余的影响因素应尽可能的相同、相似或接近。观察对象同质,研究方法相同,观察时间相等,以及地区、周围环境、风俗习惯和经济条件应一致或相近。观察对象内部构成是否相同,若两组资料的年龄、性别构成不同,可以分组或进行标准化后再作比较。 第34页,共54页,2022年,5月20日,11点26分,星期四正确应用相对数(五)样本率或构成比比较时,不能仅凭表面上的数值大小下结论,应考虑到其抽样误差,进一步作统计学处理 。第35页,共54页,2022年,5月20日,11点26分,星期四例题:下表为一抽样研

16、究资料,作如下分析:填补空白;对(5)(6)(7)栏做简要分析;比较20岁于40岁年龄组死亡率由无差别?第36页,共54页,2022年,5月20日,11点26分,星期四年龄 人口数 死亡总数 恶性肿瘤 恶性肿瘤死亡 恶性肿瘤死亡 年龄别死亡 (2) (3) 死亡总数 占总死亡的% 率(1/10万) 率( ) (4) (5) (6) (7) 0- 82920 138 4 2.90 4.82 1.6620- 46638 63 12 19.05 25.73 1.3540- 28161 172 42 24.42 149.14 6.1160- 9371 342 32 9.36 341.48 36.50合

17、计 167090 715 90 12.59 53.86 4.28某地各年龄组恶性肿瘤死亡情况第37页,共54页,2022年,5月20日,11点26分,星期四年龄 人口数 死亡总数 恶性肿瘤 恶性肿瘤死亡 恶性肿瘤死亡 年龄别死亡 (2) (3) 死亡总数 占总死亡的% 率(1/10万) 率( ) (4) (5) (6) (7) 0- 82920 138 4 2.90 4.82 1.6620- 46638 63 12 19.05 25.73 1.3540- 28161 172 42 24.42 149.14 6.1160- 9371 342 32 9.36 341.48 36.50合计 1670

18、90 715 90 12.59 53.86 4.28某地各年龄组恶性肿瘤死亡情况第38页,共54页,2022年,5月20日,11点26分,星期四三 率的标准化法目的: 用统一的标准(如年龄别人口数、年龄别人口构成比、年龄别人死亡率),消除内部构成不同对平均率所产生的影响,使两组平均率具有可比性。第39页,共54页,2022年,5月20日,11点26分,星期四第40页,共54页,2022年,5月20日,11点26分,星期四一)、方法的选择 1. 直接法:各小组率已知,各小组观察数或构成作为标准 2. 间接法:各小组观察数或构成,以及平均率已知,以各小组率作为标准第41页,共54页,2022年,5

19、月20日,11点26分,星期四二)、标准的选取 1 选一个具有代表性的、内部构成相对稳定的较大人群作为标准 2. 将要比较的两组资料内部各相应小组的观察单位数相加作为标准 3. 从要比较的两组中任选一组作为标准。第42页,共54页,2022年,5月20日,11点26分,星期四直接法(各小组出院人数合计为标准) 第43页,共54页,2022年,5月20日,11点26分,星期四直接法(各小组出院人数构成为标准) 第44页,共54页,2022年,5月20日,11点26分,星期四应用标准化时的注意事项标准化率的应用价值仅限于相互比较,不反映具体的实际水平。 要反映实际情况,则需用未标化前的率。 第45页,共54页,2022年,5月20日,11点26分,星期四应用标准化时的注意事项标准化率的适用范围仅适用于某因素两组内部构成不同,并有可能影响两组总率的比较,对于因其他条件不同而产生的不可比性问题,标准化率不能解决。第46页,共54页,2022年,5月20日,11点26分,星期四应用标准化时的注意事项标准化率也有抽样误差两样本标准化率作比较时,当样本含量较小时,还应作假设检验第47页,共54页,2022年,5月20日,11点26分,星期四表 两矿工人尘肺患病比较工龄(年)甲矿乙矿检查 人数尘肺 人数患病率(%)检查 人数尘肺 人数患病率(%)614026

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论