第5章定性资料的统计描述_第1页
第5章定性资料的统计描述_第2页
第5章定性资料的统计描述_第3页
第5章定性资料的统计描述_第4页
第5章定性资料的统计描述_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、李晓松主编李晓松主编. . 医学统计学医学统计学( (第第3 3版版). ). 北京北京: : 高等教育出版社高等教育出版社, , 2014.2014.第五章第五章陈卫中陈卫中 副教授副教授公共卫生系流行病与卫生统计学教研室公共卫生系流行病与卫生统计学教研室20142014年年9 9月月1010日星期三日星期三l描述定性变量在群体中的分布特征描述定性变量在群体中的分布特征-统计指标统计指标-统计表统计表-统计图统计图定性资料的统计描述定性资料的统计描述李晓松主编李晓松主编. . 医学统计学医学统计学( (第第3 3版版). ). 北京北京: : 高等教育出版社高等教育出版社, , 2014.2

2、014.李晓松主编李晓松主编. . 医学统计学医学统计学( (第第2 2版版). ). 北京北京: : 高等教育出版社高等教育出版社, 2008., 2008.第一第一节节ID县别不住院原因ID县别不住院原因1甲县经济困难1乙县没有必要2甲县经济困难2乙县经济困难3甲县经济困难3乙县经济困难4甲县没有必要4乙县经济困难5甲县经济困难5乙县没有时间6甲县经济困难6乙县经济困难7甲县经济困难7乙县经济困难8甲县没有时间8乙县经济困难9甲县没有时间9乙县没有时间10甲县其 它10乙县经济困难333甲县经济困难306乙县其 它表5.1 2012年甲、乙两县应住院者未住院原因抽样调查结果l以变量的类别作

3、为分组标志,统计相应频数,以变量的类别作为分组标志,统计相应频数,形成的统计表形成的统计表定性资料频数表定性资料频数表原因经济困难没有时间没有必要其它合计频数293171013333表表5.2甲县应住院者未住院原因情况甲县应住院者未住院原因情况原因经济困难没有时间没有必要其它合计频数282996306表表5.3乙县应住院者未住院原因情况乙县应住院者未住院原因情况县别应住院未住院原因经济困难没有时间没有必要其它合计甲乙合计l将观察对象按两个特征的类别交叉分组,统将观察对象按两个特征的类别交叉分组,统计相应的频数形成的频数表计相应的频数形成的频数表列联表列联表(cross tabulation)表

4、表5.4甲、乙两县应住院者未住院原因情况甲、乙两县应住院者未住院原因情况293171013333282996306575261919639县别县别经济困难经济困难没有必要没有必要没有时间没有时间其它其它合计合计甲甲293101713333乙乙282996306合计合计575192619639l也叫绝对数也叫绝对数(Absolute number),与所来自基,与所来自基数有关数有关-不便于相互比较分析不便于相互比较分析-抽样研究中难以表达总体的特征抽样研究中难以表达总体的特征频数频数表表5.4甲、乙两县应住院者未住院原因情况甲、乙两县应住院者未住院原因情况县别县别经济困难经济困难没有必要没有必

5、要没有时间没有时间其它其它合计合计甲甲293101713333乙乙282996306合计合计575192619639县别县别经济困难经济困难没有必要没有必要没有时间没有时间其它其它合计合计甲甲293(87.99)10(5.11)17(3.00)13(3.90)333(100.00)乙乙282(92.16)9(2.94)9(2.94)6(1.96)306(100.00)合计合计575(89.98) 19(2.97)26(4.07)19(2.97)639(100.00)相对数相对数(Relative Number)表表5.5甲、乙两县应住院者未住院原因构成比甲、乙两县应住院者未住院原因构成比(%)

6、(87.99)293100%87.99%333l概念:两个有关的数据或指标之比概念:两个有关的数据或指标之比l意义:消除频数所来自基数不同的影响意义:消除频数所来自基数不同的影响-便于资料比较、分析便于资料比较、分析-更能表达总体的特征更能表达总体的特征相对数相对数(Relative Number)=AB指标相对数指标l构成比构成比(Proportion)l率率 -频率频率(Frequency rate)-速率速率(Rate)l比比(Ratio)相对数相对数(Relative Number)-说明某一事物各组成部分所占整体的比重说明某一事物各组成部分所占整体的比重,各部分构成比结合在一起说明该

7、事物的内部各部分构成比结合在一起说明该事物的内部构成构成情况情况-常用百分数表示常用百分数表示-取值在取值在0%,100%-各部分构成比总和为各部分构成比总和为1或或100%,此消彼长,此消彼长构成比构成比(Proportion)100%该该部部分分的的观观察察单单位位数数某某部部分分构构成成比比各各组组成成部部分分的的观观察察单单位位总总数数县别县别经济困难经济困难没有必要没有必要没有时间没有时间其它其它合计合计甲甲293(87.99)10(5.11)17(3.00)13(3.90)333(100.00)乙乙282(92.16)9(2.94)9(2.94)6(1.96)306(100.00)

8、合计合计575(89.98) 19(2.97)26(4.07)19(2.97)639(100.00)构成比构成比(Proportion)表表5.5甲、乙两县应住院者未住院原因构成比甲、乙两县应住院者未住院原因构成比(%)饼图饼图(Pie graph)图图5.1 甲县应住院者未住院原因构成比甲县应住院者未住院原因构成比(%)88%3%5%4%经济困难没有必要没有时间其它92%3%3%2%经济困难没有必要没有时间其它图图5.2 乙县应住院者未住院原因构成比乙县应住院者未住院原因构成比(%)百分比条图百分比条图(Percent bar graph)图图5.3 甲、乙两县应住院者未住院原因构成情况甲、

9、乙两县应住院者未住院原因构成情况0%20%40%60%80%100%甲县乙县经济困难没有必要没有时间其它百分比条图百分比条图(Percent bar graph)图图5.4 甲、乙两县应住院者未住院原因构成情况甲、乙两县应住院者未住院原因构成情况80%85%90%95%100%甲县乙县经济困难没有必要没有时间其它l构成比构成比(Proportion)l率率 -频率频率(Frequency rate)-速率速率(Rate)l比比(Ratio)相对数相对数(Relative Number)l说明某事件在某时期或时点上的发生频度说明某事件在某时期或时点上的发生频度-k为比例基数,为比例基数, 100

10、%、 1000、10000/万万l依据习惯依据习惯l使计算结果保留使计算结果保留1到到2位整数,以便于阅读位整数,以便于阅读-样本率常用样本率常用p表示,总体发生概率用表示,总体发生概率用 表示表示-某某时期发生频率必须明确时间长度,否则没有时期发生频率必须明确时间长度,否则没有意义意义频率频率(Frequency rate)k某某时时点点( (或或某某时时期期) )发发生生某某事事件件的的观观察察单单位位数数发发生生频频率率该该时时点点( (期期初初) )观观察察单单位位总总数数年份检查人数检查结果阳性阴性2007356213352008534434912009378663122010622

11、91531感染率(%)5.90 8.05 17.46 14.63l20072010年某地区男男性接触者四次横断年某地区男男性接触者四次横断面调查面调查HIV感染情况感染情况频率频率(Frequency rate)表表5.6 20072010年某地区年某地区MSM的的HIV感染情况感染情况图图5.5 20072010年某地区年某地区MSM的的HIV感染情况感染情况024681012141618202007200820092010感染率(%)条图条图(Bar graph)图图5.6 20072010年某地区年某地区MSM的的HIV感染情况感染情况02468101214161820200720082

12、0092010感染率(%)线图线图(Line graph)l构成比构成比(Proportion)l率率 -频率频率(Frequency rate)-速率速率(Rate)l比比(Ratio)相对数相对数(Relative Number)l某时期单位某时期单位时间内某事件发生的频率或强度,时间内某事件发生的频率或强度,反映变量随时间变化的速率反映变量随时间变化的速率速率速率(rate)(person time)+2kkkk发发生生对对象象数数发发生生速速率率某某时时期期发发生生对对象象数数观观察察总总人人时时数数某某时时期期发发生生对对象象数数该该时时期期平平均均观观察察对对象象数数该该时时期期时

13、时间间某某时时期期发发生生对对象象数数( (期期初初观观察察对对象象数数 期期末末观观察察对对象象数数) )某某时时期期观观该该察察对对象象总总数数观观察察时时时时期期时时间间间间研究终止时间研究开始时间随访研究相关概念随访研究相关概念研究期限研究起点(zero time)死亡死亡事件事件(death event)代表规定的终点事件代表规定的终点事件随访截止,7月生存时间生存时间(survival time) 研究起点到随访截止之间的时间研究起点到随访截止之间的时间意外死亡,意外死亡,10月月失访,失访,8月月仍然存活,仍然存活,12月月11月10月2月4=100%7=57.1%年累计频率4=

14、711 10210812 12=0.8/年死亡速率年4=711 10210812=0.15/月死亡速率月l特点特点-有量纲有量纲 (单位单位):1/时间时间-根据时间单位不同,可以根据时间单位不同,可以是任意值,不一定在是任意值,不一定在0,1速率速率(rate)l频率频率(Frequency rate)-发生比例,即发生某事件的对象所占的比重发生比例,即发生某事件的对象所占的比重-说明某事件在群体中的发生频度说明某事件在群体中的发生频度l速率速率(rate)-是单位时间内事件的发生频率是单位时间内事件的发生频率-说明事件在群体中某时期内的发生说明事件在群体中某时期内的发生强度强度常见率的实质

15、常见率的实质l构成比构成比(Proportion)l率率 -频率频率(Frequency rate)-速率速率(Rate)l比比(Ratio)相对数相对数(Relative Number)l构成比构成比(Proportion)l率率 -频率频率(Frequency rate)-速率速率(Rate)l比比(Ratio)相对数相对数(Relative Number)l亦称相对比,是亦称相对比,是A、B两有关指标之比两有关指标之比-根据根据A、B两指标性质是否相同两指标性质是否相同l关系指标:两个性质不同而又有联系指标的比关系指标:两个性质不同而又有联系指标的比l对比指标:两个同类指标不同条件下的比

16、对比指标:两个同类指标不同条件下的比比值比值=1,说明比较的两指标相等,说明比较的两指标相等比值比值 1,说明比较的两指标不等,说明比较的两指标不等比比(Ratio)AB指指标标相相对对比比指指标标关系指标关系指标l由两个性质不同而又有联系的指标对比计算由两个性质不同而又有联系的指标对比计算所得的相对数所得的相对数-说明现象的强度、密度或普遍程度等说明现象的强度、密度或普遍程度等-一般都具有单位,多为两指标的复合计量单位一般都具有单位,多为两指标的复合计量单位l千人口医师、护士、床位千人口医师、护士、床位数数对比指标对比指标l同类指标在不同条件下的差异程度或相对状同类指标在不同条件下的差异程度

17、或相对状态态-说明说明A指标是指标是B指标的指标的多少倍或几分之多少倍或几分之几几l比值比值=1,说明比较的两指标相等,说明比较的两指标相等l比值比值 1,说明比较的两,说明比较的两指标指标不不等等-指标的表现形式指标的表现形式l绝对数绝对数l平均数平均数l相对数相对数绝对数之比绝对数之比l ()100男男性性人人数数性性别别比比 性性比比例例 = =女女性性人人数数年龄年龄性别比性别比出生时出生时10720岁岁10050岁岁9860岁岁9570岁岁8580岁岁662010年第六次人口普查年第六次人口普查(2010年年11月月1日日零时标准时零时标准时点点):出生性别比105.20总 人 口

18、性 别 比118.06平均预期寿命(岁)74.83 男性72.38 女性77.37平均数之比平均数之比l例例5.4 为了解新生儿的锌的营养状况,分别为了解新生儿的锌的营养状况,分别测量某医院足月儿、早产儿的脐血血清锌含测量某医院足月儿、早产儿的脐血血清锌含量,结果显示足月儿及早产儿的脐血血清锌量,结果显示足月儿及早产儿的脐血血清锌含量的均数分别为含量的均数分别为1.85mg/L和和1.41mg/L-则该医院足月儿与早产儿的脐血血清锌含量之则该医院足月儿与早产儿的脐血血清锌含量之比为比为1.85/1.41=1.31,即该医院足月儿脐血血清,即该医院足月儿脐血血清锌含量是早产儿的锌含量是早产儿的1

19、.31倍倍吸烟情况吸烟情况病例组病例组对照组对照组合计合计有有688 (a)650 (b)1338无无21 (c)59 (d)80合计合计709 (m1)709 (m0)1418吸烟情况吸烟情况病例组病例组对照组对照组合计合计有有688 (a)650 (b)1338无无21 (c)59 (d)80合计合计709 (m1)709 (m0)1418吸烟优势吸烟优势相对数之比相对数之比ORl比值比值(Odds):是指事件发生的概率与不发生:是指事件发生的概率与不发生的概率之的概率之比比肺癌病例对照研究吸烟史比较肺癌病例对照研究吸烟史比较688 70921 709650 70959 709688216

20、5059相对数之比相对数之比ORl比值比比值比(odds ratio/OR):不同群体比值的比:不同群体比值的比-病例对照研究中,病例组相对于对照组暴露于病例对照研究中,病例组相对于对照组暴露于某危险因素的优势比,也叫暴露优势比某危险因素的优势比,也叫暴露优势比吸烟情况吸烟情况病例组病例组对照组对照组合计合计有有688 (a)650 (b)1338无无21 (c)59 (d)80合计合计709 (m1)709 (m0)1418Odds688/21650/59OR肺癌病例对照研究吸烟史比较肺癌病例对照研究吸烟史比较688 21650 59.688592 9765021观察总人数观察总人数肺癌肺癌

21、肺癌发生率肺癌发生率一线作业一线作业6805735.3非一线作业非一线作业3201312.5合计合计10006600.0相对数之相对数之比比RRl相对危险度相对危险度(relative risk, RR) 是指暴露于某是指暴露于某种危险因素的观察对象发病率与非暴露种危险因素的观察对象发病率与非暴露(或或低暴露低暴露)的观察对象发病率之间的比值的观察对象发病率之间的比值RR2.35某锡矿不同生产线某锡矿不同生产线工人随访工人随访10年肺癌年肺癌发生率发生率(1/10万万)l描述定性变量在群体中的分布特征描述定性变量在群体中的分布特征-1张表、张表、2种数、种数、3个相对数指标、个相对数指标、4种

22、图种图总结:定性资料的统计描述总结:定性资料的统计描述频数表:资料的初步整理频数表:资料的初步整理 一维表格一维表格 二维表格:列联表二维表格:列联表 绝对数:受到所来自基数的影响绝对数:受到所来自基数的影响 相对数:有关数据的比值相对数:有关数据的比值 构成比构成比(Proportion) 率率(Frequency Rate) 比比(Ratio) 饼图饼图(Pie graph) 百分比条图百分比条图(Percent bar graph) 条图条图(Bar graph) 线图线图(Line graph)统计表统计表统计指标统计指标统计图统计图李晓松主编李晓松主编. . 医学统计学医学统计学(

23、(第第3 3版版). ). 北京北京: : 高等教育出版社高等教育出版社, , 2014.2014.第二第二节节l率或构成比的计算中,分母数据不宜过小率或构成比的计算中,分母数据不宜过小l注意分子分母含义的界定注意分子分母含义的界定l事物事物发生频度或强度的分析中,不能以构成比代发生频度或强度的分析中,不能以构成比代率率l几几个率不能相加求平均率后作为合计率个率不能相加求平均率后作为合计率l已知样本率或构成比的总体已知样本率或构成比的总体比较比较-假设检验假设检验-相对数进行比较时应注意可比相对数进行比较时应注意可比性性应用相对数应注意的问题应用相对数应注意的问题l某医生用自制的中药汤剂治疗了

24、某医生用自制的中药汤剂治疗了10例例AIDS患者,其中患者,其中7例有效,即报告例有效,即报告“该中药汤剂该中药汤剂的有效率为的有效率为70%”-代表性差代表性差-指标不稳定,不能用以估计概率指标不稳定,不能用以估计概率-样本例数较少时,报告成样本例数较少时,报告成分数及可信区间分数及可信区间l本本例:例:7/10,95%CI(35%, 97%)频率和概率频率和概率l死亡率和病死率死亡率和病死率l发病率和患病率发病率和患病率常见的指标的误读常见的指标的误读=k某某内内某某病病病病例例数数发发病病率率同同期期平平均均人人期期发发口口数数时时新新k某某时时期期某某病病死死亡亡同同期期平平均均人人人

25、人数数某某亡亡率率口口数数病病死死k某某时时期期某某病病死死亡亡同同期期患患该该病病的的人人数数某某死死率率人人数数病病病病k某某时时点点某某病病病病例例数数时时点点患患病病率率该该时时点点人人口口数数( (被被调调查查人人数数) )现现患患k某某时时期期某某病病病病例例数数同同期期的的平平均均人人口口数数 被被观观察察现现期期病病患患率率人人数数间间患患l“208例肺不张的病因与临床分析例肺不张的病因与临床分析”研究中,研究中,男性男性152例,占例,占73%,女性,女性56例,占例,占27%,因此认为因此认为“男性肺不张的发病率高于女性男性肺不张的发病率高于女性”。-指标与结论不一致指标与

26、结论不一致构成比和率构成比和率l某班有男生某班有男生50人,女生人,女生20人,男生英语四级人,男生英语四级通过率为通过率为80%,女生四级通过率为,女生四级通过率为100%,请问该班四级通过率为多少?请问该班四级通过率为多少?合计率的求解合计率的求解80%+100%= 90%250 80%20 100%= 85.7%50+20合合计计通通过过率率合合计计通通过过率率l为了解凉山地区彝族原发性高血压患病为了解凉山地区彝族原发性高血压患病情况,情况,抽样调查抽样调查了彝族农民了彝族农民1628人,资料如下人,资料如下-调查对象男性高血压患病率高于女性调查对象男性高血压患病率高于女性-彝族男性血压

27、患病率高于女性彝族男性血压患病率高于女性比较与假设检验比较与假设检验2007-2008年彝族农民和移民原发性高血压患病率情况年彝族农民和移民原发性高血压患病率情况组别组别高血压高血压未患病未患病合计合计患病率患病率(%)男性男性356947294.80女性女性188818992.00合计合计53157516283.26 l例:例:比较比较A校某校某班班和和B校某校某班班100米跑优秀率米跑优秀率(不分性别均以不分性别均以14.5秒为优秀秒为优秀),两班男女生,两班男女生人数及优秀率见下人数及优秀率见下表表混杂混杂因素因素(confounding factor)两班人数及百米跑优秀率统计两班人数

28、及百米跑优秀率统计性别性别A校某班校某班B校某班校某班人数人数优秀优秀人数人数优秀率优秀率(%)人数人数优秀优秀人数人数优秀率优秀率(%)男生男生6036 60.00 302170.00女生女生101 10.00 30620.00合计合计7037 52.86 602745.00l掩盖了掩盖了处理因素与事物之间处理因素与事物之间的的真实真实联系联系-必须是所研究事物的独立影响因素必须是所研究事物的独立影响因素-必须与所研究的处理因素存在统计学联系必须与所研究的处理因素存在统计学联系在处理因素的对比组间不均衡在处理因素的对比组间不均衡-不是不是处理因素与事物的发生因果处理因素与事物的发生因果链的中

29、间环节链的中间环节混杂偏倚与混杂因素混杂偏倚与混杂因素班级班级性别性别l亚组分析亚组分析l分层分析:如分层分析:如Mantel-Haenszel卡方卡方检验检验l高级高级统计统计方法:如方法:如Logistics回归回归l标准化法标准化法混杂因素的统计学处理混杂因素的统计学处理李晓松主编李晓松主编. . 医学统计学医学统计学( (第第3 3版版). ). 北京北京: : 高等教育出版社高等教育出版社, , 2014.2014.第四节第四节l基本基本思想思想-采用统一的标准构成,以消除混杂因素的影响,采用统一的标准构成,以消除混杂因素的影响,使算得的标准化率具有可比性使算得的标准化率具有可比性l

30、根据已知条件不同,标准化法根据已知条件不同,标准化法分为分为-直接法直接法-间接法间接法标准化法标准化法标准班级标准班级人数人数期望优秀人数期望优秀人数A B 9040130标准班级标准班级人数人数9040130直接标化法直接标化法638715445890 0.640 0.1100%44.62%130Ap90 0.740 0.2100%54.62%130Bp两班人数及百米跑优秀率统计两班人数及百米跑优秀率统计性别性别优秀率优秀率(%)AB男生男生60.00 70.00 女生女生10.00 20.00 合计合计52.8645.00直接标化法直接标化法l标准组按照被标化组的发生过程发生,计算标准组

31、按照被标化组的发生过程发生,计算标准化率标准化率-适用适用条件条件l被标化组的发生率被标化组的发生率l标准组各层人口标准组各层人口(对象对象)数或人口数或人口(对象对象)构成比构成比-计算计算公式公式()iiiiN pNppNN 间接标化法间接标化法期望优秀人数期望优秀人数A B 1592430333371.12133ASMR 271.12524BSMR 两班人数及百米跑优秀率统计两班人数及百米跑优秀率统计性别性别人数人数AB总总优秀优秀总总优秀优秀男生男生60 363021女生女生10 1306合计合计70376027标准班级标准班级优秀率优秀率(%)50.0030.0038.891.121

32、 38.89%43.60%Ap 1.125 38.89%43.75%Bp 间接标化法间接标化法l被标化组,按标准组的发生过程发生,计算被标化组,按标准组的发生过程发生,计算理论发生人数,通过理论发生人数,通过SMR获得标准化率获得标准化率-适用适用条件条件l已知被标化组各层人口数、已知被标化组各层人口数、总总发生发生数数l已知已知标准标准组的各层发生率及合计率组的各层发生率及合计率-计算公式计算公式iirnPpPP SMR232.598.878SMR 年龄组年龄组(i)全国平均死亡率全国平均死亡率(Pi)某地某地人口数人口数(ni)预期死亡数预期死亡数(niPi)04.8330660.1482025.7325160.64740149.1414402.14860341.4817385.935合计合计53.8687608.87853.86 102.59139.50 10p 万万万万表表5.10 某地某地2000年恶性肿瘤标准化死亡率年恶性肿瘤标准化死亡率(1/10万万)计算表计算表注意事项注意事项l选择的标准不同,标准化率也不同选择的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论