分类变量资料统计分析_第1页
分类变量资料统计分析_第2页
分类变量资料统计分析_第3页
分类变量资料统计分析_第4页
分类变量资料统计分析_第5页
已阅读5页,还剩105页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

分类变量资料的统计分析统计推断u检验、检验参数估计假设检验:频数分布集中趋势指标离散趋势指标医学参考值范围估计数值变量资料的统计分析统计描述统计推断u检验t检验方差分析统计描述

相对数参数估计假设检验第十六章分类变量的统计分析

第1-3节统计描述刘颖预防医学教研室掌握:常用相对数指标的意义、计算方法和注意事项;率的标准误和总体率可信区间的估计方法及意义;

u检验和检验的适用条件和计算方法。熟悉:

率的标准化的意义和计算方法1常用相对数2应用相对数的注意事项3率的标准化第一节常用相对数绝对数(absolutenumber)分类变量资料整理后所得到的数据。相对数(relativenumber)分类变量资料的统计描述指标。

例1某年某地流行性乙型脑炎发病240例、麻疹发病200例。240、200——绝对数绝对数说明在一定条件下该地该病实际发生的绝对水平,是制订疾病防治计划和统计分析的基础。甲地麻疹发病率=240/2000=12%乙地麻疹发病率=200/1000=20%发病人数易感儿童甲地2402000乙地2001000例2常用相对数

1.率(rate)又称频率指标或强度指标;说明某现象发生的频率或强度;常以%、‰、1/万、1/10万等表示。可能发生某现象的单位总数发生某现象的观察单位数率=×比例基数例3

某年某市三个区的肠道传染病发病率区人口数发病人数发病率(‰)甲987405035.09乙751352643.51丙1187304663.92合计29260512334.21甲区发病率=503/98740=5.09‰总发病率=1233/292605=4.21‰2.构成比(constituentratio)又称构成指标或结构指标,说明某一事物内部各组成部分的比重或分布,常以百分数表示。某一组成部分的观察单位数同一事物各组成部分的观察单位数构成比=×100%表16.12000年某医院某病住院与死亡人数病情严重程度住院人数病死数死亡构成(%)病死率(%)轻3001226.74.0

中3501840.05.1重1501533.310.0合计80045100.05.6构成比的特点

各构成部分的构成比总和为100%;

某一部分所占比重的增减,会相应地影响其他部分,各构成比之间是相互制约的。3.相对比(relativeratio)表示两个有关指标之比,常以倍数或百分数表示。甲指标乙指标相对比=(或×100%)

例5

2000年我国第五次人口普查结果,男65355万人,女子61228万人,试计算人口男女性别比。6535561228性别比

==1.067例6某市乙型脑炎的发病率1990年为4.48/10万,2000年为0.88/10万,试计算相对比。相对比=4.48/0.88=5.1(倍)相对比=0.88/4.48×100%=19.64%例16.3甲、乙两地肺癌死亡率分别为23.1/10万、12.33/10万,则两地死亡率的相对比为23.1/12.33=1.87,即甲地肺癌死亡率是乙地的1.87倍,RR=1.87。

计算相对数时分母不宜过小,即观察单位数应足够多。分析时构成比和率不能混淆(见表16-1)构成比说明事物内部各组成部分的比重或分布;率说明现象发生的频率或强度。第二节应用相对数的注意事项表16.12000年某医院某病住院与死亡人数病情严重程度住院人数病死数死亡构成(%)病死率(%)轻3001226.74.0

中3501840.05.1重1501533.310.0合计80045100.05.6

相对数的比较应注意可比性观察对象同质、研究方法相同、观察时间相等,以及客观条件一致;资料内部构成是否相同。

率的标准化要考虑存在抽样误差率或构成比的比较应做假设检验第三节率的标准化法

率的标准化法(standardization)在一个指定的标准构成条件下进行率的对比的方法。实际工作中,对两个或多个频率指标进行比较时,若各组对象内部构成存在差异,且差异又影响分析结果,应该用率的标准化法进行比较。表16.2甲、乙两医院的治愈率

科别住院人数治愈人数治愈率(%)

甲医院乙医院甲医院乙医院甲医院乙医院

内科150050097531565.063.0外科5001500470136594.091.0传染病科50050047546095.092.0合计

250025001920214076.885.61.用“标准人口”计算(1)选定标准:两医院各型病人相加;标准的选择方法:选择有代表性、较稳定、数量较大的人群,如全国、全省的历年累计数据;在互相比较的两组资料中,任选其中一组或两组合并作为共同标准。标准化率的计算(直接法)(2)计算甲、乙两医院各型传染病病人的预期治愈人数:各型病人标准人口数分别乘以相应的原治愈率;(3)计算甲、乙两医院传染病的标准化治愈率:各型病人预期治愈人数相加除以标准总人数。表16.3标准人口数计算甲、乙两医院标准化治愈率(直接法)

科别标准人原治愈率(%)预期治愈人数口数甲医院乙医院甲医院乙医院

内科200065.063.013001260外科200094.091.018801820传染病科100095.092.0950920合计500076.885.641304000乙医院标化治愈率=乙医院预期治愈人数之和/标准组总人数

=4000/5000*100%=80%2.用“标准人口构成比”计算(1)将标准病人数换算成构成比;(2)计算甲、乙两医院各型传染病的分配治愈率:标准人口构成比乘以相应原治愈率;(3)计算甲、乙两医院某传染病的标准化治愈率:各型传染病分配治愈率相加。表16.4标准人口构成比计算甲、乙两医院标准化治愈率

科别标准人口原治愈率(%)预期治愈率构成比甲医院乙医院甲医院乙医院

内科0.465.063.026.025.2外科0.494.091.037.636.4传染病科0.295.092.019.018.4合计1.076.885.682.680.0应用标准化法时的注意事项

当各比较组内部构成不同,并足以影响总率的比较时,应对率进行标准化后再作比较;

率的标准化的目的是消除混杂因素影响,使其具可比性;

各年龄组对应的率出现明显交叉时,宜分别比较各年龄组死亡率,而不用标准化进行比较;如是抽样研究,两样本标准化率的比较应作假设检验。

标准化率已不能反映率的实际水平,它只能表明相互比较资料间的相对水平;选定的标准构成不同,所得的标准化率也不同,仅限于采用共同标准构成的组间比较。统计推断统计描述统计分析第十六章分类变量的统计分析

第4-6节统计推断

刘颖预防医学教研室1率的抽样误差和总体率的估计2率的u

检验3

检验一、率的抽样误差和标准误

率的抽样误差的大小用率的标准误表示。第四节率的抽样误差和总体率的估计例16.5

欲了解某种新药对慢性乙型肝炎的疗效,对100名患者进行治疗,其中90人有效,试计算其标准误。一、正态近似法适用条件:np和n(1-p)≥5时,可根据近似正态分布的原理估计其可信区间。例16.5试求该新药有效率的95%可信区间?二、总体率的可信区间估计二、查表法

适用条件:n≤50,特别是p接近0或1时,此时资料呈二项分布,可按二项分布的原理估计总体率的可信区间。一、样本率与总体率比较的u检验目的:推断样本率与总体率的差异是否仅由抽样所致,其差异是否有统计学意义。总体率:一般是理论值、标准值或是经过大量观察所得的稳定值。第五节率的

u

检验其中:为样本率为总体率

n为样本含量例16.7

某地区一般人群中乙型肝炎的阳性率为15%,现对该地区150名流浪者进行检查,其中阳性30人,问当地流浪者的阳性率是否高于一般人群的阳性率?

本例样本率为50%,np和n(1-p)≥5时,可认为呈近似正态分布,故可采用u

检验。检验假设H0:,当地流浪者阳性率与一般人群相同H1:,当地流浪者阳性率高于一般人群单侧

计算u

确定P值

,下结论

u=1.715>1.645,P<0.05,按a=0.05的检验水准,拒绝H0,接受H1,认为当地流浪者的阳性率高于一般人群。目的:推断两样本率是否来自同一总体。适用条件:样本率符合近似正态分布的条件(n较大,且P

和1-P不太小,即np

和n(1-p)≥5时),可用率的u

检验。二、两样本率比较的u检验

式中:

、为样本率,n1、n2为样本例数,

X1、X2为阳性例数,为两样本合并率。例16.8

欲了解从事工农业生产的50岁以上人群高血压的情况,调查了首钢工人1281人,高血压患者386人,患病率为30.13%;石景山区农民387人,高血压患者65人,患病率为16.80%,试问从事工农业生产的50岁以上人群高血压患病率有无差别?

本例两样本的乙肝携带人数均大于5,故可采用样本率的u检验。建立检验假设H0:H1:计算u

3.确定P值

,下结论

u=5.17>1.96,P<

0.05,按a=0.05的检验水准,拒绝H0,接受H1,从事工业生产和农业生产的50岁以上人群高血压患病率不同。第六节检验

检验(chi-squaretest)适用于:

分类变量资料中两个或多个样本的总体率是否相同,两个或多个样本的构成比是否相同,配对资料两种属性间的阳性率是否相等。(一)四格表的检验基本思想可用于两样本率的比较

表16-7四格表检验的基本结构一、四格表的检验

处理

发生数未发生数合计

A组aba+bB组cdc+d

合计a+c

b+dn上表中第R行、第C列的理论频数为:因此:

如果四格表中实际的发生数用A来表示,可通过下式计算值:基本思想:实际频数与理论频数吻合程度。在检验假设成立的情况下,A与T之差一般不会很大,此时值也较小;反之,值较大。

检验的自由度:v=(行数-1)(列数-1)例16.9

某医生欲比较A、B两种药物治疗老年期抑郁症的效果,将病情相近的60名患者随机分成两组,分别用两种药物进行治疗,结果见表16-6,问两种药物治疗效果是否有差别?(二)四格表的检验的基本步骤表16-6A、B两种药物的疗效比较

分组有效例数(%)无效例数(%)合计

A19(63.33)11(36.67)30

B15(50.00)15(50.00)30

合计34(56.67)26(43.33)60建立检验假设H0:H1:计算统计量

计算各理论频数:3.确定P值

,下结论

v=(行数-1)(列数-1)=1按v=1,查界值表,,故P>0.05,按a=0.05的水准,不拒绝H0,说明两种药物治疗效果差异无统计学意义。

(三)四格表的检验的专用公式(16-13)(16-15)(四)四格表的检验的应用条件P326T≥5且n≥40时,非连续性校正1≤T<5且n≥40时,连续性校正

T<1或n<40时,确切概率法(五)四格表的检验的连续性校正(16-16)(16-17)例16-93.确定P值

,下结论

v=(行数-1)(列数-1)=1按v=1,查界值表,,故P>0.05,按a=0.05的水准,不拒绝H0,说明两种药物治疗老年期抑郁症差异无统计学意义。

例16.10

脑胶质瘤患者43人,28例采用手术、15例采用放疗方法进行治疗(表16-8),试比较两种治疗方法治疗后出现的脑功能损伤发生率有无差异?表16-8两种疗法治疗患者脑功能损伤率比较治疗方法有无合计手术22628放疗7815合计291443校正

表16-9配对2×2列联表基本结构二、配对四格表检验

乙属性+–+aba+b–cdc+d

合计a+cb+dn甲属性合计计算公式:b+c≥40

时,b+c<40

时,应作连续性校正检验(16-18)(16-19)例16.11

有50份痰液标本,每份分别接种在甲、乙两种培养基中,观察结核杆菌的生长情况,结果如表16-10,试比较两种培养基的效果?

表16-10甲、乙两种培养基培养效果比较

乙培养基

+

–+271239–3811

合计

302050甲培养基合计检验假设H0:总体B=C,两种培养基阳性率相同H1:总体B≠C,两种培养基阳性率不同计算统计量

分析:由于b+c=12+3=15<40,可得

v=(行数-1)(列数-1)=13.确定P值

,下结论

P<0.05,按a=0.05的水准,拒绝H0,接受H1,可以认为两种培养基的阳性率不同。

三、行×列表检验

当行和/或列大于2时,称为行×列表,又称为R×C表。专用公式:式中:

n为总例数,A为每个格子的实际数,nR

、nC分别为某格子实际数A对应的行合计和列合计。例16.12

某预防医学研究人员调查了343例离退休老人的生活满意度和家庭关系,结果如表16-11所示,试分析家庭关系类型与老人生活满意度的关系。(一)多个率比较

表16-11离退休老人家庭关系与生活满意度家庭关系满意不满意合计满意率(%)

和睦1746023474.36

一般36579338.71差6101637.50

合计21612734362.97检验假设H0:三种不同家庭关系的老人生活满意度相等H1:三种不同家庭关系的老人生活满意度不同或不全相同计算统计量

n=343,且所有T≥53.确定P值

,下结论

v=(R-1)(C-1)=(3-1)(2-1)=2,

查界值表,

,P<0.05,按a=0.05的水准,拒绝

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论