计数资料的统计描述与卡方检验课件_第1页
计数资料的统计描述与卡方检验课件_第2页
计数资料的统计描述与卡方检验课件_第3页
计数资料的统计描述与卡方检验课件_第4页
计数资料的统计描述与卡方检验课件_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计数资料的统计描述与卡方检验四川大学华西医院康德英计数资料的统计描述与卡方检验临床研究中计数资料来源、分类本身设置为分类变量(PI/ECOT)从计量资料转化而来:

如评价降压疗效时,将舒张压降低值分为三类:

<5mmHg无效

5-10mmHg有效

10-20mmHg显效

Note:计量资料转化为计数资料,过程本身损失信息,应慎重。计数资料的统计描述与卡方检验计数资料的分类无序分类:二项或二分类:对立、不相容的两类。如疗效:病死与未愈,感染与否等。多项或多分类:互不相容的多类。如感染部位、感染分型等有序分类:类间不相容且有程度差别。如疗效:痊愈、显效、好转、无效。特点:无度量衡单位;定性测量计数资料的统计描述与卡方检验在赋值时应考虑类型而定。*二分类变量:0,1*有序多分类:多采用等间距赋值如-、+、++、+++(0、1、2、3)*少量非线性关系有序多分类赋值:考虑哑变量*无序多分类变量赋值:A、B、AB、O 1234?计数资料的分类赋值采用哑变量方法:dummyvariable计数资料的统计描述与卡方检验革阳菌的哑变量赋值为(1,0,0),革阴菌哑变量赋值为(0,1,0),真菌哑变量赋值为(0,0,1)计数资料的统计描述与卡方检验一、计数资料的统计描述方法(一)图表:频数表,直条图,饼图计数资料的统计描述与卡方检验变量类型的判断病例号年龄(岁)性别身高(m)血型心电图尿WBC职业RBC1012/L135女1.65A正常-教师4.67244男1.74B正常-工人5.21326男1.80O正常+职员4.10425女1.61AB正常+农民3.92541男1.71A异常++工人3.49645女1.58B正常++工人5.48750女1.60O异常++干部6.78828男1.76AB正常+++干部7.10931女1.62O正常+军人5.24计数资料的统计描述与卡方检验1、频数表职业状况频数工人3干部2职员1军人1农民1教师1合计99名感染病例的职业状况编号性别身高职业状况1女1.65教师2男1.74工人3男1.80职员4女1.61农民5男1.71工人6女1.58工人7女1.60干部8男1.76干部9女1.62军人部分原始数据计数资料的统计描述与卡方检验2、直条图直条图(bar条形图):分类变量资料的频数图,条与条间独立,顺序可不固定。与Histgram不同计数资料的统计描述与卡方检验饼图/圆饼图/圆图/pie图计数资料的统计描述与卡方检验百分条图(percentbar)计数资料的统计描述与卡方检验(二)率、比(构成比、相对比)计数资料的统计描述与卡方检验1、率(rate,frequency)

率又包括频率指标(frequency)和强度指标(rate),用来测量一定时期内,某人群特定事件发生的频率或强度。率=(发生某现象的观察单位数)/(某时间段可能发生某现象的观察单位数)常用百分率(感染率)、千分率、10万分率(肿瘤发病率)表示。计数资料的统计描述与卡方检验率是一个动态指标,在观察期内看特定人群中某事件的变化。率有时间单位—观察时间影响率的大小。反应停销售量畸形儿发生率计数资料的统计描述与卡方检验与医院感染有关的率医院感染发生率医院感染罹患率医院感染患病率(即现患率)计数资料的统计描述与卡方检验医院感染发生率是指一定时间内某人群中新发病例的频率。公式=(同一时期内新发生医院感染例数/同一时期内处于危险中病人数)×100%或公式=(同期新发生医院感染例数/同期住院病人人数或出院病人数)×100%

观察时间可为年、季、月,一般为年。年发病率/月发病率/季发病率计数资料的统计描述与卡方检验医院感染罹患率(同发生率)公式:(同期新发生医院感染例数/观察期间具感染危险的住院病人数)×100%计数资料的统计描述与卡方检验计算医院感染率时,分子确定要注意:病例的感染时间要“落入”观察期内,即必须是新病例。注意病例与病人的区别。感染必须确诊2009.1.12009.1.31观察期新感染新感染新感染感染新感染

已感染计数资料的统计描述与卡方检验分母:可能发生感染的人数,其范围界定很关键暴露人群又称危险人群,指发生感染的可能人群应排除那些已感染或因年龄、免疫等因素而不会感染的病人?计数资料的统计描述与卡方检验现患率也称患病率或流行率,指某特定时间某人群中感染人数所占比重或比例。公式=(特定时间存在的医院感染例数/观察期间处于感染危险中的病人数)×100%现患率主要在基线调查研究中使用,一般用调查病人数作为分母。也用于评价感控效果。计数资料的统计描述与卡方检验计算现患率时应注意:分子包括新、老感染病人,只要调查时正处于感染状态,均计算在内。分母调查人数可分为时点现患率与期间现患率

pointprevalence

periodprevalence调查时应尽量缩短调查时间cross-sectionalstudy/Cohort

study计数资料的统计描述与卡方检验计数资料的统计描述与卡方检验2、构成比(proportion)说明某一事物内部各组成部分所占的比重和分布,常用百分数表示(0%-100%)。计数资料的统计描述与卡方检验构成比是一特定时间(timepoint)某特定事件在总体事件数中所占的比重。

proportion=a/(a+b+c+……)是一个静态指标无时间单位计数资料的统计描述与卡方检验3、相对比(ratio)

相对比是A、B两个指标之比,是比较两独立事件数量大小关系指标(独立指互不包含):比=A/B两个指标可性质相同,可不同;绝对数、相对数或平均数。是一个静态指标,反映一特定时间(timepoint)的情况。无时间单位计数资料的统计描述与卡方检验例1某医院院内感染汇总分析月份出院人数感染人数感染率构成比相对比1月份58481.378.8--2月份571101.7511.01.283月份714121.6813.21.234月份748162.1417.61.565月份942212.2323.01.636月份1095242.1926.41.60合计91计数资料的统计描述:率与比的综合应用计数资料的统计描述与卡方检验(三)、计数资料统计描述的

注意事项计算率时要求分母不宜过小。少于10例则直接描述。计数资料的统计描述与卡方检验例2血清TPS检出率与消化道肿瘤淋巴结转移关系肿瘤淋巴结转移无淋巴结转移

nTPS阳性率nTPS阳性率食管癌771003133.3胃癌9666.7100大肠癌10770.000-

合计262076.94125.0(7/7),(6/9),7/10,0/1计数资料的统计描述与卡方检验分析时不能以构成比代率

例3某作者调查医院感染病例,获得如下数据:年龄组(岁)感染数%30

474.640

506070-801983304341819.332.142.31.7结论:说明60岁

年龄组最容易发生感染。计数资料的统计描述与卡方检验(四)、率的标准化

例4甲、乙两个医院感染率比较病情程度甲医院乙医院

例数感染数

感染率例数感染数

感染率重

80016020%1003030%中

2002010%4006015%轻

10055%100010010%合计

110018516.8%150019012.7%计数资料的统计描述与卡方检验1、标准化法的基本方法方法1:采用标准人口构成与原始分组率,计算标准化率,直接比较。方法2:采用分组标准化率与原始人口,计算标准化比,间接比较。计数资料的统计描述与卡方检验1)、直接法--标准人口病情程度甲医院乙医院

例数感染数

感染率例数感染数

感染率重80016020%80024030%中2002010%2003015%轻10055%1001010%合计110018516.8%1100280

12.7%

25.4%

计数资料的统计描述与卡方检验2)、间接法:分组标准率病情程度

甲医院乙医院

例数感染数感染率例数实际预期感染数感染数重

80016020%1003020

2002010%4006040

10055%100010050

合计

110018516.8%1600220110

计算标准化感染比(SIR)=(实际感染数与预期感染数比)=220/110=2;SIR<1,表示被标化组的感染率低于标准组;SIR>1,表示被标化组的感染率高于标准组。计数资料的统计描述与卡方检验2、标准化率的注意事项条件:比较双方应同质、同时、同地,比较的两组应选用同一标准。标准选用不同,标化率可不同。标准化率只是两组的相对水平,不反映实际的情况,只能用于比较。总体标准化率比较也需进行假设检验。计数资料的统计描述与卡方检验(五)以率/比基础的二级指标相对危险度(RR)比数比(OR)绝对危险度(AR)NNT用来表达危险度的大小或关联程度计数资料的统计描述与卡方检验OR、RROR(比数比)、RR(相对危险度)适用条件:对于RCT试验:可以计算OR、RR

对于病例对照研究:只能计算OR计数资料的统计描述与卡方检验1、相对危险度(率比)组别感染未感染合计感染率治疗组aba+bPe

对照组cdc+dPc合计a+cb+da+b+c+dRR(相对危险度)为治疗组与对照组的感染率之比。RR=Pe/Pc计数资料的统计描述与卡方检验实例(例5)分析

组别未感染感染合计感染率治疗组90101000.1

对照组80201000.2某种抗生素预防院内感染的疗效分析。计数资料的统计描述与卡方检验RR计算的实例演示治疗组发生感染的危险度(率)=10/100=0.10对照组发生感染的危险度(率)=20/100=0.20相对危险度(RR)=0.5计数资料的统计描述与卡方检验2、比数比(OR)组别暴露非暴露合计暴露/非暴露比病例组aba+ba/b对照组cdc+dc/d合计a+cb+da+b+c+dOR(比数比)为病例组暴露与非暴露的比例与对照组暴露与非暴露的比例之比;OR=ad/bc计数资料的统计描述与卡方检验OR计算的实例演示比数比又常称为机会比/优势比/比值比。

组别未感染感染合计感染率治疗组90101000.1

对照组80201000.2某种抗生素预防院内感染的疗效分析本例OR=0.44。计数资料的统计描述与卡方检验OR、RR临床(实际)意义OR、RR>1,表明暴露因素为危险因素,偏离1越远,表示危险性越强0<OR、RR<1,表明暴露因素为保护因素,离0越近,表示保护性越强OR、RR=1,表明暴露因素与结果无关注意:暴露因素和结果的赋值标准化:1表示暴露,0表示未暴露;1表示感染,0表示未感染。否则结论可能刚好相反。计数资料的统计描述与卡方检验相对危险度与比数比的关系例6:治疗组感染率=10/100=0.1;对照组感染率0.2

RR=0.5OR=0.44例7:治疗组感染率=5/100=0.05;对照组感染率=10/100=0.1

RR=0.5OR=0.48当率较低,如小于10%时,RR值与OR值近似相等。率值越小(罕发事件),越接近。对大规模临床随机对照试验:OR、RR可使用。计数资料的统计描述与卡方检验3、绝对危险度(率差)对照组感染率40%,试验组20%,RR=0.5?对照组感染率10%,试验组5%,RR=0.5?AR为两个率的绝对差值:即对照组率-治疗组率计数资料的统计描述与卡方检验绝对危险度实例计算对于感染率研究:绝对危险度为:20%-10%=0.1

(常用百分数表示:10%)治疗能使感染率的危险度减少10%左右计数资料的统计描述与卡方检验

4、NNTNNT(NumbersNeededtoTreat):为避免一例不良事件发生而需要治疗的病例数.其值为绝对危险度的倒数(1/AR)类似还有:NNH(NumbersNeededtoHarm)。计数资料的统计描述与卡方检验NNT实例演示如果治疗一个病人能减少感染的0.10危险度,即我们能挽救0.1个人。那么为挽救一个完整的人,需要治疗多少病人?NNT=1/0.110需要治疗10个病人,才能比对照组多减少1个感染病例。计数资料的统计描述与卡方检验计数资料统计描述小结率与比可用来描述某事件发生机会的大小。二分类变量资料描述相对危险度(RR)与比数比(OR)是用来描述两组间事件发生的机会之比。当事件的发生机会较大时,RR与OR相差较大;当为罕发事件时,RR

OR。绝对危险度是指率差,NNT为避免一例不良事件发生而需要治疗的病例数。计数资料的统计描述与卡方检验二、计数资料的假设检验

----卡方检验----

PearsonChi-squaretest计数资料的统计描述与卡方检验Karl·Pearson,1857~1936,生卒于伦敦,公认为统计学之父。1879年毕业于剑桥大学数学系;曾参与激进的政治活动,还出版几本文学作品,并且作了三年的实习律师。1884年进入伦敦大学学院,教授数学与力学,从此在该校工作一直到1933年。K·Pearson最重要的学术成就,是为现代统计学打下了坚实基础。K·Pearson在1893-1912年间写出18篇《在进化论上的数学贡献》的文章,而这门“算术”,也就是今日的统计。许多统计名词如标准差,成分分析,卡方检验(1900)都是他提出。

计数资料的统计描述与卡方检验

2检验的主要应用推断两个/两个以上总体率或构成比有无差别;两分类变量间有无相关的假设检验(独立性);拟合优度检验(理论分布与实际分布的吻合情况检验)。计数资料的统计描述与卡方检验(一)2检验主要类型四格表资料的

2检验2

2列联表的

2检验R

C表资料的

2检验计数资料的统计描述与卡方检验卡方检验基本思想:

以四格表资料为例计数资料的统计描述与卡方检验

例8、为探讨医院感染与使用呼吸机的关系,某医院感控部门进行了横断面调查,使用呼吸机者77例,发生感染17例,未使用呼吸机的1821人中,有69例发生感染,问两组感染现患率有无差别?计数资料的统计描述与卡方检验表1两组医院感染率的比较处理感染数未感染数合计感染率%呼吸机组17607722未用组69175218214合计86181218984.53计数资料的统计描述与卡方检验4%

22%(样本率不等)推断总体率两总体率相等两总体率不等P值小概率事件

拒绝H0不拒绝H0

2检验的基本思想

计数资料的统计描述与卡方检验1、建立假设H0:两组感染率相等,

1=

2=

H1:两组感染率不等,

=0.05*两组的总体感染率相等,均等于合并感染率

=86/1898=4.53%计数资料的统计描述与卡方检验l在无效假设成立的条件下,计算每个格子的感染情况,T(理论频数)=组例数*总体感染率,可简化为T=(行合计*列合计)/n.处理感染数未感染数

合计

感染率呼吸机组+17(3.49)60(73.51)7722未用组69(82.51)1752(1738)18214.0合计86181218984.53计数资料的统计描述与卡方检验为反映所有格子的吻合情况,所有差值求和,

(A-T)=0(正负抵消),差值和可定义为

(A-T)2;相对比例保持不变,T值越大,

(A-T)2值越大,为消除其影响,差值定义为:

(A-T)2/T计数资料的统计描述与卡方检验2、计算统计量

2在样本量足够大时,该值服从于自由度为

=(行数-1)(列数-1)的

2

分布。即

2检验公式:

2=

(A-T)2/T

2分布是一簇连续性分布,与自由度有关;在自由度固定时,

2值越大,P值越小,反之亦然.在无效假设成立时:

2值一般不会很大,出现大的

2值的概率P是很小的,若P<

(检验水准),则怀疑假设成立,因而拒绝它;若P>

(检验水准),则没有理由拒绝它。计数资料的统计描述与卡方检验3、P值与

2分布

2值反映了实际频数与理论频数的差值大小

2值大小与p值呈反比关系,即

2

值越大,P值越小;反之亦然。

2值达到界值点,就有理由认为成立的可能性不大,是小概率事件,因而拒绝H0

。对于四格表资料:

0.052=3.84计数资料的统计描述与卡方检验四格表资料2检验计算结果

本例

2

值=53.0,自由度为1,查

2

界值表,得p<0.05,按照

=0.05的水准,拒绝H0,而接受H1,可认为两组总体感染率不同计数资料的统计描述与卡方检验四格表资料的应用条件当T

5,而n>40时,选用一般计算公式当1<T<5,而n>40时,需计算校正公式当T<1或n<40时,选用Fisher确切概率法1934

连续性校正仅用于四格表资料,当超过四个格子时,一般不作Yate校正.计数资料的统计描述与卡方检验(二)、2X2列联表(配对设计)例9、某研究室用甲乙血清学方法检查410例确诊的鼻咽癌患者,得结果如下表,问两种检验结果有无联系?有无差别?表2两种血清学检验结果甲法乙法合计+-+261(a)110(b)371-8(c)1(d)39合计269141410计数资料的统计描述与卡方检验1、资料特点与分析目的资料的特点:配对计数资料分析目的:

A:两法检验结果有无关系(四格表

2检验)

B:两法检验有无差别(专用公式)。计数资料的统计描述与卡方检验2、假设检验(1):相关分析

检验目的:两法检验结果有无关系。

H0:两法检验结果无关系

H1:两法检验结果有关系

=0.05

2值=38.85,

=1

确定P值:查卡方界值表,得P<0.005,按照

=0.05的水准,拒绝H0,而接受H1,可认为两法检验结果有关。计算Pearson列联系数反映相关程度[sqrt(

2/2+n)]。(本例为r=0.294)计数资料的统计描述与卡方检验3、假设检验(2):差别分析

检验目的:两法检验结果有无差别

H0:两总体b=c

H1:两总体b

c

=0.05

确定P值:查卡方界值表,得P<0.005,按照

=0.05的水准,拒绝H0,而接受H1,可认为两法检验结果不同.甲法的阳性检出率高。计数资料的统计描述与卡方检验4、2X2列联表差别检验的应用条件当b+c>40时,公式可简化(McNemar):

计数资料的统计描述与卡方检验计数资料的统计描述与卡方检验2X2列联表资料的分析特点对此类资料可以做两方面的分析:相关分析:采用一般的四格表公式差别分析:采用专用公式(b、c不宜过小)对上例结果:两类检验方法结果是有关的,且有差别,甲法好于乙法。计数资料的统计描述与卡方检验(三)、多个样本率比较适用资料特征:行X列表(RXC)--多个率比较的

2检验。应用条件:不能有1/5格子的理论频数小于5,或最小理论频数小于2。若不满足,可采用方法:增加样本例数以增加理论频数;删除上述理论频数太少行或列;将理论频数太小性质行或列相近实际频数合并。Fisher确切概率法计数资料的统计描述与卡方检验卡方检验:P=0.037计数资料的统计描述与卡方检验(四)特殊行X列表资料的分析

列联表:有序行X列表资料,行变量、列变量的属性分为:双向均无序单向有序双向均有序属性相同双向均有序属性不同计数资料的统计描述与卡方检验A、对于双向无序资料:若比较多个样本率(或构成比),可用行

列表资料卡方检验;若分析两个分类变量之间有无关联性以及关系的密切程度时,可用行列表卡方检验以及Pearson列联系数进行分析[sqrt(

2/2+n)]。计数资料的统计描述与卡方检验卡方检验:19.54,P<0.001计数资料的统计描述与卡方检验B、单向有序资料分组变量(如年龄)有序,而结果变量(如传染病的类型)无序,分析不同组结果构成情况,可用行

列表卡方检验进行差别分析。分组变量(如疗法)无序,而结果变量(如疗效按等级分组)有序,比较不同组别疗效,应用秩和检验计数资料的统计描述与卡方检验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论