定性资料统计推断医学统计学演示文稿_第1页
定性资料统计推断医学统计学演示文稿_第2页
定性资料统计推断医学统计学演示文稿_第3页
定性资料统计推断医学统计学演示文稿_第4页
定性资料统计推断医学统计学演示文稿_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

定性资料统计推断医学统计学演示文稿当前1页,总共64页。优选定性资料统计推断医学统计学当前2页,总共64页。常用的比例指标绝对数:资料整理后各组的例数相对数:两个绝对数之比中得到的一种数值当前3页,总共64页。1.率:速率(rate):与时间有关,如某年某病发病率、死亡率。比率(proportion):与时间无关,如某病治愈率。2.比:构成比(constituentratio):部分与全部之比相对比(relativeratio):两指标之比3.动态数列:定基比:各时间的指标分别与基数(某个时间的指标)作对比环比:以相邻的后一个时间的指标与前一个时间的指标作对比增长量:分为累积增长量、逐年增长量

常用的比例指标当前4页,总共64页。率的标准误与可信区间率的标准误率当前5页,总共64页。标准误的计算当前6页,总共64页。总体率的可信区间

1、样本量足够大,总体率适中(满足np和n(1-p)均大于5)时,样本率近似正态分布。其可信区间为(p-uα/2

Sp,p+uα/2

Sp)当前7页,总共64页。当前8页,总共64页。总体率的可信区间

2、样本量较小时,查表。附表c3(P562)百分率的置信区间例某药物治疗10例患者,有3例出现不良事件,试估计不良事件发生率。解:不良事件发生率的总体率的95%可信区间为(7%,65%)练习:某药物治疗200例患者,有130例出现不良事件,试估计不良事件发生率。当前9页,总共64页。2检验

chi-squaretest当前10页,总共64页。引例

将病情相近的乳腺癌患者随机分为两组,分别采用两种治疗方案(单纯手术治疗和手术及术后化疗联合治疗)进行治疗,观察五年,其存活情况见表1,问两种疗法的存活率是否相同?表1两种疗法治疗乳腺癌患者存活率比较疗法生存死亡

合计存活率(%)联合治疗3984783.0单纯治疗57278467.9合计963513173.3当前11页,总共64页。一、2检验的基本思想表1两种疗法治疗乳腺癌患者存活率比较疗法生存死亡

合计存活率(%)联合治疗3984783.0单纯治疗57278467.9合计963513173.3四格表(fourfoldtable,2×2table)实际频数(actualfrequency,A)行合计(rowtotal,nR)列合计(columntotal,nC)总例数(n)当前12页,总共64页。一、2检验的基本思想当前13页,总共64页。表1两种疗法治疗乳腺癌患者存活率比较疗法生存死亡

合计存活率(%)联合治疗39(a)8(b)47(a+b)83.0单纯治疗57(c)27(d)84(c+d)67.9合计96(a+c.)35(b+d.)131(n=a+b+c+d)73.3一、2检验的基本思想当前14页,总共64页。第一步:建立检验假设H0:两总体存活率相等,即1=2;H1:两总体存活率不等,即12。当前15页,总共64页。疗法生存死亡

合计存活率(%)联合治疗3984783.0单纯治疗57278467.9合计963513173.3表1两种疗法的乳腺癌患者按H0成立计算的理论频数(Theoreticalfrequency)

?39(34.44)8(12.56)57(61.56)27(22.44)73.373.3当前16页,总共64页。χ2检验的基本公式

上述基本公式由现代统计学的创始人之一,英国人KarlPearson(1857-1936)于1900年提出,因此软件上常称这种检验为Pearson2检验(Chi-squaretest)。当前17页,总共64页。2分布是一种连续型分布,按分布的密度函数可给出不同自由度的一簇分布曲线。2分布的形状依赖于自由度的大小;当自由度趋向于无穷大时,2分布趋向正态分布。

2分布(chi-squaredistribution)当前18页,总共64页。2分布(chi-squaredistribution)02468100.00.10.20.3当前19页,总共64页。2分布规律(附表c5.p569)自由度一定时,P值越小,2值越大。=1时,P=0.05,2

=3.84

P=0.01,2

=6.63当P值一定时,自由度越大,2越大。

P=0.05时,=1,2

=3.84

=2,2

=5.99当自由度取1时,u2=2当前20页,总共64页。由于四格表资料为双边固定形式,即假设行合计与列合计均固定,所以四格表的自由度ν=1疗法生存死亡

合计联合治疗

47单纯治疗84合计9635131表1两种疗法治疗乳腺癌患者存活情况(行合计与列合计均固定)当前21页,总共64页。

各种情形下,理论与实际偏离的总和即为卡方值(chi-squarevalue),它服从自由度为ν的卡方分布。当前22页,总共64页。尚不能认为两种疗法的存活率是不相同的。当前23页,总共64页。基本思想概括若H0成立,则四个格子的实际频数A与理论频数T之差异纯系抽样误差所致,故一般不会很大,2值也就不会很大;在一次随机试验中,出现大的2值的概率P

是很小的。当前24页,总共64页。因此,若根据实际样本资料求得一个很小的P,且P≤

(检验水准),根据小概率原理,就有理由怀疑H0的真实性,因而拒绝它;若P>,则没有理由拒绝H0

当前25页,总共64页。检验步骤建立假设与确定检验水准

H0

π1=π2H1

π1≠π2α=0.05计算χ2值确定P值

υ=(行数-1

)(列数-1)

=(2-1)(2-1)=1

以υ=1查χ2界值表判断结果按α

水准,将P

与α比较,作出判断。当前26页,总共64页。二、四格表专用公式

为了不计算理论频数T,

可由基本公式推导出,直接由各格子的实际频数(a、b、c、d)计算卡方值的公式:应用条件:n40,所有T5时当前27页,总共64页。尚不能认为两种疗法的存活率是不相同的。二、四格表专用公式当前28页,总共64页。

某医师研究洛赛克治疗消化性溃疡的疗效,以泰胃美作对照,其观察结果见表3。表3两种药物治疗溃疡病的疗效药物例数有效数有效率(%)泰胃美603660.0洛赛克605490.0练习药物无效数有效数例数泰胃美243660洛赛克合计630549060120当前29页,总共64页。三、连续性校正(Continuitycorrection)公式

当四格表资料理论频数较小时,需要对其进行校正,称为连续性校正,又称Yates校正(Yates’correction)。当n≥40,1≤T<5时,用连续性校正公式。校正公式为当前30页,总共64页。Trick:CalculatethesmallestT,thenIfthesmallestT≥5,noneedofcorrection.Otherwise,Continuitycorrectionisneeded.当前31页,总共64页。1≤T<5,且n≥40,应用连续性校正2检验三、连续性校正公式当前32页,总共64页。

比较两种药物治疗绦虫病患者的有效率,结果见表5。

表5两种药物治疗绦虫病的有效率药物病例数有效数有效率(%)槟榔煎剂272281.48阿的平181266.67练习当前33页,总共64页。SummaryBasicthinkingofchi-squaretestChi-squaretestof2independentsamplesn≥40andallT≥5,noneedofcorrection.n≥40but1≤T<5,continuitycorrectionisneeded.n<40orT<1,orP≈a,Fisherexacttestshouldbeused.

对于四格表资料的χ2检验,应特别注意资料的总例数n与理论数T的大小当前34页,总共64页。1.配对资料

甲医生乙医生

1++2+-3-+4--

四、配对四格表资料的χ2检验当前35页,总共64页。

表1配对四格表资料表格甲种属性乙种属性合计

+-+aba+b-cdc+d

合计a+cb+dn当前36页,总共64页。表某抗癌新药两种剂量的毒理实验结果甲剂量乙剂量合计死亡(+)生存(-)死亡(+)6(a)12(b)18生存(-)3(c)18(d)21合计93039当前37页,总共64页。配对四格表资料的χ2检验也称McNemar检验(McNemar'stest)H0:b,c来自同一个实验总体(两种剂量的死亡率无差异)H1:b,c来自不同的实验总体(两种剂量的死亡率有差别)α=0.05。当前38页,总共64页。配对四格表资料格式当前39页,总共64页。配对四格表资料的χ2检验公式推导当前40页,总共64页。五、行×列(R×C)表资料的χ2检验当前41页,总共64页。R×C表的χ2检验通用公式当前42页,总共64页。R×C表的计算举例当前43页,总共64页。4、χ2=58.91>χ20.05(6)=12.59,所以,P<0.055、以α=0.05水准拒绝H0,……1、H0:病变类型与年龄无关

H1:病变类型与年龄有关

2、3、计算统计量卡方值当前44页,总共64页。行×列表资料的检验

多个样本率比较时,有R行2列,称为R×2表;②

两个样本的构成比比较时,有2行C列,称2×C表;③

多个样本的构成比比较,以及双向无序分类资料关联性检验时,有R行C列,称为R×C表。当前45页,总共64页。几种R×C表的检验假设H0当前46页,总共64页。检验统计量(通用公式)当前47页,总共64页。当前48页,总共64页。1.多个样本率的比较当前49页,总共64页。当前50页,总共64页。例测得某地5801人的ABO血型和MN血型结果如下表,问两种血型系统之间是否有关联?

表某地5801人的血型

3.双向无序分类资料的关联性检验

当前51页,总共64页。R×C表χ2检验的应用注意事项1.对R×C表,若较多格子(1/5)的理论频数小于5或有一个格子的理论频数小于1,则易犯第一类错误。 出现某些格子中理论频数过小时怎么办?(1)增大样本含量(最好!)(2)删去该格所在的行或列(丢失信息!)(3)根据专业知识将该格所在行或列与别的行或列合并。(丢失信息!甚至出假象)

当前52页,总共64页。R×C表χ2检验的应用注意事项

2.多组比较时,若效应有强弱的等级,如+,++,+++,最好采用后面的非参数检验方法。χ2检验只能反映其构成比有无差异,不能比较效应的平均水平。

3.行列两种属性皆有序时,可考虑趋势检验或等级相关分析。

4.多个率两两比较可采用卡方分割的方法当前53页,总共64页。条件:理论依据:超几何分布,非检验的范畴。

四格表资料的Fisher确切概率法当前54页,总共64页。当前55页,总共64页。Fisher精确检验的基本思想:

在四格表周边合计数固定不变的条件下,计算表内4个实际频数变动时的各种组合之概率;再按检验假设用单侧或双侧的累计概率,依据所取的检验水准做出推断。

当前56页,总共64页。(1)各组合概率Pi的计算

在四格表周边合计数不变的条件下,表内4个实际频

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论