07分类资料的推断130407_第1页
07分类资料的推断130407_第2页
07分类资料的推断130407_第3页
07分类资料的推断130407_第4页
07分类资料的推断130407_第5页
已阅读5页,还剩101页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

定性资料的统计推断主要内容6.1率的可信区间6.2样本率与总体率的比较6.3两率的比较6.4配对设计资料的两率的比较6.5多个率的比较6.6构成比的比较6.7两标准化率的比较6.8高维列联表的分析6.9趋势性检验

6.1率的区间估计阳性率的均数μp=π

标准差σp=

(率的标准误)总体率的区间估计1.正态近似法np>5n(1-p)>5p±uasp

例1在血吸虫病流行区中,某县根据随机原则抽查4000人, 其血吸虫感染率为15%,试区间估计该县血吸虫感染率的99%可信区间总体率的99%可信区间即0.1354~0.1646

2.查表法n≤50例2有人调查29名非吸毒妇女,出狱时有1名HIV(人免疫缺陷病毒)阳性,则阳性率的95%可信区间为(0.1%,17.8%)3.精确概率法n较小,p接近于0或1(其中r为阳性数)特别地在r=0时在r=n时上例中,95%K可信区间为即(0.0009,0.1776)4.利用二项分布的概率公式迭代两率差的可信区间π1-π2的可信度为1-α的可信区间为其中6.2样本率与总体率比较比较的目的是推断该样本所代表的未知总体率π与已知的总体率π0是否相等。方法一:直接计算概率法

例3据以往经验,新生儿染色体异常率一般为1%,某医院观察了当地400名新生儿,只有1例异常,问该地新生儿染色体异常率是否低于一般?H0:π=0.01H1:π<0.01α=0.05P=p(x≤1)=p(x=0)+p(x=1)p>0.05不拒绝H0问题:P=P(x≤1),而不是P=P(x≤2)P=P(x≤1),而不是P=P(x=1)P=P(x≤1),而不是P=P(x≥1)例4用一种新药治疗某种寄生虫病,受试者50人在服药后1人发生某种严重反应,这种反应在此病患者中也曾有发生,但过去普查结果约为每5000人中仅有1人出现。问此新药是否提高了这种反应的发生率?

方法二:正态近似法(n较大)

例5根据以往经验,一般胃溃疡病患者有20%发生胃出血症状,现某医院观察65岁以上溃疡病人304例,有31.6%发生胃出血症状,问老年胃溃疡病患者是否较容易出血?H0:π=0.2H1:π>0.2α=0.05

p<0.05拒绝H0,认为……

6.3两样本率的比较目的:推断两总体率是否相等当n1,n2均较大,p1,p2,(1-p1),(1-p2)均不太小,如n1p1,n2p2,n1(1-p1),n2(1-p2)均大于5时,可用u检验6.3.1两样本率的U检验例6蛙王露:n=53,有效率81.13%复方阿胶:n=56,有效率71.43%二者是否有差别?H0:π1=

π2;H1:π1≠π2;α=0.05n1=53,n1p1=43,n2=56,n2p2=40pc=(43+40)/(53+56)=0.7615查u界值表,p>0.05,不拒绝H0,尚不能认为两药有效率不同6.3.2两样本率比较的卡方检验卡方检验的原理一种对理论频数和实际频数吻合程度的考察。Ainvestigationofthedegreeofagreementoftheoreticalfrequencyandactualfrequency.一个正常的骰子,抛出后得到六个面的概率均为1/6。因此,要判定一个骰子是否合格,可以通过抛骰子的方法来进行;χ2检验的原理理论101010101010实际121365159差值-2-345-51χ2检验的原理衡量理论数与实际数的差别KarlPearson1857~1936英国统计学家1901年10月与Weldon、Galton一起创办Biometrika理论101010101010实际121365159差值-2-345-512分布0.00.10.20.30.40.5RejectionArea四格表(fourfoldtable)例7109例患者治疗后有效率比较组别有效无效合计有效率(%)试验组43105381.13对照组40165671.43合计832610976.15理论数的计算如果两组率相等,则理论上有效率为76.15%。理论与实际相吻合!则观察53人,有53×0.7615=40.36人有效,

53-40.36=12.64人无效。观察56人,有56×0.7615=42.64人有效,

56-42.64=13.36人无效。理论频数的计算43104016实际数理论数40.3612.6442.6413.36衡量理论数与实际数的差别自由度为1的2分布0.00.10.20.30.40.5自由度为2的2分布0.00.10.20.30.40.5自由度为1的2分布界值0.00.10.20.30.40.53.840.052检验的步骤(1)H0:1=2;

H1:1≠2,

=0.05(2)2=1.41(3)P>0.05(4)

按0.05水准,不拒绝H0,尚不能认为两种方法的治疗效果不同。四格表2检验的专用公式abcd43104016四格表2检验的专用公式四格表2的检验的应用条件:N>40,T>5,用2;N>40,但1<T≤

5,用校正2。n≤40,或T≤

1,用确切概率。当P值接近检验水准时,推荐使用确切概率法。6.3.3四格表的校正卡方检验例8穿新旧两种防护服工人的皮肤炎患病率比较

组别阳性阴性合计患病率(%)新114156.7旧10182835.7合计11324325.6H0:两组工人的皮肤炎患病率无差别,即π1=π2;H1:两组工人的皮肤炎患病率有差别,即π1≠π2;检验水准=0.05。求得最小的理论频数T11=15×11/43=3.84,1<T11<5且n=43>40,所以宜用χ2检验的校正公式查χ2界值表得0.05<P<0.10,按

=0.05水准,不拒绝H0,差别无统计学意义,尚不能认为穿不同防护服的皮肤炎患病率有差别。6.3.4四格表的确切概率

Fisher’sexactprobability例9两种方法治疗黑色素瘤疗效比较

方法缓解未缓解合计缓解率(%)A1311492.9B731070.0合计2042483.3确切概率的基本思想基本思想:周边合计应当是不变的在假定H0成立时,四格表频数的各种组合都有可能得到,但得到的概率大小不同;假定零假设成立,计算此时出现现有样本及更极端样本的概率。所谓极端,这里指不同组合下两样本率差别更大的情形;若零假设成立,此概率应当不会太小!四格表周边合计不变xa+b-xa+ba+c-xd-a+xc+da+cb+dnx=0,1,…,min(a+c,a+d)在周边合计一定时,某个格子数字确定后所有格子中都会被确定。四格表(周边合计不变时)所有可能的排列(1)(2)(3)(4)(5)14013112211310464738291100每一种组合的概率aba+bcdc+da+cb+dn超几何分布(hypergeometricdistribution)四格表所有可能排列的概率(1)(2)(3)(4)(5)14013112211310464738291100Pi0.01980.15810.38540.34260.0942四格表(周边合计不变时)所有可能的排列(1)(2)(3)(4)(5)14013112211310464738291100|p1-p2|:0.4000.2290.0570.1140.286P值的计算(1)(2)(3)(4)(5)14013112211310464738291100|p1-p2|:0.4000.2290.0570.1140.286Pi0.01980.15810.0942P=0.0198+0.1581+0.0942=0.2721H0:两种方法缓解率相等;H1:两种方法缓解率不等。=0.05。P=Pi=0.2721按=0.05水准,不拒绝H0,差异无统计学意义。故尚不能认为两种方法治疗黑色素瘤缓解率有差别。两个率比较的u检验当n较大时,二项分布近似正态分布。因此两样本率比较的u检验,当n1p1、n2p2、n1(1p1)、n2(1-p2)均大于5才适用,某医师在用蛙王露口服液治疗贫血的临床试验中,将109名受试者随机分为两组,一组为试验组,接受蛙王露口服液的治疗,结果为有效43人,无效10人;另一组为对照组,接受复方阿胶浆的治疗,结果为有效40人,无效16人,问两组有效率有无差别?H0:两组有效率无差别,即π1=π2;H1:两组有效率有差别,即π1≠π2;

=0.05。p1=43/53=0.8113,p2=40/56=0.7143,pc=(43+40)/(53+56)=0.7615查附表1得P=0.234,按

=0.05的水准,不拒绝H0,差别无统计学意义,故尚不能认为两组的有效率有差别。与正态分布的关系3.840.050.0250.0251.96-1.966.4配对资料的两率的比较

配对设计的t检验配对设计的计数资料,我们可采用:(1)配对资料的χ2检验(McNemar检验)

(2)确切概率法配对四格表资料的2检验两种检验结果比较可能的结果甲法乙法频数1++a2+-b3-+c4--d例10两种检验结果比较乙甲合计+-+36(a)24(b)60-10(c)135(d)145合计46159205配对四格表资料的实际数与理论数24(b)10(c)1717b+c<40且>20时:配对四格表资料的2检验步骤H0:两法检出阳性率相同,总体B=C;

H1:两法检出阳性率不同,总体B≠C。 =0.05。计算统计量:2=4.971。P<0.05按=0.05水准,拒绝H0

。认为两种方法的阳性率不同。阳性率相同,而非检验结果完全一致!+-+2060-6020精确概率法样本例数较少时还可以用精确概率法,原理同配对设计的符号检验。P=p(x≤k)+p(x≥n-k)注:n=b+ck=min(b,c)p(x)=上例中p=p(0)+…+P(5)+P(26)+…+P(31)=0.00019226.5多个率比较的2检验虫卵阴转率的比较药物阴转例数未阴转例数合计阴转率(%)复方敌百虫片2893775.7纯敌百虫片18203847.4灭虫灵10243429.4合计565310951.4例11理论数的计算19.0217.9819.5318.4717.4816.52实际数A理论数T

2893718203810243456(51.40%)53(48.60%)1092值的计算19.0217.9819.5318.4717.4816.52实际数A理论数T

289182010242值的计算289371820381024345653109多个率比较的2检验的过程H0:π1=π2=π3H1:三种方法阴转率不等或者不全相等

α=0.05ν=2×1=2P<0.05;按照0.05的检验水准拒绝H0,接受H1,差别有统计学意义,可认为三种方法阴转率不同或不全相等。自由度为2的2分布界值0.00.10.20.30.40.55.99=0.05多重比较Scheffe可信区间法两率之差的100(1-α)%可信区间为6.6构成比的比较例12组别ABOAB合计鼻咽癌336565100眼科病人5414525125合计872010810225鼻咽癌患者与眼科病人血型构成比较2值的计算2值的计算3365651005414525125872010810225构成比比较的2检验步骤H0:两组血型构成比相同;H1:两组血型构成比不同。 =0.05。计算统计量:2=5.710,v=3

。P>0.05按=0.05水准,不拒绝H0

。 尚不能认为两组血型构成比不同。R×C表的分析方法的条件条件:理论数不能小于1;理论数大于1小于5的格子数不超过总格子数的1/5。解决方法增加样本含量删除某行或某列合并部分行或列Fisher确切概率计算法定性资料假设检验的正确应用多个率或构成比的比较拒绝H0的含义;等级资料(有序分类资料)的比较应该考虑使用秩和检验ThankU两标准化率的比较例13试就下表资料分析比较甲、乙两医院乳腺癌手术后的5年生存率(%)。腋下淋巴结转移甲医院乙医院病例数生存数生存率(%)

病例数生存数生存率(%)无453577.7730021571.67有71045063.38834250.60合计75548564.2438325767.10甲、乙两医院乳腺癌手术后的标准化率腋下淋巴结转移标准病例数甲乙生存率预计生存数生存率预计生存数无34577.7726871.67247有79368.3854250.60401计1138-810-648标准化率为:甲P1’=810/1138=71.18%乙P2’=648/1138=56.94%

H0:两标准化率相等

H1:两标准化率不相等腋下淋巴结转移(1)病例数生存数合并生存率(%)pi(8)生存率差的方差(10-4)(9)标准病例数hi(10)(10)2×(9)hi2si2×

10-4甲nAi(2)乙nBi(3)计ni(4)甲dAi(5)乙dBi(6)计di(7)无453003453521525072.4651.00345607.03有710837934504249262.0431.697931992.82计755383113848525774211382599.85生存率之差的方差

两标准化率差别的方差s2

查表得p=0.00074,拒绝H0,认为……6.8高维列联表资料的统计分析

例14在婴儿营养和发育关系调查时,分别在月龄为9月、10月、11月及12月的婴儿中调查了发育好与发育差的两组儿童的副食品供给情况,得下列资料,试对发育与副食品供应的关系作分析。发育与副食品供应的关系月龄副食品供应好差计9月充足232043不足19315010月充足282048不足24305411月充足322254不足25305512月充足412162不足382058计充足12483207不足106111217试在排除了年龄因素影响后,分析副食品供应对发育的影响情况。分析:各年龄组发育差的比例是不等的,直接用简单合并栏的四格表资料计算不合理。也不可将每个年龄组的数据分别进行检验,然后将其结论综合,这样做往往会因为每个四格表的频数都很小,不宜得出显著性。要考虑发育与副食品供给之间的关系,需要对比数比(oddsratio,相对危险度的一种估计值)OR=1作假设检验,计算公共比数比及其可信区间。公共OR:OR的可信区间:H0:OR=1H1:OR≠1检验统计量计算χ2CMH的分子χ2CMH的分母χ2CMH=4.726df=1P<0.05说明副食品的供给不足对婴儿的发育有影响。OR的95%可信区间为综合结果分层OR95%CIχ2CMHP11.8760.8204.2932.2150.13721.7500.7983.8401.9420.16331.7450.8173.7292.0620.15141.0280.4832.1860.0050.944合计1.5641.0652.2995.2050.023调整1.5401.0432.2724.7260.030本例中还可对各层的OR是否齐性作检验(Breslow-Day齐性检验)χ2=1.534df=3p=0.675说明不同月龄的婴儿,副食品的供应对其发育的影响是一致的。6.9趋势性χ2检验

当暴露水平按多个等级分类时,经常需要检验是否存在剂量-反应关系,即随着暴露水平的升高,阳性率是否有增加或减少的趋势。注:趋势性χ2检验只适合于2行或2列的资料。例15一项心肌梗塞发生前饮酒的病例-对照研究结果如下,试分析每日饮酒量与心肌梗塞发生之间是否存在剂量反应关系。

心肌梗塞患者及对照者的每日饮酒量418391调查总数241130464220+2382021100+1101360200+对照数病例数饮酒量的等级每日饮酒量(ml)趋势性χ2检验的计算饮酒量200+100+0+0计病例(a)1362024211391(n1)对照1102384624418(n0)计(m)2464408835809(N)等级(z)0123az02028433319mz0440176105721mz204403523151107χ2=7.488P=0.006,说明饮酒量的多少与心肌梗塞有关。每日饮酒量与心肌梗塞发生之间存在剂量反应关系,饮酒量增加危险性增加。

STATISTICSFORTABLEOFIBYJCochran-ArmitageTrendTest

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论