第7章 两分类资料的统计描述与推断课件_第1页
第7章 两分类资料的统计描述与推断课件_第2页
第7章 两分类资料的统计描述与推断课件_第3页
第7章 两分类资料的统计描述与推断课件_第4页
第7章 两分类资料的统计描述与推断课件_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章两分类资料的统计描述与推断

第7章两分类资料的统计描述与推断基本概念实验设计计量资料计数资料等级资料描述统计参数估计假设检验两组均数T检验多组均数方差分析两变量之间相关与回归两分类变量统计描述与推断第7章两分类资料的统计描述与推断目录第一节常用相对数及动态数列第二节率的标准化第三节二项分布和Poisson分布(略)第四节总体率的置信区间第五节样本率与总体率的比较第六节两样本比较的z检验第7章两分类资料的统计描述与推断第一节常用相对数、动态数列绝对数构成比率第7章两分类资料的统计描述与推断分类资料的统计描述,除用频数分布表和频数分布图外,常使用绝对数和一些表现为相对数的统计指标。绝对数即实际频数,如某病的出院人数、治愈人数、死亡人数等。Why?——绝对数通常不具有可比性:1、如甲、乙两个医院某病出院人数不同时,比较两医院该病的死亡人数没有意义2、如11级七年制一、二大班学生人数不同时,比较两班医学统计学的及格人数没有意义因此需要在绝对数的基础上计算相对数。第一节常用相对数、动态数列第7章两分类资料的统计描述与推断第一节常用相对数、动态数列相对数(relativenumber)是两个有联系的指标之比。常用的相对数:相对比构成比率第7章两分类资料的统计描述与推断相对比相对比(relativeratio)是两个有关指标之比,说明两者的对比水平。对比的数值可以是绝对数、相对数或平均数,可以性质相同,也可以是性质不相同。例如,性别比=女性人口数÷男性人口数;又如,医院逐年门诊量的发展速度=后一年门诊量/前一年门诊量第7章两分类资料的统计描述与推断构成比(constituentratio)又称构成指标,说明某事物内部各组成部分在总体中所占的比重或分布。常以百分数表示,即通常以100%为比例基数。其计算公式(7-1)如下:构成比第7章两分类资料的统计描述与推断

设某事物个体数的合计由A1,A2,·

·

·,Ak个部分组成,构成比的计算为:

…..…….构成比第7章两分类资料的统计描述与推断特点:①同一事物内部各构成比之和必为100%;②任一部分比重改变会影响其他部分。例如,表7-1第⑥列,是由第③列数据算得的构成比,其中“0~”年龄组患者占总数的比重为(501/1064)×100%=45.05%,依次可求出其他年龄组所占比重。构成比第7章两分类资料的统计描述与推断率(frequency)又称频率指标,说明一定条件下某现象发生的频率或强度。常用π表示总体率,用P表示样本率。计算公式(7-2)为:

率第7章两分类资料的统计描述与推断式中比例基数,可以取100%、1000‰、10万/10万…等。比例基数的选择主要根据习惯用法和使计算的结果能保留1~2位整数,以便阅读。例如患病率通常用百分率、婴儿死亡率用千分率、肿瘤死亡率以十万分率表示。率第7章两分类资料的统计描述与推断如表7-1中,“0~”年龄组患者为501人,调查人数90319人,则“0~”年龄组患病率=(501/90319)x100%=5.55%,余仿此。可见,各年龄组患病率的水平不受其他年龄组患病率大小影响,各年龄组患病率相加无意义。率第7章两分类资料的统计描述与推断率当式7-2中的分子、分母与观察期限有关时,计算的是某时期内某事件发生的频率,称为率(rate)。率的特点:①分母的每个个体都可能成为分子;②某一分率改变对其他无影响;③分率一般不能直接相加第7章两分类资料的统计描述与推断率的标准误率的标准误(standarderrorofrate)类似于均数的抽样误差,在抽样研究中所获得的样本率P与总体率π也存着率的抽样误差。表示率抽样误差大小的统计指标称为率的标准误。P的总体标准误记为σP

。由于总体率和率的标准误一般未知,常用样本率P来估计总体率π,用样本率的标准误sP来估计σP

。第7章两分类资料的统计描述与推断率的标准误一般来说,用样本率P来估计总体率π时,n至少应大于30。率的标准误是衡量样本率稳定性和可靠性的统计指标,它反应率的抽样误差大小。率的标准误越小,表示率的抽样误差越小,用以估计总体率的可靠性就越大。反之,如果率的标准误越大,则由样本率估计总体率的可靠性越小。第7章两分类资料的统计描述与推断应用相对数时应注意的问题(1)计算相对数的分母不宜过小。如某医师用川红溶液治疗4例突发性耳聋患者,2例有效,报道有效率为50%,这显然是不可靠的。例数较少时,宜用绝对数表示。在必须用相对数时,应同时列出其置信区间。但动物实验因可周密设计,严格控制实验条件,例如有的毒理实验,每组用10只小白鼠也可以观察反应率或死亡率。(2)构成比和率不能相互混淆。例如,表7-1的第⑥列,只能说明各年龄组所占的比重,而不能说明各年龄组的患病率。如果仅以"0~”岁组在各年龄组1064个患者中占45.05%最高,就说“0~岁组患病率最高”,这就是“以比代率”,“比”、“率”误用了。(3)进行率的对比分析时,应注意资料有可比性。除了被研究的因素之外,其余可能影响指标的重要因素应控制在“齐同对比”的条件下。若两组分类资料的诊断标准或疗效判断标准不一致,则组间缺乏可比性;若两组资料内部构成(如病人的性别、年龄、病程及病情等)缺乏齐同性,两个总率也不能直接进行比较,只宜比较各小组率,如要作总率比较,可计算标准化率(见本章第七节)。第7章两分类资料的统计描述与推断第二节

率的标准化当比较的两组或多组资料,其内部各小组率明显不同,且各小组观察例数的构成比,诸如年龄、性别、工龄、病情轻重、病程长短等也明显不同时,直接比较两个或多个合计率是不合理的。因为其内部构成不同,往往影响合计率大小。

第7章两分类资料的统计描述与推断为什么?第7章两分类资料的统计描述与推断【例7-18】两种疗法资料如表7-4,重、中、轻三种病情程度均为甲疗法治愈率低于乙疗法,但合计项中却反而乙疗法低于甲疗法。如不考虑内部构成直接用“甲疗法210例中治愈164例,乙疗法180例中治愈127例”,进行两样本率比较,就会产生错误结论。甲、乙两疗法重、中、轻病人的分配上相差较大,说明实验设计不妥。在这种情况下,宜分别比较各构成率,不宜比较合计率。本例可以分别比较重、中、轻三病情的两法治愈率。如果需要比较合计率,可用标准化法(standardization)消除比较组内部构成不同的影响。标准化法是在同一个标准构成条件下进行率的对比的方法,常用于不同地区人口的死亡率、生育率;不同工龄、工种及不同职业人群的患病率;不同病情轻重、病程长短的治愈率、生存率等方面的比较。第7章两分类资料的统计描述与推断标准化法的基本思想

要正确比较两种疗法的合计治愈率,必须先将两组治疗对象的病型构成按照统一标准进行校正,然后计算出校正后的标准化病死率再进行比较。这种用统一的内部构成,然后计算标准化率的方法,称为标准化法。标准化法的基本思想是:采用某影响因素的统一标准构成以消除构成不同对合计率的影响,使通过标准化后的标准化合计率具有可比性。

第7章两分类资料的统计描述与推断标准化方法的选择1、直接法2、间接法根据已有资料的条件,采用不同的方法计算标准化率。如对死亡率的年龄构成标准化,若已知年龄别死亡率,可采用直接法;若只有总死亡数和年龄别人口数而缺乏年龄别死亡率时,或各年龄组人口数较小,年龄别死亡率不稳定时,宜用间接法。第7章两分类资料的统计描述与推断标准化率的直接计算法先选定一个“标准”,将被比较的各组按“标准”分别计算出标准化指标,即标准化率(standardizedrate)或称调整率(adjustedrate),以便用两个标准化率进行率的显著性检验,得出用两个合计率比较的结论。第7章两分类资料的统计描述与推断计算步骤1)选定一个共同的“标准”,将两疗法各构成合并的数据作标准,见表7-5第②列。2)接着分别计算两疗法各构成的期望治愈数,见表7-5第④、⑥列。

3)分别计算两种疗法的标准化治愈率。结论:甲疗法标准化治愈率低于乙疗法,与各病情治愈率比较的结果一致。第7章两分类资料的统计描述与推断应用标准化法应注意的问题

(1)标准化法只适用于因比较组内部构成不同可能影响总率比较的情况,对于其他条件不同产生的可比性问题,标准化法不能解决。(2)共同标准的选择。标准化率随选的共同标准不同,所得的数据也不同。多组资料比较时,宜选用具有代表性、较稳定的、数量较大的人群为共同标准(如全国、全省或本地区通用的人口构成标准等),或以各组资料合并后的数据作为共同标准。(3)计算标准化率的目的,是为了进行合理的比较,标准化率不是实际的水平。(4)由于存在抽样误差,如需比较两个样本标准化率,须作假设检验。第7章两分类资料的统计描述与推断动态数列

动态数列(dynamicseries)亦称时间数列。它是一系列按时间顺序排列起来的统计指标(包括绝对数、相对数或平均数),用以观察和比较同一事物在时间上的变化和发展趋势。常用的动态数列指标有:增长量、发展速度、增长速度、平均发展速度、平均增长速度。第7章两分类资料的统计描述与推断动态数列第7章两分类资料的统计描述与推断动态数列平均发展速度是某时期内各环比发展速度的几何均数。平均增长速度是平均发展速度的净增长量。两者都是动态平均指标,用于概括某一时期的速度变化。计算公式分别为:平均发展速度=(7-11)式中a0为基期指标;an为第n年(或其他计时)指标。平均增长速度=平均发展速度-1(7-12)如表7-6资料某省中医院1995年~2005年门诊量为平均发展速度==1.003=100.3%平均增长速度=平均发展速度-1=1.0030-1=0.0030=3.0%。根据平均发展速度的计算公式(7-11)推导出n年后达到的目标计算公式为:

an=a0×(平均发展速度)n

(7-13)第7章两分类资料的统计描述与推断第三节二项分布和Poisson分布二项分布(binomialdistribution)是一种重要的离散型分布。应用条件:①各观察单位的结果只能是相互对立的两种情况之一,例如,疗效为有效或无效,化验结果为阳性或阴性等等,二者中必居其一,且仅居其一;②已知某一结果(记为A)发生的概率(记为π,π在这里不是圆周率!),另一结果(记为)发生的概率为(1-π);③n个观察单位的观察结果相互独立(称为n次独立重复试验),即任一观察单位的结果不会影响其他观察单位的结果。第7章两分类资料的统计描述与推断二项分布在医学中类似如这种n重Bernoulli试验的情形较为常见。如用某种药物治疗某种疾病,其疗效分为有效或无效;在动物的致死性试验中,动物的死亡或生存;接触某种病毒性疾病的传播媒介后,感染或非感染等。第7章两分类资料的统计描述与推断二项分布若从阳性率(死亡率、感染率等)为π的总体中随机抽取大小为n的样本,则出现阳性数为X的概率分布即呈二项分布,记为X~B(n,π).第7章两分类资料的统计描述与推断二项分布在n次独立重复试验中,若事件A发生的次数X是一个随机变量,可能取值为0,1,2,…,n,且X=k的概率为:则称随机变量X服从参数为n和π的二项分布,常记为X~B(n,π)n为试验次数;Cnk为从n个不同元素取k个元素的组合种数:Cnk

=n!/[k!(n一k)!]

一般用大样本(医学研究的分类资料至少要>30例,一般>100例为大样本)的样本率P来估计总体率π。第7章两分类资料的统计描述与推断二项分布第7章两分类资料的统计描述与推断二项分布第7章两分类资料的统计描述与推断【例7-5】某疗法治痹症的治愈率π=60%,用该疗法治疗痹症三例(n=3),治愈例数k(k=0,1,2,3)的情况如表7-3。第7章两分类资料的统计描述与推断【例7-6】据报道,10%的人对某药有肠道反应。为考察此药,任选服用此药的5人。因5人服药有肠道反应的人数服从二项分布:

(1)若报道属实,则无人有肠道反应的概率P5(0)=C50×0.10×0.95-0=0.5905。(2)若试验结果有多于2人出现肠道反应,因为概率0.0086很小,说明多于2人出现肠道反应的可能性很小。如果多于2人出现肠道反应发生了,则可以认为10%的人有肠道反应的报道是值得怀疑的。第7章两分类资料的统计描述与推断第四节总体率的置信区间

样本率P是总体率π的点估计,与总体均数的估计一样,由于样本率P与总体率π之间存在抽样误差,除了点估计以外,常需根据样本率P推算总体率π以一定的概率所在的范围,即总体率π的置信区间。下面介绍用查表法和正态近似法求总体率π的置信区间。第7章两分类资料的统计描述与推断1.查表法二项分布资料:总体阳性发生率为π时,在n次独立重复试验中,阳性的发生次数X是一个服从二项分布的变量。求总体率π的1-α置信区间,是求满足P(π1<π<π2)=l-α的π1、π2,据此,统计学家编制了二项分布资料总体率的置信区间表,当样本例数小时,可直接查总体百分率π的95%或99%置信区间(本书附表5录用到n≤34)。第7章两分类资料的统计描述与推断【例7-8】【例7-8】用某法矫治15只近视眼,其中10名有效,求其总体有效率的95%置信区间。以x=10,n-x=5查附表5,得该法矫治近视眼总体有效率的95%置信区间为38%~88%。第7章两分类资料的统计描述与推断2.正态近似法(1)二项分布资料:当每次抽取的样本含量n不是太小时,样本率的分布亦近似正态分布,因此,可用正态近似法,总体率π的双侧(1-α)置信区间公式为:式中p为样本率,sp为率的标准误,Zα/2为标准正态分布双侧α水准下的界值。N比较小时,不能用正态近似法求总体率的置信区间。例如,在n=2,p=50%时,sp

=35.35,1.96sp

=1.96×35.35%=69.29%,p±1.96sp已经超过0%~100%了。第7章两分类资料的统计描述与推断【例7-10】用中药与针灸治疗石淋病160例,有效81例,计算得到p=50.63%,sp

=3.95%。估计总体有效率π的95%置信区间为:

P±1.96sp

=50.63%±1.96×3.95%=42.9%~58.3%第7章两分类资料的统计描述与推断第五节样本率与总体率的比较

样本率与总体率比较的目的是推断样本所代表的未知总体率与已知总体率是否相等。小样本时,用概率函数计算P值;大样本时,可用Z检验。第7章两分类资料的统计描述与推断1.利用概率函数计算P值【例7-12】用某中药单方治疗某病,治愈率π=60%,未愈率40%。今用某中药复方治疗该病15人,结果有1人未愈,该复方疗效是否较单方好?H0:复方疗效=单方疗效(π=60%);H1:复方疗效较单方为好(π>60%)。α=0.01P15(未愈1人)=15×(0.40)1×(0.60)14=0.004702按α=0.01水准拒绝H0,接受H1,可以认为中药复方治疗该病较单方为好。第7章两分类资料的统计描述与推断【SPSS操作】1、输入数据以治疗效果(标签值1=治愈,2=未愈)、例数为变量名,建立数据文件L7-12.sav如图7-4。第7章两分类资料的统计描述与推断2、数据频数加权→Data→weightcases第7章两分类资料的统计描述与推断二项分布检验→Analyze→NonparametricTests(非参数检验),→Binomial(二项分布检验),将“治疗效果”选入TestvariableList(检验变量)框中,因题给治愈率π=60%,在TestProportion0.5(检验概率,系统默认为0.5)框中键入0.60代替系统默认值0.5;在DefineDichotomy(定义二分值)框中用⊙Getfromdata(设定的变量只有两个取值,直接从原始数据中读取。系统默认),→OK。第7章两分类资料的统计描述与推断输出结果二项分布检验见图7-5,复方的样本治愈率为0.9,单侧精确概率为0.005。拒绝H0,可认为中药复方疗效较单方为好。第7章两分类资料的统计描述与推断2.z检验二项分布资料:当n足够大,π或(1-π)均不太靠近0或1,且nπ与n(1-π)均大于5时,二项分布接近正态分布,故二项分布资料的样本率与总体率比较可用Z检验:式中x为阳性频数;π0为已知总体率;n为样本含量。若不用绝对数表示,改用率表示时,将上式的分子、分母同时除以n:第7章两分类资料的统计描述与推断【例

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论