定性的统计分析.ppt_第1页
定性的统计分析.ppt_第2页
定性的统计分析.ppt_第3页
定性的统计分析.ppt_第4页
定性的统计分析.ppt_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学,定性资料的统计分析statisticalanalysisforqualitativedata,主要内容,二项分布简介总体率的可信区间估计Poisson分布简介总体事件数的可信区间估计样本率与总体率的比较两样本率比较的u检验四格表资料的2检验行列表资料的2检验确切概率法两事件数的比较卡方检验应用的注意事项,第一节二项分布简介,二项分布的基本概念,在医学研究中常常碰到一些情况,其结局只有两种互相对立的结果。每个个体的观察结果只能取其中之一。毒理试验中,动物的生存与死亡;动物诱癌试验中,动物的发癌与不发癌;流行病学观察中,个体发病与不发病;在临床治疗中,病人的治愈与未愈;理化检验结果的阴性与阳性等等。常用二项分布(binomialdistribution)来描述其概率分布。,例、设小白鼠接受某种毒物一定剂量时,其死亡率为=80,则对于每只小白鼠而言,其死亡概率为=0.8,生存概率为1-=0.2。若每组各用三只小白鼠(分别计为甲、乙、丙),对每只鼠独立做实验,故各鼠的实验结果(生存或死亡)是互不影响的。观察每组小白鼠存亡情况,如果计算生与死的顺序,则共有8种排列方式;如果只计生存与死亡的数目,则只有4种组合方式。,概率的乘法法则:几个独立事件同时发生的概率,等于各独立事件的概率之积。概率的加法法则:互不相容事件和的概率等于各事件的概率之和。,三只小白鼠存亡的排列和组合方式及其概率的计算,(0.2+0.8)3=(0.2)3+3(0.2)2(0.8)+3(0.2)(0.8)2+(0.8)3三生二生一死一生二死三死,为总体阳性率;n为样本例数;X为样本阳性数;CnX为从n个中抽X个的组合数,其计算公式为:式中“!”为阶乘符号,n!=1234n,并约定0!=1。,可见,二项式展开式中的各项就是对应于各死亡数(X)的概率P(X),二项分布由此得名。因此,从阳性率为的总体中随机抽取含量为n的样本,恰有X例阳性的概率为:X=0,1,2,n则称X服从参数为n和的二项分布,记为:XB(n,)。其中参数n由实验者确定,而总体率常常是未知的。,例、已知n=3,=0.8,则恰有例阳性的概率P(1)为:,二项分布的均数与标准差,若XB(n,),则阳性数X的总体均数及其标准差为:,若均数与标准差不用绝对数X而用率p表示时,即对以上两式分别除以n:,样本率的标准差又称为率的标准误。,二项分布的累计概率,常用的有左侧累计和右侧累计两种方法。从阳性率为的总体中随机抽取n个个体,则:1、最多有k例阳性的概率:2、最少有k例阳性的概率:,例1、据以往经验,用某药治疗小儿上呼吸道感染、支气管炎,有效率为85,今有5个患者用该药治疗,问:至少3人有效的概率为多少?最多1人有效的概率为多少?本例=0.85,l-=0.15,n=5,依题意,至少3人有效的概率:P(X3)=P(3)+P(4)+P(5)=0.1381781250.3915046880.443705313=0.973388126最多1人有效的概率为:P(X1),例2、经统计,某省用“中药阑尾炎合剂”治疗急性阑尾炎性腹膜炎的有效率为86%,试分别估计:治疗10例中至少9例有效的概率;治疗10例中至多7例有效的概率。本例=0.86,1-=0.14,n=10,依题意,治疗10例中至少9例有效的概率:治疗10例中至多7例有效的概率:,二项分布的图形,在实际应用中,n足够大,且不太大也不太小,即既不接近于0也不接近于1时,常可用正态近似原理处理二项分布的问题。,二项分布的应用条件,二分类资料对立结果发生的概率合计为1观察结果相互独立,第二节总体率的可信区间估计,与均数一样,样本率也存在着抽样误差。样本率的标准差又称为率的标准误为:,一、正态近似法,当n较大、且p不太大也不太小时(常可通过np与n(1-p)均大于5来判断),样本率p的抽样分布近似服从正态分布。可利用正态分布原理来估计总体率的可信区间。可信度为1-的可信区间为:(p-uSp,p+uSp),缩写为:puSp式中,u为可信度为1-时的u界值。可信度为95%时,u=1.96可信度为99%时,u=2.58。,例1、从某地人群中随机抽取144人,检查乙型肝炎表面抗原携带状况,阳性率为9.20,求该地人群的乙型肝炎表面抗原阳性率的95可信区间。本例n=144,p=9.20,可用近似正态法计算可信区间。95可信限为:9.20%1.962.41%,即该地人群的乙型肝炎表面抗原阳性率的95可信区间为:4.48%13.92%。,例2、某医院用复方当归注射液静脉滴注治疗脑动脉硬化症188例,其中显效83例,试估计复方当归注射液显效率的99可信区间。本例n=188,p=83/1880.4415,np与n(1-p)均大于5,可用近似正态法计算可信区间。99可信区间为:0.44152.580.036,即复方当归注射液显效率的99可信区间为:34.86%53.44%。,二、查表法,当n50,p很接近0或1时,样本率p的抽样分布不再近似服从正态分布。样本资料呈二项分布。由于用二项分布法估计总体率的可信区间,计算复杂,故可使用查表法。查阅附表6,求得总体率的95%和99%可信区间。,例、有人调查29名非吸毒妇女,出狱时有1名HIV(人免疫缺陷病毒)阳性,该研究者报导,阳性率为3.4%,用正态近似法计算其95可信区间为:-3.1%10.0%。阳性率不可能小于0。查表法,其95可信区间为:0.1%17.8%。,第三节Poisson分布简介,Poisson分布的基本概念,对单位时间、单位空间内某独立罕见事件发生数的研究每升水中大肠菌群数的分布粉尘在单位容积内计数的分布放射性物质在单位时间内放射出质点数的分布单位空间中某些野生动物或昆虫数的分布每天交通事故发生数的分布人群中某种患病率很低的非传染性疾病患病数或死亡数的分布用Poisson分布来描述其概率分布。,如某事件的发生完全随机,则单位时间或单位空间内事件发生数的概率为:该事件的发生服从参数为的Poisson分布,记为XPoisson()。是Poisson分布的总体均数,X为罕见事件发生数,P(X)为事件数为X时发生概率,e为自然对数的底2.7183。,Poisson分布例,2019年韩日世界杯64场比赛中,各队进球数有多有少。大部分是0,1,2个进球,个别队是5个以上进球,最多的是8个进球,平均是1.2578个/场/队。虽然强队大都能进球、赢球(如巴西队),弱队大都不能进球(如中国队)。但宏观上来说,各队进球数服从Poisson分布!,平均计数为1.2578的Poisson分布,每场各队进球数场次理论数03736.3914745.7722728.7831312.07423.79510.95610.25128128.00,Poisson分布的均数与方差,Poisson分布的总体方差2与总体均数相等:2=参数表示单位空间或时间内事件平均发生的次数,又称强度参数。,Poisson分布的累计概率,常用的有左侧累计和右侧累计两种方法。单位空间或时间内事件发生的次数:1、最多为k次的概率:2、最少为k次的概率:,Poisson分布的图形,Poisson分布为正偏态分布越小,分布越偏随着的增大,分布逐渐趋于对称当=20时已基本接近对称分布当=50时,Poisson分布近似正态分布在实际工作中,当50时可按正态分布原理处理相关的问题。,Poisson分布具有可加性,以较小的度量单位观察某现象,如果发生数呈Poisson分布,那么将若干个小单位合并为一个大单位后,其总计数也呈Poisson分布。例、已知某放射性物质每10分钟放射脉冲数呈Poisson分布,5次测量的结果,分别为35、34、36、38、34次。将5个10分钟的放射脉冲数合计为50分钟放射脉冲数(总计为177次)也呈Poisson分布。对于Poisson分布资料往往可以利用其可加性的特性使50,然后用正态近似法处理。,Poisson分布是二项分布的极限形式,在二项分布中,当很小时(5同时n(1-p)5为界限,符合此条件者即可用正态近似检验。统计量u的计算为:当n和p不符合上述条件时,可利用二项分布原理直接计算其概率,根据是否小概率事件来推断;或计算率的可信区间,是否包含已知总体率来推断。,一、正态近似法,当np5同时n(1-p)5时,可用正态近似检验。例、据临床经验,一般的胃溃疡病患者有20会出现胃出血症状。某医院观察了304例65岁的胃溃疡病患者,其中有96例发生胃出血,占31.58,问老年患者是否较一般患者易出血?,例2、从某地人群中随机抽取144人,检查乙型肝炎表面抗原携带状况,阳性率为9.20,而正常人群的乙型肝炎表面抗原阳性率为1.20,能否认为该地人群为高危人群?,二、直接计算概率法,当n和p不符合上述条件时,可利用二项分布原理直接计算其概率。依据小概率事件原理,作出统计推断。例、一种鸭通常感染某种传染病的概率为0.2,现将某种药物注射到25只鸭后发现有1只鸭发生感染,试判断这种药物对预防感染是否有效。,例、18世纪天花在人群中的自然感染率高达90%。1798年英国医生琴纳对23名志愿者作接种牛痘免疫实验,发现这23人接触天花病毒后无一感染。推断牛痘疫苗是否有预防天花的作用。,第六节两样本率比较的u检验,两样本率比较的u检验,两个样本率比较的目的是推断两个样本率各自所代表的总体率是否相等。检验方法可用u检验和2检验。当n较大且p不接近于0也不接近于1时,可根据二项分布的正态近似原理,利用两样本u检验方法计算检验统计量。,式中p1、p2分别为两样本率;n1、n2分别为两样本例数;pc为合并率;分母部分常记为:Sp1-p2,是两样本率之差(p1-p2)的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论