分类变量的统计推断_第1页
分类变量的统计推断_第2页
分类变量的统计推断_第3页
分类变量的统计推断_第4页
分类变量的统计推断_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

分类变量的统计推断第1页,课件共58页,创作于2023年2月教学要求掌握率的抽样误差计算公式掌握四格表χ²检验第2页,课件共58页,创作于2023年2月3第一节

率的抽样误差一、二项分布的概念例:假设注射某种免疫疫苗会有10%的人出现不适反应。问3人接种后各种可能后果的概率是多少?第3页,课件共58页,创作于2023年2月4第4页,课件共58页,创作于2023年2月5贝努利试验:n次独立、重复试验(每次试验只出现A和之一,每次概率都是和)。贝努利试验中,事件A可能发生0,1,2,…,n次,A恰好发生k次的概率为第5页,课件共58页,创作于2023年2月6若随机变量X只能在中取值,各种可能值的概率满足前式,我们就说X服从参数为n和π的二项分布,记为第6页,课件共58页,创作于2023年2月7已知:①π=0.5,n=10;②π=0.3,n=5;③π=0.3,n=10;④π=0.3,n=15。根据上式,求各阳性数事件的概率并作概率分布图。第7页,课件共58页,创作于2023年2月8率的抽样分布特征:1.为离散型分布;2.当π=1-π时,呈对称分布;3.当n增大时,逐渐逼近正态分布。一般认为,当nπ和n(1-π)≥5时,可近似看作正态分布。第8页,课件共58页,创作于2023年2月9二、率的抽样误差和标准误由于抽样所引起的样本率和总体率或各样本率之间存在着差异,这种差异称为率的抽样误差。用率的标准误表示。第9页,课件共58页,创作于2023年2月10例:为了解某地人群结核菌素试验阳性率情况,某医疗机构在该地人群中随机检测了1773人,结核菌素试验阳性有682人,试计算其标准误。第10页,课件共58页,创作于2023年2月11第二节总体率的估计总体率的估计:点估计区间估计正态近似法第11页,课件共58页,创作于2023年2月12当样本含量n足够大,样本率p或1-p均不太小时(如np和n(1-p)均大于5),样本率的分布近似正态分布。第12页,课件共58页,创作于2023年2月1395%的置信区间:

38.47%1.961.16%=36.20%~40.74%99%的置信区间:

38.47%2.581.16%=35.48%~41.46%上例中该地人群中结核菌素试验阳性率95%和99%的置信区间为:第13页,课件共58页,创作于2023年2月14第三节率的U检验

当样本含量n足够大,样本率p或1-p均不太小时,如np和n(1-p)均大于5,样本率的分布近似正态分布。样本率和总体率之间、两个样本率之间的比较可用Z检验。第14页,课件共58页,创作于2023年2月15一、样本率与总体率的比较

第15页,课件共58页,创作于2023年2月16例:一般情况下,直肠癌围术期并发症发生率为30%,现某医院手术治疗了385例直肠癌患者,围术期出现并发症有100例,并发症发生率为26%,问该院直肠癌患者围术期并发症发生率与一般情况比较有无统计学差异。分析:本例,n=385,属于大样本,同时样本率为26%,np和n(1-p)均大于5,可采用Z检验。第16页,课件共58页,创作于2023年2月17建立检验假设

H0:=0,H1:0,=0.052.计算Z值3.确定P值,判断结果本题Z=1.713<1.96,P>0.05,按=0.05的水准不拒绝H0,差异没有统计学意义,故尚不能认为该院直肠癌患者围术期并发症发生率与一般情况不同。第17页,课件共58页,创作于2023年2月18二、两个样本率的比较第18页,课件共58页,创作于2023年2月19例:为了解某地小学生蛔虫感染率的城乡差异,抽样调查了该地小学生22792人,其中城镇小学生8207人,粪检蛔虫卵阳性数为701人,蛔虫感染率为8.54%,乡村小学生14585人,粪检蛔虫卵阳性数为2167人,蛔虫感染率为14.86%,试比较该地小学生蛔虫感染率城乡差异有无统计学意义。第19页,课件共58页,创作于2023年2月20本题=13.739>2.58,P<0.01,按=0.05的水准拒绝H0,接受H1,差异有统计学意义,认为该地乡村小学生蛔虫感染率高于城镇。

3.确定P值,判断结果建立检验假设

H0:1=2,H1:12,=0.052.计算Z值第20页,课件共58页,创作于2023年2月不同自由度的分布曲线图自由度一定时,P值越小,χ²界值越大P值一定时,自由度越大,χ²界值越大当自由度为1时,χ²=u²第21页,课件共58页,创作于2023年2月例:某医院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞米松(对照组)降低颅内压的疗效。问两组降低颅内压的总体有效率有无差别?第二节卡方检验一、四格表资料卡方检验第22页,课件共58页,创作于2023年2月200例颅内压增高症患者随机分为两组1试验组有效2试验组无效3对照组无效……200试验组有效第23页,课件共58页,创作于2023年2月组别有效无效试验组

对照组

两组降低颅内压疗效的比较两种可能性:两组总体有效率确实不同两组总体有效率相同,两组样本率的差异仅仅是由于抽样误差造成。9957521合计10496有效率(%)95.2078.13第24页,课件共58页,创作于2023年2月

1、建立检验假设,确定检验水准,两组降低颅内压总体有效率相等,两组降低颅内压总体有效率不等第25页,课件共58页,创作于2023年2月(83.52)(理论频数T12?)(90.48)实际频数A(13.52)(理论频数T22?)(理论频数T21?)(理论频数T11?)组别有效无效合计有效率(%)试验组995

10495.20对照组7521

9678.13合计

表7-1两组降低颅内压有效率的比较17487.0020026(12.48)理论频数

是在

成立的前提下计算的第26页,课件共58页,创作于2023年2月A:实际频数(Actualfrequency)

T:理论频数(Theoreticalfrequency)英国统计学家KarlPearson首次提出,故被称为Pearson

。第27页,课件共58页,创作于2023年2月2、求检验统计量和自由度99(90.48)5(13.52)75(83.52)21(12.48)第28页,课件共58页,创作于2023年2月3、查表,求

值,下结论。

以查附表8界值表得。按检验水准拒绝,接受,认为两组总体有效率不等。P第29页,课件共58页,创作于2023年2月A与T相差不大A与T相差太大第30页,课件共58页,创作于2023年2月第31页,课件共58页,创作于2023年2月第32页,课件共58页,创作于2023年2月

基本公式或专用公式;校正公式;Fisher确切概率法。四格表资料检验公式选择第33页,课件共58页,创作于2023年2月校正公式(Yates校正)第34页,课件共58页,创作于2023年2月两种药物治疗脑血管疾病有效率的比较

(4.67)组别有效无效

合计有效率(%)胞磷胆碱组4665288.46神经节苷酯组1882669.23合计64147882.05第35页,课件共58页,创作于2023年2月

(两种药物治疗脑血管疾病的有效率相等)(两种药物治疗脑血管疾病的有效率不等)

第36页,课件共58页,创作于2023年2月二、配对四格表资料的检验(McNemar检验)配对设计是指将实验单位按一定条件配成对子,再将每对中的两个实验单位随机分配到两个处理组。②同一个体同时分别接受两种不同处理①配成对子的两个个体分别给予两种不同的处理第37页,课件共58页,创作于2023年2月例:某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统红斑狼疮患者血清中抗核抗体进行测定。目的是推断两种方法的检测结果有无差别。第38页,课件共58页,创作于2023年2月成组设计1乳胶凝集法+2免疫荧光法-58乳胶凝集法+……组别+-乳胶凝集法免疫荧光法第39页,课件共58页,创作于2023年2月配对设计第1人乳胶凝集法+第2人免疫荧光法-第3人+……+--第58人-+第40页,课件共58页,创作于2023年2月免疫荧光法乳胶凝集法合计+-+-合计11(a)1223233(d)3513(c)(b)(b)(c)4558两种方法的检测结果

B=C?第41页,课件共58页,创作于2023年2月在检验假设H0为总体对子数B=C的条件下:(+,-)和(-,+)两个格子的理论频数为第42页,课件共58页,创作于2023年2月第43页,课件共58页,创作于2023年2月本例

(b+c)=14<40,应采用校正公式P<0.05,拒绝H0,接受H1,可以认为两种方法的检测结果不同,免疫荧光法的阳性检测率较高。H0:B=C,即两种方法的总体检测结果相同H1:B≠C,即两种方法的总体检测结果不同假设检验第44页,课件共58页,创作于2023年2月第五节R×C列联表的χ²检验第45页,课件共58页,创作于2023年2月46行×列表资料①

多个样本率比较时,有R行2列,称为R×2表;②

两个样本的构成比比较时,有2行C列,称2×C表;③

多个样本的构成比比较,以及双向无序分类资料关联性检验时,有行列,称为R×C表。第46页,课件共58页,创作于2023年2月甲、乙、丙三家医院住院病人院内感染率比较第47页,课件共58页,创作于2023年2月第48页,课件共58页,创作于2023年2月49检验统计量

=(R-1)(C-1)第49页,课件共58页,创作于2023年2月甲、乙、丙三家医院住院病人院内感染率比较第50页,课件共58页,创作于2023年2月51H0

:三家医院院内感染率相同H1

:三家医院院内感染率不同或不全相同=0.05=(3-1)(2-1)=2,查2值表,20.01(2)=9.21,

2>20.01(2),

P<0.01,按=0.05的检验水准,拒绝H0,接受H1,故可认为甲、乙、丙三家医院院内感染率总体有差别。第51页,课件共58页,创作于2023年2月一般要求:增大样本含量删去理论频数太小的行或列将理论频数太小的行或列与性质相近的邻行或邻列合并改用Fisher确切概率法处理方法:1、行×列表中各格理论频数不宜过小且1≤T<5的格子数不宜超过1/5格子总数

各格T≥1第52页,课件共58页,创作于2023年2月5215214935493549355212、对于有序的表资料不宜用检验组别痊愈显效无效试验组50对照组40两组降低颅内压疗效的比较

单向有序(指标有序)第53页,课件共58页,创作于2023年2月不同年龄组某药降压效果

年龄组合计有效无效20~2242

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论