版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
8.3.2独立性检验分类变量X和Y的抽样数据的2×2列联表:2×2列联表给出成对分类变量数据的交叉分类频数n=a+b+c+db+da+c合计c+ddcX=1a+bbaX=0Y=1Y=0合计YX
2×2列联表的概念
按研究问题的需要,将数据分类统计,并做成表格加以保存,这种形式的数据统计表称为列联表。它包含了X和Y的如下信息:最后一行的前两个数分别是事件{Y=0}和{Y=1}中样本点的个数;最后一列的前两个数分别是事件{X=0}和{X=1}中样本点的个数;中间的四个格中的数是表格的核心部分,给出了事件{X=x,Y=y}(x,y=0,1)中样本点的个数;右下角格中的数是样本空间中样本点的总数。复习巩固两个分类变量之间关联关系的定性分析的方法:
(2)图形分析法:与表格相比,图形更能直观地反映出两个分类变量间是否互相影响,常用等高堆积条形图展示列联表数据的频率特征.将列联表中的数据用高度相同的两个条形图表示出来,其中两列的数据分别对应不同的颜色,这就是等高堆积条形图.复习巩固
“两校学生的数学成绩优秀率存在差异”这个结论是根据两个频率间存在差异推断出来的.有可能出现这种情况:在随机抽取的这个样本中,两个频率间确实存在差异,但两校学生的数学成绩优秀率实际上是没有差别的.
对于随机样本而言,因为频率具有随机性,频率与概率之间存在误差,所以我们的推断可能犯错误,而且在样本容量较小时,犯错误的可能性会较大.
因此,需要找到一种更为合理的推断方法,同时也希望能对出现错误推断的概率有一定的控制或估算.独立性检验引入新课1.零假设(原假设)H0
:用概率语言,可将零假设改述为H0:分类变量X和Y独立
设X和Y是定义在Ω上,取值于{0,1}的成对分类变量。判断下面的假设关系H0:P(Y=1ΙX=0)=P(Y=1ΙX=1)是否成立,通常称为零假设或原假设。P(Y=1ΙX=0)表示从{X=0}中随机选取一个样本点,该样本点属于{X=0,Y=1}的概率;P(Y=1ΙX=1)表示从{X=1}中随机选取一个样本点,该样本点属于{X=1,Y=1}的概率;学习新知2.独立性检验公式及定义:
假定我们通过简单随机抽样得到了X和Y的抽样数据列联表,在列联表中,如果零假设H0成立,则应满足
,即ad-bc≈0.因此|ad−bc|越小,说明两个分类变量之间关系越弱;|ad−bc|越大,说明两个分类变量之间关系越强.
2=χ为了使不同样本容量的数据有统一的评判标准,基于上述分析,我们构造一个随机变量学习新知2=χ
用χ2取值的大小作为判断零假设H0是否成立的依据,当它比较大时推断H0不成立,否则认为H0成立。这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.独立性检验3.临界值的定义:对于任何小概率值α,可以找到相应的正实数xα,使得P(χ2≥xα)=α成立,我们称xα为α的临界值,这个临界值可作为判断χ2大小的标准,概率值α越小,临界值xα越大.χ2独立性检验中几个常用的小概率值和相应的临界值.10.8287.8796.6353.8412.706xα0.0010.0050.010.050.1α
学习新知4.基于小概率值α的检验规则:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.学习新知例2:依据小概率值α=0.1的χ2独立性检验,分析例1中的抽样数据,能否据此推断两校学生的数学成绩优秀率有差异?解:零假设为H0:分类变量X与Y相互独立,即两校学生的数学成绩优秀率无差异.因为2=χ<计算得到:根据小概率值α=0.1的χ2独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为两校的数学成绩优秀率没有差异.例题分析思考:例1和例2都是基于同一组数据的分析,但却得出了不同的结论,你能说明其中的原因吗?
例1只是根据一个样本的两个频率间存在差异得出两校学生数学成绩优秀率有差异的结论,并没有考虑由样本随机性可能导致的错误,所以那里的推断依据不太充分,在本例中,我们用χ2独立性检验对零假设H0进行了检验,通过计算,发现χ2≈0.837小于α=0.1所对应的临界值2.706,因此认为没有充分证据推断H0不成立,所以接受H0,推断出两校学生的数学优秀率没有显著差异的结论,
这个检验结果意味着,抽样数据中两个频率的差异很有可能是由样本随机性导致的,因此,只根据频率的差异得出两校学生的数学成绩优秀率有差异的结论是不可靠的。
由此可见,相对于简单比较两个频率的推断,用χ2独立性检验得到的结果更理性、更全面,理论依据也更充分。
当我们接受零假设H0时,也可能犯错误。我们不知道犯这类错误的概率p的大小,但是知道,若α越大,则p越小例3某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:抽到接受甲种疗法的患儿67名,其中未治愈15名,治愈52名;抽到接受乙种疗法的患儿69名,其中未治愈6名,治愈63名.试根据小概率值α=0.005的独立性检验,分析乙种疗法的效果是否比甲种疗法好.解:零假设为H0:疗法与疗效独立,即两种疗法效果没有差异.将所给数据进行整理,得到两种疗法治疗数据的列联表,1361152169636675215治愈未治愈合计疗效合计乙甲疗法
例题解析根据列联表中的数据,经计算得到2=χ<根据小概率值α=0.005的χ2独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为两种疗法效果没有差异.1361152169636675215治愈未治愈合计疗效合计乙甲疗法
追问1:在表8.3-5中,若对调两种疗法的位置或对调两种疗效的位置,这样做会影响χ2取值的计算结果吗?不影响疗法疗效合计未治愈治愈甲155267乙66369合计21115136疗法疗效合计未治愈治愈乙66369甲155267合计21115136疗法疗效合计治愈未治愈甲521567乙63669合计11521136追问2:对于例3中的抽样数据,根据小概率值α=0.05的独立性检验,分析乙种疗法的效果是否比甲种疗法好.解:零假设为H0:疗法与疗效独立,即两种疗法效果没有差异.根据小概率值α=0.05的χ2独立性检验,我们推断H0不成立,即可以认为两种疗法效果有差异,该推断犯错误的概率不超过0.05.因此可以推断乙种疗法的效果比甲种疗法好例4:为了调查吸烟是否对肺癌有影响,某肿瘤研究所采取有放回简单随机抽样,调查了9965人,得到如下结果(单位:人)依据小概率值α=0.001的独立性检验,分析吸烟是否会增加患肺癌的风险。解:零假设为H0:吸烟和患肺癌之间没有关系根据列联表中的数据,经计算的χ2=>根据小概率值α=0.001的独立性检验,推断H0不成立,即认为吸烟与患肺癌有关联,此推断犯错误的概率不大于0.001,即我们有99.9%的把握认为“吸烟与患肺癌有关系”.吸烟肺癌合计非肺癌患者肺癌患者非吸烟者7775427817吸烟者2099492148合计9874919965例题解析根据表中的数据计算不吸烟者中不患肺癌和患肺癌的频率分别为吸烟者中不患肺癌和患肺癌的评率分别为由可见,在被调查者中,吸烟者患肺癌的频率是不吸烟者患肺癌频率的4倍以上。于是,根据频率稳定于概率的原理,我们可以认为吸烟者患肺癌的概率明显大于不吸烟者患肺癌概率,即吸烟更容易引发肺癌。(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释.(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.(3)根据检验规则得出推断结论.(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.应用独立性检验解决实际问题大致应包括以下几个主要环节:注意:上述几个环节的内容可以根据不同情况进行调整,例如,在有些时候,分类变量的抽样数据列联表是问题中给定的.方法总结1.分类变量X和Y的抽样数据的2×2列联表:课堂小结2.独立性检验的一般步骤:(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释.(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024城市民用户燃气工程实施合同(合同版本)
- 2024工程合同转让协议范本
- 2024办公用品供货合同新(合同版本)
- 2024集成吊顶销售合同范本
- 呼伦贝尔学院《学生创新创业实践指导》2021-2022学年第一学期期末试卷
- 呼伦贝尔学院《琴法基础Ⅱ》2021-2022学年第一学期期末试卷
- 呼伦贝尔学院《创新创业实践Ⅱ》2021-2022学年第一学期期末试卷
- 《推广员培训手册》课件
- 妇产科护理学妇科疾病
- 妇科恶性肿瘤护理教学查房
- 安全培训合同范本3篇
- 2024年电工(高级技师)考前必刷必练题库500题(含真题、必会题)
- 江苏省南通市(2024年-2025年小学四年级语文)人教版能力评测(上学期)试卷及答案
- 读懂中国茶学习通超星期末考试答案章节答案2024年
- 【核心素养目标】5.4.1细菌和真菌的分布教案 2023-2024学年人教版生物八年级上册
- 健身房会员服务优化预案
- 2023年山东济南中考满分作文《今朝晴朗可喜》5
- 2024北师大版新教材初中数学七年级上册内容解读课件(深度)
- 2024年公共营养师三级考试试卷及答案
- 三位数乘两位数乘法竖式计算练习100道及答案
- 我国高尿酸血症相关疾病诊疗多学科专家共识培训课件
评论
0/150
提交评论