高二-人教A版-数学-选择性必修第三册-第八章《独立性检验》课件_第1页
高二-人教A版-数学-选择性必修第三册-第八章《独立性检验》课件_第2页
高二-人教A版-数学-选择性必修第三册-第八章《独立性检验》课件_第3页
高二-人教A版-数学-选择性必修第三册-第八章《独立性检验》课件_第4页
高二-人教A版-数学-选择性必修第三册-第八章《独立性检验》课件_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

8.3.2独立性检验高二—人教A版—数学—选择性必修第三册—第八章学习目标通过实例了解独立性检验的基本思想会用独立性检验解决简单的实际问题,提升数据分析能力。掌握独立性检验的基本步骤1.分类变量

用以区别不同的现象或性质的一种特殊的随机变量,称为分类变量.分类变量的取值可以用实数表示,例如,学生所在的班级可以用1,2,3等表示,男性、女性可以用1,0表示,等等.2.列联表将形如下表这种形式的数据统计表称为2×2列联表.2×2列联表给出了成对分类变量数据的交叉分类频数.组别甲(Y=0)乙(Y=1)合计A(X=0)aba+bB(X=1)cdc+d合计a+cb+da+b+c+d一、温故知新例1:为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取88名学生。通过测验得到了如下数据:甲校43名学生中有10名数学成绩优秀;乙校45名学生中有7名数学成绩优秀。试分析两校学生中数学成绩优秀率之间是否存在差异。解:用Ω表示两所学校的全体学生构成的集合.考虑以Ω为样本空间的古典概型.对于Ω中每一名学生,定义分类变量X和Y如下:将所给数据整理成下表(单位:人).学校数学成绩合计不优秀(Y=0)优秀(Y=1)甲校(X=0)331043乙校(X=1)38745合计711788一、温故知新学校数学成绩合计不优秀(Y=0)优秀(Y=1)甲校(X=0)331043乙校(X=1)38745合计711788

(2)P(Y=1|X=0)>P(Y=1|X=1).所以认为两校学生的数学成绩优秀率存在差异,甲校学生的数学成绩优秀率比乙校学生的高。(3)根据计算可用等高堆积条形图直观展示一、温故知新一、温故知新例1:为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取88名学生。通过测验得到了如下数据:甲校43名学生中有10名数学成绩优秀;乙校45名学生中有7名数学成绩优秀。试分析两校学生中数学成绩优秀率之间是否存在差异。甲校学生的数学成绩优秀率比乙校学生的高,这个推断的结论是否错误?频率估计概率,因样本数据的随机性特点,频率具有随机性,频率与概率直接存在误差,故根据频率推断出结论有可能错误.如何找到一种合理的推断方法,同时对出错的概率有一定的控制或估算.一、温故知新在现实生活中,人们经常需要回答一定范围内的两种分类变量是否存在关联性或相互影响的问题。

H0:分类变量X和Y独立

XY总计总计P(Y=1|X=0)=P(Y=1|X=1)如何证明呢?

二、知识生成

由条件概率可知

二、知识生成XY总计总计分类变量X和Y,2×2列联表:

由频率估计概率,可以得到

二、知识生成

一般来说,若频数的期望值较大,则差的绝对值也会较大;而若频数的期望值较小,则相应的差的绝对值也会较小.为了合理地平衡这种影响,我们将差的绝对值取平方后分别除以相应的期望值

二、知识生成由概率的相关知识可知,采用类比方法,同理可以得到下面的式子:

我们将四个差的绝对值取平方后分别除以相应的期望值再求和,得到如下的统计量:该表达式可化简为χ2读作“卡方”三、知识生成再次理解χ2公式:三、知识生成

XY总计总计请结合列联表:

xαα概率值α越小,临界值xα越大.

三、知识生成基于小概率值α的检验规则:

这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.三、知识生成α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828

三、知识生成解:零假设为H0:分类变量X与Y相互独立,即两校学生的数学成绩优秀率无差异.根据表中的数据,计算得到

α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828三、例题讲解学校数学成绩合计不优秀(Y=0)优秀(Y=1)甲校(X=0)331043乙校(X=1)38745合计711788根据小概率值α=0.1的χ2独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为两校的数学成绩优秀率没有差异.思考:例1和例2都是基于同一组数据的分析,但却得出了不同的结论,

你能说明其中的原因吗?事实上,例1只是根据一个样本的两个频率的差异得出两校学生的数学成绩优秀率存在差异的结论,并没有考虑由样本随机性可能导致的错误,所以那里的推断依据不太充分.在例2中,我们用χ2独立性检验对零假设H0进行了检验.通过计算,发现χ2≈0.837小于α=0.1所对应的临界值2.706,因此认为没有充分证据推断H0不成立,所以接受H0,推断出校的数学成绩优秀率没有差异的结论.这个检验结果意味着,抽样数据中两个频率的差异很有可能是由样本随机性导致的.因此,相对于比较两个频率的推断,用χ2独立性检验得到的结果更理性,更全面,理论依据也更充分。三、例题讲解例3某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:抽到接受甲种疗法的患儿67名,其中未治愈15名,治愈52名;抽到接受乙种疗法的患儿69名,其中未治愈6名,治愈63名.试根据小概率值α=0.005的独立性检验,分析乙种疗法的效果是否比甲种疗法好.解:零假设为H0:疗法与疗效独立,即两种疗法效果没有差异.

将所给数据进行整理,得到两种疗法治疗数据的列联表.1361152169636675215治愈未治愈合计疗效合计乙甲疗法

根据列联表中的数据,经计算得到根据小概率值α=0.005的χ2独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为两种疗法效果没有差异.三、例题讲解α0.010.0050.001xα6.6357.87910.828

疗法疗效合计未治愈治愈乙66369甲155267合计21115136疗法疗效合计治愈未治愈甲521567乙63669合计11521136

三、例题讲解(1)当小概率值α=0.005时,x0.005=7.879,此时χ2≈4.881<7.879,则没有充分证据推断H0不成立,即认为两种疗法的效果没有差异.(2)当小概率值α=0.05时,x0.05=3.841,此时χ2≈4.881>3.841,

则推断H0不成立,即认为两种疗法的效果有差异,

该推断犯错误的概率不超过0.05.(3)当小概率值α=0.1时,x0.05=2.706,此时χ2≈4.881>2.706,

则推断H0不成立,即认为两种疗法的效果有差异,

该推断犯错误的概率不超过0.1.三、例题讲解思考2:对于例3中的数据,经计算得χ2≈4.881.当小概率值α=0.005,改为“α=0.05或α=0.1”又如何?α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828练习1:为了研究每周累计户外暴露时间是否足够(单位:小时)与近视发病率的关系,对某中学一年级100名学生进行不记名问卷调查,得到如下数据:

近视不近视足够的户外暴露时间2035不足够的户外暴露时间3015α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828(1)用样本估计总体思想估计该中学一年级学生的近视率;(2)能否在犯错误的概率不超过0.01的前提下认为不足够的户外暴露时间与近视有关系?(1)零假设为H0:户外暴露时间与近视率相互独立.由题可知该中学一年级学生近视的人数为50,总数为100,利用样本估计总体思想可知50该中学一年级学生的近视率为解:练习1:为了研究每周累计户外暴露时间是否足够(单位:小时)与近视发病率的关系,对某中学一年级100名学生进行不记名问卷调查,得到如下数据:

近视不近视足够的户外暴露时间2035不足够的户外暴露时间3015α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828(2)能否在犯错误的概率不超过0.01的前提下认为不足够的户外暴露时间与近视有关系?(2)由卡方计算公式,可得解:在犯错误的概率不超过0.01的前提下可以推断H0不成立,即认为不足够的户外暴露时间与近视有关系.练习1:为了研究每周累计户外暴露时间是否足够(单位:小时)与近视发病率的关系,对某中学一年级100名学生进行不记名问卷调查,得到如下数据:

近视不近视足够的户外暴露时间2035不足够的户外暴露时间3015α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828(2)能否在犯错误的概率不超过

0.001的前提下认为不足够的户外暴露时间与近视有关系?由卡方计算公式,可得解:没有充分证据推断H0不成立,因此可以认为H0成立,即不足够的户外暴露时间与近视没有关系.吸烟肺癌合计非肺癌患者肺癌患者非吸烟者7775427817吸烟者2099492148合计9874919965例3:为研究吸烟是否与肺癌有关,某肿瘤研究所采取有放回简单随机抽样的方法,调查了9965人,得到成对样本观测数据的分类统计结果,如下表所示.依据小概率值α=0.001的独立性检验,分析吸烟是否会增加患肺癌的风险.解:零假设H0:吸烟与患肺癌之间无关联,根据小概率值α=0.001的卡方独立性检验,推断H0不成立,

因此可以推断吸烟与患肺癌之间有关联,此推断犯错误的概率不大于0.001.根据列联表中的数据,经计算得到三、例题讲解α0.010.0050.001xα6.6357.87910.828四、总结提升

根据上述例题,应用独立性检验解决实际问题大致应包括哪几个环节?3.独立性检验的一般步骤:1.χ2统计量

2.小概率值α的检验规则:

五、作业与小结思考:独立性检验的思想类似于我们常用的反证法,你能指出二者之间的相同和不同之处吗?作业:教材P134练习第3、4题五、作业与小结谢谢观看(答疑)8.3.2独立性检验高二—人教A版—数学—选择性必修第三册—第八章1.小概率值α的临界值:忽略χ2的实际分布与该近似分布的误差后,对于任何小概率值α,可以找到相应的正实数xα,使得P(χ2≥xα)=α成立.我们称xα为α的临界值,这个临界值就可作为判断χ2大小的标准,概率值α越小,临界值xα越大.2.χ2计算公式:3.基于小概率值α的检验规则是:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.知识回顾思考:独立性检验的思想类似于我们常用的反证法,

你能指出二者之间的相同和不同之处吗?反证法独立性检验在某种假设H0下,如果推出一个矛盾,则证明H0不成立;若未能推出矛盾,不能对H0下任何结论,即反证法不成功在零假设H0下,如果出现一个与H0相矛盾的小概率事件,则推断H0不成立,且该推断犯错误的概率不大于这个小概率.否则,不能推断H0不成立,通常会接受H0,即认为两个分类变量相互独立.反证法不会犯错误独立性检验会犯随机性错误课本134页1.为考察某种药物A对预防疾病B的效果,进行了动物试验,根据105个有放回简单随机样本的数据,得到如下列联表:依据α=0.05的独立性检验,分析药物A对预防疾病B的有效性.药物A疾病B合计未患病患病未服用291544服用471461合计7629105α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828

零假设为H0:药物A与预防疾病B无关联,即药物A对预防疾病B没有效果,根据列联表中数据,经计算得到根据小概率值α=0.05的χ2独立性检验,没有充分证据推断H0不成立,即可以认为药物A对预防疾病B没有效果.解:课本134页2.从某学校获取了容量为400的有放回简单随机样本,将所得数学和语文期末考试成绩的样本观测数据整理如下:依据α=0.05的独立性检验,能否认为数学成绩与语文成绩有关联?数学成绩语文成绩合计不优秀优秀不优秀21261273优秀5473127合计266134400α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828解:零假设为H0:数学成绩与语文成绩独立即数学成绩与语文成绩没有关联,根据列联表中数据,经计算得到根据小概率值α=0.05的χ2独立性检验,我们可以推断H0不成立,即认为数学成绩与语文成绩有关联,该推断犯错误的概率不超过0.05.3.根据同一抽查数据推断两个分类变量之间是否有关联,

应用不同的小概率值,是否会得出

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论