




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
8.3列联表与独立性检验(单元教学设计)一、【单元目标】(1)通过实例,理解2×2列联表的统计意义.(2)基于2×2列联表,通过实例了解独立性检验的基本思想,掌握独立性检验的基本步骤,会用独立性检验解决简单的实际问题,提升数据分析能力.二、【单元知识结构框架】三、【学情分析】学生已掌握基本的统计知识,如频率分布、概率计算等,为学习列联表和独立性检验奠定了基础.学生具备一定的数据收集和处理能力,但面对复杂的统计模型可能存在理解上的困难.学生需要具备良好的逻辑思维和分析问题的能力,以便将实际问题转化为数学模型.四、【教学设计思路/过程】课时安排:约2课时教学重点:2×2列联表,独立性检验的基本思想和独立性检验的基本方法.教学难点:独立性检验与一个小概率事件的关联;关于小概率(显著性水平)的正确理解;理解独立性检验的推断.教学方法/过程:五、【教学问题诊断分析】环节一、情景引入,温故知新情景:有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手.为此,联合国固定每年5月31日为世界无烟日.那么这些疾病与吸烟有怎样的关系呢?环节二、抽象概念,内涵辨析1.数值变量与分类变量问题1:下列变量:人的身高,直尺的长度,性别,国籍,民族有什么不同?【破解方法】人的身高,直尺的长度都是数值变量;性别,国籍,民族这些变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.【归纳新知】(1)数值变量数值变量的取值为实数,其大小和运算都有实际含义.(2)分类变量这里所说的变量和值不一定是具体的数值,例如:性别变量,其取值为男和女两种我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量,分类变量的取值可以用实数表示.2.列联表与等高堆积条形图问题2:为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,其中,不吸烟的7817人中42人患肺癌,吸烟的2148人中49人患肺癌,试分析吸烟是否对患肺癌有影响.(1)我们在研究“吸烟与患肺癌的关系”时,需要关注哪一些量呢?并填表说明.行为疾病合计不患肺癌患肺癌不吸烟427817吸烟492148合计9965①在不吸烟者中患肺癌的比例为________;②在吸烟者中患肺癌的比例为________.【破解方法】吸烟患肺癌的人数;不吸烟患肺癌的人数;吸烟不患肺癌的人数;不吸烟不患肺癌的人数.行为疾病合计不患肺癌患肺癌不吸烟7775427817吸烟2099492148合计9874919965①0.54%②2.28%说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大.问题3:我们还能够从图形中得到吸烟与患肺癌之间的关系吗?【破解方法】【归纳新知】(1)2×2列联表在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存,我们将这类数据统计表称为2×2列联表,2×2列联表给出了成对分类变量数据的交叉分类频数.一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为合计abcd合计(2)等高堆积条形图等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果.3.独立性检验的理解问题4:由2×2列联表,如何判断事件{X=1}和{Y=1}之间是否有关联?XY合计abcd合计【破解方法】假设表示和没有关系(通常称为零假设).问题5:假若分类变量X与Y没有关联,则与、与、与、与有什么关系?【破解方法】相互独立.【归纳新知】(1)临界值统计量也可以用来作相关性的度量.越小说明变量之间越独立,越大说明变量之间越相关.忽略的实际分布与该近似分布的误差后,对于任何小概率值,可以找到相应的正实数,使得成立.我们称为的临界值,这个临界值就可作为判断大小的标准.(2)独立性检验基于小概率值的检验规则是:当时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过;当时,我们没有充分证据推断H0不成立,可以认为X和Y独立.这种利用的取值推断分类变量X和Y是否独立的方法称为独立性检验,读作“卡方独立性检验”,简称独立性检验(testofindependence).下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值0.10.050.010.0050.0012.7063.8416.6357.87910.828(3)应用独立性检验解决实际问题的大致步骤①提出零假设:X和Y相互独立,并给出在问题中的解释;②根据抽样数据整理出2×2列联表,计算的值,并与临界值比较;③根据检验规则得出推断结论;④在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.环节三:例题练习,巩固理解例1.为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取88名学生.通过测验得到了如下数据:甲校43名学生中有10名数学成绩优秀;乙校45名学生中有7名数学成绩优秀.试分析两校学生中数学成绩优秀率之间是否存在差异.【解析】甲校抽取的43名学生中有10名数学成绩优秀,所以甲校数学成绩的优秀的频率为,乙校抽取的45名学生中有7名数学成绩优秀,所以乙校数学成绩的优秀的频率为,甲校的频率明显高于乙校的频率,依据频率稳定于概率的原理,我们可以推断,如果从甲校和乙校各随机抽取一名学生,那么甲校学生的数学成绩优秀的概率大于乙校学生的数学成绩优秀的概率,因此,可以认为两校学生数学成绩优秀率之间存在差异,甲校学生的数学成绩优秀率比乙校学生的高.例2.依据小概率值的独立性检验,分析抽样数据:甲校43名学生中有10名数学成绩优秀;乙校45名学生中有7名数学成绩优秀,能否据此推断两校学生的数学成绩优秀率有差异?【解析】零假设为:分类变量X与Y相互独立,即两校学生的数学成绩优秀率无差异.计算得到.根据小概率值的独立性检验,没有充分证据推断出不成立,因此可以认为成立,即认为两校的数学成绩优秀率没有差异.例3.某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:抽到接受甲种疗法的患儿67名,其中未治愈15名,治愈52名;抽到接受乙种疗法的患儿69名,其中未治愈6名,治愈63名.试根据小概率值的独立性检验,分析乙种疗法的效果是否比甲种疗法好.【解析】假设:疗法与疗效独立,即两种疗法效果没有差异.将所给数据进行整理,得到两种疗法治疗数据的列联表,如下表:疗法疗效合计未治愈治愈甲155267乙66369合计21115136根据列联表中的数据,经计算得到.根据小概率值的独立性检验,没有充分证据推断不成立,∴可以认为假设成立,即两种疗法效果没有差异.例4.为研究吸烟是否与肺癌有关,某肿瘤研究所采取有放回简单随机抽样的方法,调查了9965人,得到成对样本观测数据的分类统计结果,如表所示.依据小概率值的独立性检验,分析吸烟是否会增加患肺癌的风险.表
单位:人吸烟肺癌合计非肺癌患者肺癌患者非吸烟者7775427817吸烟者2099492148合计9874919965【解析】零假设为:吸烟与患肺癌之间无关联.根据列联表中的数据经计算得到,根据小概率值的独立性检验,我们推断不成立,即认为吸烟与患肺癌有关联,此推断犯错误的概率不大于0.001.根据表中的数据计算,不吸烟者中不患肺癌和患肺癌的频率分别为和;吸烟者中不患肺癌和患肺癌的频率分别为和,由可见,在被调查者中,吸烟者患肺癌的频率是不吸烟者患肺癌的频率的4倍以上,于是,根据频率稳定于概率的原理,我们可以认为吸烟者患肺癌的概率明显大于不吸烟者患肺癌的概率,即吸烟更容易引发肺癌.例5.小明为了了解不同性别的观众对蛇年春晚小品类节目的喜欢情况,随机选取了200名观看蛇年春晚的观众,得到如下列联表:喜欢不喜欢合计男性454590女性110合计80200(1)求;(2)在所有喜欢蛇年春晚小品类节目的观众中随机选1人,记该观众是男性观众的概率为,求出的估计值;(3)根据小概率值的独立性检验,能否认为性别因素与喜欢与否有关联?附:,其中.0.0500.0100.0050.0013.8416.6357.87910.828【解析】(1)由列联表可知,.(2)由列联表可知,喜欢蛇年春晚小品类节目的观众共计120人,其中男性有45人,则该观众是男性观众的概率的估计值为.(3)补全列联表如下:喜欢不喜欢合计男性454590女性7535110合计12080200零假设为:性别因素与喜欢与否无关联,根据列联表中的数据,得,依据小概率的独立性检验,可推断不成立,即可以认为性别因素与喜欢与否有关联.例6.为了研究某市高三年级学生的性别和身高的关联性,随机抽取了200名高三年级学生,整理数据得到如下列联表,并画出身高的频率分布直方图:性别身高合计低于不低于女20男50合计200(1)根据身高的频率分布直方图,求列联表中的,的值;(2)依据小概率值的独立性检验,能否认为“高三年级学生的性别”与“身高是否低于”有关联?附:,0.0500.0100.0013.8416.63510.828【解析】(1)由图,低于的学生有人,则不低于170cm的学生有人.从而,;(2)零假设为:性别与身高没有关联,计算可得根据的独立性检验,推断不成立,因此该市高三年级学生的性别与身高是否低于170cm有关联;例7.据不完全统计,我国小学生的近视率已经达到惊人的45.7%,也就是说有将近一半的小学生已经早早的开始与眼镜为伴了.给孩子选一台合格的护眼仪是很有必要的.护眼仪的功能就是对眼部周围的穴位进行按摩以达到刺激穴位的目的,缓解学生们眼睛的疲劳,减轻用眼时间过长造成的眼睛干涩、充血等症状,可以用来预防近视,而绝对不可能治疗近视.某医学机构为了研究某护眼仪预防近视的效果,随机调查了200名小学生,数据如下:眼睛没有近视眼睛近视合计配有某护眼仪6040100没配有某护眼仪5050100合计11090200依据小概率值的独立性,分析预防眼睛近视是否与配有某护眼仪有关?附:参考公式,其中.参考数据:0.10.050.010.0050.0012.7063.8416.6357.87910.828【解析】零假设为:分类变量X与Y相互独立,即认为预防眼睛近视与是否配有某护眼仪无关,由列联表中数据得:根据小概率值的独立性检验,没有充分证据推断不成立,因此可以认为成立,即认为预防眼睛近视与是否配有某护眼仪无关;环节四:小结提升,形成结构问题6:请你带着下列问题回顾本节课学习的内容:(1)回顾本节课的学习,请你总结应用独立性检验解决实际问题时大致包括几个主要环节?(2)独立性检验的思想类似于我们常用的反证法,你能指出两者之间的相同和不同之处吗?(3)你能说一说独立性检验的本质吗?【破解方法】师组织学生依次讨论这几个问题,并适时点评与总结.六、【教学成果自我检测】环节五:目标检测,检验效果1.某市准备安排该市所有中学教师进行体检,同时调查去年该市教师体检情况,并随机抽取100名高中教师与100名初中教师,经过统计得到如下列联表:去年体检人数去年末体检人数合计高中教师7030100初中教师100合计200若根据列表得,则这200名教师中,去年末体检的人数为(
)(附:,)A.20 B.30 C.40 D.50【答案】D【解析】由于(*),又,则可得,代入(*)式可得:,解得或(舍).故选:D.2.某实验中学为调查本校高三学生的学习成绩是否与坚持体育锻炼有关,随机选取了高三300名学生的某次联考成绩进行统计,得到如下表格:分数锻炼合计坚持锻炼不坚持锻炼分数10080180分数<6005070120合计150150300依据小概率值的独立性检验,可以认为高三学生的学习成绩与坚持进行体育锻炼有关,则m的值可能是(
)附:,.α0.10.050.010.0050.0012.7063.8416.6357.87910.828A.0.001 B.0.005 C.0.01 D.0.05【答案】D【解析】由题意,,结合表格数据及选项,可以认为高三学生的学习成绩与坚持进行体育锻炼有关,则m的值可能是0.05.故选:D.3.根据分类变量x与y的成对样本数据,计算得到.依据的独立性检验,则下列结论正确的是(
)A.变量x与y不独立 B.变量x与y不独立,这个结论犯错误的概率不超过0.05C.变量x与y独立 D.变量x与y独立,这个结论犯错误的概率不超过0.05【答案】C【解析】按照独立性检验的知识及比对的参数值,当,我们可以下结论变量与独立.故排除选项A,B;依据的独立性检验,,所以不能得到:变量x与y独立,这个结论犯错误的概率不超过0.05;故C正确,D错误.故选:C4.假设有两个分类变量和,它们的可能取值分别为和,其列联表如下:总计总计对于以下数据,对同一样本能说明与有关的可能性最大的一组为(
)A.,,, B.,,,C.,,, D.,,,【答案】B【解析】根据(其中),值越大,说明“与有关系”的可能性越大,对于同一样本,越大,说明与之间的关系越强对于A,当,,,时,;对于B,当,,,时,;对于C,当,,,时,;对于D,当,,,时,;因为,所以B中的值最大,即B对应的值最大,说明与之间的关系越强.故选:B.5.下面是列联表:合计2173222547合计46120则表中,的值分别为(
)A.94,72 B.52,50 C.52,74 D.74.52【答案】C【解析】因为.所以.又,所以.故选:C.6.年月日太原地铁号线开通,在一定程度上缓解了市内交通的拥堵状况,为了了解市民对地铁号线开通的关注情况,某调查机构在地铁开通后两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构.并制作出如下等高堆积条形图:根据图中信息,下列结论不一定正确的是()A.样本中男性比女性更关注地铁号线开通B.样本中多数女性是岁及以上C.样本中岁以下的男性人数比岁及以上的女性人数多D.样本中岁及以上的人对地铁号线的开通关注度更高【答案】C【解析】设等高条形图对应列联表如下:岁及以上岁以下总计男性女性总计根据第个等高条形图可知,岁及以上男性比岁及以上女性多,即;岁以下男性比岁以下女性多,即.根据第个等高条形图可知,男性中岁及以上的比岁以下的多,即;女性中岁及以上的比岁以下的多,即,对于A,男性人数为,女性人数为,因为,所以,所以A正确;对于B,岁及以上女性人数为,岁以下女性人数为,因为,所以B正确;对于C,岁以下男性人数为,岁及以上女性人数为,无法从图中直接判断与的大小关系,所以C不一定正确;对于D,岁及以上的人数为,岁以下的人数为,因为,所以,所以D正确.故选:C.7.(多选题)为了验证牛的毛色(黑色、红色)和角(有角、无角)这两对相对性状是否相关,某学院进行了一次数据统计,并根据形成的2×2列联表,计算得到,根据小概率值为的独立性检验,则(
)附:0.1000.0500.0102.7063.8416.635A.若,则认为“毛色”和“角”无关B.若,则认为“毛色”和“角”有关,此推断犯错误的概率不超过10%C.若,则认为“毛色”和“角”无关D.若,则认为“毛色”和“角”有关,此推断犯错误的概
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 江西省高安市高安二中学2025届初三下第二次检测试题化学试题含解析
- 九师联盟商开大联考2025年高三下期末质量检查语文试题文试题含解析
- 个人离婚合同协议书填写范例
- 工业厂房建筑工程施工合同
- 四川省绵阳市高中2025届高三模拟语文试题含解析
- 江苏省盐城市建湖县全县市级名校2024-2025学年初三4月中考模拟物理试题含解析
- 合作协议合同范本房地产开发
- 消费合同管理规范
- 讲师聘请合同模板
- 仓储操作劳动合同
- 营地指导员基础教程
- 初级电工证考试试题库电工证考试题库
- 供应室院感培训课件
- 洁净厂房设计方案
- 北京市通州区2021-2022学年高二下学期期中地理试题(解析版)
- 企业财务共享中心成熟度研究-以海尔集团为例
- 急性一氧化碳中毒教学演示课件
- 客户订单交付管理
- 《教育学》课件 第五章 学校教育制度
- 中国芳香植物资源
- 银行承兑汇票培训-课件
评论
0/150
提交评论