人教A版(新教材)高中数学选择性必修第三册学案:8 3 1 分类变量与列联表_第1页
人教A版(新教材)高中数学选择性必修第三册学案:8 3 1 分类变量与列联表_第2页
人教A版(新教材)高中数学选择性必修第三册学案:8 3 1 分类变量与列联表_第3页
人教A版(新教材)高中数学选择性必修第三册学案:8 3 1 分类变量与列联表_第4页
人教A版(新教材)高中数学选择性必修第三册学案:8 3 1 分类变量与列联表_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人教A版(新教材)高中数学选择性必修第三册PAGEPAGE1§8.3列联表与独立性检验8.3.1分类变量与列联表学习目标1.通过实例,理解2×2列联表的统计意义.2.理解判断两个分类变量是否有关系的常用方法.导语有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手.为此,联合国固定每年5月31日为全球戒烟日.那么这些疾病与吸烟有关系吗?一、数值变量与分类变量问题1下列变量:人的身高,直尺的长度,性别,国籍,民族有什么不同?〖提示〗人的身高,直尺的长度都是数值变量;性别,国籍,民族这些变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.知识梳理数值变量:数值变量的取值为实数,其大小和运算都有实际含义.分类变量:这里所说的变量和值不一定是具体的数值,例如:性别变量,其取值为男和女两种,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量,分类变量的取值可以用实数表示.注意点:分类变量的取值可以用实数来表示,例如男性,女性可以用1,0表示,学生的班级可以用1,2,3来表示.这些数值只作编号使用,并没有大小和运算意义.分类变量是相对于数值变量来说的.例1下列不是分类变量的是()A.近视 B.成绩C.血压 D.饮酒〖答案〗B〖解析〗近视变量有近视与不近视两种类别,血压变量有异常、正常两种类别,饮酒变量有饮酒与不饮酒两种类别.成绩不是分类变量,它的取值不一定有两种.反思感悟变量的不同“值”表示个体所属的不同类别,像这样的变量才是分类变量.跟踪训练1下列变量中不属于分类变量的是()A.性别 B.吸烟C.宗教信仰 D.国籍〖答案〗B〖解析〗吸烟不是分类变量,是否吸烟才是分类变量.所以选B.二、列联表问题2为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,其中,不吸烟的7817人中42人患肺癌,吸烟的2148人中49人患肺癌,试分析吸烟是否对患肺癌有影响.(1)我们在研究“吸烟与患肺癌的关系”时,需要关注哪一些量呢?并填表说明.行为疾病合计不患肺癌患肺癌不吸烟427817吸烟492148合计9965①在不吸烟者中患肺癌的比例为________;②在吸烟者中患肺癌的比例为________.〖提示〗吸烟患肺癌的人数;不吸烟患肺癌的人数;吸烟不患肺癌的人数;不吸烟不患肺癌的人数.行为疾病合计不患肺癌患肺癌不吸烟7775427817吸烟2099492148合计9874919965①0.54%②2.28%说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大.(2)我们还能够从图形中得到吸烟与患肺癌之间的关系吗?〖提示〗知识梳理(1)2×2列联表定义一对分类变量X和Y,我们整理数据如表所示:XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d上表是关于分类变量X和Y的抽样数据的2×2列联表:最后一行的前两个数分别是事件{Y=0}和{Y=1}的频数;最后一列的前两个数分别是事件{X=0}和{X=1}的频数;中间的四个数a,b,c,d是事件{X=x,Y=y}(x,y=0,1)的频数;右下角格中的数n是样本容量.(2)等高堆积条形图等高堆积条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高堆积条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果.例2在研究某种药物对“H1N1”病毒的治疗效果时,进行动物试验,得到以下数据:对150只动物服用药物,其中132只动物存活,18只动物死亡,对150只动物进行常规治疗,其中114只动物存活,36只动物死亡.请根据以上数据建立一个2×2列联表.解2×2列联表如表所示:类别治疗效果合计存活死亡药物治疗13218150常规治疗11436150合计24654300反思感悟作2×2列联表时,关键是对涉及的变量分清类别.计算时要准确无误.跟踪训练2在海南省第二十四届科技创新大赛活动中,某同学为研究“网络游戏对当代青少年的影响”作了一次调查,共调查了50名同学,其中男生26人,有8人不喜欢玩电脑游戏,而调查的女生中有9人喜欢玩电脑游戏.请根据以上数据建立一个2×2的列联表.解2×2列联表如表所示:态度性别合计男生女生喜欢玩电脑游戏18927不喜欢玩电脑游戏81523合计262450三、分类变量与列联表的实际应用例3在某测试中,卷面满分为100分,60分为及格,为了调查午休对本次测试前两个月复习效果的影响,特对复习中进行午休和不进行午休的考生进行了测试成绩的统计,数据如表所示:分数段29~4041~5051~6061~7071~8081~9091~100午休考生人数23473021143114不午休考生人数1751671530173(1)根据上述表格完成列联表:是否午休成绩合计及格不及格午休不午休合计(2)根据列联表可以得出什么样的结论?对今后的复习有什么指导意义?解(1)根据题表中数据可以得到2×2列联表如下:是否午休成绩合计及格不及格午休80100180不午休65135200合计145235380(2)计算可知,午休的考生及格率为P1=eq\f(80,180)=eq\f(4,9),不午休的考生的及格率为P2=eq\f(65,200)=eq\f(13,40),则P1>P2,因此,可以粗略判断午休与考生考试及格有关系,并且午休的及格率高,所以在以后的复习中考生应尽量适当午休,以保持最佳的学习状态.反思感悟利用2×2列联表分析两个分类变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将eq\f(a,a+b)与eq\f(c,c+d)eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(b,a+b)与\f(d,c+d)))的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.跟踪训练3网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了1000人调查,发现其中经常上网的有200人,这200人中有80人期末考试不及格,而另外800人中有120人不及格.利用等高堆积条形图判断学生学习成绩与经常上网有关吗?解根据题目所给的数据得到如下2×2列联表:学习成绩上网合计经常不经常不及格80120200及格120680800合计2008001000得出等高堆积条形图如图所示.比较图中阴影部分高可以发现经常上网不及格的频率明显高于经常上网及格的频率,因此可以认为学习成绩与经常上网有关.1.知识清单:(1)分类变量.(2)2×2列联表.(3)等高堆积条形图.2.方法归纳:数形结合.3.常见误区:2×2列联表计算错误.1.与表格相比,能更直观地反映出相关数据总体状况的是()A.列联表 B.散点图C.残差图 D.等高堆积条形图〖答案〗D2.下面是一个2×2列联表:XY合计Y=0Y=1X=0a2173X=182533合计b46则表中a,b处的值分别为()A.94,96 B.52,50C.52,60 D.54,52〖答案〗C〖解析〗∵a+21=73,∴a=52,b=a+8=52+8=60.3.假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为y1y2x11018x2m26则当m取下面何值时,X与Y的关系最弱()A.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论