全优课堂·数学·选择性必修第三册(人教A版)·课件 8.3.1 分类变量与列联表_第1页
全优课堂·数学·选择性必修第三册(人教A版)·课件 8.3.1 分类变量与列联表_第2页
全优课堂·数学·选择性必修第三册(人教A版)·课件 8.3.1 分类变量与列联表_第3页
全优课堂·数学·选择性必修第三册(人教A版)·课件 8.3.1 分类变量与列联表_第4页
全优课堂·数学·选择性必修第三册(人教A版)·课件 8.3.1 分类变量与列联表_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章成对数据的统计分析8.3列联表与独立性检验8.3.1分类变量与列联表学习目标素养要求1.通过实例,理解2×2列联表的统计意义数学抽象2.理解判断两个分类变量是否有关系的常用方法数据分析自学导引(1)数值变量:数值变量的取值为________,其大小和运算都有实际含义.(2)分类变量:这里所说的变量和值不一定是具体的数值,例如:性别变量,其取值为男和女两种,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为___________,分类变量的取值可以用________表示.实数数值变量与分类变量分类变量实数1.数值变量与分类变量区别和联系是什么?提示:分类变量的取值可以用实数来表示.例如:男性、女性可以用1,0表示,学生的班级可以用1,2,3来表示.这些数值只作编号使用,并没有大小和运算意义.分类变量是相对于数值变量来说的.2.举例说明分类变量是否一定只有两个取值?提示:不一定.例如:数学考试等级是分类变量,取优、良、中等、及格、不及格五个值.定义一对分类变量X和Y,我们整理数据如下表所示:2×2列联表XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d上表是关于分类变量X和Y的抽样数据的2×2列联表:最后一行的前两个数分别是事件{Y=0}和{Y=1}的_______;最后一列的前两个数分别是事件{X=0}和{X=1}的________;中间的四个数a,b,c,d是事件{X=x,Y=y}(x,y=0,1)的________;右下角格中的数n是________.频数频数频数样本量等高堆积条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高堆积条形图展示列联表数据的______特征,依据________________的原理,我们可以推断结果.频率等高堆积条形图频率稳定于概率1.辨析记忆(正确的打“√”,错误的打“×”)(1)分类变量中的变量与函数中的变量是同一概念. (

)(2)列联表中的数据是两个分类变量的频数. (

)(3)列联表、频率分析法、等高堆积条形图都可初步分析两分类变量是否有关系.

(

)【答案】(1)×

(2)√

(3)√2.与表格相比,能更直观地反映出相关数据总体状况的是 (

)A.列联表

B.散点图C.残差图

D.等高堆积条形图【答案】D3.(教材改编题)某校为了检验高中数学新课程改革的成果,在两个班进行教学方式的对比试验,两个月后进行了一次检测,试验班与对照班成绩统计如2×2列联表所示(单位:人),则其中m=________,n=________.班级成绩合计80分及80分以上80分以下试验班321850对照班24m50合计5644n【答案】26

1004.观察下列各图,其中两个分类变量x,y之间关系最强的是(

)【答案】D【解析】在四幅图中,选项D的图中两个深色条的高相差最明显,说明两个分类变量之间关系最强.课堂互动下列变量中不属于分类变量的是 (

)A.性别

B.吸烟C.宗教信仰

D.国籍【答案】B【解析】性别有男、女之分,宗教信仰有某一宗教的信仰、不信仰之分,国籍有某一国家的国籍、非国籍之分,吸烟不是分类变量,是否吸烟才是分类变量.题型1数值变量与分类变量辨析1.数值变量的取值为实数,其大小和运算都有实际含义.2.分类变量是用随机变量区别不同的现象或性质,分类变量的取值可以用实数表示,变量的不同“值”表示个体所属的不同类别,没有大小和运算意义.1.下列不是分类变量的是

(

)A.近视

B.成绩C.血压

D.饮酒【答案】B【解析】近视变量有近视与不近视两种类别,血压变量有异常、正常两种类别,饮酒变量有饮酒与不饮酒两种类别.成绩不是分类变量,它的取值不一定有两种.题型2用2×2列联表分析两分类变量间的关系解:2×2列联表如下:饮食情况年龄合计在六十岁以上在六十岁以下以蔬菜为主432164以肉类为主273360合计7054124显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.2.(2024年潮州期中)在调查的480名男性中有38名患有色盲,520名女性中有6名患有色盲,请根据题目的条件列出2×2列联表并由列联表估计色盲与性别是否有关.解:根据题目所给的数据列出如下列联表:项目色盲不色盲合计男38442480女6514520合计449561000(2024年南昌期中)某学校对高三学生做了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.(1)根据以上数据,作出考前心情与性格的列联表,并求出性格外向的学生考前心情紧张的概率.(2)作出等高堆积条形图,利用图形判断考前心情紧张与性格是否有关系.题型3等高堆积条形图及应用解:(1)作列联表如下:项目性格内向性格外向合计考前心情紧张332213545考前心情不紧张94381475合计4265941020(2)相应的等高堆积条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的人数所占的比例,从图中可以看出考前心情紧张的样本中性格内向的人数占的比例比考前心情不紧张样本中性格内向的人数占的比例高,可以认为考前心情紧张与性格有关.利用等高堆积条形图判断两个分类变量是否相关的步骤3.(2024年东莞期中)网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了1000人调查,发现其中经常上网的有200人,这200人中有80人期末考试不及格,而另外800人中有120人不及格.利用等高堆积条形图判断学生学习成绩与经常上网有关吗?解:根据题目所给的数据得到如下2×2列联表:学习成绩上网合计经常不经常不及格80120200及格120680800合计2008001000得出等高堆积条形图如图所示:比较图中阴影部分高可以发现经常上网不及格的频率明显高于经常上网及格的频率,因此可以认为学习成绩与经常上网有关.素养训练1.(题型1)在吸烟与患肺病是否有关的研究中,下列属于两个分类变量的是

(

)A.吸烟,不吸烟

B.患病,不患病C.是否吸烟,是否患病

D.以上都不对【答案】C2.(2024年张家口期中)(题型2)已知两个分类变量X和Y,其2×2列联表如下:XY合计Y=0Y=1X=02008001000X=1180a180+a合计380800+a1180+a如果最后发现,这两个分类变量没有任何关系,那么a的值可能是

(

)A.200

B.720C.100

D.180【答案】B3.(题型3)(多选)下图是调查某地区男女中学生喜欢理科的等高堆积条形图,阴影部分表示喜欢理科的百分比,从图中可以看出 (

)A.性别与喜欢理科无关B.女生中喜欢理科的比例为80%C.男生比女生喜欢理科的可能性大些D.男生中不喜欢理科的比例为40%【答案】CD【解析】由题图知女生中喜欢理科的比例为20%,男生中不喜欢理科的比例为40%,故B不正确.由题图知,男生比女生喜欢理科的可能性大些.4.(题型3)根据如图所示的等高堆积条形图可知吸烟与患肺病_______关系(填“有”或“没有”).【答案】有【解析】从等高堆积条形图上可以明显地看出:吸烟患肺病的频率远远大于不吸烟患肺病的频率.5.(题型2)在某医院,因为患心脏病而住院的600名男性病人中,有200人秃顶,而另外750名不是因为患心脏病而住院的男性病人中有150人秃顶.填写下列

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论