版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、8.3.1分类变量与列联表第八章8.3列联表与独立性检验1.通过实例,理解22列联表的统计意义.2.理解判断两个分类变量是否有关系的常用方法.学习目标导语有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手.为此,联合国固定每年5月31日为全球戒烟日.那么这些疾病与吸烟有关系吗?随堂演练课时对点练内容索引一、数值变量与分类变量二、列联表三、分类变量与列联表的实际应用一、数值变量与分类变量问题1下列变量:人的身高,直尺的长度,性别,国籍,民族有什么不同?提示人的身高,直尺的长度都是数值变量;性别,国籍,民族这些变量的不同“
2、值”表示个体所属的不同类别,像这样的变量称为分类变量.数值变量:数值变量的取值为 ,其大小和运算都有实际含义.分类变量:这里所说的变量和值不一定是具体的数值,例如:性别变量,其取值为男和女两种,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为 ,分类变量的取值可以用 _表示.知识梳理实数分类变量实数注意点:分类变量的取值可以用实数来表示,例如男性,女性可以用1,0表示,学生的班级可以用1,2,3来表示.这些数值只作编号使用,并没有大小和运算意义.分类变量是相对于数值变量来说的.例1下列不是分类变量的是A.近视 B.成绩 C.血压 D.饮酒解析近视变量有近视与不近视两种
3、类别,血压变量有异常、正常两种类别,饮酒变量有饮酒与不饮酒两种类别.成绩不是分类变量,它的取值不一定有两种.反思感悟变量的不同“值”表示个体所属的不同类别,像这样的变量才是分类变量.跟踪训练1下列变量中不属于分类变量的是A.性别 B.吸烟C.宗教信仰 D.国籍解析吸烟不是分类变量,是否吸烟才是分类变量.所以选B.二、列联表问题2为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9 965人,其中,不吸烟的7 817人中42人患肺癌,吸烟的2 148人中49人患肺癌,试分析吸烟是否对患肺癌有影响.(1)我们在研究“吸烟与患肺癌的关系”时,需要关注哪一些量呢?并填表说明.行为疾病合计不患肺癌患
4、肺癌不吸烟427 817吸烟492 148合计9 965在不吸烟者中患肺癌的比例为_;在吸烟者中患肺癌的比例为_.提示吸烟患肺癌的人数;不吸烟患肺癌的人数;吸烟不患肺癌的人数;不吸烟不患肺癌的人数.行为疾病合计不患肺癌患肺癌不吸烟7 775427 817吸烟2 099492 148合计9 874919 9650.54%2.28%说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大.(2)我们还能够从图形中得到吸烟与患肺癌之间的关系吗?提示知识梳理(1)22列联表定义一对分类变量X和Y,我们整理数据如表所示:XY合计Y0Y1X0ababX1cdcd合计acbdnabcdXY合计Y
5、0Y1X0ababX1cdcd合计acbdnabcd上表是关于分类变量X和Y的抽样数据的22列联表:最后一行的前两个数分别是事件Y0和Y1的 ;最后一列的前两个数分别是事件X0和X1的 _;中间的四个数a,b,c,d是事件Xx,Yy(x,y0,1)的 ;右下角格中的数n是 .频数频数频数样本容量(2)等高堆积条形图等高堆积条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高堆积条形图展示列联表数据的 特征,依据_ _的原理,我们可以推断结果.频率频率稳定于概率例2在研究某种药物对“H1N1”病毒的治疗效果时,进行动物试验,得到以下数据:对150只动物服用药物,其中132只动物
6、存活,18只动物死亡,对150只动物进行常规治疗,其中114只动物存活,36只动物死亡.请根据以上数据建立一个22列联表.解22列联表如表所示:类别治疗效果合计存活死亡药物治疗13218150常规治疗11436150合计24654300反思感悟作22列联表时,关键是对涉及的变量分清类别.计算时要准确无误.跟踪训练2在海南省第二十四届科技创新大赛活动中,某同学为研究“网络游戏对当代青少年的影响”作了一次调查,共调查了50名同学,其中男生26人,有8人不喜欢玩电脑游戏,而调查的女生中有9人喜欢玩电脑游戏.请根据以上数据建立一个22的列联表.解22列联表如表所示:态度性别合计男生女生喜欢玩电脑游戏1
7、8927不喜欢玩电脑游戏81523合计262450三、分类变量与列联表的实际应用例3在某测试中,卷面满分为100分,60分为及格,为了调查午休对本次测试前两个月复习效果的影响,特对复习中进行午休和不进行午休的考生进行了测试成绩的统计,数据如表所示:分数段29404150516061707180819091100午休考生人数23473021143114不午休考生人数1751671530173(1)根据上述表格完成列联表:是否午休成绩合计及格不及格午休不午休合计解根据题表中数据可以得到22列联表如下:是否午休成绩合计及格不及格午休80100180不午休65135200合计145235380(2)根
8、据列联表可以得出什么样的结论?对今后的复习有什么指导意义?因此,可以粗略判断午休与考生考试及格有关系,并且午休的及格率高,所以在以后的复习中考生应尽量适当午休,以保持最佳的学习状态.反思感悟利用22列联表分析两个分类变量间的关系时,首先要根据题中数据获得22列联表,然后根据频率特征,即将 与的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.跟踪训练3网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了1 000人调查,发现其中经常上网的有200人,这200人中有80人期末考试不及格,而另外800人中有120人不及
9、格.利用等高堆积条形图判断学生学习成绩与经常上网有关吗?解根据题目所给的数据得到如下22列联表:学习成绩上网合计经常不经常不及格80120200及格120680800合计2008001 000得出等高堆积条形图如图所示.比较图中阴影部分高可以发现经常上网不及格的频率明显高于经常上网及格的频率,因此可以认为学习成绩与经常上网有关.1.知识清单:(1)分类变量.(2)22列联表.(3)等高堆积条形图.2.方法归纳:数形结合.3.常见误区:22列联表计算错误.课堂小结随堂演练1.与表格相比,能更直观地反映出相关数据总体状况的是A.列联表 B.散点图C.残差图 D.等高堆积条形图1234则表中a,b处
10、的值分别为A.94,96 B.52,50 C.52,60 D.54,522.下面是一个22列联表:1234XY合计Y0Y1X0a2173X182533合计b46解析a2173,a52,ba852860.12343.假设有两个分类变量X与Y,它们的可能取值分别为x1,x2和y1,y2,其22列联表为y1y2x11018x2m26则当m取下面何值时,X与Y的关系最弱A.8 B.9 C.14 D.19解析由102618m,解得m14.4,所以当m14时,X与Y的关系最弱.12344.根据如图所示的等高堆积条形图可知吸烟与患肺病_关系(填“有”或“没有”).有解析从等高堆积条形图上可以明显地看出吸烟患
11、肺病的频率远远大于不吸烟患肺病的频率.课时对点练C.此等高堆积条形图看不出两种手术有什么不同的地方D.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响在某 种程度上是不同的,但是没有100%的把握1.下面的等高堆积条形图可以说明的问题是基础巩固12345678910111213141516A.“心脏搭桥”手术和“血管清障” 手术对“诱发心脏病”的影响是绝 对不同的B.“心脏搭桥”手术和“血管清障” 手术对“诱发心脏病”的影响没有 什么不同解析由等高堆积条形图可知选项D正确.12345678910111213141516在这50人中随机抽取1人,抽到喜欢户外运动的员工的概率是0.6,则下
12、列说法正确的是A.抽取的50人中喜欢户外运动的 有30人B.a20,c15C.e30,f10D.女性中喜欢户外运动的概率为0.42.(多选)户外运动已经成为一种时尚,某单位为了了解员工喜欢户外运动是否与性别有关,从本单位所有员工共计650人中采用分层随机抽样的方法抽取50人进行问卷调查,得到了如下22列联表:12345678910111213141516性别户外运动合计喜欢不喜欢男性a5b女性10cd合计ef50解析从50人中随机抽取1人,抽到喜欢户外运动的员工的概率是0.6,可得50人中喜欢户外运动的人数为500.630,即e30,f20.因为喜欢户外运动的女性有10人,所以喜欢户外运动的男
13、性有301020人,即a20,b25.因为不喜欢户外运动的男性有5人,所以不喜欢户外运动的女性有20515(人),12345678910111213141516则下列说法不正确的是A.adbc越小,说明X与Y关系越弱B.adbc越大,说明X与Y关系越强C.(adbc)2越大,说明X与Y关系越强D.(adbc)2越接近于0,说明X与Y关系越强123456789101112131415163.(多选)分类变量X和Y的列联表如下:y1y2合计x1ababx2cdcd合计acbdabcd12345678910111213141516解析|adbc|越小,说明X与Y关系越弱,|adbc|越大,说明X与Y
14、关系越强.最后发现,这两个分类变量没有任何关系,则a的值可能是A.200 B.720 C.100 D.1804.已知两个分类变量的列联表如下:12345678910111213141516解析由于A和B没有任何关系,12345678910111213141516A.性别与喜欢数学无关B.女生中喜欢数学的百分比为80%C.男生比女生喜欢数学的可能性大些D.男生不喜欢数学的百分比为40%5.(多选)如图是调查某地区男、女中学生喜欢数学的等高堆积条形图,阴影部分表示喜欢数学的百分比,从图可以看出12345678910111213141516解析由题图知女生中喜欢数学的百分比为20%,男生不喜欢数学的
15、百分比为40%,男生比女生喜欢数学的可能性大些,故A,B不正确,C,D正确.A.54,43 B.53,43 C.53,42 D.54,426.如图,22列联表中a,b的值分别为12345678910111213141516Y1Y2合计X1caeX223d48合计b78121解析由22列联表,可得b78121,则b43,123456789101112131415167.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如表所示:文艺节目新闻节目合计20至40岁401858大于40岁152742合计5545100由表中数据直观分析,收看新闻节目的观众是否
16、与年龄有关_(填“是”或“否”).是12345678910111213141516解析因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,两者相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的.8.下表是不完整的22列联表,其中3ac,b2d,则a_.1234567891011121314151615又3ac,b2d,Y1y2合计x1ab55x2cd合计120123456789101112131415169.为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:父母吸烟父母不吸烟合计子女吸烟23783320子
17、女不吸烟6785221 200合计9156051 520利用等高堆积条形图判断父母吸烟对子女吸烟是否有影响?12345678910111213141516解等高堆积条形图如图.由图形观察可以看出父母吸烟者中子女吸烟的比例要比父母不吸烟者中子女吸烟的比例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关系”.1234567891011121314151610.某学校对高三学生作了一项调查,发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.作出等高堆积条形图,利用图形判断考前心情紧张与性格类别是否有关系.12345678
18、910111213141516解作列联表如下:相应的等高堆积条形图如图所示.性格内向性格外向合计考前心情紧张332213545考前心情不紧张94381475合计4265941 02012345678910111213141516图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例.从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前心情紧张与性格类别有关.综合运用1234567891011121314151611.假设有两个变量x与y的22列联表如表:y1y2x1abx2cd对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组
19、为A.a2,b3,c4,d5B.a5,b3,c3,d4C.a3,b6,c2,d5D.a5,b3,c4,d312345678910111213141516解析根据观测值求解的公式可知,当ad与bc差距越大,两个变量有关的可能性就越大,检验四个选项中所给的ad与bc的差距.A,adbc10122,B,adbc20911,C,adbc15123,D,adbc15123,显然B中|adbc|最大.12.在22列联表中,两个比值相差越大,两个分类变量有关系的可能性就越大,那么这两个比值为12345678910111213141516因为|adbc|的值越大,两个分类变量有关系的可能性就越大,故选A.A.甲专业比乙专业的录取率高B.乙专业比甲专业的录取率高C.男生比女生的录取率高D.女生比男生的录取率高1234567891011121314151613.(多选)随着我国经济结构调整和方式转变,社会对高质量人才的需求越来越大,因此考研现象在我国不断升温.某大学一学院甲、乙两个本科专业,研究生的报考和录取情况如表,则性别甲专业报考人数乙专业报考人数性别甲专业录取率乙专业录取率男100400男25%45%女300100女30%50%12345678910111213141516解析由题意可得甲专业录取了男生25人,女生90人,乙专业录取了男生180人,女生50人.所以乙专业比甲专业
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024个体采购合同范本
- 2024年公墓区设施建设施工合同合同版B版
- 2024年企业员工劳动协议样本版B版
- 2024停车位车库买卖合同范本
- 江南大学《电机与拖动基础Ⅰ》2023-2024学年第一学期期末试卷
- 佳木斯大学《形势与政第》2021-2022学年第一学期期末试卷
- 佳木斯大学《科技哲学》2021-2022学年第一学期期末试卷
- 济宁学院《音乐欣赏》2021-2022学年第一学期期末试卷
- 暨南大学《环境伦理学》2021-2022学年第一学期期末试卷
- 2024年度二手工艺品采购合同(标的:一件手工制作的陶瓷花瓶)3篇
- 我的家乡兰州
- 《香格里拉并不遥远课件》初中音乐苏少课标版-八年级上册课件3663
- 交通管理员岗前培训
- 主播人设方案
- JBT 14646-2023 低蠕变填充改性聚四氟乙烯垫片 (正式版)
- 普通高中物理课程标准解读
- 成人失禁相关性皮炎的预防与护理-护理团标
- 大一学前教育职业生涯规划发展报告
- 2024年生发剂相关项目运营指导方案
- 数据分析基础课程-第一章-数据分析概述
- 无缝钢管形势分析报告
评论
0/150
提交评论