版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
8.3.1分类变量与列联表8.3.2独立性检验学习任务1.了解2×2列联表、随机变量χ2的意义.(数学抽象)2.理解独立性检验中P(χ2≥xα)的具体含义.(数学抽象)3.掌握独立性检验的方法和步骤.(数据分析)4.通过典型案例,学习统计方法,并能用这些方法解决一些实际问题.(数学建模、数据分析)任意抽取某市的一名学生,记A:喜欢长跑;B:是女生.(1)你能得出P(A),P(B),P(AB)这三者的准确值吗?(2)如果要判断A与B是否独立,该怎么办?知识点1数值变量与分类变量数值变量:数值变量的取值为________,其大小和运算都有实际含义.分类变量:这里所说的变量和值不一定是具体的数值,例如:性别变量,其取值为男和女两种,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为________,分类变量的取值可以用________表示.知识点2列联表与等高堆积条形图(1)2×2列联表①定义:列出的两个分类变量的________,称为列联表.②2×2列联表,一般地,假设有两个分类变量X和Y,它们的取值分别为{0,1},其样本频数列联表为:XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d最后一行的前两个数分别是事件{Y=0}和{Y=1}的频数;最后一列的前两个数分别是事件{X=0}和{X=1}的频数;中间的四个数a,b,c,d是事件{X=x,Y=y}(x,y=0,1)的频数;右下角格中的数n为样本容量.(2)等高堆积条形图等高堆积条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高堆积条形图展示列联表数据的________特征,依据________的原理,我们可以推断结果.2×2列联表用于研究两类变量之间是否相互独立,它适用于分析两类变量之间的关系,是对两类变量进行独立性检验的基础.知识点3独立性检验(1)零假设:设X和Y为定义在Ω上,取值于{0,1}的成对分类变量.由于{X=0}和{X=1},{Y=0}和{Y=1}都是互为对立事件,故要判断事件{X=1}和{Y=1)之间是否有关联,需要判断假定关系H0:________是否成立.(2)独立性检验的公式χ2=________________,其中n=________,用随机变量χ2取值的大小作为判断零假设H0是否成立的依据,当它比较大时推断H0不成立,否则认为H0成立.(3)临界值:对任何小概率值α,可以找到相应的正实数xα,使P(χ2≥xα)=α.称xα为α的临界值.临界值可作为判断χ2大小的标准.概率值α越小,临界值xα越大.(4)小概率值α的检验规则:当χ2≥xα时,推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α.当χ2<xα时,没有充分证据推断H0不成立,可以认为X和Y独立.利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.(5)χ2独立性检验中几个常用的小概率值和相应的临界值.α0.10.050.010.0050.001xα2.7063.8416.6357.87910.8281.思考辨析(正确的画“√”,错误的画“×”)(1)分类变量中的变量与函数中的变量是同一概念. ()(2)列联表中的数据是两个分类变量的频数. ()(3)列联表、频率分析法、等高堆积条形图都可初步分析两个分类变量是否有关系. ()(4)在独立性检验中,若χ2越大,则两个分类变量有关系的可能性越大. ()(5)2×2列联表是借助两个分类变量之间频率大小差异说明两个变量之间是否有关联关系. ()(6)应用独立性检验的基本思想对两个变量间的关系作出的推断一定是正确的. ()2.某校为了检验高中数学新课程改革的成果,在两个班进行教学方式的对比试验,两个月后进行了一次检测,试验班与对照班的成绩统计如2×2列联表所示(单位:人),则其中m=________,n=________.班级成绩合计80分及80分以上80分以下试验班321850对照班24m50合计5644n3.根据表格计算:性别不看电视看电视男3785女35143χ2≈________(保留3位小数).类型1列联表与等高堆积条形图【例1】(1)根据如图所示的等高堆积条形图可知喝酒与患胃病________关系.(填“有”或“没有”)(2)网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了1000人调查,发现其中经常上网的有200人,这200人中有80人期末考试不及格,而另外800人中有120人不及格.利用等高堆积条形图判断,学生学习成绩与经常上网有关吗?[尝试解答]1.利用2×2列联表分析两变量间关系的步骤(1)根据题中数据获得2×2列联表;(2)根据频率特征,即将aa+b与c2.利用等高堆积条形图判断两个分类变量是否相关的步骤:[跟进训练]1.某学校对高三学生作了一项调查,发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.作出等高堆积条形图,利用图形判断考前心情紧张与性格类别是否有关系.[尝试解答]类型2由χ2进行独立性检验分类变量“相关的检验”【例2】(源自湘教版教材)为了考察某种新疫苗预防疾病的作用,科学家对动物进行试验,所得数据(单位:只)如下表所示:是否接种疫苗发病没发病合计接种疫苗81523没接种疫苗18927合计262450能否作出接种疫苗与预防疾病有关的结论?[尝试解答]用χ2进行“相关的检验”步骤(1)零假设:即先假设两变量间没关系.(2)计算χ2:套用χ2的公式求得χ2值.(3)查临界值:结合所给小概率值α查得相应的临界值xα.(4)下结论:比较χ2与xα的大小,并作出结论.[跟进训练]2.在某医院,因为患心脏病而住院的600名男性病人中,有200人秃顶,而另外750名不是因为患心脏病而住院的男性病人中有150人秃顶.(1)填写下列秃顶与患心脏病列联表:是否秃顶患病合计患心脏病患其他病秃顶不秃顶合计据表中数据估计秃顶病患中患心脏病的概率P1和不秃顶病患中患心脏病的概率P2,并用两个估计概率判断秃顶与患心脏病是否有关;(2)依据α=0.001的独立性检验,分析秃顶与患心脏病有关吗?请说明理由.注:χ2=nadα0.100.050.0250.0100.0050.001xα2.7063.8415.0246.6357.87910.828[尝试解答]分类变量“无关的检验”【例3】某省进行高中新课程改革,为了解教师对新课程教学模式的使用情况,某教育机构对某学校的教师关于新课程教学模式的使用情况进行了问卷调查,共调查了50人,其中有老教师20人,青年教师30人.老教师对新课程教学模式赞同的有10人,不赞同的有10人;青年教师对新课程教学模式赞同的有24人,不赞同的有6人.(1)根据以上数据建立一个2×2列联表;(2)试根据小概率值α=0.01的独立性检验,分析对新课程教学模式的赞同情况与教师年龄是否有关系.附:χ2=nα0.0250.010.005xα5.0246.6357.879[尝试解答]独立性检验的关注点(1)χ2计算公式较复杂,一是公式要清楚;二是代入数值时不能张冠李戴;三是计算时要细心.(2)判断时把计算结果与临界值比较,其值越大,有关的可信度越高.[跟进训练]3.为了解某挑战赛中是否接受挑战与受邀者的性别是否有关系(假设每个人是否接受挑战互不影响),某机构进行了随机抽样调查,得到如下调查数据(单位:人):性别挑战合计接受挑战不接受挑战男性451560女性251540合计7030100试根据小概率值α=0.1的独立性检验,分析比赛中是否接受挑战与受邀者的性别是否有关.附:χ2=nadα0.10.050.010.0050.001xα2.7063.8416.6357.87910.828类型3独立性检验的综合应用【例4】第24届冬奥会已于2022年2月4日至2月22日在北京市和河北省张家口市联合举行,这是中国历史上第一次举办冬季奥运会.为了宣传冬奥会,让更多的人了解喜爱冰雪项目,某校高三年级举办了冬奥会知识竞赛(总分:100分),并随机抽取了n名中学生的成绩,绘制成如图所示的频率分布直方图.已知前三组的频率成等差数列,第一组和第五组的频率相同.(1)求实数a,b的值,并估计这n名中学生的成绩的平均值x;(同一组中的数据用该组区间的中点值作代表)(2)已知抽取的n名中学生中,男、女生人数相等,男生喜欢花样滑冰的人数占男生人数的14,女生喜欢花样滑冰的人数占女生人数的12,且在犯错误的概率不大于0.05的前提下,认为中学生喜欢花样滑冰与性别有关,求参考数据及公式如下:α0.050.010.001xα3.8416.63510.828χ2=nad-bc2a+bc+da+cb+d,n=[思路导引](1)频率分布直(2)列联表—计算[尝试解答]独立性检验综合应用的方法策略(1)独立性检验在实际中有着广泛的应用,是对实际生活中数据进行分析的一种方法,通过这种分析得出的结论对实际生活有着重要的指导作用.(2)近几年高考中较少单独考查独立性检验,经常与统计、概率、频率分布表、频率分布直方图等知识融合在一起考查.一般需要根据条件列出2×2列联表,计算χ2值,从而解决问题.[跟进训练]4.某学校研究性学习小组对该校高三学生视力情况进行调查,在高三的全体1000名学生中随机抽取了100名学生的体检表,并得到如图所示的频率分布直方图.(1)若频率分布直方图中后四组的频数成等差数列,试估计全年级视力在5.0以下的人数;(2)学习小组成员发现,学习成绩突出的学生,近视的比较多,为了研究学生的视力与学习成绩是否有关系,对年级名次在1~50名和951~1000名的学生进行了调查,得到下面的2×2列联表,根据小概率值α=0.05的独立性检验,能否认为视力与学习成绩有关联?视力学习成绩合计名次在1~50名名次在951~1000名近视413273不近视91827合计5050100(3)在(2)中调查的100名学生中,按照分层抽样在不近视的学生中抽取了6人,进一步调查他们良好的护眼习惯,并且在这6人中任取2人,求抽取的2人中,恰有1人年级名次在1~50名的概率.附:χ2=nadα0.050.010.0050.001xα3.8416.6357.87910.828[尝试解答]1.下列不是分类变量的是()A.近视B.成绩C.血压D.饮酒2.假设有两个分类变量X与Y,它们的可能取值分别为{0,1},其2×2列联表为XY合计Y=0Y=1X=0101828X=1m26m+26合计10+m4454+m当m取下面何值时,X与Y的关系最弱()A.8 B.9C.14 D.193.某校期中考试后,按照甲、乙两个班学生的数学成绩优秀和良好统计人数后,得到如下列联表:班级成绩合计优秀良好甲班113445乙班83745合计197190则χ2约为()A.0.600 B.0.828C.2.712 D.6.0044.下表是某校某届本科志愿报名时,对其中304名学生进入高校时是否知道想学专业的调查表:性别想学专业合计知道想学专业不知道想学专业男生63117180女生4282124合计105199304根据表中数据,则下列说法正确的是_______________.(填序号)①性别与知道想学专业有关;②性别与知道想学专业无关;③女生比男生更易知道想学专业.回顾本节知识,自主完成以下问题:1.在χ2运算后,得到χ2的值为29.78,在判断变量相关时,P(χ2≥6.635)≈0.01和P(χ2≥7.879)≈0.005,哪种说法是正确的?2.利用小概率值α独立性检验的依据是什么?8.3.1分类变量与列联表8.3.2独立性检验[必备知识·情境导学探新知]知识点1实数分类变量实数知识点2(1)频数表(2)频率频率稳定于概率知识点3(1)P(Y=1|X=0)=P(Y=1|X=1)(2)n(ad-bc)2(a课前自主体验1.(1)×(2)√(3)√(4)√(5)√(6)×2.26100[由题意得24+m=50,56+44=n3.4.514[χ2=300×(37×143[关键能力·合作探究释疑难]例1(1)有[从等高堆积条形图上可以明显地看出喝酒患胃病的频率远远大于不喝酒患胃病的频率,所以由所给等高堆积条形图可知,喝酒与患胃病有关系.](2)解:根据题目所给的数据得到如下2×2列联表:学习成绩上网合计经常不经常不及格80120200及格120680800合计2008001000得出等高堆积条形图如图所示:比较图中阴影部分高可以发现经常上网不及格的频率明显高于经常上网及格的频率,因此可以认为学习成绩与经常上网有关.跟进训练1.解:作列联表如下:考前心情性格合计内向外内紧张332213545不紧张94381475合计4265941020相应的等高堆积条形图如图所示.图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例.从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前心情紧张与性格类别有关.例2解:提出统计假设H0:接种疫苗与预防疾病无关.根据列联表中的数据,可以求得χ2=50×(8×由于5.024<5.059<6.635,查临界值表可知,我们至少有97.5%的把握认为接种疫苗与预防疾病有关,即疫苗有效.跟进训练2.解:(1)是否秃顶患病合计患心脏病患其他病秃顶200150350不秃顶4006001000合计6007501350P1=200350=47,P由于P1远大于P2,所以判断秃顶与患心脏病有关.(2)零假设为H0:秃顶与患心脏病无关.由题可知χ2=1350×(200×600-150×400所以依据小概率值α=0.001的独立性检验,我们推断H0不成立,即认为秃顶与患心脏病有关.例3解:(1)2×2列联表如表所示:教师年龄对新课程教学模式合计赞同不赞同老教师101020青年教师24630合计341650(2)零假设为H0:对新课程教学模式的赞同情况与教师年龄无关.由题可知χ2=50×(10×6-24根据小概率值α=0.01的独立性检验,没有充分证据推断H0不成立,因此可以以为H0成立,即认为对新课程教学模式的赞同情况与教师年龄无关.跟进训练3.解:零假设H0:是否接受挑战与受邀者的性别无关.根据列联表中的数据,可以求得χ2=100×(45×因为1.786<2.706,所以没有充分的证据显示比赛中是否接受挑战与受邀者的性别有关.例4解:(1)由题意知a+0.045则各组频率依次为0.05,0.25,0.45,0.2,0.05.∴x=0.05×50+0.25×60+0.45×70+0.2×80+0.05×90=69.5(分).(2)设男生人数为x,依
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度大连二手房买卖合同(含装修款支付)
- 2024版二手房交易双方权利义务协议
- 2024版技术开发合同模板
- 二零二四年度智能家居采购合同
- 2024年度人力资源服务合同:跨国公司的员工派遣与管理
- 2024年度建筑工程施工合同(标准版)
- 二零二四年度智能设备维护保养合同
- 二零二四年度00kW柴油发电机安装工程合同
- 二零二四年度租赁设备合同规定与标的
- 门口停车场承包合同范本
- 栏杆刷漆施工方案
- 第五讲铸牢中华民族共同体意识-2024年形势与政策
- 中华人民共和国学前教育法
- 潮汕音乐课件教学课件
- 【寒假阅读提升】四年级下册语文试题-非连续性文本阅读(一)-人教部编版(含答案解析)
- 霍去病课件教学课件
- 邮政储蓄银行的2024年度借款合同范本
- 2.1 充分发挥市场在资源配置中的决定性作用(课件) 2024-2025学年高中政治 必修2 经济与社会
- 国家开放大学《管理信息系统》大作业参考答案
- 《中国噬血细胞综合征诊断与治疗指南(2022年版)》解读
- 大学生涯发展展示
评论
0/150
提交评论