版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、8.3.2独立性检验第八章8.3列联表与独立性检验1.了解随机变量2的意义.2.通过对典型案例分析,了解独立性检验的基本思想和方法.学习目标导语最新研究发现,花太多时间玩电脑游戏的儿童,患多动症的风险会加倍.青少年的大脑会很快习惯闪烁的屏幕、变幻莫测的电脑游戏,一旦如此,他们在教室等视觉刺激较少的地方,就很难集中注意力.研究人员对1 323名年龄在7岁到10岁的儿童进行调查,并在孩子父母的帮助下记录了他们在13个月里玩电脑游戏的习惯.同时,教师记下这些孩子出现的注意力不集中问题.统计获得下列数据:注意力不集中注意力集中合计不玩电脑游戏268357625玩电脑游戏489209698合计75756
2、61 323从这则新闻中可以得出哪些结论?有多大把握认为你所得出结论正确?随堂演练课时对点练内容索引一、独立性检验的理解二、有关“相关的检验”三、有关“无关的检验”一、独立性检验的理解问题1由22列联表,如何判断事件X1和Y1之间是否有关联? XY合计Y0Y1X0ababX1cdcd合计acbdnabcd提示假设H0表示X1和Y1没有关系(通常称H0为零假设).问题2假若分类变量X与Y没有关联,则X1与Y1、X0与Y1、X0与Y0、X1与Y0有什么关系?并能得到什么结论?问题3用一个什么量来刻画这种差异呢? 1.独立性检验:利用2的取值推断分类变量X和Y是否独立的方法称为2独立性检验,读作“
3、”,简称 .2.2_,其中n .知识梳理卡方独立性检验独立性检验abcd注意点:(1)卡方越小,独立性越强,相关性越弱;卡方越大,独立性越弱,相关性越强.(2)当2x时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过;当2x时,我们没有充分证据推断H0不成立 ,可以认为X和Y独立.例1(1)为了研究经常使用手机是否对数学学习成绩有影响,某校高二数学研究性学习小组进行了调查,随机抽取高二年级50名学生的一次数学单元测试成绩,并制成下面的22列联表:X成绩合计及格不及格很少使用手机20525经常使用手机101525合计302050附表:0.050.0250.0100.0050.
4、001x3.8415.0246.6357.87910.828参照附表,得到的正确结论是A.依据小概率值0.001的独立性检验,认为“经常使用手机与数学学习成绩无关”B.依据小概率值0.001的独立性检验,认为“经常使用手机与数学学习成绩有关”C.在犯错误的概率不超过0.5%的前提下,认为“经常使用手机与数学学习成绩 无关”D.在犯错误的概率不超过0.5%的前提下,认为“经常使用手机与数学学习成绩 有关”解析零假设为H0:经常使用手机与数学学习成绩无关,根据小概率值0.005的独立性检验,我们推断H0不成立,即在犯错误的概率不超过0.5%的前提下,认为“经常使用手机与数学学习成绩有关”.A.大于
5、10.828 B.大于3.841C.小于6.635 D.大于2.706(2)依据小概率值0.05的独立性检验,认为“X与Y有关系”,随机变量2必须满足0.100.050.0250.0100.0050.001x2.7063.8415.0246.6357.87910.828解析查表可知犯错误的概率不超过0.05时对应的2为3.841,所以确定结论“X与Y有关系”时,随机变量2需大于3.841.反思感悟根据所给的观测值,与所给的临界值表中的数据进行比较,即可得出结论.解析因为3.84125.0036.635x0.01,又P(23.841)0.05,所以依据小概率值0.05的独立性检验,认为“X和Y有
6、关系”.A.在犯错误的概率不超过5%的前提下,认为“X和Y有关系”B.在犯错误的概率不超过5%的前提下,认为“X和Y没有关系”C.依据小概率值0.01的独立性检验,认为“X和Y有关系”D.依据小概率值0.01的独立性检验,认为“X和Y没有关系”跟踪训练1(1)为了判定两个分类变量X和Y是否有关系,应用独立性检验法算的2为5.003,又已知P(23.841)0.05,P(26.635)0.01,则下列说法正确的是(2)有关独立性检验的四个命题,其中不正确的是A.两个变量的22列联表中,对角线上数据的乘积之差的绝对值越大, 说明两个变量有关系成立的可能性就越大B.对分类变量X与Y的随机变量2来说,
7、2越小,认为“X与Y有关系”的 犯错误的概率越大C.由独立性检验可知:在犯错误的概率不超过5%的前提下,认为秃顶与 患心脏病有关,我们说某人秃顶,那么他有95%的可能患有心脏病D.依据小概率值0.01的独立性检验,认为吸烟与患肺癌有关,是指在 犯错误的概率不超过1%的前提下认为吸烟与患肺癌有关解析对于A,两个变量的22列联表中,对角线上数据的乘积之差的绝对值越大,说明两个变量有关系成立的可能性就越大,所以A正确;对于B,对分类变量X与Y的随机变量2来说,2越小,认为“X与Y有关系”的犯错误的概率越大,所以B正确;对于C,由独立性检验可知:在犯错误的概率不超过5%的前提下,认为秃顶与患心脏病有关
8、,不是说某人秃顶,那么他有95%的可能患有心脏病,所以C错误;对于D,依据小概率值0.01的独立性检验,认为吸烟与患肺癌有关,是指在犯错误的概率不超过1%的前提下认为吸烟与患肺癌有关,所以D正确.二、有关“相关的检验”例2甲、乙两机床加工同一种零件,抽检得到它们加工后的零件尺寸x(单位:cm)及个数y,如下表:零件尺寸x1.011.021.031.041.05零件个数y甲37893乙7444a由表中数据得y关于x的经验回归方程为 91100 x(1.01x1.05),其中合格零件尺寸为1.030.01 cm.完成下面列联表,并依据小概率值0.01的独立性检验,分析加工零件的质量与甲、乙是否有关
9、.机床加工零件的质量合计合格零件数不合格零件数甲乙合计所以a11.由于合格零件尺寸为1.030.01 cm,故甲、乙加工的合格与不合格零件的数据表为机床加工零件的质量合计合格零件数不合格零件数甲24630乙121830合计362460零假设为H0:加工零件的质量与甲、乙无关.根据小概率值0.01的独立性检验,我们推断H0不成立.即认为加工零件的质量与甲、乙有关.反思感悟用2进行“相关的检验”步骤(1)零假设:即先假设两变量间没关系.(2)计算2:套用2的公式求得2值.(3)查临界值:结合所给小概率值查得相应的临界值x.(4)下结论:比较2与x的大小,并作出结论.跟踪训练2某校对学生课外活动进行
10、调查,结果整理成下表,试根据小概率值0.005的独立性检验,分析喜欢体育还是文娱与性别是否有关系.性别喜欢合计体育文娱男生212344女生62935合计275279解零假设为H0:喜欢体育还是喜欢文娱与性别没有关系.a21,b23,c6,d29,n79,根据小概率值0.005的独立性检验,我们推断H0不成立,即认为喜欢体育还是喜欢文娱与性别有关.三、有关“无关的检验”例3某省进行高中新课程改革,为了解教师对新课程教学模式的使用情况,某一教育机构对某学校的教师关于新课程教学模式的使用情况进行了问卷调查,共调查了50人,其中有老教师20人,青年教师30人.老教师对新课程教学模式赞同的有10人,不赞
11、同的有10人;青年教师对新课程教学模式赞同的有24人,不赞同的有6人.(1)根据以上数据建立一个22列联表;解22列联表如表所示:教师年龄对新课程教学模式合计赞同不赞同老教师101020青年教师24630合计341650(2)试根据小概率值0.01的独立性检验,分析对新课程教学模式的赞同情况与教师年龄是否有关系.解零假设为H0:对新课程教学模式的赞同情况与教师年龄无关.由公式得根据小概率值0.01的独立性检验,没有充分证据推断H0不成立,即认为对新课程教学模式的赞同情况与教师年龄无关.反思感悟运用独立性检验的方法(1)列出22列联表,根据公式计算2.(2)比较2与x的大小作出结论.跟踪训练3学
12、校举行运动会,为了搞好接待工作,组委会招募了16名男志愿者和14名女志愿者,调查发现,男、女志愿者中分别有10人和6人喜爱运动,其余人不喜爱运动.(1)根据以上数据完成以下22列联表:运动的喜好合计喜爱运动不喜爱运动男1016女614合计30解喜爱运动不喜爱运动合计男10616女6814合计161430(2)根据列联表的独立性检验,能否在犯错误的概率不超过0.10的前提下认为性别与喜爱运动有关?解零假设为H0:喜爱运动与性别无关,由已知数据可得因为1.157 56.635x0.01,所以依据小概率值0.01的独立性检验,认为“生育意愿与城市级别有关”,故选C.41232.对两个分类变量A,B的
13、下列说法中正确的个数为A与B无关,即A与B互不影响;A与B关系越密切,则2的值就越大;2的大小是判定A与B是否相关的唯一依据.A.0 B.1 C.2 D.3解析正确,A与B无关即A与B相互独立;不正确,2的值的大小只是用来检验A与B是否相互独立;不正确,例如借助三维柱形图、二维条形图等.故选B.4则2约为A.0.600 B.0.828 C.2.712 D.6.0041233.高二第二学期期中考试,按照甲、乙两个班学生的数学成绩优秀和及格统计人数后,得到如下列联表:优秀及格合计甲班113445乙班83745合计19719041234.下表是某届某校本科志愿报名时,对其中304名学生进入高校时是否
14、知道想学专业的调查表:知道想学专业不知道想学专业合计男生63117180女生4282124合计105199304根据表中数据,则下列说法正确的是_.(填序号)性别与知道想学专业有关;性别与知道想学专业无关;女生比男生更易知道所学专业.4123所以性别与知道想学专业无关.4课时对点练1.想要检验是否喜欢参加体育活动是不是与性别有关,应该检验A.零假设H0:男性喜欢参加体育活动B.零假设H0:女性不喜欢参加体育活动C.零假设H0:喜欢参加体育活动与性别有关D.零假设H0:喜欢参加体育活动与性别无关基础巩固12345678910111213141516解析独立性检验假设有反证法的意味,应假设两类变量
15、(而非变量的属性)无关,这时的2应该很小.如果2很大,则可以否定假设,如果2很小,则不能够肯定或者否定假设.2.某市政府调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3 000人,计算得26.023,则市政府断言市民收入增减与旅游愿望有关系的犯错误的概率不超过A.10% B.5% C.1% D.0.5%12345678910111213141516解析由临界值表,得6.0233.841x0.05,所以可断言市民收入增减与旅游愿望有关系的犯错误的概率不超过5%.3.依据小概率值0.01的独立性检验,认为两个分类变量“X与Y有关系”,则随机变量2的取值范围是A.2.706,3.841)
16、 B.3.841,6.635)C.6.635,7.879) D.7.879,10.828)12345678910111213141516解析对照临界值表可知选C.解析2越大,认为“X与Y没有关系”的犯错误的概率越大,则“X与Y有关系”的犯错误的概率越小.即2越小,“X与Y有关系”的犯错误的概率越大.4.对于分类变量X与Y的随机变量2,下列说法正确的是A.2越大,认为“X与Y有关系”的犯错误的概率越大B.2越小,认为“X与Y有关系”的犯错误的概率越大C.2越接近于0,认为“X与Y没有关系”的犯错误的概率越大D.2越大,认为“X与Y没有关系”的犯错误的概率越小1234567891011121314
17、1516则推断“学生的性别与认为作业量大有关”这种推断犯错误的概率不超过A.0.01 B.0.025 C.0.05 D.0.0015.某班主任对全班50名学生进行了作业量的调查,数据如下表:12345678910111213141516性别作业量合计大不大男生18927女生81523合计262450犯错误的概率不超过0.05.解析由公式得12345678910111213141516其中a,15a均为大于5的整数,若依据小概率值0.05的独立性检验,认为X,Y有关,则a的值为A.6 B.7 C.8 D.96.(多选)有两个分类变量X,Y,其22列联表如下所示:12345678910111213
18、141516XY合计Y1Y2X1a20a20X215a30a45合计15506512345678910111213141516解析由题意可知根据a5,且15a5,aZ,得当a8或9时满足题意.123456789101112131415167.在研究性别与吃零食这两个分类变量是否有关系时,下列说法中正确的是_(填序号).若26.635,则我们在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,如果某人吃零食,那么此人是女性的可能性为99%;由独立性检验可知在犯错误的概
19、率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误.12345678910111213141516解析2的观测值是支持确定有多大把握认为“两个分类变量吃零食与性别有关系”的随机变量值,所以由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误,故填.8.世界杯期间,某一电视台对年龄高于40岁和不高于40岁的人是否喜欢西班牙队进行调查,对高于40岁的调查了50人,不高于40岁的调查了50人,所得数据制成如下列联表:12345678910111213141516不喜欢西班牙队喜欢
20、西班牙队合计高于40岁pq50不高于40岁153550合计ab100若工作人员从所有统计结果中任取一个,取到喜欢西班牙队的人的概率为 ,则在犯错误的概率不超过_的前提下认为年龄与西班牙队的被喜欢程度有关.123456789101112131415165%0.150.100.050.0250.0100.0050.001x2.0722.7063.8415.0246.6357.87910.828解析设“从所有人中任意抽取一个,取到喜欢西班牙队的人”为事件A,12345678910111213141516所以q25,p25,a40,b60.依据小概率值0.05的独立性检验,认为年龄与西班牙队的被喜欢程
21、度有关,此推断犯错误的概率不超过5%.123456789101112131415169.某地区甲校高二年级有1 100人,乙校高二年级有900人,为了统计两个学校高二年级在学业水平考试中的数学学科成绩,采用分层随机抽样的方法在两校中共抽取了200名学生的数学成绩,如下表:(已知本次测试合格线是50分,两校合格率均为100%)甲校高二年级数学成绩:分组50,60)60,70)70,80)80,90)90,100频数10253530 x12345678910111213141516乙校高二年级数学成绩:分组50,60)60,70)70,80)80,90)90,100频数153025y5(1)计算x
22、,y的值,并分别估计以上两所学校数学成绩的平均分(精确到1分);12345678910111213141516解依题意,知甲校应抽取110人,乙校应抽取90人,所以x10,y15,估计两个学校数学成绩的平均分,12345678910111213141516(2)若数学成绩不低于80分为优秀,低于80分为非优秀,根据以上统计数据填写下面的22列联表,依据小概率值0.05的独立性检验,能否推断出两个学校的数学成绩有差异?数学成绩学校合计甲校乙校优秀非优秀合计12345678910111213141516解数学成绩不低于80分为优秀,低于80分为非优秀,得到列联表:数学成绩学校合计甲校乙校优秀402
23、060非优秀7070140合计11090200零假设为H0:两个学校的数学成绩无差异.12345678910111213141516根据小概率值0.05的独立性检验,推断H0不成立,即认为两个学校的数学成绩有差异.此推断犯错误的概率不超过0.05.1234567891011121314151610.在某校对有心理障碍学生进行测试得到如下列联表:焦虑说谎懒惰合计女生5101530男生20105080合计252065110试说明在这三种心理障碍中哪一种与性别关系最大?12345678910111213141516由表中数据列出焦虑是否与性别有关的22列联表.焦虑不焦虑合计女生52530男生2060
24、80合计2585110零假设为H0:焦虑与性别无关.12345678910111213141516根据小概率值0.1的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为焦虑与性别无关.同理,可以认为说谎与性别有关,懒惰与性别无关.综合运用1234567891011121314151611.千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”,小波同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A的100天日落和夜晚天气,得到如下22列
25、联表:夜晚天气日落云里走 下雨未下雨出现255未出现2545临界值表0.100.050.0100.001x2.7063.8416.63510.82812345678910111213141516并计算得到219.05,下列小波对地区A天气判断不正确的是A.夜晚下雨的概率约为B.未出现“日落云里走”夜晚下雨的概率约为C.在犯错误的概率不超过0.1%的前提下,认为“日落云里走是否出现” 与“当晚是否下雨”有关D.出现“日落云里走”,在犯错误的概率不超过0.1%的前提下,认为夜晚会 下雨夜晚天气日落云里走 下雨未下雨出现255未出现2545临界值表0.100.050.0100.001x2.7063.
26、8416.63510.82812345678910111213141516解析由题意,把频率看作概率可得由219.0510.828x0.001,根据临界值表,可得在犯错误的概率不超过0.1%的前提下,认为“日落云里走是否出现”与“当晚是否下雨”有关,故C正确,故D错误.A.在犯错误的概率不超过1%的前提下,认为英语词汇量与阅读水平无关B.在犯错误的概率不超过0.5%的前提下,认为英语词汇量与阅读水平有关C.依据小概率值0.001的独立性检验,认为英语词汇量与阅读水平有关D.在犯错误的概率不超过1%的前提下,可以认为英语词汇量与阅读水平有关12.为了判断英语词汇量与阅读水平是否相互独立,某语言培
27、训机构随机抽取了100位英语学习者进行调查,经过计算2的观测值为7,根据这一数据分析,下列说法正确的是附:123456789101112131415160.0500.0100.0050.001x3.8416.6357.87910.828解析由题意知276.635x0.01,所以在犯错误的概率不超过1%的前提下,可以认为英语词汇量与阅读水平有关.12345678910111213141516若这两个分类变量A和B没有关系,则a的可能值是A.200 B.720 C.100 D.1801234567891011121314151613.在一次独立性检验中得到如下列联表:A1A2合计B12008001
28、 000B2180a180a合计380800a1 180a解析当a720时,20,易知此时两个分类变量没有关系.12345678910111213141516相关系数r越小,表明两个变量相关性越弱;决定系数R2越接近1,表明回归的效果越好;在一个22列联表中,由计算得213.079,则在犯错误的概率不超过1%时,认为这两个变量之间没有关系;其中正确的说法有_(填序号).12345678910111213141516解析对于,应该是相关系数r的绝对值越小,表明两个变量相关性越弱.所以它是错误的;对于,应该是在犯错误的概率不超过1%时,认为这两个变量之间有关系;对于,应该是变量x增加一个单位长度时,y平均减少5个单位长度.拓广探究1234567891011121314151615.(多选)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的 ,女生喜欢抖音的人数占女生
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《水中体能训练干预中学生耐力素质的应用研究》
- 学校运营外包合同模板(2篇)
- 2024年度餐厅经理聘用合同(04版)
- 竞争格局转型路径
- 2024版成华区房地产销售无责底薪及佣金分配合同
- 面向堆场的实时调度算法
- 服务领域竞争研判
- 2024年度智能校园一卡通门禁系统合同
- 2024版股权转让协议(详细股权结构和转让条件)
- 城市绿地系统生态安全保障机制研究
- JJF(电子)0036-2019 示波器电流探头校准规范-(高清现行)
- 2020心肌梗死后心力衰竭防治专家共识课件
- 蓄水池防水施工方案
- 隧道的衬砌计算(85页清楚明了)
- 人教版八年级(初二)数学上册全册课件PPT
- Q∕GDW 10202-2021 国家电网有限公司应急指挥中心建设规范
- CNAS-CL01:2018(ISO17025:2017)改版后实验室首次内审及管理评审资料汇总
- 护理不良事件-PPT课件
- 商业银行两地三中心数据容灾备份方案建议书
- 审核评估报告(课堂PPT)
- 体育运动中的二次函数
评论
0/150
提交评论