4.3独立性检验课件高二下学期数学选择性_第1页
4.3独立性检验课件高二下学期数学选择性_第2页
4.3独立性检验课件高二下学期数学选择性_第3页
4.3独立性检验课件高二下学期数学选择性_第4页
4.3独立性检验课件高二下学期数学选择性_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

4.3独立性检验湘教版

数学

选择性必修第二册第4章统计

课标要求1.通过实例,理解2×2列联表的统计意义.2.了解独立性检验的基本思想及实施步骤,了解χ2的含义.基础落实·必备知识全过关重难探究·能力素养全提升目录索引

成果验收·课堂达标检测基础落实·必备知识全过关知识点1列联表1.列联表:将两个(或两个以上)分类变量进行交叉分类得到的

分布表称为列联表.

说明事物类别的一个名称,其取值是分类依据

频数

2.2×2列联表:一般地,两个分类变量X,Y均有两个变量值的列联表称为2×2列联表,其一般形式如下:两个分类变量的频数汇总统计表

变量Y1Y2合计X1aba+bX2cdc+d合计a+cb+da+b+c+d名师点睛(1)分类变量的取值可以用实数来表示,例如男性、女性可以用1,0表示,学生的班级可以用1,2,3来表示.这些数值只作编号使用,并没有大小和运算意义.分类变量是相对于数值变量来说的.(2)2×2列联表主要用于研究两个事件之间是相互独立的还是存在某种关联性,它适用于分析两个事件之间的关系.过关自诊1.判断正误.(正确的画“√”,错误的画“×”)(1)所有的分类变量只有两个变量值.(

)(2)列联表中的数据是两个分类变量的频数.(

)×√2.下面是2×2列联表:项目Y1Y2合计X1a2273X252530合计b47c则表中a,b的值分别为

.

51,56解析

∵a+22=73,∴a=51.∵a+5=b,∴b=56.知识点2独立性检验1.定义:在2×2列联表中χ2=

,

其中n=a+b+c+d.利用统计量χ2来确定在多大程度上可以认为“两个分类变量有关系”的方法,称为两个分类变量的独立性检验.读作“卡方”我们只研究a,b,c,d均不小于5的情况且n是样本容量

2.独立性检验的统计思想:(1)提出统计假设H0:两个分类变量之间没有关系(指独立).(2)根据2×2列联表与公式计算χ2的值.(3)将χ2的值与临界值x0比较,当χ2>x0时,我们就推断H0不成立,即认为X和Y不独立(也称为X和Y有关),该推断犯错误的概率不超过P(χ2>x0)=α;当χ2≤x0时,我们没有充分证据推断H0不成立,可以认为X和Y独立.(4)根据所给的观测值与所给的临界值表中的数据进行比较,即可得出结论.以要研究“两个分类变量有关系为例”3.χ2的值与两变量相关性的关系:一般地,χ2的值越小,两变量的独立性越强,相关性越弱;χ2的值越大,两变量的独立性越弱,相关性越强.名师点睛(1)独立性检验的基本思想与反证法的思想的关系:反证法独立性检验要证明结论A提出假设H0在A不成立的前提下进行在H0成立的条件下进行推理推出矛盾,意味着结论A成立推出有利于H0成立的小概率事件发生,意味着H0成立的可能性小没有找到矛盾,不能对A下任何结论,即反证法不成立推出有利于H0成立的小概率事件不发生,接受原假设(2)独立性检验的必要性:由于列联表中的数据是样本数据,它只是总体的代表,它具有随机性,所以只能利用列联表的数据粗略判断两个分类变量是否有关系.而χ2给出了不同样本容量的数据的统一评判标准,利用它能精确判断两个分类变量是否有关系的可靠程度.过关自诊1.判断正误.(正确的画“√”,错误的画“×”)(1)利用χ2进行独立性检验,估计值的准确度与样本容量多少没有关系.(

)(2)χ2的大小是判断事件A与B是否有关系的统计量.(

)×√2.在吸烟与患肺癌是否相关的研究中,下列说法正确的是(

)A.若χ2>6.635,我们有不少于99%的把握认为吸烟与患肺癌有关,则在100个吸烟的人中必有99个人患肺癌B.由独立性检验可知,当有不少于99%的把握认为吸烟与患肺癌有关时,若某人吸烟,则他有99%的可能患有肺癌C.通过计算得到χ2>3.841,是指有不少于95%的把握认为吸烟与患肺癌有关联D.以上三种说法都不正确C解析

若χ2>6.635,我们有不少于99%的把握认为吸烟与患肺癌有关,而不是在100个吸烟的人中必有99个人患肺癌,故A不正确;99%是指吸烟与患肺癌有关的概率,而不是吸烟的人有99%的可能患有肺癌,故B不正确.C显然正确,D不正确.重难探究·能力素养全提升探究点一2×2列联表的理解【例1】

某村庄对该村内50名老年人、年轻人每年是否体检的情况进行了调查,统计数据如下表所示:单位:人每年体检情况体检未体检合计老年人a7c年轻人6bd合计ef50已知抽取的老年人、年轻人各25名,则对列联表数据的分析错误的是(

)A.a=18 B.b=19C.c+d=50 D.e-f=2D解析

由题意得a+7=c=25,6+b=d=25,a+6=e,7+b=f,e+f=50,所以a=18,b=19,c+d=50,e=24,f=26,则e-f=-2.故选D.规律方法

2×2列联表数据特征求解与2×2列联表中有关的数据问题应明确右下角格中的数是样本容量,且最后一行的前两个数的和与最后一列的前两个数的和相等并且都等于样本容量.变式训练1为了解某大学的学生是否爱好体育锻炼,用简单随机抽样方法在校园内调查了120位学生,得到如下2×2列联表:单位:人性别男女合计爱好ab73不爱好c25d合计74ef则a-b-c的值为(

)A.7 B.8

C.9

D.10C解析

根据题意可得c=120-73-25=22,a=74-22=52,b=73-52=21,∴a-b-c=52-21-22=9.故选C.探究点二独立性检验角度1.独立性检验的理解【例2】

假设有两个分类变量X与Y的2×2列联表如下表:变量Y1Y2X1abX2cd对于以下数据,对同一样本能说明X与Y有关系的可能性最大的一组为(

)A.a=50,b=40,c=30,d=20B.a=50,b=30,c=40,d=20C.a=20,b=30,c=40,d=50D.a=20,b=30,c=50,d=40D解析

选项A中|ad-bc|=|50×20-40×30|=200;选项B中|ad-bc|=|50×20-30×40|=200;选项C中|ad-bc|=|20×50-30×40|=200;选项D中|ad-bc|=|20×40-30×50|=700.显然D中|ad-bc|最大,该组数据能说明X与Y有关系的可能性最大.规律方法

根据2×2列联表中的数字直接判断两个变量相关性强弱的方法两个分类变量X与Y的2×2列联表中,由χ2计算公式可知对角线上两组数字乘积的差的绝对值|ad-bc|的值越大,说明X与Y有关系的可能性越大,|ad-bc|的值越小,说明X与Y有关系的可能性越小.变式训练2在一次独立性检验中,得出2×2列联表如下,且最后发现,两个分类变量A和B没有任何关系,则a的可能值是(

)变量A

合计B2008001000

180a180+a合计380800+a1180+aA.200 B.720

C.100

D.180B角度2.利用独立性检验求分类变量的值【例3】

某大学为了解喜欢看篮球赛是否与性别有关,随机调查了部分学生,在被调查的学生中,男生人数与女生人数相同,女生喜欢看篮球赛的人数占女生人数的,男生喜欢看篮球赛的人数占男生人数的

.若被调查的男生人数为n,且至少有95%的把握认为喜欢看篮球赛与性别有关,则n的最小值为(

)A.41 B.40

C.45

D.50C解析

由题意得到如下列联表:因为至少有95%的把握认为喜欢看篮球赛与性别有关,规律方法

根据独立性检验的结果求分类变量的值的方法根据独立性检验的结果求分类变量的值时首先根据题意中可能性的大小找出临界值,然后根据临界值建立不等式求解.[提醒]根据独立性检验的结果求分类变量的值时应注意分类变量的值均为正整数,且不小于5.变式训练3随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为(

)A.100 B.150

C.250

D.300B解析

设被调查的男、女学生总数量为n(n∈N*),根据题意可得出2×2列联表如下表所示:性别喜欢网络课程不喜欢网络课程合计男生0.4n0.1n0.5n女生0.3n0.2n0.5n合计0.7n0.3nn角度3.独立性检验的应用【例4】

“直播带货”是指通过一些互联网平台,使用直播技术进行商品线上展示、咨询答疑、导购销售的新型服务方式.某高校学生会调查了该校100名学生2022年在直播平台购物的情况,这100名学生中有男生60名、女(1)填写下列2×2列联表;(2)判断能否有99%的把握认为该校学生的性别与2022年在直播平台购物有关?单位:名性别男生女生合计2022年在直播平台购物

2022年未在直播平台购物

合计

(1)2×2列联表如下:性别男生女生合计2022年在直播平台购物4035752022年未在直播平台购物20525合计6040100(2)提出假设H0:该校学生的性别与2022年在直播平台购物没有关系.根据列联表中的数据,可以求得χ2=≈5.556<6.635.故没有99%的把握认为该校学生的性别与2022年在直播平台购物有关.规律方法

利用独立性检验推断“X和Y有关系”的方法(1)提出统计假设H0:X和Y之间没有关系;(2)根据2×2列联表及公式计算统计量χ2的观测值;(3)查临界值表确定临界值x0,然后作出判断.变式训练4通过随机询问某中学110名中学生是否爱好跳绳,得到如下列联表:单位:名爱好跳绳男女合计是402060否203050合计6050110已知χ2=,P(χ2≥6.635)=0.01,P(χ2≥7.879)=0.005,以下结论正确的是(

)A.爱好跳绳与性别有关,这个结论犯错误的概率不超过0.005B.爱好跳绳与性别有关,这个结论犯错误的概率不超过0.01C.爱好跳绳与性别无关D.爱好跳绳与性别无关,这个结论犯错误的概率不超过0.01B解析

χ2=≈7.82,因为P(χ2≥6.635)=0.01,P(χ2≥7.879)=0.005,又6.635<7.82<7.879,根据独立性检验知,爱好跳绳与性别有关,这个结论犯错误的概率不超过0.01.故选B.本节要点归纳1.知识清单:(1)列联表;(2)独立性检验.2.方法归纳:利用2×2列联表数据特征及公式求χ2,利用临界值与χ2比较.3.特别提示:χ2计算公式较复杂,一是公式要清楚;二是要依据数值顺序代入数值;三是计算时要细心,若能够约分,则先约分再计算;χ2>x0是指“两个分类变量之间有关系”时的把握是[1-P(χ2>x0)]×100%,也就是犯错误的概率是P(χ2>x0),不要混淆两者的说法.成果验收·课堂达标检测1234567891011121314A级必备知识基础练1.经过对χ2的统计量的研究,得到了若干个临界值,当χ2≤3.841时,我们认为事件A与B(

)A.有95%的把握认为A与B有关系B.有99%的把握认为A与B有关系C.没有充分理由说明事件A与B有关系D.有90%的把握认为A与B有关系C解析

当χ2>3.841时,有不少于95%的把握认为A与B有关系,但当χ2≤3.841时,只能说明没有充分理由证明A与B有关系.故选C.12345678910111213142.为了判定两个分类变量X和Y是否有关系,应用独立性检验算得χ2的观测值为5,又已知P(χ2≥3.841)=0.05,P(χ2≥6.635)=0.01,则下列说法正确的是(

)A.有99%以上的把握认为“X和Y有关系”B.有99%以上的把握认为“X和Y没有关系”C.有95%以上的把握认为“X和Y有关系”D.有95%以上的把握认为“X和Y没有关系”C解析

∵3.481<χ2=5<6.635,而在观测值表中对应于3.841的是0.05,对应于6.635的是0.01,∴有1-0.05=95%以上的把握认为“X和Y有关系”.故选C.12345678910111213143.根据分类变量X与Y的数据,计算得到χ2=3.974,下列判断正确的是(

)A.有不少于95%的把握认为变量X与Y有关系B.有不少于95%的把握认为变量X与Y没有关系C.没有充分的证据显示变量X与Y有关系D.没有充分的证据显示变量X与Y不独立,这个结论犯错误的概率不超过0.05A解析

∵χ2=3.974>3.841,∴有不少于95%的把握认为变量X与Y有关系.12345678910111213144.某学校食堂对高三学生偏爱蔬菜还是肉类与性别的关系进行了一次调查,根据独立性检验原理,处理所得数据之后发现,有97.5%的把握但没有99%的把握认为偏爱蔬菜还是肉类与性别有关,则χ2的观测值可能为(

)A.χ2=3.206 B.χ2=6.625C.χ2=7.869 D.χ2=11.208B解析

∵有97.5%的把握但没有99%的把握认为偏爱蔬菜还是肉类与性别有关,∴5.024<χ2≤6.635,故B选项符合题意.故选B.12345678910111213145.下表是一个2×2列联表,则表中a,b的值分别为(

)变量y1y2合计x1b21ex2c2533合计ad100A.46,54 B.54,46 C.52,54 D.50,52B解析

由表格中的数据可得c=33-25=8,d=21+25=46,所以a=100-46=54,b=54-8=46.故选B.12345678910111213146.(多选题)下列有关独立性检验的四个结论正确的是(

)A.两个变量的2×2列联表中,对角线上数据的乘积相差越大,说明两个变量有关系成立的可能性就越大B.对分类变量X与Y的统计量χ2的观测值x0来说,x0越小,“X与Y有关系”的可信程度越小C.由独立性检验可知:有95%的把握认为秃顶与患心脏病有关,我们说某人秃顶,那么他有95%的可能患有心脏病D.由独立性检验可知:有99%的把握认为吸烟与患肺癌有关,是指在犯错误的概率不超过1%的前提下认为吸烟与患肺癌有关ABD1234567891011121314解析

对于A,两个变量的2×2列联表中,对角线上数据的乘积相差越大,说明两个变量有关系成立的可能性就越大,所以A正确;对于B,对分类变量X与Y的统计量χ2的观测值x0来说,x0越小,“X与Y有关系”的可信程度越小,所以B正确;对于C,由独立性检验可知:有95%的把握认为秃顶与患心脏病有关,不是说某人秃顶,那么他有95%的可能患有心脏病,C错误;对于D,由独立性检验可知:有99%的把握认为吸烟与患肺癌有关,是指在犯错误的概率不超过1%的前提下认为吸烟与患肺癌有关,所以D正确.故选ABD.12345678910111213147.某研究机构为了解大学生对冰壶运动是否感兴趣,从某大学随机抽取了600人进行调查,经统计男生与女生的人数之比是2∶1,对冰壶运动有兴趣的人数占总数的,女生中有50人对冰壶运动没有兴趣.(1)完成下面2×2列联表;(2)判断是否有99.9%的把握认为对冰壶运动是否有兴趣与性别有关.单位:人性别有兴趣没有兴趣合计男

50

合计

6001234567891011121314解

(1)由题意,从某大学随机抽取了600人进行调查,经统计男生与女生的因为女生中有50人对冰壶运动没有兴趣,所以男生有兴趣的有250人,没有兴趣的有150人,女生有兴趣的有150人.可得如下2×2列联表:1234567891011121314单位:人

性别有兴趣没有兴趣合计男250150400女15050200合计400200600(2)提出统计假设H0:对冰壶运动是否有兴趣与性别无关.根据列联表中的数据,可以求得χ2==9.375<10.828,所以没有99.9%的把握认为对冰壶运动是否有兴趣与性别有关.1234567891011121314B级关键能力提升练8.(多选题)某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:这种血清不能起到预防感冒的作用.利用2×2列联表计算的χ2≈3.918,经查临界值表知P(χ2≥3.841)=0.05,则下列表述不正确的是(

)A.有95%的把握认为“这种血清能起到预防感冒的作用”B.若有人未使用该血清,那么他一年中有95%的可能性得感冒C.这种血清预防感冒的有效率为95%D.这种血清预防感冒的有效率为5%BCD1234567891011121314解析

根据查对临界值表知P(χ2≥3.841)=0.05,又χ2≈3.918>3.841,故有95%的把握认为“这种血清能起到预防感冒的作用”,即A正确;95%仅是指“血清与预防感冒”可信程度,但也有“在100个使用这种血清的人中一个患感冒的人也没有”的可能,即B,C,D不正确.故选BCD.12345678910111213149.每年的毕业季都是高校毕业生求职和公司招聘最忙碌的时候,甲、乙两家公司今年分别提供了2个和3个不同的职位,一共收到了100份简历,具体数据如下:单位:份公司文史男文史女理工男理工女甲10102010乙1520105分析毕业生的选择意愿与性别的关联时,对应的χ2的观测值x1≈1.010,分析毕业生的选择意愿与专业关联时,对应的χ2的观测值x2≈9.090,则下列说法正确的是(

)1234567891011121314A.有99.9%的把握认为毕业生的选择意愿与专业相关联B.毕业生在选择甲、乙公司时,选择意愿与专业的关联比与性别的关联性更大一些C.理科专业的学生更倾向于选择乙公司D.女性毕业生更倾向于选择甲公司答案

B123456789101112131410.某班主任对全班50名学生进行了作业量的评价调查,所得数据如下表所示:单位:名性别认为作业量大认为作业量不大合计男生18927女生81523合计262450则认为作业量的大小与学生的性别有关的犯错误的概率不超过

.

0.025解析

因为χ2=≈5.059,5.024<5.059<6.635,所以认为作业量的大小与学生的性别有关的犯错误的概率不超过0.025.123456789101112131411.为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:PM2.5SO2[0,50](50,150](150,475][0,35]32184(35,75]6812(75,115]3710(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;1234567891011121314(2)根据所给数据,完成下面的2×2列联表:PM2.5SO2[0,150](150,475][0,75]

(75,115]

(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.P(χ2≥x0)0.0500.0100.001x03.8416.63510.8281234567891011121314解

(1)根据抽查数据,该市100天空气中PM2.5浓度不超过75,且SO2浓度不超过150的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论