2024年广东省高考数学一轮复习第9章第4讲:列联表与独立性检验(附答案解析)_第1页
2024年广东省高考数学一轮复习第9章第4讲:列联表与独立性检验(附答案解析)_第2页
2024年广东省高考数学一轮复习第9章第4讲:列联表与独立性检验(附答案解析)_第3页
2024年广东省高考数学一轮复习第9章第4讲:列联表与独立性检验(附答案解析)_第4页
2024年广东省高考数学一轮复习第9章第4讲:列联表与独立性检验(附答案解析)_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2024年广东省高考数学一轮复习第9章第4讲:列联表与独

立性检验

【考试要求】1.通过实例,理解2X2列联表的统计意义.2.通过实例,了解独立性检验及其应用.

■落实主干知识

佚口识梳理】

1.分类变量

为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机

变量称为分类变量.分类变量的取值可以用实数表示.

2.列联表与独立性检验

(1)关于分类变量X和y的抽样数据的2X2列联表:

Y

X合计

Y=0Y=\

x=oaba~\~b

x=\cdc~\~d

合计a+cb+d

(2)计算随机变量~〃('-忖2------,利用炉的取值推断分类变量x和y是否独立

(a+Z>)(c+rf)(a+c)(6+</)

的方法称为好独立性检验.

如表为5个常用的小概率值和相应的临界值.

a0.10.050.010.0050.001

Xa2.7063.8416.6357.87910.828

【思考辨析】

判断下列结论是否正确(请在括号中打“J”或“X”)

(1)2X2列联表中的数据是两个分类变量的频数.(V)

(2)事件力和B的独立性检验无关,即两个事件互不影响.(X)

(3”的大小是判断事件/和8是否相关的统计量.(V)

(4)在2X2列联表中,若|4一切越小,则说明两个分类变量之间关系越强.(X)

【教材改编题】

1.某机构为调查网游爱好者是否有性别差异,通过调研数据统计:在500名男生中有200

第1页共17页

名爱玩网游,在400名女生中有50名爱玩网游.若要确定网游爱好是否与性别有关时,用下

列最适合的统计方法是()

A.均值B.方差

C.独立性检验D.回归分析

答案C

解析由题意可知,“爱玩网游”与“性别”是两类变量,其是否有关,应用独立性检验判断.

2.如表是2X2列联表,则表中。,6的值分别为()

yiy2合计

XIa835

X2113445

合计b4280

A.27,38B.28,38

C.27,37D.28,37

答案A

解析a=35-8=27,6=a+ll=27+ll=38.

3.己知「(/2635)=0.01,尸(/210.828)=0.001.在检验喜欢某项体育运动与性别是否有关

的过程中,某研究员搜集数据并计算得到*=7.235,则根据小概率值口=的*独立性

检验,分析喜欢该项体育运动与性别有关.

答案0.01

解析因为6.635<7.235<10.828,所以根据小概率值a=0.01的炉独立性检验,分析喜欢该项

体育运动与性别有关.

■探究核心题型

题型一列联表与炉的计算

例1(1)为了解某大学的学生是否喜欢体育锻炼,用简单随机抽样方法在校园内调查了120

位学生,得到如下2X2列联表:

男女合计

喜欢ab73

不喜欢C25

合计74

则a-b—c等于()

A.7B.8C.9D.10

第2页共17页

答案c

解析根据题意,可得c=120—73—25=22,。=74—22=52,6=73-52=21,

补充完整2X2列联表为:

男女合计

喜欢522173

不喜欢222547

合计7446120

.•.a-b—c=52-21-22=9.

(2)为加强素质教育,使学生各方面全面发展,某学校对学生文化课与体育课的成绩进行了调

查统计,结果如表:

体育课不及格体育课及格合计

文化课及格57221278

文化课不及格164359

合计73264337

在对体育课成绩与文化课成绩进行独立性检验时,根据以上数据可得到72的值为()

A.1.255B.38.214

C.0.0037D.2.058

答案A

解析k——驷*——

(〃+b)(c+d){a+c)(b+d)

—337X(57X43—16X221)2…

一21.255.

278X59X73X264

思维升华2X2列联表是4行4列,计算时要准确无误,关键是对涉及的变量分清类别.

跟踪训练1某次国际会议为了搞好对外宣传工作,会务组选聘了50名记者担任对外翻译工

作,在如表“性别与会外语”的2X2列联表中,a+b+d^.

会外语不会外语合计

男ab20

女6d

合计1850

答案44

解析由题意得a+b+d+6=50,

第3页共17页

所以<j+b+d=50—6=44.

题型二列联表与独立性检验

例2(2022•全国甲卷改编)甲、乙两城之间的长途客车均由1和8两家公司运营.为了解这

两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:

准点班次数未准点班次数

A24020

B21030

(1)根据上表,分别估计这两家公司在甲、乙两城之间长途客车准点的概率;

(2)能否根据小概率值a=0.1的独立性检验,分析甲、乙两城之间的长途客车是否准点与客车

所属公司有关?

______n(ad-bc)2______

附:x2〃=a+6+c+d.

(a+6)(c+,/)(“+c)(6+,/)

a0.10.050.01

2.7063.8416.635

Xa

解(1)根据表中数据,/家公司共有班次260个,准点班次有240个,

设/家公司长途客车准点事件为

则尸叱翁言

8家公司共有班次240个,准点班次有210个,

设B家公司长途客车准点事件为N,

则尸的=瑞=3

所以/家公司长途客车准点的概率为净

8家公司长途客车准点的概率为工

8

(2)列联表如下:

准点班次数未准点班次数合计

A24020260

B21030240

合计45050500

零假设为“。:甲、乙两城之间的长途客车是否准点与客车所属公司无关.

f=500X(240X30-210X20)2

260X240X450X50

第4页共17页

5:::::;3.2O5>2.7O6=::XO,I,

根据小概率值a=0.1的独立性检验,推断为不成立,即认为甲、乙两城之间的长途客车是否

准点与客车所属公司有关.

思维升华独立性检脸的一般步骤

(1)根据样本数据制成2X2列联表.

____n(ad-bc)2____

(2)根据公式/=计算.

(a+b)(c+d)[a+c)(Z>+J)

(3)比较42与临界值的大小关系,作统计推断.

跟踪训练2为了减少自身消费的碳排放,“绿色消费”等绿色生活方式渐成风尚.为获得

不同年龄段的人对“绿色消费”意义的认知情况,某地研究机构将“90后与00后”作为X

组,将“70后与80后”作为8组,并从48两组中各随机选取了100人进行问卷调查,

整理数据后获得如下列联表:

单位:人

认知情况

年龄段合计

知晓不知晓

A组(90后与00后)7525100

B组(70后与80后)4555100

合计12080200

____n(ad-bc¥____

附:x2”=a+6+c+d.

(a+b)(c+d)[a+c)(Z?+</)'

a0.10.050.010.0050.001

Xa2.7063.8416.6357.87910.828

(1)若从样本内知晓“绿色消费”意义的120人中用比例分配的分层随机抽样方法随机抽取

16人,问应在/组、8组中各抽取多少人?

(2)能否依据小概率值a=0.001的独立性检验,分析对“绿色消费”意义的认知情况与年龄

有关?

解(1)由题意知,在力组中抽取的人数为16X至=1().在8组中抽取的人数为16X至~=6.

120120

(2)零假设为“:对“绿色消费”意义的认知情况与年龄无关.

200X(75X55-25X45)2

由题意,得炉=18.75>10.828=x().ooi,

120X80X100X100

故依据小概率值a=0.001的独立性检验,推断仇不成立,即认为对“绿色消费”意义的认知

情况与年龄有关.

第5页共17页

题型三独立性检验的综合应用

例3体育运动是强身健体的重要途径,《中国儿童青少年体育健康促进行动方案(2020—

2030)》(下面简称“体育健康促进行动方案”)中明确提出青少年学生每天在校内参与不少于

60分钟的中高强度身体活动的要求.随着“体育健康促进行动方案”的发布,体育运动受到

各地中小学的高度重视,众多青少年的体质健康得到很大的改善.某中学教师为了了解体育

运动对学生的数学成绩的影响情况,现从该中学高三年级的一次月考中随机抽取1000名学

生,调查他们平均每天的体育运动情况以及本次月考的数学成绩情况,得到如表数据:

数学成绩(分)[30,50)[50,70)[70,90)[90,110)[110,130)[130,150]

人数(人)2512535030015050

运动达标

104514520010743

的人数(人)

约定:平均每天进行体育运动的时间不少于60分钟的为“运动达标”,数学成绩排在年级前

50%以内(含50%)的为“数学成绩达标”.

(1)求该中学高三年级本次月考数学成绩的65%分位数;

(2)请估计该中学高三年级本次月考数学成绩的平均分(同一组中的数据用该组区间的中点值

作代表);

(3)请根据已知数据完成下列列联表,并根据小概率值a=0.001的独立性检验,分析“数学成

绩达标”是否与“运动达标”相关.

数学成绩达标人数数学成绩不达标人数合计

运动达标人数

运动不达标人数

合计

______n(ad-bc)2

附:/2=(〃=q+b+c+</).

(a+/?)(c+d)[a+c)(i>+t/)

a0.0100.0050.001

Xa6.6357.87910.828

解(1)每组的频率依次为0.025,0.125,0.350,0,300,0.150,0.050,

V0.025+0.125+0.350=0.500<0.65,0.025+0.125+0.350+0.300=0.800>0.65,

0.500+0.800_

-H-Un.6r3t,

2

高三年级本次月考数学成绩的65%分位数位于[90,110)内,且为[90,110)的中点100,

该中学高三年级本次月考数学成绩的65%分位数为100.

第6页共17页

(2)该中学高三年级本次月考数学成绩的平均分

x=0.025X40+0.125X60+0.350X80+0.300X100+0.150X120+0.050X140=91.50,

估计该中学高三年级本次月考数学成绩的平均分为91.50分.

(3)列联表如表所示:

数学成绩达标人数数学成绩不达标人数合计

运动达标人数350200550

运动不达标人数150300450

合计5005001000

零假设为H.:“数学成绩达标”与“运动达标”无关,

1000X(35吃300—200X四忆四心如孙。,828f

Z2

550X450X500X500II

,根据小概率值a=0.001的独立性检验,推断”)不成立,即认为“数学成绩达标”与“运动

达标”有关.

思维升华独立性检验的考查,往往与概率和抽样统计图等一起考查,这类问题的求解往往

按各小题及提问的顺序,一步步进行下去,是比较容易解答的,考查单纯的独立性检脸往往

用小题的形式,而且炉的公式一般会在原题中给出.

跟踪训练3某网红奶茶品牌公司计划在万市某区开设加盟分店,为了确定在该区开设分店

的个数,该公司对该市已开设分店的5个区域的数据作了初步处理后得到下列表格,记x表

示在5个区域开设分店的个数,y表示这x个分店的年收入之和.

x(个)23456

y(十万元)2.5344.56

(1)该公司经过初步判断,可用经验回归模型拟合y与x的关系,求y关于x的经验回归方程:

(2)如果该公司最终决定在该区选择两个合适的地段各开设一个分店,根据市场调查得到如下

统计数据,第一分店每天的顾客平均为30人,其中5人会购买该品牌奶茶,第二分店每天的

顾客平均为80人,其中20人会购买该品牌奶茶.依据小概率值a=0.1的独立性检验,分析

两个店的顾客下单率有无差异.

______n(ad-bc¥______

参考公式:6=错误!,a=y—bx:/2=xo.i=2.706.

(a+b)(c+d)(a+c)(b+d)

2+3+4+5+6

解(1)由题意可得,=--------------------=4

5

2.5+3+4+4.5+6.

yv=----------------=4,

5

第7页共17页

错误!办=2*2.5+3><3+4X4+5X4.5+6X6=88.5,

错误*=22+32+42+52+62=90,

设y关于x的经验回归方程为

n」;山口.88.5-5X4X4…

则b=错误!=-----------=0.85,

90-5X42

AA

a=y-bx=4-0.85X4=0.6,

关于x的经验回归方程为y=0.85x+0.6.

(2)零假设为为:两个店的顾客下单率无差异,则

由题意可知2X2列联表如表所示:

不下单下单合计

分店一25530

分店二602080

合计8525110

.,=110X(25X20-5X60)2

*44O.863<2.7O6=XOJ,

30X80X85X25

,根据小概率值a=0.1的独立性检验,没有充分证据推断为不成立,即两个店的顾客下单率

没有差异.

课时精练

立基础保分练

1.观察下列各图,其中两个分类变量x,y之间关系最强的是()

y\?2

D

答案D

解析观察等高堆积条形图易知D选项两个分类变量之间关系最强.

第8页共17页

2.下列关于独立性检验的说法正确的是()

A.独立性检验是对两个变量是否具有线性相关关系的一种检验

B.独立性检验可以100%确定两个变量之间是否具有某种关系

C.利用Z2独立性检验推断吸烟与患肺病的关联中,若有99%的把握认为吸烟与患肺病有关

系时,则我们可以说在100个吸烟的人中,有99人患肺病

D.对于独立性检验,随机变量好的值越小,判定“两变量有关系”犯错误的概率越大

答案D

解析对于A,独立性检验是通过卡方计算来判断两个变量存在关联的可能性的一种方法,

并非检验二者是否是线性相关,故错误;

对于B,独立性检验并不能100%确定两个变量相关,故错误;

对于C,99%是指“抽烟”和“患肺病”存在关联的可能性,并非抽烟人中患肺病的发病率,

故错误;

对于D,根据卡方计算的定义可知该选项正确.

3.为了考察某种中成药预防流感的效果,抽样调查40人,得到如下数据:

流感

药物

患流感未患流感

服用218

未服用812

下表是Z2独立性检验中几个常用的小概率值和相应的临界值:

a0.10.050.010.005

Xa2.7063.8416.6357.879

____n(ad—bc¥____

根据表中数据,计算炉=若由此认为“该药物预防流感有效果”,

(a+h)(c+rf)(a+c)(Z>+rf)

则该结论出错的概率不超过()

A.0.05B.0.1C.0.01D.0.005

答案A

,40X(2X12-8X18)2

解析由题意知,Z2=------------------=4.8>3.84l=xo.o5,

10X30X20X20

由临界值表可知,认为“该药物预防流感有效果”,则该结论出错的概率不超过0.05.

4.(多选)(2022•郑州模拟)为考察一种新型药物预防疾病的效果,某科研小组进行动物实验,

收集整理数据后将所得结果填入相应的2X2列联表中,由列联表中的数据计算得犬-9.616.

参照附表,下列结论正确的是()

附表:

第9页共17页

a0.10.050.010.0050.001

Xa2.7063.8416.6357.87910.828

A.根据小概率值a=0.001的独立性检验,分析认为“药物有效”

B.根据小概率值a=0.001的独立性检验,分析认为“药物无效”

C.根据小概率值a=0.0()5的独立性检验,分析认为“药物有效”

D.根据小概率值a=0.005的独立性检验,分析认为“药物无效”

答案BC

解析因为好心9.616,所以7.879<好<10.828,所以根据小概率值a=0.001的独立性检验,分

析认为“药物无效”.

根据小概率值a=0.005的独立性检验,分析认为“药物有效”.

5.(多选)(2023・南通模拟)根据分类变量x与y的观察数据,计算得到好=2.974,依据表中给

出的Z2独立性检验中的小概率值和相应的临界值,作出下列判断,正确的是()

a0.10.050.010.0050.001

Xa2.7063.8416.6357.87910.828

A.根据小概率值a=0.05的独立性检验,分析变量x与y相互独立

B.根据小概率值a=0.05的独立性检验,分析变量x与y不相互独立

C.变量x与少相互独立,这个结论犯错误的概率不超过0.1

D.变量x与、不相互独立,这个结论犯错误的概率不超过0.1

答案AD

解析因为十=2.974>2.706,所以变量x与y不相互独立,这个结论犯错误的概率不超过0.1.

6.为考查某种营养品对儿童身高增长的影响,选取部分儿童进行试验,根据100个有放回简

单随机样本的数据,得到如下列联表,由表可知下列说法正确的是()

身身

营养品合计

有明显增长无明显增长

食用a1050

未食用h3050

合计6040100

______n(ad-______

参考公式:z2其中n=a+b+c-\-d.

(a+b)(c+d)(a+c)(b+d)

参考数据:

a0.10.050.010.0050.001

Xa2.7063.8416.6357.87910.828

第10页共17页

A.a=b=30

B.产〃2.667

C.从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是1

D.根据小概率值a=().OOl的独立性检验,可以认为该营养品对儿童身高增长有影响

答案D

解析由题可知。=50—10=40,*=50-30=20,所以A错误;

=100><(40X30—10X20F

^16.667>1O.828=XO.OOI,

50X50X60X40

所以根据小概率值。=0.001的独立性检验,

可以认为该营养品对儿童身高增长有影响,所以B错误,D正确;

从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是坐=2,

1005

所以C错误.

7.如表是对于“喜欢运动”与性别是否有关的2义2列联表,依据表中的数据,得到

炉〜(结果保留到小数点后3位).

喜欢运动不喜欢运动合计

男402868

女51217

合计454085

答案4.722

,85X(40X12-28X5)2

解析/2=-------------------*4.722.

45X40X68X17

8.一项研究同年龄段的男、女生的注意力差别的脑功能实验,其实验数据如表所示:

注意力稳定注意力不稳定

男生297

女生335

则/=(精确到小数点后三位),依据概率值a=0.05的独立性检验,该实验

该年龄段的学生在注意力的稳定性上对于性别没有显著差异(填拒绝或支持).

答案0.538支持

解析由表中数据可知a=29,b=7,c=33,d—5,n—a+b+c+d—74,

根据炉=——迤匕Q——,

(a+c)(c+d)(b+d)(q+b)

第11页共17页

计算可知/=_________74X(145-231(_________

«=O.538<3.841=XO.O5,

(29+33)X(33+5)X(7+5)X(29+7)

所以没有充分证据认为学生在注意力的稳定性上与性别有关,

即该实验支持该年龄段的学生在注意力的稳定性上对于性别没有显著差异.

9.(2021•全国甲卷改编)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为

了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如

下表:

一级品二级品合计

甲机床15050200

乙机床12080200

合计270130400

(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?

(2)依据小概率值a=0.01的独立性检验能否认为甲机床的产品质量与乙机床的产品质量有差

异?

____n(ad~~bc¥____

n=a+b+c+d.

(a+fe)(c+«/)(«+c)(fe+J)

a0.050.010.001

Xa3.8416.63510.828

解(1)根据题表中数据知,甲机床生产的产品中一级品的频率是荒=0.75,乙机床生产的产

品中一级品的频率是亶=0.6.

200

(2)零假设为为:甲机床的产品质量与乙机床的产品质量无差异,

根据题表中的数据可得

,=400X(150X80—120X50)2

'200X200X270X130

=—^1O.256>6.635=XOOI,

39

所以依据小概率值a=0.01的独立性检验,推断为不成立,即认为甲机床的产品质量与乙机

床的产品质量有差异.

10.某花圃为提高某品种花苗质量,开展技术创新活动,48在实验地分别用甲、乙方法培

育该品种花苗.为观测其生长情况,分别在实验地随机抽取各50株,对每株进行综合评分,

将每株所得的综合评分制成如图所示的频率分布直方图.记综合评分为80及以上的花苗为

优质花苗.

第12页共17页

频率

05060708090100综合评分

(1)求图中。的值,并求综合评分的中位数;

(2)填写下面的2X2列联表,并根据小概率值a=0.01的独立性检验,分析优质花苗与培育方

法是否有关,请说明理由.

优质花苗非优质花苗合计

甲培育法20

乙培育法10

合计

____n(ad-bc¥____

附:x2=其中n—a+b+c+d.

(a+6)(c+d)(a+c)(6+d)

a0.10.050.010.0050.001

2.7063.8416.6357.87910.828

Xa

解(1)由直方图的性质可知,0.005X10+0.010X10+0.025X10+10a+0.020X10=1,

解得a=0.040,

因为(0.02+0.04)X10=0.6>0.5,所以中位数位于[80,90)内,

设中位数为x,则有0.020X10+0.040X(90-x)=0.5,解得x=82.5.

故综合评分的中位数为82.5.

(2)由(1)得优质花苗的频率为0.6,

所以样本中优质花苗的数量为60,

得如下列联表:

优质花苗非优质花苗合计

甲培育法203050

乙培育法401050

合计6040100

零假设为“。:优质花苗与培育方法无关,

,100X(20X10-30X40)2,-…

/2=------------------------------------------------««16.667>6.635=xo.oi,

60X40X50X50

第13页共17页

所以根据小概率值a=0.01的独立性检验,推断,。不成立,即认为优质花苗与培育方法有关.

巳综合提升练

11.在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只

基因编辑小鼠对该病毒疫苗进行实验,得到如下2X2列联表(部分数据缺失):

被某病毒感染未被某病毒感染合计

注射疫苗1050

未注射疫苗3050

合计30100

计算可知,根据小概率值a=■的独立性检验,分析“给基因编辑小鼠注射该种疫苗

能起到预防该病毒感染的效果”()

n(ad-bc)2

附:x2=n=a+h+c+d.

(a+6)(c+d)(a+c)(6+d)

a0.10.050.010.0050.001

Xa2.7063.8416.6357.87910.828

A.0.001B.0.05

C.0.01D.0.005

答案B

解析完善2X2列联表如下:

被某病毒感染未被某病毒感染合计

注射疫苗104050

未注射疫苗203050

合计3070100

零假设为“0:”给基因编辑小鼠注射该种疫苗不能起到预防该病毒感染的效果”.

100X(10X30-40X20)2

因为*=n4.762,3.841<4.762<6.635,

30X70X50X50

所以根据小概率值a=0.05的独立性检验,推断为不成立,

即认为“给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果”.

12.(多选)有两个分类变量X,匕其列联表如表所示.

Y

X合计

Y\Y2

第14页共17页

a20-«20

在\5~a30+a45

合计155065

其中〃,15一〃均为大于5的整数,若依据a=0.05的独立性检验可以认为X与丫有关,则°

的可能取值为()

A.6B.7C.8D.9

答案CD

解析根据a>5且15—a>5,aHL,知a可取6,7,8,9.由表中数据及题意,得

65XW30+a)-a5』)(20』)F」3X(13L6()&84i05,结合选项,知°的可能

20X45X15X5020X45X3X2

取值为8,9.

拓展冲刺练

13.(多选)在一次恶劣天气的飞行航程中,调查男、女乘客在飞机上晕机的情况,得到如下

列联表:(单位:人),则()

晕机

性别合计

晕机者未晕机者

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论