高中数学《列联表与独立性检验》教案_第1页
高中数学《列联表与独立性检验》教案_第2页
高中数学《列联表与独立性检验》教案_第3页
高中数学《列联表与独立性检验》教案_第4页
高中数学《列联表与独立性检验》教案_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

8.3列联表与独立性检验

(第一课时分类变量与列联表)

课标要求素养要求

1.通过实例,理解2X2列联表的统计意义.通过学习2X2列联表,提升

2.理解判断两个分类变量是否有关系的常用数学抽象、直观想象及数据分

方法.析素养.

【课前预习】

新知探究

A情境引入

饮用水的质量是人类普遍关心的问题,根据统计,饮用优质水的518人中,身

体状况优秀的有466人,饮用一般水的312人中,身体状况优秀的有218人.

问题人的身体健康状况与饮用水的质量之间有关系吗?

提示我们可以根据2X2列联表找到人的身体健康与饮用水之间的关系,也就

是本节课所要学习的内容.

上知识梳理

1.分类变量

这里所说的变量和值不一定是具体的数值,例如:性别变量,其取值为男和女

两种

我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变

量称为分类变量,分类变量的取值可以用实数表示.

2.2X2列联表

在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数

据分类统计,并做成表格加以保存,我们将这类数据统计表称为2X2列联表,

2X2列联表给出了成对分类变量数据的交叉分类频数.

一般地,假设有两个分类变量X和Y,它们的取值分别为{xi,x』和{山,y2},

其2X2列联表为

yiY2合计

Xiaba+b

x2cdc+d

合计a+cb+da+b+c+d

3.等高堆积条形图

等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常

用等高条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们

可以推断结果.

拓展深化

[微判断]

1.分类变量中的变量与函数中的变量是同一概念.(X)

提示分类变量中的变量是指一定范围内的两种现象或性质,与函数中的变量

不是同一概念.

2,列联表中的数据是两个分类变量的频数.(J)

3.列联表、频率分析法、等高条形图都可初步分析两分类变量是否有关

系.(V)

[微训练]

1.下列不是分类变量的是()

A.近视B.成绩

C.血压D.饮酒

解析近视变量有近视与不近视两种类别,血压变量有异常、正常两种类别,

饮酒变量有饮酒与不饮酒两种类别.故选B.

答案B

2.某校为了检验高中数学新课程改革的成果,在两个班进行教学方式的对比试

验,两个月后进行了一次检测,试验班与对照班成绩统计如2X2列联表所示

(单位:人),则其中m=,n=.

80分及80分以

80分以下合计

试验班321850

对照班24m50

合计5644n

24+m=50,

解析由题意得,

56+44=n,

m=26,

解得

,n=100.

答案26100

[微思考]

1.是否吸烟、是否患肺癌是什么变量?

提示分类变量.

2.吸烟与患肺癌之间的关系还是前面我们研究的线性相关关系吗?

提示不是.

【课堂互动】

题型一用2X2列联表分析两分类变量间的关系

【例1】在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以

上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为

主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另

外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用

率与黑判断二者是否有关系•

解2X2列联表如下:

年龄在六十岁年龄在六十

合计

以上岁以下

饮食以蔬菜为主432164

饮食以肉类为主273360

合计7054124

将表中数据代入公式得

a43c27

—□7=77=0-671875.~r;=—=0.45.

a+b64c+d60

显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年

龄有关系.

规律方法(1)作2X2列联表时,关键是对涉及的变量分清类别.计算时要准

确无误.

(2)利用2X2列联表分析两个分类变量间的关系时,首先要根据题中数据获得

2X2列联表,然后根据频率特征,即将品;与岛岛与人的值相比,直

观地反映出两个分类变量间是否相互影响,但方法较粗劣.

【训练1】假设有两个分类变量X与Y,它们的可能取值分别为{x“xj和

{y”yj,其2X2列联表为:

□in

tn

则当m取下面何值时,X与Y的关系最弱()

A.8B.9

C.14D.19

解析由10X26g18nb解得所以当m=14时,X与Y的关系最弱.

答案C

题型二用等高堆积条形图分析两分类变量间的关系

【例2】某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格

内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有

213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格

类型是否有关系.

解作列联表如下:

性格内向性格外向合计

考前心情紧张332213545

考前心情不紧张94381475

合计4265941020

相应的等高堆积条形图如图所示:

1=]性格外向

(=3性格内向

考前心情紧张考前心情不紧张

图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的人数的比例,

从图中可以看出考前心情紧张的样本中性格内向的人数占的比例比考前心情不

紧张样本中性格内向的人数占的比例高,可以认为考前心情紧张与性格类型有

关.

规律方法利用等高堆积条形图判断两个分类变量是否相关的步骤:

【训练2】在调查的480名男人中有38人患色盲,520名女人中有6名患色

盲,试利用图形来判断色盲与性别是否有关?

解根据题目给出的数据作出如下的列联表:

根据列联表作出相应的等高堆积条形图:

不色自

色甘

从等高堆积条形图来看,在男人中患色盲的比例要比在女人中患色盲的比例大

得多,因此,我们认为患色盲与性别是有关系的.

【素养达成】

一、素养落地

1.通过本节课的学习,进一步提升数学抽象、直观想象及数据分析素养.

2.列联表与等高堆积条形图

列联表由两个分类变量之间频率大小的差异说明这两个变量之间是否有相关关

系,而利用等高堆积条形图能形象直观地反映它们之间的差异,进而推断它们

之间是否具有相关关系.

二、素养训练

1.与表格相比,能更直观地反映出相关数据总体状况的是()

A.列联表B.散点图

C.残差图D.等高堆积条形图

答案D

2.在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670

人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,则性

别与喜欢吃甜食的2X2列联表为_______.

答案

喜欢吃甜食不喜欢吃甜食合计

男117413530

女492178670

合计6095911200

3.根据如图所示的等高堆积条形图可知吸烟与患肺病关系(填“有”或

“没有”).

0.8

().7

().6□不患肺病

().5口患肺病

().1

0.3

0.2

不吸烟吸烟

解析从等高条形图上可以明显地看出吸烟患肺病的频率远远大于不吸烟患肺

病的频率.

答案有

4.(多空题)下面是一个2X2列联表:

yiY2合计

X1a2173

X222527

合计b46100

则表中a=,b=

a+21=73,a=52,

解析由题意得解得

a+2=b,b=54.

答案5254

5.为考察某种药物预防疾病的效果进行动物试验,得到如下列联表:

患病未患病合计

服用药104555

未服用药203050

合计3075105

试用等高条形图分析服用药和患病之间是否有关系.

解根据列联表所给的数据可得出服用药患病的频率为二比0.18,未服用药患

病的频率为*=0.4,两者的差距是10.18—0.41=0.22,两者相差很大,作出

等高条形图如图所示,因此服用药与患病有关系.

【课后作业】

基础达标

一、选择题

1.观察下列各图,其中两个分类变量X,y之间关系最强的是()

解析观察等高条形图发现■^和相差越大,就判断两个分类变量之间

Xi-rYiX2।72

关系越强.

答案D

2.可以粗略地判断两个分类变量是否有关系的是()

A.散点图B.等高堆积条形图

C.残差图D.以上都不对

解析用等高堆积条形图可以粗略地判断两个分类变量是否有关系,体现了数

形结合思想,但是无法给出结论的可信程度,故选B.

答案B

3.(多选题)分类变量X和Y的列联表如下:

合计

yiy2

X1aba+b

Cdc+d

X2

合计a+cb+da+b+c+d

则下列说法不正确的是()

A.ad-be越小,说明X与Y关系越弱

B.ad-bc越大,说明X与Y关系越强

C.(ad—beT越大,说明X与Y关系越强

D.(ad—be)?越接近于0,说明X与Y关系越强

解析|ad—bc|越小,说明X与Y关系越弱,|ad—bc|越大,说明X与Y关系

越强.

答案ABD

4.己知两分类变量的列联表如下:

AA合计

B2008001000

B180a180+a

合计380800+a1180+a

最后发现,这两个分类变量没有任何关系,则a的值可能是])

A.200B.720

C.100D.180

解析由于A和B没有任何关系,根据列联表可知片;和盛一基本相等,检

验可知,B满足条件,故选B.

答案B

5.(多选题)如图是调查某地区男、女中学生喜欢理科的等高条形图,阴影部分

表示喜欢理科的百分比,从图可以看出()

A.性别与喜欢理科无关

B.女生中喜欢理科的百分比为80%

C.男生比女生喜欢理科的可能性大些

D.男生不喜欢理科的百分比为40%

解析由题图知女生中喜欢理科的百分比为20%,男生不喜欢理科的百分比为

40%,男生比女生喜欢理科的可能性大些,故A,B不正确,C,D正确.

答案CD

二、填空题

6.某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该

收集的数据是.

答案男正教授人数,男副教授人数;女正教授人数,女副教授人数

7.2013年6月11日,中国的“神舟十号”发射成功,由此许多人认为中国进

入了航天强国之列,也有许多人持反对意见,为此进行了调查.在参加调查的

3648名男性公民与3432名女性公民中,持反对意见的男性有1843人、女

性有1672人,在运用这些数据说明中国“神十”发射成功是否与中国进入航

天强国有关系时,用下列给出的最具说服力(填序号).

①回归直线方程;②平均数与方差;③等高堆积条形图.

解析由于参加调查的公民按性别被分成两组,而且每一组又被分成两种情

况:认为有关与无关,故该资料取自完全随机统计,符合2X2列联表的要求,

应用等高堆积条形图最具说服力.

答案③

8.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了

100名电视观众,相关的数据如下表所示:

文艺节目新闻节目合计

20至40岁401858

大于40岁152742

合计5545100

由表中数据直观分析,收看新闻节目的观众是否与年龄有关:(填

“是”或“否”).

解析因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40

岁的42名观众中有27名观众收看新闻节目,即占=卷,三=篇两者相

a十b58c+d42

差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的.

答案是

三、解答题

9.为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的

尿液作尿棕色素定性检查,结果如下:

组别阳性数阴性数合计

铅中毒病人29736

对照组92837

合计383573

试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无

差别,铅中毒病人与尿棕色素为阳性是否有关系?

解等高条形图如图所示:

其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频

率.

由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明

显,因此铅中毒病人与尿棕色素为阳性有关系.

10.当某矿石粉厂生产一种矿石粉时,在数天内就有部分工人患职业性皮肤

炎.在生产季节期间,随机抽取车间工人抽血化验,75名穿新防护服的车间工

人中5例阳性,70例阴性,28名穿旧防护服的中间工人中10例阳性,18例阴

性,请用图形判定这种新防护服对预防工人职业性皮肤炎是否有效.(注:显阴

性即未患皮肤炎)

解由题目所给的数据得2义2列联表:

阳性例数阴性例数合计

穿新防护服57075

穿旧防护服101828

合计1588103

相应的等高条形图如图所示.

图中两个深色条的高分别表示穿新、旧防护服样本中呈阳性的频率,从图中可

以看出,穿旧防护服呈阳性的频率高于穿新防护服呈阳性的频率.因此,可以

认为新防护服比旧防护服对预防这种皮肤炎有效.

能力提升

11.在2X2列联表中,两个比值相差越大,两个分类变量有关系的可能性就越

大,那么这两个比值为()

A,a+b与c+dB.二^与

c+da+b

厂a」ca.c

D.与二^

a十db+cb十da+c

acac+ad_ac-bead—be

解析由题意,——

a+bc+d(a+b)(c+d)(a+b)(c+d)

因为lad—bc|的值越大,两个分类变量有关系的可能性就越大,故选A.

答案A

12.为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,

数据如下:

子女吸烟子女不吸烟合计

父母吸烟237678915

父母不吸烟83522605

合计32012001520

利用等高条形图判断父母吸烟对子女吸烟是否有影响?

由图形观察可以看出父母吸烟者中子女吸烟的比例要比父母不吸烟者中子女吸

烟的比例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关系”.

创新猜想

13.(多选题)已知两个分类变量X,Y,它们的取值分别为反,xj和{y”y2},

ac

B---------------

a+bc+d

C—也—心—也—

*a+b+c+da+b+c+d

D—也—%—山—

'a+b+c+da+b+c+d

解析因为分类变量X,Y没有关系,所以米化简得ad-bc,所以

A,B正确,C,D显然不正确.

答案AB

14.(多空题)下表是关于男婴与女婴出生时间调查的列联表:

晚上白天合计

男婴45AB

女婴E35C

合计98D180

那么,A=,B=,C=,D=E=

'45+E=98,,A=47,

98+D=180,B=92,

解析由列联表知识得<A+35=D,解得vC=88,

E+35=C,D=82,

<B+C=180,、E=53.

答案4792888253

8.3列联表与独立性检验

(第二课时独立性检验)

课标要求素养要求

了解随机变量Xz的意义,通过对典型

通过运用列联表进行独立性检验,

案例分析,了解独立性检验的基本思想

提升数学抽象及数据分析素养.

和方法.

【课前预习】

新知探究

A情境引入

山东省教育厅大力推行素质教育,增加了高中生的课外活动时间,某校调查了

学生的课外活动方式,结果整理成下表:

体育文娱合计

男生210230440

女生60290350

合计270520790

问题如何判定“喜欢体育还是文娱与性别是否有联系”?

提示可通过表格与图形进行直观分析,也可通过统计分析定量判断.

,知识梳理

1.临界值

X2统计量也可以用来作相关性的度量.X2越小说明变量之间越独立,X2越

大说明变量之间越相关

X=<…忽略X2的实际分布与该近似分布的

(a-rb)(c十d)(a+c)(b十d)

误差后,对于任何小概率值可以找到相应的正实数心,使得P(x2,xa)=

a成立.我们称r为a的临界值,这个临界值就可作为判断X?大小的标

准.

2.独立性检验

基于小概率值a的检验规则是:

当x22x。时,我们就推断H。不成立,即认为X和Y不独立,该推断犯错误的

概率不超过a;

当x2〈xu时,我们没有充分证据推断H。不成立,可以认为X和Y独立.

这种利用x2的取值推断分类变量X和Y是否独立的方法称为x2独立性检验,

读作“卡方独立性检验”,简称独立性检验(testofindependence).

下表给出了乂2独立性检验中几个常用的小概率值和相应的临界值

a0.10.050.010.0050.001

Xa2.7063.8416.6357.87910.828

3.应用独立性检验解决实际问题的大致步骤

(1)提出零假设H。:X和Y相互独立,并给出在问题中的解释;

⑵根据抽样数据整理出2X2列联表,计算乂?的值,并与临界值人比较;

⑶根据检验规则得出推断结论;

⑷在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y问

的影响规律.

拓展深化

[微判断]

1.概率值。越小,临界值Xu越大.(J)

2.独立性检验的思想类似于反证法.(J)

3.独立性检验的结论是有多大的把握认为两个分类变量有关系.(J)

[微训练]

1.如果根据小概率a=0.01的乂2检测试验,认为H。成立,那么具体算出的

数据满足()

附表:

a0.050.0250.0100.0050.001

Xa3.8415.0246.6357.87910.828

A.X2>6.635B.X2>5.024

C.X2>7.879D.X2>3.841

答案A

2.某校为了研究“学生的性别”和“对待某一活动的态度”是否有关,运用

2X2列联表进行独立性检验,经计算X2=7.069,则认为“学生性别与支持某

项活动有关系”的犯错误的概率不超过()

A.0.1%B.1%

C.99%D.99.9%

解析VX2=7.069>6.635=x。。”.••认为“学生性别与支持某项活动有关系”

的犯错误的概率不超过1%.

答案B

[微思考]

1.有人说:“在犯错误的概率不超过0.01的前提下认为吸烟和患肺病有关,

是指每100个吸烟者中就会有99个患肺病的.”你认为这种观点正确吗?为什

么?

提示观点不正确.犯错误的概率不超过0.01说明的是吸烟与患肺病有关的程

度,不是患肺病的百分数.

2,应用独立性检验的基本思想对两个变量间的关系作出的推断一定是正确的

吗?

提示不一定.所有的推断只代表一种可能性,不代表具体情况.

【课堂互动】

题型一有关“相关的检验”

【例1】某校对学生课外活动进行调查,结果整理成下表,用你所学过的知

识进行分析,能否在犯错误的概率不超过0.005的前提下,认为“喜欢体育还

是文娱与性别有关系”?

体育文娱合计

男生212344

女生62935

合计275279

解零假设为H。:喜欢体育还是喜欢文娱与性别没有关系

a=21>b=23,c=6,d=29,n=79,

n(ad-be)?

(a+b)(c+d)(a+c)(b+d)

79X⑵X29—23X6)2

(

44X35X27X52~-^8.106>7.879=X0.K>5.

根据小概率值Q=0.005的xz独立性检验,我们推断H。不成立,即认为喜欢

体育还是喜欢文娱与性别有关系,此推断犯错误的概率不大于0.005.

规律方法独立性检验的具体做法

①根据实际问题的需要确定允许推断“两个分类变量有关系”犯错误的概率的

上界a,然后查表确定临界值Xa.

②利用公式x=(a+b)(b+d)计算上

2

③如果x>Xfl,则“X与Y有关系”这种推断犯错误的概率不超过a;否则,

就认为在犯错误的概率不超过a的前提下不能推断“X与Y有关系”,或者在

样木数据中没有发现足够的证据支持结论“X与Y有关系”.

【训练1】打鼾不仅影响别人休息,而且可能与患某种疾病有关.下表是一

次调查所得的数据:

患心脏病未患心脏病合计

每一晚都打鼾30224254

不打鼾2413551S79

合计5415791633

根据独立性检验,能否在犯错误的概率不超过0.001的前提下认为每一晚都打

鼾与患心脏病有关系?

解零假设为Ho:打鼾与患心脏病无关系

由列联表中的数据,得

21633X(30义1355—224X24)'

254X1379X54X1579

268.033>10.828=Xo.ooi»

根据小概率值Q=0.001的x2独立性检验,我们推断H。不成立,即认为打鼾

与患心脏病有关系,此推断犯错误的概率不大于0.00L

题型二有关“无关的检验”

【例2】为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查

了361名高二在校学生,调查结果如下:理科生对外语有兴趣的有138人,无

兴趣的有98人,文科生对外语有兴趣的有73人,无兴趣的有52人.试分析学

生选报文、理科与对外语的兴趣是否有关?

解零假设为乩:选报文、理科与对外语的兴趣无关.

列出2X2列联表

理文合计

有兴趣13873211

无兴趣9852150

合计236125361

代入公式得x2的观测值

2361X(138X52-73X98)2〜八

x-=--------------------------------------871X101

236X125X211X150,

V1.871X10'J,<2.706=x(n,

根据小概率值Q=0.1的x2独立性检验,没有充分证据推断H。不成立,即选

报文、理科与对外语的兴趣无关.

规律方法独立性检验的关注点

在2X2列联表中,如果两个分类变量没有关系,则应满足ad—bcgO,因此

|ad-bc|越小,关系越弱;|ad—bc|越大,关系越强.

【训练2】某教育机构为了研究成年人具有大学专科以上学历(包括大学专

科)和对待教育改革态度的关系,随机抽取了392名成年人进行调查,所得数据

如下表所示:

积极支持不太赞成教

合计

教育改革育改革

大学专科以上学历39157196

大学专科以下学历29167196

合计68324392

对于教育机构的研究项目,根据上述数据能得出什么结论?

解零假设为H。:成年人具有大学专科以上学历(包括大学专科)和对待教育改

革态度无关.

根据表中数据,计算得

2392X(39X167-157X29)2

x=---------------------------------------78

196X196X68X324

因为1.78<2.7O6=xo.I,

根据小概率值a=0.1的x2独立性检验,没有充分证据推断H。不成立,所以

我们没有理由说成年人具有大学专科以上学历(包括大学专科)和对待教育改革

态度有关.

题型三独立性检验的综合应用

【例3】某高校共有学生15000人,其中男生10500人,女生4500

人.为调查该校学生每周平均体育运动时间的情况,采用分层随机抽样的方

法,收集300位学生每周平均体育运动时间(单位:时)的样本数据.

(1)应收集多少位女生的样木数据?

(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图

(如图),其中样本数据的分组区间为[0,2],(2,4],(4,6],(6,8],(8,

10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率.

⑶在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成

每周平均体育运动时间与性别的列联表,并判断是否认为“该校学生的每周平

均体育运动时间与性别有关”.

附:

a0.1000.0500.0100.005

xu2.7063.8416.6357.879

n(ad-be)2__________

(a+b)(c+d)(a+c)(b+d),

4500

解(D由分层随机抽样可得300X=7肃=90,所以应收集90位女生的样本

10UUU

数据.

(2)由频率分布直方图得学生每周平均体育运动时间超过4小时的频率为1—

2X(0.100+0.025)=0.75,所以该校学生每周平均体育运动时间超过4小时的

概率的估计值为0.75.

⑶由(2)知,300位学生中有300X0.75=225(人)的每周平均体育运动时间超

过4小时,75人的每周平均体育运动时间不超过4小时.样本数据中有210份

是关于男生的,90份是关于女生的,可得每周平均体育运动时间与性别的列联

表如下:

男生女生合计

每周平均体育运动时453075

间不超过4小时

每周平均体育运动时

16560225

间超过4小时

合计21090300

零假设为Ho:该校学生的每周平均体育运动时间与性别无关.

结合列联表可算得

2300X(45X60-30X165)2,、

x=75X225X210X90七4.762>3.841=xo.o5.

根据小概率值Q=0.1的x2独立性检验,我们推断H。不成立,即认为“该校

学生的每周平均体育运动时间与性别有关”,此推断犯错误的概率不大于

0.05.

规律方法(1)解答此类题目的关键在于正确利用x2=

(a+b)篙7:;;)(b+d)计算x,的值,再用它与临界值x.的大小

作比较来判断假设检验是否成立,从而使问题得到解决.

⑵此类题目规律性强,解题比较格式化,填表计算分析比较即可,要熟悉其计

算流程,不难理解掌握.

【训练3】某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优

秀的学生中,物理、化学、总分成绩优秀的人数如下表所示,能否在犯错误的

概率不超过0.001的前提下认为数学成绩优秀与物理、化学、总分成绩优秀有

关系?

物理优秀化学优秀总分优秀

数学优秀228225267

数学非优秀14315699

注:该年级在此次考试中数学成绩优秀的有360人,非优秀的有880人.

解零假设为H。:数学成绩优秀与物理、化学、总分成绩优秀都无关系.

列出数学成绩与物理成绩的2X2列联表如下:

物理优秀物理非优秀合计

数学优秀228132360

数学非优秀143737880

合计3718691240

将表中数据代入公式,得

2

1240X(228X737—132X143)

-^270.l>10.828=x,o)i.

360X880X371X8690

列出数学成绩与化学成绩的2X2列联表如下:

化学优秀化学非优秀合计

数学优秀225135360

数学非优秀156724880

合计3818591240

将表中数据代入公式,得

1240X(225X724-156X135)

2生240.6>10,828

360X880X381X859

=Xo.ooi-

列出数学成绩与总分成绩的2X2列联表如下:

总分优秀总分非优秀合计

数学优秀26793360

数学非优秀99781880

合计3668741240

将表中数据代入公式,得

21240X(267X781—93X99)、…八…

x尸360X880X366X874心486.l>10.828=xo.(wi.

根据小概率值a=0.001的x2独立性检验,我们推断不成立,即认为数学

成绩优秀与物理、化学、总分成绩优秀都有关系,此推断犯错误的概率不大于

0.001.

【素养达成】

一、素养落地

1.通过本节课的学习,提升数学抽象及数据分析素养.

2.对独立性检验思想的理解

独立性检验的基木思想类似于数学中的反证法.先假设“两个分类变量没有关

系”成立,计算x?的值,如果X?值很大,说明假设不合理,乂2越大,两个

分类变量有关系的可能性越大.

二、素养训练

1.对两个分类变量A,B的下列说法中正确的个数为()

①A与B无关,即A与B互不影响;

②A与B关系越密切,则x2的值就越大;

③X?的大小是判定A与B是否相关的唯一依据

A.0B.1

C.2D.3

解析①正确,A与B无关即A与B相互独立;②不正确,乂?的值的大小只是

用来检验A与B是否相互独立;③不正确,例如借助三维柱形图、二维条形图

等.故选B.

答案B

2.高二第二学期期中考试,按照甲、乙两个班学生的数学成绩优秀和及格统计

人数后,得到如下列联表:

优秀及格合计

甲班113445

乙班83745

合计197190

则x2的观测值约为()

A.0.600B.0.828

C.2.712D.6.004

义(11X—R4XR)2

解析根据列联表中的数据,可得.45X45X19X71一皿.故选

A.

答案A

3.考察棉花种子经过处理跟生病之间的关系得到下表数据:

种子处理种子未处理合计

得病32101133

不得病61213274

合计93314407

根据以上数据,可得出()

A.种子是否经过处理跟是否生病有关

B.种子是否经过处理跟是否生病无关

C.种子是否经过处理决定是否生病

D.以上都是错误的

q2407X(32X213-61X101)2

解析由X-=QQYQl/IV1QQV07/1^0.164X2.706—Xo.i>故没有把握

yd入JJL4入1OO入//4

认为种子是否经过处理跟是否生病有关.

答案B

4.(多选题)对于分类变量X与Y的随机变量x2的值,下列说法正确的是

()

A.X?越大,"X与Y有关系”的可信程度越小

B.x?越小,"X与Y有关系”的可信程度越小

C.x?越接近于0,“X与Y没有关系”的可信程度越小

D.X?越大,“X与Y没有关系”的可信程度越小

解析x?越大,“X与Y没有关系”的可信程度越小,则“K与Y有关系”的

可信程度越大,X」越小,“X与Y有关系”的可信程度越小.

答案BD

5.高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”.下表是一

次针对高三文科学生的调查所得的数据.

总成绩好总成绩不好合计

数学成绩好478a490

数学成绩不好39924423

合计bC913

(1)计算a,b,c的值;

(2)文科学生总成绩不好与数学成绩不好有关系吗?

解(1)由478+a=490,得a=12.

由a+24=c,得c=12+24=36.

b=478+399=877.

(2)零假设为lb文科学生总成绩不好与数学成绩不好没有关系.计算得

2913X(478X24-399X12)2八…

x=490X423X877X36=a233>5.024=x°g

根据小概率值Q=0.05的x2独立性检验,我们推断H。不成立,即认为文科学

生总成绩不好与数学成绩不好有关系,此推断犯错误的概率不大于0.05.

【课后作业】

基础达标

一、选择题

1.想要检验是否喜欢参加体育活动是不是与性别有关,应该检验()

A.零假设H。:男性喜欢参加体育活动

B.零假设H。:女性不喜欢参加体育活动

C,零假设H。:喜欢参加体育活动与性别有关

D.零假设H。:喜欢参加体育活动与性别无关

解析独立性检验假设有反证法的意味,应假设两类变量(而非变量的属性)无

关,这时的X?应该很小,如果/很大,则可以否定假设,如果X2很小,则

不能够肯定或者否定假设.

答案D

2.某市政府调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了

3000人,计算得x2=6.023,则市政府断言市民收入增减与旅游愿望有关系

的可信程度是()

A.90%B.95%

C.99%D.99.5%

解析由临界值表,得6.023>3.841=X°.°5,所以可断言市民收入增减与旅游

愿望有关系的可信程度为95%.

答案B

3.为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种杰度)与性别的关

系,运用2X2列联表进行独立性检验,经计算得乂2=7.01,则认为“喜欢乡

村音乐与性别有关系”的把握约为()

A.0.1%B.1%

C.99%D.99.9%

解析易知x=7.01>6.635=xo.ou对照临界值表知,有99舟的把握认为喜欢乡

村音乐与性别有关系.

答案C

4.在独立性检验中,两个分类变量“X与Y有关系”的可信度为99乐则随机

变量X,的取值范围是()

A.[2.706,3.841)B.[3.841,6.635)

C.[6.635,7.879)D.[7.879,10.828)

解析对照临界值表可知选C.

答案C

5.某班主任对全班50名学生进行了作业量的调查,数据如下表:

认为作业量大认为作业量不大合计

男生18927

女生81523

合计262450

则推断“学生的性别与认为作业量大有关”这种推断犯错误的概率不超过

()

A.0.01B.0.025

C.0.05D.0.001

解析由公式得一二50X,黑受篇)「5.059>3.841=X°.°5.,犯错误的

概率不超过0.05.

答案C

二、填空题

6.在研究性别与吃零食这两个分类变量是否有关系时,下列说法中正确的是

(填序号).

①若x2=6.635,则我们在犯错误的概率不超过0.01的前提下认为吃零食与性

别有关系,那么在100个吃零食的人中必有99人是女性;

②由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有

关系时,如果某人吃零食,那么此人是女性的可能性为99%;

③由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有

关系时,是指每进行100次这样的推断,平均有1次推断错误.

解析x2的观测值是支持确定有多大把握认为“两个分类变量吃零食与性别有

关系”的随机变量值,所以由独立性检验可知在犯错误的概率不超过0.01的前

提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次

推断错误,故填③.

答案③

7.某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体

数据如下表:

非统计专业统计专业

性别

男1310

女720

为了判断主修统计专业是否与性别有关系,根据表中的数据,得到乂2=

50X(13X20-10X7)

比4.844>3.O所以判定主修统计专业与性别

23X27X20X30841=X.05,

有关系,那么这种判断出错的可能性最大为.

解析因为X2>3.841=X°.05,所以有95%的把握认为主修统计专业与性别有

关,出错的可能性不超过5%.

答案5%

8.世界杯期间,某一电视台对年龄高于40岁和不高于40岁的人是否喜欢西班

牙队进行调查,对高于40岁的调查了50人,不高于40岁的调查了50人,所

得数据制成如下列联表:

不喜欢西班牙队喜欢西班牙队合计

高于40岁Pq50

不高于40岁153550

合计ab100

3

若工作人员从所有统计结果中任取一个,取到喜欢西班牙队的人的概率为4则

在犯错误的概率不超过下认为年龄与西班牙队的被喜欢程度有关.

--------n(ad—be):--------

叫・(a+b)(c+d)(a+c)(b+d).

a0.1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论