分类变量与列联表教案

上传人：灯*** IP属地：河北上传时间：2024-07-12 格式：PDF 页数：19 大小：2.55MB 积分：12 举报 版权申诉

已阅读5页，还剩14页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

8.3分类变量与列联表

教材分析

本节课选自《2019人教A版高中数学选择性必修第三册》，第七章《随机变量及其分布列》，

本节课主本节课主要学习分类变量与列联表

学生前面已经学习了基本获取样本数据的方法，从样本数据中提取信息的方法，也掌握了相互

独立事件的概率计算，独立性检验是进一步分析两个分类变量之间是否有关系，是高中数学知识中

教学过程教学设计意图

核心素养目标

体现统计思想的重要课节。学习重点应放在独立性检验的统计学原理上，理解独立性检验的基本思

想，明确独立性检验的基本步骤。课堂趣味性较强，充分体现了数学在实际生活中的应用，对于提

高学生应用意识和数学建模思想有重要意义。

教学目标与核心素养

课程目标学科素养

A.通过对典型案例的探究,了解独立性检1.数学抽象：从特殊实例到一般原理

验（只要求2x2列联表）的基本思想、方法2.逻辑推理：独立性检验的思想方法

及初步应用.3.数学运算：独立检验的运用

B.通过对数据的收集、整理和分析,增强学4.数学建模：模型化思想

生的社会实践能力,培养学生分析问题、

解决问题的能力.

重点难点

重点：了解独立性检验（只要求2x2列联表）的应用.

难点：独立性检验（只要求2x2列联表）的基本思想、方法

课前准备

多媒体

教学过程

一、问题导学

前面两节所讨论的变量,如人的身高、树的胸径、树的高度、短

跑100m世界纪录和创纪录的时间等，都是数值变量，数值变量的取值

为实数.其大小和运算都有实际含义.

在现实生活中，人们经常需要回答一定范围内的两种现象或

性质之间是否存在关联性或相互影响的问题.例如，就读不同学校是否

对学生的成绩有影响，不同班级学生用于体育锻炼的时间是否有差别，

吸烟是否会增加患肺癌的风险，等等，本节将要学习的独立性检验方法

为我们提供了解决这类问题的方案。

在讨论上述问题时,为了表述方便，我们经常会使用一种特殊

的随机变量，以区别不同的现象或性质，这类随机变量称为分类变量.

分类变量的取值可以用实数表示，例如，学生所在的班级可以用1,2,3

等表示，男性、女性可以用1,0表示，等等.在很多时候，这些数值只作为

编号使用，并没有通常的大小和运算意义，本节我们主要讨论取值于

｛0,1｝的分类变量的关联性问题.

二、探究新知

问题1.为了有针对性地提高学生体育锻炼的积极性,某中学需要了

通过具体的问题

解性别因素是否对本校学生体育锻炼的经常性有影响,为此对学生是

情境，引发学生思考

否经常锻炼的情况进行了普查，全校学生的普查数据如下:523名女生积极参与互动，说出

中有331名经常锻炼;601名男生中有473名经常锻炼。你能利用这些自己见解。从而分类

变量独立性检验的

数据，说明该校女生和男生在体育锻炼的经常性方面是否存在差异

概念，发展学生逻辑

吗？推理、数学运算、数

这是一个简单的统计问题，最直接的解答方法是,比较经常锻炼的学生学抽象和数学建模

在女生和男生中的比率，为了方便，我们即0=经常襄北生数,的核心素养。

f二竺常锻炼的男生数

,1男生总数

那么，只要求出｛和4的值，通过比较这两个值的大小，就可以知

道女生和男生在锻炼的经常性方面是否有差异，由所给的数据,经计算

得至优^会刈陋九=经=0.787.由//«0.787-0.633=0.154可

v523160110

知，男生经常锻炼的比率比女生高出15.4个百分点.

所以该校的女生和男生在体育锻等的经常性方面有差异，而且男生更

经常锻炼.

用n表示该校全体学生构成的集合,这是我们所关心的对象的总

体,考虑以n为样本空间的古典概型,并定义一对分类变量X和Y如下:

对于。中的每一名学生，

八皿人v(0,该生为女生、(0,该生不经常锻炼、

分别令x=1<1,该生为男生1I，y=(11,该生经常锻炼),

“性别对体育锻炼的经常性没有影响''可以描述为

P(Y=1|X=0)=P(Y=l|X=l);

“性别对体育锻炼的经常性有影响”可以描述为

P(Y=1|X=O)^P(Y=1|X=1).

我们希望通过比较条件概率p(y=i|x=o)和p(y=i|x=i)回答上面

的问题.按照条件本概率的直观解释，

如果从该校女生和男生中各随机选取一名学生,那么该女生属于经常

锻炼群体的概率是P(Y=l|X=0),

而该男生属于经常锻炼群体的概率是P(Y=1|X=1).

为了清楚起见，我们用表格整理数据

锻炼

性别合计

不经常(y=o)经常(y=i)

女生(X=0)192331523

男生(X=l)128473601

合计3208041124

我们用｛X=0,Y=l｝表示事件｛X=0｝和｛Y=l｝的积事件，用

｛X=1,Y=1｝表示事件(X=1｝和｛Y=1｝的积事件，根据古典概型和条件概

率的计算公式，我们有

P(Y=1|X=0)=n(X=0,/=1)=--0.633；P(y=1|X=1)=n(X"1,r=1)=--0.787

'''n(X=O)523，'I'n(X=l)601

由P(Y=1|X=1)>P(Y=1|X=0)

可以作出判断，在该校的学生中，性别对体育锻炼的经常性有影响，即

该校的女生和男生在体育锻炼的经常性方面存在差异,而且男生更经

常锻炼。

在实践中，由于保存原始数据的成本较高，人们经常按研究问题

的需要，将数据分类统计，并做成表格加以保存,我们将下表这种形式

的数据统计表称为2x2列联表（contingencytable）.

2x2列联表给出了成对分类变量数据的交叉分类频数，以右表为

例，它包含了X和Y的如下信息：

最后一行的前两个数分别是事件｛Y=0｝和｛Y=l｝中样本点的个数；

最后一列的前两个数分别是事件｛X=0｝和｛X=l｝中样本点的个数；

中间的四个格中的数是表格的核心部分，给出了事件

｛X=x,Y=y｝（x,y=0,l）中样本点的个数；

右下角格中的数是样本空间中样本点的总数。

锻炼

性别合计

不经常（y=0）经常（y=i）通过问题分析，

女生（X=0）192331523让学生理解运独立

男生(X=l)128473601性检验的统计学原

合计3208041124理。发展学生逻辑推

理，直观想象、数学

抽象和数学运算的

三、典例解析

核心素养。

例1.为比较甲、乙两所学校学生的数学水平，采用简单随机抽样的方

法抽取88名学生.通过测验得到了如下数据:甲校43名学生中有10

名数学成绩优秀;乙校45名学生中有7名数学成绩优秀,试分析两校学

生中数学成绩优秀率之间是否存在差异.

解:用C表示两所学校的全体学生构成的集合.考虑以C为样本空间的

古典概型.对于C中每一名学生，定义分类变量X和Y如下:X=

[0,该生来自甲校）=[0,该生数学成绩不优秀）

11,该生来自乙校7V二（l,该生数学成绩优秀r

学校数学成绩合计

不优秀（Y=0）优秀(Y=l)

甲校(X=0)331()43

乙校（X=D38745

合计711788

我们将所给数据整理成表(单位：人)

表是关于分类变量X和Y的抽样数据的2X2列联表:最后一行

的前两个数分别是事件(Y=0)和(Y=l)的频数;最后一列的前两个数分

别是事件(X=0)和(X=1)的频数;中间的四个格中的数是事件

(X=x,Y=y)(x,y=O,l)的频数；

甲校学生中数学成绩不优秀和数学成绩优秀的频率分别为^70.7674

和卷々0.2326;

乙校学生中数学成绩不优秀和数学成绩优秀的频率分别为

0.8444和会0.1556

我们可以用等高堆积条形图直观地展示上述计算结果，如图所示

■优秀

O.f

■不优秀

0.6u

0.4,J1

0.2

甲校乙校

左边的蓝色和红色条的高度分别是甲校学生中数学成绩不

优秀和数学成绩优秀的频率;右边的蓝色和红色条的高度分别是乙校

学生中数学成绩不优秀和数学成绩优秀的频率，通过比较发现,两个学

校学生抽样数据中数学成绩优秀的频率存在差异，甲校的频率明显高

于乙校的频率，依据频率稳定于概率的原理,我们可以推断

P(Y=1|X=O)>P(Y=1|X=1).

也就是说，如果从甲校和乙校各随机选取一名学生，那么甲校学生数学

成绩优秀的概率大于乙校学生数学成绩优秀的概率，因此，可以认为两

校学生的数学成绩优秀率存在差异，甲校学生的数学成绩优秀率比乙

校学生的高•

学校数学成绩合计

不优秀(Y=0)优秀(Y=l)

甲校(X=0)331043

乙校(X=l)38745

合计711788

2.两个分类变量之间关联关系的定性分析的方法：

(1)频率分析法：通过对样本的每个分类变量的不同类别事件发生的

频率大小进行比较来分析分类变量之间是否有关联关系.如可以通过

列联表中唉与七值的大小粗略地判断分类变量x和Y之间有无关

系.一般其值相差越大，分类变量有关系的可能性越大.

(2)图形分析法：与表格相比，图形更能直观地反映出两个分类变

量间是否互相影响，常用等高堆积条形图展示列联表数据的频率特

征.将列联表中的数据用高度相同的两个条形图表示出来，其中两列

的数据分别对应不同的颜色，这就是等高堆积条形图.

等高堆积条形图可以展示列联表数据的频率特征，能够直观地反映出

两个分类变量间是否相互影响.

问题2.你认为“两校学生的数学成绩优秀率存在差异”这一结论是否

有可能是错误的？

有可能

“两校学生的数学成绩优秀率存在差异”这个结论是根据两个频率

间存在差异推断出来的.有可能出现这种情况：在随机抽取的这个样

本中，两个频率间确实存在差异，但两校学生的数学成绩优秀率实际

上是没有差别的.对于随机样本而言，因为频率具有随机性，频率与

概率之间存在误差，所以我们的推断可能犯错误，而且在样本容量较

小时，犯错误的可能性会较大.因此，需要找到一种更为合理的推断

方法，同时也希望能对出现错误推断的概率有一定的控制或估算.

通过具体的问题

“两校学生的数学成绩优秀率存在差异”这个结论是根据两个频率

情境中的分析，深化

间存在差异推断出来的.有可能出现这种情况：在随机抽取的这个样对独立性检验的理

本中，两个频率间确实存在差异，但两校学生的数学成绩优秀率实际解。发展学生逻辑推

理，直观想象、数学

上是没有差别的.对于随机样本而言，因为频率具有随机性，频率与

抽象和数学运算的

概率之间存在误差，所以我们的推断可能犯错误，而且在样本容量较核心素养。

小时，犯错误的可能性会较大.因此，需要找到一种更为合理的推断

方法，同时也希望能对出现错误推断的概率有一定的控制或估算.

考虑以Q为样本空间的古典概型，设X和y为定义在Q上，取值

于｛0,1｝的成对分类变量，我们希望判断事件｛X=l｝和｛Y=l｝之间是否

有关联。注意到｛X=0｝和｛X=l｝,｛Y=0｝和｛Y=l｝都是互对立事件，与前

面的讨论类似，我们需要判断下面的假定关系

“o：p(y=i|x=o)=p(y=i|x=i)是否成立,通常称勺为零假设或原假设

(nullhypothesis).

P(Y=11X=0)表示从｛X=0｝中随机选取一个样本点,该样本点属于

｛X=0,Y=l｝的概率；

P(Y=1|X=1)表示从｛X=l｝中随机选取一个样本点,该样本点属于

｛X=1,Y=I｝的概率。

由条件概率的定义可知,零假设等价于端嚓上=笔写2

0P\X-x))1)

或P(X=0,Y=1)P(X=1)=P(X=1,Y=l)P(X=0).①

考虑以Q为样本空间的古典概型，设X和y为定义在Q上，取值

于｛0,1｝的成对分类变量，我们希望判断事件｛x=1｝和｛Y=1｝之间是否

有关联。注意到｛X=0｝和｛X=l｝,｛Y=0｝和｛Y=l｝都是互对立事件，与前

面的讨论类似，我们需要判断下面的假定关系

“o：p(y=i|x=o)=p(y=i|x=i)是否成立,通常称名为零假设或原假设

(nullhypothesis).P(Y=l|X=0)表示从｛X=0｝中随机选取一个样本点，该

样本点属于｛X=0,Y=l｝的概率；

P(Y=1|X=1)表示从｛X=l｝中随机选取一个样本点,该样本点属于

(X=1,Y=1｝的概率。

由条件概率的定义可知,零假设H.等价于笔踪^=端=生

0P(X=0)P(X=1)

或P(X=0.Y=1)P(X=1)=P(X=1,Y=l)P(X=0).①

注意到(X=0)和(X=l)为对立事件，于是P(X=0)=l-P(X=l).

再由概率的性质,我们有P(X=0,Y=1)=P(Y=1)-P(X=1,Y=1).

由此推得①式等价于P(x=1)P(Y=1)=P(X=1,Y=1).

因此,零假设H0等价于｛X=l｝与｛丫=1｝独立。

根据已经学过的概率知识,下面的四条性质彼此等价：

｛X=0｝与｛Y=0｝独立;｛X=0｝与｛Y=l｝独立;｛X=l｝与｛Y=0｝独

立;｛X=l｝与｛Y=l｝独立。

以上性质成立，我们就称分类变量X和Y独立，这相当于下面四个等式

成立；

P(X=O,Y=O)=P(X=O)P(Y=O);P(X=O,Y=1)=P(X=O)P(Y=1);

P(X=1,Y=O)=P(X=1)P(Y=O);P(X=1,Y=1)=P(X=1)P(Y=1).②

我们可以用概率语言，将零假设改述为H。:分类变量X和Y独立.

假定我们通过简单随机抽样得到了X和Y的抽样数据列联表,如下表

所示。

表是关于分类变量X和Y的抽样数据的2x2列联表:最后一行

的前两个数分别是事件｛Y=0｝和｛Y=l｝的频数摄后一列的前两个数

分别是事件｛X=0｝和｛X=l｝的频数;中间的四个数a,b,c,d是事件

｛X=x,Y=y｝(x,y=O,l)的频数;右下角格中的数n是样本容量。

X合计

r=or=i

x=oaba+b

X=1cdc+d

合计a+cb+dn=a+b+c+d

问题3:如何基于②中的四个等式及列联表中的数据，构造适当的统计

量，对成对分类变量X和Y是否相互独立作出推断？

在零假设”成立的条件下，根据频率稳定于概率的原理，由②

中的第一个等式，我们可以用概率P(X=O)和p(y=o)对应的频率的乘积

(a+?a+c)估计概率p(x=o,y=o),而把*射£1视为事件｛X=O.y=0｝发生

的频数的期望值(或预期值).

这样，该频数的观测值a和期望值(a+b)(a+c)应该比较接近

综合②中的四个式子，如果零假设H()成立，下面四个量的取值都不应

该太大：

।(a+b)(a+c)|,,®+b)(b+d)|,(c+d)(a+c)|,,(c+d)(b+d)|

lan1”一nk|Cn用力n1

③反之，当这些量的取值较大时，就可以推断H0不成立。

分别考虑③中的四个差的绝对值很困难，我们需要找到一个既合

理又能够计算分布的统计量，来推断Ho是否成立.

一般来说,若频数的期望值较大，则③中相应的差的绝对值也会

较大;而若频数的期望值较小，则③中相应的差的绝对值也会较小.

为了合理地平衡这种影响,我们将四个差的绝对值取平方后分别除以

相应的期望值再求和，得到如下的统计量：

2(Q__+b)(a+c))2e_9+b)(b+d))2

X-(a+b)(a+c)1(a+b)(b+d)

(C_(c+d)(a+C))2g_(。+d)(b+d),2

+(c+d)(a+c)1(c+d)(b+d)

该表达式可化简为：Z2=

(a+b)(c+d)(a+c)(b+d)

统计学家建议，用随机变量力?取值的大小作为判断零假设H°是

否成立的依据，当它比较大时推断H。不成立，

否则认为H。成立.

问题4:那么，究竟,2大到什么程度，可以推断H。不成立呢?或者说，怎

样确定判断了2大小的标准呢？

根据小概率事件在一次试验中不大可能发生的规律，可以通

过确定一个与此相矛盾的小概率事件来实现，在假定H。的条件下，对

于有放回简单随机抽样，当样本容量n充分大时，统计学家得到了#2的

近似分布，忽略％2的实际分布与该近似分布的误差后，对于任何小概

率值a,可以找到相应的正实数x,

使得下面关系成立:P(12》)=a④

我们称X为a的临界值，这个临界值就可作为判断乃2大小的标准，概率

值a越小,临界值x越大,当总体很大时，抽样有、无放回对,2的分布

影响较小.因此，在应用中往往不严格要求抽样必须是有放回的.

由④式可知,只要把概率值a取得充分小,在假设H。成立的情

况下，事件*2不大可能发生的.根据这个规律，如果该事件发生,我们就

可以推断H。不成立.不过这个推断有可能犯错误，但犯错误的概率不

会超过a.

独立性检验公式及定义：

提出零假设(原假设)H。:分类变量X和y独立，假定我们通过

简单随机抽样得到了x和y的抽样数据列联表，在列联表中，如果

零假设H成立，则应满足三，即”从.因此lad-AI越小，说

0a+bc+a

明两个分类变量之间关系越弱;lad-加1越大，说明两个分类变量之间

关系越强.

为了使不同样本容量的数据有统一的评判标准，基于上述分析,我们构

造一个随机变量…号、2.

(a+b)(c+d)(a+c)(b+d)

X独立性检验中几个常用的小概率值和相应的临界值.

X合计

r=oY=1

x=oaba+b

X=1cdc+d

合计a+cb+dn=a+b+c+d

a010.050.010.0050.001

2.7063.8416.6357.87910.858

通过典型例题的

临界值的定义：分析解决，提升学生

对于任何小概率值a,可以找到相应的正实数x,使得P(f力)=a对独立性检验的理

成立，我们称x为a的临界值，这个临界值可作为判断％大小的标解和运用。发展学生

逻辑推理，直观想

准，概率值a越小，临界值x越大.

象、数学抽象和数学

基于小概率值a的检验规则：

运算的核心素养。

当％女时，我们就推断H不成立，即认为X和Y不独立，该推断

犯错误的概率不超过a；

当％a时，我们没有充分证据推断H不成立，可以认为X和丫独

立.

用％取值的大小作为判断零假设H是否成立的依据，当它比较大时

推断H不成立，否则认为H成立。这种利用％的取值推断分类变

量X和Y是否独立的方法称为X独立性检验，读作“卡方独立性检

验”，简称独立性检验.

X独立性检验中几个常用的小概率值和相应的临界值

例2：依据小概率值a=0.1的尤2独立性检验，分析例1中的抽样数据,

能否据此推断两校学生的数学成绩优秀率有差异？

解：零假设为H：分类变量X与Y相互独立，即两校学生的数学成

绩优秀率无差异.因为

学校数学成绩合计

不优秀(Y=0)优秀(Y=l)

甲校(X=0)331043

乙校(X=D38745

合计711788

所以犬=端蔗誓。。837<2.7。6=%

根据小概率值a=O.I的f独立性检验，没有充分证据推断H。不成立，

因此可以认为H成立，即认为两校的数学成绩优秀率没有差异。

问题5.例1和例2都是基于同一组数据的分析，但却得出了不同的结

论，你能说明其中的原因吗？

例1只是根据一个样本的两个频率间存在差异得出两校学生数

学成绩优秀率有差异的结论，并没有考虑由样本随机性可能导致的错

误，所以那里的推断依据不太充分，在本例中，我们用％2独立性检验对

零假设H。进行了检验，通过计算，发现％2巾.837小于a=0.1所对应的临

界值2.706,因此认为没有充分证据推断H。不成立，所以接受H。,推断

出两校学生的数学优秀率没有显著差异的结论，

这个检验结果意味着，抽样数据中两个频率的差异很有可能是由

样本随机性导致的，因此，只根据频率的差异得出两校学生的数学成绩

优秀率有差异的结论是不可靠的.

由此可见，相对于简单比较两个频率的推断，用％2独立性检验得

到的结果更理性、更全面，理论依据也更充分。

当我们接受零假设H0时，也可能犯错误。我们不知道犯这类错误

的概率p的大小，但是知道，若a越大，则p越小

例3.某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简

单随机抽样的方法对治疗情况进行检查，得到了如下数据：抽到接受

甲种疗法的患儿67名，其中未治愈15名，治愈52名；抽到接受乙

种疗法的患儿69名，其中未治愈6名，治愈63名.试根据小概率值

a=0.005的独立性检验，分析乙种疗法的效果是否比甲种疗法好.

解：零假设为H：疗法与疗效独立，即两种疗法效果没有差异.

将所给数据进行整理，得到两种疗法治疗数据的列联表，

疗效

疗法合计

未治愈治愈

甲155267

乙66369

合计21115136

根据列联表中的数据，经计算得到/=136：T；63-52：6/〜

67X69X2IX115

4.881<7,879=%QQQG

根据小概率值a=0.005的产独立性检验，没有充分证据推断H。

不成立，因此可以认为H成立，即认为两种疗法效果没有差异.

疗效

疗法合计

未治愈治愈

甲155267

乙66369

合计21115136

136x615x63-52x6；

y29=-----------------------------------------x4.881

"67x69x21x115

疗效

疗法合计

未治愈治愈

乙66369

甲155267

合计21115136

136x652x6-15x63；

Y92=-----------------------------------------«4.881

"69x67x21x115

疗效

疗法合计

治愈未治愈

甲521567

乙63669

合计11521136

,136x<52x6-15x63；

r2=-----------------------------------------«4.881

z67x69x21x115

不影响

问题6.若对调两种疗法的位置或对调两种疗效的位置，这样做会影响

/取值的计算结果吗？

例4.为了调查吸烟是否对肺癌有影响，某肿瘤研究所采取有放回简单

随机抽样，调查了9965人，得到如下结果(单位：人)依据小概率

值a=O.O()l的独立性检验，分析吸烟是否会增加患肺癌的风险。

肺癌

吸烟合计

非肺癌患者肺癌患者

非吸烟

7775427817

者

吸烟者2099492148

合计9874919965

解：零假设为H。：吸烟和患肺癌之间没有关系根据列联表中的数据,

经计算的根据小概率值a=0.001的独立性检验，推断H。不成立，即

认为吸烟与患肺癌有关联，此推断犯错误的概率不大于0.001,即我

们有99.9%的把握认为“吸烟与患肺癌有关系”.

,9965x67775x49-42x2099；

y2=------------------------------------------------------*56.632>10,858

'7817x2148x9874x91

根据表中的数据计算不吸烟者中不患肺癌和患肺癌的频率分别为

吸烟者中不患肺癌和患肺癌的评率分别为

77764?

--x0.9946,x0.0054,

78177817

209949

—^^0.9772,0.0228

21482148

,0.0228,3

由-------»4.2

0.0054

可见，在被调查者中，吸烟者患肺癌的频率是不吸烟者患肺癌频率

的4倍以上。于是，根据频率稳定于概率的原理，我们可以认为吸烟

者患肺癌的概率明显大于不吸烟者患肺癌概率，即吸烟更容易引发肺

癌。

应用独立性检验解决实际问题大致应包括以下几个主要环节：

（1）提出零假设H：X和Y相互独立，并给出在问题中的解释.

（2）根据抽样数据整理出2x2列联表，计算/2的值，并与临界值X。

比较.

（3）根据检验规则得出推断结论.

（4）在X和Y不独立的情况下，根据需要，通过比较相应的频率，

分析X和y间的影响规律.

注意：上述几个环节的内容可以根据不同情况进行调整，

例如，在有些时候，分类变量的抽样数据列联表是问题中给定的.

0.500.400.250.150.100.050.0250.0100.0050.001

P（Z汽）

0.4550.7081.3232.0722.7063.8415.0246.6357.87910.82

归纳总结

跟踪训练1.某校对学生的课外活动进行调查，结果整理成下表:

体育文娱总计

男生212344

女生62935

3卜275279

试用你所学过的知识分析：能否在犯错误的概率不超过0.005的前提

下，认为“喜欢体育还是文娱与性别有关系”?

解：'：a=2\,b=23,c=6,d=29,n=79,

（）2

.najc2_79x21x29-23x6

'x一（a+b）（c+d）（a+c）”+d）,—44x35x27x52~6-1U0

且^2>7.879）~0.005,

0.500.400.250.150.100.050.0250.0100.0050.001

P（左X。）

0.4550.7081.3232.0722.7063.8415.0246.6357.87910.82

即我们得到的*2的观测值x=8.106超过7.879这就意味着:"喜欢体育

还是文娱与性别没有关系”这一结论成立的可能性小于0.005,即在犯

错误的概率不超过0.005的前提下认为“喜欢体育还是喜欢文娱与性

别有关.”

三、达标检测

1.给出下列实际问题：通过练习巩固

①一种药物对某种病的治愈率;②两种药物治疗同一种病是否有区本节所学知识，通过

别；学生解决问题，发展

③吸烟者得肺病的概率;④吸烟是否与性别有关系；学生的数学运算、逻

⑤网吧与青少年的犯罪是否有关系.其中用独立性检验可以解决的问辑推理、直观想象、

题有（）数学建模的核心素

A.①②③B.②④⑤C.②③④⑤D.①②③④⑤养。

解析:独立性检验是判断两个分类变量是否有关系的方法，而①③都是

概率问题,不能用独立性检验解决.

答案:B

2.某班主任对全班50名学生进行了作业量多少的调查,数据如下表：

下列叙述中，正确的是（）

认为作业多认为作业不多总数

喜欢玩电脑游戏18927

不喜欢玩电脑游戏81523

总数262450

A.有99%的把握认为“喜欢玩电脑游戏与认为作业量的多少有关系”

B.有95%的把握认为“喜欢玩电脑游戏与认为作业量的多少无关系”

C.有99%的把握认为“喜欢玩电脑游戏与认为作业量的多少无关系”

D.有95%的把握认为“喜欢玩电脑游戏与认为作业量的多少有关系”

50X(18X15-8X9)2

计算得Z2-5.059>3.841.

27X23X26X24

答案:D

3.某高校《统计》课程的教师随机调查了选该课的一些学生情况，具体

数据如下表：

为了判断主修统计专业是否与性别有关系，根据表中的数据，得到

专业

非统计专业统计专业

性别

男1310

女720

因为4.844>3.841,所以有的把握判定主修统计专业与性

别有关系.

y=50X(13X20-10X7j4844

人~23x27x20x30~'

答案：95%

4.在500人身上试验某种血清预防感冒作用，把他们一年中的感冒记

录与另外500名未用血清的人的感冒记录作比较，结果如表所示。问:

该种血清能否起到预防感冒的作用？

未感冒感冒合计

使用血清258242500

未使用血清216284500

合计4745261000

解：设H。：感冒与是

人人文库> 全部分类> 教育资料 > 辅导培训

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

分类变量与列联表教案

文档简介

温馨提示

最新文档

评论

分类变量与列联表教案

文档简介

温馨提示

最新文档

评论

相关文档