知识讲解-高考总复习:统计与统计案例_第1页
知识讲解-高考总复习:统计与统计案例_第2页
知识讲解-高考总复习:统计与统计案例_第3页
知识讲解-高考总复习:统计与统计案例_第4页
知识讲解-高考总复习:统计与统计案例_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

高考总复习:统计与统计案例

编稿:孙永钊审稿:张林娟

【考纲要求】

1.随机抽样

(1)理解随机抽样的必要性和重要性;

(2)会用简单随机抽样方法从总体中抽取样本:了解分层抽样和系统抽样方法.

2.用样本估计总体

(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎吐图,理解它

们各自的特点.

(2)理解样本数据标准差的意义和作用,会计算数据标准差.

(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.

(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用

样本估计总体的思想.

(5)会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.

3.变量的相关性

(1)会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系;

(2)了解最小二乘法的思想.能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程

系数公式不要求记忆).

【知识网络】

到的概率相等,就称这样的抽样为简单随机抽样.

①用简单随机抽样从含有N个个体的总体中抽取一个容量为n的样本时,每次抽取一个个体时,任一

个体被抽到的概率为।;在整个抽样过程中各个个体被抽到的概率为"

NN

②简单随机抽样的特点是:不放回抽样,逐个地进行抽取,各个个体被抽到的概率相等;

③简单随机抽样方法体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础.

简单抽样常用方法:

①抽签法:先将总体中的所有个体(共有N个)编号(号码可从1到N),并把号码写在形状、大小相同

的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签

时每次从中抽一个号签,连续抽取n次,就得到一个容量为n的样本.

适用范围:总体的个体数不多.

优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.

②随机数表法:随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;

第三步,获取样本号码.

2.系统抽样:

当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先制定出的规则,从每一部分抽

取一个个体,得到需要的样本,这种抽样叫做系统抽样.

系统抽样的步骤:

①采用随机的方式将总体中的个体编号,为简便起见,有时可直接采用个体所带有的号码,如考生的

准考证号、街道上各户的门牌号等等.

②为将整个的编号分段(即分成几个部分),要确定分段的间隔Z.当二是整数时(X为总体中的个体

n

NN

的个数,n为样本容量),k=上;当二不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的

nn

N'

个数N'能被n整除,这时火二一.

n

③在第•段用简单随机抽样确定起始的个体编号/.

④按照事先确定的规则抽取样本(通常是将/加上间隔%,得到第2个编号/+&,第3个编号/+2A,

这样继续下去,直到获取整个样本).

要点诠释:

①系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一

部分进行抽样时,采用的是简单随机抽样;

②与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的

③总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体

数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整

除再进行系统抽样.

3.分层抽样:

当已知总体由差异明显的几部分组成时,为r使样本更充分地反映总体的情况,常将总体分成几部分,

然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,所分成的部分叫做层.

4.常用的三种抽样方法的比较:

类别共同点不同点联系适用范围

简单随抽样过从总体中逐个抽取是后两种方法的基础总体个数较少

机抽样程中每

系统抽样个个体将总体均分成几部分,按事先确在起始部分抽样时用简总体个数较多

被抽取定的规则在各部门抽取单随机抽样

分层抽样的概率将总体分成几层,分层进行抽取各层抽样时采用简单随总体由差异明显

相等机油样或系统抽样的几部分组成

要点诠释:

(1)各种抽样的个体被抽到的概率相等;

(2)抽样过程中个体被抽到的概率相等.

5.不放回抽样和放回抽样:

在抽样中,如果每次抽出个佃后不再将它放回总体,称这样的抽样为不放回抽样;如果每次抽出个体

后再将它放回总体,称这样的抽样为放回抽样

随机抽样、系统抽样、分层抽样都是不放回抽样

考点二、用样本估计总体

1.统计图表包括条形图、折线图、饼图、茎叶图.

2.作频率分布直方图的步骤

(1)求极差(即一组数据中最大值与最小值的差)

(2)决定组距与组数

(3)将数据分组

(4)列频率分布表

(5)画频率分布表

3.频率分布折线图和总体密度曲线

(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图

(2)总体密度曲线:随着样本容量的增加,作图所分的组数增加,组距减小,相应的频率折线图会越来越

接近于一条光滑曲线,即总体密度曲线

4.标准差和方差

在散点图中,点散布在从左下角到右上角的区域.对于两个变量的这种相关关系,我们将它称为正相

(3)负相关

在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.

(4)线性相关关系、回归直线

如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这

条直线叫做回归直线.

3..回归方程

(1)最小二乘法

求回归直线使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.

(2)回归方程

方程丁二反1+。是两个具有线性相关关系的变量的一组数据(凡,,),。2,%),3(“〃,)'”),的回归方程,

期中冬〃是待定参数.

要点诠释:

相关关系与函数关系的异同点:

相同点:两者均是指两个变显的关系.

不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系;

②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随美系.

考点四、统计案例

1.回归分析

(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法;

(2)随机误差:线性回归模型用y=+a+e表示,其中。力为模型的未知数,e称为随机误差.

(3)样本点的中心在具有线性相关关系的数据(x,x),(々,,2),…(当,尤),中回归方程的截距和斜率的

最小二乘估计公式分别为:

其中x」力为产力%(元,于)称为样本点的中心.

(4)相关系数

Z(%-初y-/

①/二产—“•

j之(%-无茂(%-苏

V/=1/=1

②当厂>0时,表明两个变量正相关;

当r<0Ht,表明两个变量负相关.

r的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常卜|

2.残差分析

(1)总偏差平方和

把每个效应(观测值减去总的平均值)的平方加起来即:X(x-y)2

i=l

⑵残差

数据点和它回归直线上相应位置的差异3—必)2是随机误差的效应,称-y为残差.

⑶残差平方和£(y一),).

i=l

E(x-Z)2

(4)相关指数2=V......-

Z(z-y)2

i=i

R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中,R?表示解释变

量对预报变量变化的贡献,率,片越接近「I,表示回归的效果越好.

3.独立性检验

(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.

(2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别

为{内,):}和{々,%},其样本频数列联表(称为2X2列联表)为

2X2列联表

总计

总计

构造一个随机变量K=(»),其中"为样本容量

(3)独立性检验

利用随机变量K?来确定是否能以一定把握认为“两个分类变量有关系”的方法称为两个分类变量的

独立性检验.

注:在独立性检验中经常由42得到观测值鼠则k=K?是否成立?(K?与k的关系并不是k=K2,k

是K?的观测值,或者说K?是一个随机变量,它在。,b,c,d)取不同值时,K?可能不同,而Z是

取定一组数〃,b,c,d后的一个确定的值.

【典型例题】

类型一、简单随机抽样

【例1】某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测

量,如何采用简单随机抽样的方法抽取样本?

【思路点拨】简单随机抽样一般采用两种方法:抽签法和随机数表法.

【解析】解法卜(抽签法)将100件轴编号为1,2,…,100,并做好大小、形状相同的号签,分别

写上这100个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取10个号签,然后测量这个10个号

签对应的轴的直径.

解法2:(随机数表法)将1D0件轴编号为00,01,…99,在随机数表中选定一个起始位置,如取第

21行第1个数开始,选取10个为68,34,30,13,70,55,74,77,40,44,这10件即为所要抽取的

样本.

【总结升华】从以上两种方法可以看出,当总体个数较少时用两种方法都可以,当样本总数较多时,

方法2优于方法1.

举一反三:

【变式】某大学为了支持奥运会,从报名的24名大三的学生中选6人组成志愿小组,请用抽签法和随

机数表法设计抽样方案.

【思路点拨】(1)总体的个体数较少,利用抽签法或随机数表法可容易获取样本;

(2)抽签法的操作要点:编号、制签、搅匀、抽取;

(3)随机数表法的操作要点:编号、选起始数、读数、获取样本.

【解析】抽签法

第一步:将24名志愿者编号,编号为1,2,3,……,24;

第二步:将24个号码分别写在24张外形完全相同的纸条上,并揉成团,制成号签;

第三步:将24个号签放入一个不透明的盒子中,充分搅匀;

第四步:从盒子中逐个抽取6个号签,并记录上面的编号:

第五步:所得号码对应的志愿者,就是志愿小组的成员.

随机数表法

第一步:将24名学生编号,编号为01,02,03,……24;

第二步:在随机数表中任选一数开始,按某一确定方向读数;

笫三步:凡不在()1〜24中的数或已读过的数,都跳过去不作记录,依次记录下得数;

第四步:找出号码与记录的数相同的学生组成志愿小组.

类型二、系统抽样

【例2】某校高中三年级的295名学生已经编号为1,2,……,295,为了了解学生的学习情况,要按

1:5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程.

【思路点拨】按1:5分段,每段5人,共分59段,每段抽取一人,关键是确定第1段的编号.

【解析】按照1:5的比例,应该抽取的样本容量为295+5=59,我们把259名同学分成59组,每组5

人,第一组是编号为1〜5的5名学生,第2组是编号为6-10的5名学生,依次下去,59组是编号为291〜

295的5名学生.采用简单随机抽样的方法,从第一组5名学生中抽出一名学生,不妨设编号为k(lWk《

5),那么抽取的学生编号为k+5L(L=0,1,2,……,58),得到5g个个体作为样本,如当k=3时的样本编号

为3,8,13,……,288,293.

【总结升华】系统抽样可按寻先规定的规则抽取样本.本题采用的规则是第一组随机抽取的学生编号

为k,那么第m组抽取的学生编号为k+5(m-l).

举一反二:

【变式】一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,

组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取

的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的

号码是.

【答案】k=1,:,m+k=\3・••在第7小组中抽取的号码是63.

类型三、分层抽样

例3(2015北京高考)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调杳教师的身体状

况,在抽取的样本中,青年教师芍320人,怎该样本的老年教师人数为()

【思路点拨】先根据表格数据计算出老年教师和青年教师的比例关系然后求解即可。

【答案】C

【释析】由题意,老年和青年教师的人数比为900:1600=9:16,因为青年教师有320人,所以老年教师有180

人,故选C.

【总结升华】解决分层抽样问题的关键是要保证各个类型在样本中的比例和在总体中的比例相同.

举一反三:

【变式】(2015惠州模拟)某学校高一、高二、高三年级的学生人数分别为900、900、1200人,现用分层

抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高三年级抽取的学生人数为()

【答案】B

【解析】三个年级的学生人数比例为3:3:4,按分层抽样方法,在高三年级应该抽取人数为:

4

50x=20人,故选B.

3+3+4

【例4】一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一

个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样

的方法?并写出具体过程.

【思路点拨】采用分层抽样的方法.

【解析】因为疾病与地理位置.和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽

样的方法,具体过程如下:

(1)将3万人分为5层,其中一个乡镇为一层.

(2)按照样本容量的比例随机抽取各乡镇应抽取的样本.

300X3/15=60(A),300X2/15=40(人),300X5/15=100(A),300X2/15=40(A),300X3/15=60

(人),因此各乡镇抽取人数分别为60人、40人、100人、40人、60人.

(3)将300人组到一起,即得到一个样本.

【总结升华】分层抽样在日常生活中应用广泛,其抽取样本的步骤尤为重要,应牢记按照相应的比例

去抽取.

举一反三:

【变式】且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同的年龄层

4

次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样

本,试确定

(I)游泳组中,青年人、中年人、老年人分别所占的比例;

(II)游泳组中,青年人、中年人、老年人分别应抽取的人数.

【答案】

(I)设登山组人数为入,游泳组中,青年人、中年人、老年人各占比例分别为a、b、c,

.140%I3.v〃=475%

4x%=50%

则有《解得4

x10%+3xc”/c=10%

------------=10%

4x

故a=100%-50%-10%=40%,

即游泳组中,青年人、中年人、老年人各占比例分别为40%、50%、10%.

(II)游泳组中,抽取的青年■人数为200x3x40%=60(人);

4

3

抽取的中年人数为200x二x50%=75(人);

4

3

抽取的老年人数为200X-X10%=15(人)•

4

类型四、用样本估计总体

【例4】甲、乙两小组各10名学生的英语口语测试成绩如下:(单位:分)

甲组76908486818786828583

乙组82848589798091897974

用茎叶图表示两小组的成绩,并判断哪个小组的成绩更整齐一些?

【思路点拨】学会用茎叶图表示数据的方法;并会进行统计推断.

【解析】用茎叶图表示两小组的成绩如图:

甲茎乙

67499

766543218024599

091

由图可知甲组成绩较集中,即甲组成绩更整齐一些.

【总结升华】对各数据是二、三位数,且数据量不是很大时,用用茎叶图表示较为方便,也便于进行

统计推断,否则,应改用其他方法.

举一反三:

【变式1】甲、乙两个学习小组各有10名同学,他们在一次数学测验中成绩的茎叶图如图所示,则他

们在这次测验中成绩较好的是组.

【答案】甲小组

【变式2】甲、乙两名运动员的5次测试成绩如下图所示,设乐,与分别甲茎乙

57168

表示甲,乙两名运动员测试成绩的标准差,分别表示甲,乙两名运动

8822367

员测试成绩的平均数,则有()

A.玉二/,<与B.x}=x2,5]>s2

S

C.内>/,5,>s2D.玉=&,\=$2

【答案】B

【例5】以下茎叶图记录了甲、乙两组各四名同学在某次数学测验中的成绩,甲如记录中有一个数据

模糊,无法确认,在图中以X表示.

申阳/㈤

6A87

419003

(I)如果甲组同学与乙组同学的中均小绩一样,求X及甲组同学数学成绩的方差:

(H)如果X=7,分别从甲、乙两组同学中各随机选取一名,求这两名同学的数学成绩之和大于180的概

率.(注:方差/=—[(%-1)2+(X)-X)2+…+区-工)2],其中切…'怎的平均数)

n

【思路点拨】(I)利用平均数的基本概念加以求解。(II)根据列举法求出所有事件构成样本空间,

再求出事件”这两名同学的数学成绩之和大于18()''的样本空间,利用占典概型公式可解。

87+90+90+93

【解析】(I)乙组同学的平均成绩为=90,甲组同学的平均成绩为90,

80+X+86+91+94

所以-=--9-(-)-,-X--=-9--.--------

甲组同学数学成绩的方差为才二(86-9。)2+(89-9。)2;(9-。)2+(94-9。)、掾

(H)设甲组成绩为86,87,91,94的同学分别为2MM4,乙组成绩为87,90,90.93的同学分别为

自,打,么,则所有的事件构成的基本事件空间为:

(%也),(%也),(4,4),(。4也),(。4也),(。4也)}.共16个基本事件.

设事件A=”这两名同学的数学成绩之和大于18()”,则事件4包含的基本事件的空间为

{(6,b2),(。3,4)(6,“),(4,4),(。4也),(4,4),(%也)}.共7个基本事件,

【总结升华】会根据茎口I・图列举出相关具体数据,再利用古典概型或是独立重复试验类型加以求解―。

举一反三:

【变式】某工厂甲、乙两个车间包装同一种产品,在自动包装传送

甲乙

带上每隔一小时抽一包产品,称其重量(单位:克)是否合格,分别记2124

录抽查数据,获得重量数据茎叫图(如右).431111025

(I)根据样本数据,计算甲、乙两个车间产品重量的均值与方差,71089

并说明哪个车间的产品的重量相对稳定;

(II)若从乙车间6件样品中随机抽取两件,求所抽取两件样品重量之差不超过2克的概率.

【解析】(I)设甲、乙两个车间产品重量的均值分别为文甲、%乙,方差分别为的、$3则

—122+114+113+111+111+107…

X甲=-------------------------------=113,

—124+110+112+115+108+109一,

X乙=-------------------------------=113,

6

=21,

=29.33,

由于<si,所以甲车间的产品的重量相对稳定;

(II)从乙车间6件样品中随机抽取两件,结果共有15个:

(124,110),(124,112),(124,115),(124,108),(124,109),

(110,112),(!10,115),(!10,108),(110,109),(112,115),

(112,108),(112,109),(115,108),(115,109),(108,109).

设所抽取两件样品重量之差不超过2克的事件为A,则事件A共有4个结果:

(110,112),(110,108),(110,109),(108,109).

4

所以P(/1)=—.

【例6高清视频统计勺统计案例:例4】近年来,某市为了促进生活垃圾的分类处理,将生活垃圾分为厨

余垃圾、可呵1收物和其他垃圾三类,并分别设置了相应的垃圾斜.为调查居民生活垃圾分类投放情况,现

随机抽取了该市三类垃圾箱中总计1000吨生活垃圾,数据统计如下(单位:吨):

“厨余垃圾”箱“可回收物”箱“其他坨圾”箱(1)试估计厨余垃圾投放正确的

厨余垃圾400100100概率:

可回收物3024030

(2)试估计生活垃圾投放错误的

其他垃圾202060

概率;

(3)假设厨余垃圾在“厨余垃圾”箱、“可回收物”箱、“其他垃圾”箱的投放量分别为a,b,c,其中a〉0,a+b

+c=600.当数据小b,。的方差/最大时,写出小b,。的值(结论不要求证明),

并求此时/的值.

注:S?」L二尸+(居二产+…+区工)2],其中断数据可,物……的平均数

n~

【思路点拨】(I)、(2)两问可通过古典概型公式加以求解;第(3)问利用方差的意义求解。

【解析】(I)厨余垃圾投放正确的概率约为

(2)设生活垃圾投放错误为事件A,则可表示升华垃圾投放正确。

事件A的概率约为“厨余垃圾”箱里厨余垃圾量、“可回收物”箱里的可回收物量与“其他坨圾”箱里其

他垃圾量的总和除以升华垃圾总量,即P(N)约为」———=0.7

所以P(A)

(3)当a=600,b=c=O时.,S?取得最大值。

因为§(6Z+/?+C)=2OO,所以/=§[(600-2()0)2+(0-200)2++(0,2()())2]=8()()0()。

【总结升华】本题主要考察求解古典概型的方法和方差的几何意义,同时考查数据收集处理的能力。

【例7】为了解甲、乙两厂的产品的质量,从两厂生产的产品中随机抽取各10件,测量产品中某种元素的

含量(单位:毫克).下表是测量数据的茎叶图:

9

39658845690

1503103

规定:当产品中的此种元素含量满足218宫克时,,该产品为优等品.

(I)试用上述样本数据估计甲、乙两厂生产的优等品率;

(H)从乙厂抽出的上述10件产品中,随机抽取3件,求抽到的3件产品中优等品数g的分布列及其数

学期望E8;

CID从上述样品中,各随机抽取3件,逐一选取,取后有放回,求抽到的优等品数甲厂恰比乙厂多2件

的概率.

【思路点拨】(I)根据茎叶图所给数据,数出甲乙厂优等品数量即可。

(IDJ的取值为0,1,2,3,分别求出对应的抽取方法,再按照等可能事件概率方法求解可得。

(W)优等品数甲厂恰比乙厂多2件包括2种情况,“甲厂2件,乙厂0”以及“甲厂3件,乙厂1件“,

分别按照独立重复试验概率公式求解,又从甲厂抽取与从乙厂抽取相互独立,按照乘法计算即可。

【解析】(I)甲厂抽取的样本中优等品有6件,优等品率为一二一.

105

乙厂抽取的样本中优等品有5件,优等品率为

102

(II)4的取值为0,1,2,3.

所以4的分布列为

故4的数学期望为£(€)=0'《+}/2*得+3乂卷二|.

(III)抽取的优等品数甲厂恰比乙厂多2件包括2个事件,即A="抽取的优等品数甲厂2件,乙厂0件”,

B="抽取的优等品数甲厂3件,乙厂1件”

27c127

抽我的优等品数甲厂恰比乙厂多2件的概率为P(A)+P(3)=——+——=——.

5001000200

【总结升华】本题属于统计与概率综合题,考查茎叶图有关知识,同时考查学生对相互独立事件同时发生

的概率与独立重复试验的概率的应用能力。

【例8】对某电子元件进行寿命追踪调查,情况如下:

寿命(h)100-200200〜300300-400400〜500500〜600

个数2030804030

(1)列出频率分布表;

(2)画出频率分布直方图和累枳频率分布图;

(3)估计电子元件寿命在100〜400h以内的概率;

(4)估计电子元件寿命在400h以上的概率.

【思路点拨】本题直接利用作频率分布直方图的步骤求解即可得到答案。

【解析】(1)频率分布表如下:

寿命(h)频数频率累积频率

10()〜20()20

200〜30030

300〜40()80

40()~50040

50()〜60()301

合计2001

(2)频率分布直方图如下:

【总结升华】画频率分布条形图、直方图时要注意纵、横坐标轴的意义,明确频率分布直方图中各小

长方形的面积之和为1.

举一反三:

【变式1】根据《中华人民共和国道路交通安全法》规定:车辆驾驶员血液酒精浓度在20'80mg/100mL

(不含80)之间,属于酒后驾车;血液酒精浓度在80mg/100mL(含80)以上时,属醉酒驾车。据有关报

A.25B.50

C.75I).100

【答案】C

【变式2]某部门计划对某路段进行限速,为调查限速60km/h

是否合理,对通过该路段的300辆汽车的车速进行检测,将所得数据按

[40,50),[50,60),[60,70),[70,80]分组,绘制成如图所示频率

分布直方图.则这300辆汽车中车速低于限速的汽车有

辆.

【答案】180。

【变式3】从某校随机抽取了100名学生,将他们的体重(单位:kg)

数据绘制成频率分布直方图(如图),由图中数据可知〃?二,所抽取的学生中

体重在45〜50依的人数是,频率

'组距

【答案】0.1,50.

m

[例9]对某校高三年级学生参加社区服务次数进行统计,随机抽取0名学生作为样本,得到这M名学

生参加社区服务的次数.根据此数据作出了频数与频率的统计表,频凄分。直力图妇下:

分组频数频率

(2)求&

10

出表力

240455060体重(kg)

M,p及图

2......————1——1-------i

中。的值;01015202530次数

合计1

(1【)若

该校高三学生有240人,试估计该校高三学生参加社区服务的次数在区间[10,15)内的人数;

(III)在所取样本中,从参加社区服务的次数不少于20次的学生中任选2人,求至多一人参加社区

服务次数在区间[25,30)内的概率.

【思路点拨】(I)(II)利用某一已知组的频数和频率的关系可加以求解。

(111)利用列举法列举出所有情况,再根据对立事件概率关系可以求解。

【解析】(I)由分组[10,15)内的频数是10,频率是0.25知,—=0.25,

M

所以M=40.

因为频数之和为40,所以10+24+m+2=40,m=4.

m4

/?=—=—=0.10.

M40

24

因为a是对应分组[15,20)的频率与组距的商,所以。=套启=0.12.

(II)因为该校高三学生有240人,分组[10/5)内的频率是0.25,

所以估计该校高三学生参加社区服务的次数在此区间内的人数为60人.

CID这个样本参加社区服务的次数不少于20次的学生共有m+2=6人,

设在区间[20,25)内的人为{q,生,%,q},在区间[25,30)内的人为{如H}.

则任选2人共有(49),(4,引,(4,%),(4为1),(%也),(《,%),(出,4),(出,4),

(生也),(。3,。4),(外,乙),(々3也),(。4,4),34也),(伉也)15种情况,

而两人都在[25,30)内只能是(乙,么)一种,

114

所以所求概率为P=1=—.(约为0.93)

1515

【总结升华】在频率分布表中,频数的和等于样本容量,频率的和等于1,每一小组的频率笔于这一组的

频数除以样本容量.频率分布直方图中,小矩形的高等于每一组的频率/组距,它们与频数成正比,小矩形

的面积等于这一组的频率.对于开放性问题的回答,要选择适当的数据特征进行考察,根据数据特征分析

得出实际问题的结论.

举一反三:

【变式】某校从高一年级学生中随机抽取60名学生,将其期中考试的数学成绩(均为整数)分成六段:

[40,50),[50,60),…,[90,100]后得到如下频率分布直

方缸

(I)求分数在[70,80)内的频宝;

(H)根据频率分布直方图,估计该校高一年级学生期中

考试数学成绩的平均分;

(III)用分层抽样的方法在8()分以上(含8()分)的学生

中抽取一个容量为6的样本,将该样本看成一个总体,

从中任意选取2人,求其中恰有I人的分数不低于90分的概率.

【蚱析】(I)分数在[70,80)内的频率为:

1-(0.010+0.015+0.015+0.025+0.005)x10=1-0.7=0.3.

(II)平均分为:

x=45x0.1+55x0.154-65x0.15+75x0.3+85x0.25+95x0.05=71.

(III)由题意,[80,90)分数段的人数为:0.25x60=15人;

[90,100]分数段的人数为:0.05x60=3人;

•・•用分层抽样的方法在80分以上(含80分)的学生中抽取一个容量为6的样本,

・•・[80,90)分数段抽取5人,分别记为A,B,C,D,E;

[90,100]分数段抽取1人,记为M.

因为从样本中任取2人,其中恰有1人的分数不低于90分,

则另一人的分数一定是在[80,90)分数段,所以只需在分数段[80,90)抽取的5人中确定I人.

设“从样本中任取2人,其中恰有1人的分数不低于90分为"事件A,

则基本事件空间包含的基本事件有:(4B),(A,C),(4,D),(A,E),(B,C),(B,D),

(B,E),(C,D),(C,E),(O,E),(A,M),(8,M),(C,M),(。,M),(E,M)共15种.

事件A包含的基本事件有(A,M),(B,Af),(C,M),(D,M),(E,")5种.

・••恰有I人的分数不低于90分的概率为P(A)=K=;.

【例10]某中学举行了一次“环保知识竞赛“,全校学生参加了这次竞赛.为了了解本次竞赛成绩情况,

从中抽取了部分学生的成绩(得分取正整数,满分为100分)作为样本进行统计.请根据下面尚未完成并

有局部污损的频率分布表和频率分布直方图(如图所示)解决下列问题:

频率分布走

频率分布直方图

组别分组频数频率

第1组|50,60)8

第2组[60,70)a1

第3组[70,80)20

第4组|80,90)1

第5组[90,100]2b

合计1I

(I)写出。,力,为y的值;

(II)在选取的样本中,从竞赛成绩是80分以上(含80分)的同学中随机抽取2名同学到广场参加环保

知识的志愿宣传活动,求所抽取的2名同学来自同一组的概率;

(ill)在(II)的条件下,设4表示所抽取的2名同学中来自第5组的人数,求&的分布列及其数学期望.

【思路点拨】(I)利用某一已知组的频数和频率的关系可求得样本总频数和第四组频数,进而求出

。,一的值。

(II)分两种情况:一,2人来自第4组,二,2人来自第5组。

CIDrh(II)容易得到J的可能取值为,再利用等可能事件概率求解。

【解析】(I)由题意可知,a=[6,b=0.04,x=0.032,=0.004.

(II)由题意可知,第4组有4人,第5组有2人,共6人.

从竞赛成绩是80分以上(含80分)的同学中随机抽取2名同学有

C:=15种情况.

设事件随机抽取的2名同学来自同一组,则

P(A)=C:、C;=L.

c:15

7

所以,随机抽取的2名同学来自同一组的概率是一.

15

(III)由(H)可知,J的可能取值为0,1,2,则

陛=。)噎喋=1,­=等陪尸(2喈七

所以,J的分布列为

2Q।2

所以,£^=()x-+lx—+2x—=-.

515153

[总结升华】本题考查频数,频率及频率分布直方图及

概率知识,考查运用统计知以解决简单实际问题的能力,数据

处理能力和运用意识。

举一反三:

【变式】为增强市民的节能环保意识,某市面向全市征召义务宣传志愿者.从符合条件的500名志愿者

中随机抽样10()名志愿者的年龄情况如下表所示.

(I)频率分布表中的①、②位置应填什么数据?并在答题卡中补全频率分布直方图(如图),再根据

频率分布直方图估计这500名志愿者中年龄在[30,35)岁的人数;

(II)在抽出的1()0名志愿者中按年龄再采用分层抽样法抽取2()人参加中心广场的宣传活动,从这20

人中选取2名志愿者担仃.主要负责人,记这2名志愿者中“年龄低于30岁”的人数为X,求X的分布列

及数学期望.

分组【解甲粽【)①处填20,②处填().35:

频数频率

(单位:岁)___________________J

3卜全频2分布

百方图汝口图用示.…一

京。)刍青爆土二龌在[3。35)[勺△娄:为035x5(X)=175

①1

1tsil

04................十

(:琮蒯J方法厂取叶喔耿2c人,……j

则其时(“邳龄住于3巾岁"一产仔5人,....i

“年龄不假手加.罗”片勺有IS人.

故x的司能命僮为市一丁;2;一|

合计

“_C*_2^-------六,

「(乂=0)=4=弑>250G#=)铲漕:q五年龄岁

C22

P(X=2)=与=—

或38

所以X的分布列为:

P

**EX=0x—+1x—+2x—=—.

3838382

类型五、变量的相关性、回归分析和独立性检验

【例11】已知某地每单位面积菜地年平均使用氮肥量xkg与每单位面枳蔬菜年平均产量yt之间的关

系有如下数据:

年份19851986198719881989199019911992

x(kg)7074807885929095

y(t)

年1993199419951996199719981999

x(92108115123130138145

kg)

y(

t)

(1)求X与y之间的相关系数,并检验是否线性相关;

(2)若线性相关,求蔬菜产量y与使用氮

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论