2022版新高考数学一轮总复习学案:第9章_第1页
2022版新高考数学一轮总复习学案:第9章_第2页
2022版新高考数学一轮总复习学案:第9章_第3页
2022版新高考数学一轮总复习学案:第9章_第4页
2022版新高考数学一轮总复习学案:第9章_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第n章统计与统计案例

全国卷五年考情图解高考命题规律把握

1.考查形式

高考在本章一般命制1-2道小题

或者1道解答题.分值占5〜22分.

考点2.考查内容

独立性检验II18(2)11118(3)miso)

回归分析inis111815ms统计与统计案例的命题以一道小题

变量间的相关性

语杭布辟与痒本115nl3或一道大题的形式考查,难度中

111413

估计总体1118(3)mi8(i)ui3ini7ms

20162017201820192020年格等.主要以生活中的实际问题为背

景,考查随机抽样与样本估计总体、

线性回归方程的求解与运用、独立

性检验问题.

器随机抽样

[考试要求]

1.理解随机抽样的必要性和重要性.

2.会用简单随机抽样方法从总体中抽取样本.

3.了解分层抽样和系统抽样方法.4.会用随机抽样的基本方法解决一些简单

的实际问题.

[走进教材•夯实星础]回顾知识•激活技能

龄梳理•必备知识

1.简单随机抽样

(1)定义:设一个总体含有N个个体,从中逐个不放回地抽取〃个个体作为

样本(〃WN),如果每次抽取时总体内的各个个体被抽到的机会都相笠,就把这种

抽样方法叫做简单随机抽样.

(2)最常用的简单随机抽样的方法:抽签法和随机数法.

2.系统抽样的步骤

假设要从容量为N的总体中抽取容量为n的样本.

(1)先将总体的N个个体编号.

(2)确定分段间隔对编号进行分段,当彳N是整数时,取左=彳N,当彳N不是整

N,

数时,随机从总体中剔除余数,再取Z=-^-(N'为从总体中剔除余数后的总数).

(3)在第1段用简单随机抽样确定第一个个体编号IQWk).

(4)按照一定的规则抽取样本,通常是将I加上间隔k得到第2个个体编号I

±k,再加%得到第3个个体编号屿,依次进行下去,直到获取整个样本.

3.分层抽样

(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从

各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽

样方法叫做分层抽样.

(2)分层抽样的应用范围

当总体由差异明显的几个部分组成时,往往选用分层抽样.

[常用结论]

1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.

2.系统抽样一般也称为等距抽样,入样个体的编号相差分段间隔攵的整数

倍.

3.分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.

€>激活•必备技能

一、易错易误辨析(正确的打“J”,错误的打“x”)

(1)简单随机抽样中每个个体被抽到的机会不一样,与先后有关.()

(2)系统抽样在起始部分抽样时采用简单随机抽样.()

(3)要从1002个学生中用系统抽样的方法选取一个容量为20的样本,需要

剔除2个学生,这样对被剔除者不公平.()

(4)分层抽样中,每个个体被抽到的可能性与层数及分层有关.()

[答案](1)X(2)V(3)X(4)X

二'教材习题衍生

1.在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,

从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5000名居民

的阅读时间的全体是()

A.总体

B.个体

C.样本的容量

D.从总体中抽取的一个样本

A[由题目条件知,5000名居民的阅读时间的全体是总体;其中1名居民

的阅读时间是个体;从5000名居民某天的阅读时间中抽取的200名居民的阅读

时间是从总体中抽取的一个样本,样本容量是200.]

2.某学校为了了解高中一年级、二年级、三年级这三个年级之间的学生视

力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则

最合理的抽样方法是()

A.抽签法B.系统抽样法

C.分层抽样法D.随机数法

C[总体由差异明显的几部分组成,故最合理的抽样方法是分层抽样法.故

选C.]

3.某班共有52人,现根据学生的学号,用系统抽样的方法,抽取一个容量

为4的样本,已知3号,29号,42号学生在样本中,那么样本中还有一个学生

的学号是()

A.10B.11

C.12D.16

52

D[由题意可知,分段间隔女=彳=13,

...样本中还有一个学生的学号为3+13=16,故选D.]

4.某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为

200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品

中抽取60件进行检验,则应从丙种型号的产品中抽取件.

样本容量—60_3

L•总体个数200+400+300+1005(?

3

工应从丙种型号的产品中抽取Mjx300=18(件).]

[细研考点•突破题型]重难解惑直击高考

□考点一简单随机抽样4题组通关

畲通性通法1.简单随机抽样的四个特点

(1)被抽取样本的总体的个体数有限;

(2)逐个抽取;

(3)是不放回抽取;

(4)是等可能抽取.

2.简单随机抽样的适用范围

简单随机抽样常用抽签法(适用于总体中个体数较少的情况)、随机数法(适用

于个体数较多的情况).

1.下列抽取样本的方式属于简单随机抽样的个数为()

①从无限多个个体中抽取100个个体作为样本;

②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,

从中任意拿出一个零件进行质量检验后再把它放回盒子里;

③从20件玩具中一次性抽取3件进行质量检验;

④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.

A.0B.1

C.2D.3

A[①不是简单随机抽样,因为被抽取样本的总体的个数是无限的,而不是

有限的;②不是简单随机抽样,因为它是有放回抽样;③不是简单随机抽样,因

为这是“一次性”抽取,而不是“逐个”抽取;④不是简单随机抽样,因为不是等可

能抽样.故选A.]

2.总体由编号为01,02,03,…,49,50的50个个体组成,利用随机数表(以

下选取了随机数表中的第1行和第2行)选取5个个体,选取方法是从随机数表

第1行的第9列和第10列数字开始由左向右读取,则选出来的第4个个体的编

号为()

6667406714640571958611056509687683203790

5716001166149084451175738805905283203790

A.05B.09

C.11D.20

B[从随机数表第1行的第9列和第10列数字开始由左向右读取,符合条

件的编号有14,05,11,05,09,因为05出现了两次,所以选出来的第4个个体的编

号为09.故选B.]

3.利用简单随机抽样,从〃个个体中抽取一个容量为10的样本.若第二次

抽取时,余下的每个个体被抽到的概率为g,则在整个抽样过程中,每个个体被

抽到的概率为()

11

A.4B3

c510

C,14D,27

C[根据题意得,士=(解得〃=28.故每个个体被抽到的概率为噂=船

□考点二系统抽样、例题对讲

令通性通法(1)系统抽样适用的条件是总体容量较大,样本容量也较大.(2)

使用系统抽样的方法抽取样本时,若总体容量不能被样本容量整除,则应先从总

体中随机地剔除几个个体,再确定分段间隔.(3)起始编号的确定应用简单随机抽

样的方法,一旦起始编号确定,其他编号便随之确定.

[典例1](1)(2019・全国卷I)某学校为了解1000名新生的身体素质,将这

些学生编号为1,2,1000,从这些新生中用系统抽样方法等距抽取100名学

生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是()

A.8号学生B.200号学生

C.616号学生D.815号学生

(2)采用系统抽样方法从1000人中抽取50人做问卷调查,将他们随机编号

1,2,…,1000.适当分组后在第一组采用简单随机抽样的方法抽到的号码为8.

若抽到的50人中,编号落入区间[1,400]的人做问卷A,编号落入区间[401,750]

的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷C的人数为()

A.12B.13

C.14D.15

(1)C(2)A[(I)'.,从1000名学生中抽取一个容量为100的样本,.•.系统抽

样的分段间隔为1罂=10,•••46号学生被抽到,则根据系统抽样的性质可知,

第一组随机抽取一个号码为6,以后每个号码都比前一个号码增加10,所有号码

数是以6为首项,10为公差的等差数列,设其数列为他”},则斯=6+10(〃-1)

=10??-4,当〃=62时,062=616,即在第62组抽到616.故选C.

(2)根据系统抽样的特点可知,所有做问卷调查的人的编号构成首项为8,公

差4=写^=2°的等差数列{斯},

.•.通项公式%=8+20(〃-1)=20〃-12,令751W2O〃-12W1000,得天

253

亏,又'.,〃£v*,,39W〃W50,

做问卷C的共有12人,故选A.]

点评:系统抽样又称作等间隔抽样,其样本编号成等差数列,因此有关抽样

号码的问题常借助等差数列通项公式求解,如本例(2).

[跟进训练]

1.利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽取一

个容量为16的样本,如果抽出的产品中有一个产品的编号为13,则抽到产品的

最大编号为()

A.73B.78

C.77D.76

Qf)

B[样本的分段间隔为器=5,所以13号在第三组,则最大的编号为13+(16

-3)义5=78.]

2.某电视台为了解观众对某综艺节目的意见,准备从502名现场观众中抽

取10%进行座谈,现用系统抽样的方法完成这一抽样,则在进行分组时,需剔除

个个体,抽样间隔为.

210[把502名观众平均分成50组,由于502除以50的商是10,余数是

2,所以每组有10名观众,还剩2名观众,采用系统抽样的方法抽样时,应先用

简单随机抽样的方法从502名观众中抽取2名观众,这2名观众不参加座谈;再

将剩下的500名观众编号为1,2,3,-,500,并均匀分成50段,每段含鬻=10(个)

个体.所以需剔除2个个体,抽样间隔为10.]

□考点三分层抽样4例题对讲

令通性通法分层抽样问题类型及解题思路

(1)求某层应抽个体数量:按该层所占总体的比例计算.

(2)已知某层个体数量,求总体容量或反之:根据分层抽样就是按比例抽样,

列比例式进行计算.

(3)确定是否应用分层抽样:分层抽样适用于总体中个体差异较大的情况.

[典例2](1)某公司有大量客户,且不同年龄段客户对其服务的评价有较大

差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简

单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是.

(2)已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解

该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,

则样本容量和抽取的高中生近视人数分别为()

近视率/%

初中高中年级

A.100,10100,20

C.200,10200,20

(1)分层抽样(2)D[(1)因为不同年龄段的客户对公司的服务评价有较大差

异,所以需按年龄进行分层抽样,才能了解到不同年龄段的客户对公司服务的客

观评价.

(2)由题得样本容量为(3500+2000+4500)X2%=10000X2%=200,

抽取的高中生人数为2000X2%=40人,则近视人数为40X0.5=20人,故

选D.]

点评:进行分层抽样的相关计算时,常用到的两个关系

,样本容量〃该层抽取的个体数

(1)抽样比一总体的个体数N—该层的个体数.

(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.

[跟进训练]

1.交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,

对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,

其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分

别为12,21,25,43,则这四个社区驾驶员的总人数7\^为()

A.101B.808

C.1212D.2012

121

B[甲社区每个个体被抽取的概率为诟=土样本容量为12+21+25+43=

101,所以四个社区中驾驶员的总人数N=4L=8O8.]

8

2.为了了解高一、高二、高三学生的身体状况,现用分层抽样的方法抽取

一个容量为1200的样本,三个年级学生人数之比依次为k:5:3,已知高一年

级共抽取了240人,则高三年级抽取的人数为.

2401k1

360[因为高一年级抽取学生的比例为后5=予所以1+5+3=手解得人

3

=2,故高三年级抽取的人数为1200乂2+5+3=360.]

用样本估计总体

[考试要求]

1.了解分布的意义与作用,能根据频率分布表画频率分布直方图、频率折线

图、茎叶图,体会它们各自的特点.

2.理解样本数据标准差的意义和作用,会计算数据标准差.

3.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的

解释.

4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的

基本数字特征.理解用样本估计总体的思想,会用样本估计总体的思想解决一些

简单的实际问题.

[走进教材•分实基础]回顾知识•激活技能

©梳理•必备知识

1.常用统计图表

(1)作频率分布直方图的步骤:

①求极差(即一组数据中最大值与最小值的差).

②决定组距与组数.

③将数据分组.

④列频率分布表.

⑤画频率分布直方图.

(2)频率分布直方图:反映样本频率分布的直方图(如图)

横轴表示样本数据,纵轴表示频薪率,每个小矩形的面积表示样本数据落在该

组内的频率.各小矩形的面积和为L

(3)频率分布折线图和总体密度曲线

①频率分布折线图:将频率分布直方图中各相邻的矩形的上底边的生息顺次

连接起来,就得到频率分布折线图.

②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,

相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体

密度曲线.

(4)茎叶图的画法步骤:

第一步:将每个数据分为茎(高位)和叶(低位)两部分;

第二步:将最小茎与最大茎之间的数按大小次序排成一列:

第三步:将各个数据的叶依次写在其茎的右(左)侧.

2.样本的数字特征

(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.

(2)中位数:把〃个数据按大小顺序排列,处于最中间位置的一个数据(或最

中间两个数据的平均数)叫做这组数据的中位数.

(3)平均数:把.=山+&:+一称为阳,龙2,…,明这〃个数的平均数.

(4)标准差与方差:设一组数据X”X2,X3,…,X”的平均数为X,则这组数

据的标准差和方差分别是

S=[夕3_X)2-1-(X2-X)2-1------X归;

1一、一一

52=^FU1—X)24-(X2-X)2------X)2].

[常用结论]

1.频率分布直方图中的常见结论

(1)众数的估计值为度遹您形的生息对座的横坐标.

(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底

边中点的横坐标之和.

(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.

2.平均数、方差的公式推广

(1)若数据xi,X2,与的平均数为x,那么nix\-\-a,mx2~^a,zmg+a,…,

iwcn+a的平均数是mx+a.

(2)数据Xi,X2,…,X"的方差为P

①数据xi+a,X2+a,…,xn+a的方差也为C;

②数据axi,ax2,…,ax”的方差为足及.

黔激活•必备技能

一、易错易误辨析(正确的打“J”,错误的打“X”)

(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.()

(2)一组数据的方差越大,说明这组数据越集中.()

(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频

率越高.()

(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序

写,相同的数据可以只记一次.()

[答案](1)V(2)X(3)V(4)X

二'教材习题衍生

1.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数

为()

A.4B.8

C.12D.16

n

B[设频数为n,则变=0.25,

,”=32X0.25=8.]

2.若某校高一年级8个班参加合唱比赛的得分分别为

87,89,90,91,92,93,94,96,则这组数据的中位数和平均数分别是()

A.91.5和91.5B.91.5和92

C.91和91.5D.92和92

91+92

A「.•这组数据为87,89,90,91,92,93,94,96,.•.中位数是一j—=91.5,

……一87+89+90+91+92+93+94+96

平均数x=----------------«----------------=91.5.]

O

3.如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)

范围内的居民有人.

25[0.5x0.5x100=25.]

[细研考点•突破题型]重难解惑直击高考

□考点一样本的数字特征的计算与应用4题组通关

令通性通法

利用样本的数字特征解决决策问题的依据

(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕

平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准

差、方差越小,数据的离散程度越小,越稳定.

1——1

(2)方差的简化计算公式:$2=力[(3+焉----\-x^)—nx2],或写成S2=;(胡+

6+…+京)一彳2,即方差等于原数据平方的平均数减去平均数的平方.

1.(2020.济南模拟)已知某7个数的平均数为4,方差为2,现加入一个新数

据4,此时这8个数的平均数为方差为则()

A.x=4,.r<2B.x=4,52>2

C.x>4,52<2D.x>4,52>2

A,某7个数的平均数为4,.•.这7个数的和为4X7=28,•.•加入一个新

—28+4

数据4,二x=一O丁=4.又•.•这7个数的方差为2,且加入一个新数据4,...这

27X2+44

8个数的方差5=(_)=Z<2,故选A.]

O4

2.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图

所示,贝4()

t频数频数

33[-1

22

\,nnnnn...工.」」口一n..

0345678910环数0345678910环数

甲乙

A.甲的成绩的平均数小于乙的成绩的平均数

B.甲的成绩的中位数等于乙的成绩的中位数

C.甲的成绩的方差小于乙的成绩的方差

D.甲的成绩的极差小于乙的成绩的极差

C[根据条形统计图可知甲的中靶情况为4环、5环、6环、7环、8环;乙

—1—

的中靶情况为5环、5环、5环、6环、9环.x甲=尹(4+5+6+7+8)=6,xc

=1x(5X3+6+9)=6,甲的成绩的方差为

(4-6)2+(5—6)2+(6—6)2+(7—6)2+(8—6)2

5=2,乙的成绩的方差为

(5—6)2义3+(6—6)2+(9—6)2

5=2.4;甲的成绩的极差为4环,乙的成绩的极差为

4环;甲的成绩的中位数为6环,乙的成绩的中位数为5环,综上可知C正确,

故选C.]

3.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10/l,9.已知这组

数据的平均数为10,方差为2,则以一的值为()

A.1B.2

C.3D.4

D[由题意可知

J|(x+y+10+114-9)=10,

x+y=20,

•<

1[(x-10)24-(y-10)2+14-l]=2,,+)2=208.

:.(x+y)2=x1+y2+2xy,即208+2孙=400,:.xy=96.

(x—y)2=/+V—2xy=16,

:.\x-y\=4,故选D.]

4.(2020.全国卷I)某厂接受了一项加工业务,加工出来的产品(单位:件)

按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C

级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件

要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工

成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接

加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,

整理如下:

甲分厂产品等级的频数分布表

等级ABCD

频数40202020

乙分厂产品等级的频数分布表

等级ABCD

频数28173421

(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;

(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为

依据,厂家应选哪个分厂承接加工业务?

[解](1)由试加工产品等级的频数分布表知,

甲分厂加工出来的一件产品为A级品的概率的估计值为而=0.4;

乙分厂加工出来的一件产品为A级品的概率的估计值为而=0.28.

(2)由数据知甲分厂加工出来的100件产品利润的频数分布表为

利润6525-5-75

频数40202020

因此甲分厂加工出来的100件产品的平均利润为

65X40+25X20-5X20-75X20

--------------1-0-0--j-----------=15

由数据知乙分厂加工出来的100件产品利涧的频数分布表为

利润70300-70

频数28173421

因此乙分厂加工出来的100件产品的平均利润为

70X28+30X17+0X34—70X21

100=10,

比较甲、乙两分厂加工的产品的平均利润,应选甲分厂承接加工业务.

□考点二茎叶图4题组通关

伞通性通法1.茎叶图的三个关注点

(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统

(2)重复出现的数据要重复记录,不能遗漏.

(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一

般“重心”下移者平均数较大,数据集中者方差较小.注意“叶”中数不一定按

大小次数排列.

2.利用茎叶图解题的关键是抓住“叶”的分布特征,准确从中提炼信息.

3.以茎叶图为载体,一般考查中位数、平均数、方差.

1.(2020.平顶山模拟)中国诗词大会的播出引发了全民的读书热,某小学语

文老师在班里开展了一次诗词默写比赛,班里40名学生得分数据的茎叶图如图

所示.若规定得分不小于85分的学生得到“诗词达人”的称号,小于85分且不

小于70分的学生得到“诗词能手”的称号,其他学生得到“诗词爱好者”的称

号,根据该次比赛的成绩,按照称号的不同进行分层抽样抽选10名学生,则抽

选的学生中获得“诗词达人”称号的人数为(

0334

0444

6

D.6

A[由茎叶图可得,获“诗词达人”称号的有8人,据该次比赛的成绩按照

称号的不同进行分层抽样抽选10名学生,则抽选的学生中获得“诗词达人”称

号的人数为8X^^=2(人).]

2.(2020・长沙质检)为比较甲乙两地某月11时的气温甲乙

情况,随机选取该月5天11时的气温数据(单位:。C)制rTT689

成如图所示的茎叶图,已知甲地该月11时的平均气温比2m°3''

乙地该月11时的平均气温高1℃,则甲地该月11时的平均气温的标准差为()

A.2B.啦

C.10D.V10

B[甲地该月5天11时的气温数据(单位:°C)为28,29,30,30+加,32;

乙地该月5天11时的气温数据(单位:℃)为26,28,29,31,31,

则乙地该月11时的平均气温为(26+28+29+31+31)+5=29(℃),

所以甲地该月11时的平均气温为30℃,

故(28+29+30+30+〃?+32产5=30,解得m=\.

则甲地该月11时的平均气温的标准差为

X[(28-3O)2+(29-3O)2+(30-3O)2+(31-3O)2+(32-3O)2]

=啦.]

3.空气质量指数(AirQualityIndex,简称AQI)是定量描述空

气质量状况的指数,空气质量按照AQI大小分为六级,0〜50为一

优;51〜100为良;101〜150为轻度污染;151〜200为中度污染;754

11

19

21

201〜300为重度污染;大于300为严重污染.从某地一环保人士某年的AQI记

录数据中,随机抽取10个,用茎叶图记录如图.根据该统计数据,估计此地该

年AQI大于100的天数约为(该年为365天).

2

146[该样本中AQI大于100的频数是4,频率为予

2

由此估计该地全年AQI大于100的频率为引

2

估计此地该年AQI大于100的天数约为365X-=146.]

考点三频率分布直方图q例题对讲

畲通性通法频率、频数、样本容量的计算方法

频率

(1)品X组距=频率.

频数频数

(2)-晨昊=频率,京靠=样本容量,样本容量X频率=频数•

[典例](1)为了了解某校九年级1600名学生的体能情况,随机抽查了部分

学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率

分布直方图,根据统计图的数据,下列结论错误的是()

A.该校九年级学生1分钟仰卧起坐的次数的中位数为26.25

B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5

C.该校九年级学生1分钟仰卧起坐的次数超过30的人数约为320

D.该校九年级学生1分钟仰卧起坐的次数少于20的人数约为32

(2)(2019•全国卷III)为了解甲、乙两种离子在小鼠体内的残留程度,进行如

下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服

甲离子溶液,B组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓

度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比,

根据试验数据分别得到如下直方图:

甲离子残留百分比直方图

乙离子残留百分比直方图

记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到

P(。的估计值为0.70.

①求乙离子残留百分比直方图中a,b的值;

②分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的

中点值为代表).

(1)D[由频率分布直方图可知,中位数是频率分布直方图面积等分线对应

的数值,是26.25;众数是最高矩形的中间值27.5;1分钟仰卧起坐的次数超过

30的频率为0.2,所以估计1分钟仰卧起坐的次数超过30的人数为320:1分钟

仰卧起坐的次数少于20的频率为0.1,所以估计1分钟仰卧起坐的次数少于20

的人数为160.故选D.]

⑵[解]①由已知得0.70=a+0.20+0.15,故

a=0.35.

/?=1-0.05-0.15-0.70=0.10.

②甲离子残留百分比的平均值的估计值为

2X0.15+3X0.20+4X0.30+5X0.20+6X0.10+7X0.05=4.05.

乙离子残留百分比的平均值的估计值为

3X0.05+4X0.10+5X0.15+6X0.35+7X0.20+8X0.15=6.00.

点评:(1)频率分布直方图的纵坐标是白频率言,而不是频率,切莫与条形图混

淆.

(2)频率分布直方图考查时,重视求平均数、中位数、方差,计算要准确,

解决突破口是各个矩形面积之和为1.

[跟进训练]

1.为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生

的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道后5

组频数和为62,设视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a

的值为()

C.48D.27

B[前两组中的频数为100x(0.05+0.11)=16.因为后五组频数和为62,所以

前三组为38.所以第三组频数为22.又最大频率为0.32,对应的最大频数为

0.32x100=32.所以。=22+32=54.]

2.(2020.石家庄模拟)“一带一路”是“丝绸之路经济带”和“21世纪海上

丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄

和不同职业的人举办了一次“一带一路”知识竞赛,满分为100分(90分及以上

为认知程度高).现从参赛者中抽取了九人,按年龄分成5组,第一组:[20,25),

第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如

图所示的频率分布直方图,已知第一组有6人.

(1)求X;

(2)求抽取的x人的年龄的中位数(结果保留整数);

(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的

方法依次抽取6人,42人,36人,24人,12人,分别记为1〜5组,从这5个

按年龄分的组和5个按职业分的组中每组各选派1人参加知识竞赛,分别代表相

应组的成绩,年龄组中1〜5组的成绩分别为93,96,97,94,90,职业组中1〜5组

的成绩分别为93,98,94,95,90.

(i)分别求5个年龄组和5个职业组成绩的平均数和方差;

(ii)以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认

知程度,并谈谈你的感想.

[解](1)根据频率分布直方图得第一组的频率为0.01X5=0.05,

6

.•「=

X0.05,'.\x=120.

(2)设中位数为a,则0.01X5+0.07X5+3—30)X0.06=0.5,

95

."=铲32,则中位数为32.

——1

(3)(i)5个年龄组成绩的平均数为xi=§X(93+96+97+94+90)=94,方

差为[(-l)2+22+324-02+(-4)2]=6.

一1

5个职业组成绩的平均数为x2=5X(93+98+94+95+90)=94,方差为退=

|X[(-1)24-42+02+12+(-4)2]=6.8.

(ii)从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳

定(感想合理即可).

篦琶畲变量间的相关关系、统计案例

[考试要求]

1.会做两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关

2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回

归方程(线性回归系数公式不要求记忆).

3.了解回归分析的基本思想、方法及其简单应用.4.了解独立性检验(只要求

2X2列联表)的思想、方法及其初步应用.

[走进教材-夯实基础]回顾知识•激活技能

©梳理•必备知识

1.两个变量的线性相关

(1)正相关

在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关

关系,我们将它称为正相关.

(2)负相关

在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系

称为负相关.

(3)线性相关关系、回归直线

如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之

间具有线性相关关系,这条直线叫做回归直线.

2.回归方程

(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法

叫做最小二乘法.

(2)回归方程:方程£=即+。是两个具有线性相关关系的变量的一组数据⑶,

y),(无2,”),…,(X”,为)的回归方程,其中2分是待定参数.

A石(刘一X)&Ly)篙和Xy

b=nZZ=_nZZ-,

S石(Xj-x)2石需一〃x2

A—A-

3.回归分析

(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.

(2)样本点的中心

对于一组具有线性相关关系的数据(xi,yi),(X2,”),…,(xn,yn),其中(WL

三称为样本点的中心,即回归直线经过点(;,7).

(3)相关系数

当r>0时,表明两个变量正相关;

当rVO时,表明两个变量负相关.

r的绝对值越接近于1,表明两个变量的线性相关性越强./•的绝对值越接近

于0,表明两个变量之间几乎不存在线性相关关系.通常团大于区反时,认为两

个变量有很强的线性相关性.

4.独立性检验

(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称

为分类变量.

(2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变

量X和匕它们的可能取值分别为但,右}和{y"”},其样本频数列联表(称为2X2

列联表)为

变量yi总计

XIab

X2cdc+d

总计a+cb+da+b+c+d

构造一个随机变量心=1女”与嚼工其中为样

本容量.

[常用结论]

1.回归直线必过样本点的中心(1,V).

2.当两个变量的相关系数|r|=l时,两个变量呈函数关系.

黔激活•必备技能

一'易错易误辨析(正确的打“,错误的打“X”)

(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关

系—()

(2)通过回归直线方程£=源+。可以估计预报变量的取值和变化趋势.()

(3)因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进

行相关性检验.()

(4)事件x,y关系越密切,则由观测数据计算得到的心的观测值越大.()

[答案](1)V(2)V(3)x(4)V

二'教材习题衍生

1.在两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相

关指数收如下,其中拟合效果最好的是()

A.模型1的相关指数K为0.98

B.模型2的相关指数R2为0.80

C.模型3的相关指数K为0.50

D.模型4的相关指数K为0.25

A[/?2越接近于],其拟合效果越好.]

2.下面是2X2列联表:

变量Vy2总计

a2173

X2222547

总计b46120

则表中a,8的值分别为()

A.94,72B.52,50

C.52,74D.74,52

C[Va+21=73,,a=52.又a+22=8,A/?=74.]

3.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50

名学生,得到如下2X2列联表:

性别理科文科

男1310

女720

已知P(K223.841户0.05,2(蜉25.024户0.025.

50X(13X20—10X7)2

根据表中数据,得到K2的观测值k=24.844.则认为

23X27X20X30

选修文科与性别有关系出错的可能性约为

5%[心的观测值人心4.844,这表明小概率事件发生.根据独立性检验,应

该断定”是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为

5%.]

4.某同学家里开了一个小卖部,为了研究气温对某种冷饮销售量的影响,

他收集了一段时间内这种冷饮每天的销售量)(杯)与当天最高气温x(℃)的有关数

据,通过描绘散点图,发现y和x呈线性相关关系,并求得其回归方程(=2%+

60.如果气象预报某天的最高气温为34C,则可以预测该天这种饮料的销售量为

___________杯.

128[由题意x=34时,该小卖部大约能卖出冷饮的杯数£=2x34+60=128

杯.]

[细研考点•突破题型]重难解惑直击高考

□考点一相关关系的判断4题组通关

金通性通法判定两个变量正、负相关的方法

(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从

左上角到右下角,两个变量负相关.

(2)相关系数:r>0时,正相关;rVO时,负相关.

(3)线性回归直线方程中:金>0时,正相关;源0时,负相关.

1.观察下列各图形,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论