2023年高考数学一轮复习(学生版):第十五单元统计初步及其综合应用_第1页
2023年高考数学一轮复习(学生版):第十五单元统计初步及其综合应用_第2页
2023年高考数学一轮复习(学生版):第十五单元统计初步及其综合应用_第3页
2023年高考数学一轮复习(学生版):第十五单元统计初步及其综合应用_第4页
2023年高考数学一轮复习(学生版):第十五单元统计初步及其综合应用_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计初步及其综合应用

CBIS、

拶舔回归国

看高考

习课

§15.1随机抽样

(对应答案分册第57页)

国基础知识>夯实基础巩固提升

«《知识清单》>

1.简单随机抽样

(1)定义:一般地,设一个总体含有加个个体,从中"个个体作为样本(〃WA),

且每次抽取时各个个体被抽到的机会都,就称这样的抽样方法为简单随机抽样.

(2)常用方法:和

2.系统抽样

(1)步骤:①^将总体的4个个体编号;

②根据样本容量〃,当“是整数时,取分段间隔k

nn士

③在第1段用确定第一个个体编号/(/W冷;

也按照一定的规则抽取样本.

(2)适用范围:适用于总体中的个体数较多时.

3.分层抽样

(1)定义:在抽样时,将总体分成的层,然后按照一定的比例,从各层独立地抽取一定数

量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫作分层抽样.

(2)适用范围:适用于总体由的几个部分组成时.

8拓展知识

⑴随机数法编号要求:应保证各赞的

位数相同,而抽签法则无限制.

⑵系统抽样是等距抽样,入样个体的编号相

差?的整数倍.

(3'层抽样是按比例抽样,每一层入样的个

体数为该层的个体数乘以抽样比.

⑷三种抽样方法的比较

类共同各自相互用

别点特点联系范

从总

简总体

单是体中

随点

中的

机2逐个

抽n个数

样抽抽较

取少

分在

成起

几始

部部

分分总

抽体

个‘、

按样中

系体

事时的

统被

先个

抽抽

确采数

样到

定用比

的简较

规单多

则随

概1

率?抽

);样

相部

?分

等抽

分将在总

<«夯实基础》>

【概念辨析】

判断下面结论是否正确.(对的打“J”,错的打“X”)

(1)在抽签法中,先抽的人抽中的可能性大.()

(2)系统抽样在起始部分抽样时采用简单随机抽样.()

(3)在分层抽样的过程中,哪一层的样本越多,该层中个体抽取到的可能性越大.()

⑷要从1002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对

被剔除者不公平.()

【对接教材】

在一次游戏中,获奖者可以得到5件不同的奖品,这些奖品要从由1编号的50种不同奖品

中随机抽取确定,用系统抽样的方法为某位获奖者确定5件奖品的编号可以为().

A.7,17,27,37,47

B.1,3,5,7,9

C.11,22,33,44,50

D.12,15,19,23,28

一个公司共有N名员工,下设一些部门,要采用按比例分层抽样的方法从全体员工中抽取样本

容量为〃的样本,已知某部门有勿名员工,那么从该部门抽取的员工人数是

【易错自纠】

山东荷泽某牡丹种植基地,培育48《三个品种的红牡丹分别有1200株、1000株、800株,现

用分层抽样的方法,从三个品种中抽取150株参加节日展览,则应从C品种中抽取()株.

A.60B.50C.40D.30

某校有高中生1500人,现采用系统抽样法抽取50人做问卷调查,将高一、高

二、高三学生(高一、高二、高三分别有学生495人、490人、515人)按1,2,3,…,1500编号,若

第一组用简单随机抽样的方法抽取的号码为23,则所抽样本中高二学生的人数为().

A.15B.16C.17D.18

......................图考点考向,精研考向锤炼技能

盲点戏简单随机抽样【题组过关】

2021年5月31日世界无烟日,新华小区随机调查了300个成年人,结

果其中有45个成年人吸烟.对于这个关于数据收集与处理的问题,下列说法正确的是().

A.调查的方式是普查

B.样本是45个吸烟的成年人

C.本小区只有255个成年人不吸烟

D.本小区约有1596的成年人吸烟

某工厂为了对40个零件进行抽样调查,将其编号为00,01,-,38,39.现要

从中选出5个,利用下面的随机数表,从第1行第3列开始,由左至右依次读取,则选出来的第5个

零件编号是().

03474373863696473661469863716233

26168045601114109577742467624281

14572042533237322707360751245179

A.36B.16C.11D.14

从一群玩游戏的小孩子中随机抽取20人,一个小孩分一个苹果,让他们

返回继续游戏,过了一会儿,再从中抽取30人,发现其中有5个小孩曾分过苹果,估计参加游戏的

小孩人数为().

A.80B.100

C.120D.无法计算

⑴简单随机抽样的特点:。为由取的个体数较少;②是逐个抽取;③是不放回抽取;④是等

可能抽取.只有四个特点都满足的抽样才是简单随机抽样.

⑵抽签法与随机数表法的适用情况抽签法适用于总体中个体数较少的情况,随机数表法

适用于总体中个体数较多的情况.②一个抽样试验能否用抽签法,关键看两点:一看抽签是否方便;

二看号签是否易搅匀.

系统抽样【典例迁移】

Ofl干全堂某学校为了解1000名新生的身体素质,将这些学生编号为

1,2,…,1000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽

到,则下面4名学生中被抽到的是().

A.8号学生B.200号学生

C.616号学生D.815号学生

【变式设问】若本例条件不变,则被抽到的学生的最小编号为,最大编号

为.

♦一系统抽样的注意点:(1)系统抽样适用的条件是总体容量较大,样本容量也较大.⑵若不

改变抽样规则,则所抽取的号码构成一个等差数列,其首项为第一组所抽取的号码,公差为样本间

隔.⑶抽样规则改变,应注意每组抽取一个个体这一特性不变.⑷如果总体容量》不能被样本容

量〃整除,可随机地从总体中剔除余数,然后再按系统抽样的方法抽样,其中起始编号的确定应用

简单随机抽样的方法.

【追踪训练1](1)要从96个接种了新冠疫苗的人中抽取16人检查

体内的抗体情况,将这96人随机编为1到96号,再用系统抽样法抽出16个号.把抽出的号从小

到大排列,已知第1,3,13个号成等比数列,则抽出的最大号为().

A.92B.93C.95D.96

(2)现从编号为1,2,…,96的观众中,采用系统抽样的方法抽取八位幸

运观众,其中有两个编号为21与93,则所抽取的8个编号的中位数为().

A.45B.48C.51D.57

每点⑥分层抽样【考向变换】

考向1求总体容量或样本容量

00(1):函研:某高中有三个年级,其中高一学生900人,高二学生860人,现

采用分层抽样的方法调查学生的视力情况,在抽取的样本中有高二学生43人、高三学生39人,

则该高中的学生总人数应为().

A.2600B.2580

C.2540D.2500

(2)某单位职工分老、中、青三个层次,其中青年职工350人,中

年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样

本,若样本中的青年职工为7人,则样本容量为().

A.35B.25C.20D.15

样本容昌名■屏样本黝星

上分层抽样的计算应根据抽样比构造方程求解,其中“抽样比一-".

总体容量各层个体数量

【追踪训练2】(1)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,

对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为A;其中甲社区有

驾驶员96人,若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社

区驾驶员的总人数,〃为().

A.101B.808C.1212D.2012

(2)某工厂生产的4旦。三种不同型号的产品的数量之比为2:3:5,

为研究这三种产品的质量,现用分层抽样的方法从该工厂生产的46,。三种产品中抽取样本容量

为〃的样本,若样本中4型产品有10件,则〃的值为().

A.15B.25C.50D.60

考向2求每层中的样本数量

硼❸疫苗是全球最终战胜新冠肺炎疫情的关键,某生物技术公

司研制出一种新冠疫苗,为测试该疫苗的有效性(若疫苗有效的概率小于90%,则认为测试没有通

过),公司选定2000个样本分成三组,测试结果如下表:

,4组5组C组

疫苗有效673660y

疫苗无效7790z

(1)现用分层抽样的方法在全部测试结果中抽取360个,问应在。组中抽取多少个?

(2)已知y2465,z>25,求该疫苗不能通过测试的概率.

分层抽样问题类型及解题思路:(1)求某层应抽个体数量:按该层所占总体的比例计

算.⑵分层抽样时,每层抽取的个体可以不一样多,但必须满足抽取n,=n。=1,2,…㈤个个体(其

中,是层数,〃是抽取的样本容量/是第/层中个体的个数N是总体容量).

【追踪训练3】某学校高一年级有1802人,高二年级有1600人,高三年级有1499人,先采用

分层抽样的方法从中抽取98名学生参加全国中学生禁毒知识竞赛,则在高一、高二、高三三个

年级中抽取的学生人数分别为().

A.35,33,30B.36,32,30

C.36,33,29I).35,32,31

£3方法技巧>方法探究分类突破

园按旗^分层抽样的应用

抽样方法在古代数学也经常应用,主要是简单随机抽样与分层抽样.

似in在《九章算术》第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五

十,丙持钱一百八十,凡三人俱出关,关税百钱.欲以钱多少衰出之,问各几何?”其译文为:今有甲

持560钱,乙持350钱,丙持180钱,甲、乙、丙三人一起出关,关税共100钱,要按照各人带钱多

少的比例进行交税,问三人各应付多少税?则下列说法错误的是().

A.甲应付51葛钱

B.乙应付32益钱

C.丙应付16需钱

D.三者中甲付的钱最多,丙付的钱最少

。方法总结

解决以中国古代文化为背景的问题,要

仔细阅读题目,明确问题的含义,从中抽象出

数学问题,用所学知识解决.

【突破训练1】我国古代数学算经十书之一的《九章算术》有一衰分问题:今有北乡八千一

百人,西乡九千人,南乡五千四百人,凡三乡,发役五百,意思是用分层抽样的方法从这三乡中共抽

出500人服役,则西乡比南乡多抽出的人数为().

A.20B.60

C.80D.200

毒突破多抽样比不是整数的解题方法

分析已知条件判断抽样方法,然后根据抽样方法的特点求解.

倒国某化工厂有职工501人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及

50岁以上的有96人,为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工

作为样本,职工年龄与这项指标有关,应该怎样抽取?

I。方法总结

⑴在分层抽样的过程中为了保证每个

个体被抽到的可能性是相同的,这就要求各

层所抽取的个体数与该层所包含的个体数

之比等于样本容量与总体的个体数之比,即

n,:N,=n:A:⑵分层后,可采用简单随机抽

样抽取出各层中的个体,一定要注意按比例

抽取.当抽样比不是整数时,可在该层随机

剔除部分个体,在系统抽样中,也是如此.

【突破训练2】采用系统抽样方法从961人中抽取32人做问卷调查,为此将他们随机编号

为1,2,…,960,分组后第一组抽到的号码为20.抽到的32人中,编号落入区间[400,800]的人数为

().

A.11B.12C.13D.14

请完成课后作亚

链接《精练案》分册P107

§15.2用样本估计总体

(对应答案分册第58^9页)

圜基础知识曲实基础巩固提升

(«知识清单一

1.作频率分布直方图的步骤

日成极差(即一组数据中与的差);

②决定与;

③将数据;

殴;

2.频率分布折线图和总体密度曲线

(1)频率分布折线图:连接频率分布直方图中各小长方形上端的,就得到频率分布折线图.

(2)总体密度曲线:随着的增加,作图时所分的组数增加,减小,相应的频率折线图

就会越来越接近于一条光滑曲线,即总体密度曲线.

3.茎叶图

(1)茎叶图的概念:统计中还有一种被用来表示数据的图叫作茎叶图,茎是指中间的一列数,叶

就是从茎的旁边生长出来的数.

(2)茎叶图的优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,

能够展示数据的分布情况.

4.样本的数字特征

(1)众数、中位数、平均数

数字频率分布

样本数据优点与缺点

特征直方图

取最高的

出现次数

小长方形通常用于描述变量的值出现次数最多的数,但显然它对其他数据信息的忽视

众数的数

底边使得无法客观地反映总体特征

的横坐标

将数据按把频率分

大小依次布直方图

排列,处在划分左右是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况

中位数

最位两个面积下是优点,但它对极端值的不敏感有时也会成为缺点

置的一个的分

数据(或最界线与X

中间两个轴交点的

数据的平横坐标

均数)

(续表)

数字频率分布

样本数据优点与缺点

特征直方图

每个小矩

形的面积

样本数据

乘以小矩平均数和每一个数据有关,可以反映样本数据全体的信息,但平均数受数据中

平均数的算术平

形底边中极端值的影响较大,使平均数在估计总体时可靠性降低

均数

点的横坐

标:和

(2)方差和标准差

方差:52中(小F)2%尼―)/・・尤的为2],标准差:5二

J[(X1-X)2+(打改/+…+(Xn-X)2].

(3)平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大

小.标准差、方差越大,数据的离散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越

稳定.

b拓展知识

(1)频率分布直方图的特点

礴率分布直方图中相邻两横坐标之差表

示组距,纵坐标表示频左率,频率理距X频—率.

组距组距

②在频率分布直方图中,各小长方形的面积

总和等于1,因为在频率分布直方图中组距

是一个固定值,所以各小长方形高的比也就

是频率比.

酶率分布表和频率分布直方图是一组数

据频率分布的两种形式,前者准确,后者直

观.

⑵平均数、方差的公式推广

循数据鸟即,…出的平均数为X,则

mx\-f-a,mx2+a,mxR+a,…,/%的平均数为

鳄数据鸟&…/的方差为4则数据

X\+a,Xz+a,…I心切的方差也为S)数据

axi.axz,…,ax,,的方差为a2sz.

一夯实基础)

【概念辨析】

判断下面结论是否正确.(对的打“V”,错的打“X”)

(1)一组数据的方差越大,说明这组数据越集中.()

(2)从频率分布直方图中得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就

被抹掉了.()

(3)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越高.()

(4)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.()

【对接教材】

甲、乙两名同学在高三的6次测试的成绩统计如图所示,甲、乙两组数据的平均数分别为

二,",标准差分别为。甲,。乙,则().

中乙

01~23456”次

A.x甲3/乙

B.x<x0甲乙

甲乙

c.XA。甲乙

甲乙

D.x,。甲,“乙

甲乙

如图所示的是一次数学考试成绩的样本频率分布直方图(样本容量〃=200),若成绩在60分到

80分之间的学生称为“临界生”,则样本中“临界生”的人数约为

【易错自纠】

若数据汨,用,吊,…,X的平均数x巧,方差s'N,则数据3X产1,3%+1,3&<1=・,3%+1的平均数和方差

分别为().

A.5,2B.16,2C.16,18D.16,9

为了普及环保知识,增强环保意识,某大学随机抽取了30名学生参加环保知识测试相分(十分

制)如图所示,假设得分的中位数为他众数为平均数为工则双瓜的大小关系为.(用“C

连接)

考点考向,精研考向锤炼技能

逗点蚕茎叶图【题组过关】

某篮球队甲、乙两名运动员练习罚球,每人练习10组,每组罚球40个,

命中个数的茎叶图如图所示,则下面结论中错误的是().

甲乙

809

32113489

76542020113

73

A.甲的极差是29

B.甲的中位数是24

C.甲罚球命中率比乙高

D.乙的众数是21

♦四川乐山百三£某企业开展职工技能比赛,并从参赛职工中选1人参加该行业全国

技能大赛.经过6轮选拔,甲、乙两人成绩突出彳导分情况如茎叶图所示.

甲II乙

98278

658688

2913

若甲、乙两人的平均成绩分别是I甲区乙,则下列说法正确的是().

AG田义力乙比甲成绩稳定,应该选乙参加比赛

甲乙

BGE.”?,甲比乙成绩稳定,应该选甲参加比赛

甲乙

C.x&才甲比乙成绩稳定,应该选甲参加比赛

甲ffl乙

D.&力乙比甲成绩稳定,应该选乙参加比赛

甲乙

茎叶图中的三个关注点:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数

一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏;(3)给定两组数据的茎叶图,估计数字特

征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.

CS©样本数字特征的计算及应用【典例迁移】

某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某

项指标有无提高,用一台旧设备和一台新设备各生产了10件产品彳导到各件产品该项指标数据如

下:

旧设备9.810.310.010.29.9

新设备10.110.410.110.010.1

旧设备9.810.010.110.29.7

新设备10.310.610.510.410.5

旧设备和新设备生产产品的该项指标的样本平均数分别记为[和样本方差分别记为式和受.

⑴求x,y,sf,s之

(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果,校》2凤1,则

认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).

众数、中位数、平均数、方差的意义及常用结论:(1)平均数与方差都是重要的数字

特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众

数描述其集中趋势,方差和标准差描述波动大小.

⑵方差的简化计算公式:.号[(后^i嗨)-R],或写成旧(好转i啕全,即方差等于

原数据平方的平均数减去平均数的平方.

【追踪训练1】为了普及新冠肺炎知识,增强疫情防控意识,某学校从

高一和高二两个年级各抽取5位同学参加新冠肺炎知识测试彳导分(十分制)情况如下表所示,则下

列描述正确的是()

高一年级组高二年级组

得分45678得分569

频数11111频数311

A.高一年级组数据的平均数为6分,高二年级组数据的平均数为5分

B.两组数据的中位数都是6分

C.高一年级组数据的极差小于高二年级组数据的极差

D.高一年级组数据的方差小于高二年级组数据的方差

CIS©频率分布直方图【考向变换】

考向1求样本的频率、频数

初口某高三年级随机抽取部分考生的第一次模拟考试的数学成绩,分成6组制成如下频率

分布直方图,若图中数据构成公差为0.004的等差数列,则参加考试的2000名同学中数学

成绩不低于130分的学生有()人.

A.40B.160C.240D.400

频率、频数、样本容量的计算方法:⑴器'组距淑率;⑵急频率,黑咻本容

量,样本容量X频率濒数.

【追踪训练2】有一个容量为100的样本,其频率分布直方图如图

所示,已知样本数据落在区间[10,12)内的频数比样本数据落在区间[8,10)内的频数少12,则实数m

的值等于().

A.0.10B.0.11C.O.12D.0.13

考向2求样本的数字特征

硼❸为庆祝国庆节,某中学团委组织了“歌颂祖国,爱我中华”知识

竞赛,从参加考试的学生中抽出60名,将其成绩(成绩均为整数)分成[40,50),[50,60),…,[90,100)六

组,并画出如图所示的部分频率分布直方图,观察图形,回答下列问题:

(1)求第四组的频率,并补全这个频率分布直方图;

(2)请根据频率分布直方图,估计样本的众数、中位数和平均数.(每组数据以区间的中点值为

代表)

频率分布直方图中的众数、中位数与平均数:(1)最高的小长方形底边中点的横坐标

即是众数;(2)平分频率分布直方图的面积且垂直于横轴的直线与横轴交点的横坐标是中位数;(3)

平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形

底边中点的横坐标之和.

【追踪训练3】为抗击新型冠状病毒性肺炎疫情,某口罩生产企业职

工在做好自身安全防护的同时,加班加点生产口罩发往疫区.该企业为保证口罩的质量,从某种型

号的口罩中随机抽取100个,测量这些口罩的某项质量指标值,其频率分布直方图如图所示,其中

该项质量指标值在区间[115,125]内的口罩恰有8个.

(1)求图中a,6的值;

(2)用样本估计总体的思想,估计这种型号的口罩该项质量指标值的平均数及方差(同一组中

的数据用该组区间的中点值作代表);

(3)根据质量指标标准,该项质量指标值不低于85,则为合格产品,试估计该企业生产这种型号

口罩的质量合格率为多少.

考向3与概率结合的问题

倒您(2流行病学资料显示,50岁以上男性静息

心率过高将会增加患心血管疾病的风险,相反,静息心率相对稳定的50到60岁的男性,在未来10

年内患心血管疾病的几率会降低44%.研究员们还表示,其中静息心率超过75bpm(次份)的人比

静息心率低于55bpm的人罹患心血管疾病的风险高出一倍.某单位对其所有的离、退休老人进

行了静息心率监测,其中一次静息心率的茎叶图和频率分布直方图如下,其中,频率分布直方图的

分组区间分别为[50,60)、[60,70)、[70,80)、[80,90)、[90,100],由于扫描失误,导致部分数据丢失.

据此解答如下问题:

静息心率

0.0375\j

0.0250F…r-X.J

ooi

^°LH50±607m0809z01u00,

好息心率/bmp

图2

(1)求此单位离、退休人员总数和静息心率在[80,100]之间的频率;

(2)现从静息心率在[80,100]之间的数据中任取3份分析离、退休人员身体情况,设抽取的静

息心率在[90,100]的份数为X求才的分布列和数学期望.

解决统计与概率问题的几点注意:(1)用样本频率可以估计整体的概率;(2)用样本频率

分布直方图的面积估计频率;(3)用样本频率分布直方图来估计整体平均值.

【追踪训练4】为了解学生的学习效率,某在线教育平台统计了部分高三备考学生每天完成

数学作业所需的平均时间,绘制了如图所示的频率分布直方图.

(1)如果学生在完成在线课程后每天平均自主学习时间(完成各科作业及其他自主学习)为5

小时,估计高三备考学生每天完成数学作业的平均时间占自主学习时间的比例(同一组中的数据

用该组区间的中点值为代表)(结果精确到0.01);

(2)为了进一步了解学生的学习效率,平台随机选择100位高三备考学生进行一次测试,记选

择的学生中每天完成数学作业的时间不超过45分钟的人数为用以统计的频率作为概率,求X的

数学期望.

E3方法技巧•>方法探究分类突破

扇形图、折线图的应用

以扇形图、折线图为背景的数据分析处理的简单应用,是高考的热点,解题关键是读懂题,将

原问题转化为统计问题处理.

初02020年初,突如其来的疫情改变了人们的消费方式,在目前疫情

防控常态化背景下,某大型超市为了解人们以后消费方式的变化情况,更好地提高服务质量,收集

并整理了本超市2020年1月份到8月份的人们线上收入和线下收入的数据,并绘制如下的折线

图.根据折线图,下列结论错误的是(

A.该超市这8个月中,线上收入的平均值高于线下收入的平均值

B.该超市这8个月中,线上收入与线下收入相差最小的月份是7月

C.该超市这8个月中,每月总收入与时间呈现负相关

D.从这8个月的线上收入与线下收入对比来看,在疫情逐步得到有效控制后,人们比较愿意

线下消费

。方法总结

⑴通过扇形统计图可以很清楚地表示

出各部分数量同总数之间的关系.(2)折线

图可以显示随时间(根据常用比例放置)而

变化的连续数据,因此非常适用于显示在相

等时间间隔下数据的趋势.

【突破训练1](1)AQI是表示空气质量的指数,AQI指数值越小,表明空气

质量越好,当AQI指数值不大于100时称空气质量为“优良”.如图所示的是某地7月1日到12

日AQI指数值的统计数据,图中点/表示7月1日的AQI指数值为201,则下列叙述不正确的是

AQI指数值

250

•■■•■■■■■■4

12345日

101112日

6789

A.这12天中有6天空气质量达到“优良”

B.这12天的AQI指数值的中位数是90

C.这12天中空气质量最好的是7月9日

D.从4日到9日,空气质量越来越好

(2)已知某地区人口总数为125万,具体分布如图所示,近期,卫计委拟针对

18到60岁的人群开展新冠疫苗接种工作,抽样发现,他们中有8096的人符合接种的健康要求.截

至3月底,已有30%符合健康要求的人接种了第一剂,据要求,这部分人需要在4月份接种第二剂,

剩余70%符合健康要求的人需在4月份接种第一剂,5月份接种第二剂.则该地区4月份需要

万剂疫苗.

18岁以下口

18~6。岁口

60岁以上・

行医突破⑥绘制频率分布直方图的方法

绘制频率分布直方图时,组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,使

数据的分布规律能较清楚地呈现出来,组数太多或太少都会影响了解数据的分布情况,若样本容

量不超过100,按照数据的多少常分为512组,一般样本容量越大,所分组数越多.

硼国某省为了了解和掌握2021年高考考生的实际答卷情况,随机地取出了100名考生的数

学成绩,数据如下:(单位:分)

135981021109912111096100103

1259711711311092102109104112

1051248713197102123104104128

10912311110310592114108104102

12912697100115111106117104109

1118911012180120121104108118

12999909912112310711191100

991011169710210810195107101

1021081179911810611997126108

12311998121101113102103104108

(1)列出频率分布表;

(2)画出频率分布直方图和折线图;

(3)估计该省考生数学成绩在[100,120)分之间的比例.

。方法总结

绘制频率分布直方图的注意事项:(1)计

算极差,需要找出这组数的最大值和最小值,

当数据很多时,可选一个数当参照.(2)将一

批数据分组,目的是要描述数据分布规律,要

根据数据多少来确定分组数目,一般来说,数

据越多,分组越多.⑶将数据分组,决定分点

时,一般使分点比数据多一位小数,并且把第

一组的起点稍微减小一点.⑷列频率分布

表时,可通过逐一判断各个数据落在哪个小

组内,以“正”字确定各个小组内数据的个

数.⑸画频率分布直方图时,纵坐标表示频

率与组距的比值,一定不能标成频率.

【突破训练2】某校从高三参加数学竞赛的学生中抽取50名学生的成绩,成绩的分组及各

组的频数如下(单位:分):

[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80190),12;[90,100],8.

(1)列出样本的频率分布表;

(2)画出频率分布直方图;

(3)估计成绩在[60,90)分的学生比例;

(4)估计成绩在80分以下的学生比例.

请完成涕后作业

链接《精练案》分册P108

§15.3相关关系与统计案例

(对应答案分册第59方0页)

......................因基础知识>夯实基础巩固提升

<«知识清单》》

1.相关关系与回归方程

(1)相关关系的分类

①正相关:从散点图上看,点散布在从到的区域内,如图1;

②负相关:从散点图上看,点散布在从到的区域内,如图2.

oxox

图1图2

(2)线性相关关系:从散点图上看,如果这些点从整体上看大致分布在附近,那么称这

两个变量之间具有线性相关关系,这条直线叫作

(3)回归方程

①最小二乘法:使得样本数据的点到回归直线的最小的方法叫作最小二乘法.

②回归方程:两个具有线性相关关系的变量的一组数据(见必),(冬,闷,…,(心谒,其回归方程为

AAAAAAAA

(Xi-x)(yry)ZXj^-nxy__

y=bx+a,贝ijb*----------------,a^y-bx.其中,b是回归直线的,a是在y轴上的

却£却斓

,x』0必,y上0%,Xy称为样本点的中心.

ni=ini=i

回归直线y=bx+a必过样本点的中心

丘,»,这个结论既是检验所求回归直线方程

是否准确的依据,也是求参数的一个依据.

(4)样本相关系数

n__

£i(阳-x)(yry)

T,,用它来衡量两个变量间的线性相关关系.

n-n-

脩(3)27部“7

①当时,表明两个变量;

②当r<0时,表明两个变量;

③r的绝对值越接近I,表明两个变量的线性相关性力的绝对值接近于0,表明两个变量

之间几乎不存在线性相关关系.通常当/r/A).75时,认为两个变量有很强的线性相关关系.

2.残差分析

⑴残差:对于样本点(汨,必),(及㈤,…,(%”%),它们的随机误差为6号「勿La,/=1,2,…其估计

AAAAA

值为已广匕-丫[=匕-1)%-2,,=1,2」・・,〃©称为相应于点(才”)的残差.

(2)残差平方和为0U-yJ2.

i=i

nA2

2

团(yryf)

⑶相关指数f

团仇-y)2

i=l

3.独立性检验

(1)分类变量:变量的不同“值”表示个体所属的,像这类变量称为分类变量.

(2)列联表:列出两

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论