考点28-统计(核心考点讲与练新高考专用)(解析版)_第1页
考点28-统计(核心考点讲与练新高考专用)(解析版)_第2页
考点28-统计(核心考点讲与练新高考专用)(解析版)_第3页
考点28-统计(核心考点讲与练新高考专用)(解析版)_第4页
考点28-统计(核心考点讲与练新高考专用)(解析版)_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

考点28统计(核心考点讲与练)

,考点考若')

一、抽样与统计图表

1.获取数据的基本途径

获取数据的基本途径包括:统计报表和年鉴、社会调查、试验设计、普查和抽样、互联网等.

(1)统计报表是指各级企事业、行政单位按规定的表格形式、内容、时间要求报送程序,自上而下统一布置,

提供统计资料的一种统计调查方式.

(2)年鉴是以全面、系统、准确地记述上年度事物运动、发展状况为主要内容的资料性工具书.汇辑一年内的

重要时事、文献和统计资料,按年度连续出版的工具书.

2.总体、样本、样本容量

要考察的对象的全体叫做总便,每一个考察对象叫做个体,从总体中被抽取的考察对象的集体叫做总体的

一个样本,样本中个体的数目叫做样本容量.

3.简单随机抽样

(1)定义:从元素个数为N的总体中不放回地抽取容量为〃的样本,如果每一次抽取时总体中的各个个体有

粗包的可能性被抽到,这种抽样方法叫做简单随机抽样.

(2)最常用的简单随机抽样的方法:抽签法和随机数法.

(3)应用范围:总体中的个体数较少.

4.分层抽样

(1)定义:在抽样时,将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各

层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.

(2)应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.

5.频率分布直方图

(1)频率分布表的画法:

第一步:求极差,决定组数和组距,组距=箍极差;

第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;

第三步:登记频数,计算频率,列出频率分布表.

(2)频率分布直方图:反映样本频率分布的直方图(如图)

横轴表示样本数据,纵轴表示就,每个小矩形的面积表示样本落在该组内的频茎.

6.频率分布折线图和总体密度曲线

(1)频率分布折线图:连接频率分布直方医中各小长方形上端的中点,就得到频率分布折线图.

(2)总体密度曲线:随着样本容量的增加,作图时所分的组教增加,组距减小,相应的频率分布折线图就会

越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.

7.样本的数字特征

数字特征定义

众数在一组数据中,出现次数量多的数据叫做这组数据的众数

将一组数据按大小依次排列,把处在最空回位置的一个数据(或最中间两个数据

中位数

的平均数)叫做这组数据的中位数

平均数样本数据的算术平均数,即4理;

1

方差52=-f(Xi-X)2+(X2-X)2+-+(Xn-X)2],其中5为标准差

8.百分位数

如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分

位的百分位数.可表示为:一组〃个观测值按数值大小排列.如,处于0%位置的值称第P百分位数.

二、统计案例

1.变量间的相关关系

(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是

一种丰确定性关系.

(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相差,点散布在

左上角到右下角的区域内,两个变量的相关关系为鱼胆去.

2.回归分析

对具有相关关系的两个变量进行统计分析的方法叫回归分析.其基本步骤是:(i)画散点图:(ii)求回归直线

方程;(出)用回归直线方程作预报.

(1)回归直线:如果散点图中点的分布从整体上看大致在二1直线附近,就称这两个变量之间具有线性相关

关系,这条直线叫做回归直线.

(2)回归直线方程的求法一一最小二乘法.

设具有线性相关关系的两个变量x,y的一组观察值为(刘,y)(i=l,2,…,〃),则回归直线方程y=ar+6的

系数为:

其中亍=上小为万=工汽y,(五歹)3生母*匕M,、

n〃,-1称为样本点的中心.

(3)相关系数

①计算相关系数,•,7•有以下性质:Id<h并且bi越接近1,线性相关程度越强;H越接近0,线性相关程度

越弱;②历>为。5,表明有95%的把握认为变量x与y之间具有线性相关关系,回归直线方程有意义;否则寻

找回归直线方程毫无意义.

3.独立性检验

(1)2X2列联表

BB总计

Anwn\i川+

Ani\"22〃2+

总计n+\n+2n

其中,!1+=〃1|+川2,〃2+=〃2l+〃22,〃+1=叨1+〃21,〃+2=〃12+"22,〃=〃11+〃21+川2+〃22.

Q)/2统计量

〃(四心一丝如2

町+〃2+〃+J/Z+2

(3)两个临界值:3.841与6.635

当作>3.841时,有95%的把握说事件A与8有关;

当/>6.635时,有99%的把握说事件A与B有关;

当/W3.841时,认为事件A与8是无关的.

1.解决分层抽样的常用公式

先确定抽样比,然后把各层个体数乘以抽样比,即得各层要抽取的个体数.

(I)抽样比=一=一;

⑵层1的容量:层2的容量:层3的容量=样本中层1的容量:样本中层2的容量:样本中层3的容量.

2.统计图表人类辨识影像的能力要优於辨识文字与数字的能力,因此我们采用图形的方式来展现数据时,常常

不我们直接观察数据要来的快.

3.平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方

差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.

4.独立性检验的一般步骤

①根据样本数据制成2x2列联表;

②根据公式烂=计算X的值;

abcdacbd

③查表比较心与临界值的大小关系,作出统计判断.

1.(2。22・福建莆田•三模)已知某校有教取工560人,其中女职工240人,现按性别用分层抽样的方法从该

校教职工中抽取28人,则抽取的男职工人数与抽取的女职工人数之差是()

A.2B.4C.6D.8

【答案】B

【分析】根据分层抽样的抽取比例计算方法,分别求出抽取人数中的男女职工人数即可求解.

【详解】抽取的女职工人数为:会240x28=12人

560

抽取的男职工人数为:28-12=16人

则抽取的男职工人数与抽取的女职工人数之差为:16-12=4人

故选:B.

2.(2022•安徽・芜湖一中三模(文))某学校对高三年级800名学生进行系统抽样编号分别为001,002,

800,若样本相邻的两个编号为028,068,则样本中编号最大的为()

A.778B.780C.782D.788

【答案】D

【分析】根据样本中两个相邻编号求出组距和分组数,再根据系统抽样方法即可求出样本编号最大的一个.

【详解】•・•样本相邻的两个编号为028和068,故组距为68—28=40,

由80(—40=20知样本容量为20,

系统抽样时分为20组:001-040,041-080,760-800,

•・•从第I组抽出的数据为028・・•・从第20组抽出的数据为760+28=788.

故选:D.

3.(2021北京市通州区高三上期中)某单位有男职工56人,女职工42人,按性别分层,用分层随机抽样的

方法从全体职工中抽出一个样本,如果样本按比例分配,男职工抽取的人数为16人,则女职工抽取的人数

为()

A.12B.20C.24D.28

【答案】A

【分析】根据题意,结合分层抽样的计算方法,即可求解.

【详解】根据题意,设抽取的样本人数为〃,

因男职工抽取的人数为一迎一=16,所以〃=28,因此女职工抽取的人数为28—16=12(人).

56+42

故选:A.

4.(多选题)(2022•福建南平•三模)支气管炎患者会咳嗽失眠,给患者日常生活带来严重的影响.某医院老

年患者治愈率为20%,中年患者治愈率为30%,青年患者治愈率为40%.该医院共有600名老年患者,500

名中年患者,400名青年患者,则()

A.若从该医院所有患者中抽取容量为30的样本,老年患者应抽取12人

B.该医院青年患者所占的频率为1

C.该医院的平均治愈率为28.7%

D.该医院的平均治愈率为31.3%

【答案】ABC

【分析】由分层抽样即可判断A选项;直接计算频率即可判断B选项;直接计算平均治愈率即可判断C、

D选项.

600

【详解】对于A,由分层抽样可得,老年患者应抽取30x=12人,正确:

600+500+400

4004

对于B,青年患者所占的频率为—,正确:

600+500+40015

600x20%+500x30%+400x40%

对于C,平均治愈率为=28.7%,正确;

600+500+400

对于D,由C知错误.

故选:ABC.

统计图表

1.(2021广东省广雅中学高三上10月月考)小张一星期的总开支分布如图①所示,一星期的食品开支如图

②所示,则以下说法正确的是()

阮)②

D.肉类开支占总开支的;

C.娱乐开支比通信开支多50元

【答案】ABC

【分析】根据图表信息一一分析可得;

【详解】解:由食品开支图,可知食品开支有30+40+1(X)+80+50=300元,所以一星期的总开支

300-30%=1000元,其中储蓄金额为1000x30%=300元,故A正确;

日常开支为1000x20%=200元,故日常开支比食品中的其他开支多150元.故B正确;

娱乐开支比通信开支多1000x(10%_5%)=50元,故C正确;

肉类开支占总开支的100+1000=,,故D错误;

故选:ABC

2.(2021四川省资阳市高三第一次诊断)我国在2020年如期完成了新时代脱贫攻坚目标任务,脱贫攻坚战

取得全面胜利,历史性地解决了绝对贫困问题,并全面建成了小康社会.现就2013—2019年年末全国农村

贫困人口数进行了统计,制成如下散点图:

y/万人2013-2019年年末全国农村贫困人II数

8COO•

6000•

4000•

2(X)0•

0123456781/年份代码

据此散点图,下面4个回归方程类型中最适宜作为年末贫困人数)'和年份代码工的回归方程类型的是()

A.y=a+bxB.y=a+—C.y=a+bexD.y=a+b\nx

x

【答案】A

【分析】结合散点图中点的分布特征即可得出结果.

【详解】由散点图可知所有的点几乎分布在一条直线上,结合选项可知选A,

故选:A.

3.(2021广东省部分学校高三上11月大联考)中国互联网络信息中心(CNWC)发布了第46次《中国互

联网络发展状况统计报告》,报告公布了截至2020年6月的中国互联网状况数据与对比数据,根据下图,下

A.2020年6月我国网民规模接近9.4亿,相比2020年3月新增网民3625万

B.2020年6月我国互联网普及率达到67%,相比2020年3月增长2.5%

C.2018年12月我国互联网普及率不到60%,经过半年后普及率超过60%

D.2018年6月我国网民规模比2017年6月我国网民规模增加的百分比大于7%

【答案】D

【分析】结合图表直接判断和计算即可.

【详解】对A,由图可知,新增网民数为:93984-90359=3625万,正确;

对B,读图可直接判断正确;

对C,读图可直接判断正确;

对D,2018年6月我国网民规模比2017年6月我国网民规模增加的比例为:

80166-75116_5050<-^2_=—«0.067<7%,故D错误.

75116-75116750001500

故选:D

4.(2021山西省长治市第八中学高三上阶段性测评)随着2022年北京冬奥会临近,中国冰雪产业快速发展,

冰雪运动人数快速上升,冰雪运动市场需求得到释放,将引领相关户外用品行业市场增长.下面是2013年

至2020年中国雪场滑雪人次(万人次)与同比增长率(与上一年相比)的统计情况,则下面结论中正确的

是()

30.00%

20.00%

10.00%

0.00%

-10.00%

-20.00%

-30.00%

-40.00%

-50.00%

20132014201520162017201820192020

口中国雪场滑雪人次(万人次)一同比增长率

A.2013年至2020年,中国雪场滑雪人次的同比增长率逐年减少

B.233年至2020年,中国雪场滑雪人次逐年增加

C.233年至2020年,中国雪场滑雪人次的年增加量相近

D.2013年到2020年,中国雪场滑雪人次在2020年首次出现负增长

【答案】D

【分析】根据图中条形统计图和折线图的实际意义分析逐个判定即可.

【详解】对于A,由折线图可知,2013年至2020年,中国雪场滑雪人次的同比增长率先增长再减小,故A

错误;

对于B,由条形统计图知,2013年至2019年,中国雪场滑雪人次逐年增加,但2020年减少了,故B错误;

对于C,由条形图知,2013年至2020年,中国雪场滑雪人次的年增加量不相近,故C错误;

对于D,由条形图和折线图,明显看出2013年到2020年,中国雪场滑雪人次在2020年首次出现负增长,

故D正确.

故选:D

5.(2021河南省重点中学高三上模拟调研)茶叶源于中国,至今中国仍然是茶叶最大生产国,下图为

2019—2020年全球主要茶叶生产国调查数据.

2019—2020年全球主要茶叶生产国产量分布

单位:万吨

350.0

300.0

250.0

200.0

150.0

100.0

50.0

0.0

中国印度肯尼亚土耳其斯里兰卡

□2020B2019

根据该图,下列结论中不正确的是()

A.2019年图中5个国家茶叶产量的中位数为45.9

B.2020年图中5个国家茶叶产量比2019年增幅最大的是中国

C.2020年图中5个国家茶叶总产量超过2019年

D.2020年中国茶叶产量超过其他4个国家之和

【答案】B

【分析】根据统计图表提供的数据判断各选项.

【详解】图中,2019年的数据中间的一个是45.9,A正确;

2020年图中5个国家茶叶产量比2019年增幅最大的是肯尼亚£xl00%,B错;

45.9

2020年图中5个国家茶叶总产量比2019年总产量的差是18.7-13.4+11-2+1=14.4>0,

C正确;

2020年图中125.6+56.9+28+27.8=238.3<298.6,D正确,

故选:B.

瘦叁着样本的数字特征

1.(2021江苏苏州模拟)高铁、扫码支付、共享单车、网购并称中国“新四大发明“,近日对全国100个城市的

共享单车和扫码支付的使用人数进行大数据分析,其中共享单车使用的人数分别为幻,及,4,…,xioo,

它们的平均数为X,方差为其中扫码支付使用的人数分别为3xi+2,3X2-F2,3x3+2,...»3MOO+2,

它们的平均数为亚.,方差为则仃™,力分别为()

A.31+2,3s2+2B.31,3/

C.3x+2,9s2D.3工+2,9J2+2

【答案】C

【解析】由平均数的计算公式,可得数据用,电…,R00的平均数为1=+3+x2+x3+…+箝00),

数据lri+2,3也+2,…,3xioo+2的平均数为:

11_

I。j[(3彳1+2)+(342+2)+…+(3xioo+2)]=—[3(XI+X2+…+xioo)+2x1OO]=3x+2,

1___

数据为,X2,…,MOO的方差为?=X产+⑴一x)2+…+(为00—工产],

数据3xi+2,33+2,…,3xioo+2的方差为:

{[(3x1+2)—(3x+2)]2+](3也+2)—(3工+2)]2+...+[(3xioo+2)—(3x+2)p}

1___

=100伊3-X"93-x尸+…+%为的-x)4=9s故选C.

2.(2D21河南省湘豫名校联盟高三上11月联考)某校为了解学生体能素质,随机抽取了50名学生,进行

体能测试.并将这50名学生成绩整理得如下频率分布直方图.根据此频率分布直方图.下列结论中不正确的是

()

A.这50名学生中成绩在[80,100]内的人数占比为20%

B.这50名学生中成绩在[60,80)内的人数有26人

C.这50名学生成绩的中位数为70

D.这50名学生的平均成绩4=68.2(同一组中的数据用该组区间的中点值做代表)

【答案】C

【分析】利用频率分布直方图求解判断.

【详解】根据此频率分布直方图,成绩在[80,100]内的频率为(0.008+0.012)x10=0.20,所以A正确;

这50名学生中成绩在[60,80)内的人数为(0.032+0.020)x10x50=26,所以B正确;

根据此频率分布直方图,(0.008+0.02)x10=0.28<0.5,(0.008+0.02+0.032)x10=0.6>0.5,

可得这50名学生成绩的中位数w(60,70),所以C错误:

根据频率分布直方图的平均数的计算公式,可得:

x=45x0.08+55x0.2+65x0.32+75x0.2+85x0.12+95x0.08=68.2,所以D正确.

故选:C.

受g会线性回归方程

1.(多选题)(2021山东师范大学附中高三上期中)已知变量X,y之间的经验回归方程为》=7.6-0.4x,

且变量x,y的数据如表所示,则下列说法正确的是()

X681012

y6m32

A.变量工,y之间呈正相关关系B.变量x,y之间呈负相关关系

C.6的值等于5D.该回归直线必过点(9,4)

【答案】BCD

【分析】将样本点中心代入回归直线方程,得出阳的值,再逐一判断即可.

_6+8+10+12__6+皿+3+2\\+m

【详解】x=------------=9,y=-----------

444

因为了=7.6—().4亍,所以=7.6—0.4x9,=5,故C正确;

4

因为-o.4<o,所以变量工,y之间呈负相关关系,故A错误,B正确;

因为(月9)=(9,4),所以该回归直线必过点(9,4),故D正确:

故选:BCD

2.(2021福建省宁德市高二上期中联考)某电子产品的成本价格由两部分组成,一是固定成本,二是可变

成本,为确定该产品的成本,进行5次试验,收集到的数据如表:

产品数X个1020304050

产品总成本(元)6268a8189

由最小二乘法得到回归方程》=0.67%+54.9,则。=,

【答案】75

【分析】根据线性回归方程过样本中心点进行求解即可.

10+20+30+40+5062+68+4+81+89

【详解】x==30y=60+0.2。,

55

因为线性回归方程过样本中心点,

所以60+0.勿=0.67x30+54.9=4=75,

故答案为:75

3.(“超级全能生”2022届高三全国卷地区11月联考)自动驾驶汽车依靠5G、人工智能、视觉计算、雷达、

监控装置和全球定位系统协同合作,让电脑可以在没有任何人类主动的操作下,自动安全地操作机动车辆.

近年来全球汽车行业达成共识,认为自动驾驶代表了未来汽车行业的发展方向.实现自动驾驶是一个渐进过

程,国际通用的自动驾驶标准根据自动驾驶程度逐步提升可以分为5级.L3级自动驾驶也是整个自动驾驶技

术的分水岭.2016—2020年全球L3渗透率(%)统计表及散点图如下.

年份20162017201820192020

渗透率(%)0.20.40.61.01.4

.淮透率以%)

1.6

1.4---------------------------------------------•--------

1.2-------------------------------------------------------

1.0.

0.8-------------------------------------------------------

0.6.

0.4-----------------•------------------------------------

0.2.

0____________________________________________

2015201620172018201920202021年份

(1)利用散点图判断,y=初和(其中’C,d为大于0的常数)哪一个更适合作为渗透率y和

年份I的回归方程模型(只要给出判断即可,不必说明理由);

(2)令x=f—2018,求y关于X的回归方程;

(3)根据(2)中回归模型回答下列问题:

(i)估计2022年全球L3渗透率是多少?

(ii)预计至少要到哪一年,全球£3渗透率能超过10%?

附:回归直线g=«中斜率和截距的最小二乘估计公式为5

a=yhx-

【答案】(1)>初更适合

⑵y=0.3x+0.72

(3)⑴1.92%;(ii)2049

【分析】(1)根据散点图,即可得到丁二。+初更适合作为渗透率y和年份,的回归方程模型;

(2)由x=f-2018,得5组的对应数据,利用公式,求得R々的值,即可得到回归方程;

(3)Ci),=2022,求得y=1.92,即可得到2022年全球£3渗透率;

(ii)令y=0.3x+0.72>10,即可求得到2049年,全球L3渗透率能超过10%.

【小问1详解】解:根据散点图,可知y=〃+4更适合作为渗透率y和年份,的回归方程模型.

【小问2详解】解:由4=/—2018,得5组的对应数据为(-2,0.2),(-1,0.4),(0,0.6),(1,1.0),(2,1.4),

_55

所以;=0,5=0.72,2七"=3,Zx;=l°,

i=\i=l

9y厂记3-5x0x0,72”।--

所以力=--------=-10—5x02-二°3,则a=y—bx=0.72—0.3X0=0.72,

Vx2i-nx

所以y关于X的线性回归方程为y=o.3x+0.72.

【小问3详解】解:(i)令r=2022,可得%=2022-2018—4,此时y=0,3x4+0.72=1.92,

所以估计2022年全球L3渗透率是1.92%.

(ii)令y=0.3x+0.72>10,解得x>30.9*31,r=31+2018=2049,

所以预计至少要到2049年,全球L3渗透率能超过10%.

个亘宝>独立性检验

1.春节期间,”厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光

盘”行动,得到列联表:

分类做不到“光盘”能做到“光盘”

男4510

女3015

由此列联表得到正确结论是()

A.在犯错误概率不超过1%的前提下,认为“该市居民能否做到‘光盘'与性别有关“

B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘'与性别无关”

C.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到,光盘'与性别有关“

D.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到,光盘'与性别无关”

【答案】C

【分析】作出列联表,求得K?,再与临界值表对比判断.

【详解】列联表如下:

分类做不到“光盘”能做到“光盘”总“

男451055

女301545

总计7525100

所以六叽3。­,且〃(心2.706卜。』。,

所以在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘'与性别有关”.

故选:C

2.单位:人

数学成绩

学校合计

不优秀(y=o)优秀(y=i)

甲校(x=o)331043

乙校(x=l)38745

合计711788

对列联表中的数据,依据a=0.1的独立性检验,我们已经知道独立性检验的结论是学校和成绩无关.如果

表中所有数据都扩大为原来的10倍,在相同的检验标准下,再用独立性检验推断学校和数学成绩之间的关

联性,结论还一样吗?请你试着解释其中的原因.

附:临界值表:

a0.10.050.010.0050.001

%2.7063.8416.6357.87910.828

【分析】列出数据扩大10倍的2x2列联表,计算出/的观测值,结合独立性检验的基本思想可出结论.

【详解】数据扩大10倍的2x2列联表为:

数学成绩

学校合计

不优秀(y=o)优秀(y=i)

甲校(x=0)330100430

乙校(x=l)38070450

合11710170880

假设”0:学校与数学成绩无关,

由列联表数据得V2=88°X(33()X70-38()>d()0)

4p8.365>2.706,

430x450x710x170

根据小概率值a=O.l的独立性检验,我们推断假设“o不成立,即认为学校与数学成绩有关,

又因为甲校成绩优秀和不优秀的概率分别为拦=0.2326,黑x0.7674,

430430

70380

乙校成绩优秀和不优秀的概率分别为Ka0.1556,«0.8444,

450450

又因为0.2326>0.1556,所以,从甲校、乙校各抽取一个学生,甲校学生数学成绩优秀的概率比乙校学

生优秀的概率大.

所以,结论不一样,不一样的原因在于样本容量,

当样本容量越大时,用样本估计总体的准确性会越高.

1.(2。21年全国高考甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭

年收入的调查数据整理得到如下频率分布直方图:

八墀

根据此频率分布直方图,下面结论中不正确的是()

A.该地农户家庭年收入低于4.5万元的农户比率估计为6%

B.该地农户家庭年收入不低于1U.5万元的农户比率估计为10%

C.估计该地农户家庭年收入的平均值不超过6.5万元

D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间

【答案】C

【分析】根据直方图的意义直接计算相应范围内的频率,即可判定ABD,以各组的中间值作为代表乘以相应

的频率,然后求和即得到样本的平均数的估计值,也就是总体平均值的估计值,计算后即可判定C.

【详解】因为频率直方图中的组距为1,所以各组的直方图的高度等于频率样本频率直方图中的频率即可

作为息体的相应比率的估计值.

该地农户家庭年收入低于4.5万元的农户的比率估计值为0.02+0.04=0.06=6%,故A正确;

该地农户家庭年收入不低于10.5万元的农户比率估计值为0.04+0.02x3=0.10=10%、故B正确;

该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为

0.10+0.14+0.20x2=0.64=64%>50%.故D正确;

该地农户家庭年收入的平均值的估计值为

3x0.02+4x0.04+5x0.10+6x0.14+7x0.20+8x0.20+9x0.10+10x0.10+11x0.04+12x0.02+13x0.02+14x0.02=7.68(737U)»超过

6.5万元,故C错误.

综上,给出结论中不正确的是C.

故选:C.

【点睛】本题考查利用样本频率直方图估计总体频率和平均值,属基础题,样本的频率可作为总体的频率

的估计值,样本的平均值的估计值是各组的中间值乘以其相应频率然后求和所得值,可以作为总体的平均

值的估计值.注意各组的频率等于集X组距.

组距

2.(2020年全国统一高考(新课标I))某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单

位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(心切)(,=1,2,,20)得到下面

的散点图:

由此散点图,在10。(2至40。(2之间,下面四个回归方程类型中最适宜作为发芽率),和温度x的回归方程类

型的是()

A.y=a+bxB.y=a+bx2

C.y=a+bexD.y=a+b\nx

【答案】D

【分析】根据散点图的分布可选择合适的函数模型.

【详解】由散点图分布可知,散点图分布在一个对数函数的图象附近,

因此,最适合件为发芽率y和温度x的回归方程类型的是y=a+h\nx.

故选:D.

【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.

3.(多选题)(2021年全国新高考I卷)有一组样本数据为,…,乙,在这组数据得到新样本数据y,

力,…,L,其中V=%+c(,=l,2,…,〃),c为非零常数,则()

A.两组样本数据的样本平均数相同

B.两组样本数据的样本中位数相同

C.两组样本数据的样本标准差相同

D.两组样本数据的样本极差相同

【答案】CD

【分析】A、C利用两组数据的线性关系有E(y)=E(x)+c、5y)=5%),即可判断正误;根据中位数、

极差的定义,结合已知线性关系可判断B、D的正误.

【详解】A:E(y)=E(x+c)=E(x)+c且CHO,故平均数不相同,错误;

B:若第一组中位数为七,则第二组的中位数为y=W+c,显然不相同,错误;

C:ZX),)=O(x)+£>(c)=O(x),故方差相同,正确:

D:由极差的定义知:若第一组的极差为%ax-/而,则第二组的极差为

%ax-Xnin="max+。)-&min+。)=苍皿一%min,故极差相同,正确;

故选:CD

4.(2021年全国高考乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无

提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:

旧设备9.810310.010.29.99.810.010.110.29.7

新设备10.110.410.110.010.110.310.610.510.410.5

旧设备和新设备生产产品的该项指标的样本平均数分别记为最和亍,样本方差分别记为s;和

(1)求X9y9S],,2;

/2~

(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果干一了之2,五芳■,则认为

新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).

【答案】(1)7=1O,G=1O.3,S;=0.036,s;=0.04;(2)新设备生产产品的该项指标的均值较旧设备有显

著提高.

【分析】(1)根据平均数和方差的计算方法,计算出平均数和方差.

(2)根据题目所给判断依据,结合(1)的结论进行判断.

……-9.8+10.3+10+10.2+9.9+9.8+10+10.1+10.2+9.79

【洋解】(1)x=---------------------------------------------------=10,

10

-10.1+10.4+10.1+104-10.1+10.34-10.6+10.5+10.4+10.5…

y=--------------------------------------------------------=10.3,

10

2"+0.32+0+"+0.%"+0+01+0.22+0.32=0C6,

s「=

10

0.22+0.12+0.22+0.32+0.22+0+0.32+0.22+0.12+0.22八八,

--------------------------------------------------------=0.04.

10

(2)依题意,G—嚏=0.3=2x0.15=2而正=2血质X,20.036+0.04=2^0.0076,

10

亍_工之2后萨,所以新设备生产产品的该项指标的均值较旧设备有显著提高.

5.(2021年全国高考甲卷)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两

台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:

一级品二级品合计

甲机床15050200

乙机床12080200

合计270130400

(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?

(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?

n(ad-bc)2

附:K2=

(a+b)(c+d)(a+c)(Z?+d)

P(K2>k)0.0500.0100.001

k3.8416.63510.828

【答案】(1)75%;60%;(2)能.

【分析】根据给出公式计算即可

【详解】(1)甲机床生产的产品中的一级品的频率为铛=75%,

200

19()

乙机床生产的产品中的一级品的频率为一=60%.

200

2

⑵^=400(150X80-120X50)=400>I0>6J63S

?.70xl30x?00x?0039

故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.

6.(2020年全国统一高考(新课标II))某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所

增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样

的方法抽取20个作为样区,调杳得到样本数据®,y/)(/=l,2,…,20),其中乐和y,•分别表示第i个样区的

2()2020

植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得2七=6。,W>,=1200,2(七一幻2=80,

/-Ir-1f-1

2020

£(y-»=9000,£(X/.-x)(x-y)=800.

1=1f=l

(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均

数乘以地块数);

(2)求样本(孙y)(i=l,2,...»20)的相关系数(精确到0.01);

(3)艰据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物

数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.

附:相关系数尸I/〃,JSH.414.

住a-君吃

Vr=li=l

【答案】(1)12000;(2)0.94;(3)详见解析

【分析】(1)利用野生动物数量的估计值等于样区野生动物平均数乘以地块数,代入数据即可;

20__

Z(x7)(凹一))

(2)利用公式—=下尹-----------------•计算即可;

Vi=li=l

(3)各地块间植物覆盖面积差异较大,为提高样本数据的代表性,应采用分层抽样.

1201

【详解】(1)样区野生动物平均数为7;E>=7;X12()()=6(),

2Uj=i2U

地块数为200,该地区这种野生动物的估计值为200x60=12000

(2)样本(七,凹.)(,=1,2,...»20)的相关系数为

20

»斗-无)(凹-刃

800

0.94

Ho20-一*

780x9000

心a-亍花(%-刃2

(3)由(2)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性,

由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物的数量差异很大,

采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,

从而可以获得该地区这种野生动物数量更准确的估计.

【点睛】本题主要考查平均数的估计值、相关系数的计算以及抽样方法的选取,考查学生数学运算能力,

是一道容易题.

一、单选题

1.(2022・湖南岳阳•三模)已知一组数据:牛法看的平均数是5,方差是4,则由。+1,2g+1,2&+1和U

这四个数据组成的新数据组的方差是()

A.16B.14C.12D.11

【答案】C

【分析】根据平均数、方差公式计算可得;

【详解】解:由已知得%+9+七=15,(%-5)2+(电-5)2+(b-5)2=12,

则新数据的平均数为;3+1+2^+1+2/-1+11)=2«…=

所以方差为;[(2%+171)2+(2马+1-11)2+(久+1-11)2+(11—11)2],

=-[4(.r-5)2+4(x,-5)2+4(妙-5)2]=(x)-5)2+(x,-5)2+(^-5)2=12,

41

故选:C.

2.(2022•辽宁辽阳•二模)为了解某地高三学生的期末语文考试成绩,研究人员随机抽取了100名学生对其

进行调查,根据所得数据制成如图所示的频率分布直方图,已知不低于90分为及格,则这100名学生期末

语文成绩的及格率为()

A.40%B.50%C.60%D.65%

【答案】C

【分析】利用直方图求频率即得.

【详解】依题意可得及格率为1—20x(0.006+0.014)=0.6=60%.

故选:C.

3.(2022•天津河北•二模)为了解中学生的身高情况,某部门随机抽取了某学校的学牛,将他们的身高数据

(单位:cm)^[150,160),[160,170),[170,180),[180,190]分组,绘制成如图所示的频率分布直方

图,其中身高在区间[170,180)内的人数为300,身高在区间[160,170)内的人数为180,则a的值为()

A.0.03B.0.3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论