第二十二讲统计初步及成对数据的统计分析原卷版_第1页
第二十二讲统计初步及成对数据的统计分析原卷版_第2页
第二十二讲统计初步及成对数据的统计分析原卷版_第3页
第二十二讲统计初步及成对数据的统计分析原卷版_第4页
第二十二讲统计初步及成对数据的统计分析原卷版_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二十二讲:统计初步及成对数据的统计分析

【考点梳理】

1.统计初步

(1)随机抽样:简单随机抽样,分层抽样

(2)用样本估计总体:频率分布直方图,样本数字特征(百分位数、平均数、众数、中位数、方差、

标准差)

特征数具体数字算法频率分布直方图(表)

众数次数出现最多的数字频率最大或最高组的中间值

中位数样本数据中,将数据按大小排列,位于最中间频率等于0.5时的横坐标

的数据.如果数据的个数为偶数,就取当中两

个数据的平均数作为中位数

平均数所有数字之和除以总个数每个小矩形面积乘以小矩形底边中点的横坐

标之和

方差S~——[(X]—X)2+(%2—X)2++(怎—X)2]

n

平均数反映了数据取值的平均水平,标准差、方差描述了一组数据波动的大小.标准差、方差越大,数据

的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定

2.成对数据的统计分析

(1)相关关系,(2)回归分析,(3)独立性检验

【典型题型讲解】

考点一:抽样:简单随机抽样分层抽样

【典例例题】

例1.某工厂利用随机数表对生产的700个零件进行抽样测试,先将700个零件进行编号,001,002,.........

699,700.从中抽取70个样本,下图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取

数据,则得到的第6个样本编号是()

32211834297864540732524206443812234356773578905642

84421253313457860736253007328623457889072368960804

32567808436789535577348994837522535578324577892345

A.623B.328C.253D.007

例2.2022年7月24日,搭载问天实验舱的长征五号8遥三运载火箭,在我国文昌航天发射场成功发射,我

国的航天事业又上了一个新的台阶.某校现有高一学生1000人,高二学生800人,高三学生1200人,为了调

查该校学生对我国航天事业的了解程度,现从三个年级中采用分层抽样的方式抽取60人填写问卷调查,则

高三年级有多少人被抽中()

A.16B.18C.20D.24

【方法技巧与总结】

根据样本数据的特点要判定采用随机简单抽样和分层抽样

【变式训练】

1.某个年级有男生180人,女生160人,用分层抽样的方法从该年级全体学生中抽取一个容量为68的样本,

则此样本中女生人数为()

A.40B.36C.34D.32

2.某中学为了掌握学校员工身体状况,偶尔会采用抽检的方式来收集各部门员工的健康情况.为了让样本更

具有代表性,学校对各部门采用分层抽样的方法进行抽检.已知该校部门A、部门8、部门C分别有40、

60、80人,各部门员工不存在交叉任职情况,若共抽检了90人,则部门A抽检人数为.

3.某市甲、乙、丙三所学校的高三学生共有800名,其中男、女生人数如下表:

甲校乙校丙校

男牛.9790X

女生153160y

(1)现用分层随机抽样的方法从这三所学校的所有高三学生中抽取48人,则应从丙校抽取多少人?

(2)该市模考后,市教研室准备从这三所学校的所有高三学生中利用随机数法抽取100人进行成绩统计分析,

将800人按001,002,....800进行编号,如果从第8行第7列的数开始向右读,请你依次写出最先抽取

的4个人的编号.(下面摘取了随机数表第7行至第9行)

84421753315724550688770474476721763350268392

63015316591692753816582170717512867358074439

13263321134278641607825207443815032442997931

考点二:样本数字特征

【典例例题】

例1.(2022・广东中山•高三期末)甲、乙两支田径队的体检结果为:甲队体重的平均数为60kg,方差为200,

乙队体重的平均数为70kg,方差为300,又已知甲、乙两队的队员人数之比为1:4,那么甲、乙两队全部

队员的平均体重和方差分别是()

A.65,280B.68,280C.65,296D.68,296

例2.(2022,广东深圳•高三期末)为了分析某次考试的情况,随机抽取了若干学生,将其考试成绩分组为:

[60,70),[70,80),[80,90),[90,100),[100,110),[110,120),[120,130),[130,140),[140,150],并绘制

成如下图所示的频率分布直方图,据此可估计该次考试成绩的中位数加€(左次+1),则整数k的值为()

例3.(2021•广东汕头•高三期末)某中学为了解学生数学史知识的积累情况,随机抽取150名同学参加数学

史知识测试,测试题共5道,每答对一题得20分,答错得。分.得分不少于60分记为及格,不少于80分

记为优秀,测试成绩百分比分布图如图所示,则()

A.该次数学史知识测试及格率超过90%

B.该次数学史知识测试得满分的同学有15名

C.该次测试成绩的中位数大于测试成绩的平均数

D.若该校共有1500名学生,则数学史知识测试成绩能得优秀的同学大约有720名

例4.2021年7月至2022年7月,我国居民消费价格保持平稳,居民消费价格涨跌幅如图所示,则()

全国居民消费价格涨跌幅

—同比增长率环比增长率

3.0%

2.5%

2.0%

1.5%

1.0%

0.5%

0.0%

-0.5%

—1.0%

2021年8月9月10月11月12月2022年2月3月4月5月6月7月

7月1月

备注:同比增长率=当月消警鬻篇鬻费价格x100%,环比增长率=

去年同期消费5价格

当月消费价格-上月同期消费价格I八八。/

—上月同期消费价格—xl0()%,

A.2022年1月全国居民消费价格比2021年1月全国居民消费价格有所下降

B.2022年5月全国居民消费价格比2022年4月全国居民消费价格有所上升

C.2021年7月至2022年7月全国居民消费价格同比增长率的40%分位数为1.0%

D.2021年10月至2022年7月全国居民消费价格环比增长率的平均数为0.25%

【方法技巧与总结】

1、频率分布直方图

(1)利用频率分布直方图求频率、频数;

(2)利用频率分布直方图估计总体.

(3)频率分布直方图的纵坐标是频率除以组距,而不是频率.

2、百分位数

计算一组〃个数据的的第p百分位数的步骤

①按从小到大排列原始数据.

②计算i=〃xp%.

③若,不是整数而大于,的比邻整数则第"百分位数为第J项数据;若i是整数,则第p百分位数

为第,项与第i+1项数据的平均数.

【变式训练】

1.(2022•广东东莞•高三期末)气象意义上从春季进入夏季的标志为"当且仅当连续5天每天日平均温度不低

于22C”.现有甲、乙、丙三地连续5天日平均温度的记录数据(数据均为正整数,单位C)且满足以下条

件:

甲地:5个数据的中位数是24,众数是22;

乙地:5个数据的中位数是27,平均数是24;

丙地:5个数据有1个是30,平均数是24,方差是9.6;

根据以上数据,下列统计结论正确的是()

A.甲地进入了夏季B.乙地进入了夏季

C.不能确定丙地进入了夏季D.恰有2地确定进入了夏季

2.如图1为某省2019年1~4月份快递业务量统计图,图2为该省2019年1~4月份快递业务收入统计图,对

统计图理解不正确的是()

A.2019年1~4月份快递业务量3月份最高,2月份最低,差值接近2000万件

B.从1~4月份来看,业务量与业务收入有波动,但整体保持高速增长

C.从两图中看,增量与增长速度并不完全一致,但业务量与业务收入变化高度一致

D.2019年1~4月份快递业务量同比增长率均超过50%,在3月份最高,和春节后网购迎来喷涨有关

3.(2022・广东清远•高三期末)某学校组织了一次劳动技能大赛,共有100名学生参赛,经过评判,这100

名参赛者的得分都在[40,90]内,得分60分以下为不及格,其得分的频率分布直方图如图所示(按得分分成

[40,50),[50,60),[60,70),[70,80),[80,90]这五组),则下列结论正确的是()

B.此次比赛得分不及格的共有40人

C.以频率为概率,从这100名参赛者中随机选取1人,其得分在[60,80)的概率为0.5

D.这100名参赛者得分的中位数为65

4.(2022・广东汕头•一模)在党史学习教育动员大会上,习近平总书记强调全党同志要做到学史明理、学史

增信、学史崇德,学史力行.某单位对200名党员进行党史知识测试,将成绩分成6组:[70,75),[75,80),

[80,85),[85,90),[90,95),[95,100],得到如图所示的频率分布直方图,则。=.

5.(2022•广东广东•一模)(多选)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农

户家庭年收入调查数据整理得到如下频率分布直方图(如图):

rk收入/万左

根据此频率分布直方图,下面结论中正确的是()

A.该地农户家庭年收入低于4.5万元的农户比率估计为6%

B.该地农户家庭年收入的中位数约为7.5万元

C.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间

D.估计该地农户家庭年收入的平均值不超过6.5万元

6.(2022•广东韶关•一模)(多选)在一次演讲比赛中,以下表格数据是5位评委给甲、乙两名选手评出的成

绩,则下列说法正确的是()

甲乙

86909592879188938895

A.甲选手成绩的极差大于乙选手成绩的极差

B.甲选手成绩的中位数小于乙选手成绩的中位数

C.甲选手成绩的方差小于乙选手成绩的方差

D.甲选手成绩的平均数小于乙选手成绩的平均数

7.某市政府为了节约生活用水,实施居民生活用水定额管理政策,即确定一个居民月用水量标准x(单位:

吨),用水量不超过x的部分按平价收费,超出x的部分按议价收费,并随机抽取部分居民进行调查,抽取

的居民月均用水量的频率分布直方图如图所示.(同一组中的数据以该组区间的中点值为代表)

1、频率

air

(2)试估计该市居民月均用水量的众数、平均数;

(3)如果希望85%的居民月均用水量不超过标准x,那么标准x定为多少比较合理?

8.随着新冠肺炎疫情的稳定,各地的经济均呈现缓慢的恢复趋势,为了更进一步做好疫情的防控工作,避免

疫情的再度爆发,A地区规定居民出行或者出席公共场合均需佩戴口罩,现将A地区20000个居民一周的口

罩使用个数统计如下表所示,其中每周的口罩使用个数在6以上(含6)的有14000人.

口罩使用数量[2,4)[4,6)[6,8)18,10)[10,12]

频率0.2m0.3n0.1

频率

0.3r

0.2

24681012s/口罩使用个数

(1)求〃的值;

(2)根据表中数据,完善上面的频率分布直方图;

(3)计算A地区居民一周口罩使用个数的平均数以及方差.

考点二:回归分析

【典例例题】

例1.(2022•广东汕尾•高三期末)"绿水青山就是金山银山”的生态文明发展理念已经深入人心,这将推动新

能源汽车产业的迅速发展,下表是近几年我国某地区新能源汽车的年销售量与年价的统计表

年份20162017201820192020

年销售量(万台)812152025

根据上表,利用最小二乘法,新能源汽车的年销售量y万台关于年份x的线性回归方程为.

5

参考数据:X(士一君(%-刃=(-2)*(-8)+(-l)x(-4)+lx4+2x9=42,

1=1

5

E(%-君2=4+1+1+4=10,42x2017=84714,42x2018=84756.

/=1

附:对于一组数据(4%),(孙必),,(王,%),其回归直线亍=云+6的斜率和截距的最小二乘估计分别为:

-X)(y,-y)

•二旦F-----7------------,a=y-bx.

f(玉-x)2

Z=I

例2.(2022•广东•铁一中学高三期末)2020年1月底,为严防新型冠状病毒疫情扩散,有效切断病毒传播途

径,坚决遏制疫情蔓延势头,确保人民群众生命安全和身体健康,多地相继做出「封城决定.某地在1月23日

至29日累计确诊人数如下表:

日期(1月)23日24日25日26日27日28日29日

人数(人)611213466101196

由上述表格得到如散点图(1月23日为封城第一天).

1234567.、(封城后的天数)

(1)根据散点图判断>=。+云与y=(c,d均为大于0的常数)哪一个适宜作为累计确诊人数y与封

城后的天数X的回归方程类型(给出判断即可,不必说明理由);并根据上表中的数据求出回归方程;

(2)随着更多的医护人员投入疫情的研究,2月20日武汉影像科医生提出存在大量核酸检测呈阴性(阳性

则确诊),但观其CT肺片具有明显病变,这一提议引起了广泛的关注,2月20日武汉疾控中心接收了1000

份血液样本,假设每份样本的检验结果是阳性还是阴性都是相互独立的,且每份样本是阳性样本的概率为

0.7,核酸试剂能把阳性样本检测出阳性结果的概率是0.99(核酸检测存在阳性样本检测不出来的情况,但

不会把阴性检测呈阳性),求这1000份样本中检测呈阳性的份数的期望.

参考数据:

77

54

yW2%叱100

/=1/=|

62.141.54253550.123.47

_17

其中叱=lgy,W=~YJWi,参考公式:对于一组数据(%,叫),(“2,股),…,(““,叱),其回归直线卬=£+4,

•;=1

y'uiwi—nuw

的斜率和截距的最小二乘估计公式分别为。=丹------,=w-j3u.

立”而a

【方法技巧与总结】

1.线性回归方程的求法;

2.非线性回归方程要通过换元换成线性回归方程.

【变式训练】

1.(2022•广东深圳•一模)某人工智能公司近5年的利润情况如下表所示:

第X年12345

利润y/亿元23457

已知变量y与x之间具有线性相关关系,设用最小二乘法建立的回归直线方程为y=1.2x+a,则下列说法正

确的是()A.a=0.6

B.变量y与x之间的线性相关系数r<0

C.预测该人工智能公司第6年的利润约为7.8亿元

D.该人工智能公司这5年的利润的方差小于2

2.(2022•广东惠州•二模)某地建立了农业科技图书馆,供农民免费借阅,收集了近5年的借阅数据如下表:

年份20162017201820192020

年份代码X12345

年借阅量W万册4.95.15.55.75.8

根据上表,可得y关于x的线性回归方程为£=0.24x+4,则()A.5=4.68

B.估计近5年借阅量以0.24万册/年的速度增长

C.y与x的样本相关系数r>0

D.2021年的借阅量一定不少于6.12万册

3.(2022•广东,金山中学高三期末)2021年,我国脱贫攻坚战取得了全面胜利.为了巩固拓展脱贫攻坚成果,

不断提高群众的幸福感,某县继续推进山羊养殖项目.为了建设相应的配套项目,该县主管部门对该县近年

来山羊养殖业的规模进行了跟踪调查,得到了该县每年售卖山羊数量》(单位:万只)与相应年份代码x的

数据如下表:

年份201520162017201820192020

年份代码X123456

售卖山羊数量y(万只)111316152021

(1)由表可知y与x有较强的线性相关关系,求y关于x的线性回归方程:

(2)已知该县养殖的山羊品种只有甲、乙两种,且甲品种山羊与乙品种山羊的数量之比为2:3,甲品种山

羊达到售卖标准后的出售价为2500元/只,乙品种山羊达到售卖标准后的出售价为2700元/只.为了解养殖

山羊所需要的时间,该县主管部门随机抽取了甲品种山羊和乙品种山羊各100只进行调查,得到要达到售

卖标准所需的养殖时间如下表:

养殖时间(月数)6789

甲品种山羊(只)20353510

乙品种山羊(只)10304020

以上述样本统计的养殖山羊所需时间情况估计全县养殖山羊所需时间(即以各养殖时间的频率作为各养殖

时间的概率),且每月每只山羊的养殖成本为300元,结合(1)中所求回归方程,试求2022年该县养殖山

羊所获利润的期望(假设山羊达到售卖标准后全部及时卖完).(利润=卖山羊的收入一山羊的养殖成本)

nn

X(x,.-x)(z.-y)Xx^-nxy

参考公式及数据:回归直线方程为务,其中5=J------------------=得---------,a=y-bx.

t(x,一寸fx;-"于

/=1/=1

4.(2022•广东广州•一模)人们用大数据来描述和定义信息时代产生的海量数据,并利用这些数据处理事务

和做出决策,某公司通过大数据收集到该公司销售的某电子产品1月至5月的销售量如下表.

月份X12345

销售量y(万件)4.95.86.88.310.2

该公司为了预测未来几个月的销售量,建立了y关于x的回归模型:y=ux2+v.

⑴根据所给数据与回归模型,求y关于x的回归方程(〃的值精确到0.1);

⑵已知该公司的月利润z(单位:万元)与x,y的关系为z=24根据(1)的结果,问该公司

ylx

哪一个月的月利润预报值最大?

参考公式:对于一组数据(不乂),(々,必),,(乙,%),其回归直线》=以+4的斜率和截距的最小二乘估计公

式分别为3=^^------------------,a=y-bx.

可。

1=1

5.(2022・广东肇庆•二模)下表是我国从2016年到2020年能源消费总量近似值y(单位:千万吨标准煤)

的数据表格:

年份20162017201820192020

年份代号X12345

能源消费总量近似值y(单位:

442456472488498

千万吨标准煤)

以x为解释变量,y为预报变量,若以9=为回归方程,则相关指数0.9946,若以》=%+Hlnx

为回归方程,则相关指数R;B0.9568.

⑴判断?=6/+4与亍=%+仇111》哪一个更适宜作为能源消费总量近似值"关于年份代号*的回归方程,并

说明理由;

⑵根据(1)的判断结果及表中数据,求出y关于年份代号x的回归方程.

55

参考数据:W>=2356,>%=7212.

i=\i=l

参考公式:回归方程»=+G中斜率和截距的最小二乘估计公式分别为:

'-------;—T--------,a=y-bx.

£(若-H)-fx”加2

/=11=1

6.(2022•广东潮州•二模)我国在芯片领域的短板有光刻机和光刻胶,某风险投资公司准备投资芯片领域,

若投资光刻机项目,据预期,每年的收益率为30%的概率为。,收益率为-10%的概率为1-P;若投资光

刻胶项目,据预期,每年的收益率为30%的概率为0.4,收益率为-20%的概率为0.1,收益率为零的概率

为05

⑴已知投资以上两个项目,获利的期望是一样的,请你从风险角度考虑为该公司选择一个较稳妥的项目;

(2)若该风险投资公司准备对以上你认为较稳妥的项目进行投资,4年累计投资数据如下表:

年份X2018201920202021

1234

累计投资金额y(单位:亿元)2356

请根据上表提供的数据,用最小二乘法求出y关于〃的线性回归方程»=并预测到哪一年年末,该

公司在芯片领域的投资收益预期能达到0.75亿元.

za-亍)(¥-方z仪-两

附:收益=投入的资金x获利的期望;线性回归£=曲+4中,3=------------=号-------,a=y-bx.

i=\

7.在疫情防控常态化的背景下,山东省政府各部门在保安全,保稳定的前提下有序恢复生产,生活和工作秩

序,五一期间,文旅部门在落实防控举措的同时,推出了多款套票文旅产品,得到消费者的积极回应.下

面是文旅部门在某地区推出六款不同价位的旅游套票,每款的套票价格x(单位:元)与购买人数y(单位:

万人)的数据如下表:

旅游类别城市展馆科技游乡村特色游齐鲁红色游浮山套票游园套票观海套票

套票价格X(元)394958677786

购买数量y(万人)16.718.720.622.524.125.6

在分析数据、描点绘图中,发现散点(匕,g)(lW*6)集中在一条直线附近,其中匕=1叫,g=lny,

6666

附:①可能用到的数据:2匕3=7532匕=2462叫=18.,ZV;=10L4.

f=li=l<=l/=!

②对于一组数据(中电卜(岭,叫),…,(匕,3“),其回归直线由=加+&的斜率和截距的最小二乘估计值分别

II

,-tWCO

为另=e---------,a=co-bv

Ev,2-nv2

1=1

(1)根据所给数据,求y关于x的回归方程;

(2)按照文旅部门的指标测定,当购买数量y与套票价格x的比在区间上时,该套票受消费者的欢迎

程度更高,可以被认定为“热门套票”,现有三位同学从以上六款旅游套票中,购买不同的三款各自旅游.记

三人中购买“热门套票”的人数为X,求随机变量X的分布列和期望.

考点三:独立性检验

【典例例题】

例1.(2022•广东揭阳•高三期末)每年的毕业季都是高校毕业生求职和公司招聘最忙碌的时候,甲、乙两家

公司今年分别提供了2个和3个不同的职位,一共收到了100份简历,具体数据如下:

公司文史男文史女理工男理工女

甲10102010

乙1520105

分析毕业生的选择意愿与性别的关联关系时,己知对应的K?的观测值尢”LOI。;分析毕业生的选择意愿与

专业关联的犬的观测值心=9.090,则下列说法正确的是()

网片.人)0.40.050.0250.010.0050.001

k°0.7083.8415.0246.6357.87910.828

A.有99.9%的把握认为毕业生的选择意愿与专业相关联

B.毕业生在选择甲、乙公司时,选择意愿与专业的关联比与性别的关联性更大一些

C.理科专业的学生更倾向于选择乙公司

D.女性毕业生更倾向于选择甲公司

例2.(2021•广东汕头•高三期末)某土特产超市为预估2022年元旦期间游客购买土特产的情况,对2021

年元旦期间的90位游客购买情况进行统计,得到如下人数分布表:

购买金额(元)[0,150)[150,300)[300,450)[450,600)[600,750)[750,900]

人数101520152010

⑴根据以上数据完成2x2列联表,并判断是否有95%的把握认为购买金额是否少于600元与性别有关.

不少于600元少于600元合计

男40

女18

合计

⑵为吸引游客,该超市推出一种优惠方案:购买金额不少于600元可抽奖3次,每次中奖概率为P(每次抽

奖互不影响,且P的值等于人数分布表中购买金额不少于600元的频率),中奖1次减50元,中奖2次减

100元,中奖3次减150元.若游客甲计划购买800元的土特产,请列出实际付款数X(元)的分布列并

求其数学期望.

n(ad-be)2

附:参考公式和数据:K2=,n=a+b+c+d.

(a+b)(c4-d)(a+c)(b+d)

附表:

k。2.0722.7063.8416.6357.879

P(K->k0)0.1500.1000.0500.0100.005

【方法技巧与总结】

独立性检验独立性

【变式训练】

1.(2022・广东潮州•高三期末)(多选)千百年来,我国劳动人民在生产实践中根据云的形状、走向速度、

厚度、颜色等的变化,总结了丰富的"看云识天气”的经验,并将这些经验编成谚语,如“天上钩销云,地上

雨淋林”"日落云里走,雨在半夜后”.…小明同学为了验证"日落云里走,雨在半夜后",观察了所在地区A的

100天日落和夜晚天气,得到如下2x2列联表:

临界值表

夜晚天气

下雨不下雨

日落云里走

2

P(K>k0)0.100.050.0100.001

出现255

不出现2545即2.7063.8416.63510.828

并计算得到片=19.05,下列小明对地区A天气判断正确的是()A.夜晚下雨的概率约为g

B.未出现"日落云里走",但夜晚下雨的概率约为2

14

C.出现“日落云里走",有99.9%的把握认为夜晚会下雨

D.有99.9%的把握认为"'日落云里走'是否出现"与"当晚是否下雨”有关

2.(2022•广东湛江•一模)(多选)某市为了研究该市空气中的PM2.5浓度和SO2浓度之间的关系,环境监

测部门对该市空气质量进行调研,随机抽查了100天空气中的PM2.5浓度和SC)2浓度(单位:〃g/mD,得

到如下所示的2x2列联表:

SO2

10,150](150,475]

PM2.5

[0,75]6416

(75,115]1010

64

经计算k=100讨*1°T1°)工7.4844,则可以推断出()

80x20x74x26

附:K、——幽也——

(〃+份(c+d)(〃+c)(b+d)

尸(土“。)0.0500.0100.001

k()3.8416.63510.828

A.该市一天空气中PM2.5浓度不超过75ug/n?,且SO?浓度不超过150ng/n?的概率估计值是0.64

B.若2x2列联表中的天数都扩大到原来的10倍,K2的观测值不会发生变化

C.有超过99%的把握认为该市一天空气中PM2.5浓度与SO?浓度有关

D.在犯错的概率不超过1%的条件下,认为该市一天空气中PM2.5浓度与S02浓度有关

3.(2022・广东清远•高三期末)某市为积极响应上级部门的号召,通过沿街电子屏、微信公众号等各种渠道

对抗疫进行了深入的宣传,帮助全体市民深入了解新型冠状病毒,增强战胜疫情的信心.为了检验大家对

新型冠状病毒及防控知识的了解程度,该市推出了相关的问卷调查,随机抽取了年龄在18~99岁之间的200

人进行调查,把年龄在U8,65]和[66,99]内的人分别称为“青年人"和"中老年人经统计•,“青年人"和"中老

年人"的人数之比为2回3,其中"青年人"中有50%的人对防控的相关知识了解全面,“中老年人"中对防控的相

关知识了解全面和了解不全面的人数之比是201.

⑴根据已知条件,完成下面的2x2列联表,并根据统计结果判断是否有95%的把握认为"中老年人"比"青年

人”更加了解防控的相关知识.

了解全面了解不全面合计

青年人

中老年人

合计

(2)用频率估计概率从该市18〜99岁市民中随机抽取3位市民,记抽出的市民对防控相关知识了解全面的人

数为X,求随机变量X的分布列与数学期望.

附表及公式:K=m+o)(c+d)(a+c)(Hd),其中…

P(K2>k]0.150.100.050.0250.0100.0050.001

k2.0722.7063.8415.0246.6357.87910.828

4.(2022•广东茂名•一模)为了增强学生体质,茂名某中学的体育部计划开展乒乓球比赛,为了解学生对乒

乓球运动的兴趣,从该校一年级学生中随机抽取了200人进行调查,男女人数相同,其中女生对乒乓球运

动有兴趣的占80%,而男生有15人表示对乒乓球运动没有兴趣.

(1)完成2x2列联表,并回答能否有90%的把握认为“对乒乓球运动是否有兴趣与性别有关"?

有兴趣没兴趣合计

合计

(2)为了提高同学们对比赛的参与度,比赛分两个阶段进行.第一阶段的比赛赛制采取单循环方式,每场比赛

采取三局二胜制,然后由积分的多少选出进入第二阶段比赛的同学,每场积分规则如下:比赛中以2:0取胜

的同学积3分,负的同学积0分;以2:1取胜的同学积2分,负的同学积1分.其中,小强同学和小明同学的

比赛倍受关注,设每局小强同学取胜的概率为p=(2,记小强同学所得积分为X,求X的分布列和期望.

附表:

P(«泌0)0.500.400.250.1500.1000.050

ko0.4550.7801.3232.0722.7063.841

参考公式:\++(〃=〃+"'+")

5.(2022•广东茂名•二模)某水果经营户对出售的苹果按大小和色泽两项指标进行分类,最大横切面直径不

小于70毫米则大小达标,着色度不低于90%则色泽达标,大小和色泽均达标的苹果为一级果;大小和色泽

有一项达标另一项不达标的苹果为二级果;两项均不达标的苹果为三级果.已知该经营户购进一批苹果,

从中随机抽取100个进行检验,得到如下统计表格:

直径小于70毫米直径不小于70毫米合计

着色度低于90%101525

着色度不低于90%156075

合计2575100

⑴根据以上数据,判断是否有95%的把握认为该经营户购进的这批苹果的大小达标和色泽达标有关;

(2)该经营户对三个等级的苹果按照分层抽样从样本中抽取10个苹果,再从中随机抽取3个,求抽到二级果

个数X的概率分布列和数学期望.

附:

尸(尸次)0.0500.0250.010

3.8415.0246.635

K2其中〃=a+b+c+”.

(a+b)(c+d)(a+c)(b+d)

6.(2022•广东惠州•二模)2019年4月,江苏省发布了高考综合改革实施方案,试行"3+1+2”高考新模式.

为调研新高考模式下,某校学生选择物理或历史与性别是否有关,统计了该校高三年级800名学生的选科

情况,部分数据如下表:

性别男生女生合计

科目

物理300

历史150

合计400800

(1)根据所给数据完成上述表格,并判断是否有99.9%的把握认为该校学生选择物理或历史与性别有关;

(2)该校为了提高选择历史科目学生的数学学习兴趣,用分层抽样的方法从该类学生中抽取5人,组成数

学学习小组.一段时间后,从该小组中抽取3人汇报数学学习心得.记3人中男生人数为X,求X的分布列和

数学期望E(X).

n(ad-bc)2

(a+b)(c+d)(a+c)(b+d)

P(K\.k)0.0500.0100.001

k3.8416.63510.828

【巩固练习】

一、单选题

1.(2022•山东•汶上县第一中学高三开学考试)某市为了减少水资源的浪费,计划对居民生活用水费用实施

阶梯式水价制度.为了确定一个比较合理的标准,通过简单随机抽样,获得了100户居民的月均用水量数据

(单位:吨),得到如图所示的频率分布直方图.估计该市居民月均用水量的中位数为()

A.8.25B.8.45C.8.65D.8.85

2.(2022.黑龙江.佳木斯一中三模(文))新冠肺炎疫情防控中,测量体温是最简便、最快捷,也是筛查成

本比较低、性价比很高的筛查方式,是更适用于大众的普通筛查手段.某班级体温检测员对某一周内甲、

乙两名同学的体温进行了统计,其结果如图所示,则下列结论不正确的是()

A.甲同学的体温的极差为0.5℃

B.甲同学的体温的众数为36.3C

C.乙同学的体温的中位数与平均数不相等

D.乙同学的体温比甲同学的体温稳定

3.(2022•广西•模拟预测(文))2022年6月6日是第27个“全国爱眼日”,为普及科学用眼知识,提高群众

健康水平,预防眼疾,某区残联在残疾人综合服务中心开展“全国爱眼日”有奖答题竞赛活动.已知5位评委

老师按百分制(只打整数分)分别给出某参赛小队评分,可以判断出一定有评委打满分的是()

A.平均数为98,中位数为98B.中位数为96,众数为99

C.中位数为97,极差为9D.平均数为98,极差为6

4.(2022.黑龙江.佳木斯一中三模(文))下列说法正确的序号是()

①在回归直线方程3=0.8x72中,当解释变量x每增加一个单位时,预报变量亍平均增加0.8个单位;

②利用最小二乘法求回归直线方程,就是使得/(》-法「“尸最小的原理:

③已知x,y是两个分类变量,若它们的随机变量K?的观测值女越大,贝『'X与y有关系’’的把握程度越小;

④在一组样本数据(知幻,(巧,%),…,(%%)(”22,4,々,…,X"不全相等)的散点图中,若所

有样本a,»)(i=l,2,〃)都在直线y=-”l上,则这组样本数据的线性相关系数为

A.①③B.①②C.②④D.③④

5.(2022•四川省仁寿县文宫中学高三阶段练习(理))某医疗研究所为了检查新研发的疫苗对某种病毒的预

防作用,把1000只已注射疫苗的小白鼠与另外1000只未注射疫苗的小白鼠的感染记录作比较,提出原假

设”这种疫苗不能起到预防该病毒传染的作用.”并计算得尸(/26.635)“0.01,则下列说法正确的是

()

A.这种疫苗对预防该病毒传染的有效率为1%

B.若某人未使用疫苗,则他有99%的可能性传染该病毒

C.有99%的把握认为“这种疫苗能起到预防该病毒传染的作用”

D.有1%的把握认为“这种疫苗能起到预防该病毒传染的作用”

二、多选题

6.(2022•全国•模拟预测)最近几个月,新冠肺炎疫情又出现反复,各学校均加强了疫情防控要求,学生在

进校时必须走测温通道,每天早中晚都要进行体温检测并将结果上报主管部门.某班级体温检测员对一周内

甲乙两名同学的体温进行了统计,其结果如图所示,则下列结论正确的是()

A.甲同学体温的极差为0.4℃

B.乙同学体温的众数为36.4C,中位数与平均数相等

C.乙同学的体温比甲同学的体温稳定

D.甲同学体温的第60百分位数为36.4℃

7.某地为响应“扶贫必扶智,扶智就扶知识、扶技术、扶方法”的号召,建立农业科技图书馆,供农民免费借

阅,收集了近5年的借阅数据如下表:

年份20162017201820192020

年份代码X

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论