2022-2023学年高二下数学:成对数据的统计分析(附答案解析)_第1页
2022-2023学年高二下数学:成对数据的统计分析(附答案解析)_第2页
2022-2023学年高二下数学:成对数据的统计分析(附答案解析)_第3页
2022-2023学年高二下数学:成对数据的统计分析(附答案解析)_第4页
2022-2023学年高二下数学:成对数据的统计分析(附答案解析)_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2022-2023学年高二下数学:成对数据的统计分析

一.选择题(共8小题)

1.(2021秋•兴庆区校级期末)设两个变量X与N之间具有线性相关关系,相关系数为r,

回归方程为y=α+bx,那么必有()

A.6与尸符号相同B.Q与尸符号相同

C.b与r符号相反D.α与,,符号相反

2.(2021春•兰州期中)对两个变量歹和X进行回归分析,则下列说法中不正确的是()

^AA

A.由样本数据得到的回归方程y=bχ+a必过样本点的中心(7,y)

B.残差平方和越小的模型,拟合的效果越好

C.用相关指数乃来刻画回归效果,产的值越小,说明模型的拟合效果越好

D.回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法

3.(2021春•昌吉州期中)已知某种商品的广告费支出X(单位:万元)与销售额y(单位:

万元)之间有如下对应数据:

X24568

y3040506070

根据上表可得回归方程y=*+a,计算得b=7则当投入12万元广告费时,销售额的预

报值为()

A.75万元B.85万元C.99万元D.105万元

4.(2021春•河西区期中)如表是2X2列联表,则表中的0、6的值分别为()

巾y合计

Xla835

X113445

合计b4280

A.27、38B.28、38C.27、37D.28、37

5.(2021春•运城期中)某学校食堂对高三学生偏爱蔬菜还是肉类与性别的关系进行了一次

调查,根据独立性检验原理,处理所得数据之后发现,有97.5%的把握但没有99%的把

握认为偏爱蔬菜还是肉类与性别有关,则群的观测值可能为()

第1页(共21页)

P(K0.100.050.0250.0100.0050.001

k2.7063.8415.0246.6357.87910.828

A.烂=3.206B.AT2=6.625C.ΛT2=7.869D.K=11.208

6.(2021春•道里区校级期中)在一组样本数据(xι,yι)f(X2,”),…,(x〃,y〃),(w≥2,

Xi,X2,…,初不相等)的散点图中,若所有样本点(xi,yi)(/=1,2,-,H)都在直

线y=-^∙χ+3上,则这组样本数据的样本相关系数为()

A.-IB.ɪC..ΛD.1

22

7.(2021•淄博三模)某个国家某种病毒传播的中期,感染人数y和时间X(单位:天)在

18天里的散点图如图所示,下面四个回归方程类型中最适宜作为感染人数y和时间X的

回归方程的是()

12000001!感染人数

1000000∙

800000■

600000∙

400000-

200000■

0

O10

天额

A.y=a+bxB.y=a+bexC.y=a+blnxD.y=a+b4

8.(2021春•武汉期中)对于一组具有线性相关关系的样本数据(x,∙,yi)(z=l,2,…,〃),

其样本中心为(χ,y),回归方程为y=bχ+a,则相应于样本点(X"V)的残差为()

b

ʌ-yi-y∙y-yi

cd

∙yi-(bxi+a)∙(bxi+a)-yi

二.填空题(共4小题)

9.(2021春•昌吉州期中)甲、乙、丙、丁四位同学各自对48两个变量的线性相关性做

试验,并用回归分析方法分别求得相关系数厂与残差平方和相,如表:

甲乙丙T

r0.820.780.690.85

m106115124103

第2页(共21页)

则同学的试验结果体现出8两变量有更强的线性相关性.

10.(2021春•玉林期中)为了对X,y两个变量进行统计分析,现根据两种线性模型分别计

算出甲模型的相关指数为R[2=o.9io,乙模型的相关指数为R22=o.901,则

(填“甲”或“乙”)模型拟合的效果更好.

11.(2021春•沈阳期中)某医疗研究所为了检验某种血清预防感冒的作用,把500名使用

血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设"0:"这种血

清不能起到预防感冒的作用”,利用2X2列联表计算得K2^3.918,经查对临界值表知P

(K2》3.841)~0.05.则下列结论中,正确结论的序号是.

①在犯错误的概率不超过5%的前提个认为“这种血清能起到预防感冒的作用”;

②若某人未使用该血清,则他在一年中有95%的可能性得感冒;

③这种血清预防感冒的有效率为95%:

④有95%的把握认为这种血清不能起到预防感冒的作用.

12.(2020春•正定县校级月考)下列说法:①分类变量/与B的随机变量片越大,说明

'7与8有关系”的可信度越大,②以模型y=c∕去拟合一组数据时,为了求出回归方

程,设z=/〃y,将其变换后得到线性方程z=0.3x+4,贝∣Jc,k的值分别是和0.3,③在

残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高,④若变量X

和y满足关系y=-0∙lx+l,且变量y与Z正相关,则X与Z也正相关,正确的个数是.

Ξ.解答题(共4小题)

13.(2022•盐城一模)佩戴头盔是一项对家庭与社会负责的表现,某市对此不断进行安全教

育.如表1是该市某主干路口连续4年监控设备抓拍到的驾驶员不戴头盔的统计数据:

表1:

年度2018201920202021

年度序号X1234

不戴头盔人数y125010501000900

(1)请利用所给数据求不戴头盔人数y与年度序号X之间的回归直线方程y=br+a,并

估算该路口2022年不戴头盔的人数;

(2)交警统计2018~2021年通过该路口的开电瓶车出事故的50人,分析不戴头盔行为

与事故是否伤亡的关系,得到表2,能否有95%的把握认为不戴头盔行为与事故伤亡有

第3页(共21页)

关?

表2:

不戴头盔戴头盔

伤亡73

不伤亡1327

,Σχ1yi-∏χyΣ(χi-χ)(yi-y)ʌ,

参考公式:b=H,_2=J―二a=7一小

2

£x^-nxE(xi-χ)

i=li=l

P(K2^k)0.100.050.0250.0100.005

k2.7063.8415.0246.6357.879

21

K=----:_i」,.:!、.-」'1)--------其中n—a+b+c+d.

(a+b)(c+d)(a+c)(b+d)

14∙(2020∙新课标In)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天

到某公园锻炼的人次,整理数据得到下表(单位:天):

锻炼人次[0,200](200,400](400,600]

空气质量等级

1(优)21625

2(良)51012

3(轻度污染)678

4(中度污染)720

(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;

(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值

为代表);

(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级

为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2X2列联表,并根据

列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量

有关?

人次W400人次>400

第4页(共21页)

空气质量好

空气质量不好

附:烂=_______n(ad-bc)乙________

(a+b)(c+d)(a+c)(b+d)

P(K0.0500.0100.001

k3.8416.63510.828

15.(2021•兴宁区校级模拟)中国茶文化博大精深,已知茶水的口感与茶叶类型以及水温有

关.经验表明,某种绿茶用85℃的水泡制,再等到茶水温度降至60℃时饮用,可以产生

最佳口感.某学习研究小组通过测量,得到了下面表格中的数据(室温是20℃).

泡制时间x/tnin01234

水温yΓC8579747165

In(y-20)4.24.14.03.93.8

(1)小组成员根据上面表格中的数据绘制散点图,并根据散点图分布情况,考虑到茶水

温度降到室温(即20℃)就不能再降的事实,决定选择函数模型y=U+20(x≥0)来刻

画.

①令z=∕"(y-20),求出Z关于X的线性回归方程:

②利用①的结论,求出y=U+20(x≥0,c>0)中的%与c.

(2)你认为该品种绿茶用85℃的水大约泡制多久后饮用,可以产生最佳口感?

参考数据:log0.6=4.8,e-°∙l=0.9,ezl∙2=66.7,-^∙≈0.6∙

u∙y667

n

E(x4-χ)(z4-z)

AʌA*#ɪX^^

+=

参考公式:z=l√a'b=以F二—,a≡-b≈∙

2

∑(xi-D

i=l

16.(2017•新课标I)为了监控某种零件的一条生产线的生产过程,检验员每隔30加〃从该

生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽

取的16个零件的尺寸:

抽取次12345678

零件尺9.9510.129.969.9610.019.929.9810.04

第5页(共21页)

抽取次910111213141516

零件尺10.269.9110.1310.029.2210.0410.059.95

-16∑(x-χ)2=^⅛16

经计算得x=」1」£x,=9.97,11

-(∑『尸。⑵

16VXi?-162

16i=l

I1616_

∑(i-8.5)2=18.439,E(H-X))(Z-8.5)=-2.78,其中.Xj为抽取的第i个零件

i=li=l

的尺寸,i=l,2,16.

⑴求(xi,z)¢;=1,2,…,16)的相关系数小并回答是否可以认为这一天生产的

零件尺寸不随生产过程的进行而系统地变大或变小(若,|<0.25,则可以认为零件的尺寸

不随生产过程的进行而系统地变大或变小).

(2)一天内抽检零件中,如果出现了尺寸在(7-3s,*3s)之外的零件,就认为这条

生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.

(i)从这一天抽检的结果看,是否需对当天的生产过程进行检查?

(ii)在(7-3s,7+3S)之外的数据称为离群值,试剔除离群值,估计这条生产线当

天生产的零件尺寸的均值与标准差.(精确到0.01)

n__

Σ(χ1-χ)(yi-y)

i=l

附:样本(Xi,芹)Q=I,2,…,n)的相关系数尸=

nn

22

Σ(χi-χ)J∑(yi-y)

i=lYi=I

√0.008^0.09.

第6页(共21页)

2022-2023学年高二下数学:成对数据的统计分析

参考答案与试题解析

一.选择题(共8小题)

I.(2021秋•兴庆区校级期末)设两个变量X与V之间具有线性相关关系,相关系数为r,

回归方程为y=α+6x,那么必有()

A.6与r符号相同B.。与r符号相同

C.6与厂符号相反D.。与r符号相反

【考点】变量间的相关关系.

【专题】概率与统计.

【分析】根据相关系数知相关系数的性质:∣r∣≤L且Irl越接近1,相关程度越大;且Irl

越接近0,相关程度越小.尸为正,表示正相关,回归直线方程上升.

【解答】解:Y相关系数厂为正,表示正相关,回归直线方程上升,

r为负,表示负相关,回归直线方程下降,

;方与r的符号相同.

故选:A.

【点评】本题考查用相关系数来衡量两个变量之间相关关系的方法,当相关系数为正时,

表示两个变量正相关.

2.(2021春•兰州期中)对两个变量"口x进行回归分析,则下列说法中不正确的是()

AAΛ

A.由样本数据得到的回归方程y=bχ+a必过样本点的中心(彳,飞

B.残差平方和越小的模型,拟合的效果越好

C.用相关指数改来刻画回归效果,产的值越小,说明模型的拟合效果越好

D.回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法

【考点】线性回归方程.

【专题】转化思想;定义法;概率与统计;逻辑推理.

【分析】利用回归分析的相关知识,对四个选项逐一分析判断即可.

*ΛA

【解答】解:对于4由样本数据得到的回归方程y=bx+a必过样本点的中心7),

故选项力正确;

第7页(共21页)

对于8,残差平方和越小的模型,拟合的效果越好,故选项8正确;

对于C,用相关指数乃来刻画回归效果,好的值越大,说明模型的拟合效果越好,故选

项C错误;

对于。,回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,故选项

。正确.

故选:C.

【点评】本题考查了回归分析的理解与应用,回归方程的理解与应用,残差平方和、相

关指数尺2的含义,考查了逻辑推理能力,属于基础题.

3.(2021春•昌吉州期中)已知某种商品的广告费支出X(单位:万元)与销售额V(单位:

万元)之间有如下对应数据:

X24568

y3040506070

根据上表可得回归方程y=br+a,计算得b=7,则当投入12万元广告费时,销售额的预

报值为()

A.75万元B.85万元C.99万元D.105万元

【考点】线性回归方程.

【专题】方程思想;定义法;概率与统计;逻辑推理;数学运算.

【分析】先求出样本中心,利用样本中心在回归方程上,求出&,从而得到回归方程,将

X=12代入求解即可.

【解答】解:由题意可得,7=2+4+5+6+8=5,^=30+40+50+60+70=50,

55

ΛΛ

因为样本中心(5,50)在回归方程y=7x+a上,

则50=7X5+。,解得α=15,

ΛcL

所以回归方程为y=7x+15,

当x=12时,y=7X12+15=99,

所以当投入12万元广告费时,销售额的预报值为99万元.

故选:C.

【点评】本题考查了线性回归方程的求解与应用,要掌握线性回归方程必过样本中心这

第8页(共21页)

一知识点,考查了逻辑推理能力与运算能力,属于中档题.

4.(2021春•河西区期中)如表是2X2列联表,则表中的a、6的值分别为()

ʃiy合计

Xla835

X113445

合计b4280

A.27、38B.28、38C.27、37D.28、37

【考点】独立性检验.

【专题】方程思想;数学模型法;概率与统计;数学运算.

【分析】由列联表中数据的关系求得.

【解答】解:a=35-8=27,6=^+11=27+11=38.

故选:A.

【点评】本题考查了列联表的做法,属于基础题.

5.(2021春•运城期中)某学校食堂对高三学生偏爱蔬菜还是肉类与性别的关系进行了一次

调查,根据独立性检验原理,处理所得数据之后发现,有97.5%的把握但没有99%的把

握认为偏爱蔬菜还是肉类与性别有关,则群的观测值可能为()

P(ΛT2≥⅛O)0.100.050.0250.0100.0050.001

k2.7063.8415.0246.6357.87910.828

A.蜉=3.206B.=6.625C.A2=7.869D.AT2=I1.208

【考点】独立性检验.

【专题】转化思想:转化法;概率与统计;数学运算.

【分析】根据已知条件,结合独立性检验公式,即可求解.

【解答】解:Y有97.5%的把握但没有99%的把握认为偏爱蔬菜还是肉类与性别有关,

Λ5.024≤ΛT2<6.635,故8选项符合题意.

故选:B.

【点评】本题主要考查独立性检验的应用,属于基础题.

6.(2021春•道里区校级期中)在一组样本数据(Xl,yι),(X2,”),…,(xπ>y∣1),(n≥2,

Xi,X2>X"不相等)的散点图中,若所有样本点(Xi,勿)(i—l,2,-,n)都在直

第9页(共21页)

线y=-^χ+砧,则这组样本数据的样本相关系数为()

A.-1B.ɪC.」D.1

22

【考点】相关系数.

【专题】对应思想;定义法;概率与统计;数据分析.

【分析】根据题意知这组样本数据完全负相关,其相关系数为-L

【解答】解:因为所有样本数据点(X”,如)都在直线y=-^χ+韭,

所以这组样本数据完全负相关,其相关系数为-1.

故选:A.

【点评】本题考查了相关系数的定义与应用问题,是基础题.

7.(2021•淄博三模)某个国家某种病毒传播的中期,感染人数y和时间X(单位:天)在

18天里的散点图如图所示,下面四个回归方程类型中最适宜作为感染人数y和时间X的

回归方程的是()

1200000[感染人数

1000000-)

800000-/

600000-/

400000-

200000-

0O5101520

天数

A.y—a+bxB.y-a+bexC.y—a+blnxD.y=a+b^/x

【考点】线性回归方程.

【专题】数形结合;分析法;概率与统计;直观想象.

【分析】由图象结合四个选项中函数的单调性即可得结论.

【解答】解:由图可知,图象随着X的增大而增高,且增长速度越来越快,

结合选项,可判断y=α+b∕最适宜作为感染人数y和时间X的回归方程.

故选:B.

【点评】本题考查回归方程的求法,考查数形结合思想,是基础题.

8.(2021春•武汉期中)对于一组具有线性相关关系的样本数据(x,∙,(i=l,2,…,〃),

aʌʌ

其样本中心为Q,7),回归方程为y=bχ+a,则相应于样本点(X的残差为()

第10页(共21页)

cd

∙yi-(bxi+a)∙(bxi+a)-yi

【考点】线性回归方程.

【专题】对应思想;定义法;概率与统计;数学运算.

【分析】根据残差的定义与计算方法,即可得解.

【解答】解:因为残差是实际观察值与估计值(拟合值)之间的差,

所以样本点(为,ħ)的残差为芹-(iɔɪi+a).

故选:C.

【点评】本题考查残差的定义与计算方法,属于基础题.

二.填空题(共4小题)

9.(2021春•昌吉州期中)甲、乙、丙、丁四位同学各自对48两个变量的线性相关性做

试验,并用回归分析方法分别求得相关系数『与残差平方和加,如表:

甲乙丙T

r0.820.780.690.85

m106115124103

则同学的试验结果体现48两变量有更强的线性相关性.

【考点】变量间的相关关系.

【专题】计算题;对应思想;定义法;概率与统计;数学运算.

【分析】】根据相关系数的绝对值越接近于1,相关性越强,且残差平方和越小,相关性

也越强,判断即可.

【解答】解:在验证两个变量之间的线性相关关系中,

相关系数的绝对值越接近于I,相关性越强,且残差平方和越小,相关性越强,

在表中只有丁的相关系数最大,丁的残差平方和最小,

丁中试验结果体现x、V两变量有更强的线性相关性.

故答案为:丁.

【点评】本题考查了两个变量的线性相关性判断问题,是基础题.

10.(2021春•玉林期中)为了对X,V两个变量进行统计分析,现根据两种线性模型分别计

第11页(共21页)

算出甲模型的相关指数为R]2=0.910,乙模型的相关指数为R22=0.901,则甲(填

“甲”或“乙”)模型拟合的效果更好.

【考点】相关系数.

【专题】转化思想;转化法;概率与统计;数学运算.

【分析】根据已知条件,结合相关系数的性质,即可求解.

【解答】解:∙∙∙R[2=O.9IO>哈0.9Or

又∙.∙相关系数的绝对值越接近1,表明拟合效果越好,

...甲模型拟合的效果更好.

故答案为:甲.

【点评】本题主要考查相关系数的性质,属于基础题.

11.(2021春•沈阳期中)某医疗研究所为了检验某种血清预防感冒的作用,把500名使用

血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设为:“这种血

清不能起到预防感冒的作用”,利用2X2列联表计算得好比3.918,经查对临界值表知P

(蜉23.841)≈0.05.则下列结论中,正确结论的序号是①.

①在犯错误的概率不超过5%的前提个认为“这种血清能起到预防感冒的作用”;

②若某人未使用该血清,则他在一年中有95%的可能性得感冒:

③这种血清预防感冒的有效率为95%;

④有95%的把握认为这种血清不能起到预防感冒的作用.

【考点】独立性检验.

【专题】对应思想:数学模型法;概率与统计;数据分析.

【分析】根据题意,利用观测值与临界值的关系,判断选项中的命题是否正确即可.

【解答】解:计算群仁3.918,由尸(K2,3.841)≈0.05:

对于①,在犯错误的概率不超过5%的前提个认为“这种血清能起到预防感冒的作用”,

①正确:

对于②,若某人未使用该血清,不能说“他在一年中有95%的可能性得感冒”,②错误;

对于③,这种血清有95%的可能性预防感冒,不是有效率为95%,③错误;

对于④,有95%的把握认为这种血清能起到预防感冒的作用,所以④错误.

故答案为:①.

【点评】本题考查了独立性检验的应用问题,也考查了分析与判断能力,是基础题.

第12页(共21页)

12.(2020春•正定县校级月考)下列说法:①分类变量N与8的随机变量烂越大,说明

’7与8有关系”的可信度越大,②以模型y=cefa去拟合一组数据时,为了求出回归方

程,设z=g,将其变换后得到线性方程z=0.3x+4,则c,A的值分别是d和0.3,③在

残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高,④若变量X

和ʃ满足关系V=-0.1x+l,且变量V与Z正相关,则X与Z也正相关,正确的个数是3.

【考点】变量间的相关关系.

【专题】对应思想;数学模型法;概率与统计;数据分析.

【分析】①中,根据独立性原理判断①正确;

②中,根据回归模型和对数的运算性质,得出②正确;

③中,利用残差图的知识,判断③正确;

④中,由线性回归方程判断变量X和y负相关,由变量N与Z正相关,得X与Z是负相

关.

【解答】解:对于①,根据独立性原理知,分类变量N与3的随机变量片越大,说明

uA与B有关系”的可信度越大,①正确:

对于②,根据回归模型和对数的运算性质知,以模型V=Cek去拟合一组数据时,为了求

出回归方程,

设Z=My,将其变换后得到线性方程z=0.3x+4,则c,左的值分别是和0.3,所以②正

确;

对于③,利用残差分析模型拟合效果时,在残差图中,残差点分布的带状区域的宽度越

狭窄,

其模型拟合的精度越高,所以③正确;

对于④,若变量X和y满足关系y=-0.1x+l,且变量y与Z正相关,则X与Z是负相关,

所以④错误.

综上知,正确命题的序号是①②③,共3个.

故答案为:3.

【点评】本题考查了独立性检验原理和线性回归分析与残差图的应用问题,也考查了分

析问题的能力,是基础题.

≡.解答题(共4小题)

13.(2022•盐城一模)佩戴头盔是一项对家庭与社会负责的表现,某市对此不断进行安全教

第13页(共21页)

育.如表1是该市某主干路口连续4年监控设备抓拍到的驾驶员不戴头盔的统计数据:

表1:

年度2018201920202021

年度序号X1234

不戴头盔人数N125010501000900

(1)请利用所给数据求不戴头盔人数y与年度序号X之间的回归直线方程9=fcjr+软,并

估算该路口2022年不戴头盔的人数;

(2)交警统计2018~2021年通过该路口的开电瓶车出事故的50人,分析不戴头盔行为

与事故是否伤亡的关系,得到表2,能否有95%的把握认为不戴头盔行为与事故伤亡有

关?

表2:

不戴头盔戴头盔

伤亡73

不伤亡1327

nn__

ΣXiyG-nχyΣ(χ-χ)(y∙-y)

iA

ai=l___i_=_l__________________a———

参考公式:,

「n-n_a=y-bχ∙

EXj-nxE(Xi-X)2

i=li=l

P(片2£0.100.050.0250.0100.005

k2.7063.8415.0246.6357.879

2

K=---------n(ad-be)----------,其中n=a+^c+c(φ

(a+b)(c+d)(a+c)(b+d)

【考点】线性回归方程;独立性检验.

【专题】转化思想;转化法;概率与统计:数学运算.

【分析】(1)根据已知条件,结合最小二乘法和线性回归方程的公式,即可求解.

(2)根据已知条件,结合独立性检验公式,即可求解.

【解答】解:(1)由表中数据可得,~=1+2ζ3+4ʌr=1250+1050+1000+900=]050,

第14页(共21页)

4__

^EXiyi-4x∙y1250+2100+3000+3600-4×⅜×1050

ι=l____________________________________2

22

∑χ2-4χl+4+9+16-4×φ

i=l

I=y-bx=1050+HO×-∣=1325'

故回归直线方程为y=T10x+1325∙

2022年,即X=5,y=-no×5+1325=775

(2)2×2列联表如下:

不戴头盔戴头盔合计

伤亡7310

不伤亡132740

合计203050

∙.M=虹SL经Q=4.6875>3.841,

10×40×20×30

.∙.有95%的把握认为不戴头盔行为与事故伤亡有关.

【点评】本题主要考查了线性回归方程的求解,需要学生熟练掌握最小二乘法公式,属

于基础题.

14.(2020•新课标In)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天

到某公园锻炼的人次,整理数据得到下表(单位:天):

锻炼人次[0,200](200,400](400,600]

空气质量等级

1(优)21625

2(良)51012

3(轻度污染)678

4(中度污染)720

(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;

(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值

为代表);

第15页(共21页)

(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级

为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2义2列联表,并根据

列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量

有关?

人次W400人次>400

空气质量好

空气质量不好

附:E=________n(ad-bc),________

(a+b)(c+d)(a+c)(b+d)

P(X2≥λ)0.0500.0100.001

k3.8416.63510.828

【考点】独立性检验;古典概型及其概率计算公式.

【专题】计算题:定义法;概率与统计;数学建模;数学运算.

【分析】(1)用频率估计概率,从而得到估计该市一天的空气质量等级为1,2,3,4的

概率;

(2)采用频率分布直方图估计样本平均值的方法可得答案;

(3)由公式长2=7淤一「计算人的值,从而查表即可,

(a+b)J(Ic+kd)(a+c)(b+d)

【解答】解:(1)该市一天的空气质量等级为1的概率为:2+16+25=旦

IOO100

该市一天的空气质量等级为2的概率为:5+10+12=ɪ:

100100

该市一天的空气质量等级为3的概率为:

100100

该市一天的空气质量等级为4的概率为:Zi2+0_=_9_;

100100

(2)由题意可得:一天中到该公园锻炼的平均人次的估计值为:

X=-1..-χ[100×(2+5+6+7)+300X(16+10+7+2)+50OX(25+12+8+0)]=350,

100

(3)根据所给数据,可得下面的2X2列联表,

人次W400人次>400总计

空气质量好333770

空气质量不好22830

第16页(共21页)

总计5545100

由表中数据可得∙K2=n(ad-bc)2=IoOX(33X8-37X22)2心

(a+b)(c+d)(a+c)(b+d)70×30×55×45

5.820>3.841,

所以有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.

【点评】本题考查了独立性检验与频率估计概率,估计平均值的求法,属于中档题.

15.(2021•兴宁区校级模拟)中国茶文化博大精深,已知茶水的口感与茶叶类型以及水温有

关.经验表明,某种绿茶用85℃的水泡制,再等到茶水温度降至60℃时饮用,可以产生

最佳口感.某学习研究小组通过测量,得到了下面表格中的数据(室温是20℃).

泡制时间xlmin01234

水温y/℃8579747165

In(y-20)4.24.14.03.93.8

(1)小组成员根据上面表格中的数据绘制散点图,并根据散点图分布情况,考虑到茶水

温度降到室温(即20°C)就不能再降的事实,决定选择函数模型y=A"+20(x20)来刻

画.

①令z=/〃(y-20),求出Z关于X的线性回归方程;

②利用①的结论,求出y=h*+20(x>0,c>0)中的人与c.

(2)你认为该品种绿茶用85℃的水大约泡制多久后饮用,可以产生最佳口感?

o142

参考数据:logp.6=4∙8,e~∙≈O.9,e∙≈66.7,缪00.6∙

u∙y667

n

∑(x-χ)(z-z)

AAAAɪɪ4ɪ4A4

,=zx,

参考公式:z-∣5v+a>n_a^b

2

∑(χi-x)

i=l

【考点】线性回归方程.

【专题】转化思想;转化法;概率与统计;数学运算.

【分析】(1)①根据已知条件,结合最小二乘法和线性回归方程的公式,即可求解.

②由y=hA+20(X20),得y-20=hr"(XeO),两边取对数得,/〃(y-20)-lnk+xlnc,

利用①的结论得:/"C=-0.1,Ink=4.2,即可求解.

(2)由⑴得,y=66.7×0.9∙v+20(x≥0),令y=60,解出x,即可求解.

【解答】解:(1)①由已知得出X与Z的关系,如下表:

第17页(共21页)

泡制时间X/ιnin01234

z4.24.14.03.93.8

设线性回归方程z=bx+a,由题意得χ=0+1+^+3+4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论