成对数据的统计分析-2025年高考数学一轮复习(解析版)_第1页
成对数据的统计分析-2025年高考数学一轮复习(解析版)_第2页
成对数据的统计分析-2025年高考数学一轮复习(解析版)_第3页
成对数据的统计分析-2025年高考数学一轮复习(解析版)_第4页
成对数据的统计分析-2025年高考数学一轮复习(解析版)_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3课时成对数据的统计分析

[考试要求]1.了解样本相关系数的统计含义2理解一元线性回归模型和2X2

列联表,会运用这些方法解决简单的实际问题.3.会利用统计知识进行数据分析.

[链接教材•夯基固本】落实主干•激活技能

€>梳理•必备知识

1.变量的相关关系

两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,

这种关系称为相关关系,即不确定性关系.

2.相关关系的分类

(1)按变量间的增减性分为正相关和负相关.

①正相关:当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势;

②负相关:当一个变量的值增加时,另一个变量的相应值呈现遮小的趋势.

(2)按变量间是否有线性特征分为线性相关和韭线性相关(曲线相关).

①线性相关:如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线

附近,我们称这两个变量线性相关;

②非线性相关或曲线相关:如果两个变量具有相关性,但不是线性相关,我们称

这两个变量非线性相关或曲线相关.

3.相关关系的刻画

⑴散点图:成对样本数据都可用直角坐标系中的点表示出来,由这些点组成的

统计图,叫做散点图.

(2)样本相关系数r的计算式

n——n__

一目专一x)(兀7)_孑,一九"

居…),用5-万否j才国:一疗

(3)样本相关系数r的性质

①样本相关系数r的取值范围为[—1,1];

②若时,成对样本数据正相关;

③若r<0时,成对样本数据负相关;

④样本相关系数与相关程度

当M越接近L时,成对样本数据的线性相关程度越强;

当闭越接近。时,成对样本数据的线性相关程度越弱.

提醒:当两个变量的相关系数川=1时,两个变量呈函数关系.

4.一元线性回归模型与最小二乘法

(1)一元线性回归模型

=hy+(1+p

—',为y关于x的一元线性回归模型.其中,y称为因变量

E(e)=0,Z9(e)=o-2

或响应变量,x称为自变量或解释变量,且称为截距参数,上称为斜率参数;e是

y与如土&之间的随机误差,如果e=。,那么y与x之间的关系就可以用一元线

性函数模型来描述.

(2)最小二乘法

将夕=放十&称为y关于x的经验回归方程,也称经验回归函数或经验回归公式,

其图形称为经验回归直线,这种求经验回归方程的方法叫做最小二乘法,求得的

b,金叫做6,。的最小二乘估计,其中

n——

沁7(力7)_

b=--------------z----,a=y-b元.

E(X.-x)2

i=i1

5.刻画回归效果的方式

⑴残差图法

在残差图中,残差点比较均匀地落在以横轴为对称轴的水平的带状区域中,说明

选用的模型比较合适,这样的带状区域的宽度越室,说明模型拟合精度越高.

(2)残差平方和法

残差平方和为残差平方和越小,模型拟合效果越好.

(3)决定系数法

£(y•-土)2

R2=l—1:':(I.笈的值越趋近于1,模型的拟合效果越好.

£()2、彳•

i=11

6.列联表与独立性检验

(1)分类变量X,y的2X2列联表:

XY合计

y=oY=1

x=oaba+b

X=1cdc~\~d

合计a+cb~\~dn=a~\~b~\~c~\~d

㈣/—213*)2

、/(a+b)(c+d)(十+c)(b+d)・

(2)利用/2的取值推断分类变量X和y是否独立的方法称为12独立性检验,读作

“卡方独立性检验”,简称独立性检验.

(3)%2独立性检验中几个常用的小概率值和相应的临界值.

a0.10.050.010.0050.001

2.7063.8416.6357.87910.828

Xa

[常用结论]

经验回归方程必过样本点的中心(幻刃.

©激活•基本技能

一、易错易混辨析(正确的打“,错误的打“X”)

(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.

()

(2)样本相关系数的绝对值越接近1,成对样本数据的线性相关程度越强.()

(3)若事件X,y关系越密切,则由观测数据计算得到的42的观测值越小.()

(4)经验回归方程5>=标+。中,若2<0,则变量X和y负相关.()

[答案](1)V(2)V(3)x(4)X

二、教材经典衍生

1.(人教A版选择性必修第三册Pio3习题8.1「改编)下列四个散点图中,变量x

与y之间具有负的线性相关关系的是()

0X0

AB

n

o,%6!%

CD

D[观察散点图可知,只有D选项的散点图表示的是变量x与y之间具有负的

线性相关关系.]

2.(人教A版选择性必修第三册P103练习T3改编)在一次试验中,测得(x,月的

四组值分别为(1,2),(2,0),(4,—4),(―1,6),则.V与x的相关系数为()

11

A.-B.-1C.0D.--

22

B测得(x,刃的四组值分别为(1,2),(2,0),(4,-4),(-1,6),...兄=1.5,y

444

=1,\=—20,样本相关系数

.-1

-20-4x1.5x11

7=I=-L

(22—4x1.52)(56—4x12)

故选B.]

3.(人教A版选择性必修第三册Pii3练习T2改编)从某学校随机选取8名女大学

生,关于其身高x(单位:cm)和体重y(单位:kg)的经验回归方程为夕=0.849x—

85.712,则身高172cm的女大学生的体重约为kg.

60.316[当x=172时,9=0.849X172—85.712=60.316.]

4.(人教A版选择性必修第三册P133例4改编)为了调查患肺癌是否与吸烟有关,

调查了100名50岁以下的人,调查结果如下表:

肺癌

吸烟合计

肺癌患者非肺癌患者

吸烟者20m40

不吸烟者n5560

合计2575100

根据列联表数据,求得42=(保留3位有效数字),那么,在犯错误的概

率不超过0.001的前提下认为患肺癌与吸烟有关.

n(ad-bc)2

(a+b)(c+d)(a+c)(b+d)

a0.0500.0100.001

Xa3.8416.63510.828

22.2[由20+掰=40,得机=20.

由20+〃=25,得“=5.

100x(20x55—20x5)2

仁22.2>10.828=xo.ooi.

40x60x25x75

所以在犯错误的概率不超过0.001的前提下认为患肺癌与吸烟有关.]

[典例精研•核心考点]重难解惑•直击高考

口考点一成对数据的相关性

[典例1](1)(2023•天津高考)调查某种群花萼长度和花瓣长度,所得数据如图

所示.其中相关系数r=0.8245,下列说法正确的是()

A.花瓣长度和花萼长度没有相关性

B.花瓣长度和花萼长度呈现负相关

C.花瓣长度和花萼长度呈现正相关

D.若从样本中抽取一部分,则这部分的相关系数一定是0.8245

(2)(多选)(2023•广东湛江一模)某服装生产商为了解青少年的身高和体重的关系,

在15岁的男生中随机抽测了10人的身高和体重,数据如下表所示:

编号12345678910

身高

165168170172173174175177179182

/cm

体重

55896165677075757880

/kg

由表中数据制作成如下所示的散点图:

由最小二乘法计算得到经验回归直线/i的方程为5>=»x+&i,相关系数为ri,决

定系数为珞;经过残差分析确定(168,89)为离群点(对应残差过大),把它去掉后,

再用剩下的9组数据计算得到经验回归直线h的方程为y=石2%+&2,相关系数为

2决定系数为膨•则以下结论中正确的有()

A.a\>a2B.bi>b2

C.ri<F2D.R〉膨

(1)C(2)AC[(1):相关系数r=0.8245,且散点图呈左下角到右上角的带状分

布,...花瓣长度和花萼长度呈正相关.若从样本中抽取一部分,则这部分的相关

系数不一定是0.8245,故选C.

165+168+170+172+173+174+175+177+179+182

⑵身高的平均数为=173.5,因为离群点

10

(168,89)的横坐标168小于平均值173.5,纵坐标89相对过大,所以去掉离群

点后经验回归直线的截距变小而斜率变大,所以缶>金2,bi<b2,所以A正确,

B错误;去掉离群点后成对样本数据的线性相关程度更强,拟合效果会更好,所

以71〈72,册〈膨,所以C正确,D错误.故选AC.]

名师点评判定两个变量正、负相关的方法

(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上

角到右下角,两个变量负相关.

(2)相关系数:r>0时,正相关;r<0时,负相关.

(3)线性经验回归方程中:3>0时,正相关;时,负相关.

[跟进训练]

1.(1)在一组样本数据(xi,y\),(X2,y2)>,,,)(xn>%)(22,xi,xi,不全

相等)的散点图中,若所有样本点(电,jz)(z=L2,…,〃)都在直线尸一权+1上,

则这组样本数据的样本相关系数为()

A.-1B.0

c--D.1

・2

(2)已知一组成对数据(18,24),(13,34),(10,38),(-1,⑼的经验回归方程为

y=-2x+59.5,则该组数据的相关系数厂=.(精确到0.001).

(1)A(2)-0.998[(1)所有样本点均在同一条斜率为负数的直线上,则样本相关

系数最小,为一1.

(2)由条件可得,

_18+13+10-11八

X=-4—=]0,

24+344-38+m96+m

y=44

(X,刃一定过经验回归方程9=—2x+59.5,代入解得〃z=62,?=、¥=?

42

^xf=182+132+102+(-1)2=594,

^yf=242+342+382+622=7020,

4

Z%%-4%y

I=1J

T4

(2*-4x2)(-4y2)

i=1t=1

79

1192-4xl0x-y

(594-4xl00)x7020-4X

^-0.998.]

【教师备选资源】

1.(多选)对两组数据进行统计后得到的散点图如图所示,关于其线性相关系数

的结论正确的是()

y

16

12

8

4

012345012345%

线性相关系数n线性相关系数「2

A.n<0B.F2>1

C.n+r2>0D.\rr\>\r2\

AC[由散点图可知,线性相关系数n的图象表示y与x成负相关,故一1<心<0,

故A正确;线性相关系数F2的图象表示了与X正相关,故0<厂2<1,故B错误;

因为线性相关系数ri的点较线性相关系数n的点密集,<|r2|>kiI,故ri+r2>0,

故C正确,D错误.故选AC.]

2.如图是某地区2001年至2021年环境保护建设投资额(单位:万元)的折线图.

根据该折线图判断,下列结论正确的是()

A.为预测该地2024年的环境保护建设投资额,应用2001年至2021年的数据

建立回归模型更可靠

B.为预测该地2024年的环境保护建设投资额,应用2010年至2021年的数据

建立回归模型更可靠

C.投资额与年份负相关

D.投资额与年份的相关系数r<0

B[因为2009年之前与2010年之后投资额变化较大,故为预测该地2024年的

环境保护建设投资额,应用2010年至2021年的数据建立回归模型更可靠,所以

A错误,B正确;

随年份的增长,投资额总体上在增长,所以投资额与年份正相关,尸>0,故CD

错误.故选B.]

3.如图是相关变量的散点图,现对这两个变量进行线性相关分析,方案一:

根据图中所有数据,得到经验回归方程5>=务述+缶,样本相关系数为广;方案二:

剔除点(10,21),根据剩下的数据得到经验回归方程5>=谷2%+力,样本相关系数

为2贝女)

,24.211

1•21

;6-3

Wro~~15*20X

A.0<n<F2<lB.0<F2<ri<l

C.—l<n<F2<0D.—l<F2<ri<0

D[根据相关变量x,y的散点图知,变量x,y具有负线性相关关系,且点(10,

21)是离群值;

方案一中,没剔除离群值,线性相关性弱些;

方案二中,剔除离群值,线性相关性强些;

所以样本相关系数一l<F2<7"l<0.]

―考点二回归模型

考向1一元线性回归模型

[典例2](2023•河北唐山三模)据统计,某城市居民年收入(所有居民在一年内

收入的总和,单位:亿元)与某类商品销售额(单位:亿元)的10年数据如表所示:

第〃年12345678910

居民年收入X32.231.132.935.737.138.039.043.044.646.0

商品销售额了25.030.034.037.039.041.042.044.048.051.0

依据表格数据,得到下面一些统计量的值.

101010

10

10W(阳—沙)•Ot

EXi

i=li=li=l

i=li=l

-无尸-y)2-y)

379.6391246.904568.9m

(1)根据表中数据,得到样本相关系数厂q0.95.以此推断,y与x的线性相关程

度是否很强?

(2)根据统计量的值与样本相关系数r^0.95,建立y关于x的经验回归方程(系数

精确到0.01);

(3)根据(2)的经验回归方程,计算第1个样本点(32.2,25.0)对应的残差(精确到

0.01);并判断若剔除这个样本点再进行回归分析,石的值将变大还是变小(不必说

明理由,直接判断即可).

附:样本(Xi,j/)(z=1,2,…,〃)的相关系数r=

%)(%-父)£(々二)(%-亍)

-------——r-^-------——,V2.304心1.518,b=nz,a=y-bx.

/-«)2,£(%-丁)2Z(生-")2

VI=1Vt=1l=1

[解](1)根据样本相关系数厂Q0.95,可以推断线性相关程度很强.

£(%♦)(%-力

(2)由r=/e——=0.95及6=

22

£二心阳二厂监(%-分=厂分

=\/57304,

所以右=7隹西心0.95X1.518^1.44,

又因为元=37.96,y=39.1,

所以G=y一鼓七一15.56,

所以y与x的经验回归方程为y=1.44x—15.56.

(3)第一个样本点(32.2,25.0)的残差为:

25.0-(1.44X32.2-15.56)=-5.808^-5.81,

由于该点在回归直线的右下方,故将其剔除后,石的值将变大.

考向2非线性回归模型

[典例3](2023•广东广州二模)一企业生产某种产品,通过加大技术创新投入降

低了每件产品成本,为了调查年技术创新投入x(单位:千万元)对每件产品成本

了(单位:元)的影响,对近10年的年技术创新投入方和每件产品成本"《=1,2,

3,…,10)的数据进行分析,得到如图所示的散点图,并计算得:元=6.8,y=

每件产品成本/元

250-

200-*

150-•

100-•

5。;:•:一•\.

0~~6~~8101214~~"

年技术创新投入/千万元

(1)根据散点图可知,可用函数模型5>=:+a拟合了与X的关系,试建立了关于X

的经验回归方程;

(2)已知该产品的年销售额侬单位:千万元)与每件产品成本了(单位:元)的关系

为他=—意+祟+与+100•该企业的年投入成本除了年技术创新投入,还要

50025y-10

投入其他成本10千万元,根据(1)的结果回答:当年技术创新投入X为何值时,

年利润M的预报值最大?

(注:年利润=年销售额一年投入成本)

参考公式:对于一组数据(M1,%),(M2,⑸,…,(Un,乙),其经验回归方程力

n__

~nuV

=a+^u的斜率和截距的最小二乘估计公式分别为耳=十一—,a=v-pu.

Tu.-nu

i=i1

[解](1)令瓦=%则y关于M的经验回归方程为9=6=瓦/,

10_____

由题意可得行之;T°端六200,

Eu--lOw

i=i1

a=y-jgu=70-200X0.3=10,则^=10+200%

所以y关于x的经验回归方程为夕=10+1.

(2)由.v=10+一可得x=200

y—10'

年利润M=m—x—\0~W+幽+100—空一10=一^(y—20)2+90.8,

50025y-10y-10500V)'

当v=20时,年利润M取得最大值,

i_200200

此时nx=-----=------=20,

y-1020-10'

所以当年技术创新投入为20千万元时,年利润〃的预报值取最大值.

名师点评回归分析问题的类型及解题方法

(1)求经验回归方程

①根据散点图判断两变量是否线性相关,如不是,应通过换元构造线性相关.

②利用公式,求出回归系数R

③利用经验回归方程过样本点的中心求系数a.

(2)利用经验回归方程进行预测,把经验回归方程看作一次函数,求函数值.

(3)利用经验回归方程判断正、负相关,决定正相关还是负相关的是系数R

(4)经验回归方程的拟合效果,可以利用相关系数判断,当川越趋近于1时,两变

量的线性相关性越强.

提醒:非线性处理策略要通过换元、取对数等手段把非线性问题转化为线性问题.

[跟进训练]

2.某研究所为了研究某种昆虫的产卵数式单位:个)与温度x(单位:℃)之间的

关系,现将收集到的温度电和一组昆虫的产卵数了。=1,2,…,6)的6组观测

数据作了初步处理,得到如图的散点图及一些统计数据.

9O产卵数"个

8O

7O

6O

5O

4O

3O

2O

1O

O

101520253035温度小

666

经计算得到以下数据:〉=26,片》%=33,W3-元)(%-?)=557,

i=li=li=l

666

W®-/)2=84,W(%一?)2=3930,2(--%)2=236.64.

i=li=li=l

(1)若用线性回归模型来拟合数据的变化关系,求了关于X的经验回归方程》=取

十&(结果精确到0.1);

(2)若用非线性回归模型来拟合数据的变化关系,求得y关于x的经验回归方程?

=0.06e°-2303S且决定系数为火2=0.9672.

①试与(1)中的回归模型相比,用衣说明哪种模型的拟合效果更好;

②用拟合效果好的模型预测温度为35℃时该组昆虫的产卵数(结果四舍五入取

整数).

附参考公式:对于一组具有线性相关关系的数据(Xl,yi),(X2,J2),…,(xn,yn),

其经验回归方程?=放+2截距和斜率的最小二乘估计公式分别为:b=

2

E(专-尤)(匕->)八_i(y;-y;)

-―7,—,S=y-bx,相关系数:R2=i-t--------—•

£(%-%)E(y.-y)

t=1i=11

参考数据:e80605^3167.

6__

-2(%二%)(兀-y)„

[解](1)由题意可知5=J---------------=97心6.6,

I(x.-x)284

i=l1

一族=33—6.6X26=-138.6.

:.y关于x的经验回归方程是5>=6.6x—138.6.

(2)①用指数回归模型拟合y与x的关系,决定系数笈=0.9672,

6,

£(y•-y.)

线性回归模型拟合y与x的关系,决定系数笈=1—,-=1一能黑心0.939

8,且0.93984.9672,

/.用夕=0.06e°2303x比9=6.6x—138.6拟合效果更好.

②?=0.06e°-2303x中,令》=35,

贝母=0.06e°23°3X35=006e&0605%0.06X3167Pl90(个),

故预测温度为35℃时该组昆虫产卵数约为190个.

□考点三独立性检验

[典例4](2023•全国甲卷改编)一项试验旨在研究臭氧效应,试验方案如下:选

40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试

验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时

间后统计每只小白鼠体重的增加量(单位:g).试验结果如下:

对照组的小白鼠体重的增加量从小到大排序为

15.218.820.221.322.523.225.826.527.530.1

32.634.334.835.635.635.836.237.340.543.2

试验组的小白鼠体重的增加量从小到大排序为

7.89.211.412.413.215.516.518.018.819.2

19.820.221.622.823.623.925.128.232.336.5

(1)计算试验组的样本平均数;

(2)①求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不

小于机的数据的个数,完成如下列联表;

小白鼠体重的增加量

组别合计

<m2加

对照组

试验组

合计

②根据①中的列联表,依据小概率值a=0.05的独立性检验,能否以此推断小白

鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?

2

叫2一n(ad—bc')

附:X—(a+b)(c+d)(a+c)(b+d),

a0.1000.0500.010

Xa2.7063.8416.635

[解](1)根据题意,计算试验组样本平均数为

1

x=^X(7.8+9.2+11.4+12.4+13.2+15.5+16.5+18.0+18.8+19.2+19.8+

20.2+21.6+22.8+23.6+23.9+25.1+28.2+32.3+36.5)=19.8.

(2)①由题意知,这40只小白鼠体重的增加量的中位数是将两组数据合在一起,

从小到大排列后第20位与第21位数据的平均数,

因为第20位数据为23.2,第21位数据为23.6,

所以这组数据的中位数是机(23.2+23.6)=23.4.

填写列联表如下:

小白鼠体重的增加量

组别合计

<m2加

对照组61420

试验组14620

合计202040

②零假设为印:小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量无差

异.

根据列联表中数据,得片=*黑/=6.4>3.841=xo.o5,

所以依据小概率值a=0.05的独立性检验,可以认为小白鼠在高浓度臭氧环境中

与在正常环境中体重的增加量有差异.

名师点评独立性检验的一般步骤

(1)根据样本数据完成2X2列联表.

n(ad-bc)2

(2)根据公式42=计算.

(a+b)(a+c)(b+d)(c+d)

(3)比较%2与临界值的大小关系,作统计推断.

[跟进训练]

3.(2020•新高考I卷改编)为加强环境保护,治理空气污染,环境监测部门对

某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:

|ig/m3),得下表:

SO2浓度

PM2.5浓度

[0,50](50,150](150,475]

[0,35]32184

(35,75]6812

(75,115]3710

(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”

的概率;

(2)根据所给数据,完成下面的2X2列联表:

SO2浓度

PM2.5浓度

[0,150](150,475]

[0,75]

(75,115]

(3)根据(2)中的列联表,依据小概率值a=0.01的独立性检验,能否推断该市一天

空气中PM2.5浓度与SO2浓度有关?

n(ad-bc')2

(a+b)(c+d)(a+c)(b+d)'

a0.0500.0100.001

Xa3.8416.63510.828

[解]⑴根据抽查数据,该市100天空气中的PM2.5浓度不超过75,且SO2浓

度不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度

不超过75,且S02浓度不超过150的概率的估计值为急=0.64.

(2)根据抽查数据,可得2X2列联表:

SO2浓度

PM2.5浓度

[0,150](150,475]

[0,75]6416

(75,115]1010

⑶零假设为"):该市一天空气中PM2.5浓度与SO2浓度无关,则42=

100x(64x10-16x10)2〜=

/.T-OT-.

80x20x74x26

由于7.484>6.635=xo.oi,所以依据小概率值a=0.01的独立性检验,我们推断为

不成立,即认为该市一天空气中PM2.5浓度与SO2浓度有关.

课时分层作业(七H-)成对数据的统计分析

[A组在基础中考查学科功底]

一、单项选择题

1.根据分类变量X与y的成对样本数据,计算得到%2=6.147.依据a=0.01的

独立性检验(软.01=6.635),结论为()

A.变量x与y不独立

B.变量x与了不独立,这个结论犯错误的概率不超过0.01

C.变量x与了独立

D.变量x与了独立,这个结论犯错误的概率不超过0.01

C[按照独立性检验的知识及比对的参数值,当/2=6.147,我们可以下结论变量

x与y独立.故排除选项A,B;依据a=0.01的独立性检验(xo.oi=6.635),

6.147<6.635,所以我们不能得到“变量x与y独立,这个结论犯错误的概率不超

过0.01”这个结论.故C正确,D错误.故选C.]

2.(2024•浙江湖州模拟)研究变量x,y得到一组样本数据,进行回归分析,以

下说法中错误的是()

A.若变量x和y之间的相关系数为r=—0.992,则变量x和了之间的负相关很

B.用决定系数火2来比较两个模型拟合效果,火2越大,表示残差平方和越小,即

模型的拟合效果越好

C.在经验回归方程5>=—2x+0.8中,当解释变量X每增加1个单位时,响应变

量夕平均减少2个单位

D.经验回归直线9=标+6至少经过点(XI,Jl),(X2,J2),…,(X”,%)中的一个

D[若变量x和y之间的相关系数为r=—0.992,则变量x和y之间的负相关很

强,A正确;

用决定系数R2来比较两个模型拟合效果,R2越大,表示残差平方和越小,即模

型的拟合效果越好,B正确;在经验回归方程?=一2》+0.8中,当解释变量x每

增加1个单位时,响应变量?平均减少2个单位,C正确;经验回归直线y=标

+G必过(幻y),但不一定过样本点,D错误.故选D.]

3.已知变量x和y满足关系y=-0.1x+l,变量y与2正相关.下列结论中正确

的是()

A.X与了正相关,X与2负相关

B.x与y正相关,x与z正相关

C.x与y负相关,x与2负相关

D.x与了负相关,x与2正相关

C[因为夕=—0.1x+l的斜率小于0,故x与y负相关.因为y与z正相关,可

设2=gv+4,b>0,贝吃=加+2=—0.1石X+B+G,故x与z负相关.故选C.]

4.(2023•广东梅州二模)云计算是信息技术发展的集中体现,近年来,我国云

计算市场规模持续增长.已知某科技公司2018年至2022年云计算市场规模数据,

且市场规模j与年份代码x的关系可以用模型y=ciec2%(其中e为自然对数的底

数)拟合,设z=lny,得到数据统计表如下:

年份2018年2019年2020年2021年2022年

年份代码X12345

云计算市场规

7.4112036.666.7

模w千万元

z=lny22.433.64

由上表可得经验回归方程2=0.52x+6,则2025年该科技公司云计算市场规模》

的估计值为()

A.e5-08B.e5-6

C.e6-12D.e6-5

B[因为无=3,z=3,

所以6=2—0.52元=3—3X052=1.44,

即经验回归方程2=0.52%+1.44,

当x=8时,2=0.52X8+1.44=5.6,

所以y=e,=e5-6,即2025年该科技公司云计算市场规模y的估计值为e5-6.

故选B.]

5.(2023•河北衡水一模)某新能源汽车生产公司,为了研究某生产环节中两个

变量x,y之间的相关关系,统计样本数据得到如下表格:

X2023252730

22.4334.6

由表格中的数据可以得到.V与x的经验回归方程为?=5+%据此计算,下列选

项中残差的绝对值最小的样本数据是()

A.(30,4.6)B.(27,3)

C.(25,3)D.(23,2.4)

20+23+25+27+30_2+2.44-3+34-4.6。

C[由表格数据知:x=-------------------=2o5,y=------------------=3,

11Q

/.经验回归方程为一f

对于A,残差的绝对值为卜.6—(:X30=0.35;

对于B,残差的绝对值为13-GX27-?)|=0.5;

对于C,残差的绝对值为13-Qx25-^)|=0;

对于D,残差的绝对值为12.4-Qx23-=0.1;

.•.残差绝对值最小的样本数据是(25,3).故选C.]

6.(2023•山东荷泽二模)足球是一项大众喜爱的运动,为了解喜爱足球是否与

性别有关,随机抽取了若干人进行调查,抽取女性人数是男性的2倍,男性喜爱

足球的人数占男性人数的之女性喜爱足球的人数占女性人数的;,若本次调查得

出“在犯错误的概率不超过0.005的前提下认为喜爱足球与性别有关”的结论,

则被调查的男性至少有()

a0.100.050.010.0050.001

Xa2.7063.8416.6357.87910.828

A.10人B.11人

C.12人D.13人

C[设被调查的男性为x人,则女性为2x人,依据题意可得列联表如下表:

性别

足球合计

男性女性

5%2%3%

喜爱足球

~6TT

X4%3%

不喜爱足球

6~3~T

合计X2x3x

/2=半手亘因为本次调查得出“在犯错误的概率不超过0.005的前

•x•2x3

提下认为喜爱足球与性别有关”的结论,所以有力2三7.879,即(三7.879,

解得xNll.8185,又因为上述列联表中的所有数字均为整数,故x的最小值为

12.故选C.]

二'多项选择题

7.(2023•湖南长沙一模)自然环境中,大气压受到各种因素的影响,如温度、

湿度、风速和海拔等方面的改变,都将导致大气压发生相应的变化,其中以海拔

的影响最为显著.如图是根据一组观测数据得到海拔6~15km的大气压强散点

图,根据一元线性回归模型得到经验回归方程为%=—4G+68.5,决定系数为闿

=0.99;根据非线性回归模型得到经验回归方程为免=132.9e-o」63x,决定系数为明

=0.99,则下列说法正确的是()

A.由经验回归散点图可知,大气压强与海拔高度负相关

B.由经验回归方程%=—4.0x+68.5可知,海拔每升高1km,大气压强必定降

低4.0kPa

C.由经验回归方程%=—4.0x+68.5可知,样本点(11,22.6)的残差为一1.9

D.对比两个回归模型,结合实际情况,经验回归方程92=132.96-。」63工的预报效

果更好

ACD[由图象知,海拔高度越高,大气压强越低,所以大气压强与海拔高度负

相关,A正确;

由经验回归直线得到的数据为估计值,而非精确值,B错误;

当x=ll时,yi=-4.0X11+68.5=24.5,又由散点图知观测值为22.6,所以样

本点(11,22.6)的残差为22.6—24.5=-1.9,C正确;

随着海拔高度的增加,大气压强越来越小,但不可能为负数,因此经验回归方程

y2=132.9e-°J63x的预报效果更好,D正确.故选ACD.]

8.(2024•江苏泰州开学考试)“天宫课堂”是为发挥中国空间站的综合效益,

推出的首个太空科普教育品牌.为了解学生对“天宫课堂”的喜爱程度,某学校

从全校学生中随机抽取200名学生进行问卷调查,得到以下数据,则()

天宫课堂

性别

喜欢天宫课堂不喜欢天宫课堂

男生8020

女生7030

参考公式及数据:

02_n(ad—bc)2

=

X(a+力)(c+d)(a+c)(力+d)'na~\~b~\~c~\~d.

②当a=0.05时,xft=3.841.

A.从这200名学生中任选1人,已知选到的是男生,则他喜欢天宫课堂的概率

B.用样本的频率估计概率,从全校学生中任选3人,恰有2人不喜欢天宫课堂

的概率为A

64

C.根据小概率值Q=0.05的独立性检验,认为喜欢天宫课堂与性别没有关联

D.对抽取的喜欢天宫课堂的学生进行天文知识测试,男生的平均成绩为80,女

生的平均成绩为90,则参加测试的学生成绩的均值为85

BC[从这200名学生中任选1人,已知选到的是男生,则他喜欢天宫课堂的概

率尸=岛1A错误;

样本中喜欢天宫课堂的频率为嚅=:,从全校学生中任选3人,

ZUU4

2

恰有2人不喜欢天宫课堂的概率01=禺(1一|)x|=^,B正确;

因为2=陋竺笆善驾心2,667<3.841,所以根据小概率值a=0.05的独立性检

几100x100x150x50

验,认为喜欢天宫课堂与性别没有关联,C正确;

抽取的喜欢天宫课堂的学生男、女生人数分别为80,70,

又男生的平均成绩为80,女生的平均成绩为90,所以参加测试的学生成绩的均

80x80+70x90254

值为,D错误.故选BC.]

80+703

三、填空题

9.某工厂为研究某种产品产量x(单位:t)与所需某种原材料式单位:t)的相关性,

在生产过程中收集4组对应数据(x,内如下表所示:

X3456

2.534m

根据表中数据,得出y关于x的经验回归方程为夕=0.7x+Z据此计算出在样本点

(4,3)处的残差为一0.15,则4的值为,表中根的值为.

0.354.5[由在样本点(4,3)处的残差为一0.15,可得当x=4时,y=3A5,即

3.15=0.7X4+a,解得a=0.35.又无==(3+4+5+6)=4.5,y=y(2.5+3+4+

44

机)=?9.5+机),经验回归直线过点(无,y),所以39.5+M)=0.7X4.5+0.35,解

得机=4.5.]

10.如图是调查某学校高一年级男、女学生是否喜欢徒步运动而得到的等高堆积

条形图,阴影部分表示喜欢徒步的频率.已知该年级男生500人、女生400人(假

设所有学生都参加了调查),现从所有喜欢徒步的学生中按分层随机抽样的方法

抽取23人,则抽取的男生人数为

1

男生女生

[=1喜欢徒步二)不喜欢徒步

15[根据等高堆积条形图可知:喜欢徒步的男生人数为0.6X500=

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论