成对数据的统计分析-2025年高考数学备考复习_第1页
成对数据的统计分析-2025年高考数学备考复习_第2页
成对数据的统计分析-2025年高考数学备考复习_第3页
成对数据的统计分析-2025年高考数学备考复习_第4页
成对数据的统计分析-2025年高考数学备考复习_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章统计与成对数据的统计分析

第3讲成对数据的统计分析

课标要求命题点五年考情命题分析预测

1.了解样本相关系数的统2023天津T7,

计含义,了解样本相关关成对数据的2022全国卷乙

系与标准化数据向量夹角相关性T19;2020全国本讲是高考命题热点.对于

的关系;会通过相关系数卷UT18回归分析,主要考查散点

比较多组成对数据的相关回归模型及图,回归方程类型的识

2020全国卷IT5

性.其应用另IJ,求相关系数和回归方

2.了解一元线性回归模型程,利用回归方程进行预

的含义,了解模型参数的测等;对于独立性检验,

2023全国卷甲

统计意义,了解最小二乘主要考查列联表和依据小

T19;2022新高

原理,掌握一元线性回归概率值的独立性检验,常

考卷IT20;2022

模型参数的最小二乘估计与概率综合命题.题型以解

列联表与独全国卷甲T17;

方法;针对实际问题,会答题为主,难度中等.预计

立性检验2021全国卷甲

用一元线性回归模型进行2025年高考会以创新生产

T17;2020新高

预测.生活实践情境为载体考查

考卷IT19;2020

3.理解2X2列联表的统回归分析和独立性检验.

全国卷niT18

计意义;了解2X2列联

表独立性检验及其应用.

a学生用书P217

1.变量的相关关系

(1)正相关和负相关:从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现

①增加的趋势,我们就称这两个变量②正相关;当一个变量的值增加时,另一个

变量的相应值呈现③减小的趋势,则称这两个变量⑷负相关.

(2)线性相关:一般地,如果两个变量的取值呈现⑤正相关或⑥负相关,而且散

点落在⑦一条直线附近,我们就称这两个变量线性相关.

(3)非线性相关或曲线相关:一般地,如果两个变量具有相关性,但不是线性相关,那么

我们就称这两个变量非线性相关或曲线相关.

2.样本相关系数

(1)样本相关系数r=।二।.

n2n2

X)£(-y)

/=i^i-x/=iyi

(2)样本相关系数r的性质

①当r>0时,称成对样本数据⑧正相关;当r<0时,称成对样本数据⑨负相

关;当厂=0时,只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相

关关系.

②IrIWL当IrI越接近于1,成对样本数据的线性相关性越⑩强;IrI越接近于

0,成对样本数据线性相关性越⑪弱.

3.一元线性回归模型

(1)一元线性回归模型

Y—bx+a+e,

我们称,为y关于x的一元线性回归模型.其中,y称为因变量或响

E(e)=0,D(e)=OA

应变量,X称为自变量或解释变量;。和6为模型的未知参数,。称为截距参数,b称为斜

率参数;e是丫与6x+a之间的随机误差.

(2)经验回归方程与最小二乘估计

经验回归方程:y=bx+a.

n

A2(%i一盼Oi一夕)…yx^—nxy_

最小二乘估计:b='z---------2-=⑫.i=l.-_,a—y—bx.

■z;

i=li=L

说明经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.经验

回归直线过点(X,歹).

(3)残差

对于响应变量匕通过观测得到的数据称为观测值,通过经验回归方程得到的9称为预测

值,观测值减去⑬预测值称为残差.

(4)决定系数

n2

S(%一%)n

决定系数尺2用来比较两个模型的拟合效果,尺2=1—平------T其中Z(%一攵)2是残差平

i=1

方和,R2越大(越接近I),表示残差平方和越小,即模型的拟合效果越好;相越小,表

示残差平方和越大,即模型的拟合效果越差.

4.列联表与独立性检验

(1)2X2列联表

一般地,假设有两个分类变量X和匕它们的取值为{0,1},其样本频数列联表(称为

2X2列联表)为:

XY合计

y=oY=1

x=oaba~\~b

X=1cdc~\~d

合计a+cb~\~d

(2)独立性检验

2

/2=一::工丫、,…“、.利用/的取值推断分类变量x和y是否独立的方法称为%2独立

(a十b)(c十d)(a十c)(b十d)

性检验,读作“卡方独立性检验”,简称独立性检验.

(3)临界值

对于任何小概率值a,可以找到相应的正实数%,使得P(f2Xa)=a成立,我们称Xa为a

的临界值,这个临界值可作为判断/大小的标准.概率值a越小,临界值x“⑭越大.

下表给出了2独立性检验中5个常用的小概率值和相应的临界值.

a0.10.050.010.0050.001

Xa2.7063.8416.6357.87910.828

(4)基于小概率值a的检验规则

当,22Xa时,我们就推断二⑮不成立,即认为X和炖不独立,该推断犯错误的

概率不超过a;

当公<Xa时,我们没有充分证据推断M不成立,可以认为X和y⑰独立.

说明若2越大,则两个分类变量有关的把握越大.

1.下列四个散点图中,变量X与y之间具有负的线性相关关系的是(D)

2.下列说法正确的是(D)

A.在经验回归方程?=—0.85x+2.3中,当解释变量x每增加1个单位时,响应变量平均减

少2.3个单位

B.若两个变量的相关性越强,则厂越接近于1

C.在回归分析中,决定系数R2=O.8O的模型比决定系数相=0.98的模型拟合的效果要好

D.残差平方和越小的模型,拟合的效果越好

解析对于A,根据经验回归方程,当解释变量x每增加1个单位时,响应变量,平均减少

0.85个单位,故A错误;对于B,若两个变量的相关性越强,则Irl越接近于1,故B错

误;对于C,用决定系数尺2的值判断模型的拟合效果,尺2越大,模型的拟合效果越好,所

以C错误;对于D,由残差的统计学意义知,D正确.

3.为考查某种营养品对儿童身高增长的影响,选取部分儿童进行试验,根据100个有放回

简单随机样本的数据,得到如下列联表,由表可知下列说法正确的是(D)

身高

营养品合计

有明显增长无明显增长

食用a1050

未食用b3050

合计6040100

A.a=6=30

B.广仁12.667

C.从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是q

D.根据小概率值a=0.001的独立性检验,可以认为该营养品对儿童身高增长有影响

解析由题可知a=50—10=40,6=50—30=20,所以A错误;%2=

2

looxyso-D26.667>1O.828=XOOOI,所以根据小概率值a=0.001的独立性检验,

可以认为该营养品对儿童身高增长有影响,所以B错误,D正确;从样本中随机抽取1名

儿童,抽到食用该营养品且身高有明显增长的儿童的概率是孤=|,所以C错误.

4.[2023福州5月质检]已知变量x和y的统计数据如下表:

X678910

y3.54566.5

若由表中数据得到经验回归方程为9=0.8x+6,则x=10时的残差为一0.1.(注:观测

值减去预测值称为残差)

解析易知元=8,y=5,.*.a=5—0.8X8=—1.4,.•.x=10时,夕=811.4=6.6,/.x=10

时的残差为6.5-6.6=-0.1.

h学生用书P219

命题点1成对数据的相关性

角度1判断两个变量的相关性

例1(1)已知变量x和歹近似满足关系式y=-O.lx+1,变量〉与z正相关.下列结论中正

确的是(C)

A.x与y正相关,x与z负相关

B.x与歹正相关,x与2正相关

C.%与y负相关,x与z负相关

D.x与y负相关,x与z正相关

解析由y=-O.lx+l,知x与y负相关,即y随x的增大而减小,又y与z正相关,所以

z随y的增大而增大,随丁的减小而减小,所以z随x的增大而减小,x与z负相关.

(2)[2023湖北仙桃中学模拟]对四组数据进行统计后,获得了如图所示的散点图,四组

数据的相关系数分别为小03%,对各组的相关系数进行比较,正确的是(C)

第一组第二组

1

;_J

n'«n1

第三组第四组

A.r3<r2<0<n<r4B.r4<n<0<r2<n

C.r2<n<0<r4<nD.?"i<r4<0<r3<r2

解析由题图可知,第一、四组数据均正相关,第二、三组数据均负相关,当相关系数的

绝对值越大时,数据的线性相关性越强.第一组数据的线性相关性较第四组强,则>7-4>

0,第二组数据的线性相关性较第三组强,则I/2I>I厂3I,且厂2<0,厂3<0,则厂2<『3<

0.

因此,厂2<厂3<0<7'4<,1.故选C.

方法技巧

判断两个变量相关性的3种方法

若点的分布从左下角到右上角,则两个变量正相关;若点的分布从左上角到

画散点图

右下角,则两个变量负相关.

利用样本相

厂>0时,正相关;厂<0时,负相关;1川越接近于1,线性相关性越强.

关系数

利用经验回AA

b>0时,正相关;6<0时,负相关.

归方程

角度2相关系数的计算

例2[2022全国卷乙]某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区

某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:

m2)和材积量(单位:n?),得到如下数据:

样本号i12345678910总和

根部横截

0.040.060.040.080.080.050.050.070.070.060.6

面积Xi

材积量yi0.250.400.220.540.510.340.360.460.420.403.9

101010

并计算得Z蜡=0.038,Z*=L6158,ZX%・=0.2474.

i=li=li=l

(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量.

(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01).

(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积

总和为186nl2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区

这种树木的总材积量的估计值.

n

X(石一盼(力一歹)y_______

附:相关系数r=-曰,VL896^1.377.

n2n2

x(%厂%)i(乃一歹)

小=1i=l

10

2%inr

解析(1)估计该林区这种树木平均一棵的根部横截面积±=濡-=.=0.06,估计该林区

10

XOQ

这种树木平均一棵的材积量歹=用-=而=0.39.

1010

(2)£(汨一无)(%一歹)=2孙,-1°双=°・°134,

i=l1=1

10

2107

Z(%i-%)=Sx?-10x=0.002,

i=li=l

210

=ZyHioy?-0-0948,

i=l

102102________________________________________________________

JX(%i一元)z(%一歹)=V0.002x0.0948=70.0001x1.896^0.01X1.377=

i=li=l

io

0.01377,所以样本相关系数尸=।»=]名"0.97.

1021020・01377

Z(xj—x)2(yj—y)

•Ji=li=l

(3)设该林区这种树木的总材积量的估计值为Km*3,由题意可知,该种树木的材积量与

其根部横截面积近似成正比,所以生=与,所以¥=吟誉=1209,

0.061860.06

即该林区这种树木的总材积量的估计值为12091n3.

训练1变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,

4),(13,5);变量U与k相对应的一组数据为(10,5),(11.3,4),(11.8,

3),(12,5,2),(13,1)刀表示变量丫与X之间的线性相关系数,厂2表示变量厂与U

之间的线性相关系数,则(C)

A.;"2<n<0B.0<r2<n

C.r2<0</*iD/2=,I

解析由题中的数据可知,变量y与x正相关,相关系数n>0,变量%与u负相关,相

关系数r2c0,即『2<001.故选C.

命题点2回归模型及其应用

角度1一元线性回归模型

例3[2023广西联考]某省为调查北部城镇2022年GDP,抽取了20个城镇进行分析,得到

样本数据(X;,yt')(z=l,2,•••,20),其中方和川分别表示第,个城镇的人口(单位:

202020

万人)和该城镇2022年GDP(单位:亿元),计算得ZM=100,1^=800,2(x,—x)

i=li=li=l

2020

2=70,Z(%一歹)2=280,Z(XL元)(“一歹)=120.

i=l'i=l

(1)请用相关系数r判断该组数据中/与x之间线性相关关系的强弱(若"I£[0.75,

1],相关性较强;若“I£[0.30,0.75),相关性一般;若re[—0.25,0.25],相关性较

弱).

(2)求y关于x的线性回归方程.

(3)若该省北部某城镇2024年的人口约为5万人,根据(2)中的线性回归方程估计该城

镇2024年的GDP.

n

Z(占一元)(%一歹)

参考公式:相关系数>=一力=,对于一组具有线性相关关系的数据(如

n2n2

E(Xi-x)£(7i-y)

[i=li=l

yt)M=l,2,n),其回归直线5>=bx+a的斜率和截距的最小二乘估计分别为6=

n

Z(Xi-X)(yj—y)A

0f---------2-,a=y—bx.

Z(%「遇

i=l

20

Z(xj—x)(yi—y)-inn12n

解析(1)由题意知,相关系数曰=穿赤=搭-0.857,

202202V70X280140

2(xj-x)Z(%一歹)

、i=li=l

因为》与X的相关系数尸满足I尸I£[0.75,1],所以歹与X之间具有较强的线性相关关系.

20

AE(石一盼(力一歹)12nI?

(2)----------=^11,

弋/_、2707

Z(Xj—X)

i=l

八—-80012、/100220匚匚[、[人12,220

7所以

a=,y—bx=—20—7X—20=7—,)y=7f+—7.

(3)由(2)可估计该城镇2024年的GDP尸与X5+竽=40(亿元).

方法技巧

回归模型问题的类型及解题方法

(1)求经验回归方程:

①利用数据,求出匕y;

②利用公式,求出回归系数b;

③利用经验回归直线过样本点的中心(焉歹),求a.

(2)利用经验回归方程进行预测:直接将已知的自变量的某个数值代入经验回归方程求得

特定要求下的预测值.

(3)判断回归模型的拟合效果:利用残差平方和或决定系数R2判断,R2越大,表示残差

平方和越小,即模型的拟合效果越好.

角度2非线性回归模型

例4:2023重庆市三检]已知变量y关于x的经验回归方程为y=e^-06,若对y=e"-"两

边取自然对数,可以发现Iny与x线性相关,现有一组数据如表所示:

X12345

yee3e4e6e7

则当x=6时,预测y的值为(C)

A.9B.8C.e9D.e8

解析对丫=於*—。6两边取自然对数,得lny=bx—0.6,令z=lny,则z=bx—0.6,数据为

X12345

yee3e,e6e7

z13467

由表格数据,得无=3,2=1+3+:+。+/=42将(3,4.2)代入z=bx—0.6,得

4.2=36-0.6,(方法技巧:经验回归方程只含一个未知数问题主要是依据经验回归直线

y=bx+a必过样本点的中心(元,歹)求解)

16x

解得6=1.6,所以z=1.6x—0.6,即旷=e16x-o.6,当x=6时,y—e6-o.6_e9^故选c.

方法技巧

1.解决非线性回归模型问题的思路:根据数据的散点图,选择恰当的拟合函数,用适当的

变量进行转换,如通过换元或取对数等方法,把问题化为线性回归模型问题,使之得到解

决.

2.常见的非线性回归模型及转换技巧

(1)y-a+~,令v=L则丫=(2+加;

XX

(2)y=a+blnx(b0),令k=lnx,则y=a+6/;

(3)y=axb(a>0,6W0),令c=lna,i^lnx,u=lny,则〃=c+6/;

(4)y—aebx(a>0,6/0),令c=lna,z/=lny,则〃=c+6x.

训练2[2023合肥市质检]研究表明,温度的突然变化会引起机体产生呼吸道上皮组织的生

理不良反应,从而导致呼吸系统疾病的发生或恶化.某中学数学建模社团成员欲研究昼夜温

差大小与该校高三学生患感冒人数多少之间的关系,他们记录了某周连续六天的昼夜温

差,并到校医务室查阅了这六天中每天高三学生新增患感冒而就诊的人数(假设患感冒必

到校医务室就诊),得到资料如下:

日期第一天第二天第三天第四天第五天第六天

昼夜温差x/°C47891412

新增就诊人数y/位必

66

参考数据:2淄=3160,25一歹)2=256.

i=li=l

(1)已知第一天新增患感冒而就诊的学生中有7位女生,从第一天新增患感冒而就诊的学

生中随机抽取3位,若抽取的3人中至少有一位男生的概率为?,求力的值;

(2)已知两个变量x与y之间的样本相关系数厂=荒,试用最小二乘法求出y关于x的经验

回归方程9=区+6,据此估计昼夜温差为15。(2时,该校高三新增患感冒而就诊的学生数

(结果保留整数).

n

AZy)

参考公式:un2

£(Xj—X)

i=l

7x6x5_7

yi(yi-i)(yi-2)24’

Ayi(8一1)(刃一2)=720=10X9X8,:.yi=10.

66

(2)*.*Z»=54,・,•元=9,X(Xz—%)2=64.

i=li=l

6_6

=]=izl___________________=_,y(丫一歹)(%一歹)

[~6―2328X1616'1g(,=8X15,

'z(%i-x)•X(yi-y)

i=l、|i=l

6

.;_苕⑸一盼5—歹)_8xi5_i5

・・bL——z-一T,

(Xj—x)

i=l

6666AA

又£(〃・一歹)2=£*—2歹•£功+6歹92=£*—6歹92=256,解得歹=22,:.a=y—bx=22—

i=li=li=li=l

—X9=—

88

AA

.41।15*D_L41,15'.[二〜”

当时,

.-y——88x=158y=8—+—X15^33,

故可以估计昼夜温差为15。(3时,该校高三新增患感冒而就诊的学生数为33.

命题点3列联表与独立性检验

例5[2022全国卷甲改编]甲、乙两城之间的长途客车均由4和8两家公司运营.为了解这两

家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联

表:

准点班次数未准点班次数

A24020

B21030

(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;

(2)依据小概率值a=0.1的独立性检验,分析甲、乙两城之间的长途客车是否准点与客车

所属公司有关.

2

nCad—be).,..

附:Z2-;-------;--------;------;~­,n=a~rb~rC~ru.y

(a+b)(c+d)(a+c)(b+d)

a0.10.0500.0100.001

Xa2.7063.8416.63510.828

解析(1)由题表可得/公司甲、乙两城之间的长途客车准点的概率为

240+2013

8公司甲、乙两城之间的长途客车准点的概率为三+=£

210+308

(2)零假设为H):甲、乙两城之间的长途客车是否准点与客车所属公司无关.根据2X2列

联表,

500x(240x30—20x210)

可得/==3.205>2.706=xo.i,

(240+20)x(210+30)x(240+210)x(20+30)

根据小概率值Q=0.1的独立性检验,我们推断H)不成立,

即认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.

方法技巧

独立性检验的一般步骤

(1)提出零假设员;

(2)根据样本数据制成2X2列联表;

n(ad-be)

(3)根据公式*2=计算

(a+b)(c+d)(a+c)(b+d)

(4)比较22与临界值超的大小关系,根据检验规则得出推断结论.

训练3某市针对电动自行车骑乘人员是否佩戴安全头盔问题进行调查,在随机调查的1000

名骑行人员中,记录其年龄(单位:岁)和是否佩戴头盔情况,得到如图所示的统计图:

(1)估算该市电动自行车骑乘人员的平均年龄.

(2)根据所给的数据,完成下面的列联表:

单位:名

是否佩戴头盔

年龄/岁合计

是否

[20,40)

[40,70]

合计

(3)根据(2)中的列联表,依据a=0.010的独立性检验,能否认为遵守佩戴安全头盔规

则与年龄有关?

2

附._____n

Sdic>_______〃=a+b+c+".

'"(a+b)(c+d)(a+c)(b+d)

a0.0500.0100.001

3.8416.63510.828

解析(1)该市电动自行车骑乘人员的平均年龄为25X0.25+35X0.35+45X0.2+

55X0.15+65X0.05=39(岁).

(2)依题意,完成列联表如下:

单位:名

是否佩戴头盔

年龄/岁合计

是否

[20,40)54060600

[40,70]34060400

合计8801201000

(3)零假设为/To:遵守佩戴安全头盔规则与年龄无关.

由表得/=1000X(540x60340x60)125

600x400x880x120—^5.682<6.635=xo.oio,

根据小概率值a=0.010的独立性检验,没有充分证据推断M不成立,

因此可以认为为成立,即认为遵守佩戴安全头盔规则与年龄无关.

1.[命题点1角度1〃023天津高考]调查某种群花萼长度和花瓣长度,所得数据如图所示.其

中相关系数r=0.8245,下列说法正确的是(C)

A.花瓣长度和花萼长度没有相关性

B.花瓣长度和花萼长度呈负相关

C.花瓣长度和花萼长度呈正相关

D.若从样本中抽取一部分,则这部分的相关系数一定是0.8245

解析因为相关系数r=0.8245>0.75,所以花瓣长度和花萼长度的相关性较强,并且呈正

相关,所以选项A,B错误,选项C正确;因为相关系数与样本的数据有关,所以当样本

发生变化时,相关系数也会发生变化,所以选项D错误.故选C.

2.[命题点1,2/2024济南市摸底考试]随着科技的发展,网购成了人们购物的重要选择,

并对实体经济产生了一定影响.为了解实体经济的现状,某研究机构统计了一个大商场

2018—2022年的线下销售额,如下表:

年份编号X12345

年份20182019202020212022

销售额4万元1513146512021060860

(1)由表中数据可以看出,可用经验回归模型拟合销售额y与年份编号x的关系,请用相

关系数加以说明;

(2)建立y关于x的经验回归方程,并预测2024年该商场的线下销售额.

参考公式及数据:

^xiyi-nxy

相关系数厂=i=l

i=li=l

对于一组数据(制,歹1),(%2,J2)(羽,力),其经验回归直线$=2+八的斜率

n

A

Az—TIXyA55

=

和截距的最小二乘估计公式分别为b=2a=y—bx.X^6100,£汨%=16589,

Xx^—nxi=li=l

i=l

5959

(2靖—5/)(乞*一592)736.

、i=li=l

5

解析(1)由已知数据可得,元=I+2+”+5=3,歹=用=等£=1220,

5

所以1>"一51歹=16589—5X3X1220=—1711,

i=l

5

2片力一5元歹

—1711

所以相关系数ri=l~一^^一0.9856.

(£x?-5z2)(Ey?-5y2)1736

i=li=f

因为“I非常接近1,

所以可用经验回归模型拟合销售额》与年份编号X的关系.

5cAYxiyi-Sxy

22222711

(2)由已知数据可得,1%?=1+2+3+4+5=55,所以力=胃------=2=~

i=lz蜡—5元255—5x3

i=l

171.1,

AA

a—y—bx—1220—(—171.1)X3=l733.3,

所以y关于x的经验回归方程为$=—171.1x+l733.3.

令x=7,贝.=一171.1X7+1733.3=535.6(万元),

所以预测2024年该商场的线下销售额为535.6万元.

3.[命题点3,021全国卷甲改编]甲、乙两台机床生产同种产品,产品按质量分为一级品和

二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质

量情况统计如下表:

单位:件

一级品二级品合计

甲机床15050200

乙机床12080200

合计270130400

(1)甲机床、乙机床生产的产品中一*级品的吃顷率分别是多少?

(2)依据小概率值a=0.01的独立性检验,分析甲机床的产品质量与乙机床的产品质量是

否有差异.

2

a0.0500.0100.001

Xa3.8416.63510.828

解析(1)由题意,可得甲机床、乙机床生产的产品总数均为200件,

因为甲机床生产的产品中一级品的频数为150,所以甲机床生产的产品中一级品的频率为

黑=。-75,

因为乙机床生产的产品中一级品的频数为120,所以乙机床生产的产品中一级品的频率为

黑=。6

(2)零假设为灰:甲机床的产品质量与乙机床的产品质量无差异.

2

则根据列联表中的数据计算得/=4。。;;:黑黑黑。)〜10.256>6.635=x0.01.

所以依据小概率值a=0.01的独立性检验,推断M不成立,

即认为甲机床的产品质量与乙机床的产品质量有差异,此推断犯错误的概率不大于0.01.

F练习帮,练透好题精准分层

c学生用书•练习帮P378

■础博知F0关〕

1.在用经验回归方程研究四组数据的拟合效果时,分别作出下列四个关于四组数据的残差

图,则用线性回归模型拟合效果最佳的是(A)

CD

解析用残差图判断模型的拟合效果时,残差点比较均匀地落在水平的带状区域中,说明

这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合效果越好.故选A.

2.[全国卷I]某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的

关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(x”■•)(/=1,

2,20)得到如图所示的散点图.

由此散点图,在10。(2至40P之间,下面四个回归方程类型中最适宜作为发芽率y和温度

x的回归方程类型的是(D)

A.y—a+bxB.y—a-\-bx2

C.y=a+be*D.y=a+61nx

解析由散点图可以看出,随着温度x的增加,发芽率y增加到一定程度后,变化率越来

越慢,符合对数型函数的图象特征.

3.[2024江苏徐州模拟]如图,在一组样本数据/(2,2),B(4,

3),C(6,4),。(8,7),E(10,6)的散点图中,若去掉。

()则下列说法正确的为()

8,7,D•I

A.样本相关系数r变小

B.残差平方和变大

C.决定系数R2变小

D.自变量x与因变量了的相关程度变强

解析由散点图分析可知,只有。点偏离直线较远,去掉。点后,X与y的线性相关程度

变强,且为正相关,所以样本相关系数7•变大,决定系数尺2变大,残差平方和变小,故选

D.

4.[2024青岛市检测]已知某设备的使用年限x(年)与年维护费用y(千元)的对应数据

如下表:

X24568

y34.56.57.59

由所给数据分析可知:x与y之间具有线性相关关系,且y关于x的经验回归方程为y=

1.05x+a,贝怆=(B)

A.0.75B.0.85C.0.95D.1.05

2+4+;+6+83+4,5+6^5+7.5+9

解析由题意可知元==5,-==6贝|6.1=1.05X5+2,所以

6.1-1.05X5=0.85,故选B.

5.[多选〃024九江模拟]根据最小二乘法,由一组样本点(注,%)(其中i=l,2,…,

A

300)求得的经验回归方程是夕=云+篦则下列说法正确的是(BD)

A

A.至少有一个样本点落在经验回归直线夕=bx+2上

B.若所有样本点都在经验回归直线y=£+6上,则变量间的相关系数为土1

A

C.对所有的解释变量羽(i=l,2,300),的值一定与M有误差

AA

D.若经验回归直线夕=取+4的斜率b>0,则变量x与y正相关

解析经验回归直线必过样本点的中心,但样本点可能都不在经验回归直线上,故A错

误;若所有样本点都在经验回归直线9=取+4上,则变量间的相关系数为土1,故B正

确;若所有的样本点都在经验回归直线尸£+今上,则短+a的值与%相等,故c错误;

相关系数厂与‘符号相同,若经验回归直线9=£+a的斜率则r>0,样本点散布在

从左下角到右上角的区域,则变量x与y正相关,故D正确.故选BD.

6.[多选2024贵州统考]某学校高三年级甲、乙两班共105人进行了一次数学测试.按照成

绩大于或等于120分(满分150分)的同学评价为“优秀生”,其他分数的同学评价为

“潜力生

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论