2021-2022学年高二数学新题速递07 回归分析(2月)(文)解析版_第1页
2021-2022学年高二数学新题速递07 回归分析(2月)(文)解析版_第2页
2021-2022学年高二数学新题速递07 回归分析(2月)(文)解析版_第3页
2021-2022学年高二数学新题速递07 回归分析(2月)(文)解析版_第4页
2021-2022学年高二数学新题速递07 回归分析(2月)(文)解析版_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题07回归分析

一、单选题

1.两个变量y与尤的回归模型中,分别选择了4个不同模型,它们的相关指数R如下,其

中拟合效果最好的模型是

A.模型1的相关指数R=0.15B.模型2的相关指数R=0.85

C.模型3的相关指数R=0.25D.模型4的相关指数R=0.95

【试题来源】贵州省毕节市威宁县2019-2020学年高二下学期期末考试(文)

【答案】D

【分析】根据相关指数越大,拟合效果越好即可判断.

【解析】两个变量y与x的回归模型中,相关指数R越大,拟合效果越好,故选D.

2.在一组样本数据(内,乂),(X2,%),…,(王,丹)(〃22,玉,工2,…,X"不全相等)的散点

图中,若所有样本点(x,,y)(i=l,2,…,小都在直线y=[x+l上,则这组样本数据的样本

相关系数为

A.-1B.1

11

C.——D.-

55

【试题来源】陕西省西安市蓝田县2019-2020学年高二下学期期末(理)

【答案】B

[解析】:这组样本数据的所有样本点(%,y)(i=1,2,…,n)都在直线y=夫+1上,

,这组样本数据完全相关,即说明这组数据的样本完全正相关,其相关系数是1.故选B.

【名师点睛】本题考查变量的正负相减,一般在散点图中,所有点都在一条斜率为正的直线,

则这两个变量正相关,如果所有点在一条斜率为负的直线附近,则这两个变量呈负相关.

3.根据最小二乘法由一组样本点(七,必)(其中i=l,2,500),求得的回归方程是

y^bx+a,则下列说法不正确的是

A.样本点可能全部都不在回归直线$=%+4上

B.若所有样本点都在回归直线$=+a上,则变量间的相关系数为1

C.若所有的样本点都在回归直线$=加+&上,则法;.+□的值与%相等

D.若回归直线f=+a的斜率合<0,则变量x与y呈负相关

【试题来源】青海省海东市2019-2020学年高二下学期期末联考(文)

【答案】B

【解析】回归直线必过样本数据中心点,但样本点可能全部不在回归直线上故A正确;

所有样本点都在回归直线§=%+»上,则变量间的相关系数可能为±1,故B错误;

若所有的样本点都在回归直线,=&+»上,则故+a的值与必相等,故C正确;

相关系数「与A符号相同,若回归直线§=屏+》的斜率5<0,则r<0,则变量x与y呈

负相关,故D正确.故选B.

4.对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是

y..y

35•・•35*

30.*.**30-V…

25.・•・・25

20•.•.20

,:•••

15.•・15•・・・

1()•••10

5*.............................5

O5101520253035x05101520253035x

图3(相关系数八)图4(相关系数〃)

A.r2<r4<0<^<r[B.〃<心<0<6<〃

C.r4<r2<Q<^<rtD.r2<r4<Q<

【试题来源】2021年高考数学(文)一轮复习讲练测

【答案】A

【解析】由给出的四组数据的散点图可以看出,题图1和题图3是正相关,相关系数大于0,

题图2和题图4是负相关,相关系数小于0,

题图1和题图2的点相对更加集中,所以相关性更强,所以4接近于1,弓接近于-1,

由此可得弓<9<0<4<。.故选A.

5.下列说法中正确的是

A.若一组数据1,a,3的平均数是2,则该组数据的方差是2

3

B.线性回归直线不一定过样本中心点丘J)

C.若两个随机变量的线性相关越强,则相关系数r的值越接近于1

D.先把高三年级的2000名学生编号:1到2000,再从编号为1到50的50名学生中随机

抽取1名学生,其编号为加,然后抽取编号为5+50,加+100,加+150.....的学生,这

样的抽样方法是分层抽样

【试题来源】安徽省安庆七中2018-2019学年高二上学期期中(理)

【答案】A

【分析】A.利用平均数和方差公式判断;B.根据线性回归直线一定过样本中心点正,歹)

判断;C.根据相关系数「的绝对值与相关程度的关系判断;D.由系统抽样的特点判断.

【解析】A.若一组数据1,0,3的平均数是2,则。=2,该组数据的方差是

s=2『+(2-2『+(3-2)[=:,故正确;

B.线性回归直线一定过样本中心点&J),故错误:

C.若两个随机变量的线性相关越强,则相关系数厂的绝对值越接近于1,故错误;

D.先把高三年级的2000名学生编号:1到2000,再从编号为1到50的50名学生中随机

抽取1名学生,其编号为"?,然后抽取编号为+50,加+100,加+150,……的学生,这

样的抽样方法是系统抽样,故错误;故选A

6.下列说法正确的是

①当相关系数/•>()时,表明变量x和y正相关;

②用相关系数,•来衡量两个变量之间线性关系的强弱时,卜|越接近于1,相关性越弱;

③回归直线过样本点的中心(只了);

④若回归方程为y=0.85%一85.71,则当x=170时,y的值必为58.79.

A.B.①③④

C.①②③D.①③

【试题来源】湖北省黄冈市麻城市第二中学2020-2021学年高二上学期10月月考•

【答案】D

【分析】①由相关系数的意义判断;②由相关系数卜|越接近于1,相关性越强判断;③由回

归分析的特点判断;④当户170时,由y的值为预测值判断.

【解析】①由相关系数的意义知当相关系数—>0时,表明变量x和厂正相关,故正确;

②用相关系数r来衡量两个变量之间线性关系的强弱时,”越接近于1,相关性越强,故错

误;③回归宜线过样本点的中心(元歹),故正确;

④若回归方程为y=0.85x.85.71,则当户170时,),的预测值为58.79,故错误;故选D

7.两个变量x与y的回归模型中,分别选择了四个不同的模型来拟合y与%之间的关系,

它们的相关系数r如下,其中拟合效果最好的模型是

模型1234

r0.980.800.500.25

A.模型1B,模型2

C.模型3D.模型4

【试题来源】人教B版(2019)选择性必修第二册过关斩将第四章概率与统计

【答案】A

【分析】根据相关系数1川越接近于1,模型的拟合效果越好,结合表格中的数据,即可求

解.

【解析】两个变量》与丁的回归模型中,它们的相关系数1川越接近于I,这个模型的拟合

效果越好,在所给的四个相关系数中0.98的绝对值最接近1,所以拟合效果最好的模型是模

型1.故选A.

8.对两个变量工、V进行线性相关检验,得线性相关系数乙=0.7859,对两个变量〃、v进

行线性相关检验,得线性相关系数4=-09568,则下列判断正确的是

A.变量x与y正相关,变量〃与v负相关,变量%与y的线性相关性较强

B.变量x与y负相关,变量〃与y正相关,变量%与y的线性相关性较强

c.变量x与y正相关,变量”与v负相关,变量w与v的线性相关性较强

D.变量%与y负相关,变量〃与v正相关,变量〃与v的线性相关性较强

【试题来源】2021年高考数学(文)一轮复习讲练测

【答案】C

【分析】根据相关系数的符号决定两个变量的正相关、负相关,以及相关系数绝对值越大,

两个变量的线性相关性越强,进而可得出结论.

[解析】由线性相关系数4=0.7859>0知x与y正相关,

由线性相关系数弓=一。9568<0知〃与u负相关,

又用<1目,所以,变量〃与v的线性相关性比%与丁的线性相关性强,故选C.

9.对于一组具有线性相关关系的数据(x,,y)(i=l,2,3,…,根据最小二乘法求得回归

直线方程为y=鼠+近,则以下说法正确的是

A.至少有一个样本点落在回归直线§,=距+2上

B.预报变量y的值由解释变量x唯一确定

C.相关指数R2越小,说明该模型的拟合效果越好

D.在残差图中,残差点分布水平带状区域的宽度越窄,则回归方程的预报精确度越高

【试题来源】福建省三明市2019-2020学年高二下学期期末考试

【答案】D

【分析】由线性回归方程的特点判断A与B:由相关指数与预报效果间的关系判断C;由残

差图的形状与拟合效果间的关系判断D,即可求解.

【解析】对于一组具有线性相关关系的数据(七,丫),可能所有的样本点都不在回归直线

9=%+金上,故A不正确;预报变量y的值由解释变量x进行估计,所以B不正确;

相关系数火2越小,残差的平方和越大,说明该模型的拟合效果越不好,所以C不正确;

在残差图中,残差点分布水平带状区域的宽度越窄,则回归方程的预报精确度越高,所以D

正确.故选D.

10.两个变量丁与X的回归模型中,有4个不同模型的相关指数心如下,其中拟合效果最好

的是

A.R2=0.96B.R2=0.81

C.R2=0.50D.R2=0.25

【试题来源】四川省宜宾市2019-2020学年高二下学期期末考试(文)

【答案】A

【分析】两个变量y与%的回归模型中,相关指数/越大,拟合效果越好.

【解析】两个变量y与%的回归模型中,相关指数犬2越大,拟合效果越好,

•.-0.96>0.81>0.50>0.25,二拟合效果最好的是R?=0.96,故选A.

11.在用最小二乘法进行线性回归分析时,有下列说法:①由样本(%,%),(为2,%),-,

(七,X,)得到回归直线,可能该样本中的样本点都不在回归直线上;②残差图中的残差点比

较均匀地落在水平的带状区域中,宽度越窄,则说明模型拟合精度越高;③利用

E(z--x)2

火2=1-个---------来刻画回归的效果,R2。0.75比R2=0.64的模型回归效果好.以

)2

/=1

上说法正确的

A.①@B.①③

C.②③D.①②③

【试题来源】河南省洛阳市高二下学期期中考试(文)

【答案】D

【分析】回归直线必过样本中心,但样本点未必都在该直线,故①正确,再根据相关指数的

意义和残差图的应用可得②③正确与否.

【解析】对于①,回归直线必过样本中心点,但样本点未必都在该直线,故①正确.

相关指数火2越大,说明拟合效果越好,故③正确.

残差图中,宽度越窄,说明模型拟合精度越高,故②正确.故选D.

12.下列说法错误的是

A.自变量取值一定时,因变量的取值有一定随机性的两个变量之间的关系叫做相关关系

B.在线性回归分析中,相关系数「越大,变量间的相关性越强

C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高

D.在回归分析中,代为0.98的模型比代为。.80的模型拟合的效果好

【试题来源】黑龙江省大庆市铁人中学2019-202()学年高二(下)期末(理)

【答案】B

【解析】A.根据相关关系的定义,即可判断自变量取值一定时,因变量的取值带有一定随

机性的两个变量之间的关系叫做相关关系,正确;B.线性回归分析中,相关关系系数r的

绝对值越接近1.两个变量的线性相关性越强;C.残差图中,对于一组数据拟合程度的好

坏评价,是残差点分别的带状区域宽度越狭窄,其模型拟合的精度越高,正确;D.回归分

析中,用相关系数索义刻画回归效果时,成至的值越大,说明模型的拟合效果越好,盛顺为0.98

的模型比虚以为0.80的模型拟合的效果好,正确.

13.对四组数据进行统计,获得以下散点图,关于其线性相关系数比较,正确的是

线性相关系数为r】线性相关系数为巳线性相关系数为七线性相关系数为心

A.弓<?<0<4</;B.〃<为<0<4<4

C.〃<弓<0<4<{D.弓<4<0<4<4

【试题来源】内蒙古包头市第六中学2020-2021学年高二第一学期期中考试

【答案】B

【分析】根据题目给出的散点图,先判断是正相关还是负相关,得出4>0,々>0和

4<0,〃<0,然后根据散点的集中程度分析相关系数的大小,即可得出答案.

【解析】由给出的四组数据的散点图可以看出,

图1和图3是正相关,相关系数大于0,则{>0,4>0,

图2和图4是负相关,相关系数小于0,则弓<0,〃<0,

图3和图4的点相对更加集中,所以相关性较强,所以口接近于1,〃接近于-1,

图1和图2的点相对分散一些,所以相关性较弱,所以,和弓比较接近0,

由此可得〃〈为<0〈外〈与.故选B.

【名师点睛】本题考查由散点图判断两个变量的线性相关和相关系数厂的比较,考查散点分

布在左下角至右上角,说明两个变量正相关,r>0;散点分布在左上角至右下角,说明两

个变量负相关,r<0:散点越集中在一条直线附近,相关系数越接近于1或-1.

14.下列关于回归分析与独立性检验的说法正确的是

①回归分析和独立性检验没有什么区别;

②回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定性关

系;

③回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一

种检验;

④独立性检验可以100%确定两个变量之间是否具有某种关系.

A.@@B.(3)

C.③④D.全选

【试题来源】江苏省盐城市东台市创新学校2019-2020学年高二下学期5月检测

【答案】B

【解析】回归分析是对两个变量之间的相关关系的一种分析,而相关关系是一种不确定关系,

通过回归分析可能两个变量之间具有的相关关系.

而独立性检验是对两个变量之间是否具有某种关系的分析,并且可以分析这两个变量在多大

程度上具有这种关系,但不能100%肯定这种关系.故①②④错误,③正确.故选B.

15.2020年的“金九银十”变成“铜九铁十”,全国各地房价"跳水”严重,但某地二手房交易

却“逆市”而行.下图是该地某小区2019年11月至2020年11月间,当月在售二手房均价(单

位:万元/平方米)的散点图.(图中月份代码1〜13分别对应2019年11月〜2020年11月)

1.00■•,

0.98■•,

0.96•.

0.94•

012345678910111213月份代码工

根据散点图选择y=。+人五和y=c+dInx两个模型进行拟合,经过数据处理得到的两个

回归方程分别为y=0.9369+0.02856和y=0.9554+0.03061nx,并得到以下一些统

计量的值:

y=0.9369+0.02856y=0.9554+0.0306Inx

R20.9230.973

注:元是样本数据中x的平均数,歹是样本数据中了的平均数,则下列说法不一定成立的

A.当月在售二手房均价)与月份代码》呈正相关关系

B.根据y=0.9369+0.0285&可以预测2021年2月在售二手房均价约为1.0509万元/平

方米

C.曲线y=0.9369+0.02856与y=0.9554+0.0306Inx的图形经过点卜,y)

D.y=0.9554+0.0306Inx回归曲线的拟合效果好于y=0.9369+0.02854的拟合效果

【试题来源】河南省新乡市2021届高三第一次模拟考试(文)

【答案】c

【分析】根据散点图的分布可判断A选项的正误;将x=16代入回归方程

>=0,9369+0.0285Vx可判断B选项的正误;根据非线性回归曲线不一定经过(X习可判

断C选项的正误;根据回归模型的拟合效果与R2的大小关系可判断D选项的正误.

【解析】对于A,散点从左下到右上分布,所以当月在售二手房均价y与月份代码x呈正相

关关系,故A正确;

对于B,令x=16,由y=0.9369+0.028571^=1.0509,

所以可以预测2021年2月在售二手房均价约为1.0509万元/平方米,故B正确;

对于C,非线性回归曲线不一定经过缶,同,故C错误;

对于D,我2越大,拟合效果越好,故D正确.故选C.

16.已知变量y关于变量》的回归方程为$=a'«5,其一组数据如下表所示:

X1234

yee3e4e(,

若$=e91则》=

A.5B.6

C.7D.8

【试题来源】河南省周口市商丘市大联考2020-2021学年第一学期高中毕业班阶段性测试

(三)(文)

【答案】B

【分析】令z=lny,由样本中心点的性质可得力=1.6,即可得解.

【解析】由£=得lng=fex—0.5,令z=lny,则]=区—0.5,

元=江*=2.5,一匕/2』,

由题意,

44

因为(无可满足2=小一0.5,所以3.5=6x2.5—0.5,解得1=1.6,

所以:=1.6》一0.5,所以?=/6毋,令/64。.5=冽,解得x=6・故选B.

17.两个具有线性相关关系的变量的一组数据(%,yj,(马,%),…(x〃,K),下列说法错

误的是

A.相关系数N越接近1,变量相关性越强

B.落在回归直线方程上的样本点越多,回归直线方程拟合效果越好

C.相关指数R2越小,残差平方和越大,即模型的拟合效果越差

D.若X表示女大学生的身高,y表示体重则店a0.64表示女大学生的身高解释了64%的

体重变化

【试题来源】湖南省长沙市第一中学2020-2021学年高三上学期月考(六)

【答案】B

【分析】根据变量间的相关关系中:相关指数火2或相关系数M的意义进行判定.

【解析】对于A.根据相关系数H越接近1,变量相关性越强,故正确;

对于B.回归直线方程拟合效果的强弱是由相关指数代或相关系数H判定,故不正确;

对于C.相关指数火2越小,残差平方和越大,效果越差,故正确:

对于D.根据R2的实际意义可得,/?2°0M表示女大学生的身高解释了64%的体重变

化,故正确;故选B

【名师点睛】模型拟合效果的判断:

(1)残差平方和越小,模型的拟合效果越好;

(2)相关指数R2越大,模型的拟合效果越好;

(3)回归方程的拟合效果,可以利用相关系数判断,当网越趋近于I时,两变量的线性相

关性越强.

18.2020年初,新型冠状病毒(COV7Q-19)引起的肺炎疫情爆发以来,各地医疗机构采取了

各种针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治愈的

患者人数如下表所示:

周数(X)12345

治愈人数2173693142

由表格可得y关于x的二次回归方程为y^6x2+a,则此回归模型第2周的残差(实际值与

预报值之差)为

A.5B.4

C.1D.0

【试题来源】安徽省淮南市2020-2021学年高二上学期期末考试(文)

【答案】C

【分析】设,=/,求出,,》的值,由最小二乘法得出回归方程,代入*=2,即可得出

答案.

【解析】设.=%2,则亍=](1+4+9+16+25)=11,y=((2+17+36+93+142)=58

2

a=58-6xll=-8,所以?=6无?一8.令尤=2,=y2-y2=17-6x2+8=l.故

选C.

19.2015年年岁史诗大剧《芈月传》风靡大江南北,影响力不亚于以前的《甄娘传》.某记

者调查了大量《芈月传》的观众,发现年龄段与爱看的比例存在较好的线性相关关系,年龄

在口0,14],[15,19],[20,24],[25,29],[30,34]的爱看比例分别为10%,18%,20%,

30%,/%.现用这5个年龄段的中间值x代表年龄段,如12代表[10,14],17代表[15,19],

根据前四个数据求得%关于爱看比例V的线性回归方程为),=(依-4.68)%,由此可推测t

的值为

A.33B.35

C.37D.39

【试题来源】广西高三上学期教育质量诊断性联合考试(理)

【答案】B

【解析】前4个数据对应的元=19.5,3=0.195(把百分数转化为小数),

而y=(a-4.68)%=云一00468,.。195=晟19.5—0.0468,.,工=0.0124,

y=(1.24x-4.68)%,当x=^^^=32,r=1.24x32-4.68=35.

20.给出下列说法:

①回归直线$=良+&恒过样本点的中心(x,y),且至少过一个样本点:

②两个变量相关性越强,则相关系数I网就越接近1;

③将一组数据的每个数据都加一个相同的常数后,方差不变;

④在回归直线方程3=2-0.5x中,当解释变量x增加一个单位时,预报变量亍平均减少0.5

个单位.

其中说法正确的是

A.①@④B.②③④

C.①③④D.②④

【试题来源】2021年高考数学(文)【热点重点难点】专练

【答案】B

【分析】①中,根据回归直线方程的特征,可判定是不正确;②中,根据相关系数的意义,

可判定是是正确的;③中,根据方差的计算公式,可判定是正确的;④中,根据回归系数的

含义,可判定是正确的.

【解析】对于①中,回归直线?=淡+&恒过样本点的中心点J),但不一定过一个样本点,

所以不正确;对于②中,根据相关系数的意义,可得两个变量相关性越强,则相关系数1川

就越接近1,所以是正确的;对于③中,根据方差的计算公式,可得将一组数据的每个数据

都加一个相同的常数后,方差是不变的,所以是正确的;对于④中,根据回归系数的含义,

可得在回归直线方程亍=2-0.5x中,当解释变量x增加一个单位时,预报变量亍平均减少

0.5个单位,所以是正确的.故选B.

二、多选题

1.下列有关样本线性相关系数『的说法,正确的是

A.相关系数r可用来衡量x与y之间的线性相关程度

B.|田且忻越接近0,相关程度越小

C.且仍越接近1,相关程度越大

D.卜区1,且川越接近1,相关程度越小

【试题来源】2020-2021学年高二数学单元测试定心卷(人教B版2019选择性必修第二册)

【答案】ABC

【解析】相关系数是来衡量两个变量之间的线性相关程度的,线性相关系数是一个绝对值小

于等于1的量,并且它的绝对值越大就说明相关程度越大,故选ABC.

2.2019年女排世界杯是由国际排联(FIVB)举办的第13届世界杯赛事,比赛于2019年9月

14日至9月29日在日本举行,共有12支参赛队伍.最终,中国女排以11战全胜且只丢3

局的,成绩成功卫冕本届世界杯冠军.中国女排的影响力早已超越体育本身的意义,不仅是

时代的集体记忆,更是激励国人持续奋斗、自强不息的精神符号.以下是本届世界杯比赛最

终结果的相关数据,记前6名球队中,每个队的胜场数为变量:x,积分为变量》(只列出

了前6名).

排名123456

胜场数11108766

积分y322823211918

若y与x之间具有线性相关关系,.根据表中数据可求得y关于x的回归直线方程为

y=2.59x+a,则下列说法正确的有

A.。的值为2.78

B.a的值为2.14

C.若整队在此次比赛中获胜的场数是4,根据线性回归方程其得分为13分(精确到整数).

D.由线性回归方程可知,当某个队伍胜场增加1场时,其积分约增加2.59分.

【试题来源】广东省2021届高三上学期10月联考

【答案】ACD

--47

【解析】由题知,x=8,)'=彳等,代入方程y=2.59x+a,计算得a=2.78,故A正

确,B不正确;将x=4代入方程y=2.59x+2.78,计算得y=13.14^13,故C正确;

回归方程中x的系数是2.59,故。正确.故选ACQ.

3.为了研究某种病毒在特定环境下随时间变化的繁殖情况,得到了一些数据,绘制成散点

图,发现用模型y=ce"拟合比较合适.令z=lny,得到z=1.3x+a,经计算发现满

足下表:

天数工(天)23456

Z1.54.55.56.57

A.c-e-0.2B.Z=1.3

c.c=e°-2D.4=—1.3

【试题来源】2020-2021年新高考高中数学一轮复习对点练

【答案】AB

【分析】先求工1,利用线性回归方程必过(.习,求出。,再利用对数运算求解即可.

2+3+4+5+6_1.5+4.5+5.5+6.5+7.

【解析】因为]=二4,z=-------------------=5,

55

所以z=1.3x+a的中心点为(4,5),代入z=1.3x+a,可得a=5—1.3x4=-0.2,

由z=lny,y=cek',则z=In="+lnc,所以女=L3,lnc=a=-0.2,

即c=e”-2.故选AB.

4.下列说法中正确的是

A.对于独立性检验,X2的值越大,说明两事件的相关程度越大

B.以模型y=ceh去拟合一组数据时,为了求出回归方程,设z=lny,将其变换后得到

线性方程z=0.3X+4,则c,k的值分别是不和0.3

C.在具有线性相关关系的两个变量的统计数据所得的回归直线方程$,=4+%中,

6=2,5=1,尸=3,则4=1

D.通过回归直线$=以+6及回归系数人可以精确反映变量的取值和变化趋势

【试题来源】对点练66独立性检验-2020-2021年新高考高中数学一轮复习对点练

【答案】ABC

【解析】对于A,根据独立性检验的性质知,X?的值越大,说明两个事件的相关程度越大,

故4正确;对于5,由^=。心‘,两边取自然对数,可得lny=lnc+Ax,

.fInc=4,[c=e4,

z=lny,则2="+111。,因为z=0.3x+4,所以o,则〈故8正确;

[k=0.3,[k=Q.3,

对于C,由于回归直线过点(耳刃,£=尸一位=3-2x1=1,故C正确;

对于。,通过回归直线a=Ar+&及回归系数A,可预测变量的取值和变化趋势,故。错

误.故选A8C.

5.某电子商务平台每年都会举行“年货节”商业促销狂欢活动,现统计了该平台从2012年到

2020年共9年“年货节”期间的销售额(单位:亿元)并作出散点图,将销售额y看成以年

份序号x(2012年作为第1年)的函数.运用exce/软件,分别选择回归直线和三次函数回

归曲线进行拟合,效果如下图,则下列说法正确的是()

•y(亿元)

----线性(y(亿元))

——多项式(y(亿元))

x

B.销售额y与年份序号x线性相关不显著

c.三次函数回归曲线的拟合效果好于回归直线的拟合效果

D.根据三次函数回归曲线可以预测2021年“年货节''期间的销售额约为8454亿元

【试题来源】重庆市南开中学2021届高三上学期第四次质量检测

【答案】AC

【分析】根据图象的走势左下到右上可判断A;由相关系数的绝对值越大拟合效果越好可判

断B、C;令x=11,代入三次函数求出>值即可判断D.

【解析】根据图象可知,散点从左下到右上分布,销售额)与年份序号》呈正相关关系,故

A正确;因为相关系数0.936>0.75,靠近1,销售额y与年份序号X线性相关显著,B错

误.根据三次函数回归曲线的相关指数0.999>0.936,相关指数越大,拟合效果越好,所

以三次多项式回归曲线的拟合效果好于回归直线的拟合效果,C正确;由三次多项式函数

y=0.168x3+28.14lx2-29.027%+6.889,当x=ll时,y=3316.26亿元,D错误;故

选AC.

6.2020年3月15日,某市物价部门对5家商场的某商品一天的销售量及其价格进行调查,

5家商场的售价x(元)和销售量y(件)之间的一组数据如表所示:

价格X99.51010.511

销售量y1110865

按公式计算,y与X的回归直线方程是y=—3.2x+a,相关系数卜1=0.986,则下列说法

正确的有

A.变量X,y线性负相关且相关性较强B,,=40

C.当x=8.5时,y的估计值为12.8D.相应于点(10.5,6)的残差约为0.4

【试题来源】湖南省湖湘名校教育联合体2021届高三入学考试

【答案】ABC

【分析】根据相关性、相关系数判断A选项的正确性.利用样本中心点判断B选项的正确

性.将%=8.5代入回归直线方程,由此判断C选项的正确性.求得x=10.5时y的估计值,

进而求得对应的残差,从而判断D选项的正确性.

【解析】对A,由表可知y随8增大而减少,可认为变量x,y线性负相关,旦由相关系数

"=0.986可知相关性强,故A正确.

_1_1

对B,价格平均x=^(9+9.5+10+10.5+11)=10,销售量y=g(l1+10+8+6+5)=8.

故回归直线恒过定点(10,8),故8=-3.2xl0+ana=40,故B正确.

对C,当x=8.5时,y=-3.2x8.5+40=12.8,故C正确.

对D,相应于点(10.5,6)的残差2=6-(-3.2乂10.5+40)=-0.4,故口不正确.故选ABC

7.设(xi,yi),(X2,y2),…,(x,”y")是变量x和y的〃对数据,直线/是由这些样本点通过

最小二乘法得到的线性回归直线,如图所示,则以下结论正确的是

A.直线/过点叵J)

B.回归直线必通过散点图中的多个点

C.x和y的相关系数在一1和0之间

D.当〃为偶数时,分布在/两侧的样本点的个数一定相同

【试题来源】2020-2021学年高二数学单元测试定心卷(人教B版2019选择性必修第二册)

【答案】AC

【分析】由回归直线一定过这组数据的样本中心对A进行分析,两个变量的相关系数不是

直线的斜率,两个变量的相关系数的绝对值是小于1的,并在-1与1之间,所有的样本点

集中在回归直线附近,没有特殊的限制,据此对B、C、D进行分析,即可得到答案.

【解析】对于A:由回归直线一定过这组数据的样本中心可得A是正确的;

对于B:回归直线可以不经过散点图中的任何点,故B错误;

对于C:由题设中提供的直线的图象可知x和y是负相关,相关系数在一1到0之间,故C

正确;对于D:分布在/两侧的样本点的个数不•定相同,故D错误.故选AC

8.2020年的“金九银十”变成“铜九铁十”,全国各地房价"跳水”严重,但某地二手房交易却

“逆市”而行.下图是该地某小区2019年12月至2020年12月间,当月在售二手房均价(单

位:万元/平方米)的散点图.(图中月份代码1〜13分别对应2019年12月〜2020年12月)

八当月在手二手房

L04一均价卜....

1.02-••*•

1.00-••

0.98-•*

0.96-*

0.94-

1।।।।।।।।1।।।*

°12345678910111213月份代码x

根据散点图选择旷=。+/7«和丁=。+,111%两个模型进行拟合,经过数据处理得到的两个

回归方程分别为》=0.9369+0.02856和y=0.9554+0.03061nx,并得到以下一些统

计量的值:

>=0.9369+0.02856y=0.9554+0.0306Inx

R20.9230.973

注:亍是样本数据中x的平均数,了是样本数据中丁的平均数,则下列说法正确的是

A.当月在售二手房均价y与月份代码工呈负相关关系

B.由y=0.9369+0.0285«预测2021年3月在售二手房均价约为1.0509万元/平方米

C.曲线y=().9369+0.0285&与y=0.9554+0.0306Inx都经过点门,N)

D.模型y=0.9554+0.03061nx回归曲线的拟合效果比模型y=0.9369+0.02856的好

【试题来源】江苏省常州市四校联考2020-2021学年高三上学期期末

【答案】BD

【分析】根据散点图的分布可判断A选项的正误;将x=16代入回归方程

>=0.9369+0.02856可判断B选项的正误;根据非线性回归曲线不一定经过(H)可

判断C选项的正误:根据回归模型的拟合效果与R2的大小关系可判断D选项的正误.

【解析】对于A,散点从左下到右上分布,所以当月在售二手房均价y与月份代码x呈正相

关关系,故A不正确;对于B,令x=16,111,y=0.9369+0.0285J话=1.0509

所以可以预测2021年2月在售二手房均价约为1.05091.0509万元/平方米,故B正确;

对于C,非线性回归曲线不一定经过缶,故C错误;

对于D,R2越大,拟合效果越好,由0.923<0.973,故D正确.故选BD

9.下列命题中正确的有

A.对立事件一定是互斥事件,但互斥事件不一定是对立事件

B.两个随机变量的线性相关系数越大,则两个变量的线性相关性越强

C.回归直线§=队+2必过样本点的中心

D.相关指数后越大,则模型的拟合效果越好

【试题来源】湖北省黄冈市2020-2021学年高二上学期期末

【答案】ACD

【分析】利用回归直线方程的性质,关系数,相关指数的性质,互斥事件以及对立事件的关

系,演绎推理的定义逐一分析给定四个结论的真假,可得答案.

【解析】对于A:互斥事件不一定是对立事件,对立事件一定是互斥事件,所以A正确;

对于B:两个随机变量的线性相关系数的绝对值越大(越接近1),则两个变量的线性相关

性越强,故B错误;

对于C:回归直线y=机+加必过样本点的中心,故C正确;

对于D:在线性回归模型中,相关指数R2越接近于1,则模型回归效果越好,故D正确:

故选ACD

10.关于变量x,y的〃个样本点(西,,(马,叫),…,(%,”)及其线性回归方程.亍=浪+方,

下列说法正确的有

A.相关系数r的绝对值W越接近0,表示x,y的线性相关程度越强

B.相关指数R2的值越接近1,表示线性回归方程拟合效果越好

C.残差平方和越大,表示线性回归方程拟合效果越好

1n1n

D.若亍=一工如y=一£”,则点(元/一定在线性回归方程$=九+方上

n;=in;=1

【试题来源】江苏省宿迁中学、如东中学、阜宁中学三校2020-2021学年高三上学期八省联

考前适应性考试

【答案】BD

【分析】根据回归分析的相关知识,逐一分析四个选项的正误即可.相关系数的绝对值越接

近0,线性相关度越弱.相关指数表示拟合效果的好坏,指数越大,拟合程度越好.残差平

方和越小,拟合程度越好.线性回归方程一定过样本中心点.

【解析】根据线性相关系数的意义可知,当「的绝对值越接近于。时,

两个随机变量线性相关性越弱,则A错误;

用相关指数R2来刻画回归效果,R2越大,说明模型的拟合效果越好,则B正确;

拟合效果的好坏是由残差平方和来体现的,残差平方和越大,拟合效果越差,则C错误;

样本中心点一定在回归直线上,则D正确.故选BD.

三、填空题

1.为了比较甲、乙、丙、丁四组数据的线性相关性的强弱,某人分别计算了甲、乙、丙、丁四组

数据的线性相关系数,其数值分别为-0.95,0.87,0.58,0.92,则这四组数据中线性相关

性最强的是组数据.

【试题来源】山西省2019-2020学年高二下学期6月联考(文)

【答案】甲

【分析】根据线性相关性与相关系数的关系判断.

【解析】因为线性相关系数的绝对值越大,线性相关性越强,所以甲组数据的线性相关性最

强.故答案为甲.

【名师点睛】本题考查相关系数的概念,相关系数反应了两个变量相关性的强弱,相关系数

的绝对值越大,相关性越强,反之越弱.

2.对于一组数据的两个函数模型,其残差平方和分别为151.3和189,若从中选取一个拟合

效果好的函数模型,应选残差平方和为的那个.

【试题来源】宁夏银川市宁大附中2019-2020学年高二线上线下教学衔接摸底暨期中考试

(文)

【答案】151.3

【分析】由于残差的平方和越小,其拟合效果就越好,从而可得到答案.

【解析】因为残差的平方和是用来描述n个点与相应回归方程在整体的接近程度,残差的平

方和越小,其拟合效果就越好,又由于151.3<189,所以拟合效果好的残差平方和为151.3

的那个模型,故答案为151.3.

[名师点睛】此题考查的是线性回归方程,为了描述n个点与相应回归方程在整体的接近程

度,可以用残差的平方和来描述,残差的平方和越小,其拟合效果就越好,属于基础题.

3.在一组样本数据(玉,x),(%2,/2),…,(七,%)"N2,X],》2,…,Z互不相等)

的散点图中,若所有样本点

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论