




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
专题36相关关系与线性回归模型及其应用
一、单选题
1.(2020・四川宜宾•期末(文))两个变量y与X的回归模型中,有4个不同模型的相关指数R2如下,其中
拟合效果最好的是()
A.R*2*45=0.96B.R2=0.81c.R2=0.50D.R2=0.25
2.(2020.内蒙古赤峰.期末(文))某服装厂引进新技术,其生产服装的产量X(百件)与单位成本》(元)
满足回归直线方程9=100.36-14.2x,则以下说法正确的是()
A.产量每增加100件,单位成本约下降14.2元
B.产量每减少100件,单位成本约上升100.36元
C.产量每增加100件,单位成本约上升14.2元
D.产量每减少100件,单位成本约下降14.2元
3.(2020•雅安市教育科学研究所期末(理))如图所示,5组数据(X,〉)中去掉0(3,10)后,下列说法错
误的是()
叶*£(10,12)
,0(3.10)
•C(4.5)
・8(2.4)
*A(1.3)
cnx
A.残差平方和变大B.相关系数r变大
C.相关指数R2变大D.解释变量x与预报变量y的相关性变强
4.(2020・陕西富平期末(文))在一组样本数据(%,%),(孙必),…,(王,州)(〃-2,N,/,…,血不全相等)
的散点图中,若所有样本点(x,,y)(i=都在直线y=Q.4x+1±,则这组样本数据的样本相关系数
为()
A.-1B.0.4C.0.5D.1
5.(202。邵阳市第二中学其他(文))某种产品的广告费支出X与销售额》(单位:万元)之间有如表关系,
N与X的线性回归方程为j=6.5x+17.5,当广告支出5万元时,随机误差的效应(残差)为()
X24568
y3040605070
A.10B.20C.30D.40
6.(2020•福建三明•期末)对于一组具有线性相关关系的数据=根据最小二乘法求
得回归直线方程为¥=为矢+%,则以下说法正确的是()
A.至少有一个样本点落在回归直线§,=乐+%上
B.预报变量y的值由解释变量x唯一确定
C.相关指数R2越小,说明该模型的拟合效果越好
D.在残差图中,残差点分布水平带状区域的宽度越窄,则回归方程的预报精确度越高
7.(2020•陕西省商丹高新学校期中(文))某公司某件产品的定价x与销量y之间的数据统计表如下,根据
数据,用最小二乘法得出y与X的线性回归直线方程为:y=6.5x+17.5,则表格中n的值应为()
X24568
y3040n5070
A.45B.50C.55D.60
8.(2020•山西期末(文))对两个变量丁和X进行回归分析,得到一组样本数据:(玉,%)、(%,%)、…、
(七,%),则下列说法中不正确的是()
A.由样本数据得到的回归方程¥=凯+舌必过样本中心伉亍)
B.残差平方和越大的模型,拟合的效果越好
C.用相关指数R?来刻画回归效果,解越大,说明模型的拟合效果越好
D.若变量>和X之间的相关系数为r=-0.9362,则变量y和X之间具有线性相关关系
二、多选题
9.(2020•山东淄博・期末)下列说法正确的是()
A.对于独立性检验,随机变量K?的观测值后值越小,判定“两变量有关系''犯错误的概率越小
B.在回归分析中,相关指数R?越大,说明回归模型拟合的效果越好
C.随机变量J~8(〃,〃),若£(x)=30,D(x)=20,则〃=45
D.以〉=上心拟合一组数据时,经z=lny代换后的线性回归方程为l=o.3x+4,则c=e4,A:=0.3
10.(2020.山东荷泽・期末)以下四个命题中,其中正确的是()
A.已知两个变量具有线性相关关系,其回归直线方程为y=4+bx,若b=2,x=l,y=3,贝Ija=l.
B.两个随机变量相关性越强,则相关系数的绝对值越接近于0
C.在回归直线方程y=0.2x+12中,当变量X每增加一个单位时,则变量y平均增加0.2个单位;
D.以模型y=ceM去拟合一组数据时,为了求出回归方程,设z=lny,将其变换后得到线性方程
z=0.3x+4,则c=e3k=0.3
11.(2020•陕西新城•西安中学其他(理))下列说法错误的是()
A.回归直线过样本点的中心伉亍)
B.两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1
C.在回归直线方程y=0.2x+0.8中,当解释变量X每增加1个单位时,预报变量y平均增加0.8个单位
D.对分类变量x与y,随机变量K?的观测值越大,则判断“x与y有关系的把握程度越小
12.(2020・湖北期末)下列说法中正确的是()
A.将一组数据中的每一个数据都加上或减去同一个常数后,方差不变
B.设有一个线性回归方程£=3-5x,变量x增加1个单位时,9平均增加5个单位
C.设具有相关关系的两个变量的相关系数为小则1川越接近于0,X和>之间的线性相关程度越强
D.在一个2x2列联表中,由计算得K?的值,则K?的值越大,判断两个变量间有关联的把握就越大
三、填空题
13.(2020.海南枫叶国际学校期中)某设备的使用年限X与所支出的维修费用》的统计数据如下表:
使用年限X(单位:年)23456
维修费用y(单位:万元)1.54.55.56.57.0
根据上表可得回归直线方程为y=L3x+a,据此模型预测,若使用年限为14年,估计维修费约为
__________万元.
14.(2020•吉林高二期末(文))下列关于回归分析的说法中错误的序号为
(1)残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越高.
(2)回归直线一定过样本中心点门,亍).
(3)两个模型中残差平方和越小的模型拟合的效果越好.
(4)甲、乙两个模型的R2分别约为0.88和0.80,则模型乙的拟合效果更好.
15.(2020•黑龙江高二期末(文))下列命题中,正确的命题有.①回归直线§=米+%恒过样本点中
心且至少过一个样本点;②用相关指数R2来刻画回归效果,表示预报变量对解释变量变化的贡献
率,R2越接近于1说明模型的拟合效果越好;③残差图中残差点比较均匀的落在水平的带状区域中,说明
选用的模型比较合适;④两个模型中残差平方和越大的模型的拟合效果越好.
16.(2018•北京全国•高二单元测试(理))关于x与有如下数据有如下的两个模型:(1)力=6.5x+17.5;
(2)9=7x+17.通过残差分析发现第(1)个线性模型比第(2)个拟合效果好,则R;,
。2(用大于,小于号填空,尺。是相关指数和残差平方和)
X24568
y3040605070
四、解答题
17.(2020.全国高考真题(理))某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.
为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方
法抽取20个作为样区,调查得到样本数据出,>•,)(/=1,2,20),其中兑和y,•分别表示第i个样区的植物
202020
覆盖面积(单位:公顷)和这种野生动物的数量,并计算得Zx,=60,》>=1200,2(芭-君2=80,
i=\i=\i=l
2020
一"=9000,Z(x,一k(y,一切=800.
i=li=l
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均
数乘以地块数);
(2)求样本(Xi,y,)(/=l,2,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物
数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
Z(Xj-亍)(y-刃
附:相关系数尸I“,&N1.414.
JI?%-而吃(y_»
Vi=l/=1
18.(2016•全国高考真题(文))下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折
线图.
4
・
B?a
a
-
*
N
奥a
ss
iH
}i
(I)由折线图看出,可用线性回归模型拟合y与f的关系,请用相关系数加以说明;
(II)建立y关于f的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
附注:
77
参考数据:\>=9.32,=40.17,
/=1/=1
Z(y._5)2=0.55,币-2.646.
/=1
f7)(y,一刃
i=l
参考公式:相关系数「=
Zu-o2Z(y,-y)2
/=1/=1
-E«-D(x-7)
回归方程y=a+加中斜率和截距的最小二乘估计公式分别为:务-——n,a=y-bT.
2
i=\
19.(2020.吉林济北.白城一中期末(理))为了解某地区某种产品的年产量x(单位:吨)对价格y(单位:
千元/吨)和利润z的影响,对近五年该农产品的年产量和价格统计如下表:
X12345
y7.06.55.53.82.2
(1)求y关于x的线性回归方程A=BX+4;
(2)若每吨该农产品的成本为2千元,假设该农产品可全部卖出,预测当年产量为多少时,年利润Z取到
最大值?(保留两位小数)
2LU,.-x)(y).-y)》•,.»一呵AA
参考公式:族=上匕------------=号----------,=y-J
S(x,.-J)2Z尤;—加.
/=1i=l
20.(2020•渝中•重庆巴蜀中学月考(文))2020年初,武汉出现新型冠状病毒肺炎疫情,并快速席卷我国其
他地区,口罩成了重要的防疫物资.某口罩生产厂不断加大投入,高速生产,现对其2月1日~2月9日连续
9天的日生产量达(单位:十万只,》=1,2,…,9)数据作了初步处理,得到如图的散点图及一些统计量的
99
5Zj
yz
/=1/=!
2.7219139.091095
19
注:图中日期代码1、9分别对应2月1日~2月9日;表中z:=e”,z.
9:=1
(1)由散点图分析,样本点都集中在曲线y=ln®+a)的附近,请求),关于r的方程y=ln®+a);
(2)利用(1)中所求的方程估计该厂从什么时候开始日生产量超过四十万只.
Z(〃,一R)3,-B)Zm-n下
参考公式:回归直线方程是丫=加+应时,/=「;-------------T-------------,a=v-pp.
t";-丽2
i=l/=1
参考数据:e4=54.6.
21.(2020•福建三明•期末)“双十一”是阿里巴巴从2009年起举办的一个全民购物狂欢活动.11年来,天猫
“双十一”交易额年年创新高,为预测2020年“双十一”的交易额,收集了历年天猫“双十一”活动的交
易额》(亿元),对数据作了初步处理,得到下面的散点图及一些统计量的值.
注:年份代码1T1分别对应年份2009-2019
Z(叱-对(%-y)
11iiii
Zx-/=1/=1
11_
打,力z2
f=lf=l<=1
f=l/=1
66979050615222
_III
表中吗==,卬二百2叱.
11/=]
(1)根据散点图判断,§与>=展+力2哪一个适宜作为交易额y关于时间变量,的回归方程类型?
(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立>关于,的回归方程,并预测2020年“双十一”的交易额.
附:对于一组数据(%,匕),(%,%),…,(""""),其回归直线$=&+4的斜率和截距的最小二乘估计
分别为夕二上——二^a=y_/3u-
/=!
22.(2020•福建福州•期末)某种新产品投放市场一段时间后,经过调研获得了时间工(天数)与销售单价V
(元)的一组数据,且做了一定的数据处理(如表),并作出了散点图(如图).
101010
X(x..-x)(y,.-y)
Z(叱-可2
XywZ(叱-访)(v-y)
/=!/=!7=11=1
1.6337.80.895.150.92-20.618.40
1-1A
表中吗=一,.=>吗
xi1Ui=\
(1)根据散点图判断,夕=4+邑:与哪一个更适合作价格>关于时间》的回归方程类型?(不
X
必说明理由)
(2)根据判断结果和表中数据,建立y关于X的回归方程.
(3)若该产品的日销售量g(x)(件)与时间x的函数关系为g(x)==F+120(xeN*),求该产品投
放市场第几天的销售额最高?最高为多少元?
附:对于一组数据(/,匕),(“2,%),(%,匕)-”(〃",匕,),其回归直线u=a+P”的斜率和截距的最小二乘法
估计分别为B=口.....——,方=v-.
!(«,-«)
/=1
专题36相关关系与线性回归模型及其应用
一、单选题
1.(2020・四川宜宾•期末(文))两个变量y与X的回归模型中,有4个不同模型的相关指数R2如下,其中
拟合效果最好的是()
A.R2=0.96B.R2=0.81C./?2=0.50D.R2=0.25
【答案】A
【解析】
两个变量y与%的回归模型中,相关指数R2越大,拟合效果越好,
,/0.96>0.81>0.50>0.25,
,拟合效果最好的是R2=o.96,
故选:A-
2.(2020.内蒙古赤峰.期末(文))某服装厂引进新技术,其生产服装的产量X(百件)与单位成本》(元)
满足回归直线方程夕=100.36—14.2x,则以下说法正确的是()
A.产量每增加100#,单位成本约下降14.2元
B.产量每减少100件,单位成本约上升100.36元
C.产量每增加100件,单位成本约上升14.2元
D.产量每减少100件,单位成本约下降14.2元
【答案】A
【解析】
5=-14.2<0表示产量每增加100件,单位成本约下降14.2元,
故选:A
3.(2020•雅安市教育科学研究所期末(理))如图所示,5组数据(羽),)中去掉0(3,10)后,下列说法错
误的是()
yA*£(10,12)
,D(3.10)
•C(4.5)
•8(2.4)
*4(1,3)
A.残差平方和变大B.相关系数「变大
C.相关指数R2变大D.解释变量x与预报变量y的相关性变强
【答案】A
【解析】
由散点图知I,去掉。(3,10)后,y与x的线性相关加强,且为正相关,
所以「变大,店变大,残差平方和变小.
故选A-
4.(2020•陕西富平•期末(文))在一组样本数据(3,x),(w,y2),…,(乙,%)(〃-2,项,马,…,X”不全相等)
的散点图中,若所有样本点(七,%)«=1,2「一,〃)都在直线>=().4%+1上,则这组样本数据的样本相关系数
为()
A.-1B.0.4C.0.5D.1
【答案】D
【解析】
因为所有样本点(%,%)"=1,2,…都在直线y=0.4x+1上,
所以这组数据完全相关,
即说明这组数据完全正相关,相关系数为1.
故选:D
5.(2020.邵阳市第二中学其他(文))某种产品的广告费支出x与销售额》(单位:万元)之间有如表关系,
丁与x的线性回归方程为;=6.5X+17.5,当广告支出5万元时,随机误差的效应(残差)为()
X24568
y3040605070
A.10B.20C.30D.40
【答案】A
【解析】
因为,与x的线性回归方程为;=6.5X+17.5,
所以当x=5时,(=6.5x5+17.5=50
由表格当广告支出5万元时,销售额为6()万元,所以随机误差的效应(残差)为60—50=10
故选A.
6.(2020・福建三明・期末)对于一组具有线性相关关系的数据a,y)(i=l,2,%••,〃),根据最小二乘法求
得回归直线方程为,=队+》,则以下说法正确的是()
A.至少有一个样本点落在回归直线,=加+》上
B.预报变量y的值由解释变量x唯一确定
C.相关指数R2越小,说明该模型的拟合效果越好
D.在残差图中,残差点分布水平带状区域的宽度越窄,则回归方程的预报精确度越高
【答案】D
【解析】
对于一组具有线性相关关系的数据(七,丫),可能所有的样本点都不在回归直线§=鼠+%上,故A不正确;
预报变量y的值由解释变量x进行估计,所以B不正确;
相关系数火2越小,残差的平方和越大,说明该模型的拟合效果越不好,所以C不正确;
在残差图中,残差点分布水平带状区域的宽度越窄,则回归方程的预报精确度越高,所以D正确.
故选:D.
7.(2020•陕西省商丹高新学校期中(文))某公司某件产品的定价x与销量y之间的数据统计表如下,根据
数据,用最小二乘法得出y与x的线性回归直线方程为:y=6.5x+17.5,则表格中n的值应为()
X24568
y3040n5070
A.45B.50C.55D.60
【答案】D
【解析】
由题得样本中心点(5,190+7-7),所以1比90二+〃=6.5x5+17.5,.•.“=60.
故答案为D
8.(2020.山西期末(文))对两个变量>和x进行回归分析,得到一组样本数据:(%,y)、(孙必)、…、
(乙,丹),则下列说法中不正确的是()
A.由样本数据得到的回归方程§=乳+%必过样本中心(x,y)
B.残差平方和越大的模型,拟合的效果越好
C.用相关指数齐来刻画回归效果,R?越大,说明模型的拟合效果越好
D.若变量y和X之间的相关系数为r=-0.9362,则变量y和X之间具有线性相关关系
【答案】B
【解析】
对于A选项,回归直线¥=鼠+£必过样本的中心存,亍),A选项正确;
对于B选项,残差平方和越大的模型,拟合的效果越差,B选项错误;
对于C选项,用相关指数收来刻画回归效果,解越大,说明模型的拟合效果越好,C选项正确;
对于D选项,若变量y和X之间的相关系数为r=-0.9362,则变量y和X之间具有较强的线性相关关系,
D选项正确.
故选:B.
二、多选题
9.(2020•山东淄博・期末)下列说法正确的是()
A.对于独立性检验,随机变量K?的观测值后值越小,判定“两变量有关系''犯错误的概率越小
B.在回归分析中,相关指数R2越大,说明回归模型拟合的效果越好
C.随机变量自~8(〃,〃),若E(x)=30,D(x)=20,则〃=45
D.以丁=窿就拟合一组数据时,经z=lny代换后的线性回归方程为]=O.3X+4,则c=e3A:=0.3
【答案】BD
【解析】选项A:对于独立性检验,随机变量K?的观测值化值越小,判定“两变量有关系”犯错误的概率越
大,故选项A错误;
选项B:在回归分析中,相关指数R2越大,残差平方和越小,说明回归模型拟合的效果越好,故选项B正
确;
选项C:随机变量J〜3(〃〃),若石(力=30,D(x)=20,则〜,二、”,解得:n=90,
、/\,I=np(l-/?)=20
故选项C错误;
选项D:因为丫=。6丘,所以Iny=In(ce"v)=lnc+lne"=Inc+依,令z=lny,
则1=Inc+依,又1=0.3x+4,所以lnc=4,&=0.3,则。=/,%=0.3,故选项D正确.
故选:BD.
10.(2020.山东蒲泽•期末)以下四个命题中,其中正确的是()
A.已知两个变量具有线性相关关系,其回归直线方程为y=a+法,若。=2,嚏=1,亍=3,则。=1.
B.两个随机变量相关性越强,则相关系数的绝对值越接近于0
C.在回归直线方程y=0.2x+12中,当变量X每增加一个单位时,则变量>平均增加0.2个单位;
D.以模型y=去拟合一组数据时,为了求出回归方程,设z=lny,将其变换后得到线性方程
z=0.3x+4,则c=e",k—0.3
【答案】ACD
【解析】对于选项A,b=2,x=\,亍=3代入回归直线方程为y=即3=。+2,则。=1,正确;
对于选项B,两个随机变量相关性越强,则相关系数的绝对值越接近于1,错误;
对于选项C,在回归直线方程y=0.2x+12中,当变量x增加一个单位时,则变量
y=0.2(x+1)+12=0.2x+12+0.2平均增加0・2个单位,正确;
对于选项D,对旷=ce''两边取对数得Iny=lnc+依,设z=lny,则2="+皿。,与z=().3x+4比较
得,则4=lnc,k=0.3,即c=e“,正确.
故选:ACD.
11.(2020•陕西新城•西安中学其他(理))下列说法错误的是()
A.回归直线过样本点的中心(x,y)
B.两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1
C.在回归直线方程y=o.2x+o.8中,当解释变量X每增加1个单位时,预报变量y平均增加0.8个单位
D.对分类变量X与V,随机变量K?的观测值越大,则判断“X与y有关系”的把握程度越小
【答案】CD
【解析】
A.回归直线必过样本点的中心存,亍),故A正确;
B.两个随机变量相关性越强,则相关系数的绝对值越接近1,故B正确:
C.在线性回归方程y=0.2x+0.8中,当无每增加1个单位时,预报量平均增加0.2个单位,故C错误;
D.对分类变量x与丫的随机变量K2的观测值后来说,女越大,“x与y有关系”可信程度越大,因此
不正确.
综上可知:有CD不正确.
故选:CD.
12.(2020・湖北期末)下列说法中正确的是()
A.将一组数据中的每一个数据都加上或减去同一个常数后,方差不变
B.设有一个线性回归方程3=3-5x,变量x增加1个单位时,亍平均增加5个单位
c.设具有相关关系的两个变量的相关系数为广,则I川越接近于o,x和y之间的线性相关程度越强
D.在一个2x2列联表中,由计算得R2的值,则A:?的值越大,判断两个变量间有关联的把握就越大
【答案】AD
【解析】
将一组数据中的每一个数据都加上或减去同一个常数后,方差不变,满足方差的性质,A正确;
设有一个线性回归方程g=3—5x,变量x增加1个单位时,》平均减少5个单位;所以B不正确;
设具有相关关系的两个变量x,),的相关系数为r,则越接近于0,x和y之间的线性相关程度越弱,所以
C不正确;
在一个2X2列联表中,由计算得R2的值,则尺2的值越大,判断两个变量间有关联的把握就越大,所以D
正确;
故选:AD.
三、填空题
13.(2020•海南枫叶国际学校期中)某设备的使用年限X与所支出的维修费用》的统计数据如下表:
使用年限X(单位:年)23456
维修费用y(单位:万元)1.54.55.56.57.0
根据上表可得回归直线方程为y=1.3x+a,据此模型预测,若使用年限为14年,估计维修费约为
__________万元.
【答案】18
【解析】
_2+3+4+5+6,_1.5+4.5+5.5+6.5+7.0「
x=-------------------=4,y=--------------------------------=5,
则中心点为(4,5),代入回归直线方程可得2=5—1.3><4=-0.2,>=1.3%-0.2.
当x=14时,>=1.3x14-0.2=18(万元),
即估计使用14年时,维修费用是18万元.
故答案为:18.
14.(202。吉林高二期末(文))下列关于回归分析的说法中错误的序号为
(1)残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越高.
(2)回归直线一定过样本中心点(耳亍).
(3)两个模型中残差平方和越小的模型拟合的效果越好.
(4)甲、乙两个模型的R2分别约为0.88和0.80,则模型乙的拟合效果更好.
【答案】(1)(4)
【解析】
对于(1),残差图中残差点所在的水平带状区域越窄,则回归方程的预报精确度越高,(I)错误;
对于(2),回归直线一定过样本中心点正确;
对于(3),两个模型中残差平方和越小的模型拟合的效果越好,正确;
对于(4),甲、乙两个模型的R2分别约为0.88和0.80,则模型甲的拟合效果更好,...(4)错误;
综上,错误的命题是(1)、(4)共2个.
故答案为:(1)(4).
15.(2020•黑龙江高二期末(文))下列命题中,正确的命题有.①回归直线§=院+》恒过样本点中心
(工习,且至少过一个样本点;②用相关指数收来刻画回归效果,表示预报变量对解释变量变化的贡献率,
心越接近于1说明模型的拟合效果越好;③残差图中残差点比较均匀的落在水平的带状区域中,说明选用
的模型比较合适;④两个模型中残差平方和越大的模型的拟合效果越好.
【答案】②③
【解析】
①回归直线生=舐+含恒过样本点中心但不一定过样本点,故错误:
②用相关指数用来刻画回归效果.在线性回归模型中,及示预报变量对解释变量变化的贡献率,R2越接近
于1说明模型的拟合效果越好,故正确;
③残差图中残差点比较均匀的落在水平的带状区域中,说明选用的模型比较合适;正确.
④两个模型中残差平方和越小的模型的拟合效果越好,故错误.
故答案为:②③
16.(2018•北京全国•高二单元测试(理))关于x与有如下数据有如下的两个模型:(l)》=6.5x+17.5;
⑵9=7x+17.通过残差分析发现第(1)个线性模型比第(2)个拟合效果好,则R:用,
2)02(用大于,小于号填空,尺。是相关指数和残差平方和)
X24568
y3040605070
【答案】〉<
【解析】
由相关指数心的的性质可得,
R2越大模型的拟合效果越好,所以R:>R;,
由残差的性质可得,
残差平方和越小模型的拟合效果越好,
所以故答案为>,<
四、解答题
17.(2020•全国高考真题(理))某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.
为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方
法抽取20个作为样区,调查得到样本数据(刘,如。=1,2,20),其中H和y分别表示第i个样区的植物
202020
覆盖面积(单位:公顷)和这种野生动物的数量,并计算得»>i=60,»=1200,2a,一君2=80,
i=li=li=l
2020
一歹)2=9000,£"一幻(y厂刃=800.
/=1/=i
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均
数乘以地块数);
(2)求样本3,y,)(i=l,2,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物
数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数尸—“^=,近句.414.
柩(不一君2f(%—方
Vf=li=l
【答案】(1)12000;(2)0.94;(3)详见解析
【解析】
120]
(1)样区野生动物平均数为右ZK=而x1200=60,
2U/=]2x)
地块数为200,该地区这种野生动物的估计值为200x60=12000
(2)样本(%%)«=1,2,20)的相关系数为
20
毕-x)(y-刃8002丘
r=,―=,=----«0.94
J厚Za-君7Zs。,•-切;780x90003
V/=i/=!
(3)由(2)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性,
由于各地块间植物覆盖面积差异很大,从俄各地块间这种野生动物的数量差异很大,
采用分层抽样的方法较好地保持了样本结构与总体结构得以执行,提高了样本的代表性,
从而可以获得该地区这种野生动物数量更准确的估计.
18.(2016•全国高考真题(文))下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折
线图.
4
・
歌
左
^
就
去
姿
会
掂
招
呼
(I)由折线图看出,可用线性回归模型拟合y与/的关系,请用相关系数加以说明;
(II)建立y关于r的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
附注:
参考数据:2%=9.32,27/=40.17,
/=1i=l
J与(y,-y)2=0-55,万=2.646.
f&-T)(X-9)
参考公式:相关系数厂=-----------------,
、力f吃(力一“
V/=1/=1
汽&-f)(y-力
回归方程y^a+bt中斜率和截距的最小二乘估计公式分别为:b■.一〃,a-y-ht.
Xd)2
i=l
【答案】(1)答案见解析;(II)答案见解析.
【解析】
(I)由折线图中数据和附注中参考数据得
7=4,X(C-F)2=28,再】£=0.55,
昌婚-落加-和EM-危魂=蛔弁-命獭嚣=雪部
¥-----二^二-----+以卿懒.
蒯鹫落既落笈胸懈
因为犀与诡的相关系数近似为0.99,说明蒙与4的线性相关相当高,从而可以用线性回归模型拟合展与密的
关系.
7
工(。一『)(丫一夕)2
932
(II)由y=-^—al.331及(I)得匕二
Z(r,-n2'
Z=1
a=1.331-0.103x4®0.92.
所以,静关于窗的回归方程为:族=瞰飕朴Wife.
将2016年对应的忌=娜代入回归方程得:族=顺驱朴凯,财螂=1够.
所以预测2016年我国生活垃圾无害化处理量将约1.82亿吨.
19.(2020.吉林洪北.白城一中期末(理))为了解某地区某种产品的年产量X(单位:吨)对价格>(单位:
千元/吨)和利润z的影响,对近五年该农产品的年产量和价格统计如下表:
X12345
y7.06.55.53.82.2
(1)求y关于x的线性回归方程$=%+祗
(2)若每吨该农产品的成本为2千元,假设该农产品可全部卖出,预测当年产量为多少时,年利润Z取到
最大值?(保留两位小数)
Z(王一君(其一刃2?戊一时AA
参考公式:2=J-----------=号----------,〃小一小
S(x,-x)2z#—国
/=1i=\
【答案】⑴5^=8.69-1.23%(2)x=2.72,年利润z最大
【解析】
(1)元=3,y=5,
55555
》=15,》=25,=62.7,A—=55,日;=55,
/=1/=1/=!/=1/=1
AA
解得:,=-1.23,=8.69,
ba
所以:y=8.69-1.23%,
(2)年利润z=x(8.69-1.23x)-2x=-1.23X2+6.69X
所以x=2.72,年利润z最大.
20.(2020・渝中・重庆巴蜀中学月考(文))2020年初,武汉出现新型冠状病毒肺炎疫情,并快速席卷我国其
他地区,口罩成了重要的防疫物资.某口罩生产厂不断加大投入,高速生产,现对其2月1日~2月9日连续
9天的日生产量X(单位:十万只,i=1,2,…,9)数据作了初步处理,得到如图的散点图及一些统计量的
值:
日生产量J
9
yz
;=l/=!
2.7219139.091095
19
注:图中日期代码1~9分别对应2月I日~2月9日;表中z,.=e»,z.
9i=i
(1)由散点图分析,样本点都集中在曲线y=ln(初+。)的附近,请求y关于/的方程>=ln(初+a);
(2)利用(1)中所求的方程估计该厂从什么时候开始日生产量超过四十万只.
E(A-A)(V,-V)£%匕一〃方
参考公式:回归直线方程是丫=6〃+6时,/=-------------=耳------------,a=v-pp.
E«,2-^2
参考数据:^4«54.6.
【答案】(1)y=ln(4r-l);(2)2月14日开始日生产量超过四十万只.
【解析】
y
(1);y=ln("+a),z=e=bt+a-
9
7=5,1=285,
/=1
9
>t-z--9t-'z
,1095-9x5x19)
二b=-----------=-----------=4,
285-9X52
i=l
a=z-bt=19-4x5=-l.
A^=ln(4r-l).
4[
(2)令ln(4,-1)>4,解得/>寸_,13.9,
:.t>\4,即该厂从2月14日开始日生产量超过四卜万只.
21.(2020•福建三明•期末)“双十一”是阿里巴巴从2009年起举办的一个全民购物狂欢活动.11年来,天
猫“双十一”交易额年年创新高,为预测2020年
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论