




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
高考数学考点复习一一成对数据的统计分析
考点一、相关关系的辨析
例1、下列说法错误的是()
A.正方体的体积与棱长之间的关系是函数关系
B.人的身高与视力之间的关系是相关关系
C.汽车的重量与汽车每消耗1升汽油所行驶的平均路程负相关
D.体重与学习成绩之间不具有相关关系
答案:B
解析;正方体的体积与棱长之间的关系是函数关系,故A正确;
人的身高与视力之间不具有相关关系,故B错误;
汽车的重量与汽车每消耗1升汽油所行驶的平均路程负相关,故C正确;
体重与学习成绩之间不具有相关关系,故D正确.故选:B.
例2、下列语句所表示的事件中的因素不具有相关关系的是()
A.瑞雪兆丰年B.读书破万卷,下笔如有神
C.吸烟有害健康D.喜鹊叫喜,乌鸦叫丧
答案:D
解析:“瑞雪兆丰年”和“读书破万卷,下笔如有神”是根据多年经验总结归纳出来的,吸
烟有害健康具有科学根据,所以它们都是相关关系,所以A、B、C三项具有相关关系;
结合生活经验知喜鹊和乌鸦发出叫声是它们自身的生理反应,与人无任何关系,故D项不具
有相关关系
故选:D.
例3、有几组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习
时间和平均学习成绩;③立方体的棱长和体积.其中两个变量成正相关的是()
A.①③B.(2X3)
C.②D.③
答案:C
解析:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程是负相关关系;
②平均日学习时间和平均学习成绩是正相关关系;
③立方体的棱长和体积是函数关系,不是相关关系.
故选:C
跟踪练习
1、下面的变量之间可用直线拟合的是()
A.出租车费与行驶的里程
B.房屋面积与房屋价格
C.身高与体重
D.实心铁块的大小与质量
答案:C
解析:出租车费与行驶的里程是确定的函数关系,故A错误;房屋面积与房屋价格是确定的
函数关系,故B错误;人的身高会影响体重,但不是唯一因素,可用直线拟合,故C正确;
实心铁块的大小与质量是确定的函数关系,故D错误.
故选:C.
2、有五组变量:
①汽车的重量和汽车每消耗一升汽油所行驶的距离;
②平均日学习时间和平均学习成绩;
③某人每天的吸烟量和身体健康状况;
④圆的半径与面积;
⑤汽车的重量和每千米的耗油量.
其中两个变量成正相关的是()
A.②④⑤B.②④C.②⑤I).④@
答案:C
解析:①中,汽车的重量和汽车每消耗1升汽油所行驶的平均路程是负相关的关系;
②中,平均日学习时间和平均学习成绩的关系是一个正相关;
③中,某人每II吸烟量和其身体健康情况是负相关的关系;
④中,圆的半径与面积是函数关系;
⑤中,汽车的重量和百公里耗油量关系是一个正相关;,
所以②⑤中的两个变量属于线性正相关.
故选:C.
3、最新《交通安全法》实施后,某市管理部门以周为单位,记录的每周查处的酒驾人数与
该周内出现的交通事故数量如下:
酒驾人数X801471211009610387
交通事故y19313023252420
通过如表数据可知,酒驾人数x与交通事故数》之间是()
A.正相关B.负相关C,不相关D.函数关系
答案:A
解析:由表格中的数据,在直角坐标系中描出数据的散点图,如图所示,
直观判断散点从左向右成带状分布,在一条直线附近,所以具有线性相关关系,且是正相关.
故选:A.
交通事故数
32卜.
30卜・
22卜
20k.,
gI,I!____________________,.
8090100110120130140150酒驾人物
4、某公司2006~2011年的年利润x(单位:百万元)与年广告支出》(单位:百万元)的
统计资料如表所示:
年份200620072008200920102011
利润X12.214.6161820.422.3
支出y0.620.740.810.8911.11
根据统计资力辑,则利润中位数()
A.是16,*与y有正线性相关关系
B.是17,x与y有正线性相关关系
c.是17,x与y有负线性相关关系
D.是18,x与y有负线性相关关系
答案:B
解析:由题意,利润中位数是与竺=17,而且随着利润的增加,支出也在增加,故x与V有
正线性相关关系.
故选:B.
5、从统计学的角度看,下列关于变量间的关系说法正确的是()
A.人体的脂肪含量与年龄之间没有相关关系
B.汽车的重量和汽车每消耗1L汽油所行驶的平均路程负相关
C.吸烟量与健康水平正相关
D.气温与热饮销售好不好正相关
答案:B
解析:从统计学的角度看:
在一定年龄段内,人体的脂肪含量与年龄之间有相关关系,二A错误;
汽车的重量和汽车每消耗1L汽油所行驶的平均路程是负相关关系,二B正确;
吸烟量与健康水平是负相关关系,错误;
气温与热饮销售好不好是负相关关系,,D错误.
故选:B
考点二相关系数的理解与运用
例1、对两个变量y与x进行回归分析,分别选择不同的模型,它们的相关系数r如下,其
中拟合效果最好的模型是()
A.0.2B.0.8C.-0.98D.-0.7
答案:C
解析:•••相关系数的绝对值越大,越具有强大相关性,
C相关系数的绝对值最大约接近1,...c拟合程度越好.故选:C
例2、对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是()
t
z
35
30
25•••
20
15
10
5
0
5101520253035JT,5101520253035X
相关系数为0相关系数为口
相关系数为「3相关系数为几
A.々<以<0<4<{B.rA<r2<0<r]<r3
C.r4<r2<0<r3<rtD.
答案:A
解析:由给出的四组数据的散点图可以看出,题图1和题图3是正相关,相关系数大于0,
题图2和题图4是负相关,相关系数小于0,题图1和题图2的点相对更加集中,所以相关
性更强,所以《接近于1,4接近于-1,由此可得4<4<0<弓<].故选:A.
例3、某公司为了准确地把握市场,做好产品生产计划,对过去四年的数据进行整理得到了
第x年与年销量y(单位:万件)之间的关系如表:
X1234
y12284256
在图中画出表中数据的散点图,推断两个变量是否线性相关,计算样本相关系数,并估计它
们的相关程度.
M万件)
60-
50-
40-
30-
20-
10
~O\~1~2~3~4~
附注:参考数据:jE(x-y)2«32.6,75«2.24,£工,=418.
Vi=li=l
参考公式:相关系数r=/J”
X(^)2t(y.-y)2
V/=]i=l
答案:作图见解析;y与X的相关系数近似为0.9997,可以推断该公司的年销量y与第X年
呈正线性相关,且线性相关程度很强.
解析:作出散点图如图:
万件)
60.
50
40-°
30・
20
10,
O1234x
山散点图可知,各点大致分布在一条直线附近,山此推断x与y线性相关.
由题中所给表格及参考数据得:
4
捻=|,y=y-gxj=418,-5)2=3
2.6f=30,
Z=1
Z(匕-x)(M-y)=^x,y-4xy=418-4x[xU
=73,
/=1/=1LZ
=整-4x(|)=掂
12.24,
以x,T(一)73
r=,-=----------x0.9997
也NT芭(M-W224x32.6
V/=i1=1
•••y与X的相关系数近似为0.9997,可以推断该公司的年销量y与第X年呈正线性相关,且
线性相关程度很强.
跟踪练习
I、己知4表示变量x与y之间的线性相关系数,4表示变量u与丫之间的线性相关系数,
且4=0.837,4=-0957,Jjllj()
A.变量x与y之间呈正相关关系,且x与y之间的相关性强于u与v之间的相关性
B.变量x与y之间呈负相关关系,且x与y之间的相关性强于。与丫之间的相关性
c.变量u与v之间呈负相关关系,且x与y之间的相关性弱于。与v之间的相关性
D.变量u与丫之间呈正相关关系,且x与y之间的相关性弱于。与丫之间的相关性
答案:c
解析:因为a=0.837,弓=-0.957,所以变量X与丫之间呈正相关关系,变量U与V之间
呈负相关关系,且x与y之间的相关性弱于u与v之间的相关性.
故选:C.
2、相关系数r的取值范围是()
A.[-1/]B.[—1,0]C.[0,1]I).(-1J)
答案:A
解析:相关系数的范围是:I/IU,即r?[1,1]故选:A
3、在下列4组样本数据的散点图中,样本相关系数最大的是()
相关系数与
51015202530353W1320253035
相关系数为相关系数。
A./;B.r2C.riD.
答案:A
解析:由散点图变化趋势可知,4>0,4>。,4<。,4<0,
又图1中的散点更为集中,更接近于一条直线,
所以4>4,故样本相关系数最大的是小故选:A.
4、对两个变量>与x进行回归分析,分别选择不同的模型,它们的相关系数一如下,其中
拟合效果最好的模型是()
①模型I的相关系数/为-0.90;②模型H的相关系数『为0.80;
③模型IH的相关系数/为-0.50;④模型IV的相关系数『为0.25.
A.IB.IIC.IllD.IV
答案:A
解析:因为卜|越趋近于1,相关性越强,模型拟合效果越好,所以拟合效果最好的模型是I.
故选:A.
5、变量x,y的线性相关系数为心变量力,〃的线性相关系数为弓,下列说法错误的是()
A.若同=0.96,则说明变量x,y之间线性相关性强
B.若{>4,则说明变量x,y之间的线性相关性比变量如〃之间的线性相关性强
C.若。<4<1,则说明变量x,y之间的相关性为正相关
D.若4=0,则说明变量x,y之间线性不相关
答案:B
解析:A:因为川=0.96接近于1,所以说明变量x,y之间线性相关性强,故A正确;
B:若a=0.99/=-0.99,满足4>4,
但是不能说明变量X,y之间的线性相关性比变量如〃之间的线性相关性强,故B错误;
c:若。<4<1,则说明变量X,y之间的相关性为正相关,故C正确;
D:{=0,则说明变量x,y之间线性不相关,故D正确.
故选:B.
6、变量U与V相对应的一组样本数据为(1,1.4)、(2,2.2)、(3,3)、(4,3.8),由上述样本数
据得到U与丫的线性回归分析,居表示解释变量对于预报变量变化的贡献率,则代=()
附:决定系数公式浦=1-
r=l
A-1
C.1D.3
答案:c
【解析:
易知,点(1,14)、(2,2.2)、(3,3)、(4,3.8)都在直线y=0.8x+0.6上,
所以,%=%('=1,2,3,4),所以,R2=\-^-------------=1
—丫
(=i
故选:C.
7、已知力表示变量乃与V之间的线性相关系数,”表示变量〃与/之间的线性相关系数,
且r=0.837,r2=-0.957,贝lj()
A.变量l与F之间呈正相关关系,且X与Y之间的相关性强于〃与”之间的相关性
B.变量才与,之间呈负相关关系,且才与,之间的相关性强于〃与「之间的相关性
c.变量〃与/之间呈负相关关系,且x与?之间的相关性弱于〃与「之间的相关性
D.变量〃与/之间呈正相关关系,且才与?之间的相关性弱于〃与/之间的相关性
答案:c
解析:因为线性相关系数21=0.837,22=-0.957,
所以变量X与之间呈正相关关系,变量〃与H之间呈负相关关系,
片与Y之间的相关性弱于〃与『之间的相关性.
故选:C
8、下图是我国2014年至2021年生活垃圾无害化处理量(单位:亿吨)的折线图.
无
害
化
处
理
量
.Y
注:年份代码1〜7分别对应年份2014~2021.
由折线图看出,可用线性回归模型拟合/与£的关系,请求出相关系数八并用相关系数的
大小说明y与r相关性的强弱.
参考数据:\>尸10・97,£底=47.36,£(%—方=0.664,万-2.646.
i=i,=1V;=i
£(—)(%-方沙-0
i=li=l
参考公式:相关系数尸I广.
、归也=了£(%一9
V/=1/=1Vr=lr=l
答案:y与t的相关系数近似为0.99,y与Z的线性相关性较强.
7_
解析:由折线图中数据和参考数据得i=4,Z(f;T)2=28,
1=1
p_7_7
2(>;--y)2=0.664,ZM=47.36-4x10.97=3.48
/=]/=!/=!
3.48
贝V=。0.99
\归(4-胫(必一才2x2.646x0.664
Vr=li=l
y与t的相关系数近似为0.99,接近于1,
所以y与t的线性相性较强.1.(2021•全国•高二课时练习)根据统计,某蔬菜基地西红
柿亩产量的增加量y(百千克)与某种液体肥料每亩使用量x(千克)之间的对应数据的散
点图,如图所示.
(百千克)
A
O24568x(千克)
依据数据的散点图可以看出,可用线性回归模型拟合y与X的关系,请计算相关系数r并加
以说明(若卜|>。-75,则线性相关程度很高,可用线性回归模型拟合);
参考数据:>/03»0.55,7(19»0.95.
答案:0.95,答案见解析.
&力土匚二的rwrai-2+4+5+6+8-3+4+4+4+5
解析:由已知数据可得工=------------=5,y=------------=
所以之(玉-y)=(-3)x(-l)4-(-l)xO+OxO4-lxO+3xl=6,
r=i'
+02+l2+32=2石,
因为r>0.75,所以可用线性回归模型拟合y与x的关系.
9、某企业坚持以市场需求为导向,合理配置生产资源,不断改革、探索销售模式.下表是该
企业每月生产的一种核心产品的产量x(件)与相应的生产总成本y(万元)的五组对照数
据:
产量X(件)12345
生产总成体y(万元)3781012
试求y与X的相关系数r,并利用相关系数r说明y与X是否具有较强的线性相关关系(若
M>0・75,则线性相关程度很高,可用线性回归模型拟合).
£(%-可(》-,)
参考公式:r=
J次仁-方n刃?
V/=1V/=1
答案:0.98,y与X具有较强的线性相关关系,可用线性回归方程拟合y与X的关系.
解析:
转1+2+3+4+53+7+8+10+12
55
j£(xf=阮&『=廊,
^(x..-x)(y,.-7)=21.
/=1
相关系数"忌可匹
•.•M>O.75,与x具有较强的线性相关关系,可用线性回归方程拟合V与x的关系.
考点三、线性回归方程
例1、对于数据组a,y)(i=L2,3,...,〃),如果由线性回归方程得到的对应于自变量x,.的估计
值是先,那么将%-%称为相应于点(X“y)的残差.某工厂为研究某种产品产量X(吨)与
所需某种原材料y吨)的相关性,在生产过程中收集4组对应数据(x,y)如下表所示:
X3456
y2.534m
根据表中数据,得出y关于x的线性回归方程为y=0.7x+a,据此计算出样本点处的残差为
-0.15,则表中"?的值为()
A.3.3B.4.5C.5D.5.5
答案:B
解析:由题意可知,在样本(4,3)处的残差一0.15,则y=3.15,即3.15=0.7x+a,
解得a=0.35,即y=0.7x+0.35,
又―3+4+:5+6=4.5,且线性方程过样本中心点(斤,歹),
4
则亍=0.7x4.5+0.35=3.5,则7=2.5+3;4+/"=3.5,
解得〃2=4.5.
故答案为:B
例2、击鼓传花,也称传彩球,是中国民间游戏,数人或几十人围成圆圈坐下,其中一人拿
花(或一小物件);另有一人背着大家或蒙眼击鼓(桌子、黑板或其他能发出声音的物体),
鼓响时众人开始传花(顺序不定),至鼓停止为止.此时花在谁手中(或其座位前),谁就上
台表演节目,某单位组织团建活动,9人一组,共10组,玩击鼓传花,(前五组)组号x与
组内女性人数y统计结果如表:
X12345
y22334
(I)女性人数y与组号X(组号变量X依次为1,2,3,4,5,…)具有线性相关关系,
请预测从第几组开始女性人数不低于男性人数;
参考公式:&T--------,a=y-bx
fx;-欣2
/=!
(II)从10组中随机抽取3组,求若3组中女性人数不低于5人的有X组,求X的分布列
与期望;
(III)游戏开始后,若传给相邻的人得1分,间隔人传得2分,每击一次鼓传一次花,得1
分的概率为0.2,得2分的概率为0.8.记鼓声停止后得分恰为〃分的概率为%,求
9
答案:(I)从第8组开始女性人数不低于男性人数:(n)分布列见解析,£(%)=—;(III)
解析:(I)由题可得工=gx(l+2+3+4+5)=3,
一2+2+3+3+4+-
y=-------------------=2.8,工毛%=A47
3/=1
力占2=12+22+32+42+52=55.
/=!
5_
A»>戊一5孙
则人二是--------=0.5,
Z%_5x
i=\
a=歹-金=2.8-0.5x3=13,
夕=0.5尤+1.3,
当0.5X+1.325时,,x>7.4,
...预测从第8组开始女性人数不低于男性人数.
(II)由题可知X的所有可能取值为0,1,2,3,
17
尸(x=o)=N=',
,)品24
P(X=»管磊
唳=2)=警磊,
HX=3)=*言,
则X的分布列为
X0123
72171
p
244040T20
・•・E(X)*
(n【)在得分为(〃-1)分的基础上再传一次,则得分可能为〃分或6+1)分,记“合计得〃分”
为事件A,“合计得("+1)分”为事件B,事件A与8为对立事件.
P(A)=%,P(8)=±a,_|=l-a„(n>2),
跟踪练习
I、某工厂的每月各项开支X与毛利润y(单位:万元)之间有如下关系,y与X的线性回
归方程y=6.5x+a,贝()
X24568
y3040605070
A.17.5B.17C.15D.15.5
答案:A
...,...v..i士qjj—TZ>।—2+4+5+6+8—30+40+60+50+70
解析:山题r意,根据表中的数据,可得X=------------=5,y=------------------=50,
即样本中心为(5,50),代入了与工的线性回归方程为3,=6.5乂+。,解得a=17.5.
故选:A.
2、已知两个变量X和y之间有线性相关关系,经调查得到如下样本数据,
X34567
y3.52.41.1-0.2-1.3
根据表格中的数据求得同归方程》=3x+G,则下列说法正确的是()
A.a>0,b>0B.a>0fb<0
C.<0,b>0D.avO,Z?<0
答案:B
解析:由已知数据,可知y随着x的增大而减小,
则变量x和变量y之间存在负相关的关系,./<0,
当x=0时,则4=y>3.5>0,
即:a>0,h<0.
故选:B.
3、某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,
得到如下数据:
单价(元)456789
销量(件)908483807568
由表中数据,求得线性回归方程y=-4ka,若在这些样本点中任取一点,则它在回归直线右
上方的概率为()
A.—B.—C.~D.一
6323
答案:C
-113
解析:因为x=w(4+5+6+7+8+9)=彳,
62
y=1(90+84+83+80+75+68)=80,
6
所以a=y+4x=106,即>=<¥+106
满足4x+y-106>0的点有(6,83),(7,801(8,75),共3个
所以在这些样本点中任取一点,则它在回归直线右上方的概率为p=:3=;1,
62
故选:C
4、西部某深度贫困村,从2014—2019年的人均纯收入(单位:千元)情况y如下表,时间
变量x从2014-2019年的值依次为1,2,……6.
2014—2019年的人均纯收入情况表:
年份201420152016201720182019
人均纯收入(千元)2.63.03.63.94.45.1
(1)在图中画出表中数据的散点图,根据散点图,是否可用线性回归模型拟合y与*的关
系,请用相关系数加以说明;
(2)建立y关于X的回归方程(保留两位小数),预测该村2020年的人均纯收入为多少?
717^24.18、岳仁-=8.55,£他=87.60.
Yi=i'i=l'i=l
X%-x)(y—y)X-^yi-nx-y
参考公式:相关系数r=/,“,=/"’=’,,,,,
JzH一1•£()',—-Jz")•£()”一
回归方程尸a+法中斜率和截距的最小二乘法估计公式分别为:b=J——二一,
m-x)
1=1
(h—e一
■a=y-'bx.
答案:(1)散点图见解析;可以用线性回归方程拟合y与X的关系;说明见解析;(2)
y=0.482%+2.08;该村2020年人均收入约为5450元左右.
解析:(1)作出散点图如图:
由散点图可知各点大致分布在一条直线附近,
87.60-6x3.77x3.5…
=-----------------x0.99,
8.55
因为y与X的相关系数约为0.99,说明y与X的相关程度是很高的,所以可以用线性回归方
程拟合y与x的关系.
(2)a=y-bx=3.71-0.482x3.5«2.08.
所以回归直线方程y=0.482%+2.08,
>■=0.48x7+2.09«5.45,即该村2020年人均收入约为5450元左右.
考点四、非线性回归方程
例1、从非洲蔓延到东南亚的蝗虫灾害严重威胁了国际农业生产,影响了人民生活.世界性
与区域性温度的异常、早涝频繁发生给蝗灾发生创造了机会.已知蝗虫的产卵量y与温度》
的关系可以用模型>=£*,拟合,设z=lny,其变换后得到一组数据:
X2023252730
Z22.4334.6
由上表可.得线性回归方程z=O.2x+a,则q=()
A.-2B.e-2C.3D.i
答案:B
解析:由表格数据知:jf=g(20+23+25+27+30)=25,5=g(2+2.4+3+3+4.6)=3,
代入Z=0.2x+a得:4=3-0.2x25=—2,.\z=0.2x-2,即lny=0.2x-2,
故选:B.
例2、某创业者计划在南山旅游景区附近租赁一套农房发展成特色“农家乐”,为了确定未
来发展方向,此创业者对该景区附近五家“农家乐”跟踪调查了100天,这五家“农家乐”
的收费标准互不相同,得到的统计数据如下表,x为收费标准(单位:元/日),,为入住天
数(单位:天),以入住天数的频率作为各自的“入住率”,收费标准*与入住率y的散点图
如图.
X100150200300450
y9065453020
入住率
I*
0.8
0.6*
0.4•
0.2...:.•收.费标准
0100200300400500"
(1)若从以上五家“农家乐”中随机抽取两家深入调查,记彳为“入住率”超过0.6的农家
乐的个数,求g的分布列:
⑵令z=InX,由散点图判断$,=反+&与处良+G哪个更合适于此模型(给出判断即可,
不必说明理由)?并根据你的判断结果求回归方程;(G,3的结果精确到0.1)
(3)根据第(2)问所求的回归方程,试估计收费标准为多少时,100天销售额0最大?(100
天销售额。=100x入住率x收费标准x)
^y.-nxy55
参考数据:3=勺--------,a=y-bx,x=240,Zz,»=457.5,=36500,z«5.35,
£x,2-nx2泊I
i=\
55
ZZ/.B12.72,Zz,2s=144.24,7=28.57,e5»150.
1=1<=1
答案:(1)分布列见解析;(2)》=Az+a更适合于此模型,回归方程为?=T).51nx+3.0;
(3)150(元/日).
解析:(1)4的所有可能取值为0,1,2,
C23C1C163C21
则PC=°)=百=6尸(4=1)=*=?=士,尸©=2)=2='
砥105C;10
4的分布列是
自012
331
P
W5Io
(2)由散点图可知》=应+。更适合于此模型.
依题意,y=~(0.9+0.65+0.45+0.3+0.2)=0.5,
Yzy-5z-y
iii12.72-5x5.35x0.5
则g=S---------«-0.47«-0.5,
DE144.24-5x28.57
Z=1
a=0.5+0.47x5.35«3.0,
所求的回归方程为9=-<).5lnx+3.0.
(3)依题意,L(x)=100(-0.5Inx+3.0)x=-50xInx+300x,
贝iJL'(x)=-50lnx+250,
由L(x)〉0,得lnxv5,x<e5,由工(x)v0,得lnx>5,x>e\
.」(x)在(0,叫上递增,在伫,”)t;一递减,
...当x=e5%150时,取到最大值.
.•.当收费标准约为150(元/日)时,100天销售额/最大.
跟踪练习
1、某公司2019年1月至7月空调销售完成情况如图,如7月份销售量是190台,若月份为
x,销售量为),由统计数据(外,%)(i=L2,…,7)得到散点图,下面四个回归方程类型中
最适合作为销售量y和月份x的回归方程类型的是()
A.y=a+bxB.y=a+bx2C.y=a+he'D.y=a+b\nx
答案:B
解析:由散点图分布可知,散点图分布在一个二次函数的图像附近,因此,最适合作为销售
量)和月份x的回归方程类型的是》=。+/2.
故选:B
2、己知变量y关于X的回归方程为y=*55,其一组数据如表所示:若x=5,则预测y值
可能为()
Xi234
yee4
答案:D
叼「匚।frx-()511八oIne+Ine,+Ine'+Ine'、.1+2+3+4__
解析:由y=ebg得:Iny=bx-0.5,------------------------------=b------------------0.5,
44
解得:b=1.6,••・回归方程为尸36"-。5,若*=5,则y=e845=,.
故选:D.
3、如图是某小区2020年1月至2021年1月当月在售二手房均价(单位:万元/平方米)的
散点图.(图中月份代码1〜13分别对应2020年1月〜2021年1月).根据散点图选择
¥=〃+/7五和丫=。+4山》两个模型进行拟合,经过数据处理得到两个回归方程分别为
y=0.9369+0.02854和>'=0.9554+0.0306Inx>并得至U以下一些统计量的值:
当月在售二手房均价y
1.04
1.02
1.00
0.98
0.96
0.94
12345678910111213月份代码x
y=0.9369+0.02854y=0.9554+0.0306Inx
残差平方和%%-城
0.0005910.000164
x=l\
13_2
总偏差平方和7)0.006050
/=1
(1)请利用相关指数R2判断哪个模型的拟合效果更好;
(2)估计该小区2021年6月份的二手房均价.(精确到0.001万元/平方米)
参考数据:In2ao.69,1113*1.10,lnl7*2.83,Ini9a2.94,应名1,41,6)«1.73,后^4.12,
Ma4.36.
Xy;—yj
参考公式:相关指数R2=l-可」一;.
j=l
答案:(1)模型y=0.9554+0.0306Inx;(2)1.044(万元/平方米).
解析:(1)设模型y=0.9369+0.02856和y=0.9554+0.0306Inx的相关指数分别为用和耳,
es,,0.000591,0.000164
则R;=1---------,R;=1----------.
'0.00605-0.00605
因为0.000591>0.000164,所以
所以模型y=0.9554+0.03061nx的拟合效果更好.
(2)山⑴知,模型y=0.9554+0.03061nx的拟合效果更好,
利用该模型预测可得,这个小区2021年6月份的在售二手房均价为:
y=0.9554+0.0306In18=0.9554+0.0306(In2+2In3)»1.044(万元/平方米).
4、为2020年全国实现全面脱贫,湖南贫团县保靖加大了特色农业建设,其中茶叶产业是重
要组成部分,由于当地的地质环境非常适宜种植茶树,保靖的“黄金茶”享有“一两黄金一
两茶”的美誉.保靖县某茶场的黄金茶场市开发机构为了进一步开拓市场,对黄金茶交易市
场某个品种的黄金茶日销售情况进行调研,得到这种黄金茶的定价x(单位:百元/kg)和
销售率V(销售率是销售量与供应量的比值)的统计数据如下:
X102030405060
y0.90.650.450.30.20.175
(1)设z=lnx,根据所给参考数据判断,回归模型¥=鼠+6与y=5z+a哪个更合适?并
根据你的判断结果求回归方程(°,。的结果保留一位小数);
(2)某茶场的黄金茶生产销售公司每天向茶叶交易市场提供该品种的黄金茶1200kg,根据
(1)中的回归方程,估计定价》(单位:百元/kg)为多少时,这家公司该品种的黄金茶
的日销售额卬最大,并求W的最大值.
参考数据:y与X的相关系数42-0.96,y与Z的相关系数々“0.99,1=35,y«0.45,
6、6
2=9100,藐3.40,6z2»69.32>工了咨产8.16,^z,2»71.52,»20.1,e3-4»30.0,
<=1/=|i=l
e3'5®33.1fe4n54.6.
参考公式:济J=—=闿一^—^A%,|J_,===•
2(x..-x)2储:-〃x、这(y-y)2
i=lZ=1V»=li=l
答案:(1)>=-O.51nx+2.0,(2)120.6万元;
解析:(1)因为回归模型f,=$x+G的相关系数M卜0.96,回归模型»=良+4的相关系数
I讣0.99,
因为0.96<0.99<1,
由线性相关系数的意义可知,回归模型》=良+&更合适,
Z(4-z)(y;-y)Z2a一向
8.16-6x3.40x045
=-4---------«-0.46»-0.5
£(马-云)2--名Z;-应271.52-6932
1=1«=|
a=y-bx=0.45-(-0.45)x3.40~2.0,
所以回归方程为>'=-0-5lnx+2.0;
(2)由题意可知,W=1200x(-0.51nx+2.0)x,
所以W'=1200x(l.5-0.5Inx),
令秋=0,解得lnx=3,即x=e3°20.1,
当0<x<e3时,W'>0,W单调递增,
当joe?时,W'<0,W单调递减,
所以当售价约为20.1百元/口时,日销售额W最大,
最大值为1200x(-0.5xln/+2.0)xe、1200x(-0.5x3+20)x20.1=12060百元,
所以最大II销售额为120.6万元.
5、为了了解4地区足球特色学校的发展状况,某调查机构得到如下统计数据:
年份X20142015201620172018
足球特色学校y(百个)0.300.601.001.401.70
(1)根据上表数据,计算y与x的相关系数r,并说明y与x的线性相关性强弱(已知:
0.754"|41,则认为y与x线性相关性很强;0.3白川<0.75,则认为尸与x线性相关性一
般;|r|<0.25,则认为y与x线性相关性较弱);
(2)求y关于x的线性回归方程,并预测4地区2019年足球特色学校的个数(精确到个).
____j=l___________________,J(x,.-x)2=io,刃2=]3,屈«3.6056,
参考公式:
2
一可闻厂于J=I<=i
A----;
a=y-bx.
f(%-琦
J=1
答案:(1)r=或士,y与x线性相关很强;(2)尸0.36尸724.76,208个.
3.6056
_2016x5-2-1+1+20.3+0.6+1+1.4+1.7.
解析:(1)x=------------------=2016,y=------------------=I,
£(七-可(y-切
3.63.6
>0.75
沏-心eV
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 银行人民币借款合同
- 农村承包土地转租合同
- 举办商业演出活动协议书
- 2025公司行政个人工作计划(13篇)
- 水力发电工程施工合同
- 离职协议与劳动合同关系
- 防雷防静电工程合同
- 游泳设施租赁合同
- 交货延期赔偿合同标准文本
- 节目主持人合同
- 政务服务人员培训
- 宠物医院招聘课件
- 新老物业移交表格(全套)
- 五子棋入门教程ppt
- 18.光伏支架安装、太阳能组件自检记录
- 站台填筑检验批质量验收记录表
- 给排水管道工程实体质量检查评分表
- 城南小学“国家义务教育质量监测”工作应急预案
- SAP模块介绍及功能模块关联图(ppt 63页)
- 2018 年全国高校俄语专业四级水平测试试卷
- 年产6万吨饲料厂建设项目可行性研究报告-甲乙丙资信
评论
0/150
提交评论