版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第9章统计
9.1线性回归分析
变量的相关性
线性回归方程
基础过关练
题组一变量间的相关关系
1.有以下五组变量:
①某商品的销售价格与销售量;
②学生的学籍号与学生的数学成绩;
③坚持每天吃早餐的人数与患胃病的人数;
④气温与冷饮的销售量;
⑤电瓶车的质量和行驶每千米的耗电量.
其中两个变量具有正相关关系的是()
A.①③B.②④C.②⑤D.④⑤
2.(2021湖南郴州高一期末)在下列各散点图中,两个变量具有正相关关系的是()
""y1”
:海・::%•:•:::;.
0xOX0X05
ABCD
3.下表给出了5组数据,选出4组数据使得x与y的线性相关程度最大,且保留第1组数据(-
5,-3),则在余下的4组数据中应去掉()
第了组12345
Xi-5-4-3-24
Yi-3-24-16
A.第2组数据B.第3组数据
C.第4组数据D.第5组数据
题组二相关系数
4.(2021陕西咸阳高二期末)在变量y与x的回归模型中,它们对应的相关系数r的值如下表,
其中拟合效果最好的模型是()
模型1234
r0.480.150.960.90
A.模型1B.模型2C.模型3D.模型4
5.在一组样本数据…,(%,%)(〃三2,岛&广..,用不全相等)的散点图中,若所有样本点
(%匕)(,=1,2,...,切都在直线产一'+2上,则这组样本数据的样本相关系数r为()
1
3
6.对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是()
斗
3535
30.J;30
25・・・25
20・::・2()
15J15
olho1520253035""x1520253035%
图1(相糅物)图2(相粽物
V
斗
3535.
3O30V,
25・;
2O125.
520*
15
loj
015202530351520253035J
图3(相关系数Q图《相关系数力
Q
A.〈局〈0"3<4B.r4<r2<0<r1<r3
C.r4<7^<0<r3<r1D.r2<r4<0<rl<r3
题组三线性回归方程及其应用
/■
o
7.两个变量的散点图如图「关于x的回归方程可能是()
A.y=l.22+1.321nx
B.y=2.31/+0.25
C.y-1.23^+1.21
D.y=l.25x~0.42
8.(2021江苏常州高二期末)对某同学7次考试的数学成绩x和物理成绩p进行分析,下面是该
生7次考试的成绩(单位:分).
X888311792108100112
y949110896104101106
发现他的物理成绩y与数学成绩x是线性相关的,利用最小二乘法得到线性回归方程为
y=0.5x+a,若该生的数学成绩达到130分,估计他的物理成绩是()
.5分分
.5分分
9.(2021江苏南京高二期末)自2010年以来,一、二、三线的房价均呈现不同程度的上升趋势,
以房养老、以房为聘的理念深入人心,使得各地房产中介公司的交易数额日益增加.现将A房
产中介公司2010—2019年4月份的售房情况统计如图所示,根据2010—2013年,2014—2016
年,2017—2019年的数据分别建立回归直线方程)/=力1牙+。1,丫=52牙+(12,丫=83牙+。3,则()
A.81〉82〉力3,。3>。2>。1B.82>b1>83,。3〉。2>。1
C.61>力2〉匕3,。3>。1>。2D.力2>81〉83,。3〉。1>。2
10.(2020山东日照实验中学高二下阶段性考试)若根据5名儿童的年龄M岁)和体重Rkg)的数
据用最小二乘法得到体重关于年龄的线性回归方程是y=2x+18,已知这5名儿童的年龄分别是
3,5,2,6,4,则这5名儿童的平均体重是kg.?
11.(2021江苏南京师大附中高二期末)近年来,国家对西部发展出台了很多优惠政策,为了更有
效地促进发展,需要对一种旧能源材料进行技术革新,为了了解此种材料年产量M吨)对价格
W万元4屯)和年利润2(万元)的影响,有关部门对近五年此种材料的年产量和价格进行统计,统
计结果如下表,若歹=5.5.
X12345
y8764C
⑴求表格中c的值;
(2)求y关于x的线性回归方程)/=力牙+。;
⑶若每吨该产品的成本为2万元,假设该产品可全部卖出,预测当年产量为多少时,年利润2取
得最大值.
八n八
£x;y;-nxy八
参考公式:匕若^------,a-y-bx.
i=li
题组四非线性回归分析
12.某种微生物的繁殖速度y与生长环境中的营养物质浓度x相关,在一定条件下可用回归模
型厂21gx进行拟合.在这个条件下,要使y增加2个单位,则应该使x()
A.增加1个单位B.增加2个单位
C.增加到原来的2倍D.增加到原来的10倍
13.以模型户ce*,去拟合一组数据时,为了求出回归方程,设z=lny,将其变换后得到线性回归方
程z=0.2x+3,则c,k的值分别是()
2,0.62,0.3:0.2:0.6
14.(2021江西景德镇一中高二期末)某大型现代化农场在种植某种大棚有机无公害的蔬菜时,
为创造更大价值,提高亩产量,积极开展技术创新活动.该农场采用了延长光照时间的方案,选
取了20间大棚(每间一亩)进行试点,将得到的各间大棚产量数据绘制成散点图如图所示.光照
时长为M单位:小时),大棚蔬菜产量为y(单位:千斤/&),记-Inx.
产量y
6.0----------------------
5.5
5.0-------------;•---------------------
4.5----------/
_____-
OL_L_:,__
6121824光照时长工
⑴根据散点图判断产a+6x与产Gd•Inx,哪一个适宜作为大棚蔬菜产量y关于光照时长x的
回归方程类型(给出判断即可,不必说明理由);
⑵根据⑴的判断结果及表中数据,建立y关于x的回归方程;(结果保留小数点后两位)
⑶根据实际种植情况,发现上述回归方程在光照时长位于614小时内拟合程度良好,利用(2)
中所求方程估计当光照时长为e?小时(自然对数的底e-2.71828)时,大棚蔬菜亩产量为多少.
参考数据:
2020202020202020
Ex2Ew2
Ext巨却巨叫.
i=l1率i=A1r=l
290102.4524870540.281371578.2272.1
参考公式:万关于a的线性回归方程夕a+n中,
n_
八.ga^i-ria•/?"___
Til士匕------,n-p-m•a.
Za^-ria
i=li
能力提升练
题组一线性回归方程及其应用
1.(2021湖南长沙高三月考,姬)已知两个变量具有线性相关关系,现通过最小二乘法求回归直
八ccn
线方程y=Z)x+a,将已知数据代入公式/工业-法尸蛾,计算后得到的代数式为3a2+13ZA12a6
i=l
2加3,使上述代数式取值最小的a,6的值即为回归方程的系数,则回归直线方程为()
A.=-xy+2B.=~x-y2
C.=xy+2D.=x~y2
2.(多选)(2021江苏镇江高三期中.)已知由样本数据点集合{(鸟匕),=1,2,3,...,处,求得回归直
线方程为y=L5x+0.5,且5=3,现发现两个数据点(1.2,2.2)和(4.8,7.8)误差较大,去除后重新求
得回归直线/的斜率为1.2,则()
A.变量x与y具有正相关关系
B.去除后y的估计值增加速度变快
C.去除后与去除前均值元歹不变
D.去除后的回归方程为y=l.2x+l.4
3.(2020四川成都高二期末,姬)某国企进行节能降耗技术改造,下面是该国企节能降耗技术改
造后连续五年的生产利润:
年号X12345
年生产利润y
0.70.811.11.4
(单位:千万元)
预测第8年该国企的生产利润为()
八n八
Exiyi-nxy55
参考公式及数据力弓——,a=y-bx,^^y-5xy=l.7,Sxf-5x=10.
Zx?-nxi=l
i=li
.88千万元.21千万元
.85千万元.34千万元
4.(2021江苏淮安马坝中学高二月考,")FEV1(第一秒用力呼气容积)是肺功能的一个重要指标.
为了研究某地区10岁男孩群体的FEV1与身高的关系,现从该地区力、B、。三个社区
10岁男孩中随机抽取600名进行FEV1与身高数据的相关分析.
(1)若4B、。三个社区10~15岁男孩人数比例为1:3:2,按分层随机抽样进行抽取,请求出
三个社区应抽取的男孩人数;
(2)经过数据处理后彳导到该地区1015岁男孩身高Mem)与FEVly(L)对应的10组数据
(岛2,…,10),并作出如图所示的散点图:
y/L
4.0
3.5-・
3.0•*
2.5-•
2.0-.•*
1.5-*
1-°130135140145150155160165170175Wcm
1010
经计算得:E(毛-4^1320,E(y;-y)2^3,x=152,y=2.464,(马万)(片1,2,…JO)的相关系数K
i=li=l
0.987.
①请你利用所给公式与数据建立y关于x的线性回归方程,并估计身高160cm的男孩的FEV1
的预报值%;
②若①中回归模型误差的标准差为s,则该地区身高160cm的男孩的FEV1的实际值落在(%-
3s,%+3s)内的概率为99.74%现已求得,0.1,若该地区有两个身高160cm的12岁男孩〃和儿
测得FEV1值分别为2.8L和2.3L,请结合概率统计知识对这两个男孩的FEV1指标作出一个合
理的推断与建议.
n
X(%,一%)(y八
附:样本(X,,K)(1=1,2,…㈤的相关系数尸1,其回归方程y=a+8x的斜率和截距
nn
J区(符标)2J区(y厂歹)2
n
X(%,一元)(V,—万)八
的最小二乘法估计分别为加』———,a=y-&x,7110^10.5.
.2(州气)2
1=1
5.(2021江苏南京高三月考,如)垃圾是人类日常生活和生产中产生的废弃物,由于排出量大,成
分复杂多样,且具有污染性,所以需要无害化、减量化处理.某市为调查产生的垃圾数量,采用
简单随机抽样的方法抽取20个县城进行了分析彳导到样本数据(X,,K)(/=1,2,…,20),其中x,和力
分别表示第/个县城的人口(单位:万人)和该县年垃圾产生总量(单位:吨),并计算得
2020202020
£x尸80,£K=4000,£(x1元)J80,£(%-药=8000,£(为一司他一歹)=700.
i=li=li=li=li=l
⑴请用相关系数说明该组数据中y与x之间的关系可用线性回归模型进行拟合;
(2)求y关于x的线性回归方程;
⑶某科研机构研发了两款垃圾处理机器,其中甲款机器每台售价100万元,乙款机器每台售价
80万元,下表是以往两款垃圾处理机器的使用年限(整年)统计表:
使用年限台数款式1年2年3年4年总计
甲款520151050
乙款152010550
根据以往经验可知,某县城每年可获得政府支持的垃圾处理费用为50万元,若仅考虑购买机器
的成本和每台机器的使用年限(使用年限均为整年).某县城环保机构若考虑购买其中一款垃圾
处理器,以使用年限的频率估计概率,该机构选择购买哪一款垃圾处理机器更划算?
n
参考公式:相关系数尸]总0C⑴,
,当(X田2区(—2
对于一组具有线性相关关系的数据(汽,无)(,=1,2,…㈤,其回归方程y=Z)x+a的斜率和截距的最小
八£(ypy)-
二乘估计分别为b上噂——a=y-bx.
(芍一元)2
题组二非线性回归分析及其应用
6.(2021江苏扬州中学高三月考,灼某企业新研发了一种产品,产品的成本由原料成本及非原
料成本组成.每批产品的非原料总成本文元)与生产该产品的数量M千件)有关,经统计得到如
下数据:
入汗件1234567
y/it611213466101196
根据以上数据,绘制如图所示的散点图.
观察散点图,两个变量不具有线性相关关系,现考虑用对数函数模型户a+4nx和指数函数模型
产c•/分别对两个变量的关系进行拟合.
⑴根据散点图判断,尸讨blnx与产均为大于零的常数)哪一个适宜作为非原料总成
本y关于生产该产品的数量x的回归方程类型;(给出判断即可,不必说明理由)
⑵根据⑴的判断结果及表中的数据,建立y关于x的回归方程;
⑶已知每件产品的原料成本为10元,若该产品的总成本不得高于元,请估计最多能生产多少千
件产品.
参考数据:
777
tX:54
XVXXMEx%10°-
y1=11i=li=l
462.141.54140253550.123.47
_1rl
其中vy=lgyy,v=-£匕.
/1=1
参考公式:对于一组数据(4,匕),(阳丹),…,(4,%),其回归直线wa+/?”的斜率和截距的最小二乘
八n八
£UiVi-nuv八
估计分别为所早——,a=v-pu.
Zu?-nu?2
i=li
第9章统计
9.1线性回归分析
9.1.1变量的相关性
9.1.2线性回归方程
基础过关练
1.D①销售价格越高,销售量通常会越低,所以不是正相关关系;②学生的数学成绩与学籍号
无关;③医学证明不吃早餐的人容易患胃病,因此吃早餐的人数和患胃病的人数之间是负相关
关系;④气温越高,冷饮销量越高,是正相关关系;⑤电瓶车的质量越大,行驶每千米的耗电量越
大,所以是正相关关系.故选D.
2.B四个选项中只有选项B中总体上变量y随着x的增大而增大,因此只有B中具有正相关
关系,故选B.
3.B画出散点图如图所示,应去掉第3组数据(-3,4),故选B.
八y
6•
5
・4
3
2
...............1。:
-5-4-3-^-1_11234%
*-2
--3
4.C在线性回归分析中,相关系数为r,\r\越接近于1』与x相关程度越强;|r|越接近于0,y
与x相关程度越弱.•••10.96]>|0.90]>|0.48]>|0.15],.•.模型3的拟合效果最好,故选C.
5.A因为回归直线方程是产-打+2,所以这两个变量是负相关,故这组样本数据的样本相关系
数为负值,又所有样本点(区,匕)(/=1,2,…㈤都在直线上,所以)|=1,所以相关系数尸-1,故选A.
6.A由给出的四组数据的散点图可以看出,题图1和题图3是正相关湘关系数大于0,题图2
和题图4是负相关,相关系数小于0,题图1和题图2的点相对更加集中,所以相关性更强,所以
|百1接近于1*匕|接近于T,由此可得亦司〈0〈骂〈百.故选A.
7.D因为散点图由左下方向右上方成带状分布,所以回归方程是线性的,且线性回归方程斜率
为正数,故排除A,B,C,由于散点图的带状区域经过y轴的负半轴,故线性回归方程的截距为负数,
故选D.
8.B由题意可知
1:88+83+117+92+108+100+112=JQQ
--94+91+108+96+104+101+106inn
因为回归直线经过样本点的中心,所以100=0.5X100+见解得a=50,故线性回归方程为
y=0.5x+50,当产130时,产0.5X130+50=115.故选B.
9.A回归直线分布在散点图附近,b表示回归系数,a表示回归直线在y轴上的截距.由题图可
知,20102013年,y随x的增加而迅速增加,20142016年/随x的增加而平缓增加,20而”019
年,y随x的增加而减少,故比〉匕2〉%。3〉。2>。「
10.答案26
解析由题意得小也产=4,
由于回归直线过样本点的中心(焉力,所以歹=23+18=2X4+18=26,
故这5名儿童的平均体重是26kg.
11.解析(1万](8+7+6+4+c)=5.5,解得c-2.5.
5
(2)V£^=8+14+18+16+12.5=68.5,
i=l
XX2=12+22+32+42+52=55,
i=l1
出1+2+”+5=3,产5.5,
、5_
•7Tg产力与双68.5-5X3X5.5iA
i=l1
a=y~bx=5.4)X3=9.7,
...y关于X的线性回归方程为y=T.4x+9.7.
(3)年利润2=(-1.4x+9.7-2)A=-l.4/+7.lx,
...当75时,年利润z取得最大值.
故当年产量为2.75吨时,年利润2取得最大值.
12.D设y的增加量为△产%-%/的增加量为A产&-石,故可得△产21gx2-21gxl=2坨恐=2,解得
生10,故要使得y增加2个单位,x应增加到原来的10倍.
X1
13.C对尸ce""两边同时取以e为底的对数可得In尸111(g"。=11141116"=〃才+1116因为z=lny,
所以z=Ax+lnc,又z=0.2x+3,所以A=0.2』nc=3,所以c=e3.
14.信息提取①散点图的形状;②传Inx和题表中的数据;③利用回归方程估计当光照时长为
I小时时大棚蔬菜的亩产量.
数学建模先以大型现代化农场在种植某种大棚有机无公害的蔬菜的散点图的形状确定函数
模型,然后通过wlnx将非线性回归方程转化为线性回归方程,将与参考公式中的万,a进
行对应,利用公式求出c,d最后回代求出y关于x的回归方程.
解析⑴根据题中散点图可知,开始的点在某条直线附近,但后面的点会越来越偏离这条直线,
因此产Inx更适宜作为回归方程.
2020
(2)因为wlnx,所以产lnx=c+d•匕尸钞=踪4二5.12,w=^^-=|1=2.6,
」_272.1-20X5.12X2.6〜D0/2
d-137一20X2.6。〜工叫
c=5.12-3.26X2.6^-3.36,
所以产3.26旷3.36,即产3.261nx-3.36.
⑶由(2),知当产e?时,片3.261ne-3.36=3.16.
故估计当光照时长为e?小时时,大棚蔬菜亩产量为3.16千斤.
方法总结
建立非线性回归方程的步骤:(1)选取合适的函数进行拟合;(2)通过换元将非线性回归方程模型
转化为线性回归模型;(3)找好换元后的字母与参考公式中字母的对应关系,代入公式求出线性
回归方程中的参数;(4)消去新元彳导到非线性回归方程.
能力提升练
1.D3a2+13斤+12a62b3=3(a+26)2+(6iy+2,当{篙=°,即[二:,时,上式取值最小,故尸尸2.
2.ACD•.)关于x的线性回归方程为尸1.5x+0.5,回归系数1.5〉0,,变量太与丁具有正相关
关系,故A正确;去除两个数据点后重新求得回归直线1的斜率为1.2,由1.2<1.5,可知去除后
y的估计值增加速度变慢,故B错误;去除前的均值-3,去除的两个数据点的横坐标的平均数为
3,则去除后与去除前均值工不变,由线性回归直线恒过样本点的中心,可得去除前满足
产1.5x+0.5=1.5X3+0.5=5,而去除的两个数据点的纵坐标的平均数为5,则去除后与去除前均
值歹不变,故C正确;设去除后的线性回归方程为y=L2x+b,把去除后样本点的中心(3,5)代入
y=l.2x+必得5=1.2X3+3.b=l.4,.•.去除后的线性回归方程为y=l.2x+l.4,故D正确.故选ACD.
3.C由题可得方1+2+:+4+5=3,正°,7+口8+:+-1+L4口,
所以武奈=0.17,a=9-加=1-0.17X3=0.49,
所以年生产利润关于年号的线性回归方程为y=o.17X+0.49,
当产8时,y=0.17X8+0.49=1.85,故选C.
4.解析⑴/社区抽取600*户00(人),
£社区抽取600X,=300(人),
C社区抽取600X^200(人).
(2)①对比b与r的公式,可得b=4一E(々石)2£(必-歹)2
.E⑶-元)211=1\l=1
=ir-£(y「歹)2
10J1=1
J.E^Xj-x)2、
=岛=r〜a987=0047
V13202V1102X10.5*'
a=2.464-0.047X152=-4.68,
所求的线性回归方程为y=0.047『4.68.
当产160时,预报值及=0.047X160-4.68=2.84.
@,:,0.1,,%-3歹2.84-3X0.1=2.54,%+3s-2.84+3X0.1=3.14.
即该地区身高160cm的男孩的FEV1的实际值落在区间(2.54,3.14)内的概率为99.74%,
即该地区身高160cm的男孩的FEV1值不在这个区间内的概率极小,仅
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2023年万向节项目评价分析报告
- 2024-2030年面部化妆行业市场现状供需分析及重点企业投资评估规划分析研究报告
- 2024-2030年静脉注射针行业市场现状供需分析及重点企业投资评估规划分析研究报告
- 2024-2030年防回流装置行业市场现状供需分析及重点企业投资评估规划分析研究报告
- 2024-2030年镀锡板行业市场深度调研及发展趋势与投资战略研究报告
- 2024-2030年通信电源行业市场发展分析及前景趋势与投资战略研究报告
- 2024-2030年铅稳定剂行业市场现状供需分析及重点企业投资评估规划分析研究报告
- 房地建筑施工合同协议书2024年
- 2024-2030年钛合金项目可行性研究报告
- 2024-2030年金属包装材料行业市场深度调研及发展前景与投资研究报告
- 中医养生馆招商方案
- MPS中速磨煤机技术课件
- 《宣传海报的制作》课件
- 变压器的安装与检修课件
- 2023年湖北省武汉大学招聘专业技术岗位45人笔试参考题库(共500题)答案详解版
- 三角形相似的判定和性质课件
- 入职商务礼仪培训提升新员工职场形象
- 小学各年级 世界和平 共建未来 主题班会
- 企业研发管理中的技术平台建设
- 公路工程-图纸会审记录格式表
- 飞机复合材料的修理方法-复合材料铺层修理的主要工序
评论
0/150
提交评论