版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
n.第日章统计
DIYlZHANG§1.8最小二乘估计
课前新知预习
[航向标.学习目标]
i.在探索多种方法确定线性回归直线的过程中,体会最小二乘的思想方法.
2.能根据给出的线性回归方程系数公式建立线性回归方程.
[读教材•自主学习]
1.最小二乘法:如果有〃个点:(X1,yi),(X2,刈),…,(xn,%),可以用下
面的表达式来刻画这些点与直线y=a+bx的接近程度:
回[丫1-(a+公])]2+卜2—(v+]2H----1-[%—(a+bx0]2.
使得上式达到最小值的直线y=a+bx就是我们所要求的直线,这种方法称为
园最小二乘法.
,be—_____X1+X2+…+*"m.___Vl+V2+••,+¥„
2.线性回归方程:如果用x表示工,用y表水~,
则可以求得8=
(X1二X)8二),)+&2-X)(),2-))H-----F(X„-X)(),"-y)=但
22
(X|-X)+(X2-X)+,,,+(xn-X)2
用+二十*,四-2九y.〃=歹一匕三.这样得到的直线方程称为线性回归方
•4+於H—I-焉一〃x2
程,a,。是线性回归方程的系数.
[看名师•疑难剖析]
1.求线性回归方程的步骤
⑴列表X”M,孙.
__nn
⑵计算x,y,£4,以必
/=1/=1
Y^iy—nxy
i=\
(3)代入公式。=-----------,o=y—求出A,a.
x2
i=\
A
(4)写出直线方程:y=hx+a.
2.线性回归方程系数公式的推导过程
首先将S—(4+人为)]2+[竺一3+bx2)]2H-----(a+bx”)]?化成关于未知数
a的一元二次多项式形式:
na2+2n(bx-y)a+[(y-bx\)2+(y2—bx*。+…+(y„—Z?x„)2]=+(Z?x-
22-2
y)f—〃Sx—y)+[(yi-i)+(y2bx^H----F(y„—Z?x„)]
因此当时,上式取得最小值,将这个关系代入上式,整理成关于
未知数b的一元二次多项式的形式:
22
[yi—(«+Z?Xi)]+[y2—(«+bx2)]-\----FD”—(a+bx,^
22
=[(yi—y)-b(x\—x)]+[(j2-y)~bg~X)]4-----卜[(y„y)~b(xn—
x)]2
222
=/?[(x|—Xy+(X2-X)H-----F(x„—X)]—2&[(X1—X)-1—y)+(丁一x)(y2
22
—y)H-----<-(%„—x)(yM—y)]+[(yi—y)+(y2—y)-l-----b(y“一yf],因此,当b
(xi一x)(yi—)')+。2―%)(m—y)H-----x)&"-y)
(X1-X)2+(X2—X)2+X)2
n_____
Xxiyi-nxy
i=\
Xiyi十彳2丁2~1----|-%,加|一〃九
时点(修,yD(X2,")…(X",%)与直线y
於+於H----1-焉一〃x2
i=l
=a+bx最接近(注意并不是点到直线距离之和最小).a,b的意义是:以。为基
数,x每增加一个单位,y相应的平均增加/?个单位.
课堂师生共研
考点一线性回归方程的概念
例1设有一个线性回归方程为y=4—2x,则变量x增加2个单位时()
A.y平均增加1.5个单位B.y平均减少1.5个单位
C.y平均增加4个单位D.y平均减少4个单位
[解析]该题考查线性回归方程的两个变量之间的线性关系问题.由回归直
线方程y=4-2x,知斜率为一2,所以变量x每增加1个单位,y平均减少2个单
位,故当变量x增加2个单位时,)平均减少4个单位,所以选D.
[答案]D
类题通法
根据线性回归方程可获得对两个变量之间整体关系的了解,对于已知的变量
x,可以相应估计出变量y的值.
[变式训练1]工人月工资(元)依劳动生产率(千元)变化的线性回归方程为y
=50+80x,下列判断正确的是()
A.劳动生产率为1000元时,工资为130元
B.劳动生产率提高1000元时,工资平均提高80元
C.劳动生产率提高1000元时,工资平均提高130元
D.当月工资为210元时,劳动生产率为2000元
答案B
解析线性回归方程中匕的意义是当x增加一个单位时,y的值平
均变化。个单位,这是一个平均变化率.线性回归方程只能用于预测变量的值.
考点二求线性回归方程
例2每立方米混凝土的水泥用量式单位:kg)与28天后混凝土的抗压强度
y(单位:kg/cn?)之间的关系有如下数据:
X150160170180190200210220230240250260
y56.958.361.664.668.171.374.177.480.282.686.489.7
求两变量间的回归直线方程.
[分析]由题目可获取以下主要信息:
①两变量具有线性相关关系;
②由两变量的对应数据求回归直线方程.
解答本题要先列出相应的表格,有了表格中的那些相关数据,回归方程中的
系数就都容易求出了.
[解]列表如下:
i123456
Xi150160170180190200
M56.958.361.664.668.171.3
孙8535932810472116281293914260
i789101112
Xi210220230240250260
yi74.177.480.282.686.489.7
孙155611702818446198242160023322
x=205,y=726
121212
Z>-=518600,2y=64572.94,力渺=182943
«=i/=iz=i
.182943—12X205X72.64347
"b=-518600-12X2052-=14300^0'304,
a=^-b~x=72.6-0.304X205=10.28.
A
于是所求的回归方程是y=0.304x+10.28.
类题通法
用公式求回归方程的一般步骤是:
①列表孙孙孙.
②计算x,y,ZAH£漱,以必
i=1i=1i=1
③代入公式计算力、a的值.
④写出回归直线方程.
[变式训练2]为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身
高数据如下:
父亲身高x(cm)174176176176178
儿子身高>,(cm)175175176177177
则y对无的线性回归方程为()
A.y=x-1B.y=x+l
C.y=88+5D.y=176
答案C
解析本题考查线性回归方程的求法.设y对x的线性回归方程为
-2X(—1)+OX(-1)+OXO+OX1+2X11
因为b=a=176—176=
(-2)2+2221
88,所以y对x的线性回归方程为y=1x+88.选C.
规范答题思维
规范答题线性相关关系的判断及线性回归方程的求解
[例](12分)假设关于某设备使用年限x(年)和所支出的维修费用y(万元)有如
下统计资料:
X23456
y2.23.85.56.57.0
(1)请画出上表数据的散点图,判断它们是否具有线性相关关系;若线性相关,
用最小二乘法求出y关于x的线性回归方程;
(2)试根据(1)求出的线性回归方程,预测使用年限为10年时,维修费用是多
少?
(一)精妙思路点拨
(二)分层规范细解
(1)散点图①如图所示:
年
由散点图可知,两变量之间具有相关关系,且为线性相关关系.4分
下面用最小二乘法求线性回归方程:
列表,计算
i12345
Xi23456
%2.23.85.56.57.0
孙4.411.422.032.542.0
49162536
弟=90,玄力=112.3②
x=4,y=5,
<=1/=1
设所求回归方程为:y=bx+a,则由上表可得
5____
»以一5xy
___________112.3-5X4X512.3,田
b~5—90-5X42—10—L23
i=\
8分
■^―②
a=y=5-1.23X4=0.08.
二线性回归方程为y=1.23x+0.08.10分
(2)把尤=10代入(1)中所求得的线性回归方程得:
y=1.23X10+0.08=12.38,11分
即使用年限为10年时,维修费用约是12.38万元③.12分
(三)来自一线的报告
通过阅卷后分析,对解答本题的失分警示和解题启示总结如下:(注:此处的
①②③见分层规范细解过程)
在解答过程中,①处散点图的画法中,横、纵
①坐标的刻度选取不当,不易观察散点分布,
会丢失2分;或选取样本数据出现描点错
误,也会失2分.
失
分在解答过程中,②处的计算都很复杂,易出
②
警错,致使后面的解答也易出错,若出错,在考
示
试中最多得5分.
在解答过程中,由回归方程计算得到的
12.38万元只是一个预测值,是实际问题的
一个估计值,因此若最后③处回答中无“约”
字,则会失掉1分.
(1)在解题中注意运用数形结合法,正确地画出图形.
解
(2)求线性回归方程时,注意数字的运算技巧,提高
题
启运算能力.
示
(3)体会理解公式的作用,在记忆公式的同时,加深
理解公式的特点和规律.
(四)类题练笔掌握
以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:
房屋面积Mn?)80105110115135
销售价格y(万元)18.42221.624.829.2
(1)画出数据对应的散点图;
(2)求线性回归方程,并在散点图中加上回归直线;
⑶试预测90m2的房屋,销售价格是多少?(精确到0.01)
解(1)根据表中所列数据可得散点图如下:
由图可见两者之间是线性相关的.
(2)列表,计算:
i12345
Xi80105110115135
18.42221.624.829.2
X〉i14722310237628523942
xi640011025121001322518225
__55
x=109,y=23.2,)=60975,12952
2=1/=1
故可求得:
5_____
xy
1=1
b=
ixi-572
7=1
12952—5X109X23,2_
=―60975-5XI092—2°1962'
a=y-Z?x=23.2-0.1962X109=1.8142,
所以,线性回归方程为y=0196Zc+1.8142,回归直线如(1)中图.
(3)把x=90代入上述回归方程y=0.1962x+1.8142,
即^=0.1962X90+1.8142^19.47,即这种90m2的房屋,销售价格约是19.47
万元.
(五)解题设问
画出散点图的作用是什么?.
答案判断数据是否线性相关
检测学业达标
1.设有一个回归方程为y=2—1.5x,则变量光增加一个单位时()
A.y平均增加1.5个单位B.y平均增加2个单位
C.y平均减小1.5个单位D.y平均减少2个单位
答案C
解析由相关系数的意义可知C正确.
2.线性回归方程表示的直线y=a+法必定过(
A.(0,0)点B.(x,0)点
C.(0,歹)点D.(x,
答案D
3.试验测得四组(x,>)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的线
性回归方程为()
A.y=x+lB.y=x+2
C.y=2x+\D.y=x—1
答案A
解析作散点图,利用最小二乘法求线性回归方程.
4.施化肥量xkg与水稻产量ykg在一定范围内线性相关,若线性回归方程
为y=5x+250,当施化肥量为80kg时,预计水稻的产量为.
答案650kg
解析将x的值代入线性回归方程即可.
5.假设学生在七年级和八年级的数学成绩是线性相关的,若10个学生七年
级㈤和八年级0)数学分数如下:
X74717268767367706574
y76757170767965776272
试求七年级和八年级数学分数间的回归直线方程.
解因为三=71,£^=50520,
10
9=72.3,》科=51467,
51467—10X71X72.3
所以b=—50520-10X712=1.2182,
a=72.3—1.2182X71=—14.192.
A
回归直线方程是y=1.2182x—14.192.
课后梯度测评
一'选择题
1.过三点(3,10),(7,20),(11,24)的线性回归直线方程是()
A.y=1.75-5.75%B.-1.75+5.75%
C.y=5.75+1.75xD.y=5.75—1.75x
答案C
解析根据求线性回归方程的方法,利用公式可得到答案.
2.抽测10只某种白炽灯的使用寿命尤,结果如下(单位:力:1067,919,1196,785,
A936,918,1156,920,918,若4=997,则/大约是()
A.1120B.1124C.1155D.1128
答案C
3.在线性回归方程中,b表示()
A.当x增加一个单位时,y增加a的数量
B.当y增加一个单位时,x增加b的数量
C.当x增加一个单位时,y的平均变化量
D.当y增加一个单位时,x的平均变化量
答案C
解析本题主要考查线性回归方程中m。的含义.
4.由一组样本数据8,yi),(%2,)2),…,(X”,%)得到线性回归方程y=bx
+“,那么下列说法中错误的是()
A.直线y=b:+a必经过点(x,y)
B.直线y=/zr+a至少经过点(修,力),(物”),…,(尤"%)中的一个点
y
f=l
C.直线y=bx+a的斜率为b=-----------
2
<=1
n
D.直线y=bx+a和各点(xi,%),(检,"),…,(x”,%)的偏差的平方和
i=i
凶一(如+喇2是该坐标平面上所有直线与这些点的偏差的平方和中最小的
答案B
解析理解线性回归方程的真正含义.因为7=人工+。,其中三=/沏+%2
HFx„)»y=%i+y2Tl-yn),显然回归直线经过点(x,y).故A是正确的.回
归直线最能近似刻画点(汨,yi),(X2,"),…,(X”,y”)的变化趋势,但并不一定
经过某些点.故B是错误的.对于C、D只需了解相应概念便会得出正确结论.
5.下列叙述中:
①变量间关系有函数关系,还有相关关系;
②回归函数即用函数关系近似地描述相互关系;
n
③营商=修+尬+…
n__
"£(即一x)(y-y)__
④线性回归方程y=/?x+a中,b=71二,a=y~bx;
石(x-x)2
⑤线性回归方程一定可以近似地表示所有相关关系.
其中正确的有()
A.①②③B.①②④⑤
C.①②③④D.③④⑤
答案C
解析利用直接法逐个判断可知,①②③④正确,而⑤线性回归方程可以近
似地表示具有线性相关关系,而不能表示其他相关关系.
6.某化工厂为预测某产品的回收率y,需要研究它和原料有效成份含量x之
888
间的相关关系,现取了8对观察值,计算得:石片=52,石%=228,,?肃=478,
8
X=RY=1849,则y与x的回归方程是()
l1
AA
A.y=11.47+2.62rB.y=-11.47+2.62%
C.y=2.62+22.47xDj=11.47-2.62%
答案A
解析把题目所给的数据代入公式分别求系数。和人即可.
二、填空题
7.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万
元),调查显示年收入尤与年饮食支出y具有线性相关关系,并由调查数据得到y
对尤的回归直线方程:;=0.254x+0.321.由回归直线方程可知,家庭年收入每增
加1万元,年饮食支出平均增加万元.
答案0.254
解析本小题主要考查了利用回归直线方程,对数据进行估计.以x+1代X,
得0.254(x+1)+0.321,与0.254x+0.321相减可得,年饮食支出平均增加0.254
万元.
8.某商店统计了最近6个月某商品的进价x与售价y(单位:元)的对应数据
如下:
X3528912
y46391214
__66
则尤=,y=,耳6=,N项y尸,回归
方程为.
A
答案6.58327396y=1.4x+0.571
6
解析根据公式代入即可求得,也可以利用计算器求得,7=6.5,7=8,
6A
焉=327,石x,y=396,回归方程为y=1.4x+0.571.
9.假设学生在初中的英语成绩和高一英语成绩是线性相关的.现有10名学
解析求斜率即求回归方程中的。,按照公式进行即可,即需要依次计算出工
10_1051467-10X71X72.3
-71,gx--50520,y—72.3,石1%-51467,所以b-
50520-10X712
^1.2182,所以斜率为1.2182.
三'解答题
10.在10年期间,一城市居民的年收入与某种商品的销售额有如下数据:
第几年12345678910
城市居
民年收入32.231.132.935.837.138.039.043.044.646.0
7(亿元)
某种商品
销售额25.030.031.037.039.041.042.044.048.051.0
y(万元)
(1)画出散点图;
(2)如果散点图中的各点大致分布在一条直线的附近,求y与x之间的线性回
归方程.
解(1)散点图如图.
销售额(万元)
52
48
44
40
36
32
28
24
人人八人111111111___________-
0T303234363840424446年收入(亿元)
(2)由图可知,y与x线性相关,列表计算如下:
1乃y石”
132.225.0805
231.130.0933
332.934.01118.6
T=37.97,5=39.1
435.837.01324.69
10。
£—=14663.67,
537.139.01446.9r=1
10
638.041.01558=15202.9
/=1
739.042.01638
843.044.01892
944.648.02140.8
1046.051.02346
-X_____
心-15202.9-10X37.97X39.1
所以b=14663.67—10X37.972乂一,,=39.1-1.447X37.97--
15.843,因此,所求线性回归方程为y=1.447x-15.843.
11.PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),
为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段
车流量与PM2.5浓度的数据如下表:
时间周一周二周三周四周五
车流量M万辆)100102108114116
浓度y(微克/立方米)7880848890
(1)根据上表数据,用最小二乘法求出y与x的线性回归方程;
(2)若周六同一时段车流量是200万辆,试根据⑴求出的线性回归方程,预测
此时PM2.5的浓度为多少?
_15540
解(1)由条件可知,x产5=1。8,
/=1
-14200
5—84,
i=l
5__
z(即-X)(M-y)=(—8)义(-6)+(—6)X(—4)+0X0+6X4+8X6=144,
/=1
5_
Z(X/—x『=(—8)2+(—6)2+02+62+82=200,
/=!
5__
Z8-X)(y-y)
/=1144
b=—;2=200=°-72,
X(XLX)2
Z=1
a=y一〃x=84—0.72义108=6.24,
A
故y关于x的线性回归方程为y=0.72x+6.24.
A
(2)当尤=200时,y=0.72X200+6.24=150.24.
所以可以预测此时PM2.5的浓度约为150.24微克/立方米.
12.某地最近十年粮食需求量逐年上升,下表是部分统计数据:
年份20102012201420162018
需求量(万吨)236246257276286
(1)利用所给数据求年需求量与年份之间的回归直线方程y=foc+a;
(2)利用(1)中所求出的直线方程预测该地2020年的粮食需求量.
解本题考查回归分析的基本思想及其初步应用、回归直线的意义和求法、
数据处理的基本方法和能力,考查运用统计知识解决简单实际应用问题的能力.
(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求回归直
线方程.为此对数据预处理如下:
年份一2014-4-2024
需求量一257-21-1101929
对预处理后的数据,容易算得意=0,7=3.2,
(-4)X(-21)+(-2)X(-ll)+2X19+4X29
b=42+22+22+42
6z2—yhx=3.2.
由上述计算结果,知所求回归直线方程为y—257=b(x—2014)+a=6.5(x—
2014)+3.2,
A
即产6.5。—2014)+2602①
(2)利用直线方程①,可预测2020年的粮食需求量为
6.5X(2020—2014)+260.2=6.5X6+260.2=299.2(万吨)Q300(万吨).(未写
近似值不扣分)
13.日常生活中,某些东西所含的热量比较高,对我们的身体有一定的影响,
下表给出了不同类型八种饼干的数据,第一列数据表示八种饼干各含热量的百分
比,第二列数据表示顾客对八种饼干所给予分数(百分制).
品种所含热量的百分比口味记录
125
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 护士基础护理个人述职
- 职业生涯规划的自我监控
- 学会谈判做销冠
- 兽药课件下载
- 案例研究-广西大学文化素质教育基地
- 财务共享服务中心自建与外包的选择
- 2025年部门预算支出经济分类科目修订前后对比表
- 小学体育课件下载
- 健康幼儿园课件
- 广东省佛山市南海区2024-2025学年高一上学期学业水平测试(12月)数学试题 含解析
- DDI-目标选才经典
- 2023年注册验船师职业资格考试大纲
- EPC总承包项目管理组织方案(投标)
- 餐厅包厢改造报价清单
- 占用、挖掘城市道路审批
- XX集团公司供应商管理办法
- GB/T 12579-2002润滑油泡沫特性测定法
- 诺如病毒(同名315)课件
- 火山成因矿床课件
- 消防主机操作规范课件
- 体态与健康1剖析课件
评论
0/150
提交评论