版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
7.1一元线性回归
在现实生活中,反映量与量之间的函数关系非常普遍,但也存在一些量与量之间不满足函数关系,如人的身高与体重.一般说来,人的身高越高,体重就越重,二者确实有关系.但是身高相同的人,体重却不一定相同,也就是说,给定身高h没有唯一的体重m与之对应.在现实生活中,这样的例子还有很多,如人的年龄与血压、农作物的施肥量与产量等.实例分析1.1直线拟合为了了解人的身高与体重的关系,我们随机抽取9名15岁的男生,测得他们的身高(单位:cm)、体重(单位:kg)如表7-1:表7-1编号123456789身高/cm165157155175168157178160163体重/kg524445555447625053
从表7-1中不难看出,同一身高157cm对应着不同的体重44kg和47kg,即体重不是身高的函数.如果把身高看作横坐标、体重看作纵坐标,在平面直角坐标系中画出对应的点(如图7-1),就会发现,随着身高的增长,体重基本上呈现直线增加的趋势.1.在图7-1中,每个点对应的一对数据(xi,yi),称为成对数据.这些点构成的图称为散点图.2.从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个大致趋势,这种趋势通常可以用一条光滑的曲线来近似地描述.这样近似描述的过程称为曲线拟合。3.若在两个变量x和y的散点图中,所有点看上去都在一条直线附近波动,此时就可以用一条直线来近似地描述这两个量之间的关系,称之为直线拟合.
注意点:(1)判断两个变量X和Y之间是否具有线性关系,常用的简便方法就是绘制散点图.(2)散点图中包含的数据越多,效果就越好.那么,应当如何求出这条直线呢?方法1
选取散点图中的两个点,使得其余的点在这两个点所连直线两侧分布得尽可能一样多,如有人选取了(165,52)和(168,54)这两个成对数据,得到直线方程为2x-3y-174=0.因此,一个身高166cm的15岁男生,他的体重大致为52.667kg.方法2
将所有的点分成两部分,一部分是身高在165cm以下的,一部分是身高在165cm以上(含165cm)的;然后每部分的点求一个平均点:165cm以下的身高、体重的平均数(取整近似)作为一个平均点,即(158,48),165cm以上(含165cm)的身高、体重的平均数(取整近似)作为另一个平均点,即(172,56);最后将这两点连接成一条直线,得到直线方程为4x-7y-296=0,因此,一个身高166cm的15岁男生,他的体重大致为52.571kg.
上面两种方法都有一定的道理.用方法1,若x=175cm,则可计算y≈58.667kg;用方法2,若x=175cm,则可计算y≈714kg.每一种方法均与实际观测值有偏差.在实际应用时,我们通常选择本章第1.2节中介绍的方法进行处理.散点图说明1.定义:
将两个变量所对应的点在平面直角坐标系中描出来,这些点就组成了变量之间的一个图,这种图叫散点图.2.散点图的画法:
把成对的两个变量分别作为横坐标和纵坐标,把每对数值对应的点在平面直角坐标系中画出来.3.散点图的作用:(1)从散点图可以看出,如果变量之间存在某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样近似的过程称为曲线拟合.
若如果变量x和y的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关的.此时,我们可用一条直线来近似.xyo(2)若所有点看上去都在某条曲线(不是一条直线)附近波动,则称此相关为非线性相关的.此时,我们可用一条曲线来拟合.
如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的.xyoxyo例2.一般来说,一个人的身高越高,他的右手就越大,相应地,他的右手一拃长就越长,因此,人的身高与右手一拃长之间存在着一定的关系.为了对这个问题进行调查,我们收集了某中学2003年高三年级96名学生的身高与右手一拃长的数据如表.(P48)(1)根据表中的数据,制成散点图.你能从散点图中发现身高与右手一拃长之间的近似关系吗?o身高/cm右手一拃长/cm15015516016517017518018519019510152025女生男生4.例题与练习例2.一般来说,一个人的身高越高,他的右手就越大,相应地,他的右手一拃长就越长,因此,人的身高与右手一拃长之间存在着一定的关系.为了对这个问题进行调查,我们收集了某中学2003年高三年级96名学生的身高与右手一拃长的数据如表.(P48)(2)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系.女生男生o身高/cm右手一拃长/cm15015516016517017518018519019510152025(3)如果一个学生的身高是188cm,你能估计他的右手一拃长大概有多长吗?18821例2.一般来说,一个人的身高越高,他的右手就越大,相应地,他的右手一拃长就越长,因此,人的身高与右手一拃长之间存在着一定的关系.为了对这个问题进行调查,我们收集了某中学2003年高三年级96名学生的身高与右手一拃长的数据如表.(P48)(2)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系.o身高/cm右手一拃长/cm15015516016517017518018519019510152025(3)如果一个学生的身高是188cm,你能估计他的右手一拃长大概有多长吗?18822平均点例2.一般来说,一个人的身高越高,他的右手就越大,相应地,他的右手一拃长就越长,因此,人的身高与右手一拃长之间存在着一定的关系.为了对这个问题进行调查,我们收集了某中学2003年高三年级96名学生的身高与右手一拃长的数据如表.(P48)(2)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系.o身高/cm右手一拃长/cm15015516016517017518018519019510152025(3)如果一个学生的身高是188cm,你能估计他的右手一拃长大概有多长吗?18822.7例.一般来说,一个人的身高越高,他的右手就越大,相应地,他的右手一拃长就越长,因此,人的身高与右手一拃长之间存在着一定的关系.为了对这个问题进行调查,我们收集了某中学2003年高三年级96名学生的身高与右手一拃长的数据如表.(P48)(3)如果一个学生的身高是188cm,你能估计他的右手一拃长大概有多长吗?o身高/cm右手一拃长/cm16018.016218016616817017217417617816418218.519.019.520.020.521.021.5(2)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系.例1
某种木材体积与树木的树龄之间有如下的对应关系:(1)请作出这些数据的散点图;树龄2345678体积30344060556270解以x轴表示树木的树龄,y轴表示树木的体积,可得相应的散点图如图所示:(2)你能由散点图发现木材体积与树木的树龄近似成什么关系吗?解由散点图发现木材体积随着树龄的增加而呈增加的趋势,且散点落在一条直线附近,所以木材的体积与树龄成线性关系.练习:
以下四个散点图中,两个变量的关系适合用直线拟合描述的是(
)A.①② B.①③C.②③ D.③④解析
①③中的点分布在一条直线附近,适合直线拟合描述.B
例2某品牌服装的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下的对应数据:广告费支出x246810销售额y64138205285360(1)试画出散点图,并判断广告费支出x与销售额y是否具有线性相关关系;(2)若取过点(2,64)和点(8,285)的直线作为拟合直线,试预测当x=10和15时销售额y的值是多少?(结果保留一位小数)解
(1)根据题中数据画出散点图如图观察散点图,可以发现5个样本点从整体上看大致在一条直线附近,所以变量x,y之间具有线性相关关系.(2)过点(2,64)和点(8,285)的直线方程是221x-6y-58=0.令x=10,则221×10-6y-58=0,∴y≈358.7;令x=15,则221×15-6y-58=0,∴y≈542.8,即当x=10时,销售额y的值大约是358.7万元;当x=15时,销售额y的值大约是542.8万元.反思利用拟合直线进行预测时应注意的问题(1)首先要理解线性相关和拟合直线方程的意义.(2)利用拟合直线方程求得的预测值只是实际问题的一个估计值,因此在回答结论时不能说成是准确值,而只能用“大约”等词来回答.1.2一元线性回归方程
对于给定的两个变量x和y(如身高和体重),可以把其成对的观测值(x1,y1),(x2,y2),…,(xn,yn)表示为平面直角坐标系中的n个点.
现在希望找到一条直线Y=a+bX,使得对每一个xi(i=1,2,…,n),由这个直线方程计算出来的值a+bi与实际观测值yi的差异尽可能小.为此,希望[y1-(a+b1)]2+[y2-(a+b2)]2+…+[yn-(a+bn)]2达到最小.换句话说,我们希望a,b的取值能使上式达到最小.这个方法称为最小二乘法.
为了直观起见,先考虑3对数据(x1,y1),(x2,y2),(x3,y3),即:求a,b的值,使得偏差yi-(a+bi)(i=1,2,3)的平方和最小,即[y1-(a+b1)]2+[y2-(a+b2)]2+[y3-(a+b3)]2达到最小.下面我们用向量的方法解决这个问题.首先,用向量的语言描述问题.
要用向量的语言描述偏差yi-(a+bi)(i=1,2,3),容易想到将偏差作为向量的分量,即向量的坐标(y1-(a+b1),y2-(a+b2),y3-(a+b3)).这样,问题就等价于:求的a,b值,使得向量(y1-(a+b1),y2-(a+b2),y3-(a+b3))的长度最小.
在这里需要强调的是:身高和体重之间并没有函数关系,我们得到的线性回归方程只是对其变化趋势的一种近似描述.对一个给定身高的人,人们可以用这个方程来估计这个人的体重,这是十分有意义的.…①先来讨论3个样本点的情况补充:怎样使达到最小值?函数法求线性回归方程:利用配方法可得同样使用配方法可以得到,当假设我们已经得到两个具有相关关系的变量的一组数据且回归方程是:y=bx+a,^其中,a,b是待定参数。当变量x取时它与实际收集到的之间的偏差是oxy2023/12/28易知,截距和斜率分别是使取最小值时的值。由于这正是我们所要推导的公式。在上式中,后两项和无关,而前两项为非负数,因此要使Q取得最小值,当且仅当前两项的值均为0,即有2023/12/282023/12/28用同样的方法我们可以推导出n个点的线性回归方程的系数:牢记公式1、所求直线方程叫做回归直线方程;相应的直线叫做回归直线。2、对两个变量进行的线性分析叫做线性回归分析。回归直线方程最小二乘法:称为样本点的中心。2、求回归直线方程的步骤:(3)代入公式(4)写出直线方程为y=bx+a,即为所求的回归直线方程。^例1
在本章1.1节的练习中,从散点图可以看出,某小卖部6天卖出热茶的杯数Y(单位:杯)与当天气温X(单位:°C)之间存在近似的线性关系.数据如表7-2.(1)试用最小二乘法求岀Y关于X的线性回归方程;(2)如果某天的气温是-3℃,请预测这天可能会卖出热茶多少杯.
1.思考辨析(正确的画“√”,错误的画“×”)(1)利用散点图可以直观判断两个变量的关系是否可以用线性表示.(
)(2)线性回归方程适用于一切样本和总体.(
)(3)线性回归方程一般都有局限性.(
)(4)线性回归方程一定过样本中的某一点.(
)√×√×巩固提升2.如果记录了x,y的几组数据分别为(0,1),(1,3),(2,5),(3,7),那么y关于x的线性回归直线必过点(
)A.(2,2)
B.(1.5,2)C.(1,2)
D.(1.5,4)
答案:D3.随机抽样中测得四个样本点为(1,2),(2,3),(3,4),(4,5),则y与x之间的线性回归方程为(
)A.y=x+1B.y=x+2C.y=2x+1D.y=x-1
答案:A
例3在本章1.1节的练习中,从散点图可以看出,某小卖部6天卖出热茶的杯数Y(单位:杯)与当天气温X(单位:°C)之间存在近似的线性关系.数据如表7-2.(1) 试用最小二乘法求岀Y关于X的线性回归方程;(2) 如果某天的气温是-3℃,请预测这天可能会卖出热茶多少杯.
解(1)从散点图7-6中可以看岀,表7-2中的两个变量有近似的线性关系.
例4
某项研究发现某地的PM10浓度与车流量之间有线性相关关系.现采集到该地一周内车流量x与PM10浓度y的数据如下表:时间车流量x(单位:万辆)PM10浓度y(单位:μg/m3)星期一25.435.7星期二24.634.5星期三23.535.2星期四24.433.6星期五25.836.1星期六19.730.9星期日20.329.4
解析:(1)如图所示.
月份代码t1234567销售量y(万件)y1y2y3y4y5y6y7
例5
某地区2013年至2019年农村居民家庭人均纯收入Y(单位:千元)的数据如下表:(1)求Y关于T的线性回归方程;年份2013201420152016201720182019年份代号T1234567人均纯收入Y2.93.33.64.44.85.25.9解由所给数据计算得
=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,所求线性回归方程为Y=0.5T+2.3.(2)利用(1)中的线性回归方程,分析2013年至2019年该地区农
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 贷款担保协议范本
- 趣味小学语文阅读教学心得分享
- 路面建设分包合同格式
- 软件销售与客户服务支持合同
- 进口肉类选购协议
- 连锁合作联盟合同
- 配餐美食服务协议
- 酒店用品采购合同的法律合规指导
- 野外实习走进植物的家园
- 钢管架施工质量检测标准
- 高考英语听力专题(一)行为动作推断题课件
- 《狼和鸭子》PPT课件小学幼儿园儿童故事表演幻灯片背景有音乐
- 北京市中小学生天文观测竞赛附有答案
- 初中生物知识竞赛试题(含答案)
- 2024年食品安全考试题库及答案
- 中职专业建设方案
- 一年级口算题卡10000道(100以内加减法)
- 歌剧魅影(全英文)课件
- 辉石矿选采项目社会稳定风险评估报告样本
- 服装材料考试试卷(含答案)
- 第十二章 血液系统疾病患儿的护理(一)课件
评论
0/150
提交评论