一元线性回归模型课件高二下学期数学人教A版选择性_第1页
一元线性回归模型课件高二下学期数学人教A版选择性_第2页
一元线性回归模型课件高二下学期数学人教A版选择性_第3页
一元线性回归模型课件高二下学期数学人教A版选择性_第4页
一元线性回归模型课件高二下学期数学人教A版选择性_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

8.2.1一元线性回归模型通过前面的学习我们已经了解到,根据成对样本数据的散点图和样本相关系数,可以推断两个变量是否存在相关关系、是正相关还是负相关,以及线性相关程度的强弱等.进一步地,如果能像建立函数模型刻画两个变量之间的确定性关系那样,通过建立适当的统计模型刻画两个随机变量的相关关系,那么我们就可以利用这个模型研究两个变量之间的随机关系,并通过模型进行预测.下面我们研究当两个变量线性相关时,如何利用成对样本数据建立统计模型,并利用模型进行预测的问题.创设情境问题1:生活经验告诉我们,儿子的身高与父亲的身高不仅线性相关,而且还是正相关,即父亲的身高较高时,儿子的身高通常也较高.为了进一步研究两者之间的关系,有人调查了14名男大学生的身高及其父亲的身高,得到的数据如下表所示.编号1234567891011121314父亲身高/cm174170173169182172180172168166182173164180儿子身高/cm176176170170185176178174170168178172165182探究:一元线性回归模型思考1:根据表中的数据,儿子身高和父亲身高这两个变量之间的关系可以用函数模型刻画吗?…172…父亲身高…176174…儿子身高儿子身高不是父亲身高的函数61721768172174编号1234567891011121314父亲身高/cm174170173169182172180172168166182173164180儿子身高/cm176176170170185176178174170168178172165182思考1:根据表中的数据,儿子身高和父亲身高这两个变量之间的关系可以用函数模型刻画吗?61721768172174…170…儿子身高…173169…父亲身高父亲身高不是儿子身高的函数31731709169170利用前面表示数据的方法,以横轴表示父亲身高、纵轴表示儿子身高建立直角坐标系,再将表中的成对样本数据表示为散点图,如右图所示.思考2:经过刚才的分析,你觉得儿子身高与父亲身高的关系是怎样的?儿子身高与父亲身高不是函数关系,而是相关关系.儿子身高与父亲身高不是函数关系,而是相关关系.追问:儿子身高与父亲身高的关系是正相关还是负相关?是线性相关还是曲线相关?随着父亲身高的增加,儿子身高呈增加的趋势,所以是正相关.儿子身高与父亲身高呈正线性相关关系.思考3:你能否进一步验证刚才的结论?

样本相关系数为:表明儿子身高和父亲身高正线性相关,且相关程度较高.思考4:除父亲身高外,还有哪些因素影响儿子的身高?随机误差e母亲身高生活环境饮食习惯体育锻炼

……追问:如何理解随机误差e对儿子身高的影响?假设没有随机误差,则儿子身高Y只受父亲身高x影响,则事实上,相关系数,故也可以记作思考5:随机误差e有哪些特征?随机误差e是一个随机变量①可取正或取负②有些无法测量③不可事先设定因为误差是随机的,即取各种正负误差的可能性一样,所以它们均值的理想状态应该为0.追问:为什么要假设E(e)=0,而不假设其为某个不为0的常数?思考6:你能否考虑到上述随机因素的作用,用类似于函数的表达式,表达儿子身高与父亲身高的关系吗?若用x表示父亲身高,Y表示儿子身高,e表示随机误差.假定随机误差e的均值为0,方差为与父亲身高无关的定值σ2,则它们之间的关系可以表示为我们称(1)式为Y关于x的一元线性回归模型.其中,Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.模型中的Y也是随机变量,其值虽不能由变量x的值确定,但却能表示为bx+a与e的和,前一部分由x所确定,后一部分是随机的.如果e=0,那么Y与x之间的关系就可用一元线性函数模型来描述.函数模型与回归模型有什么区别?追问1:你能结合父亲与儿子身高的实例,说明回归模型(1)的意义?

追问2:对于父亲身高为xi的某一名男大学生,他的身高yi一定是bxi+a吗?

思考7:你能结合具体实例解释产生模型(1)中随机误差项的原因吗?在研究儿子身高与父亲身高的关系时,产生随机误差e的原因有:(1)除父亲身高外,其他可能影响儿子身高的因素,比如母亲身高、生活环境、饮食习惯和锻炼时间等;(2)在测量儿子身高时,由于测量工具、测量精度所产生的测量误差;(3)实际问题中,我们不知道儿子身高和父亲身高的相关关系是什么,可以利用一元线性回归模型来近似这种关系,这种近似也是产生随机误差e的原因.在一元线性回归模型y=bx+a+e中,随机误差e产生的原因有:(1)所用的确定性函数不恰当引起的误差;(2)忽略了某些因素的影响;(3)存在观测误差.归纳总结课本107页说明函数模型与回归模型的区别,并分别举出两个应用函数模型和回归模型的例子.解:函数模型刻画的是变量之间具有的函数关系,是一种确定性的关系.回归模型刻画的是变量之间具有的相关关系,不是一种确定性的关系,即回归模型刻画的是两个变量之间的随机关系.例如,路程与速度的关系、正方体体积与边长的关系可以应用函数模型刻画;体重与身高的关系、冷饮销量与气温的关系可以应用回归模型刻画.练习2.在一元线性回归模型(1)中,参数b的含义是什么?解:参数b的含义可以解释为解释变量x对响应变量Y的均值的影响,变量x每增加1个单位,响应变量Y的均值将增加b个单位.例如,教科书中父亲身高为175cm的儿子身高的均值比父亲身高为174cm的儿子身高的均值高出0.839cm.注意:因为响应变量Y最终取值,除了受变量x的影响,还要受随机误差e的影响,所以不能解释成解释变量x每增加一个单位,响应变量Y增加b个单位.课本107页例:若某地财政收入x与支出y满足一元线性回归模型y=bx+a+e(单元:亿元),其中b=0.7,a=3,|e|≤0.5,如果今年该地区财政收入10亿元,年支出预计不会超过多少?解:因为财政收入x与支出y满足一元线性回归模型y=bx+a+e,其中b=0.7,a=3,所以得到

y=0.7x+3+e,当x=10时,得y=0.7×10+3+e=10+e,而|e|≤0.5,即-0.5≤e≤0.5,所以9.5≤y≤10.5,所以年支出预计不会超过10.5亿元.例题随堂检测1.在线性回归模型y=bx+a+e中,下列说法正确的是(

)A.y=bx+a+e是一次函数B.因变量y是由自变量x唯一确定的C.因变量y除了受自变量x的影响外,可能还受到其它因素的影响,这些因素会导致随机误差e的产生D.随机误差e是由于计算不准确造成的,可通过精确计算避免随机误差e的产生解析:选项A,在线性回归模型y=bx+a+e中,方程表示的不是函数关系,因此不是一次函数,故A错误;选项B,因变量y不是由自变量x唯一确定的,故B错误;选项D,随机误差是不能避免的,只能将误差缩小,但是不能没有误差,故D错误,只有选项C成立.2.判断下列变量间哪些能用函数模型刻画,哪些能用回归模型刻画?(1)某公司的销售收入和广告支出;(2)某城市写字楼的出租率和每平米月租金;(3)航空公司的顾客投诉次数和航班正点率;(4)某地区的人均消费水平和人均国内生产总值(GDP);(5)学生期末考试成绩和考前用于复习的时间;(6)一辆汽车在某段路程中的行驶速度和行驶时间;(7)正方形的面积与周长.解:(1)(2)(3)(4)(5)回归模型,(6)(7)函数模型.时间x(s)5101520304050607090120深度Y(μm)581013161719232529462.建立一元线性回归模型的步骤1.一元线性回归模型(1)与函数模型的区别(2)随机误差产生的原因及分布定性分析定量分析函数关系或相关关系或没有关系课堂小结其中,Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论