人教A版选择性8.2一元线性回归模型及其应用课件(22张)_第1页
人教A版选择性8.2一元线性回归模型及其应用课件(22张)_第2页
人教A版选择性8.2一元线性回归模型及其应用课件(22张)_第3页
人教A版选择性8.2一元线性回归模型及其应用课件(22张)_第4页
人教A版选择性8.2一元线性回归模型及其应用课件(22张)_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

两个变量之间的关系不相关函数关系相关关系按增减性按图象形状正相关负相关非线性相关(曲线相关)线性相关温故知新样本相关系数r的性质(1)r∈

__________.(2)当r>0时,称成对样本数据

________相关;当r<0时,称成对样本数据

________相关.(3)当|r|越接近1时,成对样本数据的线性相关程度

_______;当|r|越接近0时,成对样本数据的线性相关程度

________.

称r为变量x和变量y的样本相关系数r:温故知新样本相关系数r的性质(1)r∈

__________.(2)当r>0时,称成对样本数据

________相关;当r<0时,称成对样本数据

________相关.(3)当|r|越接近1时,成对样本数据的线性相关程度

________;当|r|越接近0时,成对样本数据的线性相关程度

________.[-1,1]越强越弱

称r为变量x和变量y的样本相关系数r:正负温故知新

称r为变量x和变量y的样本相关系数r:研究两个变量之间的相关关系①定性研究:绘制散点图②定量研究:计算样本相关系数r温故知新探究1:

生活经验告诉我们,儿子的身高与父亲的身高不仅线性相关,而且还是正相关。为了进一步研究两者之间的关系,有人调查了14名男大学生的身高及其父亲的身高,得到数据如表:探究1:

生活经验告诉我们,儿子的身高与父亲的身高不仅线性相关,而且还是正相关。为了进一步研究两者之间的关系,有人调查了14名男大学生的身高及其父亲的身高,得到数据如表:

作出散点图如右,散点大致分布在一条从左下角到右上角的直线附近,表明儿子身高和父亲身高线性相关,可求得样本相关系数,表明儿子身高和父亲身高正线性相关,且相关程度较高。

因此我们可以用一次函数来刻画父亲身高对儿子身高的影响,而把影响儿子身高的其他因素,比如母亲身高,生活环境,饮食习惯等作为随机误差,得到刻画两个变量之间关系的线性回归模型,其中,随机误差是一个随机变量。

用x表示父亲身高,Y表示儿子身高,e表示随机误差,假定随机误差e的均值为0,方差为与父亲身高无关的定值

,它们之间的关系可以表示为

我们称上面为Y关于x

的一元线性回归模型,其中Y称为因变量或响应变量,x称为自变量或解释变量,a和b为模型的未知参数,a称为截距参数,b称为斜率参数,e是Y与

bx+a之间的随机误差。模型中的Y也是随机变量,其值虽然不能由变量x的值确定。但是却能表示为bx+a与e的和,前一部分由x确定,后一部分是随机的,如果e=0,那么Y与x之间的关系就可以用一元线性函数模型来描述。

对于上述模型,可以解释为父亲身高为

xi的所有男大学生的身高组成一个子总体,该子总体的均值为

bxi+a,即该子总体的均值与父亲身高是线性函数关系,而对于父亲身高为

xi的某一名大学生,他的身高yi不一定是

bxi+a,它仅是该子总体中的一个观测值,这个观测值与均值有一个误差项

ei=yi-(bxi+a)

如果散点图中的点的分布,从整体上看大致在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做经验回归直线.将

称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式。

一元线性回归模型对一组具有线性相关关系的样本数据:(x1,

y1),(x2,

y2),…,

(xn,

yn),

设其回归方程为

=bx+a,

可以用哪些数量关系来刻画各样本点与回归直线的接近程度?(x1,

y1)(x2,

y2)(xi,

yi)(xn,

yn)最小乘法:当时,2、

具有线性相关关系的两个变量,其回归直线一定通过样本点的中心(x,y)1、这种求经验回归方程的方法叫做最小二乘法,求得的

叫做b,a的最小二乘估计。3、对于直线

的计算公式为:

一元线性回归模型探究1:

生活经验告诉我们,儿子的身高与父亲的身高不仅线性相关,而且还是正相关。为了进一步研究两者之间的关系,有人调查了14名男大学生的身高及其父亲的身高,得到数据如表:提问:当x=176时,y≈177,如果一位父亲身高是176,他儿子长大成人之后的身高一定是177吗?为什么?

对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的y称为预测值,观测值减去预测值称为残差。残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据,这方面的工作称为残差分析。

例如,对于第6个观测值,父亲身高为172,儿子身高的观测值为y6=176,预测值为

y6,残差为176-173.265=2.735.类似,可以得到其他的残差(如下表),可画出残差图(如右图):

可以发现,残差有正有负,比较均匀地分布在横轴的两边,说明残差比较符合一元线性回归模型的假定,是均值为0,方差为

的随机变量的观测值,可见,通过观察残差图可以直观判断模型是否满足一元线性回归模型的假设。

可以发现,残差有正有负,比较均匀地分布在横轴的两边,说明残差比较符合一元线性回归模型的假定,是均值为0,方差为

的随机变量的观测值,可见,通过观察残差图可以直观判断模型是否满足一元线性回归模型的假设。

建立经验回归方程后,需要对模型刻画数据的效果进行分析,借助残差分析还可以对模型进行改进,使我们能根据改进模型作出更符合实际的预测与判定。

观察这四幅残差图,哪一个残差满足一元线性回归模型中对随机误差的假定?

课堂练习1、关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计数据(xi,yi)(i=1,2,3,4,5),由资料知y对x呈线性相关,并且统计的五组数据的平均值分别为

=4,

=5.4,若用五组数据得到的线性回归方程

y

=bx+a去估计,使用8年的维修费用比使用7年的维修费用多1.1万元,(1)求回归直线方程;(2)估计使用年限为10年时,维修费用是多少?

课堂练习2、某连锁经营公司所属5个零售店某月的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论