版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
8.2.2一元线性回归模型参数的最小二乘估计(1)复习引入在一元线性回归模型中,表达式Y=bx+a+e刻画的是变量Y与变量x之间的线性相关关系,其中参数a和b未知,需要根据成对样本数据进行估计.由模型的建立过程可知,参数a和b刻画了变量Y与变量x的线性关系,因此通过成对样本数据估计这两个参数,相当于寻找一条适当的直线,使表示成对样本数据的这些散点在整体上与这条直线最接近.探究:利用散点图8.2-1找出一条直线,使各散点在整体上与此直线尽可能接近.探究:最小二乘法在图中选择这样的两点画直线,使得直线两侧的点的个数基本相同,把这条直线作为所求直线,如图(2)所示.采用测量的方法,先画出一条直线,测量出各点到它的距离,然后移动直线,到达一个使距离的和最小的位置.然后测量出此时的斜率和截距,就可得到一条直线,如图(1)所示.(1)方法一:(2)方法二:在散点图中多取几对点,确定出几条直线的方程,再分别求出这些直线的斜率、截距的平均数,将这两个平均数作为所求直线的斜率和截距,如图(3)所示.(2)方法三:上面这些方法虽然有一定的道理,但比较难操作,我们需要另辟蹊径.先进一步明确我们面临的任务:从成对样本数据出发,用数学的方法刻画“从整体上看,各散点与直线最接近”.通常,我们会想到利用点到直线y=bx+a的“距离”来刻画散点与该直线的接近程度,然后用所有“距离”之和刻画所有样本观测数据与该直线的接近程度.设满足一元线性回归模型的两个变量的n对样本数据为(x1,
y1),(x2,
y2),‧‧‧,(xn,
yn),由yi=bxi+a+ei(i=1,2,‧‧‧,n),得显然|ei|越小,表示点(xi,
yi)与点(xi,
bxi+a)的“距离”越小,即样本数据点离直线y=bx+a的竖直距离越小,如右图所示.特别地,当ei=0时,表示点(xi,
yi)在这条直线上.因此,可以用这n个竖直距离之和来刻画各样本观测数据与直线y=bx+a的“整体接近程度”.在实际应用中,因为绝对值使得计算不方便,所以人们通常用各散点到直线的竖直距离的平方之和来刻画“整体接近程度”.所以我们可以取使Q达到最小的a和b的值作为截距和斜率的估计值.要使Q取到最小值,则∴要使Q取得最小值,当且仅当b的取值为综上,当a,b的取值为时,Q达到最小.经验回归方程与最小二乘估计:我们将
称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.
这种求经验回归方程的方法叫做最小二乘法,利用公式(2)求得的
叫做b,a的最小二乘估计.归纳总结易得:(1)经验回归直线必过点;(2)与相关系数r符号相同.这里的“二乘”是平方的意思.编号1234567891011121314父亲身高/cm174170173169182172180172168166182173164180儿子身高/cm176176170170185176178174170168178172165182对于上表中的数据,利用公式(2)可以计算出
得到儿子身高Y关于父亲身高x的经验回归方程为
相应的经验回归直线如下图所示.课本113页对一元线性回归模型参数a和b的估计中,有人认为:“估计方法不止一种,根据不同的样本观测数据到直线‘整体接近程度’的定义,可以得到参数a和b不同的估计,只要‘整体接近程度’定义合理即可.”你觉得这个说法对吗?解:这个说法是对的.选择刻画散点趋势的直线可以有不同的标准,取决于“整体接近程度”的定义,定义不同,得到参数a和b的估计往往也不同.例如,我们可以用刻画“整体接近程度”得到参数a和b的最小二乘估计,也可以用
刻画“整体接近程度”得到参数a和b的估计,二者估计的结果一般不同.练习商店名称ABCDE销售额x/千万元35679利润额y/百万元23345例1:某连锁经营公司所属5个零售店某月的销售额和利润额资料如下表:(1)画出销售额和利润额的散点图;(2)计算利润额y对销售额x的经验回归直线方程.解:(1)散点图如下:例题∴所求经验回归方程为解法1:(2)商店名称ABCDE销售额x/千万元35679利润额y/百万元23345∴所求经验回归方程为商店名称ABCDE销售额x/千万元35679利润额y/百万元23345解法2:(2)求经验回归方程的步骤:反思归纳x1234y1345
1.已知变量x,y有如下对应数据:(1)作出散点图;(2)用最小二乘法求关于x,y的经验回归方程.解:(1)散点图如下:练习∴所求经验回归方程为解:(2)x1234y13452.某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:x24568y3040605070(1)画出散点图;解:散点图如图所示.样本点分布在一条直线附近,y与x具有线性相关关系.(2)求经验回归方程.解:列出下表,并用科学计算器进行有关计算.1.已知x与y之间的一组数据:x0123y1357∴经验回归直线必过点(1.5,4).故选D.随堂检测父亲身高x/cm174176176176178儿子身高y/cm1751751761771772.为了解儿子身高与其父亲身高的关系,随机抽取5对身高数据如下:则y对x的经验回归直线方程为()3.某商品销售量y(件)与销售价格x(元/件)负相关,则其经验回归方程可能是(
)解析:x的系数为负数,表示负相关,排除B,D;由实际意义可知x>0,y>0,显然C不满足,故选A.解析:经验回归直线的斜率的估计值为1.23,4.已知经验回归直线的斜率的估计值是1.23,且过定点(4,5),则经验回归方程是______________.5.某班5名学生的数学和物理成绩如表:学生学科ABCDE数学成绩(x)8876736663物理成绩(y)7865716461求物理成绩y对数学成绩x的经验回归方程.1.经验回归方程:我们将
称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法.2.最小二乘估计:经验回
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 数据中心安全基础培训
- 华师大七年级上册科学期中试卷1
- 华师大版八年级下册科学期中试卷1
- 四川省成都市2020年会考生物试题带解析
- 医院5S管理成效展示
- 管道图纸的管道间距和高度规定
- 部门力量全解析
- 专题21 太阳、月球结构及地球自转-2022-2023学年七年级科学下册期中期末考点大串讲(浙教版)(原卷版)
- 直播知识策划的场景设计与布局
- 平安假期共同守护幸福家庭
- 计算机网络技术基础(第6版)全套教学课件
- 湖南省岳阳市2023年八年级上学期期末质量检测数学试题附答案
- 有限空间作业安全管理协议
- 2023年资产负债表模板
- 道路绿化养护投标方案(技术方案)
- 【语文】北京市芳草地小学小学三年级上册期末试卷(含答案)
- 屋面工程质量控制
- ASCP Oracle R12 计划管理 高级供应链计划管理系统 Oracle Advanced Supply Chain Planning (ASCP) (培训学习资料)
- GB/T 10858-2023铝及铝合金焊丝
- 2022青海水电集团公开招聘高校毕业生上岸笔试历年难、易错点考题附带参考答案与详解
- 机电安装工操作规程
评论
0/150
提交评论