版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
问题:在一次对人体脂肪含量与年龄关系的研究中,
研究人员获得了一组样本数据:年龄2327394145495053545657586061脂肪9.517.821.225.927.526.328.229.630.231.430.833.535.234.6散点图回归直线1BG问题:在一次对人体脂肪含量与年龄关系的研究中,年龄23273回归直线概念:散点图中心的分布从整体上看大致是一条直线附近,该直线称为回归直线求出回归直线的方程我们就可以比较清楚地了解年龄与体内脂肪含量之间的相关性由此可以预测相应年龄段的脂肪含量那我们又该如何具体求这个回归方程呢?2BG回归直线概念:散点图中心的分布从整体上看大致是一条直线附近,方法汇总?1.画一条直线2.测量出各点与它的距离3.移动直线,到达某一位置使距离的和最小,测量出此时直线的斜率与截距,得到回归方程。1.选取两点作直线ps:使直线两侧的点的个数基本相同。1.在散点图中多取几组点,确定出几条直线的方程2.分别求出各条直线的斜率、截距的平均数3.将这两个平均数当成回归方程的斜率与截距。法一法四法二法三?3BG方法汇总?1.画一条直线1.选取两点作直线1.在散点图中多取
上面三种方法都有一定的道理,但总让人感到可靠性不强.
回归直线与散点图中各点的位置用数学的方法来刻画应具有怎样的关系?4BG上面三种方法都有一定的道理,但总让人感到可靠性不强.方法汇总1.画一条直线2.测量出各点与它的距离3.移动直线,到达某一位置使距离的和最小,测量出此时直线的斜率与截距,得到回归方程。1.选取两点作直线ps:使直线两侧的点的个数基本相同。1.在散点图中多取几组点,确定出几条直线的方程2.分别求出各条直线的斜率、截距的平均数3.将这两个平均数当成回归方程的斜率与截距。最小二乘法法一法四法二法三5BG方法汇总1.画一条直线1.选取两点作直线1.在散点图中多取几求回归方程的关键
——如何使用数学方法来刻画“从整体上看,各点到此直线的距离最小”。假设两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),......(xn,yn)下面讨论如何表达这些点与一条直线y=bx+a之间的距离。6BG求回归方程的关键
——如何使用数学方法来刻画“从整体上看,各最小二乘法的公式的探索过程如下:1.设已经得到具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(xn,yn)2.设所求的回归直线方程为Y=bx+a,其中a,b是待定的系数。当变量x取x1,x2,…,xn时,可以得到
Yi=bxi+a(i=1,2,…,n)3.它与实际收集得到的yi之间偏差是
yi-Yi=yi-(bxi+a)(i=1,2,…,n)(x1,y1)(x2,y2)(xi,yi)yi-Yiy
x这样,用这n个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的。7BG最小二乘法的公式的探索过程如下:1.设已经得到具有线性相关关
因此用表示各点到直线y=bx+a的“整体距离”
(x1,y1)(x2,y2)(xi,yi)yi-(bxi+a)8BG
因此用(x1,y1)(x2,y2)(xi,yi)(xn,yn)
由于绝对值使得计算不方便,在实际应用中人们更喜欢用9BG(x1,y1)(x2,y2)(xi,yi)(xn,yn)(x1,y1)(x2,y2)(xi,yi)(xn,yn)这样,问题就归结为:当a,b取什么值时Q最小?即点到直线的“整体距离”最小.10BG(x1,y1)(x2,y2)(xi,yi)(xn,yn)这样这样通过求此式的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.根据有关数学原理推导,a,b的值由下列公式给出11BG这样通过求此式的最小值而得到回归直线的方法,即使得样本数据的Σ(yi-Yi)的最小值ni=1Σ|yi-Yi|的最小值ni=1Σ(yi-Yi)2的最小值ni=1Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2当a,b取什么值时,Q的值最小,即总体偏差最小12BGΣ(yi-Yi)的最小值ni=1Σ|yi-Yi|的最小值ni求线性回归方程的步骤:(1)求平均数;(2)计算与yi的乘积,再求;(3)计算;(4)将上述有关结果代入公式,写出回归
直线方程.xi13BG求线性回归方程的步骤:(1)求平均数年龄2327394145495053545657586061脂肪9.517.821.225.927.526.328.229.630.231.430.833.535.234.6根据最小二乘法公式,利用计算机可以求出其回归直线方程散点图回归直线14BG年龄2327394145495053545657586061思考:将表中的年龄作为x代入回归方程,看看得出的数值与真实数值之间的关系,从中你体会到了什么?
x=27时,y=15.099%x=37时,y=20.901%可利用回归方程预测不同年龄段的体内脂肪含量的百分比。存在样本点不在直线上年龄2327394145495053545657586061脂肪9.517.821.225.927.526.328.229.630.231.430.833.535.234.615BG思考:将表中的年龄作为x代入回归方程,看看得出的数值与真实数(2012山东临沂二模,20,12)假设关于某设备的使用年限x和所有支出的维修费用y(万元),有如下表的统计资料:使用年限x23456维修费用y2.23.85.56.57.0若由资料可知y对x呈线性相关关系,试求:(1)线性回归直线方程(2)估计使用年限为10年时,维修费用是多少?y=1.23x+0.08;y=12.3816BG(2012山东临沂二模,20,12)假设关于某设备的使用年限
回归直线方程特点存在样本点不在直线上的样本点只能表示线性相关关系回归直线方程的特点过定点(样本中心)17BG回归直线存在样本点只能表示线回归直线方程的特点过定点17B练习解析:∵销售量y(件)与销售价格x(元/件)负相关.∴x的系数为负.又∵y不能为负值,∴常数项必须是正值.故选A.答案:A18BG练习解析:∵销售量y(件)与销售价格x(元/件)负相关.1820y=2x19BG20y=2x19BG问题:在一次对人体脂肪含量与年龄关系的研究中,
研究人员获得了一组样本数据:年龄2327394145495053545657586061脂肪9.517.821.225.927.526.328.229.630.231.430.833.535.234.6散点图回归直线20BG问题:在一次对人体脂肪含量与年龄关系的研究中,年龄23273回归直线概念:散点图中心的分布从整体上看大致是一条直线附近,该直线称为回归直线求出回归直线的方程我们就可以比较清楚地了解年龄与体内脂肪含量之间的相关性由此可以预测相应年龄段的脂肪含量那我们又该如何具体求这个回归方程呢?21BG回归直线概念:散点图中心的分布从整体上看大致是一条直线附近,方法汇总?1.画一条直线2.测量出各点与它的距离3.移动直线,到达某一位置使距离的和最小,测量出此时直线的斜率与截距,得到回归方程。1.选取两点作直线ps:使直线两侧的点的个数基本相同。1.在散点图中多取几组点,确定出几条直线的方程2.分别求出各条直线的斜率、截距的平均数3.将这两个平均数当成回归方程的斜率与截距。法一法四法二法三?22BG方法汇总?1.画一条直线1.选取两点作直线1.在散点图中多取
上面三种方法都有一定的道理,但总让人感到可靠性不强.
回归直线与散点图中各点的位置用数学的方法来刻画应具有怎样的关系?23BG上面三种方法都有一定的道理,但总让人感到可靠性不强.方法汇总1.画一条直线2.测量出各点与它的距离3.移动直线,到达某一位置使距离的和最小,测量出此时直线的斜率与截距,得到回归方程。1.选取两点作直线ps:使直线两侧的点的个数基本相同。1.在散点图中多取几组点,确定出几条直线的方程2.分别求出各条直线的斜率、截距的平均数3.将这两个平均数当成回归方程的斜率与截距。最小二乘法法一法四法二法三24BG方法汇总1.画一条直线1.选取两点作直线1.在散点图中多取几求回归方程的关键
——如何使用数学方法来刻画“从整体上看,各点到此直线的距离最小”。假设两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),......(xn,yn)下面讨论如何表达这些点与一条直线y=bx+a之间的距离。25BG求回归方程的关键
——如何使用数学方法来刻画“从整体上看,各最小二乘法的公式的探索过程如下:1.设已经得到具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(xn,yn)2.设所求的回归直线方程为Y=bx+a,其中a,b是待定的系数。当变量x取x1,x2,…,xn时,可以得到
Yi=bxi+a(i=1,2,…,n)3.它与实际收集得到的yi之间偏差是
yi-Yi=yi-(bxi+a)(i=1,2,…,n)(x1,y1)(x2,y2)(xi,yi)yi-Yiy
x这样,用这n个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的。26BG最小二乘法的公式的探索过程如下:1.设已经得到具有线性相关关
因此用表示各点到直线y=bx+a的“整体距离”
(x1,y1)(x2,y2)(xi,yi)yi-(bxi+a)27BG
因此用(x1,y1)(x2,y2)(xi,yi)(xn,yn)
由于绝对值使得计算不方便,在实际应用中人们更喜欢用28BG(x1,y1)(x2,y2)(xi,yi)(xn,yn)(x1,y1)(x2,y2)(xi,yi)(xn,yn)这样,问题就归结为:当a,b取什么值时Q最小?即点到直线的“整体距离”最小.29BG(x1,y1)(x2,y2)(xi,yi)(xn,yn)这样这样通过求此式的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.根据有关数学原理推导,a,b的值由下列公式给出30BG这样通过求此式的最小值而得到回归直线的方法,即使得样本数据的Σ(yi-Yi)的最小值ni=1Σ|yi-Yi|的最小值ni=1Σ(yi-Yi)2的最小值ni=1Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2当a,b取什么值时,Q的值最小,即总体偏差最小31BGΣ(yi-Yi)的最小值ni=1Σ|yi-Yi|的最小值ni求线性回归方程的步骤:(1)求平均数;(2)计算与yi的乘积,再求;(3)计算;(4)将上述有关结果代入公式,写出回归
直线方程.xi32BG求线性回归方程的步骤:(1)求平均数年龄2327394145495053545657586061脂肪9.517.821.225.927.526.328.229.630.231.430.833.535.234.6根据最小二乘法公式,利用计算机可以求出其回归直线方程散点图回归直线33BG年龄2327394145495053545657586061思考:将表中的年龄作为x代入回归方程,看看得出的数值与真实数值之间的关系,从中你体会到了什么?
x=27时,y=1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论