《回归分析的基本思想及其初步应用》第一课_第1页
《回归分析的基本思想及其初步应用》第一课_第2页
《回归分析的基本思想及其初步应用》第一课_第3页
《回归分析的基本思想及其初步应用》第一课_第4页
《回归分析的基本思想及其初步应用》第一课_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、问题问题1 1:正方形的面积:正方形的面积y y与正方形的边长与正方形的边长x x之间的之间的函数关系函数关系是是y = xy = x2 2确定性关系确定性关系问题问题2 2:某水田水稻产量:某水田水稻产量y y与施肥量与施肥量x x之间是否有一个确定性之间是否有一个确定性的关系?的关系?例如:在例如:在 7 7 块并排、形状大小相同的试验田上进行施肥量块并排、形状大小相同的试验田上进行施肥量对水稻产量影响的试验,得到如下所示的一组数据:对水稻产量影响的试验,得到如下所示的一组数据:施化肥量施化肥量x 15 20 25 30 35 40 45水稻产量水稻产量y 330 345 365 405

2、445 450 455复习复习 变量之间的两种关系变量之间的两种关系10 20 30 40 50500450400350300施化肥量施化肥量x 15 20 25 30 35 40 45水稻产量水稻产量y 330 345 365 405 445 450 455xy施化肥量施化肥量水稻产量水稻产量 自变量取值一定时,因变量的取值带有一定随自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做机性的两个变量之间的关系叫做相关关系相关关系。定义:定义: 1):相关关系是一种不确定性关系;):相关关系是一种不确定性关系;注注对具有相关关系的两个变量进行统计对具有相关关系的两个变量进行统计

3、分析的方法叫分析的方法叫回归分析回归分析。2):): 现实生活中存在着大量的相关关系。现实生活中存在着大量的相关关系。 如:人的身高与年龄;如:人的身高与年龄; 产品的成本与生产数量;产品的成本与生产数量; 商品的销售额与广告费;商品的销售额与广告费; 家庭的支出与收入。等等家庭的支出与收入。等等探索:水稻产量探索:水稻产量y与施肥量与施肥量x之间大致有何规律?之间大致有何规律?10 20 30 40 50500450400350300发现:图中各点,大致分布在某条直线附近。发现:图中各点,大致分布在某条直线附近。探索探索2 2:在这些点附近可画直线不止一条,哪条直线最能代表:在这些点附近可画

4、直线不止一条,哪条直线最能代表x x与与y y之间的关系呢?之间的关系呢?施化肥量施化肥量x 15 20 25 30 35 40 45水稻产量水稻产量y 330 345 365 405 445 450 455xy散点图散点图施化肥量施化肥量水稻产量水稻产量10 20 30 40 50500450400350300 xy施化肥量施化肥量水稻产量水稻产量yx探究探究对于一组具有线性相关关系的数据对于一组具有线性相关关系的数据1122( ,),(,),.,(,),nnx yxyxy我们知道其回归方程的截距和斜率的最小二乘估计公式分别为:我们知道其回归方程的截距和斜率的最小二乘估计公式分别为:1122

5、211()(),.(2)()nniiiiiinniiiixxyyxnxybxxxnxy,.(1)aybx1111,.nniiiixx yynn其中( , )x y称为样本点的中心。称为样本点的中心。你能推导出这个公式吗?你能推导出这个公式吗?1122( ,),(,),.,(,)nnx yxyxy假设我们已经得到两个具有相关关系的变量的一组数据假设我们已经得到两个具有相关关系的变量的一组数据 且回归方程是:且回归方程是:y=bx+a,其中,其中,a,b是待定参数。当变量是待定参数。当变量x取取 时时 它与实际收集到的它与实际收集到的 之间的偏差是之间的偏差是(1,2,., )ix in()iii

6、iyyybxaiyoxy11( ,)x y22(,)xy( ,)iix yiiyy21( ,)()()niiiQyxyxyx 221()2() () () niiiiiyxyxyxyxyxyx2211()2() ()() ,nniiiiiiyxyxyxyxyxn yx11() ()()()nniiiiiiyxyxyxyxyxyx注意到,11()()nniiiiyxyxn yx()()0,yxnyn xn yx221( ,)()()niiiQyxyxn yx 因此,2222111()2()()()()nnniiiiiiixxxxyyyyn yx2222211221111()()()()()()(

7、)()()nniiiinniiiinniiiiiixxyyxxyyn yxxxyyxxxx易知,截距易知,截距 和斜率和斜率 分别是使分别是使取最小值时取最小值时 的值。由于的值。由于( ,)()iiiiQyyyx b, a121()()()niiiniixxyyxxyx这正是我们所要推导的公式。这正是我们所要推导的公式。在上式中,后两项和在上式中,后两项和 无关,而前两项为非负无关,而前两项为非负数,因此要使数,因此要使Q取得最小值,当且仅当前两项的值取得最小值,当且仅当前两项的值均为均为0,即有,即有, 1、所求直线方程叫做、所求直线方程叫做回归直线方程回归直线方程; 相应的直线叫做相应的

8、直线叫做回归直线回归直线。2、对两个变量进行的线性分析叫做、对两个变量进行的线性分析叫做线性回归分析线性回归分析。1122211()(),()nniiiiiinniiiixx yyxnxybxxxnxay bxy 回归直线方程回归直线方程nn(x- x )(y- y )xy-n x yiiiii= 1i= 1b =,nn222(x- x )x-n xiii= 1i= 1 a = y -b x .nn11x =x,y =y.iinni= 1i= 1其其 中中最小二乘法:最小二乘法:ybxa( , )x y称为样本点的中心称为样本点的中心。求回归直线方程的步骤:求回归直线方程的步骤:1111(1)

9、,nniiiixxyynn求211(2),.nniiiiixx y求(3)代入公式)代入公式1122211()(),(),.(1)nniiiiiinniiiixx yyxnxybxxxnxa y bxy (4)写出直线方程为)写出直线方程为y=bx+a,即为所求的回归直线方程。即为所求的回归直线方程。例例1 1、观察两相关量得如下数据、观察两相关量得如下数据: :101010221110,0,110,3 01 0.3 ,1iiiiiiixyyyxx求两变量间的回归方程求两变量间的回归方程. .解:列表:解:列表:1011022110110100111010010iiiiixybyxxx000a

10、ybxb.yx所求回归直线方程为所求回归直线方程为例例2:已知:已知10只狗的血球体积及血球的测量值如下:只狗的血球体积及血球的测量值如下:x(血球体积血球体积,mm), y(血球数,百万血球数,百万)(1)画出上表的散点图;)画出上表的散点图;(2)求出回归直线并且画出图形;)求出回归直线并且画出图形;(3)回归直线必经过的一点是哪一点?)回归直线必经过的一点是哪一点?利用回归直线方程对总体进行线性相关性的检验利用回归直线方程对总体进行线性相关性的检验 例例3 3、炼钢是一个氧化降碳的过程,钢水含碳量的多少直接、炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握影响冶

11、炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系。钢水含碳量和冶炼时间的关系。如果已测得炉料熔化完毕时,钢水的含碳量如果已测得炉料熔化完毕时,钢水的含碳量x与冶炼时间与冶炼时间y(从炉(从炉料熔化完毕到出刚的时间)的一列数据,如下表所示:料熔化完毕到出刚的时间)的一列数据,如下表所示:(1 1)y y与与x x是否具有线性相关关系;是否具有线性相关关系;(2 2)如果具有线性相关关系,求回归直线方程;)如果具有线性相关关系,求回归直线方程;(3 3)预测当钢水含碳量为)预测当钢水含碳量为160160个个0.01%0.01%时,应冶炼多少分钟?时,应冶炼多少分钟?(1)(1)列出下表列出下表,

12、,并计算并计算10101022111159.8,172,265448,312350,287640iiiiiiixyyyxx1011010222211100.9906.(10)(10)iiiiiiix yx yrxxyy于是,10110221101.26710iiiiixybyxxx30.51.aybx 所以回归直线的方程为所以回归直线的方程为 =1.267x-30.51 y(3)(3)当当x=160 x=160时时, 1.267.160-30.51=172, 1.267.160-30.51=172 y (2)(2)设所求的回归方程为设所求的回归方程为ybxa 例例4 4 从某大学中随机选出从某

13、大学中随机选出8 8名女大学生,其身高名女大学生,其身高和体重数据如下表:和体重数据如下表: 求根据一名女大学生的身高预报她的体重的回归求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为方程,并预报一名身高为172172的女大学生的体重。的女大学生的体重。172.85849. 0 xy分析:由于问题中要分析:由于问题中要求根据身高预报体重,求根据身高预报体重,因此选取身高为自变因此选取身高为自变量,体重为因变量量,体重为因变量学学身身高高1 17 72 2c cm m女女大大生生体体重重y y = = 0 0. .8 84 49 91 17 72 2- -8 85 5. .7 7

14、1 12 2 = = 6 60 0. .3 31 16 6( (k kg g) )2.2.回归方程:回归方程:1. 1. 散点图;散点图;n(x -x)(y -y)iii=1r=nn22(x -x)(y -y)iii=1i=1相关系数相关系数正相关;负相关通常,正相关;负相关通常,r0.75r0.75,认为两个变量有很强的相关性认为两个变量有很强的相关性本例中本例中, ,由上面公式由上面公式r=0.7980.75r=0.7980.75探究?探究? 身高为身高为172172的女大学生的体重一定是的女大学生的体重一定是60.316kg60.316kg吗?如果不是吗?如果不是, ,其原因是什么其原因是什么? ?如何描述两个变量之间线性相关关系的强弱?如何描述两个变量之间线性相

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论