变量间的相关关系_第1页
变量间的相关关系_第2页
变量间的相关关系_第3页
变量间的相关关系_第4页
变量间的相关关系_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2.3变量间的相关关系第二课时2.3.2两个变量的线性相关(下)问题提出1.两个变量之间的相关关系的含义如何?成正相关和负相关的两个相关变量的散点图分别有什么特点?自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系.正相关的散点图中的点散布在从左下角到右上角的区域,负相关的散点图中的点散布在从左上角到右下角的区域如果两个变量成正相关或负相关,从整体上看这两个变量的变化趋势如何?其散点图有什么特点?

一个变量随另一个变量的变大而变大(小),散点图中的点散布在从右(左)上角到左(右)下角的区域.正相关:两变量变化趋势相同,点在斜率大于零的直线附近;负相关:两变量变化趋势相反,点在斜率小于零的直线附近;2.观察人体的脂肪含量百分比和年龄的样本数据的散点图,这两个相关变量成正相关.我们需要进一步考虑的问题是,当人的年龄增加时,体内脂肪含量到底是以什么方式增加呢?对此,我们从理论上作些研究.回归直线及其方程知识探究(一):回归直线思考1:一组样本数据的平均数是样本数据的中心,那么散点图中样本点的中心如何确定?它一定是散点图中的点吗?

思考2:在各种各样的散点图中,有些散点图中的点是杂乱分布的,有些散点图中的点的分布有一定的规律性,年龄和人体脂肪含量的样本数据的散点图中的点的分布有什么特点?

这些点大致分布在一条直线附近.能否求出直线方程?这条直线叫什么?思考3:如果散点图中的点的分布,从整体上看大致在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线.对具有线性相关关系的两个变量,其回归直线一定通过样本点的中心吗?回归直线一定通过样本点的中心点什么是回归?

由英国一个统计学家首提。1889年,他在研究祖先与后代身高之间的关系时发现:身材较高的父母,孩子的平均身高也较高,但这些孩子的平均身高并没有他们父母的平均身高高;身材较矮的父母,孩子的平均身高也较矮,但这些孩子的平均身高却比他们父母的平均身高高;这种后代的身高向中间值靠近的趋势称为“回归现象”人们把由一个变量的变化去推测另一个变量的变化的方法称为回归方法!思考4:对一组具有线性相关关系的样本数据,你认为其回归直线是一条还是几条?回归直线只有一条思考5:怎样画出回归直线?知识探究(二):回归方程

在直角坐标系中,任何一条直线都有相应的方程,回归直线的方程称为回归方程.对一组具有线性相关关系的样本数据,如果能够求出它的回归方程,那么我们就可以比较具体、清楚地了解两个相关变量的内在联系,并根据回归方程对总体进行估计.

线性回归思想:把相关关系(不确定关系)转化为函数关系(确定关系)思考1:回归直线与散点图中各点的位置应具有怎样的关系?

整体上最接近

思考2:对于求回归直线方程,你有哪些想法?

方法一:采用测量的方法,先画出一条直线,测量各点与它的距离,然后移动直线,到达一个使距离之和最小的位置,测量出此时直线的斜率和截距,求出回归方程.方法二:在图中选择这样的两点画直线,使得直线两侧的点的个数基本相同.方法三:在散点图中多取几组点,确定出几条直线的方程,再分别求出各条直线的斜率和截距的平均数,将这个平均数作为回归方程的斜率和截距.都有道理,但不易操作,且可靠性不强求回归直线方程的关键是如何用数学的方法来刻画“从整体上看,各点与此直线的距离最小”思考3:对一组具有线性相关关系的样本数据:(x1,y1),(x2,y2),…,(xn,yn),设其回归方程为可以用哪些数量关系来刻画各样本点与回归直线的接近程度?

xy可以用

或刻画偏差

不易计算思考4:为了从整体上反映n个样本数据与回归直线的接近程度,你认为选用哪个数量关系来刻画比较合适?

xy则总偏差Q为思考5:根据有关数学原理分析,当时,总体偏差为最小这种求回归方程的方法叫做最小二乘法这样就得到了回归方程:其中为回归方程的斜率,为截距求线性回归方程的步骤线性回归方程其中(1)计算平均数(2)计算(3)计算(4)计算斜率(5)计算截距补充例题:下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应生产能耗y(吨)的对照数据.用最小二乘法求出回归方程.x3456y2.5344.57.51220279162536则回归方程为:由此我们可以根据一个人个年龄预测其体内脂肪含量的百分比的回归值.若某人37岁,则其体内脂肪含量的百分比约为20.9%书P85探究问题利用计算器或计算机或直用公式可求得:年龄和人体脂肪含量的样本数据的回归方程为把x=37代入得,某人37岁,则其体内脂肪含量的百分比约为20.9%。我们预测他的体内脂肪含量在20.9%附近的可能性较大。不过,我们不能说他的体内脂肪含量一定是20.9%。事实上,这个20.9%是对年龄为37岁的人群中的大部分人的体内脂肪含量作出的估计。X=37入,370.209理论迁移

例有一个同学开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的饮料杯数与当天气温的对比表:

摄氏温度(℃)

-504712热饮杯数

15615013212813015192327313611610489937654书P90例题摄氏温度(℃)-504712热饮杯数15615013212813015192327313611610489937654(1)画出散点图;(2)从散点图中发现气温与热饮杯数之间关系的一般规律;(3)求回归方程;(4)如果某天的气温是2℃,预测这天卖出的热饮杯数.(1)散点图如图(2)从图看出:各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数成负相关(4)当x=2时,y=143.063.(3)用公式求出:则回归直线方程为:即气温为2℃时,大约可以卖出143杯热饮.书P91思考存在随机误差,导致预测结果出现偏差,所以应为“大约可以卖出143杯热饮”书P92练习1

当x=0时,=147.767这个值与实际卖出的杯数150不符,原因是:线性回归方程中的斜率和截距都是样本估计的,存在随机误差,导致预测结果出现偏差(1-2内容)。学生练习:书P94习题A

2(1)画出如下散点图:(2)求出回归方程并画出;(3)成正相关关系。即食品所含热量越高,口味越好。(4)因为当回归直线上方食品与下方食品所含热量相同时,其回味更好.学生练习:书P94习题A

3(电子表格)(1)画出如下散点图:(2)求出回归方程并画出;(3)加工零件的个数与所花时间呈正线性相关关系.学生练习:书P94习题A

3(用公式计算)x102030405060708090100y626875818995102

1081151226201360225032404450570071408640103501220010040090016002500360049006400810010000则回归直线方程为学生练习:书P94习题A

4职工平均工资(元)居民消费水平(元)(1)画出如下散点图:(2)回归方程为:(3)从图看出:城镇居民的消费水平和工资收入之间呈正线性相关关系,即工资收入水平越高,城镇居民的消费水平越高学生练习:书P95习题B

1(1)画出如下散点图:(2)回归方程为:如果这座城市居民的年收入达到40亿元,估计这种商品销售额为42.037万元年收入(亿元)商品销售额(万元)小结求线性回归方程的步骤(1)计算平均数(2)计算(3)计算(5)计算截距(4)计算斜率得线性回归方程线性回归方程一定过中心点2.回归方程被样本数据惟一确定,各样本点大致分布在回归直线附近.对同一个总体,不同的样本数据对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论