7两个变量的线性相关_第1页
7两个变量的线性相关_第2页
7两个变量的线性相关_第3页
7两个变量的线性相关_第4页
7两个变量的线性相关_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、河北武邑中学教师课时教案备课人授课时间课题232两个变量的线性相关课标要求。通过收集现实问题中两个有关联变量的数据认识变量间的相关关系教 学 目 标知识目标.认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系.技能目标经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给岀的线性回归方程的系数公式建立线性回归方程.情感态度价值观使学生认识到在现实世界中存在变量关系,重点通过收集现实问题中两个有天联变量的数据直观认识变量间的相天天系;利用散点图直观认识 两个变量之间的线性关系;根据给岀的线性回归方程的系数公式建立线性回

2、归方程难点变量之间相关关系的理解;作散点图和理解两个变量的止相关和负相关;理解最小二乘法的思 想.教 学 过 程 及 方 法问题与情境及教师活动学生活动提出问题(1) 作散点图的步骤和方法?(2 )正、负相关的概念?(3)什么是线性相关?(4 )看人体的脂肪百分比和年龄的散点图,当人的年龄增加时,体内脂肪含量到底是以什么方式增加的呢?(5) 什么叫做回归直线?(6) 如何求回归直线的方程?什么是最小二乘法?它有什么样的 思想?(7) 利用计算机如何求回归直线的方程?(8) 利用计算器如何求回归直线的方程?活动:学生回顾,再思考或讨论,教师及时提示指导讨论结果:(1)建立相应的平面直角坐标系 ,

3、将各数据在平面直角 坐标中的对应点画出来 ,得到表示两个变量的一组数据的图形,这样的图形叫做散点图( a如果所有的样本点都落在某一函数曲线 上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.b如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系.C.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系)(2) 如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.(3) 如果所有的样本点都落在某一直线附近,变量之间就有线性相 关的关系.(4) 大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加 ,呈

4、正相关的趋势,我们可以从散点图上来进一步分析.1第1页河北武邑中学教师课时教案学生活动问题与情境及教师活动第6页学 过 程 及 方 法从散点图上可以看出,这些点大致分布在通过散点图中心的一条直线附 近如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线(regressionlin e).如果能够求出这条回归直线的方程(简称回归方程),那么我们就可以比较清楚地了解年龄与体内脂肪含量的相关性.就像平均数可以作为一个变量的数据的代表一样,这条直线可以作为两个变量具有线性相关 关系的代表.(6)从散点图上可以发现,人体的脂肪百分比和年龄的散点图

5、,大致分布 在通过散点图中心的一条直线那么,我们应当如何具体求出这个回归方程呢?有的同学可能会想,我可以采用测量的方法,先画出一条直线,测量出 各点与它的距离,然后移动直线,到达一个使距离的和最小的位置 ,测量出 此时的斜率和截距,就可得到回归方程了 .但是,这样做可靠吗?有的同学可能还会想,在图中选择这样的两点画直线,使得直线两侧 的点的个数基本相同.同样地,这样做能保证各点与此直线在整体上是最 接近的吗?还有的同学会想,在散点图中多取几组点,确定出几条直线的方程,再 分别求出各条直线的斜率、截距的平均数,将这两个平均数当成回归方程的斜率和截距.同学们不妨去实践一下,看看这些方法是不是真的可

6、行?(学生讨论:1.选择能反映直线变化的两个点.2.在图中放上一根细绳,使得上面和下面点的个数相同或基本相同.3.多取几组点对,确定几条直线方程.再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距.)教师:分别分析各方法的可靠性.如下图:课本87-88上面这些方法虽然有一定的道理,但总让人感到可靠性不强.实际上,求回归方程的关键是如何用数学的方法来刻画从整体上看,各点与此直线的距离最小 ”人们经过长期的实践与研究 ,已经得出了 计算回归方程的斜率与截距的一般公式:问题与情境及教师活动n迟(Xi -x)(yi -y)i 4bn送(Xi X)2i4n、Xi yi - nxyi丄

7、n2_2 Xj - nxi 4(1)a = y _ bX.其中,b是回归方程的斜率,a是截距.推导公式的计算比较复杂,这里不作推导但是,我们可以解释一下得出它的原理.假设我们已经得到两个具有线性相关关系的变量的一组数据学生活动教 学 过 程 及 方 法(xi,yi),(X2,y2),(Xyn),A且所求回归方程是y =bx+a,其中a、b是待定参数.当变量x取Xi(i=1,2,,时可以得到y =bxi+a(i=1,2,n),A它与实际收集到的yi之间的偏差是yj-y =yi-(bxi+a)(i=1,2,n).他Ji)0:这样,用这n个偏差的和来刻画各点与此直线的整体偏差”是比较合适anA的由于

8、(yi- y )可正可负,为了避免相互抵消,可以考虑用x | y yi |来代替,但由于它含有绝对值,运算不太方便,所以改用2 2 2Q=(yi-bxi-a) +(y 2-bx2-a) + +(yn-bx n-a)来刻画n个点与回归直线在整体上的偏差.这样,问题就归结为:当a,b取什么值时Q最小,即总体偏差最小.经过 数学上求最小值的运算,a,b的值由公式给出.通过求式的最小值而得出回归直线的方法,即求回归直线,使得样 本数据的点到它的距离的平方和最小,这一方法叫做最小二乘法(method of least square)(8)利用计算器求回归直线的方程课本89教 学 过 程 及 方 法问题与

9、情境及教师活动学生活动例1有一个冋学家开了一个小卖部,他为了研究气温对热饮销售的影 响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:摄氏温度/C-504712151923热饮杯数15615013212813011610489(1) 画出散点图;(2) 从散点图中发现气温与热饮销售杯数之间关系的一般规律;(3) 求回归方程;(4) 如果某天的气温是 2 C,预测这天卖出的热饮杯数.解:课本911线性回归方程中的截距和斜率都是通过样本估计出来的,存在随机误 差,这种误差可以导致预测结果的偏差2即使截距和斜率的估计没有误差,也不可能百分之百地保证对应于x的预报值,能够与实际值y很接近我们不能保证点(x,y)落在回归直线上,甚至不能百分之百地保证它落在回归直线的附近,事实上,AAy=bx+a+e= y+e.这里e是随机变量,预报值 y与实际值y的接近程度由 随机变量e的标准差所决定.一些学生可能会提出问题:既然不一定能够卖出143杯左右热饮,那么为什么我们还以 这天大约可以卖出143杯热饮”作为结论呢?这是 因为这个结论出现的可能性最大.具体地说,假如我们规定可以选择连续的3个非负

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论