




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
学必求其心得,业必贵于专精学必求其心得,业必贵于专精学必求其心得,业必贵于专精§8最小二乘估计整体设计教学分析教材通过思考交流引入了最小二乘法,进一步提出了线性回归方程.教科书在探索用多种方法确定线性回归直线的过程中,向学生展示创造性思维的过程,帮助学生理解最小二乘法的思想。通过气温与饮料销售量的例子及随后的思考,使同学们了解利用线性回归方程解决实际问题的全过程,体会线性回归方程作出的预测结果的随机性,并且可能犯的错误。进一步,教师可以利用计算机模拟和多媒体技术,直观形象地展示预测结果的随机性和规律性.三维目标经历用不同估算方法描述两个变量线性相关的过程。了解最小二乘法的思想,能根据给出的线性回归方程的系数公式建立线性回归方程。重点难点教学重点:求线性回归方程,以及线性回归分析.教学难点:确定线性回归系数.课时安排1课时教学过程导入新课思路1。客观事物是相互联系的,过去研究的大多数是因果关系,但实际上更多存在的是一种非因果关系。比如说:某某同学的数学成绩与物理成绩,彼此是互相联系的,但不能认为数学是“因”,物理是“果”,或者反过来说。事实上,数学和物理成绩都是“果”,而真正的“因"是学生的理科学习能力和努力程度.所以说,函数关系存在着一种确定性关系,但还存在着另一种非确定性关系——相关关系.为表示这种相关关系,我们接着学习两个变量的线性相关——回归直线及其方程.思路2。某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对照表:气温/℃261813104—1杯数202434385064如果某天的气温是-5℃推进新课新知探究提出问题(1)画散点图的步骤是什么?(2)正、负相关的概念?(3)什么是线性相关?(4)观察下面人体的脂肪百分比和年龄的散点图,当人的年龄增加时,体内脂肪含量到底是以什么方式增加的呢?图1(5)什么叫作回归直线?(6)如何求回归直线的方程?什么是最小二乘法?(7)利用计算机如何求线性回归方程?活动:学生回顾,再思考或讨论,教师及时提示指导.讨论结果:(1)建立相应的平面直角坐标系,将各数据在平面直角坐标中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫作散点图。(2)如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.(3)如果所有的样本点都落在某一直线附近,变量之间就有线性相关的关系。(4)大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加,呈正相关的趋势,我们可以从散点图上来进一步分析。(5)从散点图上可以看出,这些点大致分布在通过散点图中心的一条直线附近。如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直线。如果能够求出这条回归直线的方程(简称回归方程),那么我们就可以比较清楚地了解年龄与体内脂肪含量的相关性。就像平均数可以作为一个变量的数据的代表一样,这条直线可以作为两个变量具有线性相关关系的代表。(6)从散点图上可以发现,人体的脂肪百分比和年龄的散点图,大致分布在通过散点图中心的一条直线.那么,我们应当如何具体求出这个回归方程呢?有的同学可能会想,我可以采用测量的方法,先画出一条直线,测量出各点与它的距离,然后移动直线,到达一个使距离的和最小的位置,测量出此时的斜率和截距,就可得到回归方程了.但是,这样做可靠吗?有的同学可能还会想,在图中选择这样的两点画直线,使得直线两侧的点的个数基本相同.同样地,这样做能保证各点与此直线在整体上是最接近的吗?还有的同学会想,在散点图中多取几组点,确定出几条直线的方程,再分别求出各条直线的斜率、截距的平均数,将这两个平均数当成回归方程的斜率和截距。同学们不妨去实践一下,看看这些方法是不是真的可行?(学生讨论:1.选择能反映直线变化的两个点.2。在图中放上一根细绳,使得上面和下面点的个数相同或基本相同.3。多取几组点对,确定几条直线方程.再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距。)教师:分别分析各方法的可靠性。如图2、3、4:图2图3图4上面这些方法虽然有一定的道理,但总让人感到可靠性不强。实际上,求回归方程的关键是如何用数学的方法来刻画“从整体上看,各点与此直线的距离最小”.人们经过长期的实践与研究,已经得出了计算回归方程的斜率与截距的一般公式①这样得到的直线方程y=a+bx称为线性回归方程,a,b是线性回归方程的系数.推导以上公式的计算比较复杂,这里不作推导。但是,我们可以解释一下得出它的原理。假设我们已经得到两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn),且所求回归方程是y=a+bx,其中a、b是待定参数.当变量x取xi(i=1,2,…,n)时可以得到y=a+bxi(i=1,2,…,n),它与实际收集到的yi之间的偏差是yi-y=yi—(a+bxi)(i=1,2,…,n)。图5这样,用这n个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的。由于(yi-y)可正可负,为了避免相互抵消,可以考虑用来代替,但由于它含有绝对值,运算不太方便,所以改用Q=(y1-bx1-a)2+(y2—bx2—a)2+…+(yn—bxn—a)2②来刻画n个点与回归直线在整体上的偏差.这样,问题就归结为:当a,b取什么值时Q最小,即总体偏差最小。经过数学上求最小值的运算,a,b的值由公式①给出.通过求②式的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫作最小二乘法(methodofleastsquare)。(7)见课本本节信息技术应用中利用计算机求线性回归方程的具体操作步骤。应用示例思路1例1在上一节练习中,从散点图可以看出,某小卖部6天卖出热茶的杯数(y)与当天气温(x)之间是线性相关的.数据如下表:气温(xi)/℃261813104—1杯数202434385064(1)试用最小二乘法求出线性回归方程.(2)如果某天的气温是—3℃解:(1)从散点图中可以看出,表中的两个变量是线性相关的。图6先列表求出,其他数据如下表.ixiyixi2xiyi126206765202182432443231334169442410381003805450162006—1641—64合计7023012861910进而,可以求得b=≈-1。648,a≈57。557.于是,线性回归方程为y=57.557-1.648x。(2)由上面的最小二乘估计得出的线性回归方程知,当某天的气温是—3℃变式训练下表为某地近几年机动车辆数与交通事故数的统计资料.机动车辆数x/千台95110112120129135150180交通事故数y/千件6.27.57.78.58.79。810.213(1)请判断机动车辆数与交通事故数之间是否有线性相关关系,如果不具有线性相关关系,请说明理由;(2)如果具有线性相关关系,求出线性回归方程。解:(1)在直角坐标系中画出数据的散点图,如图7。图7直观判断散点在一条直线附近,故具有线性相关关系.(2)计算得b≈0。0774,a=—1.0241,所以,所求线性回归方程为y=-1。0241+0.0774x。思路2例1给出施化肥量对水稻产量影响的试验数据:施化肥量x15202530354045水稻产量y330345365405445450455(1)画出上表的散点图;(2)求出回归直线的方程。解:(1)散点图如图8。图8(2)计算得b≈4。75,a≈257。从而得回归直线方程是y=257+4.75x。变式训练1.一个车间为了规定工时定额,需要确定加工零件所花费的时间.为此进行了10次试验,测得数据如下:零件个数x(个)102030405060708090100加工时间y(分)626875818995102108115122请判断y与x是否具有线性相关关系,如果y与x具有线性相关关系,求线性回归方程.解:在直角坐标系中画出数据的散点图,如图9.图9直观判断散点在一条直线附近,故具有线性相关关系.由测得的数据表可知:b≈0。668,a=—b≈54。96。因此,所求线性回归方程为y=bx+a=54。96+0.668x.2.已知10只狗的血球体积及红血球数的测量值如下:血球体积x(mL)45424648423558403950红血球数y(百万)6。536。309.527.506.995。909。496.206.558。72(1)画出上表的散点图;(2)求出回归直线的方程。解:(1)散点图如图10。图10(2)(45+42+46+48+42+35+58+40+39+50)=44。50,(6.53+6.30+9。52+7.50+6.99+5.90+9。49+6。20+6。55+8。72)=7。37.设回归直线方程为y=a+bx,则b=0。175,a==—0。418,所以所求回归直线的方程为y=-0。418+0.175x。点评:对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数a,b的计算公式,算出a,b.由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误,求线性回归方程的步骤:计算平均数;计算xi与yi的积,求∑xiyi;计算∑xi2;将结果代入公式求b;用a=求a;写出回归直线方程。知能训练1.下列两个变量之间的关系哪个不是函数关系()A.角度和它的余弦值B.正方形边长和面积C.正n边形的边数和它的内角和D.人的年龄和身高答案:D2.三点(3,10),(7,20),(11,24)的线性回归方程是()A.y=5.75—1。75xB.y=1。75+5.75xC.y=1。75—5.75xD.y=5.75+1.75x答案:D3。已知关于某设备的使用年限x与所支出的维修费用y(万元),有如下统计资料:使用年限x23456维修费用y2。23。85。56.57。0设y对x呈线性相关关系.试求:(1)线性回归方程y=bx+a的回归系数a,b;(2)估计使用年限为10年时,维修费用是多少?答案:(1)b=1。23,a=0。08;(2)12。38.4。我们考虑两个表示变量x与y之间的关系的模型,δ为误差项,模型如下:模型1:y=6+4x;模型2:y=6+4x+e.(1)如果x=3,e=1,分别求两个模型中y的值;(2)分别说明以上两个模型是确定性模型还是随机模型.解:(1)模型1:y=6+4x=6+4×3=18;模型2:y=6+4x+e=6+4×3+1=19。(2)模型1中相同的x值一定得到相同的y值,所以是确定性模型;模型2中相同的x值,因δ的不同,所得y值不一定相同,且δ为误差项是随机的,所以模型2是随机性模型.5。以下是收集到的新房屋销售价格y与房屋大小x的数据:房屋大小x(m2)80105110115135销售价格y(万元)18.42221.624.829。2(1)画出数据的散点图;(2)用最小二乘法估计求线性回归方程;(3)计算此时Q(a,b)和Q(2,0.2)的值,并作比较。解:(1)散点图如图11。图11(2)计算得b≈0.1962,a≈1.8166,所以,线性回归方程为y=1.8166+0.1962x。(3)Q(1.8166,0。1962)≈5。171,Q(2,0。2)≈7.0,由此可知,求得的a=1。8166,b=0.9162是函数Q(a,b)取最小值的a,b值.拓展提升某调查者从调查中获知某公司近年来科研费用支出(Xi)与公司所获得利润(Yi)的统计资料如下表:科研费用支出(Xi)与利润(Yi)统计表单位:万元年份科研费用支出利润1998199920002001200220035114532314030342520合计30180要求估计利润(Yi)对科研费用支出(Xi)的线性回归模型。解:设线性回归模型直线方程为Yi=β0+β1Xi,因为=30,求解参数β0、β1的估计值:β1=2,β0=20.所以利润(Yi)对科研费用支出(Xi)的线性回归模型直线方程为Yi=20+2Xi.课堂小结1.求线性回
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年03月四川自贡市沿滩区社会治安综合治理中心公开招聘聘用制人员4人笔试历年典型考题(历年真题考点)解题思路附带答案详解
- 高温气冷堆及配套产品项目风险分析和评估报告
- 浙江省嘉兴市2025届高三下学期4月教学测试政治+答案
- 民办四川天一学院《酒店信息化管理》2023-2024学年第二学期期末试卷
- LCR测量仪项目风险分析和评估报告
- 华东交通大学《剧本创作》2023-2024学年第二学期期末试卷
- 漳州理工职业学院《中医养生与食疗》2023-2024学年第二学期期末试卷
- 广东海洋大学《形体训练(Ⅱ)》2023-2024学年第一学期期末试卷
- 湖南都市职业学院《专业方向综合课程设计》2023-2024学年第二学期期末试卷
- 江西水利职业学院《中国古代小说导读》2023-2024学年第二学期期末试卷
- 发证机关所在地区代码表
- 奥托尼克斯计米器使用说明书
- 风生水起博主的投资周记
- 供水管网施工组织设计
- 最全的冷轧知识材质牌号分类及生产工艺
- 易制毒、易制爆化学品安全培训
- 气化风机检修工艺规程
- 美女金喜善写真集
- 大学物理平面电磁波ppt课件
- 八年级下写字课
- 前列腺癌临床路径(最全版)
评论
0/150
提交评论