回归分析的基本思想及应用_第1页
回归分析的基本思想及应用_第2页
回归分析的基本思想及应用_第3页
回归分析的基本思想及应用_第4页
回归分析的基本思想及应用_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

精品资料精品资料●课程目标1.双基目标(1)通过典型(diǎnxíng)案例的探究,进一步了解回归分析的基本思想、方法及其初步应用.(2)通过典型(diǎnxíng)案例的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及其初步应用.2.情感目标本章提供了数据处理的方法,通过对数据的收集、整理和分析,使学生认识统计方法的直观特点、增强学生的社会实践能力,培养学生分析问题、解决问题的能力,养成科学严谨的良好品质.精品资料●重点难点本章重点:回归分析、残差分析、相关指数的意义以及独立性检验中K2的有关计算.本章难点:借助于回归分析的思想选择恰当的模型拟合变量间的相关关系(尤其是非线性的),由于该部分内容的数据相对较复杂,故在高考(ɡāokǎo)中出现大题的可能性不是很大,应以选择、填空题为主,旨在考察对回归方程的求解及预测,K2的计算等.精品资料●学法探究本章内容是统计案例中常见方法中的两种:回归分析和独立性的检验.通过对典型案例的学习,理解问题和方法的实质,进一步体会统计方法在解决实际问题中的基本(jīběn)思想.在学习过程中多与社会实践相结合,亲自动手实践,加深对知识的认识,巩固知识,不断创新,多寻找规律,形成方法.精品资料1.1回归分析的基本(jīběn)思想及其初步应用精品资料精品资料1.知识与技能通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.2.过程与方法通过求线性回归方程,探究(tànjiū)相关性检验的基本思想.通过对典型案例的探究(tànjiū),体会回归分析在生产实际和日常生活中的广泛应用.精品资料精品资料本节重点:了解(liǎojiě)线性回归模型与函数模型的差异,了解(liǎojiě)判断刻画模型拟合效果的方法——相关指数和残差分析.本节难点:解释残差变量的含义,了解(liǎojiě)偏差平方和分解的思想.精品资料精品资料1.通过复习线性回归方程,探究相关性检验的基本(jīběn)思想.2.培养类比、迁移、化归的能力.精品资料精品资料一、相关关系的概念当一个变量取值一定(yīdìng)时,另一个变量的取值带有一定(yīdìng)随机性的两个变量之间的关系叫做相关关系.二、回归分析的相关概念1.回归分析是处理两个变量之间 的一种统计方法.若两个变量之间具有线性相关关系,则称相应的回归分析为 .相关(xiāngguān)关系线性回归分析精品资料精品资料3.线性相关关系强与弱的判断:用 来描述线性相关关系的强弱.当r>0时,表明两个变量 ;当r<0时,表明两个变量 .r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值接近于0时,表明两个变量之间 线性相关关系.通常当|r|大于 时,认为两个变量有很强的线性相关关系.4.随机误差的概念:当样本点散布在某一条(yītiáo)直线的附近,而不是在一条(yītiáo)直线上时,不能用一次函数y=bx+a来描述两个变量之间的关系,而是用线性回归模型

来表示,其中 为模型的未知参数, 称为随机误差.相关系数r正相关(xiāngguān)负相关几乎不存在0.75y=bx+a+ea和be精品资料精品资料R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越 .在线性回归(huíguī)模型中,R2表示解释变量对预报变量变化的 .R2越接近于1,表示回归(huíguī)的效果越好(因为R2越接近于1,表示解释变量和预报变量的线性相关性越强).好贡献率精品资料精品资料(2)利用图形来分析残差特性,作图时纵坐标为

,横坐标可以选为 ,这样作出的图形称为残差图.如果图中有某个样本点的残差比较大,需要确认在采集这个样本点的过程中是否有人为的错误.如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他的原因.另外,残差点比较均匀地落在水平的带状区域中,说明选用(xuǎnyòng)的模型比较合适.这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.残差样本(yàngběn)编号精品资料回归分析问题有线性回归问题和非线性回归问题,对于非线性回归问题,往往利用转换变量的方法(fāngfǎ)进行转化,转变为线性回归问题.精品资料精品资料[例1]有下列说法:①线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;④因为由任何一组观测值都可以求得一个(yīɡè)线性回归方程,所以没有必要进行相关性检验.其中正确命题的个数是 ()精品资料A.1 B.2C.3 D.4[分析]由题目可获取以下信息:①线性回归分析;②散点图;③相关性检验等的相关概念及意义.解答本题(běntí)可先逐一核对相关概念及其性质,然后再逐一作出判断,最后得出结论.精品资料[答案]C[解析]①反映的正是最小二乘法思想,故正确.②反映的是画散点图的作用,也正确.③解释的是回归方程=x+的作用,故也正确.④是不正确的,在求回归方程之前必须进行(jìnxíng)相关性检验,以体现两变量的关系.[点评]线性回归分析的过程:(1)随机抽取样本,确定数据,形成样本点(2)由样本点形成散点图,判定是否具有线性相关关系;(3)由最小二乘法确定线性回归方程;(4)由回归方程观察变量的取值及变化趋势.精品资料下列有关线性回归的说法,不正确的是 ()A.变量取值一定(yīdìng)时,因变量的取值带有一定(yīdìng)随机性的两个变量之间的关系叫做相关关系B.在平面直角坐标系中用描点的方法得到表示具有相关关系的两个量的一组数据的图形叫做散点图C.线性回归方程最能代表具有线性相关关系的x,y之间的关系D.任何一组观测值都能得到具有代表意义的线性回归方程精品资料[答案]D[解析]只有对两个变量具有(jùyǒu)线性相关性作出判断时,利用最小乘法求出线性方程才有意义.精品资料[例2]某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应(duìyìng)数据:(1)画出散点图;(2)求y关于x的回归直线方程.精品资料[解析(jiěxī)](1)散点图如图所示.精品资料(2)列出下表,并用科学计算器进行有关(yǒuguān)计算.精品资料[点评]求回归直线方程,关键在于正确地求出,,由于,的计算量较大,计算时要仔细谨慎、分层进行(jìnxíng),避免计算失误.精品资料精品资料精品资料精品资料[例3]一个车间为了规定工时定额(dìngé),需要确定加工零件所花费的时间,为此进行了10次试验,测得数据如下:把零件数x作为解释变量,加工时间y作为预报变量.(1)计算总偏差平方和、残差平方和及相关指数;(2)作出残差图;(3)进行残差分析.精品资料[解析(jiěxī)](1)由x,y的数据得散点图如图.精品资料由散点图可以认为样本点大致分布在某条直线的附近,因此可以用线性回归模型(móxíng)来拟合.设线性回归方程为=+x,列出下表:续表精品资料精品资料将数据代入相应(xiāngyīng)公式可得如下数据表:精品资料续表精品资料(2)作出残差图如图,横坐标为零件(línɡjiàn)数的数据,纵坐标为残差.精品资料(3)由题中数据可得样本相关系数r的值为0.9998,再结合散点图可以说明x与y有很强的线性相关关系.由R2的值可以看出回归效果很好,也说明用线性回归模型拟合数据效果很好.由残差图也可以观察到,第4个样本点和第5个样本点的残差比较大,需要确认在采集在这两个样本点的过程中是否有人为的错误.[点评]本题涉及公式多且复杂,计算量也很大,需首先了解(liǎojiě)公式,明白原理.精品资料(2)在利用残差图对数据进行残差分析时,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.这样的带状区域宽度越窄,说明模型拟合精度(jīnɡdù)越高,回归方程的预报精度(jīnɡdù)越高.精品资料某运动员训练次数与运动成绩之间的数据关系(guānxì)如下:(1)作出散点图;(2)求出线性回归方程;(3)作出残差图;(4)计算R2;(5)试预测该运动员训练47次及55次的成绩.精品资料[解析](1)作出该运动员训练次数(x)与成绩(chéngjì)(y)之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系.精品资料精品资料(3)残差分析作残差图如图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用(xuǎnyòng)的模型比较合适.精品资料(4)计算相关指数R2计算相关指数R2=0.9855.说明了该运动员的成绩的差异(chāyì)有98.55%是由训练次数引起的.精品资料精品资料[例4]炼钢厂出钢时所用的盛钢水的钢包,在使用过程中,由于钢液厂炉渣对包衬耐火材料的侵蚀(qīnshí),使其容积不断增大,请根据表格中的数据找出使用次数x与增大的容积y之间的关系.精品资料续表[解析]先根据试验(shìyàn)数据作散点图,如图所示.精品资料精品资料精品资料精品资料[点评]作出散点图,由散点图选择合适(héshì)的回归方程类型是解决本题的关键,在这里线性回归模型起了转化的作用.对于非线性回归问题,并没有给出经验公式,这时我们可以画出已知数据的散点图,把它与必修模块《数学1》中学过的各种函数(幂函数、指数函数、对数函数等)的图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量代换,把问题转化为线性回归问题,使其得到解决.精品资料精品资料[例5]在一次抽样调查中测得样本的5个样本点数值如下表:试建立(jiànlì)y与x之间的回归直线方程.精品资料精品资料[辨析]此题解法是错误的,原因是这两个变量之间不是线性相关关系.此类问题的解决,应先对两个变量间的相关关系进行相关性检验,然后(ránhòu)结合作出的散点图,选择适宜的回归方程.精品资料精品资料由置换(zhìhuàn)后的数值表作散点如图所示:精品资料由散点图可以看出y与t呈近似的线性相关关系(guānxì).列表如下:精品资料精品资料精品资料一、选择题1.下列说法中错误的是 ()A.如果变量x与y之间存在着线性相关关系,则我们根据实验数据得到(dédào)的点(xi,yi)(i=1,2,…,n)将散布在某一条直线的附近B.如果两个变量x与y之间不存在线性关系,那么根据它们的一组数据(xi,yi)(i=1,2,…,n)不能写出一个线性方程精品资料[答案]B[解析]两变量x与y之间不存在(cúnzài)线性关系,根据它们的一组数据(xi,yi)(i=1,2,3,…n)可通过已有的函数知识进行变换,利用线性回归模型来建立y与x之间的非线性回归方程精品资料A.y平均增加(zēngjiā)2.5个单位B.y平均增加(zēngjiā)2个单位C.y平均减少2.5个单位D.y平均减少2个单位[答案]C精品资料精品资料[答案(dáàn)]C精品资料4.下列两个变量之间的关系不是函数(hánshù)关系的是()A.角度和余弦值B.正n边形的边数和一个内角的度数C.棱锥的体积和底面积D.某种物质和溶解度和温度[答案]D精品资料精品资料6.某种产品(chǎnpǐn)的广告费支出x与销售额y(单位:万元)之间有下表关系:已知y与x之间是线性相关关系,若实际销售额不低于82.5万元,则广告费支出最少是__________万元.[答案]10[解析]由本节例2可知y关于x

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论