




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
§3.1回归分析的思想及其初步应用(1)高中数学选修2-3·精品课件第三章统计案例
复习回顾
求回归直线方程的步骤
某大学中随机选取8名女大学生,其身高和体重数据如下表所示.编号12345678身高/cm165165157170175165155170体重/kg4857505464614359求根据女大学生的身高预报体重的回归方程,并预报一名身高为172cm的女大学生的体重.案例分析解:①选取身高为自变量x,体重为因变量y,②作散点图:
因此,对于身高172cm的女大学生,由线性回归方程可以预报其体重为:如何描述它们之间线性相关关系的强弱?
相关系数
相关系数的性质:(1)|r|≤1.
(2)|r|越接近于1,相关程度越强;|r|越接近于0,相关程度越弱.问题:达到怎样程度,x、y线性相关呢?它们的相关程度怎样呢?(相关系数取值及其意义)-1.0+1.00-0.5+0.5完全负相关无线性相关完全正相关负相关程度增加r正相关程度增加相关关系的测度
r=0.798>0.75表明体重与身高有很强的线性相关性,从而说明我们建立的回归模型是有意义的.案例1中
r=0.798>0.75表明体重与身高有很强的线性相关性,从而说明我们建立的回归模型是有意义的.案例1中身高为172cm的女大学生的体重一定是60.316kg吗?如果不是,你能解析一下原因吗?答:身高为172cm的女大学生的体重不一定是60.316kg,但一般可以认为她的体重在60.316kg左右.从散点图看到,样本点散布在某一条直线的附近,而不是在一条直线上,所以不能用一次函数y=bx+a描述它们关系.
我们可以线性回归模型来表示:y=bx+a+e,其中a和b为模型的未知参数,e称为随机误差.案例分析思考:产生随机误差项e的原因是什么?随机误差e的来源(可以推广到一般):1、忽略了其它因素的影响:影响身高y的因素不只是体重x,可能还包括遗传基因、饮食习惯、生长环境等因素;2、用线性回归模型近似真实模型所引起的误差;3、身高y
的观测误差.
以上三项误差越小,说明我们的回归模型的拟合效果越好.思考:产生随机误差项e的原因是什么?随机误差e的来源(可以推广到一般):1、忽略了其它因素的影响:影响身高y的因素不只是体重x,可能还包括遗传基因、饮食习惯、生长环境等因素;2、用线性回归模型近似真实模型所引起的误差;3、身高y
的观测误差.
以上三项误差越小,说明我们的回归模型的拟合效果越好.函数模型与回归模型之间的差别
可以提供选择模型的准则我们把自变量x称为解释变量,因变量y称为预报变量.
函数模型与回归模型之间的差别我们把自变量x称为解释变量,因变量y称为预报变量.
函数模型与回归模型之间的差别线性回归模型y=bx+a+e与一次函数模型不同之处在于多了一个随机误差e,y的值有它们一起决定.解释变量x预报变量y随机误差e函数模型与回归模型之间的差别如何估计a,b,e?
则她们身高-体重的散点图应该在一条水平直线上:事实上,并非如此,它们和54.5之间存在差别,这时我们就引入随机误差,利用随机误差和解释变量共同来预报变量y.54.5kg把所有的这种效应利用总体偏差平方和合并成一个数.怎样去刻画每个效应呢?
把所有的这种效应利用总体偏差平方和合并成一个数.怎样去刻画每个效应呢?
为了回归的准确和计算的方便我们引入残差平方和它代表随机误差的效应求出了随机误差的效应后,就比较容易得到解释变量的效应了.同学们知道怎样求吗?解释变量的效应=总体偏差平方和-残差平方和回归平方和相关指数R2:残差平方和总体偏差平方和显然,当R2的值越大,说明残差所占的比例越小,回归效果约好;反之,回归效果越差.一般的,当R2越接近于1,说明解释变量和预报变量之间的相关性越强,如果同一个问题,采用不同的回归方法分析,我们可以通过选择R2大的来作为回归模型.
一般方法:1.利用散点图观察两个变量是否线性相关2.利用残差来判断模型拟合的效果(残差分析)利用残差图来分析数据,对可疑数据(残差较大的数据)进行重新调查,有错误就更正,然后重新利用回归模型拟合,如果没有错误,则需要找其他原因.残差图:编号12345678身高/cm165165157170175165155170体重/kg4857505464614359残差-6.3732.6272.419-4.6181.1376.627-2.8830.382问题数据越窄越好例1.以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:房屋面积/m211511080135105销售价格/万元24.821.618.429.222(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线;(3)据(2)的结果估计当房屋面积为150m2时的销售价格.例题解析解:(1)数据对应的散点图如下图所示:
例2.已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:求y对x的回归直线方程,并说明回归模型拟合效果的好坏.x1416182022y1210753例题解析
所以回归模型的拟合效果很好.回归分析基本思想及其初步应用基本思想实际应用回归分析相关性方法分析回归优劣分析总偏差平方和残差平方和回归平方和课堂小结
(相关系数取值及其意义)-1.0+1.00-0.5+0.5完全负相关无线性相关完全正相关负相关程度增加r正相关程度增加相关关系的测度因此,对于身高172cm的女大学生,由线性回归方程可以预报其体重为:如何描述它们之间线性相关关系的强弱?
复习回顾解:①选取身高为自变量x,体重为因变量y,②作散点图:
(相关系数取值及其意义)-1.0+1.00-0.5+0.5完全负相关无线性相关完全正相关负相关程度增加r正相关程度增加相关关系的测度因此,对于身高172cm的女大学生,由线性回归方程可以预报其体重为:如何描述它们之间线性相关关系的强弱?
某大学中随机选取8名女大学生,其身高和体重数据如下表所示.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 云计算与企业虚拟化技术考核试卷
- 体育赛事衍生品市场跨界合作案例解析考核试卷
- 厨房安全地垫考核试卷
- 厨具行业供应链创新案例研究考核试卷
- 传统化学纤维生产技术的保护与传承考核试卷
- 基因组变异检测技术
- 计划生育责任书(16篇)
- 中学防范暴力事件的应急预案
- 二十四节气小雪国旗下讲话稿范文(5篇)
- 消防主题班会教学课件
- 国际法-001-国开机考复习资料
- 2024年河北省唐山市高考语文一模试卷
- 公务员考试经验分享培训课件
- 风动凿岩机操作规程(4篇)
- (高级)数据安全管理员职业技能鉴定考试题库-实操题
- 自助餐的服务流程培训
- 联塑管材检验报告模板
- 部编版五年级上册课内、课外阅读训练(教师+学生)+根据课文内容填空
- 浙江省杭州市(2024年-2025年小学四年级语文)部编版质量测试((上下)学期)试卷及答案
- 【建筑专业】16J914-1公用建筑卫生间(完整)
- DL∕T 1098-2016 间隔捧技术条件和试验方法
评论
0/150
提交评论