版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、3.1回归分析的基本思想及初步应用(1)第1页,共26页。问题1:正方形的面积y与正方形的边长x之间 的函数关系是y = x2确定性关系问题2:某水田水稻产量y与施肥量x之间是否 -有一个确定性的关系?例如:在 7 块并排、形状大小相同的试验田上 进行施肥量对水稻产量影响的试验,得到如下所示的一组数据:施化肥量x 15 20 25 30 35 40 45水稻产量y 330 345 365 405 445 450 455复习、变量之间的两种关系第2页,共26页。自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系。1、定义: 1):相关关系是一种不确定性关系;注对具有相关
2、关系的两个变量进行统计分析的方法叫回归分析。2):第3页,共26页。2、现实生活中存在着大量的相关关系。 如:人的身高与年龄; 产品的成本与生产数量; 商品的销售额与广告费; 家庭的支出与收入。等等探索:水稻产量y与施肥量x之间大致有何规律?第4页,共26页。10 20 30 40 50500450400350300发现:图中各点,大致分布在某条直线附近。探索2:在这些点附近可画直线不止一条, 哪条直线最能代表x与y之间的关系呢?xy施化肥量水稻产量施化肥量x 15 20 25 30 35 40 45水稻产量y 330 345 365 405 445 450 455散点图第5页,共26页。10
3、 20 30 40 50500450400350300 xy施化肥量水稻产量第6页,共26页。最小二乘法:称为样本点的中心。第7页,共26页。3、对两个变量进行的线性分析叫做线性回归分析。2、回归直线方程:2.相应的直线叫做回归直线。1、所求直线方程 叫做回归直 -线方程;其中第8页,共26页。相关系数 1.计算公式2相关系数的性质(1)|r|1(2)|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小问题:达到怎样程度,x、y线性相关呢?它们的相关程度怎样呢?第9页,共26页。负相关正相关第10页,共26页。相关系数正相关;负相关通常, r-1,-0.75-负相关很强; r0.75
4、,1正相关很强; r-0.75,-0.3-负相关一般; r0.3, 0.75正相关一般; r-0.25, 0.25-相关性较弱; 第11页,共26页。10 20 30 40 50500450400350300 xy施化肥量水稻产量施化肥量x 15 20 25 30 35 40 45水稻产量y 330 345 365 405 445 450 455解: 1.画出散点图2.求出3.写出回归方程4.计算相关系数第12页,共26页。例题1 从某大学中随机选出8名女大学生,其身高和体重数据如下表:编号12345678身高165165157170175165155170体重4857505464614359
5、求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172的女大学生的体重。第13页,共26页。分析:由于问题中要求根据身高预报体重,因此选取身高为自变量,体重为因变量3.通过探究栏目引入“线性回归模型”。此处可以引导学生们体会函数模型与回归模型之间的差别。第14页,共26页。函数模型与回归模型之间的差别函数模型:回归模型: 线性回归模型y=bx+a+e增加了随机误差项e,因变量y的值由自变量x和随机误差项e共同确定,即自变量x只能解析部分y的变化。 在统计中,我们也把自变量x称为解析变量,因变量y称为预报变量。第15页,共26页。探究P4:身高为172cm的女大学生的体重一定是6
6、0.316kg吗?如果不是,你能解析一下原因吗?答:身高为172cm的女大学生的体重不一定是60.316kg, 但一般可以认为她的体重在60.316kg左右。函数模型与回归模型之间的差别函数模型:回归模型:第16页,共26页。如何描述两个变量之间线性相关关系的强弱? 在数学3中,我们学习了用相关系数r来衡量两个变量之间线性相关关系的方法。相关系数r第17页,共26页。相关关系的测度(相关系数取值及其意义)-1.0+1.00-0.5+0.5完全负相关无线性相关完全正相关负相关程度增加r正相关程度增加第18页,共26页。线性回归模型 +其中和为模型的未知参数,e是y与 之间的误差,通常称为随机误差
7、。第19页,共26页。 例1假设某设备的使用年限x(年)和所支出的维修费用y(万元)有如下的统计资料:x23456y2.23.85.56.57.0试求:(1)y与x之间的回归方程;(2)当使用年限为10年时,估计维修费用是多少?第20页,共26页。 思路点拨先作出散点图,再根据散点图分析支出的维修费用与使用年限是否线性相关,若相关,再利用线性回归方程求解,最后根据求得的方程估计10年时的维修费用第21页,共26页。第22页,共26页。第23页,共26页。思考P3产生随机误差项e的原因是什么?随机误差e的来源(可以推广到一般):1、其它因素的影响:影响身高 y 的因素不只是体重 x,可能 还包括遗传基因、饮食习惯、生长环境等因素;2、用线性回归模型近似真实模型所引起的误差;3、身高 y 的观测误差。第24页,共26页。(1)根据散点图来粗略判断它们是否线性相关。(2)是否可以用线性回归模型来拟合数据(3)通过残差 来判断模型拟合的效 果这种分析工作称为残差分析第25页,共26页
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学一年级作文未来的房子(10篇)
- 小学一年级课外阅读小故事(二十篇)
- 小学数学六年级下册3 1《圆柱》同步练习
- Tenuifolin-Standard-生命科学试剂-MCE
- Suksdorfin-生命科学试剂-MCE
- 天津市2024年高考地理压轴卷含解析
- 2025届高考英语3500词汇基础+提升练09含解析
- 2025版高中数学一轮复习课时作业梯级练三十八等差数列及其前n项和课时作业理含解析新人教A版
- 2023届新高考新教材化学人教版一轮学案-第十章第3讲 热点综合实验探究
- 玉溪师范学院《城市规划原理》2022-2023学年第一学期期末试卷
- 《创意改善生活》课件 2024-2025学年湘美版(2024)初中美术七年级上册
- 《风电场项目经济评价规范》(NB-T 31085-2016)
- 管道定额价目表
- 工期日历天计算器
- 相敏检波电路
- 私募股权投资基金基本知识(共45页).ppt
- IEC国内技术对口单位
- 第一章特殊教育概述-特殊教育概论(共4页)
- 浅谈公务用车费用审计
- 炼油厂化重整装置生产原理及工艺
- (完整版)装修主要材料一览表
评论
0/150
提交评论