版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
3.1回归分析的基本(jīběn)思想及其初步应用高二数学(shùxué)选修2-3第一页,共25页。问题1:正方形的面积y与正方形的边长x之间的函数(hánshù)关系是y=x2确定性关系问题2:某水田(shuǐtián)水稻产量y与施肥量x之间是否有一个确定性的关系?例如:在7块并排、形状大小相同的试验田上进行施肥量对水稻产量影响(yǐngxiǎng)的试验,得到如下所示的一组数据:施化肥量x15202530354045水稻产量y330345365405445450455复习变量之间的两种关系第二页,共25页。1020304050500450400350300·······施化肥量x15202530354045水稻产量y330345365405445450455xy施化肥(huàféi)量水稻(shuǐdào)产量第三页,共25页。自变量取值一定(yīdìng)时,因变量的取值带有一定(yīdìng)随机性的两个变量之间的关系叫做相关关系。1、定义(dìngyì):1):相关关系(guānxì)是一种不确定性关系(guānxì);注对具有相关关系的两个变量进行统计分析的方法叫回归分析。2):第四页,共25页。现实生活中存在着大量的相关(xiāngguān)关系。如:人的身高与年龄;产品的成本与生产数量;商品的销售额与广告费;家庭的支出与收入。等等探索:水稻产量y与施肥量x之间大致(dàzhì)有何规律?第五页,共25页。1020304050500450400350300·······发现:图中各点,大致分布(fēnbù)在某条直线附近。探索2:在这些点附近可画直线不止一条(yītiáo),哪条直线最能代表x与y之间的关系呢?施化肥量x15202530354045水稻产量y330345365405445450455xy散点图施化肥(huàféi)量水稻产量第六页,共25页。探究(tànjiū)对于一组具有(jùyǒu)线性相关关系的数据我们知道其回归方程的截距和斜率的最小二乘估计公式(gōngshì)分别为:称为样本点的中心。第七页,共25页。1、所求直线(zhíxiàn)方程叫做回归直线(zhíxiàn)方程;相应的直线(zhíxiàn)叫做回归直线(zhíxiàn)。2、对两个变量(biànliàng)进行的线性分析叫做线性回归分析。1、回归(huíguī)直线方程第八页,共25页。2、求回归直线(zhíxiàn)方程的步骤:(3)代入公式(4)写出直线方程为y=bx+a,即为所求的回归直线方程。^第九页,共25页。例1、观察两相关(xiāngguān)量得如下数据:x-1-2-3-4-553421y-9-7-5-3-115379求两变量(biànliàng)间的回归方程.解:列表(lièbiǎo):i12345678910xi-1-2-3-4-553421yi-9-7-5-3-115379xiyi9141512551512149第十页,共25页。所求回归直线(zhíxiàn)方程为第十一页,共25页。假设随机误差对体重没有影响,也就是说,体重仅受身高的影响,那么散点图中所有的点将完全落在回归直线上。但是,在图中,数据点并没有完全落在回归直线上。这些(zhèxiē)点散布在回归直线附近。那么,数据点和它在回归直线上相应位置的差异
是随机误差的效应,称为残差。第十二页,共25页。表3-2列出了女大学生身高(shēnɡāo)和体重的原始数据以及相应的残差数据。编号12345678身高/cm165165157170175165155170体重/kg4857505464614359残差-6.3732.6272.419-4.6181.1376.627-2.8830.382(一)我们(wǒmen)可以利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图。3、残差分析(fēnxī):第十三页,共25页。残差图的制作及作用1、坐标纵轴为残差变量,横轴可以有不同的选择;2、若模型选择的正确,残差图中的点应该(yīnggāi)分布在以横轴为心的带形区域;3、对于远离横轴的点,要特别注意。身高与体重残差图异常点错误数据模型问题第十四页,共25页。表3-2列出了女大学生身高(shēnɡāo)和体重的原始数据以及相应的残差数据。编号12345678身高/cm165165157170175165155170体重/kg4857505464614359残差-6.3732.6272.419-4.6181.1376.627-2.8830.382(一)我们可以利用(lìyòng)图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图。3、残差分析(fēnxī):(二)第十五页,共25页。例2在一段时间内,某中商品(shāngpǐn)的价格x元和需求量Y件之间的一组数据为:求出Y对的回归直线(zhíxiàn)方程,并说明拟合效果的好坏。价格x1416182022需求量Y1210753列出残差表为0.994因而(yīnér),拟合效果较好。00.3-0.4-0.10.24.62.6-0.4-2.4-4.4第十六页,共25页。例3关于x与y有如下数据:
有如下的两个线性模型:(1);(2)试比较哪一个(yīɡè)拟合效果更好。x24568y3040605070第十七页,共25页。7、一般地,建立(jiànlì)回归模型的基本步骤为:(1)确定研究对象,明确哪个变量是解析变量,哪个变量是预报变量。(2)画出确定好的解析变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等)。(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程y=bx+a).(4)按一定规则估计回归方程中的参数(如最小二乘法)。(5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性,等等),过存在异常,则检查数据是否有误,或模型是否合适等。第十八页,共25页。什么是回归(huíguī)分析?
(内容)从一组样本数据出发,确定变量之间的数学关系式对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著利用所求的关系式,根据一个或几个变量的取值来预测(yùcè)或控制另一个特定变量的取值,并给出这种预测(yùcè)或控制的精确程度第十九页,共25页。回归分析(fēnxī)与相关分析(fēnxī)的区别相关分析中,变量x变量y处于平等的地位;回归分析中,变量y称为因变量,处在被解释的地位,x称为自变量,用于预测因变量的变化相关分析中所涉及的变量x和y都是随机变量;回归分析中,因变量y是随机变量,自变量x可以是随机变量,也可以是非(shìfēi)随机的确定变量相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制第二十页,共25页。例3、炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系。如果已测得炉料(lúliào)熔化完毕时,钢水的含碳量x与冶炼时间y(从炉料(lúliào)熔化完毕到出刚的时间)的一列数据,如下表所示:x(0.01%)104180190177147134150191204121y(min)100200210185155135170205235125(1)y与x是否具有线性相关关系;(2)如果具有线性相关关系,求回归直线方程;(3)预测(yùcè)当钢水含碳量为160个0.01%时,应冶炼多少分钟?第二十一页,共25页。如何描述两个变量之间线性相关关系(guānxì)的强弱?在《数学(shùxué)3》中,我们学习了用相关系数r来衡量两个变量之间线性相关关系的方法。相关系数rr>0正相关;r<0负相关。通常,r>0.75或r<-0.75认为两个(liǎnɡɡè)变量有很强的相关性.第二十二页,共25页。相关关系(guānxì)的测度
(相关系(guānxì)数取值及其意义)-1.0+1.00-0.5+0.5完全负相关无线性相关完全正相关负相关程度增加r正相关程度增加第二十三页,共25页。(1)列出下表,并计算(jìsuàn)i12345678910xi104180190177147134150191204121y
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 教师开学前军训心得体会5篇
- 物流设施与设备第二章航空管道
- 债务偿付质押合同(2篇)
- 公共事业投资合作协议书(2篇)
- 河南省安阳市第六十二中学2022年高三语文下学期期末试卷含解析
- 2025年Γ-球蛋白三类项目合作计划书
- 上海写字楼租赁合同范本
- 幼儿园房屋租赁合同书范本
- 小吃街摊位租赁合同
- 长期租赁合同范本
- 2024-2034年全球及中国年糕行业市场发展分析及前景趋势与投资发展研究报告
- 烈士陵园的数字化转型与智能服务
- 生理学重点复习资料全
- 初中生理想信念教育班会(3篇模板)
- (高清版)JGT 225-2020 预应力混凝土用金属波纹管
- 2024年上海市奉贤区中考一模英语试题(含答案解析)
- 农产品加工与贮藏原理复习资料
- (正式版)JBT 5300-2024 工业用阀门材料 选用指南
- Unit1WhatsthematterSectionB2a-2e教学设计人教版八年级英语下册
- 工艺工程师的成长计划书
- 幼儿园大班音乐教案《爆米花》教学反思
评论
0/150
提交评论