![人教A版选择性必修第三册第八章82一元线性回归模型及其应用学案_第1页](http://file4.renrendoc.com/view/fd530f148fa87d7f17a04a55bc72794b/fd530f148fa87d7f17a04a55bc72794b1.gif)
![人教A版选择性必修第三册第八章82一元线性回归模型及其应用学案_第2页](http://file4.renrendoc.com/view/fd530f148fa87d7f17a04a55bc72794b/fd530f148fa87d7f17a04a55bc72794b2.gif)
![人教A版选择性必修第三册第八章82一元线性回归模型及其应用学案_第3页](http://file4.renrendoc.com/view/fd530f148fa87d7f17a04a55bc72794b/fd530f148fa87d7f17a04a55bc72794b3.gif)
![人教A版选择性必修第三册第八章82一元线性回归模型及其应用学案_第4页](http://file4.renrendoc.com/view/fd530f148fa87d7f17a04a55bc72794b/fd530f148fa87d7f17a04a55bc72794b4.gif)
![人教A版选择性必修第三册第八章82一元线性回归模型及其应用学案_第5页](http://file4.renrendoc.com/view/fd530f148fa87d7f17a04a55bc72794b/fd530f148fa87d7f17a04a55bc72794b5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
8.2一元线性回归模型及其应用必备学问·自主学习导思1.什么是一元线性回归模型?如何求阅历回归方程?2.如何进行回归分析?一元线性回归模型的完整表达式为eq\b\lc\{(\a\vs4\al\co1(Y=bx+a+e,E〔e〕=0,D〔e〕=σ2)),其中Y称为因变量或响应变量,x称为自变量或解释变量,a,b为模型的未知参数,a称为截距参数,b称为斜率参数,e是Y与bx+a之间的随机误差.具有相关关系的两个变量,其样本点散布在某一条直线y=bx+a的四周,可以用一次函数y=bx+a来描述两个变量之间的关系吗?提示:不能.2.阅历回归方程(1)最小二乘法我们将=x+称为Y关于x的阅历回归方程,也称阅历回归函数或阅历回归公式,其图形称为阅历回归直线.这种求阅历回归方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估量.(2)阅历回归方程的系数计算公式(3)阅历回归方程的性质①阅历回归方程肯定过点;②一次函数=x+的单调性由的符号打算,函数递增的充要条件是__>0__;③的实际意义:当x增大一个单位时,增大个单位.正相关、负相关与的符号有何关系?提示:Y与x正相关的充要条件是>0,Y与x负相关的充要条件是<0.3.残差(1)残差:对于响应变量Y,通过观测得到的数据称为观测值,通过阅历回归方程得到的称为猜测值,观测值减去猜测值称为残差.(2)打算系数:R2=1-越接近1,表示回归的效果越好.1.辨析记忆(对的打“√〞,错的打“×〞).(1)阅历回归方程肯定过样本中的某一个点.(×)提示:阅历回归方程肯定过点(eq\x\to(x),eq\x\to(y)),可能过样本中的某个或某些点,也可能不过样本中的任何一个点.(2)选取一组数据中的局部点得到的阅历回归方程与由整组数据得到的阅历回归方程是同一个方程.(×)提示:选取一组数据中的局部点得到的阅历回归方程与由整组数据得到的阅历回归方程不肯定是同一个方程.(3)在阅历回归模型中,R2越接近于1,表示解释变量和响应变量的线性相关性越强.(√)(4)在画两个变量的散点图时,响应变量在x轴上,解释变量在y轴上.(×)提示:在画两个变量的散点图时,解释变量在x轴上,响应变量在y轴上.2.假如记录了x,y的几组数据分别为(0,1),(1,3),(2,5),(3,7),那么y关于x的阅历回归直线必过点()A.(2,2)B.(1.5,2)C.(1,2)D.(1.5,4)【解析】eq\x\to(x)=eq\f(0+1+2+3,4)=1.5,eq\x\to(y)=eq\f(1+3+5+7,4)=4,所以阅历回归直线必过点(1.5,4).3.假设一个样本的总偏差平方和为80,残差平方和为60,那么R2为________.【解析】R2=1-eq\f(60,80)=0.25.答案:关键力量·合作学习类型一阅历回归方程及其应用(数学建模、数学运算)1.四名同学依据各自的样本数据讨论变量x,y之间的相关关系,并求得阅历回归方程,分别得到以下四个结论:①y与x负相关且x-6.423;②y与x负相关且x+5.648;③y与x正相关且x+8.493;④y与x正相关且x-4.578.其中肯定不正确的结论的序号是()A.①②B.②③C.③④D.①④【解析】>0,负相关时<0,故①④肯定不正确.2.某产品的广告费用x(单位:万元)与销售额y(单位:万元)的统计数据如下表:广告费用x4235销售额y49263954依据上表可得阅历回归方程=x+中的为9.4,据此模型猜测广告费用为6万元时销售额为()A.63.6万 【解析】选B.eq\x\to(x)=eq\f(4+2+3+5,4)=3.5,eq\x\to(y)=eq\f(49+26+39+54,4)=42.由于回归直线过点(eq\x\to(x),eq\x\to(y)),所以42=9.4×3.5+,解得=9.1,故回归方程为xx=6时=6×9.4+9.1=65.5.3.某商店统计了最近6个月商品的进价x与售价y(单位:元)的对应数据如下:x3528912y46391214那么阅历回归方程为________.【解析】eq\x\to(x)=eq\f(3+5+2+8+9+12,6)=6.5,eq\x\to(y)=eq\f(4+6+3+9+12+14,6)=8,eq\i\su(i=1,6,x)eq\o\al(\s\up1(2),\s\do1(i))=32+52+22+82+92+122=327,eq\i\su(i=1,6,x)iyi=3×4+5×6+2×3+8×9+9×12+12×14=396,=eq\f(\i\su(i=1,6,x)iyi-6\x\to(x)\x\to(y),\i\su(i=1,6,x)eq\o\al(\s\up1(2),\s\do1(i))-6\x\to(x)2)≈1.143,=eq\x\to(y)-eq\x\to(x)≈0.571.故阅历回归方程为x+0.571.答案:x1.求阅历回归方程的方法(1)公式法:求出b,a的最小二乘估量,.(2)待定系数法:利用阅历回归直线过(eq\x\to(x),eq\x\to(y))求,.2.阅历回归方程的应用(1)进行猜测:把阅历回归方程看作一次函数,求函数值.(2)推断正、负相关:打算正相关还是负相关的是参数.【加练·固】依据?中国统计年鉴?计算整理某城市最近十年蔬菜需求量的统计数据,截取局部统计数据如下表:年份20092011201320152017需求量(万吨)336346357376386(1)画出散点图;(2)依据(1)画出的散点图推断需求量与年份是否线性相关,假设相关,求出阅历回归方程,假设不相关,说明理由;(3)利用(2)中所求的阅历回归方程猜测该市2020年的蔬菜需求量.附:参考公式=eq\f(\i\su(i=1,n,)〔ti-\x\to(t)〕〔mi-\x\to(m)〕,\i\su(i=1,n,)〔ti-\x\to(t)〕2)=eq\x\to(m)-eq\x\to(t)【解析】(1)画出散点图如图.(2)由散点图可知,需求量与年份线性相关.将所给表格中的数据进行处理如下表:t(年份-2013)-4-2024m(需求量-357)-21-1101929由表可知eq\x\to(t)=eq\f(1,5)(-4-2+0+2+4)=0,eq\x\to(m)=eq\f(1,5)(-21-11+0+19+29)=3.2.所以=[(-4)×(-21)+(-2)×(-11)+2×19+4×29-5×0×3.2]÷(42+22+22+42-5×02)=6.5,所以=3.2-0×6.5=3.2,所以t+3.2,所以线性回归方程是-357=6.5(x-2013)+3.2,即x-12724.3.(3)当x=2020时,=6.5×2020-12724.3=405.7,即猜测该市2020年蔬菜需求量是405.7万吨.类型二线性回归分析(数据分析、数学运算)【典例】某运发动训练次数与训练成果之间的数据关系如表:次数(x)3033353739444650成果(Y)3034373942464851(1)作出散点图;(2)求出阅历回归方程;(3)作出残差图;(4)计算R2,并说明运发动的训练次数对成果的影响占百分之几.【解析】(1)作出该运发动训练次数x与成果Y的散点图,如下图.由散点图可知,它们之间具有相关关系.(2)eq\x\to(x)=39.25,eq\x\to(y)=40.875,eq\i\su(i=1,8,x)eq\o\al(\s\up1(2),\s\do1(i))=12656,eq\i\su(i=1,8,x)iyi=13180,所以≈1.0415,=eq\x\to(y)-eq\x\to(x)=-0.003875,所以阅历回归方程为=1.0415x-0.003875.(3)残差分析:下面的表格列出了运发动训练次数和成果的原始数据以及相应的残差数据.xY3030-1.24113334-0.365635370.551437390.468439421.385444460.177946480.09495051-1.0711作残差图如下图.由图可知,残差点比拟匀称地分布在水平带状区域内,说明选择的模型比拟适宜.(4)计算R2≈0.9855,说明白该运发动的训练次数对成果的影响占98.55%.“R2、残差图〞在回归分析中的作用(1)R2是用来刻画回归效果的,由R2=1-可知R2越大,意味着残差平方和越小,也就是说模型的拟合效果就越好.(2)残差图也是用来刻画回归效果的,推断依据是:残差点比拟匀称地分布在水平带状区域中,带状区域越窄,说明模型拟合精度越高,回归方程预报精度越高.为讨论质量x(单位:g)对弹簧长度Y(单位:cm)的影响,对不同质量的6个物体进行测量,数据如表所示:x51015202530Y(1)作出散点图并求阅历回归方程;(2)求出R2并说明回归模型拟合的程度;(3)进行残差分析.【解析】(1)散点图如图.eq\x\to(x)=eq\f(1,6)×(5+10+15+20+25+30)=17.5,eq\x\to(y)=eq\f(1,6)×(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487,计算得≈0.183,≈6.285.故所求阅历回归方程为x.(2)列出残差表为yi-iyi-eq\x\to(y)yi-iyi-eq\x\to(y)所以i)2≈0.01318,eq\x\to(y))2=14.6783.所以,R2=1-eq\f(0.01318,14.6783)≈0.9991,回归模型的拟合效果较好.(3)由残差表中的数值可以看出第3个样本点的残差比拟大,需要确认在采集这个样本点的时候是否有人为的错误,假如有的话,需要订正,重新建立回归模型;由表中数据可以看出残差点比拟匀称地落在狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与所挂物体的质量成线性关系.类型三求非线性阅历回归方程(数据分析、数学运算)【典例】在一化学反响过程中,某化学物质的反响速度y(g/min)与一种催化剂的量x(g)有关,现收集了如表所示的8组数据,求y与x的阅历回归方程.催化剂量x(g)1518212427303336化学物质反响速度y(g/min)6830277020565350【解析】依据收集的数据作散点图,如下图.依据样本点的分布状况,可选用指数型函数模型y=c1ec2x(c1,c2为待定的参数),令z=lny,那么z=c2x+lnc1,即变换后样本点应当分布在直线z=bx+a(a=lnc1,b=c2)的四周,由y与x的数据表得z与x的数据表如下:x1518212427303336z作出z与x的散点图,如下图,由图可以看出变换后的样本点分布在一条直线四周,所以可用线性回归方程来拟合.由表中数据可得≈0.1812,≈-0.8492,故=0.1812x-0.8492,所以=e0.1812x-0.8492,因此该化学物质的反响速度与催化剂的量的非线性回归方程为=e0.1812x-0.8492.求非线性阅历回归方程常见转化类型:(1)反比例函数y=a+eq\f(b,x)可作变换t=eq\f(1,x),得y=a+bt.(2)幂函数型y=axb(a>0)可作变换Y=lny,m=lna,t=lnx,那么有Y=m+bt.(3)指数型函数y=kabx(a>0且a≠1,k>0)可作变换Y=lny,m=lnk,那么有:Y=m+(blna)x生物学家认为,睡眠中的恒温动物依旧会消耗体内能量,主要是为了保持体温.脉搏率f是单位时间心跳的次数,医学讨论发觉,动物的体重W(单位:g)与脉搏率f存在着肯定的关系.如表给出一些动物体重与脉搏率对应的数据,图1画出了体重W与脉搏率f的散点图,图2画出了lgW与lgf的散点图.动物名体重脉搏率鼠25670大鼠200420豚鼠300300兔2000200小狗5000120大狗3000085羊5000070为了较好地描述体重和脉搏率的关系,现有以下两种模型供选择:①f=kW+b②lgf=klgW+b(1)选出你认为最符合实际的函数模型,并说明理由;(2)不妨取表中豚鼠和兔的体重脉搏率数据代入所选函数模型,求出f关于W的函数解析式;(3)假设马的体重是兔的256倍,依据(2)的结论,估计马的脉搏率.(参考数据:lg2≈0.3,lg3≈0.5.)【解析】(1)模型②lgf=klgW+b最符合实际.依据散点图的特征,图2根本上呈直线形式,所以可选择一次函数来刻画lgW和lgf的关系.(2)lg200=2+lg2≈2.3,lg2000=3+lg2≈3.3,lg300=2+lg3≈2.5,由题意知eq\b\lc\{(\a\vs4\al\co1(lg300=klg300+b,lg200=klg2000+b)),解得eq\b\lc\{(\a\vs4\al\co1(k=-\f(1,4),b=\f(25,8))),所以lgf=-eq\f(1,4)lgW+eq\f(25,8),所以f关于W的函数解析式为f=·.(3)设马的体重和脉搏率分别为W1,f1,兔的体重和脉搏率分别为W2,f2,由题意知,eq\f(W1,W2)=256,所以eq\f(f1,f2)=====eq\f(1,4).由于f2=200,所以f1=50,即马的脉搏率为50.课堂检测·素养达标1.关于回归分析,以下说法错误的选项是()A.回归分析是讨论两个具有相关关系的变量的方法B.散点图中,解释变量在x轴,响应变量在y轴C.回归模型中肯定存在随机误差D.散点图能明确反映变量间的关系【解析】选D.用散点
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 酿酒厂天然气供气服务合同
- 物联网工程居间合同
- 农业政策支持方案
- 补充借款合同格式
- 新媒体运营合作协议
- 林木种植与林业管理作业指导书
- 大型钻机租赁合同
- 大厦物业租赁合同
- 小学二年级数学上册口算题卡
- 2025年汉中货运上岗证模拟考试试题
- (完整版)《植物生产与环境》试卷与答案
- 二年级上册竖式计算题100题及答案
- 【光明乳业企业偿债能力问题及完善建议8900字论文】
- 多益网络游戏开发工程师岗位笔试选择题附笔试高分技巧
- 提高感染性休克集束化治疗达标率
- 译林版七年级下册英语单词默写表
- 专题01 中华传统文化-中考英语时文阅读专项训练
- 阿特拉斯拧紧工具维修培训课件
- 密封条模板大全
- 页眉和页脚基本知识课件
- ST语言编程手册
评论
0/150
提交评论