版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
§11.4回归分析考试要求1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3.了解回归分析的基本思想、方法及其简单应用.知识梳理相关关系与回归方程(1)相关关系的分类①正相关在散点图中,点散布在从________到________的区域,两个变量的这种相关关系称为正相关.②负相关在散点图中,点散布在从________到________的区域,两个变量的这种相关关系称为负相关.(2)线性相关关系如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做________________.(3)回归方程①最小二乘法求回归直线,使得样本数据的点到它的________________________________的方法叫做最小二乘法.②回归方程方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^))是待定参数.eq\b\lc\{\rc\(\a\vs4\al\co1(\o(b,\s\up6(^))=\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\i\su(i=1,n,)xi-\x\to(x)2)=\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),,\o(a,\s\up6(^))=.))(4)回归分析①定义:对具有相关关系的两个变量进行统计分析的一种常用方法.②样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其中________________称为样本点的中心.③相关系数当r>0时,表明两个变量________________;当r<0时,表明两个变量________________.r的绝对值越接近于1,表明两个变量的线性相关性________.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于________时,认为两个变量有很强的线性相关性.常用结论1.回归直线过样本点的中心(eq\x\to(x),eq\x\to(y)).2.求eq\o(b,\s\up6(^))时,常用公式eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2).3.回归分析是基于样本观测数据进行估计或推断的,得出的结论可能犯错误.思考辨析判断下列结论是否正确(请在括号中打“√”或“×”)(1)相关关系是一种非确定性关系.()(2)散点图是判断两个变量相关关系的一种重要方法和手段.()(3)回归直线eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点.()(4)相关系数的绝对值越接近1,两个变量的线性相关程度越强.()教材改编题1.在对两个变量x,y进行回归分析时有下列步骤:①对所求出的回归方程作出解释;②收集数据(xi,yi),i=1,2,…,n;③求回归方程;④根据所收集的数据绘制散点图.则下列操作顺序正确的是()A.①②④③ B.③②④①C.②③①④ D.②④③①2.对于x,y两个变量,有四组样本数据,分别算出它们的相关系数r如下,则线性相关性最强的是()A.-0.82 B.0.78C.-0.69 D.0.873.某单位为了了解办公楼用电量y(度)与气温x(℃)之间的关系,随机统计了四个工作日的用电量与当天平均气温,并制作了对照表:气温(℃)181310-1用电量(度)24343864由表中数据得到线性回归方程eq\o(y,\s\up6(^))=-2x+eq\o(a,\s\up6(^)),当气温为-4℃时,预测用电量约为()A.68度 B.52度C.12度 D.28度题型一数据的相关性例1(1)(2023·保定模拟)已知两个变量x和y之间有线性相关关系,经调查得到如下样本数据:x34567y3.52.41.1-0.2-1.3根据表格中的数据求得线性回归方程为eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),则下列说法中正确的是()A.eq\o(a,\s\up6(^))>0,eq\o(b,\s\up6(^))>0 B.eq\o(a,\s\up6(^))>0,eq\o(b,\s\up6(^))<0C.eq\o(a,\s\up6(^))<0,eq\o(b,\s\up6(^))>0 D.eq\o(a,\s\up6(^))<0,eq\o(b,\s\up6(^))<0听课记录:_______________________________________________________________________________________________________________________________________________________(2)(2022·大同模拟)如图是相关变量x,y的散点图,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))1x+eq\o(a,\s\up6(^))1,相关系数为r1;方案二:剔除点(10,21),根据剩下的数据得到线性回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))2x+eq\o(a,\s\up6(^))2,相关系数为r2.则()A.0<r1<r2<1 B.0<r2<r1<1C.-1<r1<r2<0 D.-1<r2<r1<0听课记录:_______________________________________________________________________________________________________________________________________________________思维升华判定两个变量相关性的方法(1)画散点图:若点的分布从左下角到右上角,则两个变量正相关;若点的分布从左上角到右下角,则两个变量负相关.(2)相关系数:当r>0时,正相关;当r<0时,负相关;|r|越接近1,线性相关性越强.(3)线性回归方程:当eq\o(b,\s\up6(^))>0时,正相关;当eq\o(b,\s\up6(^))<0时,负相关.跟踪训练1(1)某公司2017~2022年的年利润x(单位:百万元)与年广告支出y(单位:百万元)的统计数据如表所示:年份201720182019202020212022年利润x12.214.6161820.422.3年广告支出y0.620.740.810.8911.11根据统计数据,则利润中位数()A.是16,x与y有正相关关系B.是17,x与y有正相关关系C.是17,x与y有负相关关系D.是18,x与y有负相关关系(2)已知相关变量x和y的散点图如图所示,若用y=b1·ln(k1x)与y=k2x+b2拟合时的相关系数分别为r1,r2,则比较r1,r2的大小结果为()A.r1>r2 B.r1=r2C.r1<r2 D.不确定题型二回归分析命题点1线性回归模型例2(2023·蚌埠模拟)某商业银行对存款利率与日存款总量的关系进行调研,发现存款利率每上升一定的百分点,日均存款总额就会发生一定的变化,经过统计得到下表:利率上升百分点x0.10.20.30.40.5日均存款总额y(亿元)0.20.350.50.650.8(1)在给出的坐标系中画出上表数据的散点图;(2)根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^));(3)已知现行利率下的日均存款总额为0.625亿元,试根据(2)中的线性回归方程,预测日均存款总额为现行利率下的2倍时,利率需上升多少个百分点?参考公式及数据:①eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x),②eq\i\su(i=1,5,x)iyi=0.9,eq\i\su(i=1,5,x)eq\o\al(2,i)=0.55.________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________命题点2非线性回归模型例3(2023·保山模拟)某县为了解乡村经济发展情况,对全县乡村经济发展情况进行调研,现对2013年以来的乡村经济收入y(单位:亿元)进行了统计分析,制成如图所示的散点图,其中年份代码x的值1—10分别对应2013年至2022年.(1)若用模型①y=a+bx,②y=a+beq\r(x)拟合y与x的关系,其相关系数分别为r1=0.8519,r2=0.9901,试判断哪个模型的相关程度更强?(2)根据(1)中相关程度更强的模型,求y关于x的回归方程(系数精确到0.01),并估计该县2026年的乡村经济收入(精确到0.01).参考数据:ti=eq\r(xi),eq\x\to(t)=eq\f(1,10)eq\i\su(i=1,10,t)i,eq\r(13)≈3.606,eq\r(14)≈3.742,eq\r(15)≈3.873.eq\x\to(y)eq\x\to(t)eq\i\su(i=1,10,)(xi-eq\x\to(x))2eq\i\su(i=1,10,)(ti-eq\x\to(t))2eq\i\su(i=1,10,)(xi-eq\x\to(x))·(yi-eq\x\to(y))eq\i\su(i=1,10,)(ti-eq\x\to(t))·(yi-eq\x\to(y))72.652.25126.254.52235.4849.16参考公式:对于一组数据(t1,y1),(t2,y2),…,(tn,yn),线性回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))t+eq\o(a,\s\up6(^))中的斜率和截距的最小二乘估计公式分别为eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,)ti-\x\to(t)yi-\x\to(y),\i\su(i=1,n,)ti-\x\to(t)2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(t).________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________思维升华求线性回归方程的步骤跟踪训练2(2022·南充模拟)某特色餐馆开通了某APP的外卖服务,在一周内的某特色菜外卖份数x(单位:份)与收入y(单位:元)之间有如下的对应数据:外卖份数x(份)24568收入y(元)3040605070(1)在给出的坐标系中画出数据散点图;(2)请根据以上数据用最小二乘法求出收入y关于外卖份数x的线性回归方程;(3)据此估计外卖份数为12时,收入为多少元.参考数据与公式:eq\i\su(i=1,5,x)eq\o\al(2,i)=145,eq\i\su(i=1,5,x)iyi=1380,eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\i\su(i=1,n,)xi-\x\to(x)2)=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x).________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________题型三残差分析例4(1)下列说法中正确的是()①在线性回归方程eq\o(y,\s\up6(^))=-0.85x+2.3中,当解释变量x每增加1个单位时,预报变量eq\o(y,\s\up6(^))平均减少2.3个单位;②在线性回归方程eq\o(y,\s\up6(^))=-0.85x+2.3中,相对于样本点(1,1.2)的残差为-0.25;③在残差图中,残差分布的水平带状区域的宽度越窄,其模型的拟合效果越好;④若两个变量的相关指数R2越大,表示残差平方和越小,即模型的拟合效果越好.A.①③ B.①②④C.①④ D.②③④听课记录:_______________________________________________________________________________________________________________________________________________________(2)新能源汽车的核心部件是动力电池,电池占了新能源整车成本的很大一部分,而其中的原材料碳酸锂又是电池的主要成分.从2020年底开始,碳酸锂的价格不断升高,如表是2022年某企业的前5个月碳酸锂的价格与月份的统计数据:月份代码x12345碳酸锂价格y(万元/kg)0.50.61m1.5根据表中数据,得出y关于x的线性回归方程为eq\o(y,\s\up6(^))=0.28x+eq\o(a,\s\up6(^)),根据数据计算出在样本点(5,1.5)处的残差为-0.06,则m=________.听课记录:_______________________________________________________________________________________________________________________________________________________思维升华检验回归模型的拟合效果的两种方法(1)残差分析:通过残差分析发现原始数据中的可疑数据,判断所建立模型的拟合效果.(2)R2分析:通过公式计算R2,R2越大,残差平方和越小,模型的拟合效果越好;R2越小,残差平方和越大,模型的拟合效果越差.跟踪训练3(1)下列命题是真命题的为()A.回归直线eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))一定不过样本点B.可以用相关系数r来刻画两个变量x和y线性相关程度的强弱,r的值越小,说明两个变量的线性相关程度越弱C.在回归分析中,相关指数R2=0.80的模型比相关指数R2=0.98的模型拟合的效果要好D.残差平方和越小的模型,拟合的效果越好(2)两个线性相关变量x与y的统计数据如表:x99.51010.511y1110865其线性回归方程是eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+40,则相应于点(9,11)的残差为________.§11.4回归分析考试要求1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3.了解回归分析的基本思想、方法及其简单应用.知识梳理相关关系与回归方程(1)相关关系的分类①正相关在散点图中,点散布在从左下角到右上角的区域,两个变量的这种相关关系称为正相关.②负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.(2)线性相关关系如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(3)回归方程①最小二乘法求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法.②回归方程方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^))是待定参数.eq\b\lc\{\rc\(\a\vs4\al\co1(\o(b,\s\up6(^))=\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\i\su(i=1,n,)xi-\x\to(x)2)=\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),,\o(a,\s\up6(^))=\x\to(y)-\o(b,\s\up6(^))\x\to(x).))(4)回归分析①定义:对具有相关关系的两个变量进行统计分析的一种常用方法.②样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其中(eq\x\to(x),eq\x\to(y))称为样本点的中心.③相关系数当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.常用结论1.回归直线过样本点的中心(eq\x\to(x),eq\x\to(y)).2.求eq\o(b,\s\up6(^))时,常用公式eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2).3.回归分析是基于样本观测数据进行估计或推断的,得出的结论可能犯错误.思考辨析判断下列结论是否正确(请在括号中打“√”或“×”)(1)相关关系是一种非确定性关系.(√)(2)散点图是判断两个变量相关关系的一种重要方法和手段.(√)(3)回归直线eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点.(×)(4)相关系数的绝对值越接近1,两个变量的线性相关程度越强.(√)教材改编题1.在对两个变量x,y进行回归分析时有下列步骤:①对所求出的回归方程作出解释;②收集数据(xi,yi),i=1,2,…,n;③求回归方程;④根据所收集的数据绘制散点图.则下列操作顺序正确的是()A.①②④③ B.③②④①C.②③①④ D.②④③①答案D解析根据回归分析的思想,可知对两个变量x,y进行回归分析时,应先收集数据(xi,yi),然后绘制散点图,再求回归方程,最后对所求的回归方程作出解释.2.对于x,y两个变量,有四组样本数据,分别算出它们的相关系数r如下,则线性相关性最强的是()A.-0.82 B.0.78C.-0.69 D.0.87答案D解析由相关系数的绝对值|r|越大,变量间的线性相关性越强知,各选项中r=0.87的绝对值最大,故线性相关性最强.3.某单位为了了解办公楼用电量y(度)与气温x(℃)之间的关系,随机统计了四个工作日的用电量与当天平均气温,并制作了对照表:气温(℃)181310-1用电量(度)24343864由表中数据得到线性回归方程eq\o(y,\s\up6(^))=-2x+eq\o(a,\s\up6(^)),当气温为-4℃时,预测用电量约为()A.68度 B.52度C.12度 D.28度答案A解析由表格可知eq\x\to(x)=10,eq\x\to(y)=40,根据回归直线必过(eq\x\to(x),eq\x\to(y)),得eq\o(a,\s\up6(^))=40+20=60,则回归方程为eq\o(y,\s\up6(^))=-2x+60,因此当x=-4时,eq\o(y,\s\up6(^))=68.题型一数据的相关性例1(1)(2023·保定模拟)已知两个变量x和y之间有线性相关关系,经调查得到如下样本数据:x34567y3.52.41.1-0.2-1.3根据表格中的数据求得线性回归方程为eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),则下列说法中正确的是()A.eq\o(a,\s\up6(^))>0,eq\o(b,\s\up6(^))>0 B.eq\o(a,\s\up6(^))>0,eq\o(b,\s\up6(^))<0C.eq\o(a,\s\up6(^))<0,eq\o(b,\s\up6(^))>0 D.eq\o(a,\s\up6(^))<0,eq\o(b,\s\up6(^))<0答案B解析由已知数据可知y随着x的增大而减小,则变量x和y之间存在负相关关系,所以eq\o(b,\s\up6(^))<0.又eq\x\to(x)=eq\f(1,5)×(3+4+5+6+7)=5,eq\x\to(y)=eq\f(1,5)×(3.5+2.4+1.1-0.2-1.3)=1.1,即1.1=5eq\o(b,\s\up6(^))+eq\o(a,\s\up6(^)),所以eq\o(a,\s\up6(^))=1.1-5eq\o(b,\s\up6(^))>0.(2)(2022·大同模拟)如图是相关变量x,y的散点图,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))1x+eq\o(a,\s\up6(^))1,相关系数为r1;方案二:剔除点(10,21),根据剩下的数据得到线性回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))2x+eq\o(a,\s\up6(^))2,相关系数为r2.则()A.0<r1<r2<1 B.0<r2<r1<1C.-1<r1<r2<0 D.-1<r2<r1<0答案D解析根据相关变量x,y的散点图知,变量x,y具有负线性相关关系,剔除点(10,21)后,剩下的数据线性相关性更强;所以样本相关系数-1<r2<r1<0.思维升华判定两个变量相关性的方法(1)画散点图:若点的分布从左下角到右上角,则两个变量正相关;若点的分布从左上角到右下角,则两个变量负相关.(2)相关系数:当r>0时,正相关;当r<0时,负相关;|r|越接近1,线性相关性越强.(3)线性回归方程:当eq\o(b,\s\up6(^))>0时,正相关;当eq\o(b,\s\up6(^))<0时,负相关.跟踪训练1(1)某公司2017~2022年的年利润x(单位:百万元)与年广告支出y(单位:百万元)的统计数据如表所示:年份201720182019202020212022年利润x12.214.6161820.422.3年广告支出y0.620.740.810.8911.11根据统计数据,则利润中位数()A.是16,x与y有正相关关系B.是17,x与y有正相关关系C.是17,x与y有负相关关系D.是18,x与y有负相关关系答案B解析由题意知,年利润的中位数是eq\f(16+18,2)=17,而且随着年利润x的增加,年广告支出y也在增加,故x与y有正相关关系.(2)已知相关变量x和y的散点图如图所示,若用y=b1·ln(k1x)与y=k2x+b2拟合时的相关系数分别为r1,r2,则比较r1,r2的大小结果为()A.r1>r2 B.r1=r2C.r1<r2 D.不确定答案C解析由散点图可知,用y=b1·ln(k1x)拟合比用y=k2x+b2拟合的效果更好,故|r1|>|r2|;又因为x,y负相关,所以-r1>-r2,即r1<r2.题型二回归分析命题点1线性回归模型例2(2023·蚌埠模拟)某商业银行对存款利率与日存款总量的关系进行调研,发现存款利率每上升一定的百分点,日均存款总额就会发生一定的变化,经过统计得到下表:利率上升百分点x0.10.20.30.40.5日均存款总额y(亿元)0.20.350.50.650.8(1)在给出的坐标系中画出上表数据的散点图;(2)根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^));(3)已知现行利率下的日均存款总额为0.625亿元,试根据(2)中的线性回归方程,预测日均存款总额为现行利率下的2倍时,利率需上升多少个百分点?参考公式及数据:①eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x),②eq\i\su(i=1,5,x)iyi=0.9,eq\i\su(i=1,5,x)eq\o\al(2,i)=0.55.解(1)如图所示.(2)由表格数据可得eq\x\to(x)=eq\f(1,5)×(0.1+0.2+0.3+0.4+0.5)=0.3,eq\x\to(y)=eq\f(1,5)×(0.2+0.35+0.5+0.65+0.8)=0.5,所以eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(5),\s\do14(i=1))xiyi-5\x\to(x)\x\to(y),\o(∑,\s\up6(5),\s\do14(i=1))x\o\al(2,i)-5\x\to(x)2)=eq\f(0.9-5×0.3×0.5,0.55-5×0.3×0.3)=1.5,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)=0.5-1.5×0.3=0.05,故eq\o(y,\s\up6(^))=1.5x+0.05.(3)设利率需上升x个百分点,由(2)得,0.625×2=1.5x+0.05,解得x=0.8,所以预测利率需上升0.8个百分点.命题点2非线性回归模型例3(2023·保山模拟)某县为了解乡村经济发展情况,对全县乡村经济发展情况进行调研,现对2013年以来的乡村经济收入y(单位:亿元)进行了统计分析,制成如图所示的散点图,其中年份代码x的值1—10分别对应2013年至2022年.(1)若用模型①y=a+bx,②y=a+beq\r(x)拟合y与x的关系,其相关系数分别为r1=0.8519,r2=0.9901,试判断哪个模型的相关程度更强?(2)根据(1)中相关程度更强的模型,求y关于x的回归方程(系数精确到0.01),并估计该县2026年的乡村经济收入(精确到0.01).参考数据:ti=eq\r(xi),eq\x\to(t)=eq\f(1,10)eq\i\su(i=1,10,t)i,eq\r(13)≈3.606,eq\r(14)≈3.742,eq\r(15)≈3.873.eq\x\to(y)eq\x\to(t)eq\i\su(i=1,10,)(xi-eq\x\to(x))2eq\i\su(i=1,10,)(ti-eq\x\to(t))2eq\i\su(i=1,10,)(xi-eq\x\to(x))·(yi-eq\x\to(y))eq\i\su(i=1,10,)(ti-eq\x\to(t))·(yi-eq\x\to(y))72.652.25126.254.52235.4849.16参考公式:对于一组数据(t1,y1),(t2,y2),…,(tn,yn),线性回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))t+eq\o(a,\s\up6(^))中的斜率和截距的最小二乘估计公式分别为eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,)ti-\x\to(t)yi-\x\to(y),\i\su(i=1,n,)ti-\x\to(t)2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(t).解(1)因为r2更接近1,所以y=a+beq\r(x)的相关程度更强.(2)根据题中所给数据得eq\o(y,\s\up6(^))=eq\o(a,\s\up6(^))+eq\o(b,\s\up6(^))t,所以eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,10,)ti-\x\to(t)yi-\x\to(y),\i\su(i=1,10,)ti-\x\to(t)2)=eq\f(49.16,4.52)≈10.88,则eq\o(a,\s\up6(^))≈72.65-10.88×2.25=48.17,所以非线性回归方程为eq\o(y,\s\up6(^))=48.17+10.88eq\r(x),2026年的年份代码为14,当x=14时,eq\o(y,\s\up6(^))=48.17+10.88×eq\r(14)≈88.88,所以估计该县2026年的乡村经济收入为88.88亿元.思维升华求线性回归方程的步骤跟踪训练2(2022·南充模拟)某特色餐馆开通了某APP的外卖服务,在一周内的某特色菜外卖份数x(单位:份)与收入y(单位:元)之间有如下的对应数据:外卖份数x(份)24568收入y(元)3040605070(1)在给出的坐标系中画出数据散点图;(2)请根据以上数据用最小二乘法求出收入y关于外卖份数x的线性回归方程;(3)据此估计外卖份数为12时,收入为多少元.参考数据与公式:eq\i\su(i=1,5,x)eq\o\al(2,i)=145,eq\i\su(i=1,5,x)iyi=1380,eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\i\su(i=1,n,)xi-\x\to(x)2)=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x).解(1)作出散点图如图所示.(2)由表格数据得,eq\x\to(x)=eq\f(2+4+5+6+8,5)=5,eq\x\to(y)=eq\f(30+40+60+50+70,5)=50,则eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,5,x)iyi-5\x\to(x)\x\to(y),\i\su(i=1,5,x)\o\al(2,i)-5\x\to(x)2)=eq\f(1380-5×5×50,145-5×52)=6.5,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)=50-6.5×5=17.5,因此所求线性回归方程为eq\o(y,\s\up6(^))=6.5x+17.5.(3)当x=12时,eq\o(y,\s\up6(^))=12×6.5+17.5=95.5,即外卖份数为12时,预测收入为95.5元.题型三残差分析例4(1)下列说法中正确的是()①在线性回归方程eq\o(y,\s\up6(^))=-0.85x+2.3中,当解释变量x每增加1个单位时,预报变量eq\o(y,\s\up6(^))平均减少2.3个单位;②在线性回归方程eq\o(y,\s\up6(^))=-0.85x+2.3中,相对于样本点(1,1.2)的残差为-0.25;③在残差图中,残差分布的水平带状区域的宽度越窄,其模型的拟合效果越好;④若两个变量的相关指数R2越大,表示残差平方和越小,即模型的拟合效果越好.A.①③ B.①②④C.①④ D.②③④答案D解析对于①,根据线性回归方程,当解释变量x每增加1个单位时,预报变量eq\o(y,\s\up6(^))平均减少0.85个单位,故①错误;对于②,当解释变量x=1时,预报变量eq\o(y,\s\up6(^))=1.45,则样本点(1,1.2)的残差为-0.25,故②正确;对于③,在残差图中,残差分布的水平带状区域的宽度越窄,说明拟合精度越高,即拟合效果越好,故③正确;对于④,由相关指数R2的意义可知,R2越大,表示残差平方和越小,即模型的拟合效果越好,故④正确.(2)新能源汽车的核心部件是动力电池,电池占了新能源整车成本的很大一部分,而其中的原材料碳酸锂又是电池的主要成分.从2020年底开始,碳酸锂的价格不断升高,如表是2022年某企业的前5个月碳酸锂的价格与月份的统计数据:月份代码x12345碳酸锂价格y(万元/kg)0.50.61m1.5根据表中数据,得出y关于x的线性回归方程为eq\o(y,\s\up6(^))=0.28x+eq\o(a,\s\up6(^)),根据数据计算出在样本点(5,1.5)处的残差为-0.06,则m=________.答案1.4解析由题设,1.5-eq\o(y,\s\up6(^))=1.5-(0.28×5+eq\o(a,\s\up6(^)))=-0.06,可得eq\o(a,\s\up6(^))=0.16.又eq\x\to(x)=eq\f(1+2+3+4+5,5)=3,eq\x\to(y)=eq\f(0.5+0.6+1+m+1.5,5)=eq\f(3.6+m,5),所以0.28×3+0.16=eq\f(3.6+m,5),可得m=1.4.思维升华检验回归模型的拟合效果的两种方法(1)残差分析:通过残差分析发现原始数据中的可疑数据,判断所建立模型的拟合效果.(2)R2分析:通过公式计算R2,R2越大,残差平方和越小,模型的拟合效果越好;R2越小,残差平方和越大,模型的拟合效果越差.跟踪训练3(1)下列命题是真命题的为()A.回归直线eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))一定不过样本点B.可以用相关系数r来刻画两个变量x和y线性相关程度的强弱,r的值越小,说明两个变量的线性相关程度越弱C.在回归分析中,相关指数R2=0.80的模型比相关指数R2=0.98的模型拟合的效果要好D.残差平方和越小的模型,拟合的效果越好答案D解析对于A,回归直线可能经过样本点,一定经过(eq\x\to(x),eq\x\to(y)),所以A是假命题;对于B,由相关系数的意义知,当|r|越接近0时,表示变量y与x之间的线性相关程度越弱,所以B是假命题;对于C,用相关指数R2的值判断模型的拟合效果,R2越大,模型的拟合效果越好,所以C是假命题;对于D,由残差的统计学意义知,D是真命题.(2)两个线性相关变量x与y的统计数据如表:x99.51010.511y1110865其线性回归方程是eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+40,则相应于点(9,11)的残差为________.答案-0.2解析因为eq\x\to(x)=eq\f(1,5)×(9+9.5+10+10.5+11)=10,eq\x\to(y)=eq\f(1,5)×(11+10+8+6+5)=8,所以8=10eq\o(b,\s\up6(^))+40,解得eq\o(b,\s\up6(^))=-3.2,所以eq\o(y,\s\up6(^))=-3.2x+40,当x=9时,eq\o(y,\s\up6(^))=11.2,所以残差为11-11.2=-0.2.课时精练1.下列说法中不正确的是()A.具有相关关系的两个变量不是因果关系B.散点图能直观地反映数据的相关程度C.回归直线最能代表线性相关的两个变量之间的关系D.任一组数据都有回归方程答案D解析根据两个变量具有相关关系的概念,可知A正确;散点图能直观地描述具有相关关系的两个变量的相关程度,所以B正确;回归直线最能代表线性相关的两个变量之间的相关关系,所以C正确;具有相关关系的样本数据才有回归方程,所以D不正确.2.对于相关系数,下列说法错误的是()A.相关系数可以用来判断样本数据相关关系的正负性B.相关系数可以是正的,也可以是负的C.相关系数r∈[-1,1]D.相关系数越大,样本数据的线性相关程度越强答案D解析相关系数的绝对值越大,样本数据的线性相关程度越强,故D错误.3.(2023·运城模拟)在线性回归模型中,变量x与y的一组样本数据对应的点均在直线y=eq\f(1,2)x+1上,R2=1-eq\f(\i\su(i=1,n,)yi-\o(y,\s\up6(^))i2,\i\su(i=1,n,)yi-\x\to(y)2),则R2等于()A.eq\f(1,4)B.eq\f(1,2)C.1D.eq\f(5,2)答案C解析因为样本数据对应的点均在一条直线上,所以R2=1.4.某工厂研究某种产品的产量x(单位:吨)与所需某种材料y(单位:吨)之间的相关关系,在生产过程中收集了4组数据如表所示.根据表中数据可得线性回归方程为eq\o(y,\s\up6(^))=0.7x+eq\o(a,\s\up6(^)),则下列四个说法中不正确的为()x3467y2.5345.9A.变量x与y正相关B.y与x的相关系数r>0C.eq\o(a,\s\up6(^))=0.45D.当产量为8吨时,预测所需材料为5.95吨答案C解析因为线性回归方程eq\o(y,\s\up6(^))=0.7x+eq\o(a,\s\up6(^)),所以变量x与y呈正相关,所以相关系数r>0,故A正确,B正确;由表格可得eq\x\to(x)=eq\f(3+4+6+7,4)=5,eq\x\to(y)=eq\f(2.5+3+4+5.9,4)=3.85,则0.7×5+eq\o(a,\s\up6(^))=3.85,解得eq\o(a,\s\up6(^))=0.35,故C不正确;所以线性回归方程为eq\o(y,\s\up6(^))=0.7x+0.35,当x=8时,eq\o(y,\s\up6(^))=0.7×8+0.35=5.95,即产量为8吨时,预测所需材料为5.95吨,故D正确.5.(2023·成都模拟)某制衣品牌为使成衣尺寸更精准,选择了10名志愿者,对其身高(单位:cm)和臂展(单位:cm)进行了测量,这10名志愿者身高和臂展的折线图如图所示.已知这10名志愿者身高的平均值为176cm,根据这10名志愿者的数据求得臂展u关于身高v的线性回归方程为eq\o(u,\s\up6(^))=1.2v-34,则下列结论正确的是()①这10名志愿者身高的极差小于臂展的极差;②这10名志愿者的身高和臂展负相关;③这10名志愿者臂展的平均值为176.2cm;④根据线性回归方程可估计身高为160cm的人的臂展为158cm.A.①② B.①④C.②③ D.②④答案B解析对于①,因为这10名志愿者臂展的最大值大于身高的最大值,而臂展的最小值小于身高的最小值,所以这10名志愿者身高的极差小于臂展的极差,故①正确;对于②,因为1.2>0,所以这10名志愿者的身高和臂展正相关,故②错误;对于③,因为这10名志愿者身高的平均值为176cm,所以这10名志愿者臂展的平均值为1.2×176-34=177.2(cm),故③错误;对于④,若一个人的身高为160cm,则由线性回归方程eq\o(u,\s\up6(^))=1.2v-34,可得这个人的臂展的估计值为158cm,故④正确.6.色差和色度是衡量毛绒玩具质量优劣的重要指标,现抽检一批产品测得数据列于表中.已知该产品的色度y和色差x之间满足线性相关关系,且eq\o(y,\s\up6(^))=0.8x+eq\o(a,\s\up6(^)),现有一对测量数据为(30,23.6),则该数据的残差为()色差x21232527色度y15181920A.-0.96B.-0.8C.0.8D.0.96答案C解析由题意可知,eq\x\to(x)=eq\f(21+23+25+27,4)=24,eq\x\to(y)=eq\f(15+18+19+20,4)=18,将(24,18)代入eq\o(y,\s\up6(^))=0.8x+eq\o(a,\s\up6(^)),即18=0.8×24+eq\o(a,\s\up6(^)),解得eq\o(a,\s\up6(^))=-1.2,所以eq\o(y,\s\up6(^))=0.8x-1.2,当x=30时,eq\o(y,\s\up6(^))=0.8×30-1.2=22.8,所以该数据的残差为23.6-22.8=0.8.7.某智能机器人的广告费用x(万元)与销售额y(万元)的统计数据如表所示:广告费用x(万元)2356销售额y(万元)28314148根据此表可得线性回归方程为eq\o(y,\s\up6(^))=5x+eq\o(a,\s\up6(^)),据此模型预测广告费用为8万元时销售额为________万元.答案57解析由表格,得eq\x\to(x)=eq\f(2+3+5+6,4)=4,eq\x\to(y)=eq\f(28+31+41+48,4)=37,所以37=5×4+eq\o(a,\s\up6(^)),即eq\o(a,\s\up6(^))=17,所以eq\o(y,\s\up6(^))=5x+17,所以预测当广告费用为8万元时,销售额为5×8+17=57(万元).8.已知具有相关关系的两个随机变量的一组观测数据的散点图分布在函数y=2e2x+1的图象附近,设z=lny,将其变换后得到线性回归方程eq\o(z,\s\up6(^))=eq\o(m,\s\up6(^))x+eq\o(n,\s\up6(^)),则eq\o(m,\s\up6(^))eq\o(n,\s\up6(^))=________.答案2ln2+2解析由z=lny,则lny=ln2e2x+1,即z=ln2+lne2x+1=ln2+2x+1,则eq\o(z,\s\up6(^))=2x+ln2+1,故eq\o(m,\s\up6(^))=2,eq\o(n,\s\up6(^))=ln2+1,所以eq\o(m,\s\up6(^))eq\o(n,\s\up6(^))=2ln2+2.9.假设关于某种设备的使用年限x(单位:年)与所支出的维修费用y(单位:万元)线性相关,统计资料如下.x23456y2.23.85.56.57.0已知eq\i\su(i=1,5,x)eq\o\al(2,i)=90,eq\i\su(i=1,5,y)eq\o\al(2,i)≈140.8,eq\i\su(i=1,5,x)iyi=112.3,eq\r(79)≈8.9,eq\r(2)≈1.4.(1)求eq\x\to(x),eq\x\to(y);(2)计算y与x的相关系数r(精确到0.001),并判断该设备的使用年限与所支出的维修费用的线性相关程度.附:相关系数r=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xi-\x\to(x)yi-\x\to(y),\r(\o(∑,\s\up6(n),\s\do4(i=1))xi-\x\to(x)2\o(∑,\s\up6(n),\s\do4(i=1))yi-\x\to(y)2))=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n\x\to(x)\x\to(y),\r(\o(∑,\s\up6(n),\s\do4(i=1))x\o\al(2,i)-n\x\to(x)2\o(∑,\s\up6(n),\s\do4(i=1))y\o\al(2,i)-n\x\to(y)2)).解(1)eq\x\to(x)=eq\f(2+3+4+5+6,5)=4,eq\x\to(y)=eq\f(2.2+3.8+5.5+6.5+7.0,5)=5.0.(2)eq\i\su(i=1,5,x)iyi-5eq\x\to(x)eq\x\to(y)=112.3-5×4×5=12.3,eq\i\su(i=1,5,x)eq\o\al(2,i)-5eq\x\to(x)2=90-5×42=10,eq\i\su(i=1,5,y)eq\o\al(2,i)-5eq\x\to(y)2≈140.8-5×52=15.8,所以r=eq\f(\i\su(i=1,5,x)iyi-5\x\to(x)\x\to(y),\r(\i\su(i=1,5,x)\o\al(2,i)-5\x\to(x)2)\r(\i\su(i=1,5,y)\o\al(2,i)-5\x\to(y)2))≈eq\f(12.3,\r(10×15.8))=eq\f(12.3,\r(2)×\r(79))≈eq\f(12.3,1.4×8.9)≈0.987,r接近1,说明该设备的使用年限与所支出的维修费用之间的线性相关程度很强.10.(2022·全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:样本号i12345678910总和根部横截面积xi0.040.060.040.080.080.050.050.070.070.060.6材积量yi0.250.400.220.540.510.340.360.460.420.403.9并计算得eq\o(∑,\s\up6(10),\s\do4(i=1))xeq\o\al(2,i)=0.038,eq\o(∑,\s\up6(10),\s\do4(i=1))yeq\o\al(2,i)=1.6158,eq\o(∑,\s\up6(10),\s\do4(i=1))xiyi=0.2474.(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:相关系数r=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xi-\x\to(x)yi-\x\to(y),\r(\o(∑,\s\up6(n),\s\do4(i=1))xi-\x\to(x)2\o(∑,\s\up6(n),\s\do4(i=1))yi-\x\to(y)2))=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n\x\to(x)\x\to(y),\r(\o(∑,\s\up6(n),\s\do4(i=1))x\o\al(2,i)-n\x\to(x)2\o(∑,\s\up6(n),\s\do4(i=1))y\o\al(2,i)-n\x\to(y)2)),eq\r(1.896)≈1.377.解(1)样本中10棵这种树木的根部横截面积的平均值eq\x\to(x)=eq\f(0.6,10
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《焊接工程与装备》教学大纲
- 玉溪师范学院《武术》2021-2022学年第一学期期末试卷
- 玉溪师范学院《社区活动策划》2022-2023学年第一学期期末试卷
- 基尔霍夫定律教案K
- 函数概念教案
- 幼儿文学寓言课件
- 三维设计课件
- 2024届河北省涞水波峰中学高三(上)期末教学统一检测试题数学试题试卷
- 本地化部署合同
- 保险项目合同
- 2024秋期国家开放大学专科《高等数学基础》一平台在线形考(形考任务一至四)试题及答案
- 矿区基本情况(简介)
- 部门服务满意度评分表
- 第十章销售团队的激励机制
- 《蚂蚁做操》说课稿
- 《危险驾驶罪》PPT课件.ppt
- (完整版)PD、QC有限快充的知识讲解
- 习惯一积极主动
- 张矿集团人才发展规划
- 初中美术板报设计1ppt课件
- 南苑校区集团考核自评报告
评论
0/150
提交评论