版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
一元线性回归模型及其应用(15分钟35分)1.关于残差图的描述错误的选项是()A.残差图的横坐标可以是样本编号B.残差图的横坐标也可以是解释变量或响应变量C.残差点分布的带状区域的宽度越窄打算系数越小D.残差点分布的带状区域的宽度越窄残差平方和越小【解析】选C.残差点分布的带状区域的宽度越窄,说明模型拟合精度越高,那么残差平方和越小,此时,打算系数R2的值越大,故描述错误的选项是选项C.【加练·固】方程x-82.71是依据女高校生的身高预报她的体重的回归方程,其中x的单位是cm,的单位是kg,那么针对某个体(160,53)的残差是________.【解析】将x=160代入x-82.71,得=0.85×160-82.71=53.29,所以残差=y-=53-53.29=-0.29.答案:2.假设某地财政收入x与支出y满意回归方程=x++ei(单位:亿元)(i=1,2,…),其中=0.8,=2,|ei|<0.5,假如今年该地区财政收入10亿元,年支出估计不会超过()A.10亿元 B.9亿元C.10.5亿元 【解析】选C.=0.8×10+2+ei=10+ei,由于|ei|<0.5所以9.5<<10.5.3.某车间为了规定工时定额,需要确定加工零件所花费用的时间,为此进行了5次试验,依据收集到的数据(如下表),由最小二乘法求得回归直线方程x+40.2.零件数x(个)12345加工时间y(min)50677179表中有一个数据模糊不清,请你推断出该数据的值为()A.55 B. C.59 【解析】m.由表中的数据可得eq\x\to(x)=eq\f(1+2+3+4+5,5)=3,eq\x\to(y)=eq\f(50+m+67+71+79,5)=eq\f(267+m,5),又由回归直线的方程为x+40.2,所以eq\f(267+m,5)=7.8×3+40.2,解得m=51.即表中模糊的数据为51.4.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的打算系数R2分别如下表:甲乙丙丁R2哪位同学建立的回归模型拟合效果最好()A.甲 B.乙 C.丙 D.丁【解析】R2越大,表示回归模型的效果越好.5.在讨论两个变量的相关关系时,观看散点图发觉样本点集中于某一条指数曲线y=ebx+a的四周,令z=lny,求得回归直线方程为x-2.58,那么该模型的回归方程为____________.【解析】由z=lny,x-2.58,得lnx-2.58,所以=ex,故该模型的回归方程为=ex.答案:=ex6.某城市理论猜测2016年到2020年人口总数(单位:十万)与年份的关系如下表所示:年份2016+x01234人口总数y5781119(1)请画出上表数据的散点图;(2)请依据上表供应的数据,用最小二乘法求出y关于x的阅历回归方程=x+;(3)据此估量2021年该城市人口总数.(参考数据:0×5+1×7+2×8+3×11+4×19=132,02+12+22+32+42=30)【解析】(1)依据题中数表画出数据的散点图如下图:(2)由题中数表,知eq\x\to(x)=eq\f(1,5)(0+1+2+3+4)=2,eq\x\to(y)=eq\f(1,5)(5+7+8+11+19)=10,所以=eq\f(\i\su(i=1,5,x)iyi-5\x\to(x)\x\to(y),\i\su(i=1,5,x)eq\o\al(\s\up1(2),\s\do1(i))-5\x\to(x)2)=eq\x\to(y)-eq\x\to(x)x+3.6;(3)当x=5时=3.2×5+3.6=19.6(十万)=196(万).估量2021年该城市人口总数约为196万.(30分钟60分)一、单项选择题(每题5分,共20分)1.对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,那么以下模型拟合精度最高的是()【解析】选A.用残差图推断模型的拟合效果,残差点比拟匀称地落在水平的带状区域中,说明这样的模型比拟相宜.带状区域的宽度越窄,说明模型的拟合精度越高.2.在生物学上,有隔代遗传的现象.某数学老师的体重为62kg,他的曾祖父、祖父、父亲、儿子的体重分别为58kg、64kg、58kg、60kg.假如体重是隔代遗传,且呈线性相关,依据以上数据可得解释变量x与响应变量的回归方程为=x+,其中=0.5,据此模型猜测他的孙子的体重约为()A.58kg B.61kg C.65kg D.68kg【解析】选B.由于体重是隔代遗传,且呈线性相关,那么取数据(58,58),(64,62),(58,60),得eq\x\to(x)=eq\f(58+64+58,3)=60,eq\x\to(y)=eq\f(58+62+60,3)=60,即样本点的中心为(60,60),代入=x+,得=60-0.5×60=30,那么x+30,取x=62,可得=0.5×62+30=61kg.故猜测他的孙子的体重约为61kg.【加练·固】5G网络是一种先进的高频传输技术,我国的5G技术开展快速,已位居世界前列.华为公司2019年8月初推出了一款5G,现调查得到该款5G上市时间x和市场占有率Y(单位:%)的几组相关对应数据.如下图的折线图中,横轴1代表2019年8月,2代表2019年9月,……,5代表2019年12月,依据数据得出Y关于x的阅历回归方程为x-.假设用此方程分析并猜测该款市场占有率的变化趋势,那么最早何时该款5G市场占有率能超过0.5%(精确到月)()A.2020年6月 B.2020年7月C.2020年8月 D.2020年9月【解析】选C.依据表中数据,得eq\x\to(x)=eq\f(1+2+3+4+5,5)=3,eq\x\to(y)=eq\f(1,5)(0.02+0.05+0.1+0.15+0.18)=0.1,所以0.1=0.042×3-,=0.026,所以阅历回归方程为x-0.026,x-0.026>0.5,得x≥13,估计上市13个月时,即最早在2020年8月,市场占有率能超过0.5%.3.各地医疗机构针对某种疾病实行了各种的治疗方法,取得了不错的成效,某地开头使用中西医结合方法后,每周治愈的患者人数如表所示:周数(x)12345治愈人数(Y)21736103142由表格可得Y关于x的非线性阅历回归方程为=6x2+a,那么此回归模型第4周的残差(实际值与猜测值之差)为()A.5 B.-13 C.13【解析】eq\x\to(x)2=eq\f(1,5)(1+4+9+16+25)=11,eq\x\to(y)=eq\f(1,5)(2+17+36+103+142)=60,所以a=60-6×11=-6,那么Y关于x的非线性阅历回归方程为=6x2x=4,得=6×42-6=90,所以此回归模型第4周的预报值为90,那么此回归模型第4周的残差为103-90=13.4.x与y之间的几组数据如下表:x123456y021334假设依据上表数据所得线性回归直线方程为=x+,假设某同学依据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y′=b′x+a′,那么以下结论正确的选项是()A.>b′,>a′ B.>b′,<a′C.<b′,>a′ D.<b′,<a′【解析】选C.过(1,0)和(2,2)的直线方程为y′=2x-2,画出六点的散点图,回归直线的也许位置如下图,明显,b′>,>a′.二、多项选择题(每题5分,共10分,全部选对得5分,选对但不全的得2分,有选错的得0分)5.对于回归分析,以下说法正确的选项是()A.在残差图中,纵坐标表示残差B.假设散点图中的一组点全部位于直线=-3x+2的图象上,那么相关系数r=1C.假设残差平方和越小,那么打算系数R2越大D.在回归分析中,变量间的关系假设是非确定关系,那么因变量不能由自变量唯一确定【解析】选ACD.对于A,在残差图中,纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估量值等,所以A正确;对于B,散点图中的一组点全部位于直线=-3x+2的图象上,那么x,y成负相关,且相关关系最强,此时相关系数r=-1,所以B错误;对于C,假设残差平方和越小,那么残差点分布的带状区域的宽度越窄,其相关性越强,打算系数R2越大,所以C正确;对于D,回归分析中,变量间的关系假设是非确定关系,即变量间的关系不是函数关系,因变量不能由自变量唯一确定,所以D正确.6.对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…(xn,yn),那么正确的说法是()A.假设求得的回归方程为x-0.3,那么变量y和x之间具有正的线性相关关系B.假设这组样本数据分别是(1,1),(2,1.5),(4,3),(5,4.5)那么其回归方程=bx+a必过点(3,2.5)C.假设同学甲依据这组数据得到的回归模型1的残差平方和为E1E2=2.1,那么模型1的拟合效果更好D.假设用打算系数R2来刻画回归效果,回归模型3的打算系数Req\o\al(\s\up1(2),\s\do1(3))=0.32,回归模型4的打算系数Req\o\al(\s\up1(2),\s\do1(4))=0.91,那么模型3的拟合效果更好【解析】选ABC.对于A:依据求得的回归方程为x-0.3,中的斜率为正,得出变量y和x之间具有正的线性相关关系;故A正确,对于B:样本中心点在直线上,故B正确,对于C:残差平方和越小的模型,拟合效果越好,故C正确,对于D:打算系数R2用来衡量两个变量之间线性关系的强弱,R2越接近于1,说明相关性越强,相反,相关性越小,因此R2越大拟合效果越好,故D不正确.【加练·固】给出以下四个命题,正确的选项是()A.由样本数据得到的回归方程=x+必过样本点的中心(eq\x\to(x),eq\x\to(y))B.用相关指数R2来刻画回归效果,R2的值越小,说明模型的拟合效果越好C.假设线性回归方程为x,那么变量x每增加1个单位时,yD.在残差图中,残差点分布的带状区域的宽度越窄,残差平方和越小【解析】选ACD.对于A,由样本数据得到的回归方程=x+必过样本点的中心(eq\x\to(x),eq\x\to(y)),命题正确;对于B,用相关指数R2来刻画回归效果,R2的值越大,说明模型的拟合效果越好,命题错误;对于C,在线性回归方程x中,变量x每增加1个单位时,y平均削减2.5个单位,命题正确;对于D,在残差图中,残差点分布的带状区域的宽度越窄,说明模型的拟合精度越高,残差平方和也越小,命题正确.三、填空题(每题5分,共10分)7.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:h)与当天投篮命中率y之间的关系:时间x12345命中率y小李这5天的平均投篮命中率为________;用线性回归分析的方法,猜测小李该月6号打6h篮球的投篮命中率为________.【解析】eq\x\to(y)=eq\f,5)=eq\f,5)=0.5,eq\x\to(x)=eq\f(1+2+3+4+5,5)=3.由公式,得=0.01,从而=eq\x\to(y)-eq\x\to(x)=0.5-0.01×3=0.47.所以回归方程为x.所以当x=6时,=0.47+0.01×6=0.53.答案:8.一组数据确定的回归直线方程为=-x+2且eq\x\to(y)=4,通过残差分析,发觉两个数据(-1.7,2.9),(-2.3,5.1)误差较大,去除这两个数据后,重新求得回归直线的斜率为-1.5,那么当x=-4时,=________.【解析】由样本数据点集{(xi,yi)|i=1,2,…,n},求得的回归直线方程为=-x+2,且eq\x\to(y)=4,所以eq\x\to(x)=-2,故数据的样本中心点为(-2,4),去掉(-1.7,2.9),(-2.3,5.1),重新求得的回归直线的斜率估量值为-1.5,回归直线方程设为:x+a,代入(-2,4),求得a=1,所以回归直线的方程为:x+1,将x=-4代入回归直线方程求得的估量值-1.5×(-4)+1=7.答案:7四、解答题(每题10分,共20分)9.假定小麦根本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下:xy(1)以x为解释变量,y为响应变量,作出散点图;(2)求y与x之间的回归方程,对于根本苗数56.7猜测有效穗;(3)计算各组残差,并计算残差平方和;(4)求R2,并说明残差变量对有效穗的影响占百分之几?【解析】(1)散点图如下.(2)由(1)中散点图看出,样本点大致分布在一条直线的四周,有比拟好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系.设回归方程为=x+.eq\x\to(x)=30.36,eq\x\to(y)=43.5,eq\i\su(i=1,5,x)eq\o\al(\s\up1(2),\s\do1(i))=5101.56,eq\i\su(i=1,5,y)eq\o\al(\s\up1(2),\s\do1(i))=9511.43.eq\x\to(x)eq\x\to(y)=1320.66,eq\x\to(x)2=921.7296,eq\i\su(i=1,5,x)iyi=6746.76.那么=eq\f(\i\su(i=1,5,x)iyi-5\x\to(x)\x\to(y),\i\su(i=1,5,x)eq\o\al(\s\up1(2),\s\do1(i))-5\x\to(x)2)≈0.29,=eq\x\to(y)-eq\x\to(x)≈34.70.故所求的回归直线方程为x+34.70.当x=56.7时,=0.29×56.7+34.70=51.143.估量成熟期有效穗为51.143.(3)由于i=xi+,可以算得i=yi-i分别为1=0.35,2=0.718,3=-0.5,4=-2.214,5=1.624,残差平方和:eq\i\su(i=1,5,)eq\o\al(\s\up1(2),\s\do1(i))≈8.43.(4)eq\i\su(i=1,5,)(yi-eq\x\to(y))2=50.18,故R2=1-eq\f,50.18)≈0.832.所以解释变量小麦根本苗数对总效应约奉献了83.2%,残差变量奉献了约1-83.2%=16.8%.10.菜农定期使用低害杀虫农药对蔬菜进行喷洒,以防止害虫的危害,但采集上市时蔬菜仍存有少量的残留农药,食用时需要用清水清洗洁净,下表是用清水x(单位:千克)清洗该蔬菜1千克后,蔬菜上残留的农药y(单位:微克)的统计表:x12345y5854392910(1)令w=x2,利用给出的参考数据求出y关于w的回归方程=w+.(,精确到0.1)参考数据:=55,(wi-eq\x\to(w))(yi-eq\x\to(y))=-751,(wi-eq\x\to(w))2=374,其中wi=xeq\o\al(\s\up1(2),\s\do1(i)),eq\x\to(w)=eq\f(1,5)i.(2)对于某种残留在蔬菜上的农药,当它的残留量不高于20微克时对人体无害,为了放心食用该蔬菜,请估量至少需要用多少千克的清水清洗1千克蔬菜?(精确到0.1,参考数据eq\r(5)≈2.24)附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线=+u的斜率和截距的最小二乘估量分别为=eq\f(\i\su(i=1,n,)〔ui-\x\to(u)〕〔vi-\x\to(v)〕,\i\su(i=1,n,)〔ui-\x\to(u)〕2),=eq\x\to(v)-eq\x\to(u).【解析】(1)由题意得,eq\x\to(w)=11,eq\x\to(y)=38.=eq\f(\i\su(i=1,5,)〔wi-\x\to(w)〕〔yi-\x\to(y)〕,\i\su(i=1,5,)〔wi-\x\to(w)〕2)=-eq\f(751,374)≈-2.0,=eq\x\to(y)-eq\x\to(w)=60.0,所以w+60.0.(2)由(1)得w+60.0,所以x2+60.0,当x2+60.0≤20,解得x≥2eq\r(5)≈4.5,所以为了放心食用该蔬菜,估量需要用的清水清洗1千克蔬菜.【加练·固】某公司为确定下一年度投入某种产品的宣扬费,需了解年宣扬费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣扬费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中wi=eq\r(,xi),eq\x\to(w)=eq\f(1,8)eq\i\su(i=1,8,w)i.(1)依据散点图推断,y=a+bx与y=c+deq\r(,x)哪一个相宜作为年销售量y关于年宣扬费x的回归方程类型?(给出推断即可,不必说明理由)(2)依据(1)的推断结果及表中数据,建立y关于x的回归方程;(3)这种产品的年利润z与x,y的关系为zy-x.依据(2)的结果答复以下问题:①年宣扬费x=49时,年销售量及年利润的猜测值是多少?②年宣扬费x为何值时,年利润的猜测值最大?附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估量分别为=eq\f(\i\su(i=1,n,)〔ui-\x\to(u)〕〔vi-\x\to(v)〕,\i\su(i=1,n,)〔ui-\x\to(u)〕2),=eq\x\to(v)-eq\x\to(u).【解析】(1)由散点图可以推断,y=c+deq\r(x)相宜作为年销售量y关于年宣扬费x的回归方程类型.(2)令w=eq\r(x),先建立y关于w的线性回归方程.由于=eq\f(\i\su(i=1,8,)〔wi-\x\to(w)〕〔yi-\x\to(y)〕,\i\su(i=1,8,)〔wi-\x\to(w)〕2)=eq\f,1.6)=68,=eq\x\to(y)-eq\x\to(w)=563-68×6.8=100.6,所以y关于w的线性回归方程为=100.6+68w,因此y关于x的回归方程为=100.6+68eq\r(,x).(3)①由(2)知,当x=49时,年销售量y的预报值=100.6+68eq\r(,49)=576.6,年利润z的猜测值=576.6×0.2-49=66.32.②依据(2)的结果知,年利润z的猜测值=0.2(100.6+68eq\r(,x))-x=-xeq\r(,x)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 海南职业技术学院《品牌管理》2023-2024学年第一学期期末试卷
- 海南政法职业学院《小学语文教学设计与技能训练》2023-2024学年第一学期期末试卷
- 2025年度网络安全技术研发软件开发人员保密及保密协议2篇
- 二零二五年度新型水暖材料研发与应用合同模板3篇
- 海南体育职业技术学院《机械工程基础Ⅱ》2023-2024学年第一学期期末试卷
- 二零二五年度房地产沙盘模型制作与物联网技术应用合同3篇
- 二零二五年度卷闸门安全性能检测与认证合同3篇
- 语句排序题课程设计
- 蜗轮减速器 课程设计
- 二零二五年度景区旅游商品开发与销售合作协议3篇
- DB11T 808-2020市政基础设施工程资料管理规程
- 压铸机结构及原理2
- GB/T 29663-2013化妆品中苏丹红Ⅰ、Ⅱ、Ⅲ、Ⅳ的测定高效液相色谱法
- GA 1205-2014灭火毯
- 个人扫描的吴玉生楷书7000字
- 医院污水处理工程施工组织设计
- 闸板防喷器使用手册 精品
- 欢迎新同学幼儿园中小学开学第一课入学准备ppt
- 金手指外观检验重点标准
- 高级财务管理(第2版)-教学大纲
- 档案保护技术概论期末复习资料教材
评论
0/150
提交评论