版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
PAGE十七一元线性回归模型及其应用(25分钟50分)一、选择题(每小题5分,共30分)1.若冬季昼夜温差x(单位:℃)与某新品种反季节大豆的发芽数量y(单位:颗)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,3,…,n),用最小二乘法近似得到回归直线方程为y=2.5x-3,则下列结论中不正确的是 ()A.y与x具有正相关关系B.回归直线过点(x,y)C.若冬季昼夜温差增加1℃,则该新品种反季节大豆的发芽数约增加2.5颗D.若冬季昼夜温差的大小为10℃,则该新品种反季节大豆的发芽数一定是22颗【解析】选D.因为回归直线的斜率为2.5,所以y与x具有正相关关系,则A正确;回归直线过点样本中心点(x,y),则B正确;冬季昼夜温差增加1℃,则该新品种反季节大豆的发芽数约增加2.5颗,所以C正确;若冬季昼夜温差的大小为10℃,则可估计该新品种反季节大豆的发芽数为22颗,但不可确定,所以D错误.2.在生物学上,有隔代遗传的现象.已知某数学老师的体重为62kg,他的曾祖父、祖父、父亲、儿子的体重分别为58kg、64kg、58kg、60kg.如果体重是隔代遗传,且呈线性相关,根据以上数据可得解释变量x与响应变量的回归方程为=x+,其中=0.5,据此模型预测他的孙子的体重约为 ()A.58kg B.61kg C.65kg D.68kg【解析】选B.由于体重是隔代遗传,且呈线性相关,则取数据(58,58),(64,62),(58,60),得x=58+64+583=60,y=58+62+60即样本点的中心为(60,60),代入=x+,得=60-0.5×60=30,则=0.5x+30,取x=62,可得=0.5×62+30=61kg.故预测他的孙子的体重约为61kg.3.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据成对样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的经验回归方程为=0.85x-85.71,则下列结论中不正确的是 ()A.y与x具有正的线性相关关系B.经验回归直线过点(x,y)C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可判定其体重必为58.79kg【解析】选D.当x=170时,=0.85×170-85.71=58.79,体重的估计值为58.79kg.4.对于样本点分布在指数函数曲线y=aebx(其中a,b为待定参数且a>0)周围时,令z=lny,c=lna,经过变换后得到的线性回归方程为 ()A.y=bx+c B.y=cx+bC.z=bx+c D.z=cx+b【解析】选C.因为y=aebx,所以lny=lna+bx,所以z=c+bx.5.用y关于x的方程y=menx来拟合一组数据(xi,yi)(i=1,2,…,10)时为了求出其回归方程,设z=lny,得到z关于x的线性回归方程z=0.6x+1,则 ()A.m=e,n=0.6 B.m=0.6,n=eC.m=1,n=0.6 D.m=0.6,n=1【解析】选A.由题意,y=menx得到z=lny=lnmenx=lnm+nx=0.6x+1,故n=0.6,lnm=1,所以n=0.6,m=e.6.(多选题)研究变量x,Y得到一组样本数据,进行回归分析,以下说法正确的是 ()A.残差平方和越小的模型,拟合的效果越好B.用相关指数R2来刻画回归效果,R2越小说明拟合效果越好C.在回归直线方程=0.2x+0.8中,当解释变量x每增加1个单位时,响应变量平均增加0.2个单位D.若变量Y和x之间的相关系数为r=-0.9462,则变量Y和x之间的负相关性很强【解析】选ACD.A可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,故A正确;B用相关指数R2来刻画回归效果,R2越大说明拟合效果越好,故B错误;C在经验回归方程=0.2x+0.8中,当解释变量x每增加1个单位时,响应变量平均增加0.2个单位,故C正确;D若变量Y和x之间的相关系数为r=-0.9462,r的绝对值趋向于1,则变量Y和x之间的负相关性很强,故D正确.二、填空题(每小题5分,共10分)7.某数学老师身高为176cm,他爷爷、父亲和儿子的身高分别是173cm,170cm和182cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为cm.
【解析】设父亲身高为xcm,儿子身高为Ycm,则x173170176Y170176182x=173,y=176,=0×(-=y-x=176-1×173=3,所以=x+3,当x=182时,=185.答案:1858.已知变量x,Y线性相关,由观测数据算得样本的平均数x=4,y=5,经验回归方程=x+中的系数,满足+=4,则经验回归方程为.
【解析】由题知,点(4,5)在回归直线上,则4+=5,又+=4,所以=113,=13,即经验回归方程为=13x+113答案:=13x+11三、解答题9.(10分)某种产品的广告费用支出x(单位:百万元)与销售额y(单位:百万元)之间有如下的对应数据:x/百万元24568y/百万元3040605070(1)画出散点图;(2)求经验回归方程;(3)试预测广告费用支出为10百万元时,销售额多大.【解析】(1)散点图如图所示:(2)列出下表,并用科学计算器进行有关计算:i12345合计xi2456825yi3040605070250xiyi601603003005601380x416253664145所以x=255=5,y=2505=50,∑i=15xiy所以=∑i=15xiy=y-x=50-6.5×5=17.5.所以所求的经验回归方程为=6.5x+17.5.(3)根据上面求得的经验回归方程,当广告费用支出为10百万元时,=6.5×10+17.5=82.5(百万元),即广告费用支出为10百万元时,销售额大约为82.5百万元.【补偿训练】近年来,随着互联网的发展,“共享汽车”在我国各城市迅猛发展,为人们出行提供了便利,但也给城市交通管理带来了一些困难.为掌握“共享汽车”在M省的发展情况,M省某调查机构从该省抽取了5个城市,分别收集和分析了“共享汽车”的A,B两项指标数xi,yi(i=1,2,3,4,5),数据如下表所示:项目城市1城市2城市3城市4城市5A指标数x46285B指标数y44354经计算得∑i=15(xi-(1)试求y与x间的相关系数r,并利用r说明y与x是否具有较强的线性相关关系(若|r|>0.75,则线性相关程度很高,可用线性回归模型拟合);(2)建立y关于x的回归方程,并预测当A指标数x为7时,B指标数y的估计值.附:相关公式:r=∑i=1n(xi-x)(yi参考数据:0.3≈0.55,0.9【解析】(1)由已知,x=4+6+2+8+55=5,y=4+4+3+5+4所以相关系数r=∑i=15(xi-x)(所以y与x有较强的线性相关关系,可以用线性回归模型拟合y与x的关系;(2)由(1)知=∑i=15(xi-x)(yi-y)故y与x的线性回归方程为=310x+52当x=7时,=310×7+52=4.6(25分钟50分)一、选择题(每小题5分,共20分)1.已知变量x,Y的取值如表:x12345Y1015304550由散点图分析可知Y与x线性相关,且求得经验回归方程为=x-3,据此可预测:当x=8时,的值为 ()A.63 B.74 C.85 D.96【解析】选C.由题得x=1+2+3+4+55y=10+15+30+45+505=30故样本点的中心的坐标为(3,30),代入=x-3,得=30+33=11.所以=11x-3,取x=8,得=11×8-3=85.2.若一函数模型为y=ax2+bx+c(a≠0),将y转化为t的线性回归方程,需做变换t= ()A.x2 B.(x+a)2C.x+b2a2 D.以上都不对【解析】选C.y=ax2+bx+c(a≠0)=ax+b2a2+4ac-b24a,根据线性回归方程是一次函数可知,令t=x+b2a2,则y=at+4ac-3.以模型y=cekx去拟合一组数据时,为了求出经验回归方程,设z=lny,将其变换后得到经验回归直线方程=0.2x+3,则c,k的值分别是 ()A.e2,0.6 B.e2,0.3C.e3,0.2 D.e4,0.6【解析】选C.因为y=cekx,等式两边同时取对数可得lny=ln(cekx)=lnc+lnekx=kx+lnc,设z=lny,则上式可化为z=kx+lnc,因为z=0.2x+3,则k=0.2,lnc=3,所以c=e3,k=0.2.4.(多选题)由相关变量x,y之间的一组数据(xi,yi)(i=1,2,…,10),得到y关于x的线性回归方程为=1.4x+0.8,且x=3,去除两个歧义点(1.2,2.4)和(4.8,7.6)后,得到y关于x的新线性回归方程的回归系数为1.5,则去除这两个歧义点后 ()A.xj(j=1,2,…,8)的平均值变大B.xj(j=1,2,…,8)的平均值不变C.新线性回归方程为=1.5x+0.5D.当x增加1个单位时,y增加1.5个单位【解析】选BC.将x=3代入=1.4x+0.8得y=5,又因为1.2+4.82=3,2.4+7.62=5,故去除两个歧义点(1.2,2.4)和(4.8,7.6)后,其数据的平均值不变,故A错误,B正确;设新线性回归方程为=1.5x+a,将数据中心(3,5)代入得a=0.5,故C正确;故当x增加1个单位时,y平均增加1二、填空题(每小题5分,共20分)5.已知某成对样本数据的残差图如图,则样本点数据中可能不准确的是从左到右第个.
【解析】原始数据中的可疑数据往往是残差绝对值过大的那个数据,即偏离平衡位置过大的数据.答案:66.某公司调查了商品A的广告投入费用x(万元)与销售利润Y(万元)的统计数据,如表:广告费用x(万元)2356销售利润Y(万元)57911由表中的数据得经验回归直线方程为=x+,则当x=7时销售利润y的估值为万元.
【解析】由题表中数据可得x=2+3+5+64=4,y=5+7+9+11所以=∑i=14xiy所以=y-x=8-1.4×4=2.4,故经验回归方程为=1.4x+2.4,所以当x=7时,=1.4×7+2.4=12.2.答案:12.27.在研究两个变量的相关关系时,观察散点图,发现样本点集中于某一条曲线y=ebx+a的周围,令z=lny,求得经验回归方程=0.25x-2.58,则该模型的经验回归方程为.
【解析】由经验回归方程=0.25x-2.58得ln=0.25x-2.58,整理得=e0.25x-2.58,所以该模型的经验回归方程为=e0.25x-2.58.答案:=e0.25x-2.588.已知某产品连续4个月的广告费xi(千元)与销售额yi(万元)(i=1,2,3,4),经过对这些数据的处理,得到如下数据信息:①∑i=14xi=18,∑i=14yi=14;②广告费x和销售额y之间具有较强的线性相关关系;③回归系数=0.8.则广告费平均值为千元,当广告费为6千元时【解析】由题意得,x=184=4.5,y=144=3由y=x+得,=3.5-0.8×4.5=-0.1,所以=0.8x-0.1.当x=6时,=0.8×6-0.1=4.7.答案:4.54.7三、解答题9.(10分)为了落实习主席提出的“绿水青山就是金山银山”的环境治理要求,某市计划自2014年初起开始实施绿化行动.实施绿化的第x年(如2014年对应的x=1),绿化面积为y平方公里,则连续五年x,y之间的数据如下表:x12345y13678(1)已知对于一组数据(x1,y1),(x2,y2),…,(xn,yn),若其拟合直线方程=x+,记Q=∑i=1n(yi-xi-)2,若Q越小则拟合效果越好.若根据表中数据,观察得出的拟合直线方程分别为l1:=2x-1,l2:=32x+12,使用Q判断哪条直线的拟合效果更好;(2)试用(1)中所求的拟合效果较好的直线,估计2024年的绿化面积.【解析】(1)根据直线l1:=2x-1得出的数据列表如表:x12345y13678l1:=2x-113579根据直线l2:=32x+12得出的数据列表如表x12345y13678l2:=32x+123.556.58分别根据表中数据及Q的公式可得,Q1=02+02+12+02+(-1)2=2,Q2=(-1)2+(-0.5)2+12+0.52+02=2.5,因为Q1<Q2,所以直线l1:=2x-1的拟合效果更好.(2)由题意可知,l1:=2x-1,2024年对应的x=11,所以预测绿化面积=2×11-1=21(平方公里).【补偿训练】生物学家预言,21世纪将是细菌发电造福人类的时代.说起细菌发电,可以追溯到1910年,英国植物学家利用铂作为电极放进大肠杆菌的培养液里,成功地制造出世界上第一个细菌电池.然而各种细菌都需在最适生长温度的范围内生长.当外界温度明显高于最适生长温度,细菌被杀死;如果在低于细菌的最低生长温度时,细菌代谢活动受抑制.为了研究某种细菌繁殖的个数Y是否与在一定范围内的温度x有关,现收集了该种细菌的6组观测数据如表:温度x/℃21232427293
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论