考点45 变量间的相关关系-备战2020年高考数学(理)考点一遍过_20210103224733_第1页
考点45 变量间的相关关系-备战2020年高考数学(理)考点一遍过_20210103224733_第2页
考点45 变量间的相关关系-备战2020年高考数学(理)考点一遍过_20210103224733_第3页
考点45 变量间的相关关系-备战2020年高考数学(理)考点一遍过_20210103224733_第4页
考点45 变量间的相关关系-备战2020年高考数学(理)考点一遍过_20210103224733_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、考点45 变量间的相关关系变量的相关性(1)会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.(2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.回归分析了解回归分析的基本思想、方法及其简单应用.1相关关系当自变量取值一定时,因变量的取值带有一定的随机性,则这两个变量之间的关系叫做相关关系即相关关系是一种非确定性关系当一个变量的值由小变大时,另一个变量的值也由小变大,则这两个变量正相关;当一个变量的值由小变大时,而另一个变量的值由大变小,则这两个变量负相关.【注意】相关关系与函数关系的异同点:共同点:二者都是指两个变量间的关系不同点:函数关系是一种确

2、定性关系,体现的是因果关系;而相关关系是一种非确定性关系,体现的不一定是因果关系,可能是伴随关系2散点图将样本中的n个数据点描在平面直角坐标系中,所得图形叫做散点图从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点散布在从左上角到右下角的区域内,两个变量的相关关系为负相关具有正相关关系的两个变量的散点图如图1,具有负相关关系的两个变量的散点图如图2.3回归分析如果散点图中点的分布从整体上看大致在一条直线附近,则这两个变量之间具有线性相关关系,这条直线叫做回归直线回归直线对应的方程叫做回归直线方程(简称回归方程)4回归方程的求解(1)求回归方程的方法是最小二乘法

3、,即使得样本数据的点到回归直线的距离的平方和最小若变量x与y具有线性相关关系,有n个样本数据,则回归方程中,.其中,称为样本点的中心(2)线性回归模型,其中称为随机误差,自变量称为解释变量,因变量称为预报变量【注意】回归直线必过样本点的中心,这个结论既是检验所求回归直线方程是否准确的依据,也是求参数的一个依据利用回归直线方程不但可以预测在x取某一个值时,y的估计值,同时也能知道x每增加1个单位,的变化量在回归直线方程中,既表示直线的斜率,又表示自变量x的取值每增加一个单位时,函数y的改变量5相关系数(1)样本相关系数r的计算公式我们可以利用相关系数来定量地衡量两个变量之间的线性相关关系,计算公

4、式为.(2)样本相关系数r的性质;当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关;|r|越接近于1,表明两个变量的线性相关性越强;|r|越接近于0,表明两个变量的线性相关性越弱.6非线性回归分析对某些特殊的非线性关系,可以通过变量转换,把非线性回归问题转化成线性回归问题,然后用线性回归的方法进行研究在大量的实际问题中,所研究的两个变量不一定都呈线性相关关系,当两变量y与x不具有线性相关关系时,要借助散点图,与已学过的函数(如指数函数、对数函数、幂函数等)的图象相比较,找到合适的函数模型,利用变量代换转化为线性函数关系,从而使问题得以解决7刻画回归效果的方式方式方法计

5、算公式刻画效果越接近于1,表示回归的效果越好残差图称为相应于点的残差,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,其中这样的带状区域的宽度越窄,说明模型拟合精确度越高.残差平方和残差平方和越小,模型的拟合效果越好考向一 相关关系的判断判定两个变量正、负相关性的方法:(1)画散点图:若点的分布从左下角到右上角,则两个变量正相关;若点的分布从左上角到右下角,则两个变量负相关;(2)相关系数:r>0时,正相关;r<0时,负相关;(3)线性回归方程中:时,正相关;时,负相关典例1 给出下列有关线性回归分析的四个命题:线性回归直线未必过样本数据点的中心;回归直线就是散点图中

6、经过样本数据点最多的那条直线;当相关系数时,两个变量正相关;如果两个变量的相关性越强,则相关系数就越接近于.其中真命题的个数为abcd【答案】a【解析】对于,线性回归直线一定过样本数据点的中心,故错误;对于,回归直线在散点图中可能不经过任何一个样本数据点,故错误;对于,当相关系数时,两个变量正相关,故正确;对于,如果两个变量的相关性越强,则相关性系数就越接近于或,故错误.故真命题的个数为1,故选a.1已知变量x和y满足关系y0.1x1,变量y与z正相关下列结论中正确的是ax与y正相关,x与z负相关 bx与y正相关,x与z正相关cx与y负相关,x与z负相关 dx与y负相关,x与z正相关2变量x与

7、y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量u与v相对应的一组数据为(10,5),(11.3,4)(11.8,3),(12.5,2),(13,1),r1表示变量y与x之间的线性相关系数,r2表示变量v与u之间的线性相关系数,则ar2<r1<0b0<r2<r1cr2<0<r1dr2=r1考向二 线性回归方程及应用求回归直线方程的一般步骤:(1)作出散点图,依据问题所给的数据在平面直角坐标系中描点,观察点的分布是否呈条状分布,即是否在一条直线附近,从而判断两变量是否具有线性相关关系(2)当两变量具有线

8、性相关关系时,求回归系数,写出回归直线方程(3)根据方程进行估计.典例2 某车间加工的零件数与加工时间的统计数据如下表:零件数(个)102030加工时间(分钟)213039现已求得上表数据的回归方程中的值为,则据此回归模型可以预测,加工个零件所需要的加工时间约为a分钟b分钟c分钟d分钟【答案】c 【解析】因为,又回归直线恒过样本点的中心,且知值为,所以,所以回归直线方程为,从而当时,由此可以预测,加工个零件所需要的加工时间约为分钟,故选c.典例3 一商场对每天进店人数和商品销售件数进行了统计对比,得到如下表格:(1)在给定的坐标系中画出表中数据的散点图,并由散点图判断销售件数y与进店人数x是否

9、线性相关?(给出判断即可,不必说明理由)(2)建立y关于x的回归方程(系数精确到0.01),并预测进店人数为80时,商品销售的件数(结果保留整数).参考数据:x=25,y=15.43,7x2=4375,7xy=2700,.参考公式:回归方程y=bx+a,其中,.【解析】(1)散点图如图所示:由散点图可以判断,商品件数y与进店人数x线性相关.(2)因为,所以,.所以回归方程为y=0.78x-4.07,当x=80时,y=0.78×80-4.0758.所以预测进店人数为80时,商品销售的件数为58.3已知的取值如下表,从散点图知,线性相关,且,则下列说法正确的是12341.41.82.43

10、.2a回归直线一定过点b每增加1个单位,就增加1个单位c当时,的预报值为3.7d每增加1个单位,就增加0.7个单位4某学习小组在研究性学习中,对昼夜温差大小与绿豆种子一天内出芽数之间的关系进行研究,该小组在4月份记录了1日至6日每天昼夜最高、最低温度(如图1),以及浸泡的100颗绿豆种子当天内的出芽数(如图2).根据上述数据作出散点图,可知绿豆种子出芽数(颗)和温差具有线性相关关系.(1)求绿豆种子出芽数(颗)关于温差的回归方程;(2)假如4月1日至7日的日温差的平均值为11,估计4月7日浸泡的10000颗绿豆种子一天内的出芽数.附:.考向三 非线性回归方程及应用求非线性回归方程的步骤:1确定

11、变量,作出散点图2根据散点图,选择恰当的拟合函数3变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程4分析拟合效果:通过计算相关指数或画残差图来判断拟合效果5根据相应的变换,写出非线性回归方程典例4 噪声污染已经成为影响人们身体健康和生活质量的严重问题,为了了解声音强度(单位:分贝)与声音能量i(单位:)之间的关系,将测量得到的声音强度和声音能量(=1,2,10)数据作了初步处理,得到如图散点图及一些统计量的值.45.70.515.1表中,.(1)根据散点图判断,与哪一个适宜作为声音强度关于声音能量i的回归方程类型?(给出判断即可,不必说明理由)(2)根据表中数据,求

12、声音强度关于声音能量i的回归方程;(3)当声音强度大于60分贝时属于噪音,会产生噪音污染,城市中某点共受到两个声源的影响,这两个声源的声音能量分别是和,且.已知点的声音能量等于声音能量与之和,请根据(1)中的回归方程,判断点是否受到噪音污染的干扰,并说明理由.附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:.【解析】(1)根据散点图,可知更适合.(2)令,先建立关于的线性回归方程.,关于的线性回归方程是,即关于i的回归方程是.(3)点的声音能量,根据(2)中的回归方程,点的声音强度的预报值,点会受到噪音污染的干扰.5近期,某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了

13、一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x表示活动推出的天数,y表示每天使用扫码支付的人次(单位:十人次),统计数据如下表所示:根据以上数据,绘制了如图所示的散点图(1)根据散点图判断,在推广期内,y=a+bx与y=cdx(c,d均为大于零的常数)哪一个适宜作为扫码支付的人次y关于活动推出天数x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中的数据,求y关于x的回归方程,并预测活动推出第8天使用扫码支付的人次.参考数据:其中.参考公式:对于一组数据u1,1,u2,

14、2,un,n,其回归直线=a+u的斜率和截距的最小二乘估计公式分别为:.1已知变量x,y之间具有线性相关关系,其散点图如图所示,回归直线l的方程为x,则下列说法正确的是a>0,<0 b>0,>0c<0,<0 d<0,>02下列说法错误的是a相关关系是一种非确定性关系b线性回归方程对应的直线,至少经过其样本数据点中的一个点c在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高d在回归分析中,为的模型比为的模型拟合的效果好3在一组样本数据不全相等)的散点图中,若所有样本点都在直线上,则这组样本数据的样本相关系数为a1 b0c d14已知

15、5个学生的数学和英语成绩如下表:学生abcde数学8075706560英语7066686462则数学与英语成绩之间a是函数关系b是相关关系,但相关性很弱c具有较好的相关关系,且是正相关d具有较好的相关关系,且是负相关5已知变量x与y负相关,且由观测数据算得样本平均数x=4,y=5.6,则由该观测的数据算得的线性回归方程可能是ay=0.4x+4 by=1.2x+0.7cy=-0.6x+8 dy=-0.7x+8.26某考察团对全国10大城市的职工人均工资与居民人均消费进行统计调查,与具有相关关系,回归方程为(单位:千元),若某城市居民消费水平为千元,估计该城市消费额占人均工资收入的百分比约为abc

16、d7在2019年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价元和销售量件之间的一组数据如下表所示:价格元99.510.511销售量件11865由散点图可知,销售量与价格之间有较强的线性相关关系,其线性回归方程是,且,则其中的a10b11c12d10.58某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响对近8年的年宣传费xi和年销售量yii=1,2,.,8数据作了初步处理,得到下面的散点图及一些统计量的值有下列5个曲线类型:;y=p+qlnx;y=k1+ek2x;y=

17、c1x2+c2,则较适宜作为年销售量y关于年宣传费x的回归方程的是a bc d9下列四个结论:在回归分析模型中,残差平方和越大,说明模型的拟合效果越好;某学校有男教师60名、女教师40名,为了解教师的体育爱好情况,在全体教师中抽取20名调查,则宜采用的抽样方法是分层抽样;线性相关系数越大,两个变量的线性相关性越弱;反之,线性相关性越强;在回归方程中,当解释变量每增加一个单位时,预报变量增加0.5个单位.其中正确的结论是abcd10经统计,用于数学学习的时间(单位:小时)与成绩(单位:分)近似于线性相关关系对某小组学生每周用于数学的学习时间x与数学成绩y进行数据收集如下表:x1516181922

18、y10298115115120由表中样本数据求得回归方程为,则点与直线x18y=100的位置关系是abcd与的大小无法确定11以模型去拟合一组数据时,为了求出回归方程,设,其变换后得到线性回归方程,则ab cd12千年潮未落,风起再扬帆,为实现“两个一百年”奋斗目标、实现中华民族伟大复兴的中国梦奠定坚实基础,某校积极响应国家号召,不断加大拔尖人才的培养力度,据不完全统计:年份(届)2014201520162017学科竞赛获省级一等奖及以上的学生人数x51495557被清华、北大等世界名校录取的学生人数y10396108107根据上表可得回归方程x中的为1.35,该校2018届同学在学科竞赛中获

19、省级一等奖及以上的学生人数为63,据此模型预测该校今年被清华、北大等世界名校录取的学生人数为a111 b117c118 d12313由身高(cm)预报体重(kg)满足y0.849x85.712,若要找到41.638 kg的人,_是在150 cm的人群中(填“一定”或“不一定”)14已知方程是根据女大学生的身高预报她的体重的回归方程,其中x的单位是cm,的单位是kg,那么针对某个体(160,53)的残差是_15已知一组数据确定的回归直线方程为y=-1.5x+1,且y=4,发现两组数据(-1,7,2.9),(-2.3,5,1)误差较大,去掉这两组数据后,重新求得回归直线的斜率为-1,当x=-3时,

20、y=_.16在一组样本数据(x1,y1),(x2,y2),(x6,y6)的散点图中,若所有样本点(xi,yi)(i1,2,6)都在曲线ybx2附近波动经计算11,13,21,则实数b的值为_17下表是某学生在4月份开始进人冲刺复习至高考前的5次大型联考数学成绩(分).(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程;若在4月份开始进入冲刺复习前,该生的数学分数最好为116分,并以此作为初始分数,利用上述回归方程预测高考的数学成绩,并以预测高考成绩作为最终成绩,求该生4月份后复习提高率.(复习提高率=净提高分卷面总分×100%,分数取整数

21、)附:回归直线的斜率和截距的最小二乘估计公式分别为,a=y-bx.18某电视厂家准备在五一举行促销活动,现在根据近七年的广告费与销售量的数据确定此次广告费支出广告费支出x(万元)和销售量y(万台)的数据如下:(1)若用线性回归模型拟合y与x的关系,求出y关于x的线性回归方程(其中;参考方程:回归直线,)(2)若用模型拟合y与x的关系,可得回归方程,经计算线性回归模型和该模型的分别约为0.75和0.88,请用说明选择哪个回归模型更好;(3)已知利润z与x,y的关系为z200yx根据(2)的结果回答:当广告费x20时,销售量及利润的预报值是多少?(精确到0.01)参考数据:.19二手车经销商小王对

22、其所经营的a型号二手汽车的使用年数x(单位年)与销售价格y(单位:万元辆)进行整理,得到如下数据:下面是z关于x的折线图.(1)由折线图可以看出,可以用线性回归模型拟合z与x的关系,求z关于x的回归方程,并预测当某辆a型号二手车使用年数为9年时售价约为多少?(b,a小数点后保留两位有效数字)(2)基于成本的考虑,该型号二手车的售价不得低于7118元,请根据(1)求出的回归方程预测在收购该型号二手车时车辆的使用年数不得超过多少年?参考公式:回归方程中斜率和截距的最小二乘估计公式分别为:,. 参考数据:.20某商场营销人员进行某商品的市场营销调查时发现,每回馈消费者一定的点数,该商品每天的销量就会

23、发生一定的变化,经过试点统计得到下表:反馈点数t(百分比)12345销量(千件)/天0.50.611.41.7(1)经分析发现,可用线性回归模型拟合当地该商品销量(千件)与返还点数之间的相关关系,试预测若返回6个点时该商品每天的销量;(2)若节日期间营销部对商品进行新一轮调整.已知某地拟购买该商品的消费群体十分庞大,经营销调研机构对其中的200名消费者的返点数额的心理预期值进行了一个抽样调查,得到如下一份频数表:返还点数预期值区间(百分比)1,3)3,5)5,7)7,9)9,11)11,13)频数206060302010将对返点点数的心理预期值在和的消费者分别定义为“欲望紧缩型”消费者和“欲望

24、膨胀型”消费者,现采用分层抽样的方法从位于这两个区间的30名消费者中随机抽取6名,再从这6人中随机抽取3名进行跟踪调查,求抽出的3人中至少有1名“欲望膨胀型”消费者的概率.21中华人民共和国道路交通安全法第47条的相关规定:机动车行经人行横道时,应当减速慢行;遇行人正在通过人行横道,应当停车让行,俗称“礼让斑马线”,中华人民共和国道路交通安全法第90条规定:对不礼让行人的驾驶员处以扣3分,罚款50元的处罚下表是某市一主干路口监控设备所抓拍的5个月内驾驶员不“礼让斑马线”行为统计数据:月份12345违章驾驶员人数1201051009085(1)请利用所给数据求违章人数与月份之间的回归直线方程,并

25、预测该路口7月份不“礼让斑马线”的违章驾驶员的人数;(2)交警从这5个月内通过该路口的驾驶员中随机抽查了50人,调查驾驶员不“礼让斑马线”行为与驾龄的关系,得到如下列联表:不礼让斑马线礼让斑马线合计驾龄不超过1年22830驾龄1年以上81220合计302050能否据此判断有97.5%的把握认为“礼让斑马线”的行为与驾龄有关?参考公式:在回归直线方程中,参考公式:(其中).临界值表:0.1500.1000.0500.0250.0100.0050.0012.0722.7063.8415.0246.6357.87910.82822为了缓解日益拥堵的交通状况,不少城市实施车牌竞价策略,以控制车辆数量某

26、地车牌竞价的基本规则是:“盲拍”,即所有参与竞拍的人都要网络报价一次,每个人不知晓其他人的报价,也不知道参与当期竞拍的总人数;竞价时间截止后,系统根据当期车牌配额,按照竞拍人的出价从高到低分配名额某人拟参加2018年5月份的车牌竞拍,他为了预测最低成交价,根据竞拍网站的数据,统计了最近5个月参与竞拍的人数(见下表):(1)由收集数据的散点图发现,可用线性回归模型拟合竞拍人数y(万人)与月份编号t之间的相关关系请用最小二乘法求y关于t的线性回归方程:y=bt+a,并预测2018年5月份参与竞拍的人数(2)某市场调研机构从拟参加2018年5月份车牌竞拍人员中,随机抽取了200人,对他们的拟报价价格

27、进行了调查,得到如下频数分布表和频率分布直方图:(i)求a、b的值及这200位竟拍人员中报价大于5万元的人数;(ii)若2018年5月份车牌配额数量为3000,假设竞拍报价在各区间分布是均匀的,请你根据以上抽样的数据信息,预测(需说明理由)竞拍的最低成交价参考公式及数据:y=bx+a,其中;.23为利于分层教学,某学校根据学生的情况分成了a,b,c三类,经过一段时间的学习后在三类学生中分别随机抽取了1个学生的5次考试成绩,其统计表如下:a类第x次12345分数y(满分150)145839572110,;b类第x次12345分数y(满分150)85939076101,;c类第x次12345分数y

28、(满分150)8592101100112,;(1)经计算已知a,b类学生成绩的相关系数分别为,请计算出c类学生成绩的相关系数,并通过数据的分析回答抽到的哪类学生学习成绩最稳定;(结果保留两位有效数字,越大认为成绩越稳定)(2)利用(1)中成绩最稳定的学生的样本数据,已知线性回归直线方程为,利用线性回归直线方程预测该生第十次的成绩附:相关系数,线性回归直线方程中,24某互联网公司为了确定下一季度的前期广告投入计划,收集了近6个月广告投入量x(单位:万元)和收益y(单位:万元)的数据如下表:月份123456广告投入量/万元24681012收益/万元14.2120.3131.831.1837.834

29、4.67他们用两种模型:ybxa,yaebx分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值: 7301464.24364(1)根据残差图,比较模型,的拟合效果,应选择哪个模型?并说明理由(2)残差绝对值大于2的数据被认为是异常数据,需要剔除;()剔除异常数据后,求出(1)中所选模型的回归方程;()广告投入量x18时,(1)中所选模型收益的预报值是多少?附:对于一组数据(x1,y1),(x2,y2),(xn,yn),其回归直线x的斜率和截距的最小二乘估计分别为,.25“爱国,是人世间最深层、最持久的情感,是一个人立德之源、立功之本.”在中华民族几千年绵延发展

30、的历史长河中,爱国主义始终是激昂的主旋律.爱国汽车公司拟对“东方红”款高端汽车发动机进行科技改造,根据市场调研与模拟,得到科技改造投入x(亿元)与科技改造直接收益y(亿元)的数据统计如下:x2346810132122232425y1322314250565868.56867.56666当0<x17时,建立了y与x的两个回归模型:模型:y=4.1x+11.8;模型:y=21.3x-14.4;当x>17时,确定y与x满足的线性回归方程为:y=-0.7x+a.(1)根据下列表格中的数据,比较当0<x17时模型、的相关指数r2,并选择拟合精度更高、更可靠的模型,预测对“东方红”款汽车

31、发动机科技改造的投入为17亿元时的直接收益.回归模型模型模型回归方程y=4.1x+11.8y=21.3x-14.4i=17(yi-yi)2182.479.2(附:刻画回归效果的相关指数,174.1.)(2)为鼓励科技创新,当科技改造的投入不少于20亿元时,国家给予公司补贴收益10亿元,以回归方程为预测依据,比较科技改造投入17亿元与20亿元时公司实际收益的大小;(附:用最小二乘法求线性回归方程的系数公式,)(3)科技改造后,“东方红”款汽车发动机的热效率x大幅提高,x服从正态分布n(0.52,0.012),公司对科技改造团队的奖励方案如下:若发动机的热效率不超过50%,不予奖励;若发动机的热效

32、率超过50%但不超过53%,每台发动机奖励2万元;若发动机的热效率超过53%,每台发动机奖励5万元.求每台发动机获得奖励的数学期望.(附:随机变量服从正态分布n(,2),则p-<<+=0.6826,p-2<<+2=0.9544.)1(2017山东理科)为了研究某班学生的脚长(单位:厘米)和身高(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出与之间有线性相关关系,设其回归直线方程为已知,该班某学生的脚长为24,据此估计其身高为a b c d2(2015新课标全国理科)根据下面给出的年至年我国二氧化硫排放量(单位:万吨)柱形图.以下结论不正确的是

33、a逐年比较,年减少二氧化硫排放量的效果最显著b年我国治理二氧化硫排放显现c年以来我国二氧化硫年排放量呈减少趋势d年以来我国二氧化硫年排放量与年份正相关3(2015福建理科)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入(万元)8.28.610.011.311.9支出(万元)6.27.58.08.59.8根据上表可得回归直线方程,其中,据此估计,该社区一户年收入为万元家庭的年支出为a万元 b万元 c万元 d万元4(2014重庆理科)已知变量与正相关,且由观测数据算得样本平均数,则由该观测数据算得的线性回归方程可能是a bc d5(2014湖北理科)

34、 根据如下样本数据:3456784.02.50.5得到的回归方程为,则a, b, c, d, 6(2018新课标全国理科)下图是某地区2000年至2016年环境基础设施投资额(单位:亿元)的折线图为了预测该地区2018年的环境基础设施投资额,建立了与时间变量的两个线性回归模型根据2000年至2016年的数据(时间变量的值依次为)建立模型:;根据2010年至2016年的数据(时间变量的值依次为)建立模型:(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由7(2016新课标全国理科)下图是我国2008年至2014年生活垃圾

35、无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:,.参考公式:相关系数 回归方程中斜率和截距的最小二乘估计公式分别为:8(2015新课标全国理科)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的宣传费和年销售量数据作了初步处理,得到下面的散点图及一些统计量的值.46.65636.8289.81.61469108.8表中=,.(1)根据散

36、点图判断,与哪一个适宜作为年销售量y关于年宣传费x的回归方程类型(给出判断即可,不必说明理由);(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为,根据(2)的结果回答下列问题:年宣传费时,年销售量及年利润的预报值是多少?年宣传费为何值时,年利润的预报值最大?附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:,.变式拓展1【答案】c【解析】因为y0.1x1的斜率小于0,故x与y负相关因为y与z正相关,所以可设zy,>0,则zy0.1x,故x与z负相关2【答案】c【解析】根据题中提供的数据,变量y随x的增大而增大,故y与x

37、正相关,即r1>0;变量v随u的增大而减小,故v与u负相关,即r2<0,故r2<0<r1.3【答案】c【解析】由已知得,故a错误;由回归直线恒过样本中心点(2.5,2.2),得,解得0.7回归直线方程为x每增加1个单位,y就增加0.6个单位,故b,d错误;当x5时,y的预测值为3.7,故c正确.故选c4【解析】(1)依照最高(低)温度折线图和出芽数条形图可得如下数据表:日期日日日日日日温差出芽数故,所以,则,所以,绿豆种子出芽数(颗)关于温差的回归方程为;(2)因为月1日至日温差的平均值为,所以月日的温差,所以,所以,月日浸泡的颗绿豆种子一天内的出芽数约为颗.5【解析】

38、(1)根据散点图判断,y=cdx适宜作为扫码支付的人数y关于活动推出天数x的回归方程类型. (2)y=cdx,两边同时取常用对数得.设,v=lgc+xlgd.x=4,v=1.54, 把样本点的中心 (4,1.54)代入v=lgc+xlgd,得,v=0.54+0.25x, 则y关于x的回归方程为y=100.54+0.25x=100.54×(100.25)x=3.47×100.25x. 把x=8代入上式,得y=3.47×102=347.故活动推出第8天使用扫码支付的人次为347.考点冲关1【答案】d【解析】由题图可知,回归直线的斜率是正数,即>0;回归直线在y轴

39、上的截距是负数,即<0,故选d2【答案】b【解析】对于选项a,相关关系是一种非确定的关系,而函数关系是一种确定的关系,a选项正确;对于选项b,回归直线过样本数据的中心,并不一定过样本数据中的某一个点,b选项错误;对于c选项,在残差图中,残差点分布的带状区域的宽度越狭窄,说明数据越逼近回归直线,两个变量的相关关系越强,其拟合精确度越高,c选项正确;对于d选项而言,越大,其拟合效果越好,d选项正确.故选b3【答案】d【解析】所有样本点均在直线上,则样本相关系数最大,即为1.4【答案】c【解析】画出散点图,通过散点图进行判断.设数学成绩和英语成绩分别为x,y,画出散点图,如图,从图上可以看出数

40、学成绩和英语成绩具有较好的相关关系,且是正相关.故选c5【答案】c【解析】因为变量x与y负相关,所以b<0 ,排除a、b选项;因为x=4,y=5.6,代入检验即可得到c正确.所以选c.6【答案】d 【解析】由题意知,代入回归方程得,所以该城市消费额占人均工资收入的百分比约为,故选d.7【答案】a【解析】由题意,可得,又由回归直线方程,得,即,又因为,解得,故选a8【答案】b【解析】从散点图知,样本点分布在开口向右的抛物线(上支)附近或对数曲线(上部分)的附近,所以ycx+d或ypqlnx较适宜,故选b.9【答案】d【解析】根据残差的意义,可知当残差的平方和越小,模拟效果越好,所以错误;当

41、个体差异明显时,选用分层抽样法抽样,所以正确;根据线性相关系数特征,当相关系数越大,两个变量的线性相关性越强,所以错误;根据回归方程的系数为0.5,可知当解释变量每增加一个单位时,预报变量增加0.5个单位.综上,正确,故选d10【答案】b【解析】(1516181922)×18,(10298115115120)×110,所以样本点的中心为(18,110),所以有,即点满足110>100.11【答案】d 【解析】因为,所以两边同时取对数得,设,得,又因为变换后得到线性回归方程,所以,解得.12【答案】b【解析】因为53,103.5,所以103.51.35×533

42、1.95,所以回归直线方程为1.35x31.95.当x63时,代入解得117,故选b13【答案】不一定【解析】由回归分析可知,体重为41.638kg的人的身高多数在150cm左右故答案为:不一定.14【答案】【解析】把代入,得,所以残差.15【答案】5【解析】一组数据确定的回归直线方程为y=-1.5x+1,且y=4,y=-1.5x+1=4,解得x=-2,原样本点的中心为(-2,4)由题意得去掉数据-1,7,2.9,(-2.3,5,1)后新数据的样本点的中心为(-2,4),重新求得的回归直线的斜率估计值为-1,可设新的回归直线方程为y=-x+a,将点(-2,4)代入上式后得4=2+a,解得a=2

43、,新的回归直线的方程为y=-x+2,将x=-3代入回归直线方程求得y=3+2=516【答案】【解析】令tx2,则曲线的回归方程变为线性的回归方程,即ybt,此时,代入ybt,得b×,解得b.17【解析】(1)散点图如图:(2)计算得x=1+2+3+4+55=3,y= 117+127+125+134+1425=129,5x2=5×32=45,所以b=1992-193555-45=5710=5.7,a=129-5.7×3=111.9,故y关于x的线性回归方程为y=5.7x+111.9.由上述回归方程可得高考应该是第六次考试,故x=6,则y=5.7×6+111

44、.9 =146.1146(分),故净提高分为146-116=30(分),所以该生的复习提高率为30150×100%=20%.18【解析】(1)由题意有,则,y关于x的线性回归方程为;(2)r2越接近于1,模型的拟合效果越好,故选用;(3)广告费x20时,销售量预报值(万台),故利润的预报值(万元)19【解析】(1)由题意,计算得x=16×2+3+4+5+6+7=4.5,z=16×3+2.48+2.08+1.86+1.48+1.10=2,且,计算得 ,a=z-bx=2+0.36×4.5=3.62,z关于x的线性回归方程是z=-0.36x+3.62, 又z=

45、lny,y关于x的回归方程是y=e-0.36x+3.62.令x=9,解得y=e-0.36×9+3.621.46,即预测当某辆a型号二手车使用年数为9年时,售价约1.46万元 (2)当y0.7118时,e-0.36x+3.620.7118=eln0.7118=e-0.34,-0.36x+3.62-0.34,解得x11,因此预测在收购该型号二手车时,车辆的使用年数不得超过11年20【解析】(1)易知,所以1.04=+0.08, 所以.则y关于t的线性回归方程为,当时,即返回6个点时该商品每天销量约为2千件. (2)设从“欲望膨胀型”消费者中抽取x人,从“欲望紧缩型”消费者中抽取y人,由分

46、层抽样的定义可知,解得,在抽取的6人中,2名“欲望膨胀型”消费者分别记为,4名“欲望紧缩型”消费者分别记为,则所有的抽样情况共20种,其中至少有1名“欲望膨胀型”消费者的情况有16种,记事件a为“抽出的3人中至少有1名欲望膨胀型消费者”,则.21【解析】(1)利用所给数据,计算得×(1+2+3+4+5)3,×(120+105+100+90+85)100,则=,100(8.5)×3125.5,与之间的回归直线方程为,当时,即预测该路口7月份不“礼让斑马线”的违章驾驶员有66人.(2)由列联表中数据,计算得,由此能判断有97.5%的把握认为“礼让斑马线”的行为与驾龄有

47、关22【解析】(1)易知, 计算得 , 则a=y-bt=1.04-0.32×3=0.08,则y关于t的线性回归方程为y=0.32t+0.08, 当t=6时,y=2.00,即2018年5月份参与竞拍的人数估计为2万人.(2)(i)由a200=0.20,解得a=40.由频率和为1,得0.05×2+0.10+2c+0.20+0.30×1=1,解得b=0.15, 则200位竞拍人员报价大于5万元的人数为0.05+0.10+0.15×200=60.(ii)2018年5月份实际发放车牌数量为3000,根据竞价规则,报价在最低成交价以上人数占总人数比例为.又由频率分布

48、直方图知竞拍报价大于6万元的频率为0.05+0.10=0.15,所以根据统计思想(样本估计总体)可预测2018年5月份竞拍的最低成交价为6万元.23【解析】(1)根据所给数据,可得对于c类学生:,则,所以,又,则从c类学生抽到的学生的成绩最稳定.(2)由(1)知,所以,所以当时,所以预测第10次的成绩为分24【解析】(1)应该选择模型,因为模型的残差点比较均匀地落在水平的带状区域中,且模型的带状区域比模型的带状区域窄,所以模型的拟合精度高,回归方程的预报精度高(2)()剔除异常数据,即3月份的数据后,得×(7×66)7.2,×(30×631.8)29.6

49、4.1464.246×31.81273.44,36462328.则,29.643×7.28.04.所以y关于x的回归方程为3x8.04.()把x18代入()中所求回归方程,得3×188.0462.04,故预报值为62.04万元25【解析】(1)由表格中的数据,有182.4>79.2,即,所以模型的r2小于模型,说明回归模型刻画的拟合效果更好.所以当x=17亿元时,科技改造直接收益的预测值为y=21.3×17-14.4=21.3×4.1-14.4=72.93(亿元).(2)由已知可得:x-20=1+2+3+4+55=3,所以x=23.y-60=8.5+8+7.5+6+65=7.2,所以y=67.2.所以=y+0.7x=67.2+0.7×23=83.3.所以当x>17亿元时,y与x满足的线性回归方程为:y=-0.7x+83.3.所

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论