《8.2 一元线性回归模型及其应用》考点讲解与专题训练_第1页
《8.2 一元线性回归模型及其应用》考点讲解与专题训练_第2页
《8.2 一元线性回归模型及其应用》考点讲解与专题训练_第3页
《8.2 一元线性回归模型及其应用》考点讲解与专题训练_第4页
《8.2 一元线性回归模型及其应用》考点讲解与专题训练_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《8.2一元线性回归模型及其应用》考点讲解【思维导图】【常见考点】考点一样本中心解小题【例1】某产品在某零售摊位上的零售价(元)与每天的销售量(个)统计如下表:16171819503431据上表可得回归直线方程为,则上表中的的值为()A.38B.39C.40D.41【一隅三反】1.随机变量与的数据如表中所列,其中缺少了一个数值,已知关于的线性回归方程为,则缺少的数值为()2345656▲79A.6B.6.6C.7.5D.82.根据如下样本数据:2345642.5得到的回归方程为,则()A.,B.,C.,D.,3.蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率(每分钟鸣叫的次数)与气温(单位:)存在着较强的线性相关关系.某地观测人员根据下表的观测数据,建立了关于的线性回归方程.(次数/分钟)则当蟋蟀每分钟鸣叫次时,该地当时的气温预报值为()A.B.C.D.考点二一元线性方程【例2】在2020年春节期间,某市物价部门,对本市五个商场销售的某商品一天的销售量及其价格进行调查,五个商场的售价x元和销售量y件之间的一组数据如下表所示:价格x99.51010.511销售量y1110865通过分析,发现销售量y对商品的价格x具有线性相关关系,求(1)销售量y对商品的价格x的回归直线方程;(2)若使销售量为12,则价格应定为多少.附:在回归直线中,【一隅三反】1.配速是马拉松运动中常使用的一个概念,是速度的一种,是指每公里所需要的时间,相比配速,把心率控制在一个合理水平是安全理性跑马拉松的一个重要策略.图1是一个马拉松跑者的心率(单位:次/分钟)和配速(单位:分钟/公里)的散点图,图2是一次马拉松比赛(全程约42公里)前3000名跑者成绩(单位:分钟)的频率分布直方图.(1)由散点图看出,可用线性回归模型拟合与的关系,求与的线性回归方程;(2)该跑者如果参加本次比赛,将心率控制在160左右跑完全程,估计他跑完全程花费的时间,并估计他能获得的名次.参考公式:线性回归方程中,,参考数据:.2.随着电商事业的快速发展,网络购物交易额也快速提升,特别是每年的“双十一”,天猫的交易额数目惊人.2020年天猫公司的工作人员为了迎接天猫“双十一”年度购物狂欢节,加班加点做了大量准备活动,截止2020年11月11日24时,2020年的天猫“双十一”交易额定格在3700多亿元,天猫总公司所有员工对于新的战绩皆大欢喜,同时又对2021年充满了憧憬,因此公司工作人员反思从2014年至2020年每年“双十一”总交易额(取近似值),进行分析统计如下表:年份2014201520162017201820192020年份代码()1234567总交易额(单位:百亿)5.79.112.116.821.326.837(1)通过分析,发现可用线性回归模型拟合总交易额y与年份代码t的关系,请用相关系数加以说明;(2)利用最小二乘法建立y关于t的回归方程(系数精确到0.1),预测2021年天猫“双十一”的总交易额.参考数据:,,;参考公式:相关系数;回归方程中,斜率和截距的最小二乘估计公式分别为:,.3.根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩使用量x(千克)之间的对应数据的散点图,如图所示.(1)依据数据的散点图可以看出,可用线性回归模型拟合y与x的关系,请计算相关系数r并加以说明(若,则线性相关程度很高,可用线性回归模型拟合);(2)求y关于x的回归方程,并预测当液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为多少?附:相关系数公式.参考数据:,.回归方程中斜率和截距的最小二乘估计公式分别为,.考点三非一元线性方程【例3】在一次抽样调查中测得个样本点,得到下表及散点图.(1)根据散点图判断与哪一个适宜作为关于的回归方程;(给出判断即可,不必说明理由)(2)根据(1)的判断结果试建立与的回归方程;(计算结果保留整数)(3)在(2)的条件下,设且,试求的最小值.参考公式:回归方程中,,.【一隅三反】1.某种新产品投放市场一段时间后,经过调研获得了时间x(天数)与销售单价y(元)的一组数据,且做了一定的数据处理(如表),并作出了散点图(如图).表中.(1)根据散点图判断,与哪一个更适合作价格y关于时间x的回归方程类型?(不必说明理由)(2)根据判断结果和表中数据,建立y关于x的回归方程.(3)若该产品的日销售量(件)与时间x的函数关系为,求该产品投放市场第几天的销售额最高?最高为多少元?附:对于一组数据,其回归直线的斜率和截距的最小二乘法估计分别为.2.我国为全面建设社会主义现代化国家,制定了从2021年到2025年的“十四五”规划.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金.现该企业为了了解年研发资金投入额(单位:亿元)对年盈利额(单位:亿元)的影响,研究了“十二五”和“十三五”规划发展期间近10年年研发资金投入额和年盈利额的数据.通过对比分析,建立了两个函数模型:①,②,其中,,,均为常数,为自然对数的底数.令,,经计算得如下数据:262156526805.36112501302.612(1)请从相关系数的角度,分析哪一个模型拟合程度更好?(2)(ⅰ)根据(1)的选择及表中数据,建立关于的回归方程;(系数精确到0.01)(ⅱ)若希望2021年盈利额为250亿元,请预测2021年的研发资金投入额为多少亿元?(结果精确到0.01)附:①相关系数,回归直线中:,②参考数据:,.答案解析考点一样本中心解小题【例1】某产品在某零售摊位上的零售价(元)与每天的销售量(个)统计如下表:16171819503431据上表可得回归直线方程为,则上表中的的值为()A.38B.39C.40D.41【答案】D【解析】由题意,,所以,解得.故选:D.【一隅三反】1.随机变量与的数据如表中所列,其中缺少了一个数值,已知关于的线性回归方程为,则缺少的数值为()2345656▲79A.6B.6.6C.7.5D.8【答案】A【解析】设缺少的数值为,由于回归方程为过样本中心点,且,代入,所以,解得.故选:A.2.根据如下样本数据:2345642.5得到的回归方程为,则()A.,B.,C.,D.,【答案】B【解析】由图表中的数据可得,变量随着的增大而减小,则,,,又回归方程经过点,可得,故选:B.3.蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率(每分钟鸣叫的次数)与气温(单位:)存在着较强的线性相关关系.某地观测人员根据下表的观测数据,建立了关于的线性回归方程.(次数/分钟)则当蟋蟀每分钟鸣叫次时,该地当时的气温预报值为()A.B.C.D.【答案】D【解析】由表格中的数据可得,,由于回归直线过样本中心点,可得,解得.所以,回归直线方程为.在回归直线方程中,令,可得.故选:D.考点二一元线性方程【例2】在2020年春节期间,某市物价部门,对本市五个商场销售的某商品一天的销售量及其价格进行调查,五个商场的售价x元和销售量y件之间的一组数据如下表所示:价格x99.51010.511销售量y1110865通过分析,发现销售量y对商品的价格x具有线性相关关系,求(1)销售量y对商品的价格x的回归直线方程;(2)若使销售量为12,则价格应定为多少.附:在回归直线中,【答案】(1)(2)8.75【解析】(1)由题意知,,,,线性回归方程是;(2)令,可得,预测销售量为12件时的售价是8.75元.【一隅三反】1.配速是马拉松运动中常使用的一个概念,是速度的一种,是指每公里所需要的时间,相比配速,把心率控制在一个合理水平是安全理性跑马拉松的一个重要策略.图1是一个马拉松跑者的心率(单位:次/分钟)和配速(单位:分钟/公里)的散点图,图2是一次马拉松比赛(全程约42公里)前3000名跑者成绩(单位:分钟)的频率分布直方图.(1)由散点图看出,可用线性回归模型拟合与的关系,求与的线性回归方程;(2)该跑者如果参加本次比赛,将心率控制在160左右跑完全程,估计他跑完全程花费的时间,并估计他能获得的名次.参考公式:线性回归方程中,,参考数据:.【答案】(1);(2)210分钟,192名.【解析】(1)由散点图中数据和参考数据得,,,,所以与的线性回归方程为.(2)将代入回归方程得,所以该跑者跑完马拉松全程所花的时间为分钟.从马拉松比赛的频率分布直方图可知成绩好于210分钟的累积频率为,有的跑者成绩超过该跑者,则该跑者在本次比赛获得的名次大约是名.2.随着电商事业的快速发展,网络购物交易额也快速提升,特别是每年的“双十一”,天猫的交易额数目惊人.2020年天猫公司的工作人员为了迎接天猫“双十一”年度购物狂欢节,加班加点做了大量准备活动,截止2020年11月11日24时,2020年的天猫“双十一”交易额定格在3700多亿元,天猫总公司所有员工对于新的战绩皆大欢喜,同时又对2021年充满了憧憬,因此公司工作人员反思从2014年至2020年每年“双十一”总交易额(取近似值),进行分析统计如下表:年份2014201520162017201820192020年份代码()1234567总交易额(单位:百亿)5.79.112.116.821.326.837(1)通过分析,发现可用线性回归模型拟合总交易额y与年份代码t的关系,请用相关系数加以说明;(2)利用最小二乘法建立y关于t的回归方程(系数精确到0.1),预测2021年天猫“双十一”的总交易额.参考数据:,,;参考公式:相关系数;回归方程中,斜率和截距的最小二乘估计公式分别为:,.【答案】(1)答案见解析;(2)回归方程为,预测2021年天猫“双十一”的总交易额约为38百亿.【解析】(1),,,所以因为总交易额y与年份代码t的相关系数近似为0.98,说明总交易额y与年份代码t的线性相关性很强,从而可用线性回归模型拟合总交易额y与年份代码t的关系.(2)因为,,所以,,所以y关于t的回归方程为又将2021年对应的代入回归方程得:.所以预测2021年天猫“双十一”的总交易额约为38百亿.3.根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩使用量x(千克)之间的对应数据的散点图,如图所示.(1)依据数据的散点图可以看出,可用线性回归模型拟合y与x的关系,请计算相关系数r并加以说明(若,则线性相关程度很高,可用线性回归模型拟合);(2)求y关于x的回归方程,并预测当液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为多少?附:相关系数公式.参考数据:,.回归方程中斜率和截距的最小二乘估计公式分别为,.【答案】(1)0.95;答案见解析;(2);610千克.【解析】(1)由已知数据可得,,所以,,,所以相关系数.因为,所以可用线性回归模型拟合y与x的关系.(2),,所以回归方程为.当时,,即当液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为610千克.考点三非一元线性方程【例3】在一次抽样调查中测得个样本点,得到下表及散点图.(1)根据散点图判断与哪一个适宜作为关于的回归方程;(给出判断即可,不必说明理由)(2)根据(1)的判断结果试建立与的回归方程;(计算结果保留整数)(3)在(2)的条件下,设且,试求的最小值.参考公式:回归方程中,,.【答案】(1);(2);(3).【解析】(1)由题中散点图可以判断,适宜作为关于的回归方程;(2)令,则,原数据变为由表可知与近似具有线性相关关系,计算得,,,所以,,则.所以关于的回归方程是.(3)由(2)得,,任取、,且,即,可得,因为,则,,所以,,所以,函数在区间上单调递增,则.【一隅三反】1.某种新产品投放市场一段时间后,经过调研获得了时间x(天数)与销售单价y(元)的一组数据,且做了一定的数据处理(如表),并作出了散点图(如图).表中.(1)根据散点图判断,与哪一个更适合作价格y关于时间x的回归方程类型?(不必说明理由)(2)根据判断结果和表中数据,建立y关于x的回归方程.(3)若该产品的日销售量(件)与时间x的函数关系为,求该产品投放市场第几天的销售额最高?最高为多少元?附:对于一组数据,其回归直线的斜率和截距的最小二乘法估计分别为.【答案】(1)更适合作价格y关于时间x的回归方程;(2);(3)第10天,最高销售额为2420元;【解析】(1)根据散点图知更适合作价格y关于时间x的回归方程类型;(2)令,则,而,,即有;(3)由题意结合(2)知:日销售额为,∴,若,令,∴时,,即天,元,所以该产品投放市场第10天的销售额最高,最高销售额为2420元.2.我国为全面建设社会主义现代化国家,制定了从2021年到2025年的“十四五”规划.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金.现该企业为了了解年研发资金投入额(单位:亿元)对年盈利额(单位:亿元)的影响,研究了“十二五”和“十三五”规划发展期间近10年年研发资金投入额和年盈利额的数据.通过对比分析,建立了两个函数模型:①,②,其中,,,均为常数,为自然对数的底数.令,,经计算得如下数据:262156526805.36112501302.612(1)请从相关系数的角度,分析哪一个模型拟合程度更好?(2)(ⅰ)根据(1)的选择及表中数据,建立关于的回归方程;(系数精确到0.01)(ⅱ)若希望2021年盈利额为250亿元,请预测2021年的研发资金投入额为多少亿元?(结果精确到0.01)附:①相关系数,回归直线中:,②参考数据:,.【答案】(1)模型的拟合程度更好;(2)(ⅰ);(ⅱ)27.56.【解析】(1)设和的相关系数为,和的相关系数为,由题意,,,则,因此从相关系数的角度,模型的拟合程度更好.(2)(ⅰ)先建立关于的线性回归方程,由,得,即,,,所以关于的线性回归方程为,所以,则.(ⅱ)2021年盈利额(亿元),所以,则,因为,所以.所以2021年的研发资金投入量约为27.56亿元.《8.2一元线性回归模型及其应用》考点训练【题组一样本中心解小题】1.据统计,某产品的市场销售量y(万台)与广告费用投入x(万元)之间的对应数据的散点图如图所示,由图可知y与x之间有较强的线性相关关系,其线性同归方程是,则a的值是()A.2.5B.3C.3.5D.42.设一个回归方程为,则变量增加一个单位时().A.平均增加12个单位B.平均增加3个单位C.平均减少1.2个单位D.平均减少3个单位3.在对具有线性相关的两个变量和进行统计分析时,得到如下数据:由表中数据求得关于的回归直线方程,则,,,这四个样本点中,距离回归直线最近的点是()A.B.C.D.4.对具有线性相关关系的变量,,测得一组数据如表,利用最小二乘法得它们的回归直线方程为,据此模型来预测当时,的估计值为__________2456820506070805.已知某产品的销售额(万元)与广告费用(万元)之间的关系如下表:(单位:万元)(单位:万元)若销售额与广告费用之间的线性回归方程为,预计当广告费用为万元时的销售额约为_____________(万元).6.某产品的广告费用x与销售额y的统计数据如下表:广告费用x/万元1234销售额y/万元23mn现已知,且回归方程中的,据此模型预测广告费用为10万元时,销售额为______万元.7.下列是某厂1~4月份用水量(单位:百吨)的一组数据,由其散点图可知,用水量与月份之间有较好的线性相关关系,其线性回归方程是,则_______.月份1234用水量4.5432.58.已知x与y之间的一组数据:x0123ym35.57已知关于y与x的线性回归方程为,则m的值为___________.9.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程.零件数x(个)1020304050加工时间y(min)62758090现发现表中有一个数据看不清,请你推断该数据的值为___________.10.已知与之间的一组数据:12343.24.87.5若关于的线性回归方程为,则的值为______.【题组二一元线性方程】1.为了研究某班男生身高和体重的关系,从该班男生中随机选取6名,得到他们的身高和体重的数据如下表所示:编号123456身高165171167173179171体重62m64747466在收集数据时,2号男生的体重数值因字迹模糊看不清,故利用其余5位男生的数话得到身高与体重的线性回归方程为.后来得到2号男生的体重精准数值m后再次计算得到线性回归方程为.(1)求回归方程;(2)若分别按照和来预测身高为的男生的体重,得到的估计值分别为,,且,求m的值;(3)指数是目前国际上常用的衡量人体胖瘦程度以及是否健康的一个标准,其中指数在24到27.9之间的定义为超重.通过计算可知这6人的指数分别为:22.8,27.4,22.9,24.7,23.1,22.6,现从这6人中任选2人,求恰有1人体重为超重的概率.附:回归直线的斜率和截距的最小二乘估计公式分别为:,.2.让来自世界各地的与会者和消费者更深入了解遂宁,某记者对本次农交会进行了跟踪报道和实际调查,对某特产的最满意度和对应的销售额(万元)进行了调查得到以下数据:时间第一天第二天第三天第四天第五天最满意度2234252019销售额(万元)7890867675(1)求销量额关于最满意度的相关系数;我们约定:销量额关于最满意度的相关系数的绝对值在以上(含)是线性相关性较强;否则,线性相关性较弱.请你对线性相关性强弱作出判断,并给出理由;(2)如果没有达到较强线性相关,则采取“末位淘汰”制(即销售额最少的那一天不作为计算数据),并求在剔除“末位淘汰”的那一天后的销量额关于最满意度的线性回归方程(系数精确到0.1).参考数据:,,,,,.附:对于一组数据.其回归直线方程的斜率和截距的最小二乘法估计公式分别为:,,线性相关系数.3.某医院随着医疗工作的有序开展,从2020年3月1日算第一天起,该医院每日治愈的新型冠状病毒肺炎人数(人)的近5天的具体数据如下表:第天12345治愈的新型冠状病毒肺炎人数(人)24818若在一定时间内,该医院每日治愈的新型冠状病毒肺炎病人数与天数具有相关关系,已知线性回归方程恒过定点,且,.(1)求的值和线性回归方程;(2)预测该医院3月11日能否可以实现“单日治愈人数突破40人”的目标?参考公式:,,,为样本平均值.4.(统计中用相关系数来衡量两个变量之间的线性相关的强弱,若相应于变量的取值,变量的观测值,则两个变量的相关关系的计算公式为.对于变量,若,时,那么负相关很强;若,时,那么正相关很强;若,或,,那么相关性一般;若,,那么相关性较弱.下表是一位母亲给儿子作的成长记录:年龄/周岁34567身高/厘米9198104111116(1)根据公式以及上表数据,判断孩子在3岁到7岁期间年龄与身高线性相关的强弱;(2)根据上表数据,,求出年龄与身高的线性回归方程,并根据求得的回归方程,预估孩子8岁时的身高.,.5.天气寒冷,加热手套比较畅销,某商家为了解某种加热手套如何定价可以获得最大利润,现对这种加热手套进行试销售,统计后得到其单价x(单位;元)与销量y(单位:副)的相关数据如下表:单价x(元)80859095100销量y(副)1401301109080(1)已知销量y与单价x具有线性相关关系,求y关于x的线性回归方程;(2)若每副该加热手套的成本为65元,试销售结束后,请利用(1)中所求的线性回归方程确定单价为多少元时,销售利润最大?(结果保留到整数)附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线的斜率和截距的最小二乘估计分别为参考数据:6.据了解,温带大陆性气候,干燥,日照时间长,昼夜温差大,有利于植物糖分积累.某课题研究组欲研究昼夜温差大小(x/℃)与某植物糖积累指数(y/GI)之间的关系,得到如下数据:组数第一组第二组第三组第四组第五组第六组昼夜温差x/℃1011131286某植物糖积累指数y/GI202430281815该课题研究组确定的研究方案是先从这6组数据中选取4组数据求线性回归方程,再用剩下的2组数据进行检验,假设这剩下的2组数据恰好是第一组与第六组数据.(1)求y关于x的线性回归方程;(2)若由线性回归方程得到的估计数据与所选出的检验数据的差的绝对值均不超过2.58,则认为得到的线性回归方程是理想的,试问(1)中所得线性回归方程是否理想?参考公式:回归直线方程的斜率和截距的最小二乘估计.7.广西某高三理科班名学生的物理测评成绩(满分120分)的频率分布直方图如图,已知分数在95—105的学生有27人.(1)求总人数和分数在110—120分的人数;(2)求出该频率分布直方图的众数,中位数,平均数;(3)为了分析某个学生的学习状态,对其下一阶段的学生提供指导性建议,对他前7次考试的数学成绩(满分150分),物理成绩进行分析,如表是该生7次考试的成绩.数学888311792108100112物理949110896104101106已知该生的物理成绩与数学成绩是线性相关的,若该生的数学成绩达到130分,请你估计他的物理成绩大约是多少?其回归方程,,.其中.8.某公司为了提升市场的占有率,准备对一项产品实施科技改造,经过充分的市场调研与模拟,得到,之间的五组数据如下表:2357858121416其中,(单位:百万元)是科技改造的总投入,(单位:百万元)是改造后的额外收益;设是对当地生产总值增长的贡献值.(1)若从五组数据中任取两组,求恰有一组满足的概率;(2)记为时的任意两组数据对应的贡献值的和,求随机变量的分布列和数学期望;(3)利用表中数据,甲、乙两个调研小组给出的拟合直线方程分别为甲组:,乙组:,试用最小二乘法判断哪条直线的拟合效果更好?附:对于一组数据,其拟合直线方程的残差平方和为,越小拟合效果越好.【题组三非一元线性方程】1.某地级市共有200000名中小学生,其中有7%的学生在2017年享受了“国家精准扶贫”政策,在享受“国家精准扶贫”政策的学生中困难程度分为三个等次:一般困难、很困难、特别困难,且人数之比为5∶3∶2,为进一步帮助这些学生,当地市政府设立“专项教育基金”,对这三个等次的困难学生每年每人分别补助1000元、1500元、2000元.经济学家调查发现,当地人均可支配收入较上一年每增加n%,一般困难的学生中有3n%会脱贫,脱贫后将不再享受“国家精准扶贫”政策,很困难的学生中有2n%转为一般困难,特别困难的学生中有n%转为很困难.现统计了该地级市2013年到2017年共5年的人均可支配收入,对数据初步处理后得到了如图所示的散点图和表中统计量的值,其中年份x取13时代表2013年,x与y(万元)近似满足关系式y=,其中C1,C2为常数(2013年至2019年该市中学生人数大致保持不变).2.31.23.14.621其中(1)估计该市2018年人均可支配收入;(2)求该市2018年的“专项教育基金”的财政预算大约为多少?附:①对于一组具有线性相关关系的数据(u1,v1),(u2,v2),…,(un,vn),其回归直线方程的斜率和截距的最小二乘估计分别为2-0.72-0.320.121.721.821.90.60.81.13.23.53.732.某学生为了测试燃气灶烧水如何节省天然气的问题设计了一个试验,并获得了天然气开关旋钮旋转的弧度数与烧开一壶水所用时间(以下简称烧水时间)的一组数据,且进行了一定的数据处理(如下表),得到了散点图(如下图).1.4720.60.782.350.8116.2表中.(1)根据散点图判断,与哪一个更适宜作为烧水时间关于开关旋钮旋转的弧度数的回归方程类型;(不必说明理由)(2)根据判断结果和表中数据,建立关于的回归方程;(3)如果旋转的弧度数与单位时间内天然气输出量成正比,那么为多少时,烧开一壶水最省天然气?附:对于一组数据,其回归直线方程的斜率和截距的最小二乘估计分别为.3.红铃虫是棉花的主要害虫之一,能对农作物造成严重伤害.每只红铃虫的平均产卵数和平均温度有关.现收集了以往某地的7组数据,得到下面的散点图及一些统计量的值.平均温度/℃21232527293235平均产卵数/个71121246611532527.42981.2863.61240.182147.714表中,(1)根据散点图判断,与(其中为自然对数的底数)哪一个更适宜作为平均产卵数关于平均温度的回归方程类型?(给出判断即可不必说明理由)并由判断结果及表中数据,求出关于的回归方程.(计算结果精确到小数点后第三位)(2)根据以往统计,该地每年平均温度达到28℃以上时红铃虫会造成严重伤害,需要人工防治,其他情况均不需要人工防治,记该地每年平均温度达到28℃以上的概率为.(ⅰ)记该地今后5年中,恰好需要3次人工防治的概率为,求的最大值,并求出相应的概率.(ⅱ)当取最大值时,记该地今后5年中,需要人工防治的次数为,求的数学期望和方差.附:对于一组数据,其回归直线的斜率和截距的最小二乘法估计分别为:,.4.根据普遍规律,志愿者接种疫苗后体内会产生抗体,人体中检测到抗体,说明有抵御病毒的能力.科研人员要定期从接种疫苗的志愿者身上采集血液样本,检测人体中抗体含量水平(单位:,百万国际单位/毫升).(1)IgM作为人体中首先快速产生的抗体,是人体抗感染免疫的“先头部队”.经采样分折,志愿者身体中IgM含量水平与接种天数x(接种后每满24小时为一天,)近似满足函数关系:,经研究表明,IgM含量水平不低于时是免疫的有效时段,试估计接种一次后IgM含量水平有效时段可经历的时间(向下取整).(参考数据:)(2)IgG虽然是接种后产生比较慢的抗体,却是血清和体液中含量最高的抗体,也是亲和力最强、人体内分布最广泛、具有免疫效应的抗感染“主力军”.科研人员每间隔3天检测一次(检测次数依次记为,)某志愿者人体中IgG的含量水平,记作,得到相关数据如下表:(次)12345670.090.380.954.853.357.4817.25①请画出散点图,并根据散点图判断线性拟合模型与指数拟合模型哪种更适合拟合z与t的关系(不必说明理由);②研究人员发现,上述数据中存在一组异常数据应当予以剔除.试根据余下的六组数据,利用①中选择的拟合模型计算回归方程,并估计原异常数据对应的值.附:回归系数与估计值均保留两位小数,由七组数据计算出的参考数据见下表,其中.4.910.60205.4839.87-2.840.440.821.58参考公式:线性回归直线的分别为:,5.某工厂生产不同规格的一种产品,根据检测标准,其合格产品的质量与尺寸之间满足关系式为大于的常数),现随机抽取6件合格产品,测得数据如下:尺寸(mm)384858687888质量(g)16.818.820.722.42425.5对数据作了处理,相关统计量的值如下表:75.324.618.3101.4(1)根据所给数据,求关于的回归方程(提示:由已知与呈线性关系);(2)按照某项指标测定,当产品质量与尺寸的比在区间内时为优等品,现从抽取的6件合格产品中再任选3件,求恰好取得两件优等品的概率.(附:对于一组数据,其回归直线的斜率和截距的最小二乘法估计值分别为)答案解析【题组一样本中心解小题】1.据统计,某产品的市场销售量y(万台)与广告费用投入x(万元)之间的对应数据的散点图如图所示,由图可知y与x之间有较强的线性相关关系,其线性同归方程是,则a的值是()A.2.5B.3C.3.5D.4【答案】A【解析】由题可知:将代入线性回归方程可得:故选:A2.设一个回归方程为,则变量增加一个单位时().A.平均增加12个单位B.平均增加3个单位C.平均减少1.2个单位D.平均减少3个单位【答案】A【解析】由回归直线斜率知:变量增加一个单位时,,平均增加个单位.故选:A.3.在对具有线性相关的两个变量和进行统计分析时,得到如下数据:由表中数据求得关于的回归直线方程,则,,,这四个样本点中,距离回归直线最近的点是()A.B.C.D.【答案】C【解析】,,根据回归直线方程的性质可知,平均值点在回归直线上,故选:C.4.对具有线性相关关系的变量,,测得一组数据如表,利用最小二乘法得它们的回归直线方程为,据此模型来预测当时,的估计值为___________245682050607080【答案】213.5【解析】,,所以中心点为,所以,解得,所以回归直线方程为,所以当时,,故答案为:5.已知某产品的销售额(万元)与广告费用(万元)之间的关系如下表:(单位:万元)(单位:万元)若销售额与广告费用之间的线性回归方程为,预计当广告费用为万元时的销售额约为_____________(万元).【答案】【解析】由表格中的数据可得,,由于回归直线过样本的中心点,所以,,解得,所以,回归直线方程为,当时,.故答案为:.6.某产品的广告费用x与销售额y的统计数据如下表:广告费用x/万元1234销售额y/万元23mn现已知,且回归方程中的,据此模型预测广告费用为10万元时,销售额为______万元.【答案】35【解析】由题意,∴,,时,.故答案为:35.7.下列是某厂1~4月份用水量(单位:百吨)的一组数据,由其散点图可知,用水量与月份之间有较好的线性相关关系,其线性回归方程是,则______.月份1234用水量4.5432.5【答案】5.25【解析】由题意知:,,将代入线性回归方程,即,解得:.故答案为:5.25.8.已知x与y之间的一组数据:x0123ym35.57已知关于y与x的线性回归方程为,则m的值为___________.【答案】【解析】由表格中的数据可得由于回归直线过样本的中心点,所以所以,解得故答案为:9.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程.零件数x(个)1020304050加工时间y(min)62758090现发现表中有一个数据看不清,请你推断该数据的值为___________.【答案】【解析】设阴影部分的数据为,由表中数据得:,,由于由最小二乘法求得回归方程,将,,代入回归直线方程,得.故答案为:.10.已知与之间的一组数据:12343.24.87.5若关于的线性回归方程为,则的值为______.【答案】=4.5【解析】由题得,,所以,所以.故答案为:=4.5【题组二一元线性方程】1.为了研究某班男生身高和体重的关系,从该班男生中随机选取6名,得到他们的身高和体重的数据如下表所示:编号123456身高165171167173179171体重62m64747466在收集数据时,2号男生的体重数值因字迹模糊看不清,故利用其余5位男生的数话得到身高与体重的线性回归方程为.后来得到2号男生的体重精准数值m后再次计算得到线性回归方程为.(1)求回归方程;(2)若分别按照和来预测身高为的男生的体重,得到的估计值分别为,,且,求m的值;(3)指数是目前国际上常用的衡量人体胖瘦程度以及是否健康的一个标准,其中指数在24到27.9之间的定义为超重.通过计算可知这6人的指数分别为:22.8,27.4,22.9,24.7,23.1,22.6,现从这6人中任选2人,求恰有1人体重为超重的概率.附:回归直线的斜率和截距的最小二乘估计公式分别为:,.【答案】(1);(2);(3)【解析】(1),,所以,,所以,,所以.(2)根据题意,将代入方程得,所以,所以,①另一方面,6名男生的身高的平均值为,体重的平均值为,所以,②,,所以,③综合①②③即可得:,.(3)设这6人分别记为,其中表示体重超标的两人,则从这6人中任选2人,所有的可能情况为:,共15种,其中恰有1人体重为超重有:,共8种,所以恰有1人体重为超重的概率为:.2.让来自世界各地的与会者和消费者更深入了解遂宁,某记者对本次农交会进行了跟踪报道和实际调查,对某特产的最满意度和对应的销售额(万元)进行了调查得到以下数据:时间第一天第二天第三天第四天第五天最满意度2234252019销售额(万元)7890867675(1)求销量额关于最满意度的相关系数;我们约定:销量额关于最满意度的相关系数的绝对值在以上(含)是线性相关性较强;否则,线性相关性较弱.请你对线性相关性强弱作出判断,并给出理由;(2)如果没有达到较强线性相关,则采取“末位淘汰”制(即销售额最少的那一天不作为计算数据),并求在剔除“末位淘汰”的那一天后的销量额关于最满意度的线性回归方程(系数精确到0.1).参考数据:,,,,,.附:对于一组数据.其回归直线方程的斜率和截距的最小二乘法估计公式分别为:,,线性相关系数.【答案】(1),线性相关性较弱;(2)【解析】(1).因为,所以线性相关性较弱,(2)由(1)可得没有达到较强线性相关,则淘汰销售额为万元的数据.剔除数据后的,.,,,,所以,.所以线性回归方程为.3.某医院随着医疗工作的有序开展,从2020年3月1日算第一天起,该医院每日治愈的新型冠状病毒肺炎人数(人)的近5天的具体数据如下表:第天12345治愈的新型冠状病毒肺炎人数(人)24818若在一定时间内,该医院每日治愈的新型冠状病毒肺炎病人数与天数具有相关关系,已知线性回归方程恒过定点,且,.(1)求的值和线性回归方程;(2)预测该医院3月11日能否可以实现“单日治愈人数突破40人”的目标?参考公式:,,,为样本平均值.【答案】(1),;(2)能实现.【解析】解:(1)由题意,,,∴,解得,∵,,所以,,,所以线性回归方程为.(2)在中,3月11日即,取..∵,∴该医院3月11日能实现“单日治愈人数突破40人”的目标.4.统计中用相关系数来衡量两个变量之间的线性相关的强弱,若相应于变量的取值,变量的观测值,则两个变量的相关关系的计算公式为.对于变量,若,时,那么负相关很强;若,时,那么正相关很强;若,或,,那么相关性一般;若,,那么相关性较弱.下表是一位母亲给儿子作的成长记录:年龄/周岁34567身高/厘米9198104111116(1)根据公式以及上表数据,判断孩子在3岁到7岁期间年龄与身高线性相关的强弱;(2)根据上表数据,,求出年龄与身高的线性回归方程,并根据求得的回归方程,预估孩子8岁时的身高.,.【答案】(1)见解析(2);厘米【解析】(1)则即孩子在3岁到7岁期间年龄与身高线性相关很强(2),则年龄与身高的线性回归方程为当时,身高为厘米5.天气寒冷,加热手套比较畅销,某商家为了解某种加热手套如何定价可以获得最大利润,现对这种加热手套进行试销售,统计后得到其单价x(单位;元)与销量y(单位:副)的相关数据如下表:单价x(元)80859095100销量y(副)1401301109080(1)已知销量y与单价x具有线性相关关系,求y关于x的线性回归方程;(2)若每副该加热手套的成本为65元,试销售结束后,请利用(1)中所求的线性回归方程确定单价为多少元时,销售利润最大?(结果保留到整数)附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线的斜率和截距的最小二乘估计分别为参考数据:【答案】(1);(2)单价应该定为元,销售利润最大.【解析】(1)由表中数据,计算得,,则,,所以关于的线性回归方程为.(2)设定价为元,利润为,则(元)时,最大,所以为使得销售的利润最大,单价应该定为元.6.据了解,温带大陆性气候,干燥,日照时间长,昼夜温差大,有利于植物糖分积累.某课题研究组欲研究昼夜温差大小(x/℃)与某植物糖积累指数(y/GI)之间的关系,得到如下数据:组数第一组第二组第三组第四组第五组第六组昼夜温差x/℃1011131286某植物糖积累指数y/GI202430281815该课题研究组确定的研究方案是先从这6组数据中选取4组数据求线性回归方程,再用剩下的2组数据进行检验,假设这剩下的2组数据恰好是第一组与第六组数据.(1)求y关于x的线性回归方程;(2)若由线性回归方程得到的估计数据与所选出的检验数据的差的绝对值均不超过2.58,则认为得到的线性回归方程是理想的,试问(1)中所得线性回归方程是否理想?参考公式:回归直线方程的斜率和截距的最小二乘估计.【答案】(1);(2)是.【解析】(1)由表中2月至5月份的数据,得,,故有,,,,即关于的线性回归方程为;(2)由,当时,,,当时,,,则该小组所得线性回归方程是理想的.7.广西某高三理科班名学生的物理测评成绩(满分120分)的频率分布直方图如图,已知分数在95—105的学生有27人.(1)求总人数和分数在110—120分的人数;(2)求出该频率分布直方图的众数,中位数,平均数;(3)为了分析某个学生的学习状态,对其下一阶段的学生提供指导性建议,对他前7次考试的数学成绩(满分150分),物理成绩进行分析,如表是该生7次考试的成绩.数学888311792108100112物理949110896104101106已知该生的物理成绩与数学成绩是线性相关的,若该生的数学成绩达到130分,请你估计他的物理成绩大约是多少?其回归方程,,.其中.【答案】(1);9;(2)97.5,100,80.50;(3)可估计他的物理成绩为115分.【解析】(1)根据频率分布直方图的意义,分数在95—105的学生有27人,95—105的频率为:,可得总人数.直方图面积之和为,可得110—115的频率为0.1,即人数为人.的人数为,所以110—120人数为9人.(2)众数;由,所以中位数为100;平均数(分)(3)由表中数据:,,其中;∵∴物理成绩与数学成绩是线性其回归方程为:.当时,可得,即可估计他的物理成绩为115分.8.某公司为了提升市场的占有率,准备对一项产品实施科技改造,经过充分的市场调研与模拟,得到,之间的五组数据如下表:2357858121416其中,(单位:百万元)是科技改造的总投入,(单位:百万元)是改造后的额外收益;设是对当地生产总值增长的贡献值.(1)若从五组数据中任取两组,求恰有一组满足的概率;(2)记为时的任意两组数据对应的贡献值的和,求随机变量的分布列和数学期望;(3)利用表中数据,甲、乙两个调研小组给出的拟合直线方程分别为甲组:,乙组:,试用最小二乘法判断哪条直线的拟合效果更好?附:对于一组数据,其拟合直线方程的残差平方和为,越小拟合效果越好.【答案】(1);(2)分布列见解析;期望为;(3)甲组给出的拟合直线方程拟合效果更好.【解析】(1)设所给五组数据分别为,,,,(只有满足),从五组数据中任意取出两组的情况有:,,,,,,,,,共10种情况,其中,恰有一组满足的有:,,,共4种情况,故所求概率为;(2)满足的数据是后3组(贡献值分别为:22,28,32),∴的值为50,54,60,则,,,∴的分布列为:505460数学期望;(3)用甲组给出的拟合直线方程列表如下:235785812141657111517用乙组给出的拟合直线方程列表如下:23578581214163.56111618.5由表中数据得,,,∴,故甲组给出的拟合直线方程拟合效果更好.【题组三非一元线性方程】1.某地级市共有200000名中小学生,其中有7%的学生在2017年享受了“国家精准扶贫”政策,在享受“国家精准扶贫”政策的学生中困难程度分为三个等次:一般困难、很困难、特别困难,且人数之比为5∶3∶2,为进一步帮助这些学生,当地市政府设立“专项教育基金”,对这三个等次的困难学生每年每人分别补助1000元、1500元、2000元.经济学家调查发现,当地人均可支配收入较上一年每增加n%,一般困难的学生中有3n%会脱贫,脱贫后将不再享受“国家精准扶贫”政策,很困难的学生中有2n%转为一般困难,特别困难的学生中有n%转为很困难.现统计了该地级市2013年到2017年共5年的人均可支配收入,对数据初步处理后得到了如图所示的散点图和表中统计量的值,其中年份x取13时代表2013年,x与y(万元)近似满足关系式y=,其中C1,C2为常数(2013年至2019年该市中学生人数大致保持不变).2.31.23.14.621其中(1)估计该市2018年人均可支配收入;(2)求该市2018年的“专项教育基金”的财政预算大约为多少?附:①对于一组具有线性相关关系的数据(u1,v1),(u2,v2),…,(un,vn),其回归直线方程的斜率和截距的最小二乘估计分别为②2-0.72-0.320.121.721.821.90.60.81.13.23.53.73【答案】(1)2.8万元;(2)1624万元.【解析】(1)因为=×(13+14+15+16+17)=15,所以=(-2)2+(-1)2+02+12+22=10.由k=y得k=2C1+C2x,所以C1=-C2=1.2-×15=-0.3,所以C1=2-0.3=0.8,所以y=.当x=18时,y=0.8×21.8=0.8×3.5=2.8(万元).即该市2018年人均可支配收入为2.8万元.(2)由题意知2017年时该市享受“国家精准扶贫”政策的学生有200000×7%=14000人,一般困难、很困难、特别困难的中学生依次有7000人、4200人、2800人,2018年人均可支配收入比2017年增长=20.1-1=0.1=10%,所以2018年该市特别困难的中学生有2800×(1-10%)=2520人.很困难的学生有4200×(1-20%)+2800×10%=3640人,一般困难的学生有7000×(1-30%)+4200×20%=5740人.所以2018年的“专项教育基金”的财政预算大约为5740×1000+3640×1500+2520×2000=16240000(元)=1624(万元).2.某学生为了测试燃气灶烧水如何节省天然气的问题设计了一个试验,并获得了天然气开关旋钮旋转的弧度数与烧开一壶水所用时间(以下简称烧水时间)的一组数据,且进行了一定的数据处理(如下表),得到了散点图(如下图).1.4720.60.782.350.8116.2表中.(1)根据散点图判断,与哪一个更适宜作为烧水时间关于开关旋钮旋转的弧度数的回归方程类型;(不必说明理由)(2)根据判断结果和表中数据,建立关于的回归方程;(3)如果旋转的弧度数与单位时间内天然气输出量成正比,那么为多少时,烧开一壶水最省天然气?附:对于一组数据,其回归直线方程的斜率和截距的最小二乘估计分别为.【答案】(1);

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论