8.2 一元线性回归模型及应用(解析版)人教版高中数学精讲精练选择性必修三_第1页
8.2 一元线性回归模型及应用(解析版)人教版高中数学精讲精练选择性必修三_第2页
8.2 一元线性回归模型及应用(解析版)人教版高中数学精讲精练选择性必修三_第3页
8.2 一元线性回归模型及应用(解析版)人教版高中数学精讲精练选择性必修三_第4页
8.2 一元线性回归模型及应用(解析版)人教版高中数学精讲精练选择性必修三_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

8.2一元线性回归模型及应用考法一一元线性回归模型【例1-1】(2024·四川绵阳)已知变量x,y之间的线性回归方程为,且变量x,y之间的一组相关数据如表所示,x2468y58.213m则下列说法正确的是(

)A.B.变量y与x是负相关关系C.该回归直线必过点D.x增加1个单位,y一定增加2个单位【答案】C【解析】依题意,,由,解得,A错误;回归方程中,,则变量y与x是正相关关系,B错误;由于样本中心点为,因此该回归直线必过点,C正确;由回归方程知,x增加1个单位,y大约增加2个单位,D错误.故选:C【例1-2】(2024湖南长沙)党的十八大以来,全国各地区各部门持续加大就业优先政策实施力度,促进居民收入增长的各项措施持续发力,居民分享到更多经济社会发展红利,居民收入保持较快增长,收入结构不断优化,随着居民总收入较快增长,全体居民人均可支配收入也在不断提升.下表为某市2014~2022年全体居民人均可支配收入,将其绘制成散点图(如图1),发现全体居民人均可支配收入与年份具有线性相关关系.年份201420152016201720182019202020212022全体居民人均可支配收入(元)183522011022034241532638628920308243380335666参考数据:.参考公式:对于一组数据,其回归直线方程的斜率和截距的最小二乘估计分别为.(1)设年份编号为(2014年的编号为1,2015年的编号为2,依此类推),记全体居民人均可支配收入为(单位:万元),求经验回归方程(结果精确到0.01);(2)为进一步对居民人均可支配收入的结构进行分析,某分析员从2014~2022中任取2年的数据进行分析,将选出的人均可支配收入超过3万的年数记为,求随机变量的分布列与数学期望.【答案】(1)(2)分布列见解析,【解析】(1)由题意得,,故,所以.故回归方程为;(2)由图表知,人均可支配收入超过3万的年份有3年,故的可能取值为,则,故随机变量的分布列为:012故.【例1-3】(2023河南南阳)在线性回归方程中,为回归系数,下列关于的说法中不正确的是(

)A.为回归直线的斜率B.,表示随增加,值增加,,表示随增加,值减少C.是唯一确定的值D.回归系数的统计意义是当每增加(或减少)一个单位,平均改变个单位【答案】C【解析】对于A,线性回归方程中的为回归直线的斜率,A正确;对于B,,表示随增加,值增加,,表示随增加,值减少,B正确;对于C,是由总体的一个样本利用一定的方法计算得到的,选择不同的样本或不同的计算方法得到的一般是不同的,C错误;对于D,回归系数的统计意义是当每增加(或减少)一个单位,平均改变个单位,D正确.故选:C【一隅三反】1.(2023青海海南)某厂近几年陆续购买了几台A型机床,该型机床已投入生产的时间x(单位:年)与当年所需要支出的维修费用y(单位:万元)有如下统计资料:x23456y2.23.85.56.57根据表中的数据可得到线性回归方程为则该型机床已投入生产的时间为10年时,当年所需要支出的维修费用估计为(

)A.12.9万元 B.12.36万元C.13.1万元 D.12.38万元【答案】D【解析】,中心点代入回归方程得,解得,,故当时,,即当年所需要支出的维修费用估计为万元,故选:D2.(2024·甘肃陇南)(多选)某厂近几年陆续购买了几台A型机床,该型机床已投入生产的时间x(单位:年)与当年所需要支出的维修费用y(单位:万元)有如下统计资料:x23456y2.23.85.56.57根据表中的数据可得到经验回归方程为.则(

)A.B.y与x的样本相关系数C.表中维修费用的第60百分位数为6D.该型机床已投入生产的时间为10年时,当年所需要支出的维修费用一定是12.38万元【答案】ABC【解析】根据题意可得,,,所以样本中心点为,对于A,将样本中心点代入回归方程,可得,故A正确;对于B,由表中数据可得随着增大而增大,与正相关,所以相关系数,故B正确;对于C,维修费用从小到大依次为,第60百分位数为,故C正确;对于D,根据回归分析的概念,机床投入生产的时间为10年时,所需要支出的维修费用大概是12.38万元,故D错误.故选:ABC.3.(2024·陕西)某村在推进乡村振兴的过程中,把做活乡村产业作为强村富民的重要抓手,因地制宜推进茶叶种植,成立了茶叶合作社.为了对茶叶在销售旺季进行合理定价,合作社进行了市场调研,得到了销售旺季时销量(吨)关于售价(元/公斤)的散点图.

(1)求关于的线性回归方程;(2)该合作社2023年茶叶总产量为150吨,如果在销售旺季时售价为250元/公斤,在销售旺季没能售出的,年底以每公斤100元的价格卖给批发商,则该合作社2023年的总销售额为多少万元?公式及参考数据:关于的线性回归方程为,其中,;,,,.【答案】(1)(2)万元【解析】(1)由已知,,所以关于的线性回归方程为;(2)由(1)得当时,,即旺季时的销量约为吨,剩下的约为吨,所以该合作社2023年的总销售额(元),即该合作社2023年的总销售额为万元.考法二残差的计算【例2】(2024·云南大理)已知某种商品的广告费支出(单位:万元)与销售额(单位:万元)之间有如下表对应数据:134571520304045根据表中数据得到关于的经验回归方程为,则当时,残差为.(残差观测值-预测值)【答案】【解析】,因为回归直线过点,代入,可得,当时,,所以残差为.故答案为:【一隅三反】1.(2023黑龙江双鸭山)色差和色度是衡量玩具质量优劣的重要指标,已知该产品的色度和色差之间满足线性相关关系,且,现有一对测量数据为(30,22.8),则该数据的残差为(

)A.0.6 B.0.4 C. D.【答案】A【解析】当时,,所以该数据的残差为.故选:A.2.(2023·河南)已知一组样本数据,,,,根据这组数据的散点图分析与之间的线性相关关系,若求得其线性回归方程为,则在样本点处的残差为(

)A.38.1 B.22.6 C. D.91.1【答案】C【解析】因为观测值减去预测值称为残差,所以当时,,所以残差为.故选:C.3.(2024·云南楚雄)对具有线性相关关系的变量有一组观测数据(),其经验回归方程为,且,,则相应于点的残差为.【答案】/【解析】经验回归直线过样本点的中心,,,经验回归方程为.当时,,残差为.故答案为:.考法三回归效果的刻画方式【例3-1】(2024吉林长春)(多选)对两组线性相关成对数据进行回归分析,得到不同的统计结果,第一组和第二组成对数据的样本相关系数,残差平方和,决定系数分别为和,则(

)A.若,则第一组成对数据的线性相关关系比第二组的强B.若,则第一组成对数据的线性相关关系比第二组的强C.若,则第二组成对数据的经验回归模型拟合效果比第一组的好D.若,则第二组成对数据的经验回归模型拟合效果比第一组的好【答案】BD【解析】由越趋近1,数据的线性相关关系越强知,A错误;B正确;由残差平方和越小,则数据的经验回归模型拟合效果越好知,C错误;由决定系数越大,则数据的经验回归模型拟合效果越好知,D正确,故选:BD【例3-2】(2024黑龙江哈尔滨)如图,5个数据,去掉后,下列说法正确的是(

A.样本相关系数r变小B.残差平方和变大C.决定系数变大D.解释变量x与响应变量y的相关性变弱【答案】C【解析】由散点图可知,去掉点后,与的相关性变强,且为正相关,所以变大,变大,残差平方和变小.故选:C【一隅三反】1.(2024河北邢台)中国茶文化博大精深、茶水的口感与茶叶的类型和水的温度有关,某数学建模小组建立了茶水冷却时间x和茶水温度y的一组数据,经过分析,提出了四种回归模型,①②③④四种模型的残差平方和的值分别是1.23、0.80、0.12、1.36.则拟合效果最好的模型是(

)A.模型① B.模型② C.模型③ D.模型④【答案】C【解析】残差平方和越小则拟合效果越好,而模型③的值最小,所以C正确.故选:C2.(2023四川成都)收集一只棉铃虫的产卵数与温度的几组数据后发现两个变量有相关关系,按不同的曲线来拟合与之间的回归方程,并算出了对应的决定系数如下表:拟合曲线直线指数曲线抛物线二次曲线与的回归方程0.7460.9960.9020.002则这组数据模型的回归方程的最好选择应是(

)A. B.C. D.【答案】B【解析】由决定系数来刻画回归效果,的值越大越接近1,说明模型的拟合效果最好.由表可知指数模型的决定系数最接近1.故选:B.3.(2023·江苏徐州)(多选)某研究小组采集了组数据,作出如图所示的散点图.若去掉后,下列说法正确的是(

A.相关系数变小B.决定系数变大C.残差平方和变大D.解释变量与预报变量的相关性变强【答案】BD【解析】根据散点图可知,去掉点后,与的线性相关性加强,且为正相关,相关系数变大,则A错D对,去掉点后,残差平方和变小,则变大,B对C错.故选:BD.4.(2024重庆·开学考试)(多选)为研究女儿身高与母亲身高的关系,现经过随机抽样获得成对样本数据,,下列说法正确的是(

)A.落在回归直线上的样本点越多,回归直线方程的拟合效果越好B.样本相关系数越大,变量线性相关程度越强C.决定系数越小,残差平方和越大,模型的拟合效果越好D.决定系数越大,残差平方和越小,模型的拟合效果越好【答案】BD【解析】对于A:回归直线方程拟合效果的好坏是由决定系数来判断的,故A错误;对于B:因为,且相关系数越接近,变量线性相关程度越强,故B正确;对于C:决定系数越小,残差平方和越大,模型的拟合效果越差,故C错误;对于D:决定系数越大,残差平方和越小,模型的拟合效果越好,故D正确.故选:BD考法四经验回归模型的选择【例4-1】(2023河南信阳·期末)如图是两个变量的散点图,y关于x的回归方程可能是(

)A. B. C. D.【答案】C【解析】由散点图可知,y与x负相关,故排除A,B,对于D:,点偏离较大,而点近似在曲线附近,所以y关于x的回归方程是C的可能性大.故选:C.【例4-2】(2023江苏)在一次数学建模活动中,某同学采集到如下一组数据:x0123y0.240.5112.023.988.02以下四个函数模型(a,b为待定系数)中,最能反映y与x的函数系的是(

)A. B. C. D.【答案】B【解析】由表格中的数据,作出数据的散点图,如图所示,数据散点图和指数型函数的图象类似,所以选项B最能反映之间的函数关系.故选:B.【一隅三反】1.(2023河南)已知关于变量有相关关系,由观测数据得到的样本数据散点图如图所示,则该组观测数据中关于的回归方程可能是(

A. B.C. D.【答案】D【解析】由散点图可知,所求回归方程先减后增,选项中A,B均为定义域上的增函数,不符合题意;选项C中的函数图象为开口向下的抛物线,不符合题意;而选项D中的函数图象增减性与散点图符合题意,故D正确.故选:D.2.(2023福建福州)某个国家某种病毒传播的中期感染人数y和天数x的散点图如图所示,下列最适宜作为感染人数y和天数x的经验回归方程类型的是(

)A. B.C. D.【答案】B【解析】由图可知,图象随着x的增大而增高,且增长速度越来越快,结合选项,可判断最适宜作为感染人数y和时间x的回归方程.故选:B考法五非线性回归方程【例5-1】(2023·四川遂宁)某池塘中水生植物的覆盖水塘面积x(单位:)与水生植物的株数y(单位:株)之间的相关关系,收集了4组数据,用模型去拟合x与y的关系,设,x与z的数据如表格所示:x3467z22.54.57得到x与z的线性回归方程,则.【答案】/【解析】由已知可得,,,所以,有,解得,所以,,由,得,所以,,则.故答案为:【例5-2】(2024江西·期中)2020年是具有里程碑意义的一年,我们将全面建成小康社会,实现第一个百年奋斗目标;2020年也是脱贫攻坚决战决胜之年.为贯彻落实党中央全面建设小康社会的战略部署.某贫困地区的广大党员干部深入农村积极开展“精准扶贫”工作﹒经过多年的精心帮扶,2020年8月,为估计该地能否在2020年全面实现小康,统计了该地当时最贫困的一个家庭2020年1至7月的人均月纯收入,作出散点图如下.观察散点图,发现其家庭人均月纯收入(元)与时间代码之间不具有线性相关关系(记2020年1月、2月…分别为,,…,依此类推),现考虑用对数函数模型和指数函数模型分别对两个变量的关系进行拟合.(1)根据散点图判断,与(,均为大于零的常数)哪一个适宜作为家庭人均月纯收入关于时间代码的回归方程类型;(给出判断即可,不必说明理由)(2)根据(1)的判断结果及参考数据,求关于的回归方程.参考数据:其中,.参考公式:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计公式分别为,.【答案】(1)适宜;(2).【解析】(1)根据散点图判断,函数适宜作为家庭人均月纯收入关于时间代码的回归方程类型.(2)由,两边同时取常用对数得设,所以,因为,,,所以.把代入,得,所以,即,所以,即关于的回归方程为.【一隅三反】1.(2023·全国·模拟预测)以函数模型去拟合一组数据,,…,,设,,,则c的值为.【答案】【解析】由,两边同时取对数可得,由,可得.因为,,所以直线过点,所以,得,所以.故答案为:2.(2024山东·开学考试)某市为繁荣地方经济,大力实行人才引进政策,为了解政策的效果,统计了2018-2023年人才引进的数量(单位:万人),并根据统计数据绘制了如图所示的散点图(表示年份代码,年份代码1-6分别代表2018-2023年).(1)根据散点图判断与(均为常数)哪一个适合作为关于的回归方程类型;(给出结论即可,不必说明理由)(2)根据(1)的结果及表中的数据,求出关于的回归方程,并预测该市2025年引进人才的数量;(3)从这6年中随机抽取4年,记引进人才数量超过4万人的年数为,求的分布列和数学期望.参考数据:5.151.5517.520.953.85其中.参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:.【答案】(1)选择更合适.(2),12.68万人(3)分布列见解析,2【解析】(1)根据散点图可知,选择更合适.(2)因为,所以两边同时取常用对数,得.设,则,先求关于的线性回归方程.因为,,,所以.把代入上式,得,故预测该市2025年引进人才的数量为12.68万人.(3)这6年中,引进人才的数量超过4万人的年数有3个,所以的所有可能取值为1,2,3.,所以的分布列为123所以.3.(2024浙江宁波)某企业对2023年上半年的月利润情况进行调查统计,得到数据如下:月份123456净利润(万元)510265096195根据以上数据,绘制了散点图.(1)根据散点图判断,与(均为大于零的常数)哪一个更适宜作为描述与关系的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果求出关于的回归方程;(3)已知该企业的产品合格率为,现随机抽取9件产品进行检测,则这9件产品中合格的件数最有可能是多少?参考数据:3.5063.673.4917.509.4912.95519.01其中.参考公式:用最小二乘法求经验回归直线方程的系数公式为,,.【答案】(1)(2)(3)8件或9件【解析】(1)由于散点图呈现在曲线附近,所以选择(2)两边取对数,得,设,,建立关于的回归方程,则,,所以关于的回归方程为,所以.(3)设抽到的产品中有件合格品,则,所以,,即,,解得,所以最有可能是8件或9件.单选题1.(2024·全国·模拟预测)已知与之间的一组数据:01231357则与的线性回归方程必过定点(

)A. B.C. D.【答案】B【解析】由表格中的数据,可得,即数据的样本中心为,所以回归直线方程必过定点.故选:B.2.(2024安徽)下表数据为年我国生鲜零售市场规模(单位:万亿元),根据表中数据可求得市场规模关于年份代码的线性回归方程为,则(

)年份20172018201920202021年份代码12345市场规模4.24.44.75.15.6A.1.01 B.3.68 C.3.78 D.4.7【答案】C【解析】由题意得,,,所以.故选:C.3.(2024江西上饶)根据如下样本数据,得到回归直线方程,则(

)345678-3.0-2.00.5-0.52.54.0A., B.,C., D.,【答案】C【解析】做出散点图,由散点图判断的正负.从整体上看这些点大致分布在一条直线的周围,且该回归直线的斜率为正,在轴上的截距为负则,故选:C4.(2024辽宁)下列有关回归分析的说法正确的是(

)A.样本相关系数越大,则两变量的相关性就越强.B.回归直线就是散点图中经过样本数据点最多的那条直线.C.回归直线方程不一定过样本中心点.D.回归分析中,样本相关系数,则两变量是负相关关系.【答案】D【解析】由知识点:两变量的相关性就越强,则相关系数越接近或可知A不正确;由回归直线是基于样本数据使残差平方和最小的拟合直线可判断B不正确;由回归直线方程一定过样本中心点可知C不正确;由当相关系数时两个变量正相关,时两个变量负相关可得D正确.故选:D5.(2023·江苏苏州)为研究某地区疫情结束后一段时间内的复工率,用模型(1)和模型(2)模拟复工率y(%)与复工时间x(x的取值为5,10,15,20,25,30天)的回归关系:模型(1),模型(2),设两模型的决定系数依次为和.若两模型的残差图分别如下,则(

)A.< B.=C.> D.、关系不能确定【答案】A【解析】根据残差点图,模型(2)残差点比较均匀地落在水平的带状区域中,带状区域宽度窄,拟合精度较高,所以<,故选:A.6.(2024河南)两个变量与的回归模型中,分别选择了4个不同的模型,其中拟合效果最好的模型是(

)A.模型1的决定系数 B.模型2的决定系数C.模型3的决定系数 D.模型4的决定系数【答案】D【解析】决定系数越大(接近1),模型的拟合效果越好;决定系数越小,模型的拟合效果越差.模型4的决定系数最大、最接近1,其拟合效果最好.故选:D.7.(2024天津)下列说法中正确的个数为(

)个①互斥事件一定是对立事件.②在回归直线方程中,当解释变量每增加一个单位时,预报变量增加个单位;③两个随机变量的线性相关性越强,相关系数的绝对值越接近于;④在回归分析模型中,若相关指数越大,则残差平方和越小,模型的拟合效果越好.A. B. C. D.【答案】C【解析】对于①,对立事件一定是互斥事件,但互斥事件未必是对立事件,①错误;对于②,根据回归直线方程中回归系数的含义可知:当解释变量每增加一个单位时,预报变量增加个单位,②正确;对于③,根据相关系数的计算公式可知:相关系数的绝对值越接近,两个变量的线性相关性越强,③正确;对于④,根据回归分析的基本思想可知:相关指数越大,残差平方和越小,模型的拟合度越高,④正确.故选:C.8.(2024·浙江)假设变量与变量的对观测数据为,两个变量满足一元线性回归模型.要利用成对样本数据求参数的最小二乘估计,即求使取最小值时的的值,则(

)A. B.C. D.【答案】A【解析】因为,上式是关于的二次函数,因此要使取得最小值,当且仅当的取值为.故选:A.多选题9.(2024河南)已知变量之间的经验回归方程为,且变量的数据如下表所示:5681214108651则下列说法正确的是(

)A.变量之间负相关 B.C.当时,可估计的值为11 D.当时,残差为【答案】AC【解析】对于A选项,由,可得变量之间负相关,故A选项正确;对于B选项,,将代入经验回归方程,有,可得,故B选项错误;对于C选项,由上知,当时,,故C选项正确;对于D选项,当时,,残差为,故D选项错误.故选:AC.10(2023·江苏)蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率x(每分钟鸣叫的次数)与气温y(单位:℃)存在着较强的线性相关关系.某地观测人员根据下表的观测数据,建立了y关于x的经验回归方程,则下列说法正确的是(

)x(单位:次数/分钟)2030405060y(单位:℃)2527.52932.536A.k的值是20B.变量x,y呈正相关关系C.若x的值增加1,则y的值约增加0.25D.当蟋蟀52次/分鸣叫时,该地当时的气温预测值为33.5℃【答案】ABC【解析】由表格中的数据,可得:,,因为回归直线方程,可得,所以A正确;由经验回归方程可知,可得变量x,y呈正相关关系,所以B正确;由回归系数,可得的值增加1,则的值约增加0,所以C正确;当时,可得,所以D不正确.故选:ABC.11.(2023重庆沙坪坝·阶段练习)两个具有相关关系的变量x,y的一组数据为,,求得样本中心点为,回归直线方程为,决定系数为;若将数据调整为,,求得新的样本中心点为,回归直线方程为,决定系数为,则以下说法正确的有(

)附,,A. B.C. D.【答案】BC【解析】,А错误;的计算中,数据不变,也不变,所以不变,B正确;,C正确;由于,变成了,,,从而,都不变,所以,D错误.故选:BC12(2023·广东湛江)某服装生产商为了解青少年的身高和体重的关系,在15岁的男生中随机抽测了10人的身高和体重,数据如下表所示:编号12345678910身高/cm165168170172173174175177179182体重/kg55896165677075757880由表中数据制作成如下所示的散点图:由最小二乘法计算得到经验回归直线的方程为,相关系数为,决定系数为;经过残差分析确定为离群点(对应残差过大),把它去掉后,再用剩下的9组数据计算得到经验回归直线的方程为,相关系数为,决定系数为.则以下结论中正确的有(

)A. B.C. D.【答案】AC【解析】身高的平均数为,因为离群点的横坐标168小于平均值,纵坐标89相对过大,所以去掉离群点后经验回归直线的截距变小而斜率变大,所以,,所以A正确,B错误;去掉离群点后成对样本数据的线性相关程度更强,拟合效果会更好,所以,所以C正确,D错误.故选:AC.填空题13.(2024全国·模拟预测)根据下表中的数据得到线性回归方程为,则可以预测,当时,的值为.456789908483807568【答案】58【解析】由题意得,,,将代入中,可得,∴当时,.故答案为:58.14.(2023全国·专题练习)x和y的散点图如图所示,在相关关系中,若用拟合时的决定系数为,用拟合时的决定系数为,则,中较大的是.【答案】【解析】由题图知,用拟合的效果比拟合的效果要好,所以,故较大者为.故答案为:.15.(2024内蒙古)下列四个命题中为真命题的是.(写出所有真命题的序号)①若随机变量服从二项分布,则其方差;②若随机变量服从正态分布,且,则;③已知一组数据的方差是3,则的方差是6;④对具有线性相关关系的变量,其线性回归方程为,若样本点的中心为,则实数的值是.【答案】①②④【解析】对于①,若随机变量服从二项分布,则其方差,故①正确;对于②,若随机变量服从正态分布,且,则,故②正确;对于③,已知一组数据的方差是3,则的方差是,故③错误;对于④,对具有线性相关关系的变量,其线性回归方程为,若样本点的中心为,则,则,即实数的值是,故④正确.故答案为:①②④16.(2023·陕西西安)数学兴趣小组对具有线性相关的两个变量x和y进行了统计分析,得到了下表:x4681012ya2bc6并由表中数据求得y关于x的回归方程为,若a,b,c成等差数列,则.【答案】3【解析】由题意得,代入回归方程得,则,所以,又,所以,故答案为:3解答题17.(2024青海)某企业投资两个新型项目,投资新型项目的投资额(单位:十万元)与纯利润(单位:万元)的关系式为,投资新型项目的投资额(单位:十万元)与纯利润(单位:万元)的散点图如图所示.(1)求关于的线性回归方程;(2)若该企业有一笔资金(万元)用于投资两个项目中的一个,为了收益最大化,应如何设计投资方案?附:回归直线的斜率和截距的最小二乘估计分别为,.【答案】(1);(2)见解析.【解析】(1)由散点图可知,取时,的值分别为,所以,,,则.故关于的线性回归方程为.(2)因为投资新型项目的投资额(单位:十万元)与纯利润(单位:万元)的关系式为,所以若投资项目,则该企业所得纯利润为万元;因为关于的线性回归方程为,所以若投资项目,则该企业所得纯利润的估计值为万元.因为,所以当时,投资项目;当时,投资或项目;当时,投资项目.18.(2024福建)某市政府为调查集贸蔬菜市场个体承包摊户年收入情况,随机抽取了6个摊户进行分析,得到样本数据,),其中和分别表示第个摊户和该摊户年收入(单位:万元),如下123456567798(1)请用相关系数判断该组数据中与之间线性相关关系的强弱(若,相关性较强;若,相关性一般;若,相关性较弱);(2)求关于的线性回归方程;(3)若该集贸蔬菜市场个体承包摊户有300个,根据题设估计该集贸蔬菜市场个体承包摊户年收入总值.参考公式:相关系数,对于一组具有线性相关关系的数据,其回归直线的斜率和截距的最小二乘估计分别为,,.【答案】(1)与之间具有较强的线性相关关系(2)(3)210万元【解析】(1)题意计算得,则,,则,所以,,,所以相关系数,因为与的相关系数满足,所以与之间具有较强的线性相关关系.(2)由(1)可得,,所以(3)由题设得,可估计该集贸蔬菜市场个体承包摊户年收入总值约为(万元).19.(2024江苏)某公司为了解年研发资金投入量(单位:亿元)对年销售额(单位:亿元)的影响.对公司近12年的年研发资金投入量和年销售额的数据,进行了对比分析,建立了两个模型:①,②,其中,,,均为常数,为自然对数的底数,并得到一些统计量的值.令,,(,,,…,),经计算得如下数据:(1)请从相关系数的角度,分析哪一个模型拟合程度更好?(2)根据(1)的分析及表中数据,求关于的回归方程.附:(1)相关系数;(2)线性回归方程中,的计算公式分别为:,.【答案】(1)模型②的拟合程度更好(2)【解析】(1)设模型①和②的相关系数分别为,.由题意可得,,所以,由相关系数的相关性质可得,模型②的拟合程度更好.(2)因为,可得,即,可得,,所以关于的线性回归方程为,即关于的回归方程为.20.(2023·新疆哈密·期末)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如表:零件的个数x(个)2345加工的时间y(小时)2.5344.5

参考公式:,(1)在给定的坐标系中画出表中数据的散点图;(2)求出关于的线性回归方程;(3)预测加工10个零件需要多少小时?【答案】(1)作图见解析(2)(3)8.05【解析】(1)

(2),,,,,由公式得,所以所求回归方程为.(3)当时,,所以预测加工个零件需要小时.21.(2024重庆)研究表明,学生的学习成绩y(分)与每天投入的课后学习时间x(分钟)有较强的线性相关性.某校数学小组为了研究如何高效利用自己的学习时间,收集了该校高三(1)班学生9个月内在某学科(满分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论