专题10.2 统计案例(原卷版)_第1页
专题10.2 统计案例(原卷版)_第2页
专题10.2 统计案例(原卷版)_第3页
专题10.2 统计案例(原卷版)_第4页
专题10.2 统计案例(原卷版)_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题10.2统计案例题型一相关关系与相关系数题型二回归直线方程与样本中心题型三线性回归方程题型四非线性回归方程题型五误差分析题型六独立性检验题型一 相关关系与相关系数例1.(2022春·河南省直辖县级单位·高一济源高中校考期末)下列两个变量具有相关关系的是(

)A.正方形的边长与面积 B.匀速行驶的车辆的行驶距离与时间C.人的身高与视力 D.人的身高与体重例2.(2023春·河南濮阳·高二统考期末)某公司对其产品研发的年投资额(单位:百万元)与其年销售量(单位:千件)的数据进行统计,整理后得到如下统计表;123451.523.5815(1)求变量和的样本相关系数(精确到0.01),并推断变量和的线性相关程度;(参考;若,则线性相关性程度很强;若,则线性相关性程度一般,若,则线性相关性程度很弱.)(2)求年销售量关于年投资额的经验回归方程.参考公式:样本相关系数;经验回归方程中;参考数据练习1.(2023春·山东·高三济南市章丘区第四中学校联考阶段练习)(多选)在以下4幅散点图中,所对应的成对样本数据呈现出线性相关关系的是(

)A. B.C. D.练习2.(2023秋·高三课时练习)相关系数r是衡量两变量之间的线性相关程度的,对此有下列说法:①越接近于1,相关程度越大;②越接近于0,相关程度越小;③越接近于1,相关程度越小;④越接近于0,相关程度越大.其中正确的是(

)A.①② B.②④ C.②③ D.①④练习3.(2023春·江苏常州·高三常州高级中学校考阶段练习)(多选)某学校一名同学研究温差与本校当天新增感冒人数(人)的关系,该同学记录了5天的数据:x568912y1720252835经过拟合,发现基本符合经验回归方程,则下列说法正确的有(

)参考公式:相关系数公式A.样本中心点为 B.C.当时,残差为 D.若去掉样本点,则样本的相关系数r增大练习4.(2023春·全国·高三卫辉一中校联考阶段练习)(多选)沃柑,因其口感甜柔、低酸爽口,且营养成分高,成为大家喜欢的水果之一,目前主要种植于我国广西、云南、四川、湖南等地.得益于物流的快速发展,沃柑的销量大幅增长,同时刺激了当地农民种植沃柑的热情.根据对广西某地的沃柑种植面积情况进行调查,得到统计表如下:年份t20182019202020212022年份代码x12345种植面积y/万亩814152028附:①样本相关系数;②为经验回归方程,,,.根据上表,下列结论正确的是(

)A.该地区这5年沃柑的种植面积的方差为212B.种植面积y与年份代码x的样本相关系数约为0.972(精确到0.001)C.y关于x的经验回归方程为D.预测该地区沃柑种植面积最早在2027年能突破40万亩练习5.(2023春·重庆沙坪坝·高三重庆一中校考期中)根据国家统计局统计,我国2018—2022年的新生儿数量如下:年份编号12345年份20182019202020212022新生儿数量(单位:万人)1523146512001062956(1)由表中数据可以看出,可用线性回归模型拟合新生儿数量与年份编号的关系,请用相关系数说明相关关系的强弱;(,则认为与线性相关性很强)(2)建立关于的回归方程,并预测我国2025年的新生儿数量.参考公式及数据:r=i=1题型二 回归直线方程与样本中心例3.(2023春·上海宝山·高二上海市行知中学校考期中)已知x,y的对应值如下表所示:02468113若y与x线性相关,且回归直线方程为,则______.例4.(2023春·湖北武汉·高二武钢三中校考阶段练习)已知由样本数据点集合,求得的回归直线方程为,且,现发现两个数据点和误差较大,去除后重新求得的回归直线的斜率为,则去除后当时,的估计值为__________练习6.(2023·上海奉贤·校考模拟预测)已知一组成对数据的回归方程为,则该组数据的相关系数__________(精确到0.001).练习7.(2023春·山东聊城·高三山东聊城一中校联考阶段练习)为研究变量的相关关系,收集得到如下数据:5678998643若由最小二乘法求得关于的经验回归方程为,则据此计算残差为0的样本点是(

)A. B. C. D.练习8.(2023春·江苏连云港·高三校考阶段练习)某人工智能公司近5年的利润情况如下表所示:第年12345利润/亿元23457已知变量与之间具有线性相关关系,设用最小二乘法建立的回归直线方程为,预测该人工智能公司第6年的利润约为____亿元.练习9.(2023春·山东青岛·高三青岛市即墨区第一中学统考期中)某研究性学习小组对春季昼夜温差大小与某花卉种子发芽多少之间的关系进行研究,据统计得出了昼夜温差x(℃)与实验室种子浸泡后的发芽数y(颗)之间的线性回归方程:,且对应数据如下表:温差x(℃)12345发芽数y/颗3781012如果昼夜温差为13℃时,那么种子的发芽数大约是(

)A.20颗 B.29颗 C.30颗 D.36颗练习10.(2023春·江苏淮安·高三淮阴中学校联考阶段练习)用模型拟合一组数据组,其中.设,变换后的线性回归方程为,则_________.题型三 线性回归方程例5.(2023春·重庆北碚·高三重庆市兼善中学校考阶段练习)近年来随着教育科研的不断进步,兼善中学教育质量不断提高,某知名机构对近年来升入北京航天航空大学兼善学子人数作了如下统计年份20182019202020212022时间代号人数(人)附:回归方程中,.(1)求关于t的回归方程;(2)用所求回归方程预测兼善中学2023年(t=6)升入北航的人数例6.(2023春·陕西延安·高二陕西延安中学校考期中)某校在一次强基计划模拟考试后,从全体考生中随机抽取52名,获取他们本次考试的数学成绩(x)和物理成绩(y),绘制成如图散点图:

根据散点图可以看出y与x之间有线性相关关系,但图中有两个异常点A,B.经调查得知,A考生由于重感冒导致物理考试发挥失常,B考生因故未能参加物理考试.为了使分析结果更科学准确,剔除这两组数据后,对剩下的数据作处理,得到一些统计的值:,,,,,其中,分别表示这50名考生的数学成绩、物理成绩,,2,…,50,y与x的相关系数.(1)若不剔除A,B两名考生的数据,用52组数据作回归分析,设此时y与x的相关系数为r0.试判断r0与r的大小关系(不必说明理由);(2)求y关于x的线性回归方程(系数精确到0.01),并估计如果B考生加了这次物理考试(已知B考生的数学成绩为125分),物理成绩是多少?(精确到0.1)附:线性回归方程中中:,.练习11.(2023·安徽亳州·蒙城第一中学校联考模拟预测)为调查某地区植被覆盖面积x(单位:公顷)和野生动物数量y的关系,某研究小组将该地区等面积花分为400个区块,从中随机抽取40个区块,得到样本数据(),部分数据如下:x…2.73.63.23.9…y…50.663.752.154.3…经计算得:,,,.(1)利用最小二乘估计建立y关于x的线性回归方程;(2)该小组又利用这组数据建立了x关于y的线性回归方程,并把这两条拟合直线画在同一坐标系下,横坐标x,纵坐标y的意义与植被覆盖面积x和野生动物数量y一致.设前者与后者的斜率分别为,,比较,的大小关系,并证明.附:y关于x的回归方程中,斜率和截距的最小二乘估计公式分别为:,,

练习12.(2023春·陕西宝鸡·高三眉县中学校考阶段练习)根据统计,某蔬菜基地西红柿亩产量的增加量(百千克)与某种液体肥料每亩使用量(千克)之间的对应数据的散点图,如图所示.

(1)依据数据的散点图可以看出,可用线性回归模型拟合与的关系,请计算相关系数并加以说明(若,则线性相关程度很高,可用线性回归模型拟合);(2)求关于的回归方程,并预测液体肥料每亩使用量为千克时,西红柿亩产量的增加量约为多少?附:相关系数公式,回归方程中斜率和截距的最小二乘估计公式分别为:,.练习13.(2023春·贵州黔东南·高三校考阶段练习)随着农村电子商务体系和快递物流配送体系加快贯通,以及内容电商、直播电商等模式不断创新落地,农村电商呈现高速发展的态势,下表为2017-2022年中国农村网络零售额规模(单位:千亿元),其中2017-2022年对应的代码分别为1~6.年份代码123456农村网络零售额12.513.717.118.020.523.02(1)根据2017-2021年的数据求农村网络零售额规模关于年度代码的线性回归方程(,的值精确到0.01);(2)若由回归方程得到的估计数据与剩下的检验数据的误差不超过1千亿,则认为得到的回归方程是“理想的”,试判断(1)中所得回归方程是否是“理想的”.参考公式:,.参考数据:,.练习14.(2023春·广东广州·高三广州市真光中学校考阶段练习)某乡政府为提高当地农民收入,指导农民种植药材,并在种植药材的土地附近种草放牧发展畜牧业.牛粪、羊粪等有机肥可以促进药材的生长,发展生态循环农业.下图所示为某农户近7年种植药材的平均收入y(单位:千元)与年份代码x的折线图.并计算得到,,,,,,,其中.

(1)根据折线图判断,与哪一个适宜作为平均收入y关于年份代码x的回归方程类型?并说明理由;(2)根据(1)的判断结果及数据,建立y关于x的回归方程,并预测2023年该农户种植药材的平均收入.附:相关系数,回归直线的斜率和截距的最小二乘法估计公式分别为:,,.练习15.(2023春·安徽阜阳·高三安徽省临泉第一中学校考阶段练习)某城市的公交公司为了方便市民出行,科学规划车辆投放,在一个人员密集流动地段增设一个起点站,为了研究车辆发车间隔时间x与乘客等候人数y之间的关系,经过调查得到如下数据:间隔时间(x分钟)68101214等候人数(y人)1518202423(1)易知可用线性回归模型拟合y与x的关系,请用相关系数加以说明;(2)建立y关于x的回归直线方程,并预测车辆发车间隔时间为20分钟时乘客的等候人数.附:回归直线的斜率和截距的最小二乘估计分别为,;相关系数;.题型四 非线性回归方程例7.(2023·陕西·西北工业大学附属中学校联考模拟预测)为了反映城市的人口数量x与就业压力指数y之间的变量关系,研究人员选择使用非线性回归模型对所测数据进行拟合,并设,得到的数据如表所示,则_________.x46810z2c56例8.(2023·江苏镇江·江苏省镇江中学校考三模)经观测,长江中某鱼类的产卵数与温度有关,现将收集到的温度和产卵数的10组观测数据作了初步处理,得到如图的散点图及一些统计量表.360表中

(1)根据散点图判断,与哪一个适宜作为与之间的回归方程模型并求出关于回归方程;(给出判断即可,不必说明理由)(2)某兴趣小组抽取两批鱼卵,已知第一批中共有6个鱼卵,其中“死卵”有2个;第二批中共有8个鱼卵,其中“死卵”有3个.现随机挑选一批,然后从该批次中随机取出2个鱼卵,求取出“死卵”个数的分布列及数学期望.附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为.练习16.(2023春·辽宁·高三辽宁实验中学校考阶段练习)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)的影响,对近8年的年宣传费和年销售量数据作了初步处理,得到下面的散点图.根据散点图判断,下面四个回归模型中,最适合的是(

)A.y=bx+a B. C. D.练习17.(2023·全国·高二专题练习)规定抽球试验规则如下:盒子中初始装有白球和红球各一个,每次有放回的任取一个,连续取两次,将以上过程记为一轮.如果每一轮取到的两个球都是白球,则记该轮为成功,否则记为失败.在抽取过程中,如果某一轮成功,则停止;否则,在盒子中再放入一个红球,然后接着进行下一轮抽球,如此不断继续下去,直至成功.(1)某人进行该抽球试验时,最多进行三轮,即使第三轮不成功,也停止抽球,记其进行抽球试验的轮次数为随机变量,求的分布列和数学期望;(2)为验证抽球试验成功的概率不超过,有1000名数学爱好者独立的进行该抽球试验,记表示成功时抽球试验的轮次数,表示对应的人数,部分统计数据如下:1234523298604020求关于的回归方程,并预测成功的总人数(精确到1);练习18.(2023·河北·统考模拟预测)为了研究某种细菌随天数变化的繁殖个数,设,收集数据如下:天数123456繁殖个数612254995190表(Ⅰ)3.5062.833.5317.50596.5712.08表(Ⅱ)(1)根据表(Ⅰ)在图中作出繁殖个数关于天数变化的散点图,并由散点图判断(,为常数)与(,为常数,且,)哪一个适宜作为繁殖个数关于天数变化的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)中的判断结果和表(Ⅱ)中的数据,建立关于的经验回归方程(结果保留2位小数).附:对于一组数据,,…,,其经验回归直线的斜率和截距的最小二乘法估计分别为,.练习19.(2023春·山东聊城·高三山东聊城一中校联考阶段练习)今年刚过去的4月份是“全国消费促进月”,各地拼起了特色经济”,带动消费复苏、市场回暖.“小饼烤炉加蘸料,灵魂烧烤三件套”,最近,淄博烧烤在社交媒体火爆出圈,吸引全国各地的游客坐着高铁,直奔烧烤店,而多家店铺的营业额也在近一个月内实现了成倍增长.因此某烧烤店老板考虑投入更多的人工成本,现有以往的服务人员增量x(单位:人)与年收益增量y单位:万元)的数据如下:服务人员增量x/人234681013年收益增量y/万元13223142505658据此,建立了y与x的两个回归模型:

模型①:由最小二乘公式可求得与的一元线性经验回归方程为;模型②:由散点图(如图)的样本点分布,可以认为样本点集中在曲线的附近.对数据进行初步处理后,得到了一些统计的量的值:,,,,其中,(1)根据所给的统计量,求模型②中关于的经验回归方程(精确到0.1);(2)根据下列表格中的数据,比较两种模型的决定系数,并选择拟合精度更高的模型,预测服务人员增加25人时的年收益增量.回归模型模型①模型②回归方程182.479.2附:样本的最小二乘估计公式为,,刻画样本回归效果的决定系数练习20.(2023·全国·二三专题练习)党的二十大报告提出,从现在起,中国共产党的中心任务就是团结带领全国各族人民全面建成社会主义现代化强国、实现第二个百年奋斗目标,以中国式现代化全面推进中华民族伟大复兴.高质量发展是全面建设社会主义现代化国家的首要任务.加快实现高水平科技自立自强,才能为高质量发展注入强大动能.某科技公司积极响应,加大高科技研发投入,现对近十年来高科技研发投入情况分析调研,其研发投入y(单位:亿元)的统计图如图1所示,其中年份代码x=1,2,…,10分别指2013年,2014年,…,2022年.

现用两种模型①,②分别进行拟合,由此得到相应的回归方程,并进行残差分析,得到图2所示的残差图.结合数据,计算得到如下值:752.2582.54.512028.67表中.(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由;(2)根据(1)中所选模型,求出y关于x的回归方程;根据所选模型,求该公司2028年高科技研发投入y的预报值.(回归系数精确到0.01)附:对于一组数据其回归直线的斜率和截距的最小二乘估计分别为.题型五 误差分析例9.(2023春·河南濮阳·高三统考期末)某城市选用一种植物进行绿化,设其中一株幼苗从观察之日起,第天的高度为,测得一些数据如下表所示第天1234567高度1469111213由表格数据可得到关于的经验回归方程为,则第6天的残差为(

)A. B.2.12 C. D.0.08例10.(2023春·浙江·高二统考阶段练习)(多选)某兴趣小组研究光照时长和向日葵种子发芽数量颗之间的关系,采集5组数据,作如图所示的散点图.若去掉后,下列说法正确的是(

A.相关系数的绝对值变小B.决定系数变大C.残差平方和变大D.解释变量与响应变量的相关性变强练习21.(2023春·河南新乡·高三统考阶段练习)两个变量与的回归模型中,分别选择了4个不同的模型,其中拟合效果最好的模型是(

)A.模型1的决定系数 B.模型2的决定系数C.模型3的决定系数 D.模型4的决定系数练习22.(2023·河南南阳·南阳中学校考模拟预测)网络直播带货助力乡村振兴,它作为一种新颖的销售土特产的方式,受到社会各界的追捧.某直播间开展地标优品带货直播活动,其主播直播周期次数(其中10场为一个周期)与产品销售额(千元)的数据统计如下:直播周期数12345产品销售额(千元)37153040根据数据特点,甲认为样本点分布在指数型曲线的周围,据此他对数据进行了一些初步处理.如下表:5538265978101其中,(1)请根据表中数据,建立关于的回归方程(系数精确到);(2)①乙认为样本点分布在直线的周围,并计算得回归方程为,以及该回归模型的相关指数,试比较甲、乙两人所建立的模型,谁的拟合效果更好?(3)由①所得的结论,计算该直播间欲使产品销售额达到8万元以上,直播周期数至少为多少?(最终答案精确到1)附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,,相关指数:.练习23.(2023·高二课时练习)已知x、y的取值如下表:x1234y32487288根据表中的数据求得y关于x的回归直线方程为,则这组数据相对于所求的回归直线方程的4个残差的方差为______.练习24.(2023·四川成都·四川省成都市玉林中学校考模拟预测)如图是某企业2016年至2022年的污水净化量(单位:吨)的折线图.注:年份代码1~7分别对应年份2016~2022.

(1)由折线图看出,可用线性回归模型拟合y和t的关系,请建立y关于t的回归方程,并预测2025年该企业的污水净化量;(2)请用相关指数说明回归方程预报的效果.参考数据:;参考公式:线性回归方程;相关指数:练习25.(2023·全国·高三专题练习)某种产品的广告支出费用(单位:万元)与销售量(单位:万件)之间的对应数据如下表所示:根据表中的数据可得回归直线方程,,以下说法正确的是(

)广告支出费用2.22.64.05.35.9销售量3.85.47.011.6122A.销售量的多少有96%是由广告支出费用引起的B.销售量的多少有4%是由广告支出费用引起的C.第三个样本点对应的残差,回归模型的拟合效果一般D.第三个样本点对应的残差,回归模型的拟合效果较好题型六 独立性检验例11.(2023·全国·模拟预测)2023上海蒸蒸日上迎新跑于2023年2月19日举办,该赛事设有21.6公里竞速跑、5.4公里欢乐跑两个项目.某马拉松兴趣小组为庆祝该赛事,举行一场小组内有关于马拉松知识的有奖比赛,一共有25人报名(包括20位新成员和5位老成员),其中20位新成员的得分情况如下表所示(满分30分):得分人数234641得分在20分以上(含20分)的成员获得奖品一份.(1)请根据上述表格中的统计数据,将下面的列联表补充完全,并通过计算判断在20位新成员中,是否有的把握认为“获奖”与性别有关?没获奖获奖合计男4女78合计(2)若5名老成员的性别相同并全部获奖,且进行计算发现在所有参赛人员中,有的把握认为“获奖”与性别有关.请判断这5名老成员的性别?附:参考公式:.临界值表:0.1000.0500.0100.0012.7063.8416.63510.828例12.(2023·全国·高三专题练习)为探究某药物对小鼠的生长抑制作用,将40只小鼠均分为两组,分别为对照组(不加药物)和实验组(加药物).(1)设其中两只小鼠中对照组小鼠数目为,求的分布列和数学期望;(2)测得40只小鼠体重如下(单位:g):(已按从小到大排好)对照组:17.318.420.120.421.523.224.624.825.025.426.126.326.426.526.827.027.427.527.628.3实验组:5.46.66.86.97.88.29.410.010.411.214.417.319.220.223.623.824.525.125.226.0(i)求40只小鼠体重的中位数m,并完成下面2×2列联表:对照组实验组(ii)根据2×2列联表,能否有95%的把握认为药物对小鼠生长有抑制作用.参考数据:0.100.050.0102.7063.8416.635练习26.(2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论