第八章 成对数据的统计分析 章末小结及测试(原卷版)人教版高中数学精讲精练选择性必修三_第1页
第八章 成对数据的统计分析 章末小结及测试(原卷版)人教版高中数学精讲精练选择性必修三_第2页
第八章 成对数据的统计分析 章末小结及测试(原卷版)人教版高中数学精讲精练选择性必修三_第3页
第八章 成对数据的统计分析 章末小结及测试(原卷版)人教版高中数学精讲精练选择性必修三_第4页
第八章 成对数据的统计分析 章末小结及测试(原卷版)人教版高中数学精讲精练选择性必修三_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

【公众号:该学习了】第八章成对数据的统计分析章末小结及测试考法一相关系数【例1-1】(2024·山西运城)对变量,有观测数据,得散点图1;对变量,有观测数据,得散点图2.表示变量,之间的样本相关系数,表示变量,之间的样本相关系数,则(

)A. B.C. D.【例1-2】(2024·湖南)某骑行爱好者在专业人士指导下对近段时间骑行锻炼情况进行统计分析,统计每次骑行期间的身体综合指标评分与骑行用时(单位:小时)如下表:身体综合指标评分12345用时小时)9.58.87.876.1由上表数据得到的正确结论是(

)参考数据:参考公式:相关系数.A.身体综合指标评分与骑行用时正相关B.身体综合指标评分与骑行用时的相关程度较弱C.身体综合指标评分与骑行用时的相关程度较强D.身体综合指标评分与骑行用时的关系不适合用线性回归模型拟合【例1-3】(2024陕西汉中)大学生刘铭去某工厂实习,实习结束时从自己制作的某种零件中随机选取了10个样品,测量每个零件的横截面积(单位:)和耗材量(单位:),得到如下数据:样本号12345678910总和零件的横截面积0.030.050.040.070.070.040.050.060.060.050.52耗材量0.240.400.230.550.500.340.350.450.430.413.9并计算得.(1)估算刘铭同学制作的这种零件平均每个零件的横截面积以及平均一个零件的耗材量;(2)求刘铭同学制作的这种零件的横截面积和耗材量的样本相关系数(精确到0.01);(3)刘铭同学测量了自己实习期制作的所有这种零件的横截面积,并得到所有这种零件的横截面积的和为,若这种零件的耗材量和其横截面积近似成正比,请帮刘铭计算一下他制作的零件的总耗材量的估计值.附:相关系数.【例1-4】(2023·河南·模拟预测)党的二十大以来,国家不断加大对科技创新的支持力度,极大鼓舞了企业持续投入研发的信心.某科技企业在国家一系列优惠政策的大力扶持下,通过不断的研发和技术革新,提升了企业收益水平.下表是对2023年1~5月份该企业的利润y(单位:百万)的统计.月份1月2月3月4月5月月份编号x12345利润y(百万)712131924(1)根据统计表,求该企业的利润y与月份编号x的样本相关系数(精确到0.01),并判断它们是否具有线性相关关系(,则认为y与x的线性相关性较强,,则认为y与x的线性相关性较弱.);(2)该企业现有甲、乙两条流水线生产同一种产品.为对产品质量进行监控,质检人员先用简单随机抽样的方法从甲、乙两条流水线上分别抽取了5件、3件产品进行初检,再从中随机选取3件做进一步的质检,记抽到“甲流水线产品”的件数为,试求的分布列与期望.附:相关系数考法二线性回归方程【例2-1】(2023山东滨州·期末)某学校一同学研究温差(单位:℃)与本校当天新增感冒人数(单位:人)的关系,该同学记录了5天的数据:5689121620252836由上表中数据求得温差与新增感冒人数满足经验回归方程,则下列结论不正确的是(

)A.与有正相关关系 B.经验回归直线经过点C. D.时,残差为0.2【例2-2】(2024·全国·模拟预测)(多选)节约用电是低碳生活的重要组成部分,契合环保和社会可持续发展的原则,是推动“双碳”目标实现的一场全社会的行动,离不开你我的共同参与.某企业从2019年开始加强节电管理,收效明显.下表是该企业自2018年至2022年的用电量:年份2018年2019年2020年2021年2022年年份编号x12345用电量y(单位:)3.242.942.602.222.00根据表格数据计算得,.已知y与x具有线性相关关系,则下列说法中正确的是(

)(附:,)A.该企业2018年至2022年平均每年用电量为B.y与x正相关C.估计该企业2017年用电量为D.预测该企业2023年用电量为【例2-3】(2023山东日照)发展新能源汽车是我国从汽车大国迈向汽车强国的必由之路,是应对气候变化推动绿色发展的战略举措.随着国务院《新能源汽车产业发展规划(2021—2035)》的发布,我国自主品牌汽车越来越具备竞争力.国产某品牌汽车对市场进行调研,统计了该品牌新能源汽车在某城市年前几个月的销售量(单位:辆),用表示第月份该市汽车的销售量,得到如下统计表格:123456728323745475260(1)经研究,、满足线性相关关系,求关于的线性回归方程,并根据此方程预测该店月份的成交量(、按四舍五入精确到整数);(2)该市某店为感谢客户,决定针对该品牌的汽车成交客户开展抽奖活动,设“一等奖”、“二等奖”和“祝您平安”三种奖项,“一等奖”奖励千元;“二等奖”奖励千元;“祝您平安”奖励纪念品一份.在一次抽奖活动中获得“二等奖”的概率为,获得一份纪念品的概率为,现有甲、乙两个客户参与抽奖活动,假设他们是否中奖相互独立,求此二人所获奖金总额(千元)的分布列及数学期望.参考数据及公式:,,.【例2-4】(2024重庆·阶段练习)党的十八大以来,全国各地区各部门持续加大就业优先政策实施力度,促进居民收入增长的各项措施持续发力,居民分享到更多经济社会发展红利,居民收入保持较快增长,收入结构不断优化,随着居民总收入较快增长,全体居民人均可支配收入也在不断提升.下表为重庆市20142022年全体居民人均可支配收入,将其绘制成散点图(如图1),发现全体居民人均可支配收入与年份具有线性相关关系.(数据来源于重庆市统计局2023-05-06发布).年份201420152016201720182019202020212022全体居民人均可支配收入(元)183522011022034241532638628920308243380335666(1)设年份编号为(2014年的编号为1,2015年的编号为2,依此类推),记全体居民人均可支配收入为(单位:万元),求经验回归方程(结果精确到0.01),并根据所求回归方程,预测2023年重庆市全体居民人均可支配收入;(2)为进一步对居民人均可支配收入的结构进行分析,某分析员从20142022中任取3年的数据进行分析,将选出的人均可支配收入超过3万的年数记为,求随机变量的分布列与数学期望.参考数据:.参考公式:对于一组数据,其回归直线方程的斜率和截距的最小二乘估计分别为.考法三独立性检验【例3-1】(2023江苏常州·期末)某单位为了调查性别与对工作的满意程度是否具有相关性,随机抽取了若干名员工,所得数据统计如下表所示,其中,且,若有的把握可以认为性别与对工作的满意程度具有相关性,则的值是.对工作满意对工作不满意男女附:,其中.【例3-2】(2024河南省直辖县级单位·期中)为了解患某疾病是否与性别有关,随机地调查了50人,得到如下的列联表:患该疾病不患该疾病总计男151025女52025总计203050则(填“有”或“没有”)的把握认为患该疾病与性别有关.参考公式:,其中.参考数据:0.0500.0100.001k3.8416.63510.828【例3-3】(2024·山东淄博)为了解居民体育锻炼情况,某地区对辖区内居民体育锻炼进行抽样调查.统计其中400名居民体育锻炼的次数与年龄,得到如下的频数分布表.

年龄次数[20,30)[30,40)[40,50)[50,60]每周0~2次70553659每周3~4次25404431每周5次及以上552010(1)若把年龄在的锻炼者称为青年,年龄在的锻炼者称为中年,每周体育锻炼不超过2次的称为体育锻炼频率低,不低于3次的称为体育锻炼频率高,根据小概率值的独立性检验判断体育锻炼频率的高低与年龄是否有关联;(2)从每周体育锻炼5次及以上的样本锻炼者中,按照表中年龄段采用按比例分配的分层随机抽样,抽取8人,再从这8人中随机抽取3人,记这3人中年龄在与的人数分别为,求ξ的分布列与期望;(3)已知小明每周的星期六、星期天都进行体育锻炼,且两次锻炼均在跑步、篮球、羽毛球3种运动项目中选择一种,已知小明在某星期六等可能选择一种运动项目,如果星期六选择跑步、篮球、羽毛球,则星期天选择跑步的概率分别为,求小明星期天选择跑步的概率.参考公式:附:α0.100.050.010.0050.0012.7063.8416.6357.87910.828【例3-4】(2024·江苏徐州)某中学对该校学生的学习兴趣和预习情况进行长期调查,学习兴趣分为兴趣高和兴趣一般两类,预习分为主动预习和不太主动预习两类,设事件A:学习兴趣高,事件B:主动预习.据统计显示,,,.(1)计算和的值,并判断A与B是否为独立事件;(2)为验证学习兴趣与主动预习是否有关,该校用分层抽样的方法抽取了一个容量为的样本,利用独立性检验,计算得.为提高检验结论的可靠性,现将样本容量调整为原来的倍,使得能有99.5%的把握认为学习兴趣与主动预习有关,试确定的最小值.附:,其中.0.100.050.0100.0050.001k2.7063.8416.6357.87910.828考法四非线性回归方程【例4-1】(2023山东·开学考试)为研究某池塘中水生植物的覆盖水塘面积(单位:)与水生植物的株数(单位:株)之间的相关关系,收集了4组数据,用模型去拟合与的关系,设与的数据如表格所示:得到与的线性回归方程,则(

)346722.54.57A.-2 B.-1 C. D.【例4-2】(2024山东聊城·阶段练习)今年刚过去的4月份是“全国消费促进月”,各地拼起了特色经济”,带动消费复苏、市场回暖.“小饼烤炉加蘸料,灵魂烧烤三件套”,最近,淄博烧烤在社交媒体火爆出圈,吸引全国各地的游客坐着高铁,直奔烧烤店,而多家店铺的营业额也在近一个月内实现了成倍增长.因此某烧烤店老板考虑投入更多的人工成本,现有以往的服务人员增量x(单位:人)与年收益增量y单位:万元)的数据如下:服务人员增量x/人234681013年收益增量y/万元13223142505658据此,建立了y与x的两个回归模型:

模型①:由最小二乘公式可求得与的一元线性经验回归方程为;模型②:由散点图(如图)的样本点分布,可以认为样本点集中在曲线的附近.对数据进行初步处理后,得到了一些统计的量的值:,,,,其中,(1)根据所给的统计量,求模型②中关于的经验回归方程(精确到0.1);(2)根据下列表格中的数据,比较两种模型的决定系数,并选择拟合精度更高的模型,预测服务人员增加25人时的年收益增量.回归模型模型①模型②回归方程182.479.2附:样本的最小二乘估计公式为,,刻画样本回归效果的决定系数【例4-3】(2024吉林长春·阶段练习)《中共中央国务院关于全面推进乡村振兴加快农业农村现代化的意见》,这是21世纪以来第个指导“三农”工作的中央一号文件.文件指出,民族要复兴,乡村必振兴,要大力推进数字乡村建设,推进智慧农业发展.某乡村合作社借助互联网直播平台进行农产品销售,众多网红主播参与到直播当中,在众多网红直播中,统计了名网红直播的观看人次和农产品销售量的数据,得到如图所示的散点图.(1)利用散点图判断,和哪一个更适合作为观看人次和销售量的回归方程类型;(只要给出判断即可,不必说明理由)(2)对数据作出如下处理:得到相关统计量的值如表:其中令,.根据(1)的判断结果及表中数据,求(单位:千件)关于(单位:十万次)的回归方程,并预测当观看人次为万人时的销售量;参考数据和公式:,附:对于一组数据、、、,其回归线的斜率和截距的最小二乘估计分别为:,.考法五综合运用【例5-1】(2023辽宁沈阳·期末)(多选)对两个变量和进行回归分析,则下列结论正确的为()A.回归直线至少会经过其中一个样本点B.残差平方和越小的模型,拟合的效果越好C.建立两个回归模型,模型的相关系数,模型的相关系数,则模型的拟合度更好D.以模型去拟合某组数据时,为了求出回归方程,设,将其变换后得到线性方程,则的值分别为【例5-2】(2024·河南南阳)(多选)下列说法中,正确的是(

)A.设有一个经验回归方程为,变量增加1个单位时,平均增加2个单位B.已知随机变量,若,则C.两组样本数据和的方差分别为.若已知且,则D.已知一系列样本点的经验回归方程为,若样本点与的残差相等,则【例5-3】(2023浙江湖州·期末)(多选)下列结论中正确的是(

)A.在列联表中,若每个数据均变为原来的2倍,则的值不变B.已知随机变量服从正态分布,若,则C.在一组样本数据的散点图中,若所有样本点都在直线上,则这组样本数据的样本相关系数为0.9D.分别抛掷2枚相同的硬币,事件表示为“第1枚为正面”,事件表示为“两枚结果相同”,则事件是相互独立事件单选题1.(2023湖北)调查某种群花萼长度和花瓣长度,所得数据如图所示,其中相关系数,下列说法正确的是(

)A.花瓣长度和花萼长度没有相关性B.花瓣长度和花萼长度呈现负相关C.花瓣长度和花萼长度呈现正相关D.若从样本中抽取一部分,则这部分的相关系数一定是2.(2023陕西西安)如图是某地在50天内感染新冠病毒的累计病例y(单位:万人)与时间x(单位:天)的散点图,则下列最适宜作为此模型的回归方程类型的是(

A. B.C. D.3.(2024高三·全国·专题练习)下列命题中①散点图可以直观地判断两个变量是否具有线性相关关系;②回归直线就是散点图中经过样本数据点最多的那条直线;③回归分析和独立性检验没有什么区别;④回归直线一定经过样本中心点.其中正确的命题个数为()A. B. C. D.4.(2024天津)中国茶文化博大精深、茶水的口感与茶叶的类型和水的温度有关,某数学建模小组建立了茶水冷却时间和茶水温度的一组数据,经过分析,提出了四种回归模型,①②③④四种模型的残差平方和的值分别是.则拟合效果最好的模型是(

)A.模型① B.模型② C.模型③ D.模型④5.(2024河北)集校为了解本校高一男生身高和体重的相关关系,在该校高一年级随机抽取了7名男生,测量了他们的身高和体重得下表:身高(单位:167173175177178180181体重(单位:90545964677276由表格制作成如图所示的散点图:

由最小二乘法计算得到经验回归直线的方程为,其相关系数为;经过残差分析,点对应残差过大,把它去掉后,再用剩下的6组数据计算得到经验回归直线的方程为,相关系数为.则下列选项正确的是(

)A.B.C.D.【答案】A6.(2023高二下·全国·课时练习)经统计,用于数学学习的时间(单位:小时)与成绩(单位:分)近似于线性相关关系.对某小组学生每周用于数学的学习时间与数学成绩进行数据收集如下:x1516181922y10298115115120由样本中样本数据求得回归直线方程为,则点与直线的位置关系是(

)A. B.C. D.与的大小无法确定7.(2024天津)有人调查了某高校14名男大学生的身高及其父亲的身高,得到如下数据表:编号1234567891011121314父亲身高/cm174170173169182172180172168166182173164180儿子身高/cm176176170170185176178174170168178172165182利用最小二乘法计算的儿子身高关于父亲身高的回归直线为.根据以上信息进行的如下推断中,正确的是(

)A.当时,,若一位父亲身高为,则他儿子长大成人后的身高一定是B.父亲身高和儿子身高是正相关,因此身高更高的父亲,其儿子的身高也更高C.从回归直线中,无法判断父亲身高和儿子身高是正相关还是负相关D.回归直线的斜率可以解释为父亲身高每增加,其儿子身高平均增加8.(2024四川绵阳)有一散点图如图所示,在5个数据中去掉后,给出下列说法:①相关系数r变大;②相关指数变大;③残差平方和变小;④变量x与变量y的相关性变强.其中正确说法的个数为(

)A.1个 B.2个 C.3个 D.4个多选题9.(2024·湖南邵阳)下列命题中,说法正确的有(

)A.设随机变量,则B.成对样本数据的线性相关程度越强,样本相关系数越接近于1C.决定系数越大,表示残差平方和越小,即模型的拟合效果越好D.基于小概率值的检验规则是:当时,我们就推断不成立,即认为和不独立,该推断犯错误的概率不超过;当时,我们没有充分证据推断不成立,可以认为和独立10.(2023山西·期末)下列说法正确的是(

)A.设随机变量的均值为,是不等于的常数,则相对于的偏离程度小于相对于的偏离程度(偏离程度用差的平方表示)B.若一组数据,,…,的方差为0,则所有数据都相同C.用决定系数比较两个回归模型的拟合效果时,越大,残差平方和越小,模型拟合效果越好D.在对两个分类变量进行独立性检验时,如果列联表中所有数据都扩大为原来的10倍,在相同的检验标准下,再去判断两变量的关联性时,结论不会发生改变11.(2023江苏常州)已知由样本数据组成的一个样本,根据最小二乘法求得线性回归方程为且,去除两个异常数据和后,得到新的线性回归直线的斜率为3,则下列结论中正确的是(

)A.相关变量,具有正相关关系B.去除异常数据后,新的平均数C.去除异常数据后的线性回归方程为D.去除异常数据后,随值增加,的值增加速度变大12.(2023浙江宁波)某电商平台为了对某一产品进行合理定价,采用不同的单价在平台试销,得到的数据如下表所示:单价x/元88.599.510销量y/万件8985807868根据以上数据得到与具有较强的线性关系,若用最小二乘估计得到经验回归方程为,则(

)A.相关系数 B.点一定在经验回归直线上C. D.时,对应销量的残差为填空题13.(2024江西·开学考试)商家为了解某品牌取暖器的月销售量Y(台)与月平均气温之间的关系,随机统计了某4个月该品牌取暖器的月销售量与当月平均气温,其数据如下表;平均气温()10741月销售量(台)26375582由表中数据算出线性回归方程中的,当平均气温为时,此品牌取暖器的月销售量为台(结果保留整数).14.(2024·山西吕梁)某市2018年至2022年新能源汽车年销量(单位:百台)与年份代号的数据如下表:年份20182019202020212022年份代号01234年销量1015203035若根据表中的数据用最小二乘法求得关于的回归直线方程为,据此计算相应于样本点的残差为.15.(2024江苏·课时练习)在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线的周围.令,求得线性回归方程为,则该模型的非线性回归方程为.16(2023江苏·单元测试)为了调查患慢性气管炎是否与吸烟有关,调查了100名50岁以下的人,调查结果如下表:患慢性气管炎未患慢性气管炎合计吸烟20m40不吸烟n5560合计2575100根据列联表数据,求得χ2=(保留3位有效数字),根据下表,有的把握认为患慢性气管炎与吸烟有关.附:P(χ2≥x0)0.0500.0100.001x03.8416.63510.828χ2=.解答题17.(2023·全国·模拟预测)新冠病毒奥密克戎毒株开始流行后,为了控制新冠肺炎疫情,杭州某高中开展了每周核酸检测工作.周一至周五,每天中午13:30开始,安排位师生进行核酸检测,教职工每天都要检测,用五天时间实现全员覆盖.(1)该校教职工有人,高二学生有人,高三学生有人.①用分层抽样的方法,求高一学生每天的检测人数.②高一年级共个班,该年级每天进行核酸检测的学生有两种安排方案.方案一:集中来自部分班级;方案二:分散来自所有班级.你认为哪种方案更合理?给出理由.(2)学校开展核酸检测的第一周,周一至周五核酸检测用时记录如下表.第天用时①计算变量和的相关系数(精确到),并说明两变量的线性相关程度;②根据①中的计算结果,判定变量和是正相关还是负相关,并给出可能的原因.参考数据和公式:,相关系数.18.(2024·贵州贵阳)某学校为学生开设了一门模具加工课,经过一段时间的学习,拟举行一次模具加工大赛,学生小明、小红打算报名参加大赛.赛前,小明、小红分别进行了为期一周的封闭强化训练,下表记录了两人在封闭强化训练期间每天加工模具成功的次数,其中小明第7天的成功次数忘了记录,但知道,(,分别表示小明、小红第天的成功次数).第一天第二天第三天第四天第五天第六天第七天序号1234567小明成功次数162020253036小红成功次数16222526323535(1)求这7天内小明成功的总次数不少于小红成功的总次数的概率;(2)根据小明这7天内前6天的成功次数,求其成功次数关于序号的线性回归方程,并估计小明第七天成功次数的值.参考公式:回归方程中斜率与截距的最小二乘估计公式分别为:,.参考数据:;.19.(2023山东菏泽·期末)2023年9月23日第19届亚运会在杭州开幕,本届亚运会共设40个竞赛大项,包括31个奥运项目和9个非奥运项目.为研究不同性别学生对杭州亚运会项目的了解情况,某学校进行了一次抽样调查,分别抽取男生和女生各50名作为样本,设事件“了解亚运会项目”,“学生为女生”,据统计,.(1)根据已知条件,填写列联表,并依据的独立性检验,能否认为该校学生对亚运会项目的了解情况与性别有关?(2)现从该校了解亚运会项目的学生中,采用分层随机抽样的方法随机抽取9名学生,再从这9名学生中随机抽取4人,设抽取的4人中男生的人数为,求的分布列和数学期望.附:,.0.0500.0100.0013.8416.63510.82820(2023·贵州贵阳)为了研究某种细菌随天数x变化的繁殖个数y,收集数据如下:天数x123456繁殖个数y612254995190(1)在图中作出繁殖个数y关于天数x变化的散点图,并由散点图判断(a,b为常数)与(,为常数,且,)哪一个适宜作为繁殖个数y关于天数x变化的回归方程类型?(给出判断即可,不必说明理由)(2)对于非线性回归方程(,为常数,且,),令,可以得到繁殖个数的对数z关于天数x具有线性关系及一些统计量的值.3.5062.833.5317.50596.5712.09①证明:“对于非线性回归方程,令,可以得到繁殖个数的对数z关于天数x具有线性关系(即,β,α为常数)”;②根据(1)的判断结果及表中数据,建立y关于x的回归方程(系数保留2位小数).附:对于一组数据,,…,,其回归直线方程的斜

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论