8.1成对数据的相关分析(分层练习)-2022-2023学年高二数学同步精品课堂(沪教版2020选择性必修第二册)(原卷版)_第1页
8.1成对数据的相关分析(分层练习)-2022-2023学年高二数学同步精品课堂(沪教版2020选择性必修第二册)(原卷版)_第2页
8.1成对数据的相关分析(分层练习)-2022-2023学年高二数学同步精品课堂(沪教版2020选择性必修第二册)(原卷版)_第3页
8.1成对数据的相关分析(分层练习)-2022-2023学年高二数学同步精品课堂(沪教版2020选择性必修第二册)(原卷版)_第4页
8.1成对数据的相关分析(分层练习)-2022-2023学年高二数学同步精品课堂(沪教版2020选择性必修第二册)(原卷版)_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

8.1成对数据的相关分析(分层练习)【夯实基础】一、单选题1.(2023春·上海嘉定·高三统考阶段练习)如图是根据的观测数据得到的散点图,可以判断变量,具有线性相关关系的图是(

)A.①② B.③④ C.②③ D.①④2.(2023·上海·高三专题练习)通过抽样调研发现,当地第三季度的医院心脑血管疾病的人数和便利店购买冷饮的人数的相关系数很高,甲认为这是巧合,两者其实没有关系:乙认为冷饮的某种摄入成分导致了疾病;丙认为病人对冷饮会有特别需求:丁认为两者的相关关系是存在的,但不能视为因果,请判断哪位成员的意见最可能成立(

)A.甲 B.乙 C.丙 D.丁3.(2023春·上海徐汇·高二统考阶段练习)下列关于散点图的说法中,正确的是(

)A.任意给定统计数据,都可以绘制散点图 B.从散点图中可以看出两个量是否具有一定的关系C.从散点图中可以看出两个量的因果关系 D.从散点图中无法看出数据的分布情况4.(2023秋·上海浦东新·高二统考期末)小明同学每天阅读数学文化相关的书籍,他每天阅读的页数分别为:4、5、4.5、5、6、8、7、5、4.5、6(单位:页).下列图形中不利于描述这些数据的是(

)A.条形图 B.茎叶图 C.散点图 D.扇形图5.(2023春·高二课时练习)下列有关样本线性相关系数r的说法,错误的是()A.相关系数r可用来衡量x与y之间的线性相关程度B.,且越接近0,相关程度越小C.,且越接近1,相关程度越大D.,且越接近1,相关程度越小6.(2023·全国·高三专题练习)如图是根据的观测数据得到的散点图,可以判断变量具有线性相关关系的有(

)A.①② B.①③ C.②④ D.③④7.(2023·全国·高三专题练习)某初级中学有700名学生,在2021年秋季运动会中,为响应全民健身运动的号召,要求每名学生都必须在“立定跳远”与“坐位体前屈”中选择一项参加比赛.根据报名结果知道,有的男生选择“立定跳远”,有的女生选择“坐位体前屈”,且选择“立定跳远”的学生中女生占,则参照附表,下列结论正确的是(

)附:0.100.050.0252.7063.8415.024,n=a+b+c+d.A.在犯错误的概率不超过2.5%的前提下,认为选择运动项目与性别无关B.在犯错误的概率不超过5%的前提下,认为选择运动项目与性别无关C.有97.5%的把握认为选择运动项目与性别有关D.有95%的把握认为选择运动项目与性别有关8.(2023·湖南·湖南师大附中校联考模拟预测)下列关于统计概率知识的判断,正确的是(

)A.将总体划分为2层,通过分层随机抽样,得到两层的样本平均数和样本方差分别为和,且已知,则总体方差B.在研究成对数据的相关关系时,相关关系越强,相关系数越接近于1C.已知随机变量服从正态分布,若,则D.按从小到大顺序排列的两组数据:甲组:;乙组:,若这两组数据的第30百分位数、第50百分位数都分别对应相等,则二、填空题9.(2023·高三课时练习)观察下列图形,其中两个变量x、y具有相关关系的图是______.(写出所有满足条件的图形序号)10.(2023秋·陕西西安·高三西安市铁一中学校考期末)如表中给出五组数据,从中选出四组使其线性相关最大,且保留第一组,那么应去掉第___________组.12345-5-4-3-24-3-24-16三、双空题11.(2023·高三课时练习)对变量x、y有观测数据(i=1,2,…,10),得散点图如图1所示;对变量u、v有观测数据(i=1,2,…,10),得散点图如图2所示.由这两个散点图函可以判断变量x与y______,u与v______.(填写“正相关”或“负相关”)12.(2023·高三课时练习)已知变量x和y满足关系,变量y与z负相关,则可以判断变量x与y______,x与z______.(填写“正相关”或“负相关”)四、解答题13.(2023·辽宁朝阳·校联考一模)秋天的第一杯奶茶是一个网络词汇,最早出自四川达州一位当地民警之口,民警用“秋天的第一杯奶茶”顺利救下一名女孩,由此而火爆全网.后来很多人开始在秋天里买一杯奶茶送给自己在意的人.某奶茶店主记录了入秋后前7天每天售出的奶茶数量(单位:杯)如下:日期第一天第二天第三天第四天第五天第六天第七天日期代码1234567杯数4152226293132(1)请根据以上数据,绘制散点图,并根据散点图判断,与哪一个更适宜作为y关于x的回归方程模型(给出判断即可,不必说明理由);(2)建立y关于x的回归方程(结果保留1位小数),并根据建立的回归方程,试预测要到哪一天售出的奶茶才能超过35杯?(3)若每天售出至少25杯即可盈利,则从第一天至第七天中任选三天,记随机变量X表示盈利的天数,求随机变量X的分布列.参考公式和数据:其中回归直线方程中,22.71.2759235.113.28.214.(2023·全国·高三专题练习)为打造“四态融合、产村一体”的望山、见水、忆乡愁的美丽乡村,增加农民收入,某乡政府在近几年中任选了5年,经统计,年份代号x与景区农家乐接待游客人数y(单位:万人)的数据如下表:年份代号x23578接待游客人数y(万人)33.546.58(1)根据数据说明变量x与y是正相关还是负相关;(2)求相关系数r的值,并说明年份与接待游客数的相关性的强与弱;(3)分析近几年中该景区农家乐接待游客人数y的变化情况,求该景区农家乐接待游客人数关于年份代号的回归直线方程;并预测在年份代号为10时该景区农家乐接待游客的人数(单位:万人,精确到小数点后2位).附:一般地,当r的绝对值大于0.75时认为两个变量之间有很强的线性关系.,.【能力提升】一、填空题1.(2023春·全国·高一专题练习)图1为某省某年1~4月份快递业务量统计图,图2为该省当年1~4月份快递业务收入统计图.根据对以上统计图的理解,有下列四个说法:①当年1~4月份快递业务量,3月份最高,2月份最低,差值接近2000万件;②当年1~4月份快递业务量同比增长率均超过50%,在3月份最高,可能与春节后快递恢复网购迎来喷涨有关;③从两图中看,快递业务量与业务收入的同比增长率并不完全一致,但业务量与业务收入变化高度一致;④从1~4月份来看,快递业务量与快递业务收入有波动,但整体保持高速增长.其中,正确的说法为______.(写出所有满足条件的说法序号)二、解答题2.(2022秋·上海宝山·高三上海交大附中校考阶段练习)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据,其中和分别表示第个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量(单位:头),并计算得,,,,.(1)估计该地区这种野生动物的数量;(2)求样本的相关系数.(精确到0.01)3.(2023·上海·高三专题练习)湖南省从2021年开始将全面推行“”的新高考模式,新高考对化学、生物、地理和政治等四门选考科目,制定了计算转换T分(即记入高考总分的分数)的“等级转换赋分规则”(详见附1和附2),具体的转换步骤为:①原始分Y等级转换;②原始分等级内等比例转换赋分.某校的一次年级统考中,政治、生物两选考科目的原始分分布如下表:等级ABCDE比例约15%约35%约35%约13%约2%政治学科各等级对应的原始分区间生物学科各等级对应的原始分区间现从政治、生物两学科中分别随机抽取了20个原始分成绩数据,作出茎叶图:(1)根据茎叶图,分别求出政治成绩的中位数和生物成绩的众数;(2)该校的甲同学选考政治学科,其原始分为82分,乙同学选考生物学科,其原始分为91分,根据赋分转换公式,分别求出这两位同学的转化分;(3)根据生物成绩在等级B的6个原始分和对应的6个转化分,得到样本数据,请计算生物原始分与生物转换分之间的相关系数,并根据这两个变量的相关系数谈谈你对新高考这种“等级转换赋分法”的看法.附1:等级转换的等级人数占比与各等级的转换分赋分区间.等级ABCDE原始分从高到低排序的等级人数占比约15%约35%约35%约13%约2%转换分T的赋分区间附2:计算转换分T的等比例转换赋分公式:.(其中:,,分别表示原始分Y对应等级的原始分区间下限和上限;,分别表示原始分对应等级的转换分赋分区间下限和上限.T的计算结果按四舍五入取整数)附3:,,.4.(2023·广西·统考模拟预测)2016~2020年广西城乡居民人均可支配收入的柱形图如下图所示.(1)不考虑价格因素,求广西2020年农村居民人均可支配收入的年增长率(结果精确到0.1%).(2)现欲了解广西各年城镇居民人均可支配收入y(单位:元)与农村居民人均可支配收入x(单位:元)是否存在较好的线性关系.设广西2016年城镇居民人均可支配收入为元,农村居民人均可支配收入为元,2017年对应的数据分别为,,2018年对应的数据分别为,,2019年对应的数据分别为,,2020年对应的数据分别为,.根据图中的五组数据,得到y关于x的线性回归方程为.试问y关于x的线性相关系数r是否大于0.95,并判断y与x之间是否存在较好的线性关系.参考数据:,,.附:样本的相关系数,线性回归方程中的系数,.5.(2023·全国·高三专题练习)某专营店统计了近五年来该店的创收利润y(单位:万元)与时间(单位:年)的相关数据,列表如下:123452.42.74.16.47.9依据表中给出的数据,是否可用线性回归模型拟合y与t的关系?请计算相关系数r并加以说明(计算结果精确到0.01,若,则认为y与t高度相关,可用线性回归模型拟合y与t的关系).6.(2023·全国·高二专题练习)近年来,云南省保山市龙陵县紧紧围绕打造“中国石斛之乡”的发展定位,大力发展石斛产业,该产业带动龙陵县近四分之一人口脱贫致富.2022年8月,龙陵紫皮石斛获国家地理标志运用促进工程重点项目,并被评为优秀等次.在政府的大力扶持下,龙陵紫皮石斛产量逐年增长,2017年底到2022年底龙陵县石斛产量统计如下及散点图如图.年份201720182019202020212022年份代码x123456紫皮石斛产量y(吨)320034003600420075009000(1)根据散点图判断,与(a,b,c,d均为常数)哪一个更适合作为龙陵县紫皮石斛产量y关于年份代码x的回归方程类型?(给出判断即可,不必说明理由)(2)经计算得下表中数据,根据(1)中结果,求出y关于x的回归方程;3.551508.4617.5209503.85其中.(3)龙陵县计划到2025年底实现紫皮石斛年产量达1.5万吨,根据(2)所求得的回归方程,预测该目标是否能完成?(参考数据:)附:,.7.(2023·高三课时练习)某研究所将某一型号的疫苗用在小白鼠身上进行科研和临床实验,得到统计数据如下表:未感染R病毒感染R病毒总计未注射疫苗20xA注射疫苗30yB合计5050100现从所有试验小白鼠中任取一只,取到“注射疫苗”小白鼠的概率.(1)求2×2列联表中的数据x、y、A、B的值;(2)能否有99.9%的把握认为注射此种疫苗对预防R病毒有效?附表:0.050.010.0050.0013.8416.6357.87910.8288.(2023春·高二单元测试)2020年,是人类首次成功从北坡登顶珠峰60周年,也是中国首次精确测定并公布珠峰高程的45周年.华为帮助中国移动开通珠峰峰顶5G,有助于测量信号的实时开通,为珠峰高程测量提供通信保障,也验证了超高海拔地区5G信号覆盖的可能性,在持续高风速下5G信号的稳定性,在条件恶劣地区通过简易设备传输视频信号的可能性.正如任总在一次采访中所说:“华为公司价值体系的理想是为人类服务.”有人曾问,在珠峰开通5G的意义在哪里?“我认为它是科学技术的一次珠峰登顶,告诉全世界,华为5G、中国5G的底气来自哪里.现在,5G的到来给人们的生活带来更加颠覆性的变革,某IT公司基于领先技术的支持,5G经济收入在短期内逐月攀升,该IT公司在1月份至6月份的5G经济收入y(单位:百万元)关于月份x的数据如下表所示,并根据数据绘制了如图所示的散点图.月份x123456收入y(百万元)6.68.616.121.633.041.0(1)根据散点图判断,与(a,b,c,d均为常数)哪一个更适宜作为5G经济收入y关于月份x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的结果及表中的数据,求出y关于x的回归方程,并预测该公司7月份的5G经济收入.(结果保留小数点后两位)(3)从前6个月的收入中抽取2个,记收入超过20百万元的个数为X,求X的分布列和数学期望.参考数据:3.5021.152.8517.70125.356.734.5714.30其中,设(i=1,2,3,4,5,6).参考公式:对于一组具有线性相关关系的数据(,)(i=1,2,3,…,n),其回归直线的斜率和截距的最小二乘估计公式分别为,.9.(2023·全国·高三专题练习)为了监控某种零件的一条生产线的生产过程,检验员每隔从该生产线上随机抽取一个零件,并测量其尺寸(单位:)做好记录.下表是检验员在一天内依次抽取的个零件的尺寸:抽取次序零件尺寸()抽取次序910111213141516零件尺寸()经计算得,,,,其中为抽取的第个零件的尺寸().(1)求的相关系数,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);(2)一天内抽检的零件中,如果出现了尺寸在之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.①从这一天抽检的结果看,是否需对当天的生产过程进行检查?②在之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到)10.(2023·全国·高三专题练习)某公司为了做好产品生产计划,准确地把握市场,对过去四年的产品数据进行整理得到了第年与年销售量(单位:万件)之间的关系如下表:第年销售量(万件)(1)在图中画出表中数据的散点图;(2)根据(1)中的散点图选择用于拟合与的回归模型,并用相关系数加以说明;(3)建立关于的回归方程,预测第年的销售量.(参考数据:,)11.(2023·全国·高二专题练习)经观测,某种昆虫的产卵数y与温度x有关,现将收集到的温度和产卵数()的10组观测数据作了初步处理,得到如下图的散点图及一些统计量表.275731.121.71502368.3630表中,.(1)根据散点图判断,,与哪一个适宜作为y与x之间的回归方程模型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,试求y关于x的回归方程.12.(2023·高二课时练习)我国西北某地区开展改造沙漠的巨大工程,该地区于2017年投入沙漠治理经费2亿元,从2018年到2020年连续3年每年增加沙漠治理经费1亿元,近4年投入的沙漠治理经费x(亿元)和沙漠治理面积y(万亩)的相关数据如下表所示:年份2017201820192020x2345y26394954通过绘制散点图看出,y与x之间具有明显的相关性,请用相关系数加以说明.(结果保留3位小数)13.(2023·高二课时练习)假设关于某种设备的使用年限x(单位:年)与所支出的维修费用y(单位:万元)有如下统计资料:x23456y2.23.85.56.57.0已知,,,,.(1)求,;(2)计算y与x的相关系数,并判断该设备的使用年限与所支出的维修费用的相关程度.14.(2023春·高二课时练习)为调查野生动物保护地某种野生动物的数量,将保护地分成面积相近的300个地块,并设计两种抽样方案.方案一:在该地区应用简单随机抽样的方法抽取30个作为样本区,依据抽样数据计算得到相应的相关系数;方案二:在该地区应用分层抽样的方法抽取30个作为样本区,调查得到样本数据,其中和分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,,,,.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求方案二抽取的样本的相关系数r(精确到0.01),并判定哪种抽样方法更能准确地估计这种野生动物的数量.附:若相关系数则相关性很强,的值越大相关性越强.15.(2023春·高二课时练习)某药企加大了治疗特种病的创新药的研发投入.已知市场上治疗一类慢性病的特效药品的研发费用(百万元)和销量(万盒)的统计数据如下:研发费用x(百万元)销量y(万盒)(1)求与的相关系数(精确到),并判断与的关系是否可用线性回归方程模型拟合(规定时,可用线性回归方程模型拟合);(2)该药企准备生产药品的三类不同的剂型、、,并对其进行两次检测,当第一次检测合格后,才能进行第二次检测.第一次检测时,三类剂型、、合格的概率分别为、、;第二次

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论