第02讲 成对数据的统计分析(练习)(原卷版)_第1页
第02讲 成对数据的统计分析(练习)(原卷版)_第2页
第02讲 成对数据的统计分析(练习)(原卷版)_第3页
第02讲 成对数据的统计分析(练习)(原卷版)_第4页
第02讲 成对数据的统计分析(练习)(原卷版)_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第02讲成对数据的统计分析(模拟精练+真题演练)1.(2022·甘肃兰州·统考一模)下面是一个列联表,其中a、b处填的值分别为(

)总计a217322527总计b46100

A.52、54 B.54、52C.94、146 D.146、942.(2023·海南海口·海南华侨中学校考模拟预测)为客观反映建设创新型国家进程中我国创新能力的发展情况,国家统计局社科文司《中国创新指数(CII)研究》课题组研究设计了评价我国创新能力的指标体系和指数编制方法.中国创新指数(ChinaInnovationIndex,CII)中有4个分指数(创新环境指数、创新投入指数、创新产出指数、创新成效指数),下面是2005—2021年中国创新指数及分领域指数图,由图可知指数与年份正相关,则对4个分领域指数,在建立年份值与指数值的回归模型中,相关系数最大的指数类型是(

A.创新环境指数 B.创新投入指数 C.创新产出指数 D.创新成效指数3.(2023·安徽六安·六安一中校考模拟预测)某学校一同学研究温差(℃)与本校当天新增感冒人数(人)的关系,该同学记录了5天的数据:x568912y1720252835经过拟合,发现基本符合经验回归方程,则下列结论错误的是(

)A.样本中心点为B.C.时,残差为D.若去掉样本点,则样本的相关系数增大4.(2023·江西南昌·江西师大附中校考三模)下列说法:(1)分类变量与的随机变量越大,说明与相关的把握性越大;(2)以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则的值分别是和0.7;(3)若随机变量,且,则.以上正确的个数是(

)A.0 B.1 C.2 D.35.(2023·重庆·统考二模)设两个相关变量和分别满足下表:若相关变量和可拟合为非线性回归方程,则当时,的估计值为(

)(参考公式:对于一组数据,,,,其回归直线的斜率和截距的最小二乘估计公式分别为:,;)A. B. C. D.6.(2023·陕西商洛·校考三模)用模型拟合一组数,若,,设,得变换后的线性回归方程为,则(

)A.12 B. C. D.77.(2022·四川成都·成都七中校考模拟预测)根据一组样本数据,,…,,求得经验回归方程为,且.现发现这组样本数据中有两个样本点(1.2,2.2)和(4.8,7.8)误差较大,去除后重新求得的经验回归直线l的斜率为1.2,则(

)A.变量x与y具有正相关关系B.去除两个误差较大的样本点后,重新求得的经验回归方程为C.去除两个误差较大的样本点后,y的估计值增加速度变快D.去除两个误差较大的样本点后,相应于样本点(2,3.75)的残差为0.058.(2021·江西南昌·南昌市八一中学校考三模)已知变量关于的回归方程为,其一组数据如表所示:若,则预测值可能为(

)A. B. C. D.9.(2021·山西·统考三模)某公交公司推出扫码支付乘车优惠活动,活动为期两周,活动的前五天数据如下表:第天12345使用人数()151734578421333由表中数据可得y关于x的回归方程为,则据此回归模型相应于点(2,173)的残差为(

)A. B. C.3 D.210.(多选题)(2023·广东广州·统考模拟预测)总和生育率有时也简称生育率,是指一个人口群体的各年龄别妇女生育率的总和.它反映的是一名妇女在每年都按照该年龄别现有生育率生育的假设下,在育龄期间生育的子女总数.为了了解中国人均GDPx(单位:万元)和总和生育率y以及女性平均受教育年限z(单位:年)的关系,采用2012~2022近十年来的数据绘制了散点图,并得到经验回归方程,,对应的决定系数分别为,,则(

A.人均GDP和女性平均受教育年限正相关.B.女性平均受教育年限和总和生育率负相关C.D.未来三年总和生育率一定继续降低11.(多选题)(2023·江苏盐城·盐城市伍佑中学校考模拟预测)下列命题正确的是(

)A.对于事件A,B,若,且,,则B.若随机变量,,则C.相关系数r的绝对值越接近1,两个随机变量的线性相关程度越强D.在做回归分析时,残差图中残差点分布的带状区域的宽度越宽表示回归效果越差12.(多选题)(2023·吉林长春·长春吉大附中实验学校校考模拟预测)年月日,工业和信息化部成功举办第十七届“中国芯”集成电路产业大会.此次大会以“强芯固基以质为本”为主题,旨在培育壮大我国集成电路产业,夯实产业基础、营造良好产业生态.某芯片研发单位用在“A芯片”上研发费用占本单位总研发费用的百分比如表所示.已知,于是分别用p=和p=得到了两条回归直线方程:,,对应的相关系数分别为、,百分比y对应的方差分别为、,则下列结论正确的是(

)(附:,)年份年份代码xpqA. B. C. D.13.(多选题)(2023·福建厦门·统考模拟预测)为了有针对性地提高学生体育锻炼的积极性,某中学需要了解性别因素是否对本校学生体育锻的经常性有影响,随机抽取了300名学生,对他们是否经常锻炼的情况进行了调查,调查发现经常锻炼人数是不经常锻炼人数的2倍,绘制其等高堆积条形图,如图所示,则(

)A.参与调查的男生中经常锻炼的人数比不经常锻炼的人数多B.从参与调查的学生中任取一人,已知该生为女生,则该生经常锻炼的概率为C.依据的独立性检验,认为性别因素影响学生体育锻炼的经常性,该推断犯错误的概率不超过0.1D.假设调查人数为600人,经常锻炼人数与不经常锻炼人数的比例不变,统计得到的等高堆积条形图也不变,依据的独立性检验,认为性别因素影响学生体育锻炼的经常性,该推断犯错误的概率不超过0.05附:,0.10.050.010.0050.0012.7063.8416.6357.87910.82814.(2023·全国·镇海中学校联考模拟预测)害虫防控对于提高农作物产量具有重要意义.已知某种害虫产卵数(单位:个)与温度(单位:)有关,测得一组数据,可用模型进行拟合,利用变换得到的线性回归方程为.若,则的值为.15.(2023·上海·统考模拟预测)某校团委对“学生性别和喜欢网络游戏是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢网络游戏的人数占男生人数的,女生喜欢网络游戏的人数占女生人数的.若根据独立性检验认为喜欢网络游戏和性别有关,且此推断犯错误的概率超过0.01但不超过0.05,则被调查的学生中男生可能有人.(请将所有可能的结果都填在横线上)附表:,其中.0.0500.0103.8416.63516.(2023·广西桂林·校联考模拟预测)一只红铃虫产卵数和温度有关,现测得一组数据,可用模型拟合,设,其变换后的线性回归方程为,若,,为自然常数,则.17.(2022·北京·人大附中校考模拟预测)某班在一次考试后分析学生在语文、数学、英语三个学科的表现,绘制了各科年级排名的散点图(如下图所示).关于该班级学生这三个学科本次考试的情况,给出下列四个结论:①三科中,数学年级排名的平均数及方差均最小;②语文、数学、英语年级排名均在150名以外的学生为1人;③本次考试该班语文第一名、数学第一名、英语第一名可能为三名不同的同学;④从该班学生中随机抽取1人,若其语文排名大于200,则其英语和数学排名均在150以内的概率为.其中所有正确结论的序号是.18.(2022·安徽安庆·安庆一中校考三模)在工程技术和科学实验中,经常利用最小二乘法原理求曲线的函数关系式:设有一组实验数据,它们大体分布在某条曲线上,通过偏差平方和最小求该曲线的方法称为最小二乘法,当该曲线为一条直线时,由方程组来确定,的值,此时偏差平方和表示为.为了测定某种刀具的磨损速度,每隔1小时测一次刀具的厚度,得到一组实验数据,如下表:顺序编号i01234567时间01234567刀具厚度作出刀具厚度关于时间散点图,发现这些点分布在一条直线附近.(1)求实数,的值,并估计时刀具厚度(所有结果均精确到);(2)求偏差平方和.(参考数据:,)19.(2023·湖北武汉·华中师大一附中校考模拟预测)2021年春节前,受疫情影响,各地鼓励外来务工人员选择就地过年.某市统计了该市4个地区的外来务工人数与就地过年人数(单位:万),得到如下表格:区区区区外来务工人数万3456就地过年人数万2.5344.5(1)请用相关系数说明与之间的关系可用线性回归模型拟合,并求关于的线性回归方程和A区的残差(2)假设该市政府对外来务工人员中选择就地过年的每人发放1000元补贴.①若该市区有2万名外来务工人员,根据(1)的结论估计该市政府需要给区就地过年的人员发放的补贴总金额;②若区的外来务工人员中甲、乙选择就地过年的概率分别为,其中,该市政府对甲、乙两人的补贴总金额的期望不超过1400元,求的取值范围.参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为.20.(2023·江西南昌·南昌市八一中学校考三模)为了解某一地区电动汽车销售情况,某机构根据统计数据,用最小二乘法得到电动汽车销量单位:万台关于年份的线性回归方程为,且销量的方差,年份的方差为.(1)求与的相关系数,并据此判断电动汽车销量与年份的相关性强弱;(2)该机构还调查了该地区位购车车主性别与购车种类情况,得到的数据如下表:购买非电动汽车购买电动汽车总计男性女性总计能否有的把握认为购买电动汽车与性别有关(3)在购买电动汽车的车主中按照性别进行分层抽样抽取人,再从这人中随机抽取人,记这人中,男性的人数为,求的分布列和数学期望.参考公式:线性回归方程:,其中,;相关系数:,若,则可判断与线性相关较强;,其中.附表:21.(2023·福建南平·统考模拟预测)五一小长假期间,文旅部门在某地区推出A,B,C,D,E,F六款不同价位的旅游套票,每款套票的价格(单位:元;)与购买该款套票的人数(单位:千人)的数据如下表:套票类别ABCDEF套票价格(元)405060657288购买人数(千人)16.918.720.622.524.125.2(注:A,B,C,D,E,F对应i的值为1,2,3,4,5,6)为了分析数据,令,,发现点集中在一条直线附近.(1)根据所给数据,建立购买人数y关于套票价格x的回归方程;(2)规定:当购买某款套票的人数y与该款套票价格x的比值在区间上时,该套票为“热门套票”.现有甲、乙、丙三人分别从以上六款旅游套票中购买一款.假设他们买到的套票的款式互不相同,且购买到“热门套票”的人数为X,求随机变量X的分布列和期望.附:①参考数据:,,,.②对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,.22.(2023·上海浦东新·华师大二附中校考模拟预测)为帮助乡村脱贫,某勘探队计划了解当地矿脉某金属的分布情况,测得了平均金属含量(单位:)与样本对原点的距离(单位:)的数据,并作了初步处理,得到了下面的一些统计量的值.(表中)660(1)利用样本相关系数的知识,判断与哪一个更适宜作为平均金属含量关于样本对原点的距离的回归方程类型?(2)根据(1)的结果回答下列问题:(i)建立关于的回归方程;(ii)样本对原点的距离时,金属含量的预报值是多少?(3)已知该金属在距离原点米时的平均开采成本(单位:元)与关系为,根据(2)的结果回答,为何值时,开采成本最大?1.(2023•天津)调查某种花萼长度和花瓣长度,所得数据如图所示,其中相关系数,下列说法正确的是A.花瓣长度和花萼长度没有相关性 B.花瓣长度和花萼长度呈现负相关 C.花瓣长度和花萼长度呈现正相关 D.若从样本中抽取一部分,则这部分的相关系数一定是0.82452.(2023•甲卷)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:.试验结果如下:对照组的小白鼠体重的增加量从小到大排序为15.218.820.221.322.523.225.826.527.530.132.634.334.835.635.635.836.237.340.543.2试验组的小白鼠体重的增加量从小到大排序为7.89.211.412.413.215.516.518.018.819.219.820.221.622.823.623.925.128.232.336.5(1)计算试验组的样本平均数;(2)(ⅰ)求40只小白鼠体重的增加量的中位数,再分别统计两样本中小于与不小于的数据的个数,完成如下列联表;对照组试验组(ⅱ)根据中的列联表,能否有的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?附:,0.1000.0500.0102.7063.8416.6353.(2022•新高考Ⅰ)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:不够良好良好病例组4060对照组1090(1)能否有的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?(2)从该地的人群中任选一人,表示事件“选到的人卫生习惯不够良好”,表示事件“选到的人患有该疾病”,与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为.(ⅰ)证明:;(ⅱ)利用该调查数据,给出,的估计值,并利用(ⅰ)的结果给出的估计值.附:.0.0500.0100.0013.8416.63510.8284.(2021•甲卷)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品二级品合计甲机床15050200乙机床12080200合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:.0.0500.0100.0013.8416.63510.8285.(2020•新课标Ⅱ)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据,,2,,,其中和分别表示第个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,,,,.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本,,2,,的相关系数(精确到;(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确地估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数,.6.(2020•新课标Ⅲ)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天)锻炼人次空气质量等级,,,1(优216252(良510123(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的列联表,并根据列联表,判断是否有的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次人次空气质量好空气质量不好附:0.0500.0100.0013.8416.63510.8287.(2020•山东)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的和浓度(单位:,得下表:,,,,32184,6812,3710(1)估计事件“该市一天空气中浓度不超过75,且浓度不超过150”的概率;(2)根据所给数据,完成下面的列联表:,,,,(3)根据(2)中的列联表,判断是否有的把握认为该市一天空气中浓度与浓度有关?附:0.0500.0100.0013.8416.63510.8288.(2019•新课标Ⅰ)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有的把握认为男、女顾客对该商场服务的评价有差异?附:.0.0500.0100.0013.8416.63510.8289.(2018•新课标Ⅱ)如图是某地区2000年至2016年环境基础设施投资额(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了与时间变量的两个线性回归模型.根据2000年至2016年的数据(时间变量的值依次为1,2,,建立模型①:;根据2010年至2016年的数据(时间变量的值依次为1,2,,建立模型②:.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.10.(2017•新课标Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:,其频率分布直方图如图:(1)设两种养殖方法的箱产量相互独立,记表示事件“旧养殖法的箱

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论