版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第02讲成对数据的统计分析(模拟精练+真题演练)1.(2022·甘肃兰州·统考一模)下面是一个SKIPIF1<0列联表,其中a、b处填的值分别为(
)SKIPIF1<0SKIPIF1<0总计SKIPIF1<0a2173SKIPIF1<022527总计b46100
A.52、54 B.54、52C.94、146 D.146、94【答案】A【解析】由题意可得SKIPIF1<0,解得SKIPIF1<0,所以a、b值分别为52、54.故选:A.2.(2023·海南海口·海南华侨中学校考模拟预测)为客观反映建设创新型国家进程中我国创新能力的发展情况,国家统计局社科文司《中国创新指数(CII)研究》课题组研究设计了评价我国创新能力的指标体系和指数编制方法.中国创新指数(ChinaInnovationIndex,CII)中有4个分指数(创新环境指数、创新投入指数、创新产出指数、创新成效指数),下面是2005—2021年中国创新指数及分领域指数图,由图可知指数与年份正相关,则对4个分领域指数,在建立年份值与指数值的回归模型中,相关系数最大的指数类型是(
)
A.创新环境指数 B.创新投入指数 C.创新产出指数 D.创新成效指数【答案】D【解析】由题图易知4个分领域指数的起始位置相同,其中创新投入指数、创新产出指数从2014年起,指数增幅大,变化趋势明显大于另两类指数;从2011年起,创新环境指数的波动幅度比创新成效指数的波动幅度大,创新成效指数对应的散点更趋近于某一条直线,故其对应的相关系数最大.故选:D.3.(2023·安徽六安·六安一中校考模拟预测)某学校一同学研究温差SKIPIF1<0(℃)与本校当天新增感冒人数SKIPIF1<0(人)的关系,该同学记录了5天的数据:x568912y1720252835经过拟合,发现基本符合经验回归方程SKIPIF1<0,则下列结论错误的是(
)A.样本中心点为SKIPIF1<0B.SKIPIF1<0C.SKIPIF1<0时,残差为SKIPIF1<0D.若去掉样本点SKIPIF1<0,则样本的相关系数SKIPIF1<0增大【答案】D【解析】对于A项,因为SKIPIF1<0,SKIPIF1<0,所以样本中心点为SKIPIF1<0,故A项正确;对于B项,由回归直线必过样本中心可得:SKIPIF1<0,解得:SKIPIF1<0,故B项正确;对于C项,由B项知,SKIPIF1<0,令SKIPIF1<0,则SKIPIF1<0,所以残差为SKIPIF1<0,故C项正确;对于D项,由相关系数公式可知,去掉样本点SKIPIF1<0后,x与y的样本相关系数r不变,故D项错误.故选:D.4.(2023·江西南昌·江西师大附中校考三模)下列说法:(1)分类变量SKIPIF1<0与SKIPIF1<0的随机变量SKIPIF1<0越大,说明SKIPIF1<0与SKIPIF1<0相关的把握性越大;(2)以模型SKIPIF1<0去拟合一组数据时,为了求出回归方程,设SKIPIF1<0,将其变换后得到线性方程SKIPIF1<0,则SKIPIF1<0的值分别是SKIPIF1<0和0.7;(3)若随机变量SKIPIF1<0,且SKIPIF1<0,则SKIPIF1<0.以上正确的个数是(
)A.0 B.1 C.2 D.3【答案】D【解析】根据独立性检验原理,分类变量SKIPIF1<0与SKIPIF1<0的随机变量SKIPIF1<0越大,说明SKIPIF1<0与SKIPIF1<0相关的把握性越大,故(1)正确;由SKIPIF1<0,两边取对数得SKIPIF1<0,即SKIPIF1<0,设SKIPIF1<0,可得SKIPIF1<0,又SKIPIF1<0,∴SKIPIF1<0,即SKIPIF1<0,故(2)正确;若随机变量SKIPIF1<0,则正态曲线关于SKIPIF1<0对称,则SKIPIF1<0,故(3)正确,所以正确的个数是3.故选:D.5.(2023·重庆·统考二模)设两个相关变量SKIPIF1<0和SKIPIF1<0分别满足下表:SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0若相关变量SKIPIF1<0和SKIPIF1<0可拟合为非线性回归方程SKIPIF1<0,则当SKIPIF1<0时,SKIPIF1<0的估计值为(
)(参考公式:对于一组数据SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,其回归直线SKIPIF1<0的斜率和截距的最小二乘估计公式分别为:SKIPIF1<0,SKIPIF1<0;SKIPIF1<0)A.SKIPIF1<0 B.SKIPIF1<0 C.SKIPIF1<0 D.SKIPIF1<0【答案】B【解析】因为非线性回归方程为:SKIPIF1<0,则有SKIPIF1<0,令SKIPIF1<0,即SKIPIF1<0,列出相关变量SKIPIF1<0关系如下:SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<001334所以SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,所以SKIPIF1<0,所以SKIPIF1<0,所以SKIPIF1<0,即SKIPIF1<0,即SKIPIF1<0,因为SKIPIF1<0,所以SKIPIF1<0,当SKIPIF1<0时,SKIPIF1<0.故选:B6.(2023·陕西商洛·校考三模)用模型SKIPIF1<0拟合一组数SKIPIF1<0,若SKIPIF1<0,SKIPIF1<0,设SKIPIF1<0,得变换后的线性回归方程为SKIPIF1<0,则SKIPIF1<0(
)A.12 B.SKIPIF1<0 C.SKIPIF1<0 D.7【答案】B【解析】由已知,SKIPIF1<0,所以SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,所以SKIPIF1<0SKIPIF1<0,由题意,SKIPIF1<0满足线性回归方程为SKIPIF1<0,所以SKIPIF1<0,所以SKIPIF1<0,此时线性回归方程为SKIPIF1<0,即SKIPIF1<0,可将此式子化为指数形式SKIPIF1<0,即为SKIPIF1<0,因为模型为模型SKIPIF1<0,所以SKIPIF1<0,SKIPIF1<0,所以SKIPIF1<0SKIPIF1<0.故选:B.7.(2022·四川成都·成都七中校考模拟预测)根据一组样本数据SKIPIF1<0,SKIPIF1<0,…,SKIPIF1<0,求得经验回归方程为SKIPIF1<0,且SKIPIF1<0.现发现这组样本数据中有两个样本点(1.2,2.2)和(4.8,7.8)误差较大,去除后重新求得的经验回归直线l的斜率为1.2,则(
)A.变量x与y具有正相关关系B.去除两个误差较大的样本点后,重新求得的经验回归方程为SKIPIF1<0C.去除两个误差较大的样本点后,y的估计值增加速度变快D.去除两个误差较大的样本点后,相应于样本点(2,3.75)的残差为0.05【答案】A【解析】对A:SKIPIF1<0经验回归方程为SKIPIF1<0,SKIPIF1<0,SKIPIF1<0变量SKIPIF1<0与SKIPIF1<0具有正相关关系,故选项A正确;对B:当SKIPIF1<0时,SKIPIF1<0,所以样本中心为SKIPIF1<0,SKIPIF1<0去掉两个样本点为SKIPIF1<0和SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0样本中心不变,SKIPIF1<0去除后重新求得的经验回归直线SKIPIF1<0的斜率为1.2,SKIPIF1<0SKIPIF1<0,解得SKIPIF1<0,故去除两个误差较大的样本点后,重新求得的回归方程为SKIPIF1<0,故选项B错误;对C:SKIPIF1<0,SKIPIF1<0去除两个误差较大的样本点后,SKIPIF1<0的估计值增加速度变慢,故选项C错误;对D:SKIPIF1<0SKIPIF1<0,SKIPIF1<0SKIPIF1<0,SKIPIF1<0去除两个误差较大的样本点后,相应于样本点(2,3.75)的残差为SKIPIF1<0,故选项D错误.故选:A.8.(2021·江西南昌·南昌市八一中学校考三模)已知变量SKIPIF1<0关于SKIPIF1<0的回归方程为SKIPIF1<0,其一组数据如表所示:若SKIPIF1<0,则预测SKIPIF1<0值可能为(
)SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0A.SKIPIF1<0 B.SKIPIF1<0 C.SKIPIF1<0 D.SKIPIF1<0【答案】D【解析】由SKIPIF1<0得:SKIPIF1<0,SKIPIF1<0,解得:SKIPIF1<0,SKIPIF1<0回归方程为SKIPIF1<0,若SKIPIF1<0,则SKIPIF1<0.故选:D.9.(2021·山西·统考三模)某公交公司推出扫码支付乘车优惠活动,活动为期两周,活动的前五天数据如下表:第SKIPIF1<0天12345使用人数(SKIPIF1<0)151734578421333由表中数据可得y关于x的回归方程为SKIPIF1<0,则据此回归模型相应于点(2,173)的残差为(
)A.SKIPIF1<0 B.SKIPIF1<0 C.3 D.2【答案】B【解析】令SKIPIF1<0,则SKIPIF1<0,SKIPIF1<01491625使用人数(SKIPIF1<0)151734578421333SKIPIF1<0,SKIPIF1<0,所以SKIPIF1<0,所以SKIPIF1<0,当SKIPIF1<0时,SKIPIF1<0,所以残差为SKIPIF1<0.故选:B10.(多选题)(2023·广东广州·统考模拟预测)总和生育率有时也简称生育率,是指一个人口群体的各年龄别妇女生育率的总和.它反映的是一名妇女在每年都按照该年龄别现有生育率生育的假设下,在育龄期间生育的子女总数.为了了解中国人均GDPx(单位:万元)和总和生育率y以及女性平均受教育年限z(单位:年)的关系,采用2012~2022近十年来的数据SKIPIF1<0绘制了散点图,并得到经验回归方程SKIPIF1<0,SKIPIF1<0,对应的决定系数分别为SKIPIF1<0,SKIPIF1<0,则(
)
A.人均GDP和女性平均受教育年限正相关.B.女性平均受教育年限和总和生育率负相关C.SKIPIF1<0D.未来三年总和生育率一定继续降低【答案】AB【解析】由回归方程SKIPIF1<0知人均GDP和女性平均受教育年限正相关,故A正确;因为SKIPIF1<0,SKIPIF1<0,可得女性平均受教育年限z和总和生育率y的关系式为SKIPIF1<0,所以女性平均受教育年限z和总和生育率y负相关,故B正确;由散点图可知,回归方程SKIPIF1<0相对SKIPIF1<0拟合效果更好,所以SKIPIF1<0,故C错误;根据回归方程SKIPIF1<0预测,未来总和生育率预测值有可能降低,但实际值不一定会降低,故D错误.故选:AB11.(多选题)(2023·江苏盐城·盐城市伍佑中学校考模拟预测)下列命题正确的是(
)A.对于事件A,B,若SKIPIF1<0,且SKIPIF1<0,SKIPIF1<0,则SKIPIF1<0B.若随机变量SKIPIF1<0,SKIPIF1<0,则SKIPIF1<0C.相关系数r的绝对值越接近1,两个随机变量的线性相关程度越强D.在做回归分析时,残差图中残差点分布的带状区域的宽度越宽表示回归效果越差【答案】ACD【解析】对于A,由于SKIPIF1<0,即A发生必定有B发生,根据条件概率的定义SKIPIF1<0,正确;对于B,根据正态分布密度函数的性质知SKIPIF1<0,SKIPIF1<0,错误;对于C,根据相关系数的性质知:SKIPIF1<0约接近于1,表示线性相关程度越强,正确;对于D,残差点分布的带状区域越宽说明线性回归时的误差越大,即回归效果越差,正确;故选:ACD.12.(多选题)(2023·吉林长春·长春吉大附中实验学校校考模拟预测)SKIPIF1<0年SKIPIF1<0月SKIPIF1<0日,工业和信息化部成功举办第十七届“中国芯”集成电路产业大会.此次大会以“强芯固基以质为本”为主题,旨在培育壮大我国集成电路产业,夯实产业基础、营造良好产业生态.某芯片研发单位用在“A芯片”上研发费用占本单位总研发费用的百分比SKIPIF1<0如表所示.已知SKIPIF1<0,于是分别用p=SKIPIF1<0和p=SKIPIF1<0得到了两条回归直线方程:SKIPIF1<0,SKIPIF1<0,对应的相关系数分别为SKIPIF1<0、SKIPIF1<0,百分比y对应的方差分别为SKIPIF1<0、SKIPIF1<0,则下列结论正确的是(
)(附:SKIPIF1<0,SKIPIF1<0)年份SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0年份代码xSKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0pSKIPIF1<0SKIPIF1<0qA.SKIPIF1<0 B.SKIPIF1<0 C.SKIPIF1<0 D.SKIPIF1<0【答案】ABC【解析】SKIPIF1<0时,SKIPIF1<0,变量SKIPIF1<0、SKIPIF1<0呈线性正相关,故SKIPIF1<0,故A正确;方差反映数据的稳定性,显然SKIPIF1<0时更稳定,故此时方差更小,即SKIPIF1<0,故B正确;由于SKIPIF1<0,当SKIPIF1<0时,SKIPIF1<0,当SKIPIF1<0时,SKIPIF1<0,所以SKIPIF1<0,故C正确;因为SKIPIF1<0,所以SKIPIF1<0时,SKIPIF1<0,故D错误.故选:ABC13.(多选题)(2023·福建厦门·统考模拟预测)为了有针对性地提高学生体育锻炼的积极性,某中学需要了解性别因素是否对本校学生体育锻的经常性有影响,随机抽取了300名学生,对他们是否经常锻炼的情况进行了调查,调查发现经常锻炼人数是不经常锻炼人数的2倍,绘制其等高堆积条形图,如图所示,则(
)A.参与调查的男生中经常锻炼的人数比不经常锻炼的人数多B.从参与调查的学生中任取一人,已知该生为女生,则该生经常锻炼的概率为SKIPIF1<0C.依据SKIPIF1<0的独立性检验,认为性别因素影响学生体育锻炼的经常性,该推断犯错误的概率不超过0.1D.假设调查人数为600人,经常锻炼人数与不经常锻炼人数的比例不变,统计得到的等高堆积条形图也不变,依据SKIPIF1<0的独立性检验,认为性别因素影响学生体育锻炼的经常性,该推断犯错误的概率不超过0.05附:SKIPIF1<0,SKIPIF1<0SKIPIF1<00.10.050.010.0050.001SKIPIF1<02.7063.8416.6357.87910.828【答案】ABD【解析】对于A,由题意知经常锻炼人数是不经常锻炼人数的2倍,故经常锻炼人数为200人,不经常锻炼人数为100人,故男生中经常锻炼的人数为SKIPIF1<0人,不经常锻炼的人数为SKIPIF1<0人,故男生中经常锻炼的人数比不经常锻炼的人数多,A正确;对于B,经常锻炼的女生人数为SKIPIF1<0人,不经常锻炼的人数为SKIPIF1<0人,故从参与调查的学生中任取一人,已知该生为女生,则该生经常锻炼的概率为SKIPIF1<0,B正确;对于C,由题意结合男女生中经常锻炼和不经常锻炼的人数,可得列联表:经常锻炼不经常锻炼合计男10060160女10040140合计200100300则SKIPIF1<0,故依据SKIPIF1<0的独立性检验,不能认为性别因素影响学生体育锻炼的经常性,该推断犯错误的概率不超过0.1,C错误;对于D,由题意可得:经常锻炼不经常锻炼合计男200120320女20080280合计400200600则此时SKIPIF1<0,故依据SKIPIF1<0的独立性检验,认为性别因素影响学生体育锻炼的经常性,该推断犯错误的概率不超过0.05,D正确,故选:ABD14.(2023·全国·镇海中学校联考模拟预测)害虫防控对于提高农作物产量具有重要意义.已知某种害虫产卵数SKIPIF1<0(单位:个)与温度SKIPIF1<0(单位:SKIPIF1<0)有关,测得一组数据SKIPIF1<0,可用模型SKIPIF1<0进行拟合,利用SKIPIF1<0变换得到的线性回归方程为SKIPIF1<0.若SKIPIF1<0,则SKIPIF1<0的值为.【答案】SKIPIF1<0【解析】对SKIPIF1<0两边同时取对数可得SKIPIF1<0;即SKIPIF1<0,可得SKIPIF1<0由SKIPIF1<0可得SKIPIF1<0,代入SKIPIF1<0可得SKIPIF1<0,即SKIPIF1<0,所以SKIPIF1<0.故答案为:SKIPIF1<015.(2023·上海·统考模拟预测)某校团委对“学生性别和喜欢网络游戏是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢网络游戏的人数占男生人数的SKIPIF1<0,女生喜欢网络游戏的人数占女生人数的SKIPIF1<0.若根据独立性检验认为喜欢网络游戏和性别有关,且此推断犯错误的概率超过0.01但不超过0.05,则被调查的学生中男生可能有人.(请将所有可能的结果都填在横线上)附表:SKIPIF1<0,其中SKIPIF1<0.SKIPIF1<00.0500.010SKIPIF1<03.8416.635【答案】45,50,55,60,65【解析】设男生有x人,由题意可得SKIPIF1<0列联表如下,喜欢不喜欢合计男生SKIPIF1<0SKIPIF1<0x女生SKIPIF1<0SKIPIF1<0x合计SKIPIF1<0SKIPIF1<0SKIPIF1<0若认为喜欢网络游戏和性别有关,且该推断犯错误的概率超过0.01但不超过0.05,则SKIPIF1<0.∵SKIPIF1<0,∴SKIPIF1<0,解得SKIPIF1<0,又x为5的整数倍,∴被调查的学生中男生可能人数为45,50,55,60,65.故答案为:45,50,55,60,65.16.(2023·广西桂林·校联考模拟预测)一只红铃虫产卵数SKIPIF1<0和温度SKIPIF1<0有关,现测得一组数据SKIPIF1<0,可用模型SKIPIF1<0拟合,设SKIPIF1<0,其变换后的线性回归方程为SKIPIF1<0,若SKIPIF1<0,SKIPIF1<0,SKIPIF1<0为自然常数,则SKIPIF1<0.【答案】SKIPIF1<0【解析】SKIPIF1<0经过SKIPIF1<0变换后,得到SKIPIF1<0,根据题意SKIPIF1<0,故SKIPIF1<0,又SKIPIF1<0,故SKIPIF1<0,SKIPIF1<0,故SKIPIF1<0,于是回归方程为SKIPIF1<0一定经过SKIPIF1<0,故SKIPIF1<0,解得SKIPIF1<0,即SKIPIF1<0,于是SKIPIF1<0SKIPIF1<0.故答案为:SKIPIF1<0.17.(2022·北京·人大附中校考模拟预测)某班在一次考试后分析学生在语文、数学、英语三个学科的表现,绘制了各科年级排名的散点图(如下图所示).关于该班级学生这三个学科本次考试的情况,给出下列四个结论:①三科中,数学年级排名的平均数及方差均最小;②语文、数学、英语年级排名均在150名以外的学生为1人;③本次考试该班语文第一名、数学第一名、英语第一名可能为三名不同的同学;④从该班学生中随机抽取1人,若其语文排名大于200,则其英语和数学排名均在150以内的概率为SKIPIF1<0.其中所有正确结论的序号是.【答案】①②④【解析】①:三科中,数学对应的点比英语对应的点到横轴的距离近且较为密集,数学对应的点到横轴的距离比语文对应的点到纵轴距离近且较为密集,所以数学年级排名的平均数及方差均最小.判断正确;②:语文、数学、英语年级排名均在150名以外的学生为1人.判断正确;③:本次考试该班语文第一名、数学第一名、英语第一名为同一名同学.判断错误;④:由图表可知语文排名大于200的有3位同学,语文排名大于200且英语和数学排名均在150以内的同学仅有1位同学.故从该班学生中随机抽取1人,若其语文排名大于200,则其英语和数学排名均在150以内的概率为SKIPIF1<0.判断正确.故答案为①②④18.(2022·安徽安庆·安庆一中校考三模)在工程技术和科学实验中,经常利用最小二乘法原理求曲线的函数关系式:设有一组实验数据SKIPIF1<0,它们大体分布在某条曲线上,通过偏差平方和最小求该曲线的方法称为最小二乘法,当该曲线为一条直线SKIPIF1<0时,由方程组SKIPIF1<0来确定SKIPIF1<0,SKIPIF1<0的值,此时偏差平方和表示为SKIPIF1<0.为了测定某种刀具的磨损速度,每隔1小时测一次刀具的厚度,得到一组实验数据,如下表:顺序编号i01234567时间SKIPIF1<001234567刀具厚度SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0作出刀具厚度SKIPIF1<0关于时间SKIPIF1<0散点图,发现这些点分布在一条直线SKIPIF1<0SKIPIF1<0附近.(1)求实数SKIPIF1<0,SKIPIF1<0的值,并估计SKIPIF1<0时刀具厚度(所有结果均精确到SKIPIF1<0);(2)求偏差平方和.(参考数据:SKIPIF1<0,SKIPIF1<0)【解析】(1)由条件可得,SKIPIF1<0应满足SKIPIF1<0,其中SKIPIF1<0,可由SKIPIF1<0得到,且SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,即SKIPIF1<0,解得SKIPIF1<0,所以该直线方程为SKIPIF1<0,当SKIPIF1<0时,则SKIPIF1<0所以,刀具的厚度为SKIPIF1<0.(2)由题意可得,偏差平方和为SKIPIF1<0SKIPIF1<0SKIPIF1<0.19.(2023·湖北武汉·华中师大一附中校考模拟预测)2021年春节前,受疫情影响,各地鼓励外来务工人员选择就地过年.某市统计了该市4个地区的外来务工人数与就地过年人数(单位:万),得到如下表格:SKIPIF1<0区SKIPIF1<0区SKIPIF1<0区SKIPIF1<0区外来务工人数SKIPIF1<0万3456就地过年人数SKIPIF1<0万2.5344.5(1)请用相关系数说明SKIPIF1<0与SKIPIF1<0之间的关系可用线性回归模型拟合,并求SKIPIF1<0关于SKIPIF1<0的线性回归方程SKIPIF1<0和A区的残差(2)假设该市政府对外来务工人员中选择就地过年的每人发放1000元补贴.①若该市SKIPIF1<0区有2万名外来务工人员,根据(1)的结论估计该市政府需要给SKIPIF1<0区就地过年的人员发放的补贴总金额;②若SKIPIF1<0区的外来务工人员中甲、乙选择就地过年的概率分别为SKIPIF1<0,其中SKIPIF1<0,该市政府对甲、乙两人的补贴总金额的期望不超过1400元,求SKIPIF1<0的取值范围.参考公式:相关系数SKIPIF1<0,回归方程SKIPIF1<0中斜率和截距的最小二乘估计公式分别为SKIPIF1<0.【解析】(1)由题,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,所以相关系数SKIPIF1<0,因为SKIPIF1<0与SKIPIF1<0之间的相关系数近似为0.99,说明SKIPIF1<0与SKIPIF1<0之间的线性相关程度非常强,所以可用线性回归模型拟合SKIPIF1<0与SKIPIF1<0之间的关系.SKIPIF1<0,故SKIPIF1<0关于SKIPIF1<0的线性回归方程为SKIPIF1<0.∵SKIPIF1<0,∴SKIPIF1<0,故A区的残差为0.05.(2)(2)①将SKIPIF1<0代入SKIPIF1<0,得SKIPIF1<0,故估计该市政府需要给SKIPIF1<0区就地过年的人员发放的补贴总金额为SKIPIF1<0(万元).②设甲、乙两人中选择就地过年的人数为SKIPIF1<0,则SKIPIF1<0的所有可能取值为0,1,2,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0.所以SKIPIF1<0,所以SKIPIF1<0,由SKIPIF1<0,得SKIPIF1<0,又SKIPIF1<0,所以SKIPIF1<0,故SKIPIF1<0的取值范围为SKIPIF1<0.20.(2023·江西南昌·南昌市八一中学校考三模)为了解某一地区电动汽车销售情况,某机构根据统计数据,用最小二乘法得到电动汽车销量SKIPIF1<0单位:万台SKIPIF1<0关于SKIPIF1<0年份SKIPIF1<0的线性回归方程为SKIPIF1<0,且销量SKIPIF1<0的方差SKIPIF1<0,年份SKIPIF1<0的方差为SKIPIF1<0.(1)求SKIPIF1<0与SKIPIF1<0的相关系数SKIPIF1<0,并据此判断电动汽车销量SKIPIF1<0与年份SKIPIF1<0的相关性强弱;(2)该机构还调查了该地区SKIPIF1<0位购车车主性别与购车种类情况,得到的数据如下表:购买非电动汽车购买电动汽车总计男性SKIPIF1<0SKIPIF1<0SKIPIF1<0女性SKIPIF1<0SKIPIF1<0SKIPIF1<0总计SKIPIF1<0SKIPIF1<0SKIPIF1<0能否有SKIPIF1<0的把握认为购买电动汽车与性别有关SKIPIF1<0(3)在购买电动汽车的车主中按照性别进行分层抽样抽取SKIPIF1<0人,再从这SKIPIF1<0人中随机抽取SKIPIF1<0人,记这SKIPIF1<0人中,男性的人数为SKIPIF1<0,求SKIPIF1<0的分布列和数学期望.参考公式:SKIPIF1<0线性回归方程:SKIPIF1<0,其中SKIPIF1<0,SKIPIF1<0;SKIPIF1<0相关系数:SKIPIF1<0,若SKIPIF1<0,则可判断SKIPIF1<0与SKIPIF1<0线性相关较强;SKIPIF1<0SKIPIF1<0,其中SKIPIF1<0.附表:SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0【解析】(1)相关系数为SKIPIF1<0SKIPIF1<0所以SKIPIF1<0,故SKIPIF1<0与SKIPIF1<0线性相关较强.(2)零假设为SKIPIF1<0:购买电动汽车与车主性别相互独立,即购买电动汽车与车主性别无关.SKIPIF1<0,
所以依据小概率值SKIPIF1<0的独立性检验,我们推断SKIPIF1<0不成立.由此推断犯错误的概率不大于SKIPIF1<0,故有SKIPIF1<0的把握认为购买电动汽车与性别有关.(3)SKIPIF1<0人中,男性车主SKIPIF1<0人,女性车主SKIPIF1<0人,则SKIPIF1<0的可能取值为SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,故SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0故SKIPIF1<0的分布列为:SKIPIF1<001234SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<021.(2023·福建南平·统考模拟预测)五一小长假期间,文旅部门在某地区推出A,B,C,D,E,F六款不同价位的旅游套票,每款套票的价格SKIPIF1<0(单位:元;SKIPIF1<0)与购买该款套票的人数SKIPIF1<0(单位:千人)的数据如下表:套票类别ABCDEF套票价格SKIPIF1<0(元)405060657288购买人数SKIPIF1<0(千人)16.918.720.622.524.125.2(注:A,B,C,D,E,F对应i的值为1,2,3,4,5,6)为了分析数据,令SKIPIF1<0,SKIPIF1<0,发现点SKIPIF1<0集中在一条直线附近.(1)根据所给数据,建立购买人数y关于套票价格x的回归方程;(2)规定:当购买某款套票的人数y与该款套票价格x的比值在区间SKIPIF1<0上时,该套票为“热门套票”.现有甲、乙、丙三人分别从以上六款旅游套票中购买一款.假设他们买到的套票的款式互不相同,且购买到“热门套票”的人数为X,求随机变量X的分布列和期望.附:①参考数据:SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0.②对于一组数据SKIPIF1<0,其回归直线SKIPIF1<0的斜率和截距的最小二乘估计分别为SKIPIF1<0,SKIPIF1<0.【解析】(1)由已知点SKIPIF1<0集中在一条直线附近,设回归直线方程为SKIPIF1<0,由SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,得SKIPIF1<0,SKIPIF1<0,因此变量SKIPIF1<0关于SKIPIF1<0的回归方程为SKIPIF1<0,令SKIPIF1<0,则SKIPIF1<0,即SKIPIF1<0,所以SKIPIF1<0关于SKIPIF1<0的回归方程为SKIPIF1<0.(2)由SKIPIF1<0,解得SKIPIF1<0,所以SKIPIF1<0,于是SKIPIF1<0为“热门套票”,则三人中购买“热门套票”的人数SKIPIF1<0服从超几何分布,SKIPIF1<0的可能取值为1,2,3,SKIPIF1<0,所以SKIPIF1<0的分布列为:SKIPIF1<0123SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0期望SKIPIF1<0.22.(2023·上海浦东新·华师大二附中校考模拟预测)为帮助乡村脱贫,某勘探队计划了解当地矿脉某金属的分布情况,测得了平均金属含量SKIPIF1<0(单位:SKIPIF1<0)与样本对原点的距离SKIPIF1<0(单位:SKIPIF1<0)的数据,并作了初步处理,得到了下面的一些统计量的值.(表中SKIPIF1<0)SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<06SKIPIF1<0SKIPIF1<060SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0(1)利用样本相关系数的知识,判断SKIPIF1<0与SKIPIF1<0哪一个更适宜作为平均金属含量SKIPIF1<0关于样本对原点的距离SKIPIF1<0的回归方程类型?(2)根据(1)的结果回答下列问题:(i)建立SKIPIF1<0关于SKIPIF1<0的回归方程;(ii)样本对原点的距离SKIPIF1<0时,金属含量的预报值是多少?(3)已知该金属在距离原点SKIPIF1<0米时的平均开采成本SKIPIF1<0(单位:元)与SKIPIF1<0关系为SKIPIF1<0,根据(2)的结果回答,SKIPIF1<0为何值时,开采成本最大?【解析】(1)因为SKIPIF1<0的线性相关系数SKIPIF1<0,SKIPIF1<0的线性相关系数SKIPIF1<0,SKIPIF1<0,SKIPIF1<0更适宜作为平均金属含量SKIPIF1<0关于样本对原点的距离SKIPIF1<0的回归方程类型.(2)(i)依题意,可得SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0关于SKIPIF1<0的回归方程为SKIPIF1<0.(ii)当SKIPIF1<0时,金属含量的预报值为SKIPIF1<0.(3)因为SKIPIF1<0,令SKIPIF1<0,则SKIPIF1<0,当SKIPIF1<0时,SKIPIF1<0,SKIPIF1<0在SKIPIF1<0上单调递增;当SKIPIF1<0时,SKIPIF1<0,SKIPIF1<0在SKIPIF1<0上单调递减,SKIPIF1<0在SKIPIF1<0处取得极大值,也是最大值,此时SKIPIF1<0取得最大值,故SKIPIF1<0为10时,开采成本最大.1.(2023•天津)调查某种花萼长度和花瓣长度,所得数据如图所示,其中相关系数SKIPIF1<0,下列说法正确的是SKIPIF1<0SKIPIF1<0A.花瓣长度和花萼长度没有相关性 B.花瓣长度和花萼长度呈现负相关 C.花瓣长度和花萼长度呈现正相关 D.若从样本中抽取一部分,则这部分的相关系数一定是0.8245【答案】SKIPIF1<0【解析】SKIPIF1<0相关系数SKIPIF1<0,且散点图呈左下角到右上角的带状分布,SKIPIF1<0花瓣长度和花萼长度呈正相关.若从样本中抽取一部分,则这部分的相关系数不一定是0.8245.故选:SKIPIF1<0.2.(2023•甲卷)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:SKIPIF1<0.试验结果如下:对照组的小白鼠体重的增加量从小到大排序为15.218.820.221.322.523.225.826.527.530.132.634.334.835.635.635.836.237.340.543.2试验组的小白鼠体重的增加量从小到大排序为7.89.211.412.413.215.516.518.018.819.219.820.221.622.823.623.925.128.232.336.5(1)计算试验组的样本平均数;(2)(ⅰ)求40只小白鼠体重的增加量的中位数SKIPIF1<0,再分别统计两样本中小于SKIPIF1<0与不小于SKIPIF1<0的数据的个数,完成如下列联表;SKIPIF1<0SKIPIF1<0对照组试验组(ⅱ)根据SKIPIF1<0中的列联表,能否有SKIPIF1<0的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?附:SKIPIF1<0,SKIPIF1<00.1000.0500.010SKIPIF1<02.7063.8416.635【解析】(1)根据题意,计算试验组样本平均数为SKIPIF1<0.(2)SKIPIF1<0由题意知,这40只小鼠体重的中位数是将两组数据合在一起,从小到大排列后第20位与第21位数据的平均数,因为原数据的第11位数据是18.8,后续依次为19.2,19.8,20.2,20.2,21.3,21.6,22.5,22.8,23.2,23.6,SKIPIF1<0,所以第20位为23.2,第21位数据为23.6,所以这组数据的中位数是SKIPIF1<0;填写列联表如下:SKIPIF1<0SKIPIF1<0合计对照组61420试验组14620合计202040SKIPIF1<0根据列联表中数据,计算SKIPIF1<0,所以有SKIPIF1<0的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异.3.(2022•新高考Ⅰ)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:不够良好良好病例组4060对照组1090(1)能否有SKIPIF1<0的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?(2)从该地的人群中任选一人,SKIPIF1<0表示事件“选到的人卫生习惯不够良好”,SKIPIF1<0表示事件“选到的人患有该疾病”,SKIPIF1<0与SKIPIF1<0的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为SKIPIF1<0.(ⅰ)证明:SKIPIF1<0;(ⅱ)利用该调查数据,给出SKIPIF1<0,SKIPIF1<0的估计值,并利用(ⅰ)的结果给出SKIPIF1<0的估计值.附:SKIPIF1<0.SKIPIF1<00.0500.0100.001SKIPIF1<03.8416.63510.828【解析】(1)补充列联表为:不够良好良好合计病例组4060100对照组1090100合计50150200计算SKIPIF1<0,所以有SKIPIF1<0的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.(2)SKIPIF1<0证明:SKIPIF1<0;(ⅱ)利用调查数据,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,所以SKIPIF1<0.4.(2021•甲卷)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品二级品合计甲机床15050200乙机床12080200合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有SKIPIF1<0的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:SKIPIF1<0.SKIPIF1<00.0500.0100.001SKIPIF1<03.8416.63510.828【解析】(1)由题意可得,甲机床、乙机床生产总数均为200件,因为甲的一级品的频数为150,所以甲的一级品的频率为SKIPIF1<0;因为乙的一级品的频数为120,所以乙的一级品的频率为SKIPIF1<0;(2)根据SKIPIF1<0列联表,可得SKIPIF1<0SKIPIF1<0.所以有SKIPIF1<0的把握认为甲机床的产品质量与乙机床的产品质量有差异.5.(2020•新课标Ⅱ)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据SKIPIF1<0,SKIPIF1<0,2,SKIPIF1<0,SKIPIF1<0,其中SKIPIF1<0和SKIPIF1<0分别表示第SKIPIF1<0个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本SKIPIF1<0,SKIPIF1<0,2,SKIPIF1<0,SKIPIF1<0的相关系数(精确到SKIPIF1<0;(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确地估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数SKIPIF1<0,SKIPIF1<0.【解析】(1)由已知,SKIPIF1<0,SKIPIF1<0个样区野生动物数量的平均数为SKIPIF1<0,SKIPIF1<0该地区这种野生动物数量的估计值为SKIPIF1<0;(2)SKIPIF1<0SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0;(3)更合理的抽样方法是分层抽样,根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度物流仓储用地承包租赁合同(2024版)4篇
- 2025年度新型储藏室与车位投资合作合同模板4篇
- 2025年度新能源汽车充电桩承债式公司股权转让合同4篇
- 2025年度文化演艺场馆承包经营合同4篇
- 2025年度土地整治与生态修复项目承包合同4篇
- 2024通信线路施工及改造分包合同范本3篇
- 2025年度生态环保工程承包商工程款支付担保协议4篇
- 2025年度历史文化街区保护项目房屋拆迁补偿合同2篇
- 2025年度住宅小区配套停车场车位代理销售协议4篇
- 2025年度星级酒店厨师团队合作协议4篇
- 土壤农化分析课件
- 小区大型团购活动策划
- NEC(新生儿坏死性小肠结肠炎)92273
- 2023年租赁风控主管年度总结及下一年展望
- 开关插座必看的七个安全隐患范文
- 高分子成型加工课件
- 消防救援-低温雨雪冰冻恶劣天气条件下灾害防范及救援行动与安全
- 硅石项目建议书范本
- 概率论在金融风险评估中的应用研究
- 住院医疗互助给付申请书
- 外墙外保温工程检验批质量验收记录表
评论
0/150
提交评论