![高考数学二轮复习专项训练23统计与成对数据的统计分析含答案及解析_第1页](http://file4.renrendoc.com/view12/M04/12/16/wKhkGWdbal-AeEXGAAGs9Ib9G48072.jpg)
![高考数学二轮复习专项训练23统计与成对数据的统计分析含答案及解析_第2页](http://file4.renrendoc.com/view12/M04/12/16/wKhkGWdbal-AeEXGAAGs9Ib9G480722.jpg)
![高考数学二轮复习专项训练23统计与成对数据的统计分析含答案及解析_第3页](http://file4.renrendoc.com/view12/M04/12/16/wKhkGWdbal-AeEXGAAGs9Ib9G480723.jpg)
![高考数学二轮复习专项训练23统计与成对数据的统计分析含答案及解析_第4页](http://file4.renrendoc.com/view12/M04/12/16/wKhkGWdbal-AeEXGAAGs9Ib9G480724.jpg)
![高考数学二轮复习专项训练23统计与成对数据的统计分析含答案及解析_第5页](http://file4.renrendoc.com/view12/M04/12/16/wKhkGWdbal-AeEXGAAGs9Ib9G480725.jpg)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2025二轮复习专项训练23统计与成对数据的统计分析[考情分析]高考近几年考查热点,主要考查线性回归分析和独立性检验,以实际应用题的形式出现,题目阅读量大,难度中档.【练前疑难讲解】一、用样本估计总体1.统计中的四个数据特征:(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:在样本数据中,将数据按从小到大顺序排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.(3)平均数:样本数据的算术平均数,即eq\x\to(x)=eq\f(1,n)(x1+x2+…+xn).(4)方差与标准差:s2=eq\f(1,n)[(x1-eq\x\to(x))2+(x2-eq\x\to(x))2+…+(xn-eq\x\to(x))2],s=eq\r(\f(1,n)[x1-\x\to(x)2+x2-\x\to(x)2+…+xn-\x\to(x)2]).2.频率分布直方图的两个结论:(1)小长方形的面积=组距×eq\f(频率,组距)=频率.(2)各小长方形的面积之和等于1.二、回归分析1.经验回归直线eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))经过样本点的中心(eq\x\to(x),eq\x\to(y)),若x取某一个值,代入经验回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))中,可求出y的估计值.2.样本相关系数:当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.三、独立性检验1.独立性检验的一般步骤(1)根据样本数据列成2×2列联表;(2)根据公式χ2=eq\f(nad-bc2,a+bc+da+cb+d),计算χ2的值;(3)查表比较χ2与临界值的大小关系,作统计判断.2.χ2的值越大,对应假设事件H0成立(两类变量相互独立)的概率越小,H0不成立的概率越大.一、单选题1.(2024·黑龙江哈尔滨·一模)为了迎接2025年第九届亚冬会的召开,某班组织全班学生开展有关亚冬会知识的竞赛活动.已知该班男生35人,女生25人.根据统计分析,男生组成绩和女生组成绩的方差分别为,该班成绩的方差为,则下列结论中一定正确的是(
)A. B.C. D.2.(2024·天津和平·一模)某市为了减少水资源浪费,计划对居民生活用水实施阶梯水价制度,为确定一个比较合理的标准,从该市随机调查了100位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图,则以下四个说法正确的个数为(
)
①估计居民月均用水量低于的概率为0.25;②估计居民月均用水量的中位数约为;③该市有40万居民,估计全市居民中月均用水量不低于的人数为6万;④根据这100位居民的用水量,采用样本量按比例分配的分层随机抽样的方法,抽取了容量为20人的样本,则在用水量区间中应抽取4人.A.1 B.2 C.3 D.4二、多选题3.(2024·湖南衡阳·模拟预测)中国雪乡哈尔滨的看雪最佳时间在11月中旬到次年的2月上旬,某旅游公司设计了一款冰雪文创产品.试营销以来,这款冰雪文创产品定价(单位:元)与销量(单位:万件)的数据如下表所示:产品定价(单位:元)99.51010.511销量(单位:万件)1110865则下列结论正确的是(
)参考公式:.参考数据:,,,.A.产品定价的平均值是10元B.产品定价与销量存在正相关关系C.产品定价与销量满足一元线性回归模型D.产品定价与销量的相关系数4.(23-24高三下·山东菏泽·开学考试)下列说法正确的是(
)A.若随机变量,则B.若经验回归方程中的,则变量与正相关C.若随机变量,且,则D.若事件与为互斥事件,则的对立事件与的对立事件一定互斥三、填空题5.(2024·山东济南·二模)现有A,B两组数据,其中A组有4个数据,平均数为2,方差为6,B组有6个数据,平均数为7,方差为1.若将这两组数据混合成一组,则新的一组数据的方差为.6.(2024·广西·二模)设实数x,y4≤x<y,满足1,3,4,x,y,的平均数与50%分位数相等,则数据x,y,的方差为.四、解答题7.(2024·安徽芜湖·二模)据新华社北京2月26日报道,中国航天全年预计实施100次左右发射任务,有望创造新的纪录,我国首个商业航天发射场将迎来首次发射任务,多个卫星星座将加速组网建设;中国航天科技集团有限公司计划安排近70次宇航发射任务,发射290余个航天器,实施一系列重大工程任务.由于航天行业拥有广阔的发展前景,有越来越多的公司开始从事航天研究,某航天公司研发了一种火箭推进器,为测试其性能,对推进器飞行距离与损坏零件数进行了统计,数据如下:飞行距离x(kkm)5663717990102110117损坏零件数y(个)617390105119136149163参考数据:,,,(1)建立y关于x的回归模型,根据所给数据及回归模型,求y关于x的回归方程(精确到0.1,精确到1);(2)该公司进行了第二项测试,从所有同型号推进器中随机抽取100台进行等距离飞行测试,对其中60台进行飞行前保养,测试结束后,有20台报废,其中保养过的推进器占比30%,请根据统计数据完成2×2列联表,并根据小概率值的独立性检验,能否认为推进器是否报废与保养有关?保养未保养合计报废20未报废合计60100附:回归方程中斜率和截距的最小二乘估计公式分别为,,,;0.250.10.050.0250.010.0011.3232.7063.8415.0246.63510.8288.(2022·全国·高考真题)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:不够良好良好病例组4060对照组1090(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”.与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.(ⅰ)证明:;(ⅱ)利用该调查数据,给出的估计值,并利用(ⅰ)的结果给出R的估计值.附,0.0500.0100.001k3.8416.63510.828【基础保分训练】一、单选题1.(23-24高三下·广东·开学考试)国家统计局发布的2018年至2022年我国居民消费水平情况如图所示,则下列说法正确的是(
)(居民消费水平:)
A.2018年至2022年我国居民消费水平逐年提高B.2018年至2022年我国城镇居民消费水平逐年提高C.2018年至2022年我国居民消费水平数据的分位数为27504元D.2022年我国城镇人口数比农村人口数的1.5倍还要多2.(2023·贵州黔东南·模拟预测)“说文明话、办文明事、做文明人,树立城市新风尚!创建文明城市,你我共同参与!”为宣传创文精神,华强实验中学高一(2)班组织了甲乙两名志愿者,利用一周的时间在街道对市民进行宣传,将每天宣传的次数绘制成如下频数分布折线图,则以下说法不正确的为(
)
A.甲的众数小于乙的众数 B.乙的极差小于甲的极差C.甲的方差大于乙的方差 D.乙的平均数大于甲的平均数3.(2024·海南·模拟预测)某机构统计了1000名演员的学历情况,制作出如图所示的饼状图,其中本科学历的人数为630.现按比例用分层随机抽样的方法从中抽取200人,则抽取的硕士学历的人数为(
)
A.11 B.13 C.22 D.264.(2023·福建泉州·模拟预测)某市物价部门对某商品在5家商场的售价(元)及其一天的销售量(件)进行调查,得到五对数据(),经过分析、计算,得,,,之间的经验回归方程是:,则相应于点的残差为(
)A. B. C. D.二、多选题5.(2024·河南三门峡·模拟预测)某灯具配件厂生产了一种塑胶配件,该厂质检人员某日随机抽取了100个该配件的质量指标值(单位:分)作为一个样本,得到如下所示的频率分布直方图,则(同一组中的数据用该组区间的中点值作代表)(
)A.B.样本质量指标值的平均数为75C.样本质量指标值的众数小于其平均数D.样本质量指标值的第75百分位数为856.(2024·广东·二模)若是样本数据的平均数,则(
)A.的极差等于的极差B.的平均数等于的平均数C.的中位数等于的中位数D.的标准差大于的标准差7.(2024·云南昆明·模拟预测)某城市在创建文明城市的活动中,为了解居民对“创建文明城市”的满意程度,组织居民给活动打分(分数为整数,满分100分),从中随机抽取一个容量为100的样本,发现数据均在内.现将这些分数分成6组并画出样本的频率分布直方图,但不小心污损了部分图形,如图所示.观察图形,则下列说法正确的是(
)
A.频率分布直方图中第三组的频数为15B.根据频率分布直方图估计样本的众数为75分C.根据频率分布直方图估计样本的中位数为74分D.根据频率分布直方图估计样本的平均数为73分8.(2024·湖北武汉·模拟预测)某科技公司统计了一款App最近5个月的下载量如表所示,若与线性相关,且线性回归方程为,则(
)月份编号12345下载量(万次)54.543.52.5A.与负相关 B.C.预测第6个月的下载量是2.1万次 D.残差绝对值的最大值为0.2三、填空题9.(2024·全国·模拟预测)某小组5位同学各拋掷一枚正方体骰子,将正面向上的点数按从小到大的顺序记录下来,得到一组统计数据.已知这组数据的平均数为整数,最大值为6,中位数为3,方差为1.6,则这组数据的众数为.10.(2024·四川成都·一模)某区为了解全区名高二学生的体能素质情况,在全区高二学生中随机抽取了名学生进行体能测试,并将这名的体能测试成绩整理成如下频率分布直方图.根据此频率分布直方图,这名学生平均成绩的估计值为.
四、解答题11.(2024·陕西西安·模拟预测)某企业近年来的广告费用(百万元)与所获得的利润(千万元)的数据如下表所示,已知与之间具有线性相关关系.年份20182019202020212022广告费用百万元1.51.61.71.81.9润千万元1.622.42.53(1)求关于的线性回归方程;(2)若该企业从2018年开始,广告费用连续每一年都比上一年增加10万元,根据(1)中所得的线性回归方程,预测2025年该企业可获得的利润.参考公式:.12.(2024·全国·模拟预测)中国新能源汽车企业在10余年间实现了“弯道超车”,使我国一跃成为新能源汽车产量连续7年居世界第一的全球新能源汽车强国.某新能源汽车配件企业积极加大科研力度,生产效益逐步攀升.该企业在今年1月份至5月份的生产利润(单位:亿元)关于月份的数据如下表所示:月份12345生产利润(亿元)268910(1)试求y与x之间的相关系数r,并利用r说明y与x是否具有较强的线性相关关系;(若,则认为两个变量具有较强的线性相关性)(2)为扩大生产,该企业在M大学启动了校园招聘,分别招聘A、B两个工程师岗位,两个岗位都各设有3门笔试科目.M大学的硕士毕业生张无忌决定参加这次应聘,且每门科目考试是否通过相互独立.若张无忌报考A岗位,每门笔试科目通过的概率依次为,,,其中;若张无忌报考B岗位,每门笔试科目通过的概率均为.且张无忌只能报考A,B两个岗位中的一个.若以笔试中通过科目数的数学期望为依据作出决策,得出张无忌更有希望通过A岗位的笔试,试求的取值范围.附:参考数据:,,.相关系数.13.(2024·湖南长沙·模拟预测)为了了解高中生运动达标情况和性别之间的关系,某调查机构随机调查了100名高中生的情况,统计他们在暑假期间每天参加体育运动的时间,并把每天参加体育运动时间超过30分钟的记为“运动达标”,时间不超过30分钟的记为“运动欠佳”,已知运动达标与运动欠佳的人数比为3∶2,运动达标的女生与男生的人数比为2∶1,运动欠佳的男生有5人.(1)根据上述数据,完成下面2×2列联表,并依据小概率值的独立性检验,能否认为学生体育运动时间达标与性别因素有关系;性别运动达标情况合计运动达标运动欠佳男生女生合计(2)现从“运动达标”的学生中按性别用分层随机抽样的方法抽取6人,再从这6人中任选2.人进行体能测试,求选中的2人中恰有一人是女生的概率.参考公式,.0.10.050.012.7063.8416.63514.(2024·陕西·二模)为了引导学生阅读世界经典文学名著,某学校举办“名著读书日”活动,每个月选择一天为“名著读书日”,并给出一些推荐书目.为了了解此活动促进学生阅读文学名著的情况,该校在此活动持续进行了一年之后,随机抽取了校内100名学生,调查他们在开始举办读书活动前后的一年时间内的名著阅读数量,所得数据如下表:多于5本少于5本合计活动前3565100活动后6040100合计95105200(1)试通过计算,判断是否有的把握认为举办该读书活动对学生阅读文学名著有促进作用;(2)已知某学生计划在接下来的一年内阅读6本文学名著,其中4本国外名著,2本国内名著,并且随机安排阅读顺序.记2本国内名著恰好阅读完时的读书数量为随机变量,求的数学期望.参考公式:.临界值表:0.100.050.0250.0100.0050.0012.7063.8415.0246.6357.87910.828【能力提升训练】一、单选题1.(2021·河南郑州·一模)某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图,后从事互联网行业岗位分布条形图,则下列结论错误的是(
)注:后指年及以后出生,后指年之间出生,前指年及以前出生.A.互联网行业从业人员中从事技术和运营岗位的人数占总人数的三成以上B.互联网行业中从事技术岗位的人数超过总人数的C.互联网行业中从事运营岗位的人数后一定比前多D.互联网行业中从事技术岗位的人数后一定比后多2.(2024·四川·模拟预测)某市教育主管部门为了解高三年级学生学业达成的情况,对高三年级学生进行抽样调查,随机抽取了1000名学生,他们的学业达成情况按照从高到低都分布在五个层次内,分男、女生统计得到以下样本分布统计图,则下列叙述正确的是(
)A.样本中层次的女生比相应层次的男生人数多B.估计样本中男生学业达成的中位数比女生学业达成的中位数小C.层次的女生和层次的男生在整个样本中频率相等D.样本中层次的学生数和层次的学生数一样多3.(2022·天津和平·模拟预测)某校随机抽取了400名学生进行成绩统计,发现抽取的学生的成绩都在50分至100分之间,进行适当分组画出频率分布直方图如图所示,下列说法正确的是(
)A.直方图中x的值为0.040B.在被抽取的学生中,成绩在区间的学生数为30人C.估计全校学生的平均成绩为84分D.估计全校学生成绩的样本数据的80%分位数约为93分4.(2024·安徽合肥·模拟预测)某停车场在统计停车数量时数据不小心丢失一个,其余六个数据分别是10,8,8,11,16,8,若这组数据的平均数、中位数、众数成等差数列,则丢失数据的所有可能值的和为(
)A.21 B.24 C.27 D.325.(2024·河北·一模)某校为了解本校高一男生身高和体重的相关关系,在该校高一年级随机抽取了7名男生,测量了他们的身高和体重得下表:身高x(单位:)167173175177178180181体重y(单位:)90545964677276由表格制作成如图所示的散点图:由最小二乘法计算得到经验回归直线的方程为,其相关系数为;经过残差分析,点对应残差过大,把它去掉后,再用剩下的6组数据计算得到经验回归直线的方程为,相关系数为.则下列选项正确的是(
)A. B.C. D.6.(2024·湖北荆州·三模)根据变量和的成对样本数据,由一元线性回归模型得到经验回归模型,求得如图所示的残差图.模型误差(
)A.满足一元线性回归模型的所有假设B.不满足一元线性回归模型的的假设C.不满足一元线性回归模型的假设D.不满足一元线性回归模型的和的假设二、多选题7.(23-24高三下·福建·开学考试)据国家统计局网站2023年9月15日消息,8月份,社会消费品零售总额为37933亿元,同比增长(同比一般情况下是指本年第N月与去年的第N月比).其中,除汽车以外的消费品零售额为33820亿元,增长.1∼8月份,社会消费品零售总额为302281亿元,同比增长.其中,除汽车以外的消费品零售额为271888亿元,增长.2022年8月至2023年8月社会消费品零售总额同比增速如下:则下列说法正确的是(
)A.2023年1~8月份,社会消费品零售总额的月平均值约为25422.6亿元B.2022年8月份,社会消费品零售总额约为36264.8亿元C.除掉2022年8月至2023年8月社会消费品零售总额同比增速数据的最大值和最小值所得数据的标准差比原数据的标准差小D.2022年8月至2023年8月社会消费品零售总额同比增速数据的极差比中位数的8倍还多8.(2023·广东·二模)现有甲、乙、丙三位篮球运动员连续5场篮球比赛得分情况的记录数据,已知三位球员得分情况的数据满足以下条件:甲球员:5个数据的中位数是26,众数是24;乙球员;5个数据的中位数是29,平均数是26;丙球员:5个数据有1个是32,平均数是26,方差是9.6;根据以上统计数据,下列统计结论一定正确的是(
)A.甲球员连续5场比赛得分都不低于24分B.乙球员连续5场比赛得分都不低于24分C.丙球员连续5场比赛得分都不低于24分D.丙球员连续5场比赛得分的第60百分位数大于249.(2024·湖北鄂州·一模)下列命题正确的是(
)A.若样本数据的频率分布直方图为单峰不对称,且在右边“拖尾”,则样本数据的平均数大于中位数B.若散点图的散点均落在一条斜率非0的直线上,则决定系数C.数据的均值为4,标准差为1,则这组数据中没有大于5的数D.数据12,23,35,47,61的75百分位数为47三、填空题10.(2024·河南新乡·二模)若一组数据,,,,的平均数为3,方差为,则,,,,,9这6个数的平均数为,方差为.11.(2024·广东·一模)已知a,b,c是正整数,且,,,当a,b,c方差最小时,写出满足条件的一组a,b,c的值.四、解答题12.(2024·河南·三模)PM2.5是指环境空气中直径小于或等于2.5微米的颗粒物.它能较长时间悬浮于空气中,其在空气中含量越高,说明空气污染越严重.城市中的PM2.5成分除扬尘等自然因素外,燃料的燃烧也是一个重要来源.某市环境检测部门为检测燃油车流量对空气质量的影响,在一个检测点统计每日过往的燃油车流量(单位:辆)和空气中的PM2.5的平均浓度(单位:).检测人员采集了50天的数据,制成列联表(部分数据缺失):燃油车日流量燃油车日流量合计PM2.5的平均浓度1624PM2.5的平均浓度20合计22(1)完成上面的列联表,并根据小概率值的独立性检验,能否认为PM2.5的平均浓度小于与燃油车日流量小于1500辆有关联?(2)经计算得与之间的回归直线方程为,且这50天的燃油车的日流量的标准差,PM2.5的平均浓度的标准差.若相关系数满足,则判定所求回归直线方程有价值;否则判定其无价值.①判断该回归直线方程是否有价值;②若这50天的燃油车的日流量满足,试求这50天的PM2.5的平均浓度的平均数(利用四舍五入法精确到0.1).参考公式:,其中.0.010.0050.0016.6367.87910.828回归方程,其中,;相关系数.参考数据:,,.13.(2024·重庆·一模)实现“双碳目标”是党中央作出的重大战略决策,新能源汽车、电动汽车是重要的战略新兴产业,对于实现“双碳目标”具有重要的作用.为了解某市电动汽车的销售情况,调查了该市某电动汽车企业近6年产值情况,数据如下表所示:年份201820192020202120222023编号x123456产值y/百万辆91830515980(1)若用模型拟合y与x的关系,根据提供的数据,求出y与x的经验回归方程(精确到0.01);(2)为了进一步了解车主对电动汽车的看法,从某品牌汽车4S店当日5位购买电动汽车和3位购买燃油汽车的车主中随机选取4位车主进行采访,记选取的4位车主中购买电动汽车的车主人数为X,求随机变量X的分布列与数学期望,参考数据:,其中.参考公式:对于一组数据,其经验回归直线的斜率截距的最小二乘估计分别为.14.(2023·河北·模拟预测)5G技术对社会和国家十分重要.从战略地位来看,业界一般将其定义为继蒸汽机革命、电气革命和计算机革命后的第四次工业革命.某科技集团生产A,B两种5G通信基站核心部件,下表统计了该科技集团近几年来在A部件上的研发投入(亿元)与收益y(亿元)的数据,结果如下:研发投入x(亿元)12345收益y(亿元)3791011(1)利用样本相关系数r说明是否可以用线性回归模型拟合y与x的关系(当时,可以认为两个变量有很强的线性相关性);(2)求出y关于x的经验回归方程,并利用该方程回答下列问题:①若要使生产A部件的收益不低于15亿元,估计至少需要投入多少研发资金?(精确到0.001亿元)②该科技集团计划用10亿元对A,B两种部件进行投资,对B部件投资元所获得的收益y近似满足,则该科技集团针对A,B两种部件各应投入多少研发资金,能使所获得的总收益P最大.附:样本相关系数,回归直线方程的斜率,截距.15.(2024·全国·模拟预测)随着人工智能的进一步发展,逐渐进入大众视野.是一种基于人工智能的语言模型,具备卓越的自然语言处理能力、广泛的知识覆盖范围和富有创造性的回答能力,是人们学习、工作与生活中的出色助手.尽管如此,也有部分人认为会对人类未来工作产生威胁,由于其在提高工作效率方面的出色表现,将在未来取代一部分人的职业.现对200家企业开展调查,统计每家企业一年内应用的广泛性及招聘人数的增减,得到数据结果统计如下表所示:应用广泛性招聘人数减少招聘人数增加合计广泛应用6050110没有广泛应用405090合计100100200(1)根据小概率的独立性检验,是否有99%的把握认为企业招聘人数的增减与应用的广泛性有关?(2)用频率估计概率,从招聘人数减少的企业中随机抽取30家企业,记其中广泛应用的企业有X家,事件“”的概率为.求X的分布列并计算使取得最大值时k的值.附:,其中.0.10.050.012.7063.8416.635
2025二轮复习专项训练23统计与成对数据的统计分析[考情分析]高考近几年考查热点,主要考查线性回归分析和独立性检验,以实际应用题的形式出现,题目阅读量大,难度中档.【练前疑难讲解】一、用样本估计总体1.统计中的四个数据特征:(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:在样本数据中,将数据按从小到大顺序排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.(3)平均数:样本数据的算术平均数,即eq\x\to(x)=eq\f(1,n)(x1+x2+…+xn).(4)方差与标准差:s2=eq\f(1,n)[(x1-eq\x\to(x))2+(x2-eq\x\to(x))2+…+(xn-eq\x\to(x))2],s=eq\r(\f(1,n)[x1-\x\to(x)2+x2-\x\to(x)2+…+xn-\x\to(x)2]).2.频率分布直方图的两个结论:(1)小长方形的面积=组距×eq\f(频率,组距)=频率.(2)各小长方形的面积之和等于1.二、回归分析1.经验回归直线eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))经过样本点的中心(eq\x\to(x),eq\x\to(y)),若x取某一个值,代入经验回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))中,可求出y的估计值.2.样本相关系数:当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.三、独立性检验1.独立性检验的一般步骤(1)根据样本数据列成2×2列联表;(2)根据公式χ2=eq\f(nad-bc2,a+bc+da+cb+d),计算χ2的值;(3)查表比较χ2与临界值的大小关系,作统计判断.2.χ2的值越大,对应假设事件H0成立(两类变量相互独立)的概率越小,H0不成立的概率越大.一、单选题1.(2024·黑龙江哈尔滨·一模)为了迎接2025年第九届亚冬会的召开,某班组织全班学生开展有关亚冬会知识的竞赛活动.已知该班男生35人,女生25人.根据统计分析,男生组成绩和女生组成绩的方差分别为,该班成绩的方差为,则下列结论中一定正确的是(
)A. B.C. D.2.(2024·天津和平·一模)某市为了减少水资源浪费,计划对居民生活用水实施阶梯水价制度,为确定一个比较合理的标准,从该市随机调查了100位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图,则以下四个说法正确的个数为(
)
①估计居民月均用水量低于的概率为0.25;②估计居民月均用水量的中位数约为;③该市有40万居民,估计全市居民中月均用水量不低于的人数为6万;④根据这100位居民的用水量,采用样本量按比例分配的分层随机抽样的方法,抽取了容量为20人的样本,则在用水量区间中应抽取4人.A.1 B.2 C.3 D.4二、多选题3.(2024·湖南衡阳·模拟预测)中国雪乡哈尔滨的看雪最佳时间在11月中旬到次年的2月上旬,某旅游公司设计了一款冰雪文创产品.试营销以来,这款冰雪文创产品定价(单位:元)与销量(单位:万件)的数据如下表所示:产品定价(单位:元)99.51010.511销量(单位:万件)1110865则下列结论正确的是(
)参考公式:.参考数据:,,,.A.产品定价的平均值是10元B.产品定价与销量存在正相关关系C.产品定价与销量满足一元线性回归模型D.产品定价与销量的相关系数4.(23-24高三下·山东菏泽·开学考试)下列说法正确的是(
)A.若随机变量,则B.若经验回归方程中的,则变量与正相关C.若随机变量,且,则D.若事件与为互斥事件,则的对立事件与的对立事件一定互斥三、填空题5.(2024·山东济南·二模)现有A,B两组数据,其中A组有4个数据,平均数为2,方差为6,B组有6个数据,平均数为7,方差为1.若将这两组数据混合成一组,则新的一组数据的方差为.6.(2024·广西·二模)设实数x,y4≤x<y,满足1,3,4,x,y,的平均数与50%分位数相等,则数据x,y,的方差为.四、解答题7.(2024·安徽芜湖·二模)据新华社北京2月26日报道,中国航天全年预计实施100次左右发射任务,有望创造新的纪录,我国首个商业航天发射场将迎来首次发射任务,多个卫星星座将加速组网建设;中国航天科技集团有限公司计划安排近70次宇航发射任务,发射290余个航天器,实施一系列重大工程任务.由于航天行业拥有广阔的发展前景,有越来越多的公司开始从事航天研究,某航天公司研发了一种火箭推进器,为测试其性能,对推进器飞行距离与损坏零件数进行了统计,数据如下:飞行距离x(kkm)5663717990102110117损坏零件数y(个)617390105119136149163参考数据:,,,(1)建立y关于x的回归模型,根据所给数据及回归模型,求y关于x的回归方程(精确到0.1,精确到1);(2)该公司进行了第二项测试,从所有同型号推进器中随机抽取100台进行等距离飞行测试,对其中60台进行飞行前保养,测试结束后,有20台报废,其中保养过的推进器占比30%,请根据统计数据完成2×2列联表,并根据小概率值的独立性检验,能否认为推进器是否报废与保养有关?保养未保养合计报废20未报废合计60100附:回归方程中斜率和截距的最小二乘估计公式分别为,,,;0.250.10.050.0250.010.0011.3232.7063.8415.0246.63510.8288.(2022·全国·高考真题)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:不够良好良好病例组4060对照组1090(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”.与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.(ⅰ)证明:;(ⅱ)利用该调查数据,给出的估计值,并利用(ⅰ)的结果给出R的估计值.附,0.0500.0100.001k3.8416.63510.828参考答案:题号1234答案DDACDBC1.D【分析】借助分层抽样的方差公式计算即可得.【详解】设该班男生组成绩和女生组成绩的平均分分别为,,两个班的总的平均分为,则,故选:D.2.D【分析】由频率分布直方图求频率判断①,结合直方图中位数的求法计算中位数,即可判断②;用频率估计总体即可判断③,结合分层抽样的概念即可判断④.【详解】由频率分布直方图可知,居民月均用水量低于的概率为,故①正确;前三组的频率之和为,而前四组频率之和为,故中位数位于,由,可以估计居民月均用水量的中位数约为,②正确;估计万居民中月均用水量不低于的人数为,③正确;根据用水量对这位居民进行分层,用分层抽样的方法抽取人,则在用水量中应抽取人,④正确.故选:D3.ACD【分析】计算出可得A;计算出后可得B、C、D.【详解】由题可得,故A正确;而.由于与的相关系数近似为,故与的线性相关性很强,从而可以用线性回归模型拟合与的关系,同时,与为负相关,故B错误,C、D正确.故选:ACD.4.BC【分析】本题考查了二项分布,回归直线方程与两个变量的相关关系,正态分布的概率,互斥事件与对立事件,根据选项,逐一分析判断即可.【详解】对于,根据二项分布的概率计算,可知A错误;对于B,若回归直线的斜率,则回归直线是从左到右是上升的,则散点图也是从左到右是上升的,故变量与正相关,故B正确;对于C,因为随机变量,且,所以,则,故C正确;对于D,若、为互斥事件,但的对立事件与的对立事件可能同时发生,所以不一定互斥,故D错误;故选:BC.5.9【分析】根据题意,由分层抽样中数据方差的计算公式计算可得答案.【详解】根据题意,甲组数据的平均数为2,方差为6,乙组数据的平均数为7,方差为1,则两组数据混合后,新数据的平均数,则新数据的方差故答案为:96.149/【分析】利用平均数与分位数相等,得,代入数据中得方差.【详解】根据题意,数据1,3,4,x,y,y+2的平均数为1+3+4+x+y+y+26数据1,3,4,x,y,y+2的分位数为,∴1+3+4+x+y+y+26=4+x2,即即为,此组数据的平均数为x+x+1+x+33=x+∴数据x,y,y+2的方差为13故答案:7.(1)(2)列联表见解析;是否报废与保养有关,理由见解析.【分析】(1)根据题意可求出,,从而可求解.(2)根据题意可将列联表补充完整,并求得,从而求解判断是否报废与是否保养有关.【详解】(1)由题意得,则,所以.(2)设零假设为:是否报废与是否保养无关,由题意,报废推进器中保养过的共台,未保养的推进器共台,补充列联表如下:保养未保养合计报废61420未报废542680合计6040100则,根据小概率值的独立性检验,我们推断不成立,即认为是否报废与保养有关,此推断的错误概率不大于0.01.8.(1)答案见解析(2)(i)证明见解析;(ii);【分析】(1)由所给数据结合公式求出的值,将其与临界值比较大小,由此确定是否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异;(2)(i)根据定义结合条件概率公式即可完成证明;(ii)根据(i)结合已知数据求.【详解】(1)由已知,又,,所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.(2)(i)因为,所以所以,(ii)由已知,,又,,所以【基础保分训练】一、单选题1.(23-24高三下·广东·开学考试)国家统计局发布的2018年至2022年我国居民消费水平情况如图所示,则下列说法正确的是(
)(居民消费水平:)
A.2018年至2022年我国居民消费水平逐年提高B.2018年至2022年我国城镇居民消费水平逐年提高C.2018年至2022年我国居民消费水平数据的分位数为27504元D.2022年我国城镇人口数比农村人口数的1.5倍还要多2.(2023·贵州黔东南·模拟预测)“说文明话、办文明事、做文明人,树立城市新风尚!创建文明城市,你我共同参与!”为宣传创文精神,华强实验中学高一(2)班组织了甲乙两名志愿者,利用一周的时间在街道对市民进行宣传,将每天宣传的次数绘制成如下频数分布折线图,则以下说法不正确的为(
)
A.甲的众数小于乙的众数 B.乙的极差小于甲的极差C.甲的方差大于乙的方差 D.乙的平均数大于甲的平均数3.(2024·海南·模拟预测)某机构统计了1000名演员的学历情况,制作出如图所示的饼状图,其中本科学历的人数为630.现按比例用分层随机抽样的方法从中抽取200人,则抽取的硕士学历的人数为(
)
A.11 B.13 C.22 D.264.(2023·福建泉州·模拟预测)某市物价部门对某商品在5家商场的售价(元)及其一天的销售量(件)进行调查,得到五对数据(),经过分析、计算,得,,,之间的经验回归方程是:,则相应于点的残差为(
)A. B. C. D.二、多选题5.(2024·河南三门峡·模拟预测)某灯具配件厂生产了一种塑胶配件,该厂质检人员某日随机抽取了100个该配件的质量指标值(单位:分)作为一个样本,得到如下所示的频率分布直方图,则(同一组中的数据用该组区间的中点值作代表)(
)A.B.样本质量指标值的平均数为75C.样本质量指标值的众数小于其平均数D.样本质量指标值的第75百分位数为856.(2024·广东·二模)若是样本数据的平均数,则(
)A.的极差等于的极差B.的平均数等于的平均数C.的中位数等于的中位数D.的标准差大于的标准差7.(2024·云南昆明·模拟预测)某城市在创建文明城市的活动中,为了解居民对“创建文明城市”的满意程度,组织居民给活动打分(分数为整数,满分100分),从中随机抽取一个容量为100的样本,发现数据均在内.现将这些分数分成6组并画出样本的频率分布直方图,但不小心污损了部分图形,如图所示.观察图形,则下列说法正确的是(
)
A.频率分布直方图中第三组的频数为15B.根据频率分布直方图估计样本的众数为75分C.根据频率分布直方图估计样本的中位数为74分D.根据频率分布直方图估计样本的平均数为73分8.(2024·湖北武汉·模拟预测)某科技公司统计了一款App最近5个月的下载量如表所示,若与线性相关,且线性回归方程为,则(
)月份编号12345下载量(万次)54.543.52.5A.与负相关 B.C.预测第6个月的下载量是2.1万次 D.残差绝对值的最大值为0.2三、填空题9.(2024·全国·模拟预测)某小组5位同学各拋掷一枚正方体骰子,将正面向上的点数按从小到大的顺序记录下来,得到一组统计数据.已知这组数据的平均数为整数,最大值为6,中位数为3,方差为1.6,则这组数据的众数为.10.(2024·四川成都·一模)某区为了解全区名高二学生的体能素质情况,在全区高二学生中随机抽取了名学生进行体能测试,并将这名的体能测试成绩整理成如下频率分布直方图.根据此频率分布直方图,这名学生平均成绩的估计值为.
四、解答题11.(2024·陕西西安·模拟预测)某企业近年来的广告费用(百万元)与所获得的利润(千万元)的数据如下表所示,已知与之间具有线性相关关系.年份20182019202020212022广告费用百万元1.51.61.71.81.9润千万元1.622.42.53(1)求关于的线性回归方程;(2)若该企业从2018年开始,广告费用连续每一年都比上一年增加10万元,根据(1)中所得的线性回归方程,预测2025年该企业可获得的利润.参考公式:.12.(2024·全国·模拟预测)中国新能源汽车企业在10余年间实现了“弯道超车”,使我国一跃成为新能源汽车产量连续7年居世界第一的全球新能源汽车强国.某新能源汽车配件企业积极加大科研力度,生产效益逐步攀升.该企业在今年1月份至5月份的生产利润(单位:亿元)关于月份的数据如下表所示:月份12345生产利润(亿元)268910(1)试求y与x之间的相关系数r,并利用r说明y与x是否具有较强的线性相关关系;(若,则认为两个变量具有较强的线性相关性)(2)为扩大生产,该企业在M大学启动了校园招聘,分别招聘A、B两个工程师岗位,两个岗位都各设有3门笔试科目.M大学的硕士毕业生张无忌决定参加这次应聘,且每门科目考试是否通过相互独立.若张无忌报考A岗位,每门笔试科目通过的概率依次为,,,其中;若张无忌报考B岗位,每门笔试科目通过的概率均为.且张无忌只能报考A,B两个岗位中的一个.若以笔试中通过科目数的数学期望为依据作出决策,得出张无忌更有希望通过A岗位的笔试,试求的取值范围.附:参考数据:,,.相关系数.13.(2024·湖南长沙·模拟预测)为了了解高中生运动达标情况和性别之间的关系,某调查机构随机调查了100名高中生的情况,统计他们在暑假期间每天参加体育运动的时间,并把每天参加体育运动时间超过30分钟的记为“运动达标”,时间不超过30分钟的记为“运动欠佳”,已知运动达标与运动欠佳的人数比为3∶2,运动达标的女生与男生的人数比为2∶1,运动欠佳的男生有5人.(1)根据上述数据,完成下面2×2列联表,并依据小概率值的独立性检验,能否认为学生体育运动时间达标与性别因素有关系;性别运动达标情况合计运动达标运动欠佳男生女生合计(2)现从“运动达标”的学生中按性别用分层随机抽样的方法抽取6人,再从这6人中任选2.人进行体能测试,求选中的2人中恰有一人是女生的概率.参考公式,.0.10.050.012.7063.8416.63514.(2024·陕西·二模)为了引导学生阅读世界经典文学名著,某学校举办“名著读书日”活动,每个月选择一天为“名著读书日”,并给出一些推荐书目.为了了解此活动促进学生阅读文学名著的情况,该校在此活动持续进行了一年之后,随机抽取了校内100名学生,调查他们在开始举办读书活动前后的一年时间内的名著阅读数量,所得数据如下表:多于5本少于5本合计活动前3565100活动后6040100合计95105200(1)试通过计算,判断是否有的把握认为举办该读书活动对学生阅读文学名著有促进作用;(2)已知某学生计划在接下来的一年内阅读6本文学名著,其中4本国外名著,2本国内名著,并且随机安排阅读顺序.记2本国内名著恰好阅读完时的读书数量为随机变量,求的数学期望.参考公式:.临界值表:0.100.050.0250.0100.0050.0012.7063.8415.0246.6357.87910.828参考答案:题号12345678答案DDDAACDABBDACD1.D【分析】AB选项,2019年比2020年的两项指标高;C选项,将数据从小到大排序,再利用百分位数的概念进行求解;D选项,设2022年我国农村人口数为,城镇人口数为,则可列出方程,得到,故D正确.【详解】A选项,2019年的居民消费水平为元,2020年的居民消费水平为元,2019年比2020年的居民消费水平高,A错误;B选项,2019年的城镇居民消费水平为元,2020年的城镇居民消费水平为元,2019年比2020年的城镇居民消费水平高,B错误;C选项,2018年至2022年我国居民消费水平数据从小到大排序为,由于,故年至2022年我国居民消费水平数据的分位数为从小到大第3个和第4个数据的平均数,即元,C错误.D选项,设2022年我国农村人口数为,城镇人口数为,则,化简得,所以2022年我国城镇人口数比农村人口数的1.5倍还要多,D正确.故选:D2.D【分析】根据已知条件,结合众数、极差的定义,以及方差和平均数公式,即可求解.【详解】由图可知,甲志愿者的宣传次数分别为:4,5,6,3,4,3,3,乙志愿者的宣传次数分别为:5,4,4,5,4,3,3,甲的平均数为,乙的平均数为,故D错误,甲的众数为3,乙的众数为4,故甲的众数小于乙的众数,故A正确;甲的极差为3,乙的极差为2,则乙的极差小于甲的极差,故B正确;甲的方差为,乙的方差为,故甲的方差大于乙的方差,故C正确.故选:D.3.D【分析】由饼状图先算出硕士学历的人数与总人数1000之比,进一步结合分层抽样的方法即可求解.【详解】由题意硕士学历的人数与总人数1000之比为,现按比例用分层随机抽样的方法从中抽取200人,则抽取的硕士学历的人数为.故选:D.4.A【分析】先根据经验回归直线过样本点的中心求出,然后求出时的预测值,进而求得残差.【详解】因为,,所以样本点的中心为,又因为经验回归直线过样本点的中心,所以,所以,所以经验回归方程是:,当时,,所以残差为.故选:A.5.ACD【分析】运用频率分布直方图中所有频率之和为1及平均数、众数、百分位数公式计算即可.【详解】对于A项,由题意知,解得0.030,故A项正确;对于B项,样本质量指标值的平均数为,故B项错误;对于C项,样本质量指标值的众数是,故C项正确;对于D项,前3组的频率之和为,前4组的频率之和为,故第75百分位数位于第4组,设其为,则,解得,即第75百分位数为85,故D项正确.故选:ACD项.6.AB【分析】根据题意,依次分析两组数据的极差、平均数、中位数和标准差是否相等,综合可得答案.【详解】对于A,样本数据的平均数为,则,故的极差等于的极差,故A正确;对于B,数据的平均数,故B正确;对于C,如果是按从小到大排列,则的中位数为,不一定等于的中位数,故C错误;对于D,的方差,而的方差,但当时两组数据的方差相等,其标准差也相等,故D错误.故选:AB.7.BD【分析】根据频率分布直方图中所有小矩形的面积之和为求出分数在内的频率,再根据频率分布直方图一一分析即可.【详解】对A,因为分数在内的频率为,所以第三组的频数为,故A错误;对B,因为众数的估计值是频率分布直方图中最高矩形底边的中点的横坐标,从图中可看出众数的估计值为75分,故B正确;对C,因为,,所以中位数位于内,设中位数为,则,解得,所以中位数的估计值为75分,故C错误;对D,样本平均数的估计值为分,故D正确,故选:BD.8.ACD【分析】对于A:根据回归方程分析判断;对于B:根据线性回归方程必过样本中心点,运算求解;对于C:根据回归方程进而预测;对于D:根据题意结合残差的定义分析判断.【详解】对于A:因为,所以变量与负相关,故正确;对于B:,,,则,解得,故错误;对于C:当时,,故可以预测第6个月的下载量约为2.1万次,故正确;对于D:当时,,,当时,,,当时,,,当时,,,当时,,,故残差绝对值的最大值为0.2,故正确.故选:ACD.9.3【分析】根据题意将这组数据由小到大设出来,再根据方差为1.6可判断出平均数的取值有两种情况,对这两种情况分别讨论即可得出结果.【详解】设这组数据为,则平均数大于等于,假设平均数为3.因为,所以平均数或,若,则,所以,解得;若,则,所以,此时无解.所以这组数据的众数为3.故答案为:3.10.【分析】根据所有矩形面积之和为求出的值,将每个矩形底边的中点值乘以对应矩形的面积,相加可得这名学生平均成绩.【详解】由于频率分布直方图中所有矩形面积之和为,可得,解得,由频率分布直方图可知,这名学生平均成绩的估计值为分.故答案为:.11.(1)(2)3.95千万元【分析】(1)根据参考公式求出的值,即可得到结果;(2)根据表格得到2025年的广告费用,再代入方程即可得到结果.【详解】(1)据题意,则,,,∴关于的线性回归方程为.(2)由表可知2025年该企业广告费用为百万元,代入得:千万元.∴预测2025年该企业可获得的利润为千万元.12.(1),y与x具有较强的线性相关关系(2)【分析】(1)计算相关系数r,再进行判断即可;(2)分别计算通过A,B两个岗位的科目数学期望,再比较大小判断即可.【详解】(1)由题意,,故y与x具有较强的线性相关关系.(2)由题意,因为每门科目考试是否通过相互独立,故张无忌通过A岗位的3门笔试门数的数学期望为,通过B岗位的3门笔试门数的数学期望为,故若张无忌更有希望通过A岗位的笔试,则,又,解得.即的取值范围13.(1)列联表见解析,能(2)【分析】(1)由已知数据完成列联表,计算,与临界值比较得结论;(2)由分层抽样确定男女生人数,利用组合数公式和古典概型求解.【详解】(1)100名高中生,运动达标与运动欠佳的人数比为3∶2,则运动达标人数为,运动达标的女生与男生的人数比为2∶1,则运动达标的女生有40人,运动达标的男生有20人,列联表为性别运动达标情况合计运动达标运动欠佳男生20525女生403575合计6040100零假设为:性别与锻炼情况独立,即学生体育运动时间达标与性别因素无关,根据小概率值的独立性检验,推断不成立,即学生体育运动时间达标与性别因素有关系,此推断犯错误的概率不超过0.05.(2)因为“运动达标”的男生、女生分别有20人和40人,按分层随机抽样的方法从中抽取6人,则男生、女生分别抽到2人和4人,则选中的2人中恰有一人是女生的概率为.14.(1)有(2)【分析】(1)由表中数据计算卡方,对比临界值即可得出结论;(2)的可能取值为,由古典概型概率公式、组合数公式求出对应概率,进一步由数学期望公式即可运算求解.【详解】(1)由表中数据可知,,所以有的把握认为举办该读书活动对学生阅读文学名著有促进作用;(2)由题意可知,的可能取值为,则,,所以.【能力提升训练】一、单选题1.(2021·河南郑州·一模)某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图,后从事互联网行业岗位分布条形图,则下列结论错误的是(
)注:后指年及以后出生,后指年之间出生,前指年及以前出生.A.互联网行业从业人员中从事技术和运营岗位的人数占总人数的三成以上B.互联网行业中从事技术岗位的人数超过总人数的C.互联网行业中从事运营岗位的人数后一定比前多D.互联网行业中从事技术岗位的人数后一定比后多2.(2024·四川·模拟预测)某市教育主管部门为了解高三年级学生学业达成的情况,对高三年级学生进行抽样调查,随机抽取了1000名学生,他们的学业达成情况按照从高到低都分布在五个层次内,分男、女生统计得到以下样本分布统计图,则下列叙述正确的是(
)A.样本中层次的女生比相应层次的男生人数多B.估计样本中男生学业达成的中位数比女生学业达成的中位数小C.层次的女生和层次的男生在整个样本中频率相等D.样本中层次的学生数和层次的学生数一样多3.(2022·天津和平·模拟预测)某校随机抽取了400名学生进行成绩统计,发现抽取的学生的成绩都在50分至100分之间,进行适当分组画出频率分布直方图如图所示,下列说法正确的是(
)A.直方图中x的值为0.040B.在被抽取的学生中,成绩在区间的学生数为30人C.估计全校学生的平均成绩为84分D.估计全校学生成绩的样本数据的80%分位数约为93分4.(2024·安徽合肥·模拟预测)某停车场在统计停车数量时数据不小心丢失一个,其余六个数据分别是10,8,8,11,16,8,若这组数据的平均数、中位数、众数成等差数列,则丢失数据的所有可能值的和为(
)A.21 B.24 C.27 D.325.(2024·河北·一模)某校为了解本校高一男生身高和体重的相关关系,在该校高一年级随机抽取了7名男生,测量了他们的身高和体重得下表:身高x(单位:)167173175177178180181体重y(单位:)90545964677276由表格制作成如图所示的散点图:由最小二乘法计算得到经验回归直线的方程为,其相关系数为;经过残差分析,点对应残差过大,把它去掉后,再用剩下的6组数据计算得到经验回归直线的方程为,相关系数为.则下列选项正确的是(
)A. B.C. D.6.(2024·湖北荆州·三模)根据变量和的成对样本数据,由一元线性回归模型得到经验回归模型,求得如图所示的残差图.模型误差(
)A.满足一元线性回归模型的所有假设B.不满足一元线性回归模型的的假设C.不满足一元线性回归模型的假设D.不满足一元线性回归模型的和的假设二、多选题7.(23-24高三下·福建·开学考试)据国家统计局网站2023年9月15日消息,8月份,社会消费品零售总额为37933亿元,同比增长(同比一般情况下是指本年第N月与去年的第N月比).其中,除汽车以外的消费品零售额为33820亿元,增长.1∼8月份,社会消费品零售总额为302281亿元,同比增长.其中,除汽车以外的消费品零售额为271888亿元,增长.2022年8月至2023年8月社会消费品零售总额同比增速如下:则下列说法正确的是(
)A.2023年1~8月份,社会消费品零售总额的月平均值约为25422.6亿元B.2022年8月份,社会消费品零售总额约为36264.8亿元C.除掉2022年8月至2023年8月社会消费品零售总额同比增速数据的最大值和最小值所得数据的标准差比原数据的标准差小D.2022年8月至2023年8月社会消费品零售总额同比增速数据的极差比中位数的8倍还多8.(2023·广东·二模)现有甲、乙、丙三位篮球运动员连续5场篮球比赛得分情况的记录数据,已知三位球员得分情况的数据满足以下条件:甲球员:5个数据的中位数是26,众数是24;乙球员;5个数据的中位数是29,平均数是26;丙球员:5个数据有1个是32,平均数是26,方差是9.6;根据以上统计数据,下列统计结论一定正确的是(
)A.甲球员连续5场比赛得分都不低于24分B.乙球员连续5场比赛得分都不低于24分C.丙球员连续5场比赛得分都不低于24分D.丙球员连续5场比赛得分的第60百分位数大于249.(2024·湖北鄂州·一模)下列命题正确的是(
)A.若样本数据的频率分布直方图为单峰不对称,且在右边“拖尾”,则样本数据的平均数大于中位数B.若散点图的散点均落在一条斜率非0的直线上,则决定系数C.数据的均值为4,标准差为1,则这组数据中没有大于5的数D.数据12,23,35,47,61的75百分位数为47三、填空题10.(2024·河南新乡·二模)若一组数据,,,,的平均数为3,方差为,则,,,,,9这6个数的平均数为,方差为.11.(2024·广东·一模)已知a,b,c是正整数,且,,,当a,b,c方差最小时,写出满足条件的一组a,b,c的值.四、解答题12.(2024·河南·三模)PM2.5是指环境空气中直径小于或等于2.5微米的颗粒物.它能较长时间悬浮于空气中,其在空气中含量越高,说明空气污染越严重.城市中的PM2.5成分除扬尘等自然因素外,燃料的燃烧也是一个重要来源.某市环境检测部门为检测燃油车流量对空气质量的影响,在一个检测点统计每日过往的燃油车流量(单位:辆)和空气中的PM2.5的平均浓度(单位:).检测人员采集了50天的数据,制成列联表(部分数据缺失):燃油车日流量燃油车日流量合计PM2.5的平均浓度1624PM2.5的平均浓度20合计22(1)完成上面的列联表,并根据小概率值的独立性检验,能否认为PM2.5的平均浓度小于与燃油车日流量小于1500辆有关联?(2)经计算得与之间的回归直线方程为,且这50天的燃油车的日流量的标准差,PM2.5的平均浓度的标准差.若相关系数满足,则判定所求回归直线方程有价值;否则判定其无价值.①判断该回归直线方程是否有价值;②若这50天的燃油车的日流量满足,试求这50天的PM2.5的平均浓度的平均数(利用四舍五入法精确到0.1).参考公式:,其中.0.010.0050.0016.6367.87910.828回归方程,其中,;相关系数.参考数据:,,.13.(2024·重庆·一模)实现“双碳目标”是党中央作出的重大战略决策,新能源汽车、电动汽车是重要的战略新兴产业,对于实现“双碳目标”具有重要的作用.为了解某市电动汽车的销售情况,调查了该市某电动汽车企业近6年产值情况,数据如下表所示:年份201820192020202120222023编号x123456产值y/百万辆91830515980(1)若用模型拟合y与x的关系,根据提供的数据,求出y与x的经验回归方程(精确到0.01);(2)为了进一步了解车主对电动汽车的看法,从某品牌汽车4S店当日5位购买电动汽车和3位购买燃油汽车的车主中随机选取4位车主进行采访,记选取的4位车主中购买电动汽车的车主人数为X,求随机变量X的分布列与数学期望,参考数据:,其中.参考公式:对于一组数据,其经验回归直线的斜率截距的最小二乘估计分别为.14.(2023·河北·模拟预测)5G技术对社会和国家十分重要.从战略地位来看,业界一般将其定义为继蒸汽机革命、电气革命和计算机革命后的第四次工业革命.某科技集团生产A,B两种5G通信基站核心部件,下表统计了该科技集团近几年来在A部件上的研发投入(亿元)与收益y(亿元)的数据,结果如下:研发投入x(亿元)12345收益y(亿元)3791011(1)利用样本相关系数r说明是否可以用线性回归模型拟合y与x的关系(当时,可以认为两个变量有很强的线性相关性);(2)求出y关于x的经验回归方程,并利用该方程回答下列问题:①若要使生产A部件的收益不低于15亿元,估计至少需要投入多少研发资金?(精确到0.001亿元)②该科技集团计划用10亿元对A,B两种部件进行投资,对B部件投资元所获得的收益y近似满足,则该科技集团针对A,B两种部件各应投入多少研发资金,能使所获得的总收益P最大.附:样本相关系数,回归直线方程的斜率,截距.15.(2024·全国·模拟预测)随着人工智能的进一步发展,逐渐进入大众视野.是一种基于人工智能的语言模型,具备卓越的自然语言处理能力、广泛的知识覆盖范围和富有创造性的回答能力,是人们学习、工作与生活中的出色助手.尽管如此,也有部分人认为会对人类未来工作产生威胁,由于其在提高工作效率方面的出色表现,将在未来取代一部分人的职业.现对200家企业开展调查,统计每家企业一年内应用的广泛性及招聘人数的增减,得到数据结果统计如下表所示:应用广泛性招聘人数减少招聘人数增加合计广泛应用6050110没有广泛应用405090合计100100200(1)根据小概率的独立性检验,是否有99%的把握认为企业招聘人数的增减与应用的广泛性有关?(2)用频率估计概率,从招聘人数减少的企业中随机抽取30家企业,记其中广泛应用的企业有X家,事件“”的概率为.求X的分布列并计算使取得最大值时k的值.附:,其中.0.10.050.012.7063.8416.635参考答案:题号123456789答案DBCDADBCADABD1.D【解析】根据整个互联网行业从业者年龄分布饼状图、后从事互联网行业岗位分布条形图,对四个选项逐一分析,即可得出正确选项.【详解】对于选项A,因为互联网行业从业人员中,“后”占比为,其中从事技术和运营岗位的人数占的比分别为和,则“后”从事技术和运营岗位的人数占总人数的.“前”和“后”中必然也有从事技术和运营岗位的人,则总的占比一定超过三成,故选项A正确;对于选项B,因为互联网行业从业人员中,“后”占比为,其中从事技术岗位的人数占的比为,则“后”从事技术岗位的人数占总人数的.“前”和“后”中必然也有从事技术岗位的人,则总的占比一定超过,故选项B正确;对于选项C,“后”从事运营岗位的人数占总人数的比为,大于“前”的总人数所占比,故选项C正确;选项D,“后”从事技术岗位的人数占总人数的,“后”的总人数所占比为,条件中未给出从事技术岗位的占比,故不能判断,所以选项D错误.故选:D.【点睛】关键点点睛:本题考查利用扇形统计图和条形统计图解决实际问题,解本题的关键就是利用条形统计图中“后”事互联网行业岗位的占比乘以“后”所占总人数的占比,再对各选项逐一分析即可.2.B【分析】频率分布直方图,得女生学业达成在各层次的频率,对选项中的频率频数问题进行判断.【详解】对于AC,设女生学业达成频率分布直方图中的组距为,由,得,所以女生学业达成频率分布直方图中层次频率为,层次频率为,层次频率为,层次频率为,层次频率为,因为男、女生样本数未知,所以层次中男、女生人数不能比较,即A选项错误;同理,层次女生在女生样本数中频率与层次男生在男生样本数中频率相等,都是,但因男、女生人数未知,所以在整个样本中频率不一定相等,即C选项错误;对于D,设女生人数为,男生人数为,但因男、女生人数可能不相等,则层次的学生数为,层次的学生数为,因为不确定,所以与可能不相等,即D选项错误;对于B,女生两个层次的频率之和为,所以女生的样本学业达成的中位数为B,C层次的分界点,男生两个层次的频率之和为,显然中位数落在C层次内,所以样本中男生学业达成的中位数比女生学业达成的中位数小,B选项正确.故选:B.3.C【分析】根据学生的成绩都在50分至100分之间的频率和为1可求得x值,以此判断A;计算成绩在区间[70,80)的学生频率,然后可计算该区间学生数,以此判断B;按照频率频率分布直方图中平均数计算公式计算可判断C;按照频率分布直方图中百分位数的计算方法计算可判断D.【详解】定义A:根据学生的成绩都在50分至100分之间的频率和为1,可得,解得x=0.03,所以A错;对于B:在被抽取的学生中,成绩在区间[70,80)的学生数为10×0.015×400=60(人),所以B错;对于C:估计全校学生的平均成绩为55×0.05+65×0.1+
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《设施选址及其评价》课件
- 2023六年级数学上册 一 圆说课稿教学反思作业题 北师大版
- 2024-2025学年八年级政治下册 第六单元 与大自然和谐相处 第12课 感受大自然(人与大自然的不和谐之音)说课稿 鲁人版六三制
- 《陪访的技巧》课件
- 《千与千寻》分析课件
- DB37-T 4506-2022 河湖管护规范
- 二零二五年指纹锁产品销售代理合同2篇
- 二零二五年度预制混凝土构件销售合同模板3篇
- 保洁员劳务协议
- 保安公司劳务派遣合同
- 《对私外汇业务从业资格》开放式测试答案
- 《保险法解读》课件
- 非煤矿山复工复产安全培训
- 变压器投标书-技术部分
- 《我国跨境电子商务消费者权益保护问题研究》
- 2024九省联考适应性考试【甘肃省】历史试卷及答案解析
- 四年级语文下册第六单元【集体备课】(教材解读+教学设计)
- 苏教版小学信息技术五年级下册五年级下册教案全集
- 苏教版八年级数学上册期末试卷及答案【完美版】
- 法院拍卖议价协议书
- 2021年人教版八年级物理上册期末考试卷(完美版)
评论
0/150
提交评论