第12小题 统计(高考必考22题)2024年高考《数学》复习题型分类与方法点拨(解析版)_第1页
第12小题 统计(高考必考22题)2024年高考《数学》复习题型分类与方法点拨(解析版)_第2页
第12小题 统计(高考必考22题)2024年高考《数学》复习题型分类与方法点拨(解析版)_第3页
第12小题 统计(高考必考22题)2024年高考《数学》复习题型分类与方法点拨(解析版)_第4页
第12小题 统计(高考必考22题)2024年高考《数学》复习题型分类与方法点拨(解析版)_第5页
已阅读5页,还剩75页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第第页第12小题统计TOC\o"1-5"\h\u第12小题统计 1一、主干知识归纳与回顾 312.1随机抽样 312.2用样本估计总体 3(一)命题角度剖析 4(二)考情分析 4(三)高考预测 5二、题型分类与预测 5命题点一:抽样方法及应用 51.1母题精析(三年高考真题) 5一.分层抽样方法(共1小题) 5二.系统抽样方法(共1小题) 51.2解题模型 61.3对点训练(四年省市模考) 6一.简单随机抽样(共2小题) 6二.分层抽样方法(共6小题) 7三.系统抽样方法(共3小题) 10四.收集数据的方法(共1小题) 11命题点二:总体分布的估计 131.1母题精析(三年高考真题) 13一.频率分布直方图(共4小题) 13二.茎叶图(共1小题) 16三.散点图(共1小题) 16四.众数、中位数、平均数(共4小题) 17五.极差、方差与标准差(共4小题) 18六.变量间的相关关系(共1小题) 201.2解题模型 211.3对点训练(四年省市模考) 22一.分布和频率分布表(共3小题) 22二.频率分布直方图(共7小题) 24三.统计图表获取信息(共3小题) 31四.众数、中位数、平均数(共7小题) 34五.极差、方差与标准差(共2小题) 38六.用样本的数字特征估计总体的数字特征(共1小题) 39七.百分位数(共1小题) 40八.变量间的相关关系(共1小题) 41九.线性回归方程(共8小题) 43一十.独立性检验(共2小题) 48三、类题狂刷(五年区模、校模): 52一.频率分布直方图(共11小题) 52二.频率分布折线图、密度曲线(共1小题) 61三.茎叶图(共3小题) 62四.散点图(共1小题) 64五.统计图表获取信息(共3小题) 65六.众数、中位数、平均数(共4小题) 68八.百分位数(共1小题) 73九.变量间的相关关系(共1小题) 73一十.线性回归方程(共8小题) 74一十一.独立性检验(共1小题) 78一、主干知识归纳与回顾12.1随机抽样1.抽样调查:根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查.样本:从总体中抽取的那部分个体称为样本.样本容量(样本量):样本中包含的个体数称为样本容量.2.简单随机抽样:设一个总体含有N(N为正整数)个个体,从中逐个抽取n(l≤n<N)个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们这样的抽样方法叫做不放回简单随机抽样,放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.3.分层随机抽样:按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样.12.2用样本估计总体总体取值规律的估计频率分布直方图的画法:(1)求极差(2)决定组距和组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图:纵轴表示,小长方形面积=频率.总体百分位数的估计(1)第p百分位数:它使得这组数据中至少的数据小于或等于这个值,且至少有的数据大于或等于这个值.(2)第p百分位数的计算步骤:①按从小到大排列原始数据.②计算.③若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据,若i是整数,则第p百分位数为第i项与第i+1项数据的平均数.(3)四分位数:第25、50、75百分位数称为四分位数。总体集中趋势的估计:平均数、中位数、众数从不同角度刻画了一组数据的集中趋势.对数值型数据(如身高、收入)集中趋势的描述可以用平均数、中位数;而对分类型数据(如校服规格、性别)集中趋势的描述可以用众数.总体离散程度的估计:方差与标准差:一组样本数据。方差:;(一)命题角度剖析1.抽样方法及应用★★☆☆☆2.总体分布的估计★★★★☆(二)考情分析高考频率:100%试题难度:中等呈现形式:以选择题或填空题(三)高考预测抽样方法及应用有时考查抽样方法的选取及相关计算,尤其是分层随机抽样的计算;总体分布的估计主要考查样本数据分析、频率分布表、频率分布直方图等有关问题,考查学生数据分析、数学运算的能力。二、题型分类与预测命题点一:抽样方法及应用1.1母题精析(三年高考真题)一.分层抽样方法(共1小题)1.(2018•新课标Ⅲ)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是分层抽样.【分析】利用简单随机抽样、分层抽样和系统抽样的定义、性质直接求解.【解答】解:某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异,为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是分层抽样.故答案为:分层抽样.【点评】本题考查抽样方法的判断,考查简单随机抽样、分层抽样和系统抽样的性质等基础知识,考查运算求解能力,考查函数与方程思想,是基础题.二.系统抽样方法(共1小题)2.(2019•新课标Ⅰ)某学校为了解1000名新生的身体素质,将这些学生编号1,2,,1000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是A.8号学生 B.200号学生 C.616号学生 D.815号学生【分析】根据系统抽样的特征,从1000名学生从中抽取一个容量为100的样本,抽样的分段间隔为10,结合从第4组抽取的号码为46,可得第一组用简单随机抽样抽取的号码.【解答】解:从1000名学生从中抽取一个容量为100的样本,系统抽样的分段间隔为,号学生被抽到,则根据系统抽样的性质可知,第一组随机抽取一个号码为6,以后每个号码都比前一个号码增加10,所有号码数是以6为首项,以10为公差的等差数列,设其数列为,则,当时,,即在第62组抽到616.故选:.【点评】本题考查了系统抽样方法,关键是求得系统抽样的分段间隔.1.2解题模型1.两种抽样方法的选择(1)如果总体中个体之间的差异明显(如年龄、学段、性别、工种),并能据此将总体分为几层(几类、几部分),那么一般选择分层随机抽样方法.(2)如果总体没有差异明显的层次,则考虑采用简单随机抽样.常用的简单随机抽样方法有抽签法和随机数法.当总体容量较少时,宜用抽签法;当总体容量较大时,宜用随机数法.分层随机抽样中的计算方法在分层随机抽样中,每层抽取的个体数与层每层中抽取的个体数量的大小成比例,满足“”,即“或”,据此,当已知每层间的个体数量或数量比、样本容量、总体容量中的两个时,就可以求出第三个.1.3对点训练(四年省市模考)一.简单随机抽样(共2小题)1.(2019•漳州二模)某工厂利用随机数表对生产的600个零件进行抽样测试,先将600个零件进行编号,编号分别为001,002,,599,600从中抽取60个样本,如下提供随机数表的第4行到第6行:322118342978645407325242064438122343567735789056428442125331345786073625300732862345788907236896080432567808436789535577348994837522535578324577892345若从表中第6行第6列开始向右依次读取3个数据,则得到的第6个样本编号A.522 B.324 C.535 D.578【分析】根据随机抽样的定义进行判断即可.【解答】解:第6行第6列的数开始的数为808,不合适,436,789不合适,535,577,348,994不合适,837不合适,522,535重复不合适,578合适则满足条件的6个编号为436,535,577,348,522,578,则第6个编号为578,故选:.【点评】本题主要考查随机抽样的应用,根据定义选择满足条件的数据是解决本题的关键.2.(2020•漳州模拟)某公司决定利用随机数表对今年新招聘的800名员工进行抽样调查他们对目前工作的满意程度,先将这800名员工进行编号,编号分别为001,002,,799,800,从中抽取80名进行调查,如下提供随机数表的第4行到第6行322118342978645407325242064438122343567735789056428442125331345786073625300732862345788907236896080432567808436789535577348994837522535578324377892345若从表中第5行第6列开始向右依次读取3个数据,则抽到的第5名员工的编号是A.007 B.253 C.328 D.736【分析】根据随机数表法,抽取,重复和不在的舍弃,得到结论【解答】解:依次读取的数据为253,313,457,860(超过800,舍去),736,253(与前面重复,舍去),007,,所以抽到的第5名员工的编号是007,故选:.【点评】考查随机数表法抽取样本,基础题.二.分层抽样方法(共6小题)3.(2022•莆田模拟)厦门中学生助手通过统计已知某校有教职工560人,其中女职工240人,现按性别用分层抽样的方法从该校教职工中抽取28人,则抽取的男职工人数与抽取的女职工人数之差是A.2 B.4 C.6 D.8【分析】先求出男职工人数和抽取的女职工人数所占的比例,再根据分层抽样的特点,即可求出抽取的男职工人数和抽取的女职工人数,从而得出结论.【解答】解:某校有教职工560人,其中女职工240人,男职工320人,故男女职工数之比为.现按性别用分层抽样的方法从该校教职工中抽取28人,则抽取的男职工人数与抽取的女职工人数之比为,即抽取的男职工人数占的比例为,抽取的女职工人数占的比例为,故抽取的男职工人数为,抽取的女职工人数为,抽取的男职工人数与抽取的女职工人数之差是,故选:.【点评】本题主要考查分层抽样的定义和方法,属于基础题.4.(2020•龙岩模拟)2020年初,我国突发新冠肺炎疫情,疫情期间中小学生“停课不停学”.已知某地区中小学生人数情况如甲图所示,各学段学生在疫情期间“家务劳动”的参与率如乙图所示.为了进一步了解该地区中小学生参与“家务劳动”的情况,现用分层抽样的方法抽取的学生进行调查,则抽取的样本容量、抽取的高中生中参与“家务劳动”的人数分别为A.2750,200 B.2750,110 C.1120,110 D.1120,200【分析】由题意利用频率分布直方图、分层抽样的定义和方法,得出结论.【解答】解:学生总数为人,由于抽取的学生进行调查,则抽取的样本容量为人,故高中生应抽取的人数为,而高中生中参与“家务劳动”的比率为0.55,故高中生中参与“家务劳动”的人数为,故选:.【点评】本题主要考查频率分布直方图、分层抽样的定义和方法,属于基础题.5.(2020•厦门模拟)中国武汉于2019年10月18日至2019年10月27日成功举办了第七届世界军人运动会.来自109个国家的9300余名运动员同台竞技.经过激烈的角逐,奖牌榜的前3名如下:国家金牌银牌铜牌奖牌总数中国1336442239俄罗斯515357161巴西21313688某数学爱好者采用分层抽样的方式,从中国和巴西获得金牌选手中抽取了22名获奖代表.从这22名中随机抽取3人,则这3人中中国选手恰好1人的概率为A. B. C. D.【分析】根据分层抽样求出22名获奖代表中有中国选手19个,巴西选手3个.再根据组合知识和概率公式即可求出.【解答】解:中国和巴西获得金牌总数为154,按照分层抽样方法,22名获奖代表中有中国选手19个,巴西选手3个.故从这22名中随机抽取3人,则这3人中中国选手恰好1人的概率为故选:.【点评】本题考查了分层抽样排列组合和概率的问题,属于基础题.6.(2020•漳州模拟)已知某校有高一学生1000人,高二学生800人,高三学生600人,该校学生会希望调查有关本学期学生活动计划的意见,现从全体高中学生中抽取作为样本.若利用分层抽样,则应在高二学生中抽取A.100人 B.80人 C.600人 D.240人【分析】由题意利用分层抽样,求得结果.【解答】解:由题意,应在高二学生中抽取的人数为,故选:.【点评】本题主要考查分层抽样,属于基础题.7.(2020•漳州一模)已知某学校高一、高二、高三学生的人数如表:年级高一高二高三学生人数150020002500利用分层抽样抽取部分学生观看演出,已知高一年级抽调15人,则该学校观看演出的人数为A.35 B.45 C.60 D.80【分析】由题意利用分层抽样的定义,求得结果.【解答】解:由高一年级抽调15人,可知,即每100人中选一个,则该校观看演出的人数为(人,故选:.【点评】本题考查统计的相关知识,考查运算求解能力、数据处理能力,属于基础题.8.(2020•厦门模拟)某地区中小微企业中,员工人数50人以下的企业占总数的,员工人数人的企业占总数的,员工人数人的企业占总数的,员工人数500人及以上的企业占总数的,现在用分层抽样的方式从中抽取40个企业调查生产情况,员工人数人的企业应抽取的个数为6.【分析】直接根据其所占比例即可求得结论.【解答】解:因为各自所占的比例为:;且员工人数人的企业占总数的,所以:员工人数人的企业应抽取的个数为:;故答案为:6.【点评】本题主要考查分层抽样的应用,根据条件得到对应的比例是解决本题的关键.三.系统抽样方法(共3小题)9.(2020•三明模拟)将编号为001,002,003,,300的300个产品,按编号从小到大的顺序均匀的分成若干组,采用每小组选取的号码间隔一样的系统抽样方法抽取一个样本,若第一组抽取的编号是003,第二组抽取的编号是018,则样本中最大的编号应该是A.283 B.286 C.287 D.288【分析】先求样本间隔,然后计算抽查样本容量,结合系统抽样的定义进行求解即可.【解答】解:样本间隔为,即抽取样本数为,则最大的样本编号为,故选:.【点评】本题主要考查系统抽样的应用,求出样本间隔和样本容量是解决本题的关键.比较基础.10.(2020•厦门模拟)从编号0,1,2,,79的80件产品中,采用系统抽样的方法抽取容量是10的样本,若编号为58的产品在样本中,则该样本中产品的最大编号为A.72 B.74 C.76 D.78【分析】求出抽样间隔,由编号为58的产品在样本中,58是第8组第二个样本,由此能求出该样本中产品的最大编号.【解答】解:从编号0,1,2,,79的80件产品中,采用系统抽样的方法抽取容量是10的样本,抽样间隔,编号为58的产品在样本中,该样本中产品的最大编号为.故选:.【点评】本题考查样本中产品的最大编号的求法,考查系统抽样的性质等基础知识,考查运算求解能力,是基础题.11.(2019•福州一模)中国传统文化是中华民族智慧的结晶,是中华民族的历史遗产在现实生活中的展现.为弘扬中华民族传统文化,某校学生会为了解本校高一1000名学生的课余时间参加传统文化活动的情况,随机抽取50名学生进行调查.将数据分组整理后,列表如下:参加场数01234567参加人数占调查人数的百分比以下四个结论中正确的是A.表中的数值为10 B.估计该校高一学生参加传统文化活动次数不高于2场的学生约为180人 C.估计该校高一学生参加传统文化活动次数不低于4场的学生约为360人 D.若采用系统抽样方法进行调查,从该校高一1000名学生中抽取容量为50的样本,则分段间隔为25【分析】根据系统抽样的定义分别进行判断即可.【解答】解:,得,故错误,活动次数不高于2场的学生约,即约为380人,故错误,参加传统文化活动次数不低于4场的学生为人,故是正确的;中的分段间隔应为,故错误,故选:.【点评】本题主要考查命题的真假判断,结合系统抽样的定义进行判断是解决本题的关键.四.收集数据的方法(共1小题)12.(2020•厦门一模)某批库存零件在外包装上标有从到的连续自然数序号,总数未知,工作人员随机抽取了个零件,它们的序号从小到大依次为:,,,.现有两种方法对零件总数进行估计.方法一:用样本的数字特征估计总体的数字特征,可以认为样本零件序号的中位数与总体序号的中位数近似相等,进而可以得到的估计值.方法二:因为零件包装上的序号是连续的,所以抽出零件的序号,,,相当于从区间,中随机抽取个整数,这个整数将区间,分为个小区间:,,,,,.由于这个数是随机抽取的,所以前个区间的平均长度与所有个区间的平均长度近似相等,进而可以得到的估计值.现工作人员随机抽取了31个零件,序号从小到大依次为:83、135、274、380、668、895、955、964、1113、1174、1210、1344、1387、1414、1502、1546、1689、1756、1865、1874、1880、1936、2005、2006、2065、2157、2220、2224、2396、2543、2791.(1)请用上述两种方法分别估计这批零件的总数.(结果四舍五入保留整数)(2)将第(1)问方法二估计的总数作为这批零件的总数,从中随机抽取100个零件测量其内径(单位:,绘制出频率分布直方图(如图).已知标准零件的内径为,将这100个零件的内径落入各组的频率视为这批零件内径分布的概率.其中内径长度最接近标准的720个零件为优等品,请求出优等品的内径范围(结果四舍五入保留整数).【分析】(1)分别利用方法一,方法二进行计算得出;(2)先求出优等品的频率,再由频率分布直方图算出,得出优等品的范围即可.【解答】解:(1)方法一31个零件序号的中位数为1546,所有零件序号的中位数为,依题意得,解得.方法二抽取的31个零件将,划分为32个区间,平均长度为,前31个区间的平均长度为,依题意得,解得.(2)抽取的720件优等品占总数的,依题意得由频率分布直方图可知:,故.则,解得.故优等品的范围为.【点评】本题考查了抽样方法的应用问题,频率分布直方图,解题时应根据题中给出的抽样方法进行计算,是道综合题.命题点二:总体分布的估计1.1母题精析(三年高考真题)一.频率分布直方图(共4小题)1.(2022•天津)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:的分组区间为,,,,,,,,,,将其按从左到右的顺序分别编号为第一组,第二组,,第五组,右图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为A.8 B.12 C.16 D.18【分析】结合已知条件和频率分布直方图求出志愿者的总人数,进而求出第三组的总人数,由此能求出结果.【解答】解:志愿者的总人数为,第3组的人数为,有疗效的人数为人.故选:.【点评】本题考查频率分布直方图的性质等基础知识,考查运算求解能力,是基础题.2.(2021•甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是A.该地农户家庭年收入低于4.5万元的农户比率估计为 B.该地农户家庭年收入不低于10.5万元的农户比率估计为 C.估计该地农户家庭年收入的平均值不超过6.5万元 D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间【分析】利用频率分布直方图中频率的求解方法,通过求解频率即可判断选项,,,利用平均值的计算方法,即可判断选项.【解答】解:对于,该地农户家庭年收入低于4.5万元的农户比率为,故选项正确;对于,该地农户家庭年收入不低于10.5万元的农户比率为,故选项正确;对于,估计该地农户家庭年收入的平均值为万元,故选项错误;对于,家庭年收入介于4.5万元至8.5万元之间的频率为,故估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间,故选项正确.故选:.【点评】本题考查了频率分布直方图的应用,解题的关键是掌握频率分布直方图中频率的求解方法以及平均数的计算方法,属于基础题.3.(2021•天津)从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:,,,,,,,并整理得到如下的频率分布直方图,则评分在区间,内的影视作品数量是A.20 B.40 C.64 D.80【分析】由频率分布直方图先求频率,再求频数,即评分在区间,内的影视作品数量即可.【解答】解:由频率分布直方图知,评分在区间,内的影视作品的频率为,故评分在区间,内的影视作品数量是,故选:.【点评】本题考查了频率分布直方图的应用及频率的定义与应用,属于基础题.4.(2020•天津)从一批零件中抽取80个,测量其直径(单位:,将所得数据分为9组:,,,,,,,,,并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间,内的个数为A.10 B.18 C.20 D.36【分析】根据频率分布直方图求出径径落在区间,的频率,再乘以样本的个数即可.【解答】解:直径落在区间,的频率为,则被抽取的零件中,直径落在区间,内的个数为个,故选:.【点评】本题考查了频率分布直方图,属于基础题.二.茎叶图(共1小题)5.(2022•乙卷)分别统计了甲、乙两位同学16周的各周课外体育运动时长(单位:,得如图茎叶图:则下列结论中错误的是A.甲同学周课外体育运动时长的样本中位数为7.4 B.乙同学周课外体育运动时长的样本平均数大于8 C.甲同学周课外体育运动时长大于8的概率的估计值大于0.4 D.乙同学周课外体育运动时长大于8的概率的估计值大于0.6【分析】根据茎叶图逐项分析即可得出答案.【解答】解:由茎叶图可知,甲同学周课外体育运动时长的样本中位数为,选项说法正确;由茎叶图可知,乙同学周课外体育运动时长的样本平均数大于8,选项说法正确;甲同学周课外体育运动时长大于8的概率的估计值为,选项说法错误;乙同学周课外体育运动时长大于8的概率的估计值为,选项说法正确.故选:.【点评】本题考查茎叶图,考查对数据的分析处理能力,属于基础题.三.散点图(共1小题)6.(2023•上海)根据所示的散点图,下列说法正确的是A.身高越大,体重越大 B.身高越大,体重越小 C.身高和体重成正相关 D.身高和体重成负相关【分析】根据散点图的分布情况,即可得解.【解答】解:根据散点图的分布可得:身高和体重成正相关.故选:.【点评】本题考查线性相关的概念,属基础题.四.众数、中位数、平均数(共4小题)7.(2019•新课标Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分个有效评分与9个原始评分相比,不变的数字特征是A.中位数 B.平均数 C.方差 D.极差【分析】根据题意,由数据的数字特征的定义,分析可得答案.【解答】解:根据题意,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分,7个有效评分与9个原始评分相比,最中间的一个数不变,即中位数不变,故选:.【点评】本题考查数据的数字特征,关键是掌握数据的平均数、中位数、方差、极差的定义以及计算方法,属于基础题.8.(2023•新高考Ⅰ)有一组样本数据,,,,其中是最小值,是最大值,则A.,,,的平均数等于,,,的平均数 B.,,,的中位数等于,,,的中位数 C.,,,的标准差不小于,,,的标准差 D.,,,的极差不大于,,,的极差【分析】根据平均数,中位数,标准差,极差的概念逐一判定即可.【解答】解:选项,,,,的平均数不一定等于,,,的平均数,错误;选项,,,,的中位数等于,,,,的中位数等于,正确;选项,设样本数据,,,为0,1,2,8,9,10,可知,,,的平均数是5,,,,的平均数是5,,,,的方差,,,,的方差,,,错误.选项,,,,正确.故选:.【点评】本题考查平均数、中位数、标准差、极差的计算,是基础题.9.(2020•江苏)已知一组数据4,,,5,6的平均数为4,则的值是2.【分析】运用平均数的定义,解方程可得的值.【解答】解:一组数据4,,,5,6的平均数为4,则,解得.故答案为:2.【点评】本题考查平均数的定义的运用,考查方程思想和运算能力,属于基础题.10.(2020•上海)已知有四个数1,2,,,这四个数的中位数是3,平均数是4,则36.【分析】分别由题意结合中位数,平均数计算方法得,,解得,,再算出答案即可.【解答】解:因为四个数的平均数为4,所以,因为中位数是3,所以,解得,代入上式得,所以,故答案为:36.【点评】本题考查样本的数字特征,中位数,平均数,属于基础题.五.极差、方差与标准差(共4小题)11.(2020•新课标Ⅲ)在一组样本数据中,1,2,3,4出现的频率分别为,,,,且,则下面四种情形中,对应样本的标准差最大的一组是A., B., C., D.,【分析】根据题意,求出各组数据的方差,方差大的对应的标准差也大.【解答】解:选项,所以;同理选项,;选项,;选项,;故选:.【点评】本题考查了方差和标准差的问题,记住方差、标准差的公式是解题的关键.12.(2020•新课标Ⅲ)设一组样本数据,,,的方差为0.01,则数据,,,的方差为A.0.01 B.0.1 C.1 D.10【分析】根据任何一组数据同时扩大几倍方差将变为平方倍增长,求出新数据的方差即可.【解答】解:样本数据,,,的方差为0.01,根据任何一组数据同时扩大几倍方差将变为平方倍增长,数据,,,的方差为:,故选:.【点评】本题考查了方差的性质,掌握根据任何一组数据同时扩大几倍方差将变为平方倍增长是解题的关键,本题属于基础题.13.(2021•新高考Ⅰ)有一组样本数据,,,,由这组数据得到新样本数据,,,,其中,2,,,为非零常数,则A.两组样本数据的样本平均数相同 B.两组样本数据的样本中位数相同 C.两组样本数据的样本标准差相同 D.两组样本数据的样本极差相同【分析】利用平均数、中位数、标准差、极差的定义直接判断即可.【解答】解:对于,两组数据的平均数的差为,故错误;对于,两组样本数据的样本中位数的差是,故错误;对于,标准差,两组样本数据的样本标准差相同,故正确;对于,,2,,,为非零常数,的极差为,的极差为,两组样本数据的样本极差相同,故正确.故选:.【点评】本题考查命题真假的判断,考查平均数、中位数、标准差、极差的定义等基础知识,是基础题.14.(2021•新高考Ⅱ)下列统计量中,能度量样本,,,的离散程度的有A.样本,,,的标准差 B.样本,,,的中位数 C.样本,,,的极差 D.样本,,,的平均数【分析】利用中位数、标准差、极差、平均数的定义以及含义分析求解即可.【解答】解:中位数是反应数据的变化,方差是反应数据与均值之间的偏离程度,极差是用来表示统计资料中的变异量数,反映的是最大值与最小值之间的差距,平均数是反应数据的平均水平,故能反应一组数据离散程度的是标准差,极差.故选:.【点评】本题考查了中位数、标准差、极差、平均数的定义以及含义,属于基础题.六.变量间的相关关系(共1小题)15.(2023•天津)调查某种花萼长度和花瓣长度,所得数据如图所示,其中相关系数,下列说法正确的是A.花瓣长度和花萼长度没有相关性 B.花瓣长度和花萼长度呈现负相关 C.花瓣长度和花萼长度呈现正相关 D.若从样本中抽取一部分,则这部分的相关系数一定是0.8245【分析】根据散点图及线性相关的知识,即可求解.【解答】解:相关系数,且散点图呈左下角到右上角的带状分布,花瓣长度和花萼长度呈正相关.若从样本中抽取一部分,则这部分的相关系数不一定是0.8245.故选:.【点评】本题考查线性相关问题,属基础题.1.2解题模型1.与频率分布直方图有关的结论由频率分布直方图进行相关计算时,需掌握下列结论:(1)频率:频率分布直方图中横轴表示组别,纵轴表示,;(2)频率比:频率分布直方图中各小长方形的面积之和为1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比,从而可以根据已知的几组数据的个数比求有关值;(3)众数:最高小长方形底边中点的横坐标;(4)中位数:平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;(5)平均数:频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和.2.数字特征的统计意义(1)众数、中位数、平均数都是描述一组数据集中趋势的量.①众数考查各数据出现的频率,大小只与这组数据中的部分数据有关.众数作为一组数据的代表时,可靠性较差,出现次数最多的数据很多时候不能反映一组数据的中心值.②在一组数据中,有一半的数据不大于中位数,而另一半的数据则不小于中位数,中位数反映了一组数据的中心的情况.中位数不受极端值的影响.③平均数代表性较好,是反映数据集中趋势最常用的统计量.平均数反映一组数据的平均水平,任何一个样本数据的改变一般都会引起平均数的改变.在某些情况下,平均数也易受到一些极端值的影响而偏离一般情况.(2)极差、方差(标准差)都是描述一组数据离散程度的量.一般情况下,极差大,则数据较分散,数据的波动性大.方差(标准差)越大,数据的波动性越大.3平均数与方差的有关性质若x₁,x₂,…,xn,的平均数为,方差为s²,则ax₁+b,ax₂+b,…,ax,+b的平均数为a+b,方差为a²s².1.3对点训练(四年省市模考)一.分布和频率分布表(共3小题)1.(2022•龙岩模拟)国外新冠肺炎疫情形势严峻,国内疫情传播风险加大,为了更好地抗击疫情,国内进一步加大新冠疫苗的接种力度.某制药企业对某种新冠疫苗开展临床接种试验,若使用该疫苗后的抗体呈阳性,则认为该新冠疫苗有效.该企业对参与试验的1000名受试者的年龄和抗体情况进行统计,结果如图表所示:年龄频率,0.20,0.30,0.10,0.20,0.10,0.10则下列结论正确的是A.在受试者中,50岁以下的人数为700 B.在受试者中,抗体呈阳性的人数为800 C.受试者的平均年龄为45岁 D.受试者的疫苗有效率为【分析】由频率分布表及直方图对四个选项依次分析即可.【解答】解:在受试者中,50岁以下的人数为,故选项错误;在受试者中,抗体呈阳性的人数为,故选项错误;受试者的平均年龄为,故选项正确;受试者的疫苗有效率为,故选项错误;故选:.【点评】本题考查了样本的数字特征及频率分布表的应用,属于基础题.2.(2022•南平模拟)支气管炎患者会咳嗽失眠,给患者日常生活带来严重的影响.某医院老年患者治愈率为,中年患者治愈率为,青年患者治愈率为.该医院共有600名老年患者,500名中年患者,400名青年患者,则A.若从该医院所有患者中抽取容量为30的样本,老年患者应抽取12人 B.该医院青年患者所占的频率为 C.该医院的平均治愈率为 D.该医院的平均治愈率为【分析】由分层抽样即可判断;直接计算频率即可判断;直接计算平均冶愈率即可判断.【解答】解:对于,由分层抽样可得,老年患者应抽取人,故正确;对于,青年患者所占的频率为,故正确;对于,平均治愈率为,故正确,错误.故选:.【点评】本题考查命题真假的判断,考查分层抽样、频率、平均数等基础知识,考查运算求解能力,是基础题.3.(2022•漳州模拟)2021年电影《长津湖》累计票房逾57亿,该片点燃了每个人心中对英雄的崇敬之情,也更加显示出如今和平生活的来之不易.某影院记录了观看此片的70位观众的年龄,其中年龄位于区间,的有10位,位于区间,的有20位,位于区间,的有25位,位于区间,的有15位,则这70位观众年龄的众数的估计值为35.【分析】由题意知年龄位于区间,的有25位,人数最多,从而求众数的估计值.【解答】解:年龄位于区间,的有25位,人数最多,这70位观众年龄的众数的估计值为35,故答案为:35.【点评】本题考查了众数的估计值的求法,属于基础题.二.频率分布直方图(共7小题)4.(2022•福州模拟)中国营养学会把走路称为“最简单、最优良的锻炼方式”,它不仅可以帮助减肥,还可以增强心肺功能、血管弹性、肌肉力量等,如图为甲、乙两人在同一星期内日步数的折线统计图:则下列结论中不正确的是A.这一星期内甲的日步数的中位数为11600 B.乙的日步数星期四比星期三增加了1倍以上 C.这一星期内甲的日步数的平均值大于乙 D.这一星期内甲的日步数的方差大于乙【分析】利用中位数的定义判断;乙的暑期三步数7030,星期四12970,没有增加1倍以上,判断;由平均数定义判断;由方差定义判断.【解答】解:对于,甲的频数从小于大为:2435,7965,9500,11600,12700,16000,16800,中位数是11600,故正确;对于,乙的暑期三步数7030,星期四12970,,没有增加1倍以上,故错误;对于,,,,故正确;对于,.,,故正确.故选:.【点评】本题考查命题真假的判断,考查折线统计图等基础知识,考查运算求解能力,是基础题.5.(2021•龙岩模拟)平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据的分布形态有关.如图所示的统计图,记这组数据的众数为,中位数为,平均数为,则A. B. C. D.【分析】根据中位数、众数、平均数的定义结合统计图进行分析,即可得到答案.【解答】解:由统计图可知,众数,共有个数据,处在中间位置的两个数据为5,6,所以中位数为,平均数为,所以.故选:.【点评】本题考查了样本数据特征数的理解和应用,其中读懂统计图并能从统计图得到必要的信息是解决问题的关键,属于基础题.6.(2022•宁德模拟)某单位为了更好地开展党史学习教育,举办了一次党史知识测试,其200名职工成绩的频率分布直方图如图所示,则下列说法正确的是A.图中的 B.成绩不低于80分的职工约80人 C.200名职工的平均成绩是80分 D.若单位要表扬成绩由高到低前职工,则成绩87分的职工肯定能受到表扬【分析】利用频率分布直方图中各个小矩形面积之和为1可求出的值,前3组的频率之和乘以总人数,即为成绩不低于80分的职工人数,每个区间中点值乘以该组频率,依次相加,即可得到成绩的平均值,计算第分位数可判断.【解答】解:对于,解得,故正确;对于:成绩不低于80分的职工人数为,故正确;对于:平均成绩为,故错误;对于:第分位数为,故错误,故选:.【点评】本题主要考查了频率分布直方图的应用,属于基础题.7.(2022•厦门模拟)为推动学校体育运动发展,引导学生积极参与体育锻炼,增强健康管理意识,某校根据性别比例采用分层抽样方法随机抽取了120名男生和80名女生,调查并分别绘制出男、女生每天在校平均体育活动时间的频率分布直方图(如图所示),则A. B.该校男生每天在校平均体育活动时间中位数的估计值为75 C.估计该校至少有一半学生每天在校平均体育活动时间超过一小时 D.估计该校每天在校平均体育活动时间不低于80分钟的学生中男、女生人数比例为【分析】利用频率分布直方图依次对四个选项判断即可.【解答】解:,解得,故选项正确;,,该校男生每天在校平均体育活动时间中位数的估计值为,故选项错误;估计每天在校平均体育活动时间超过一小时,男生有,女生有,故估计该校至少有一半学生每天在校平均体育活动时间超过一小时,故选项正确;估计该校每天在校平均体育活动时间不低于80分钟的学生中,男生有,女生有,故估计该校每天在校平均体育活动时间不低于80分钟的学生中男、女生人数比例为,故选项正确;故选:.【点评】本题考查了频率分布直方图的应用,属于中档题.8.(2021•宁德三模)某校研究性学习小组根据某市居民人均消费支出的统计数据,制作2018年人均消费支出条形图(单位:元)和2019年人均消费支出饼图(如图).已知2019年居民人均消费总支出比2018年居民人均消费总支出提高,则下列结论正确的是A.2019年的人均衣食支出金额比2018年的人均衣食支出金额高 B.2019年除医疗以外的人均消费支出金额等于2018年的人均消费总支出金额 C.2019年的人均文教支出比例比2018年的人均文教支出比例有提高 D.2019年人均各项消费支出中,“其他”消费支出的年增长率最低【分析】利用条形图和饼状图的性质直接求解.【解答】解:年居民人均消费总支出比2018年居民人均消费总支出提高,年居民人均消费总支出为:,对于,2019年的人均衣食支出金额为:元,年的人均衣食支出金额比2018年的人均衣食支出金额高,故正确;对于,2019年除医疗以外的人均消费支出金额为:,2018年的人均消费总支出金额为元,2019年除医疗以外的人均消费支出金额不等于2018年的人均消费总支出金额,故错误;对于,2019年的人均文教支出比例为,2018年的人均文教支出比例为,年的人均文教支出比例比2018年的人均文教支出比例有提高,故正确;对于,2018其他支出4400元,2019年其他支出元,“其他”消费支出的年增长率为,衣食支出的年增长率为:,住支出的年增长率为:,文教支出的年增长率为:,医疗支出的年增长率为:,年人均各项消费支出中,“其他”消费支出的年增长率最低,故正确.故选:.【点评】本题考查命题真假的判断,考查条形图、饼状图的性质等基础知识,考查运算求能力、数据分析能力等数学核心素养,是基础题.9.(2021•厦门模拟)记考试成绩的均值为,方差为,若满足,则认对考试试卷设置合理.在某次考试后,从20000名考生中随机抽取1000名考生的成绩进行统计,得到成绩的均值为63.5,方差为169,将数据分皮7组,得到如图所示的频率分布直方图.用样本估计总体,则A.本次考试成绩不低于80分的考生约为5000人 B. C.本次考试成绩的中位数约为70 D.本次考试试卷设置合理【分析】求出成绩不低于80分的频率,求出对应的频数,即可判断选项;利用概率之和为1,即可判断选项;利用中位数的求法求出中位数,即可判断选项;求出,即可判断选项.【解答】解:由频率分布直方图可得,解得,故选项正确;不低于80分的考生的频率为,所以考试成绩不低于80分的考生约为人,故选项错误;低于70分的频率为,所以中位数为70分,不选项正确;由题意可得,,所以本次考试试卷设置不合理,故选项错误.故选:.【点评】本题考查了频率分布直方图的应用以及正态分布的理解和应用,解题的关键是掌握频率分布直方图中中位数、众数、平均数的求解方法,掌握频率、频数、样本容量之间的关系,属于基础题.10.(2021•漳州模拟)在第一次全市高三年级统考后,某数学老师为了解本班学生的本次数学考试情况,将全班50名学生的数学成绩绘制成频率分布直方图.已知该班级学生的数学成绩全部介于65分到145分之间(满分150分),将数学成绩按如下方式分成八组:第一组,,第二组,,,第八组,,按上述分组方法得到的频率分布直方图的一部分,如图所示,则下列结论正确的是A.第七组的频率为0.008 B.该班级数学成绩的中位数的估计值为101分 C.该班级数学成绩的平均分的估计值大于95分 D.该班级数学成绩的方差的估计值大于26【分析】利用频率之和为1,求出第七组的频率,即可判断选项;直接根据频率分布直方图中计算中位数,再判断选项;直角计算平均数,再判断选项;直接计算方程,再判断选项.【解答】解:对于,利用频率之和为1,可得第七组的频率为,故选项错误;对于,成绩在第一组到第八组的人数分别为2,6,8,15,10,3,4,2,所以中位数在第四组,内,设中位数为,则有,所以,解得,所以该班级数学成绩的中位数的估计值为101分,故选项正确;对于,该班级数学成绩的平均分的估计值为:,故选项正确;对于,该班级数学成绩的方差的估计值为:,故选项正确.故选:.【点评】本题考查了频率分布直方图的应用,解题的关键是掌握频率分布直方图中中位数、平均数的求解方法,考查了逻辑推理能力,属于基础题.三.统计图表获取信息(共3小题)11.(2023•莆田模拟)2022年11月,国内猪肉、鸡蛋、鲜果、禽肉、粮食、食用油、鲜菜价格同比(与去年同期相比)的变化情况如图所示,则下列说法正确的是A.猪肉、鸡蛋、鲜果、禽肉、粮食、食用油这6种食品中,食用油价格同比涨幅最小 B.猪肉价格同比涨幅超过禽肉价格同比涨幅的5倍 C.去年11月鲜菜价格要比今年11月低 D.这7种食品价格同比涨幅的平均值超过【分析】根据题中表格可依次判断.【解答】解:对于,猪肉、鸡蛋、鲜果、禽肉、粮食、食用油这6种食品中,粮食价格同比涨幅最小,故错,对于,猪肉价格同比涨幅超过禽肉价格同比涨幅的倍数为,故错,对于,根据图表可得去年鲜菜价格比今年高,故错,对于,这7种食品价格同比涨幅的平均值约为,,故对,故选:.【点评】本题考查对图表的分析能力,属于基础题.12.(2023•泉州模拟)在党中央、国务院决策部署下,近一年来我国经济运行呈现企稳回升态势.如图为2022年2月至2023年1月社会消费品零售总额增速月度同比折线图,月度同比指的是与去年同期相比,图中纵坐标为增速百分比.就图中12个月的社会消费品零售总额增速而言,以下说法正确的是A.12个月的月度同比增速百分比的中位数为 B.12个月的月度同比增速百分比的平均值大于0 C.图中前6个月的月度同比增速百分比波动比后6个月的大 D.共有8个月的月度同比增速百分比大于12个月的月度同比增速百分比的平均值【分析】根据题意结合相关概念逐项分析判断.【解答】解:由折线图可得增速百分比由小到大依次为:,,,,,,2.5,2.7,3.1,3.5,5.4,6.7,对于选项,12个月的月度同比增速百分比的中位数为,故选项正确;对于选项,,个月的月度同比增速百分比的平均值小于0,故选项错误;对于选项,由折线图可得前6个月的月度同比增速百分比先大幅度波动后渐渐趋于稳定,后6个月的大波动整体较小,前6个月的月度同比增速百分比波动比后6个月的大,故选项正确;对于选项,,可知大于的有2.5,2.7,3.1,3.5,5.4,6.7,共有6个,共有6个月的月度同比增速百分比大于12个月的月度同比增速百分比的平均值,故选项错误.故选:.【点评】本题主要考查折线图,平均数,中位数的求法,考查运算求解能力,属于中档题.13.(2023•漳州模拟)已知附件某地区甲、乙两所高中学校的六次联合模拟考试的数学平均分数(满分150分)的统计如图所示,则A.甲校的平均分均高于乙校的平均分 B.甲校六次平均分的方差小于乙校六次平均分的方差 C.甲校六次平均分第25百分位数小于乙校六次平均分的第75百分位数 D.甲校的平均分极差小于乙校的平均分极差【分析】根据图表,结合方差、百分位数、极差的概念依次判断各个选项即可.【解答】解:对于,甲校第2次考试的平均分低于乙校第2次考试的平均分,错误;对于,由图可知:甲校六次考试的平均分相对于乙校六次考试的平均分更加集中,说明数据更加稳定,则甲校六次平均分的方差小于乙校六次平均分的方差,正确;对于,,甲校平均分按从小到大顺序排列,第2个成绩为第25百分位数,由图可知,为第5次考试的平均分,约为90分,,乙校平均分按从小到大顺序排列,第5个成绩为第75百分位数,由图可知,为第2次考试的平均分,高于90,甲校六次平均分第25百分位数小于乙校六次平均分的第75百分位数,正确;对于,由图可知:甲校平均分的最高值和最低值的分差明显小于乙校平均分最高值和最低值的分差,即甲校的平均分极差小于乙校的平均分极差,正确.故选:.【点评】本题主要考查了统计图的应用,考查了平均数、方差和极差的计算,属于基础题.四.众数、中位数、平均数(共7小题)14.(2023•厦门模拟)某餐馆在网站有200条评价,好评率为,在网站有100条评价,好评率为.综合考虑这两个网站的信息,这家餐馆的好评率为A. B. C. D.【分析】根据已知数据直接计算可得.【解答】解:由已知可得这家餐馆的好评率为.故选:.【点评】本题主要考查了平均数的计算,属于基础题.15.(2020•福州模拟)某学生5次考试的成绩(单位:分)分别为85,67,,80,93,其中,若该学生在这5次考试中成绩的中位数为80,则得分的平均数不可能为A.70 B.75 C.80 D.85【分析】由该学生在这5次考试中成绩的中位数为80,得到,由此能求出得分的平均数不大于81.【解答】解:某学生5次考试的成绩(单位:分)分别为85,67,,80,93,其中,该学生在这5次考试中成绩的中位数为80,,得分的平均数:,得分的平均数不可能为85.故选:.【点评】本题考查实数值的判断,考查中位数、平均数等基础知识,考查运算求解能力,是基础题.16.(2023•福州模拟)已知互不相同的9个样本数据,若去掉其中最大和最小的数据,则剩下的7个数据与原9个数据相比,下列数字特征中不变的是A.中位数 B.平均数 C.方差 D.第40百分位数【分析】根据中位数,平均数,方差及百分位数的定义,举例说明即可.【解答】解:设这9个数分别为,,,,,,,,,且,则中位数为,去掉最大和最小的数据,得,,,,,,,中位数为,故中位数一定不变;故正确,由,得,,,,,,,,的第40百分位数为,由,得,,,,,,的第40百分位数为,故第40百分位数不变,故正确,设这9个数分别1,2,3,4,5,6,7,8,9,则平均数为,方差为,去掉最大和最小的数据为2,3,4,5,6,7,8,则平均数为,方差为,所以此时方差都改变了,故错,设这9个数分别,2,3,4,5,6,7,9,10,则平均数为,去掉最大和最小的数据为2,3,4,5,6,7,9,此时平均数为,所以此时平均数改变了,故错.故选:.【点评】本题考查中位数,平均数,方差及百分位数的定义,属于基础题.17.(2023•厦门模拟)今年春节档两部电影票房突破20亿大关,《满江红》不负众望,凭借喜剧元素和家国情怀,以25.96亿票房成为档期内票房冠军,另一部科幻续作《流浪地球2》则成为最高口碑电影.下图是这两部电影连续7天的日票房情况,则A.《满江红》日票房平均数大于《流浪地球2》日票房平均数 B.《满江红》日票房方差大于《流浪地球2》日票房方差 C.《满江红》日票房极差小于《流浪地球2》日票房极差 D.《满江红》日票房的第25百分位数小于《流浪地球2》日票房的第75百分位数【分析】根据图表信息逐一判断即可.【解答】解:对于,由图表可得《满江红》日票房都大于《流浪地球2》日票房,所以《满江红》日票房平均数大于《流浪地球2》日票房平均数,故正确;对于,由图可得《满江红》日票房单日票房数据波动更大,《满江红》日票房方差大于《流浪地球2》日票房方差,故正确;对于,《满江红》日票房极差大于《流浪地球2》日票房极差,故错误;对于,《满江红》日票房的第25百分位数,第25百分位数是从小到大排序第2个数,《流浪地球2》日票房的第75百分位数,第75百分位数是从小到大排序第6个数,《满江红》日票房的第25百分位数小于《流浪地球2》日票房的第75百分位数,故正确.故选:.【点评】本题主要考查了统计图的应用,考查了平均数、方差和极差的计算,属于基础题.18.(2023•南平模拟)2022年4月24日是第七个“中国航天日”,今年的主题是“航天点亮梦想”.某校组织学生参与航天知识竞答活动,某班8位同学成绩如下:7,6,8,9,8,7,10,.若去掉,该组数据的第25百分位数保持不变,则整数的值可以是7或8或9或10(填上述4个数中任意一个均可)(写出一个满足条件的值即可).【分析】根据整数代入该组数据对排序的影响分类讨论,从而求解.【解答】解:若整数时,将8个数据从小到大排序,因为,故8位同学的第25百分位数是第2、3位数的平均数,去掉后,将7个数据从小到大排序,因为,故7位同学的第25百分位数是第2位数7,故不成立;若整数时,将8个数据从小到大排序,因为,故8位同学的第25百分位数是第2、3位数的平均数7,去掉后,将7个数据从小到大排序,因为,故7位同学的第25百分位数是第2位数7,故成立;若整数时,将8个数据从小到大排序,因为,故8位同学的第25百分位数是第2、3位数的平均数7,去掉后,将7个数据从小到大排序,因为,故7位同学的第25百分位数是第2位数7,故答案为:7或8或9或10(填上述4个数中任意一个均可).【点评】本题考查了百分位数定义的应用,属于基础题.19.(2023•福建模拟)以下为甲、乙两组按从小到大顺序排列的数据:甲组:14,30,37,,41,52,53,55,58,80;乙组:17,22,32,43,45,49,,56.若甲组数据的第40百分位数和乙组数据的平均数相等,则100.【分析】根据百分位数和平均数的定义即可列出式子计算求解.【解答】解:因为,甲组数据的第40百分位数为第四个数和第五个数的平均数,乙组数据的平均数为,根据题意得,解得:,所以.故答案为:100.【点评】本题主要考查百分位数和平均数的定义,属于基础题.20.(2022•漳州模拟)某校体育节10名旗手的身高分别为175.0,178.0,176.0,180.0,179.0,175.0,176.0,179.0,180.0,179.0,则中位数为178.5.【分析】利用中位数的定义直接求解.【解答】解:某校体育节10名旗手的身高从小到大为:175.0,175.0,176.0,176.0,178.0,179.0,179.0,179.0,180.0,180.0,中位数为.故答案为:178.5.【点评】本题考查中位数的求法,考查中位数的定义等基础知识,考查运算求解能力,是基础题.五.极差、方差与标准差(共2小题)21.(2022•莆田模拟)有一组样本甲的数据,2,3,4,5,,由这组数据得到新样本乙的数据,2,3,4,5,,其中,2,3,4,5,为正实数.下列说法正确的是A.样本甲的极差一定小于样本乙的极差 B.样本甲的方差一定大于样本乙的方差 C.若为样本甲的中位数,则样本乙的中位数为 D.若为样本甲的平均数,则样本乙的平均数为【分析】利用极差定义判断;利用方差定义判断;利用中位数定义判断;利用平均数定义判断.【解答】解:对于,样本甲的极差是乙的极差的一半,一定小于等于样本乙的极差,故错误;对于,设样本甲的方差为,则样本乙的方差为,二者有可能相等,故错误;对于,若为样本甲的中位数,则由中位数的定义得样本乙的中位数为,故正确;对于,若为样本甲的平均数,则由平均数定义得样本乙的平均数为,故正确.故选:.【点评】本题考查命题真假的判断,考查极差、方差、中位数、平均数等基础知识,考查运算求解能力,是基础题.22.(2023•漳州模拟)某企业统计中级技术人员和高级技术人员的年龄,中级技术人员的人数为40,其年龄的平均数为35岁,方差为18,高级技术人员的人数为10,其年龄的平均数为45岁,方差为73,则该企业中级技术人员和高级技术人员的年龄的平均数为37,方差为.【分析】设中级技术人员分别为,,,,高级技术人员分别为,,,,然后利用平均数,方差公式化简整理即可求解.【解答】解:设中级技术人员分别为,,,,高级技术人员分别为,,,,则由题意可得,,所以,,所以,则,即,又,则,同理,,则,所以方差为.故答案为:37;45.【点评】本题考查了平均数,方差的求解,考查了学生的运算求解能力,属于中档题.六.用样本的数字特征估计总体的数字特征(共1小题)23.(2023•泉州模拟)某学校为调查学生迷恋电子游戏情况,设计如下调查方案,每个被调查者先投掷一枚骰子,若出现向上的点数为3的倍数,则如实回答问题“投掷点数是不是奇数?”,反之,如实回答问题“你是不是迷恋电子游戏?”.已知被调查的150名学生中,共有30人回答“是”,则下列结论正确的是A.这150名学生中,约有50人回答问题“投掷点数是不是奇数?” B.这150名学生中,必有5人迷恋电子游戏 C.该校约有的学生迷恋电子游戏 D.该校约有的学生迷恋电子游戏【分析】先由题意计算出回答问题一的人数50人,再计算出回答问题一“是”的人数25人,故可得到回答问题二“是”的人数5人,最后逐一分析四个选项即可.【解答】解:由题意可知掷出点数为3的倍数的情况为3,6,故掷出点数为3的倍数的概率为,故理论上回答问题一的人数为人.掷出点数为奇数的概率为,理论上回答问题一的50人中有25人回答“是”,故回答问题二的学生中回答“是”的人数为人.对于,抽样调查的这150名学生中,约有50人回答问题一,故正确.对于,抽样调查的这150名学生中,约有5人迷恋电子游戏,“必有”过于绝对,故错.对于,抽样调查的150名学生中,50名学生回答问题一,故有100名学生回答问题二,有5名学生回答“是”,故该校迷恋电子游戏的学生约为,故正确.对于,由可知该校迷恋电子游戏的学生约为,故错.故选:.【点评】本题考查利用数学知识解决实际问题,考查学生的计算能力,比较基础.七.百分位数(共1小题)24.(2023•宁德模拟)某工厂有甲、乙两个车间生产同一种产品,其产量比为.从两个车间中各随机抽取了10个样品进行测量,其数据(单位:如下:甲车间:9.410.19.810.210.010.110.29.610.39.8乙车间:10.39.29.610.010.39.810.49.410.210.3规定数据在之内的产品为合格品.若将频率作为概率,则以下结论正确的是A.甲车间样本数据的第40百分位数为9.8 B.从样本数据看,甲车间的极差小于乙车间的极差 C.从两个车间生产的产品任取一件,取到合格品的概率为0.84 D.从两个车间生产的产品任取一件,若取到不合格品,则该产品出自甲车间的概率为0.4【分析】根据百分位数计算规则判断,计算出极差即可判断,根据全概率公式计算,根据条件概率公式计算.【解答】解:对于:甲车间样本数据从小到大排列为:9.4、9.6、9.8、9.8、10.0、10.1、10.1、10.2、10.2、10.3,又,所以第40百分位数为第四、五两数的平均数即为,故错误;对于:甲车间的极差为,乙车间的极差为,故正确;对于:从样本数据可知甲车间合格品的概率,乙车间合格品的概率,甲、乙两车间产量比为,若从两个车间生产的产品任取一件,取到合格品的概率,故正确;对于:由可知取到不合格品的概率,所以若取到不合格品,则该产品出自甲车间的概率,故错误.故选:.【点评】本题主要考查百分数、平均数的求解,属于基础题.八.变量间的相关关系(共1小题)25.(2022•泉州模拟)某校高三1班48名物理方向的学生在一次质量检测中,语文成绩、数学成绩与六科总成绩在全年级中的排名情况如图所示,“★”表示的是该班甲、乙、丙三位同学对应的点.从这次考试的成绩看,下列结论正确的是A.该班六科总成绩排名前6的同学语文成绩比数学成绩排名更好 B.在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是语文 C.数学成绩与六科总成绩的相关性比语文成绩与六科总成绩的相关性更强 D.在甲、乙两人中,其语文成绩名次比其六科总成绩名次靠前的学生是甲【分析】结合图形可分析出答案.【解答】解::由图可得,该班六科总成绩排名前6的同学数学成绩比语文成绩排名更好,故错误;:由右图可得丙同学的总成绩排在班上倒数第三名,其语文成绩排在250到300名之间,从左图可得其数学成绩排在400名左右,故正确;:数学成绩与六科总成绩的相关性比语文成绩与六科总成绩的相关性更强,因为右图的点的分布较左图更分散,故正确;:由左图可得甲的总成绩排在班上第7名,年级名次100多一点,对应到右图可得,其语文成绩排在年级近100名,故甲的语文成绩名次比其六科总成绩名次靠前;由左图可得甲的总成绩排在班上第27名,年级名次接近250名,对应到右图可得,其语文成绩排在年级250名之后,故乙的语文成绩名次比其六科总成绩名次靠后,故正确;故选:.【点评】本题考查了根据图形解决实际问题,属于中档题.九.线性回归方程(共8小题)26.(2023•宁德模拟)某学校利用实践基地开展劳动教育活动,在其中一块土地上栽种某种蔬菜,并指定一位同学观测其中一棵幼苗生长情况,该同学获得前6天的数据如下:第天123456高度14791113经这位同学的研究,发现第天幼苗的高度的经验回归方程为,据此预测第10天这棵幼苗的高度大约为A. B. C. D.【分析】先根据回归直线经过样本点的中心建立方程,求出的值,再将代入经验回归方程,即可得到答案.【解答】解:由已知得:,,因为经验回归方程为,所以,解得,当时,,所以预测第10天这棵幼苗的高度大约为.故选:.【点评】本题主要考查线性回归方程,考查运算求解能力,属于基础题.27.(2023•龙岩模拟)下列说法正确的是A.一组数1,5,6,7,10,13,15,16,18,20的第75百分位数为16 B.在经验回归方程中,当解释变量每增加1个单位时,相应变量增加0.6个单位 C.数据,,,,,的方差为,则数据,,,,的方差为 D.一个样本的方差,则这组样本数据的总和等于100【分析】由统计及其有关概念逐一分析四个选项得答案.【解答】解:,一组数1,5,6,7,10,13,15,16,18,20的第75百分位数为第八个数,等于16,故正确;在经验回归方程中,当解释变量每增加1个单位时,相应变量减少0.6个单位,故错误;数据,,,,,的方差为,则数据,,,,的方差为,故正确;一个样本的方差,这组样本数据的平均数是2,数据总和为,故正确.故选:.【点评】本题考查统计及其有关概念,是基础题.28.(2022•泉州模拟)“中国最具幸福感城市调查推选活动”由新华社《瞭望东方周刊》、瞭望智库共同主办,至今已连续举办15年,累计推选出80余座幸福城市,现某城市随机选取30个人进行调查,得到他们的收入、生活成本及幸福感分数(幸福感分数为分),并整理得到散点图(如图),其中是收入与生活成本的比值,是幸福感分数,经计算得回归方程为.根据回归方程可知A.与成正相关 B.样本点中残差的绝对值最大是2.044 C.只要增加民众的收入就可以提高民众的幸福感 D.当收入是生活成本3倍时,预报得幸福感分数为6.044【分析】由散点图及线性回归方程判断;求出点的残差的绝对值判断;由幸福感分数与收入与生活成本的比值的关系判断;求出收入是生活成本3倍时的幸福感分数判定.【解答】解:由散点图及线性回归方程可知,与成正相关,故正确;由散点图可知,点到线性回归方程的距离最远,则其残差绝对值最大,在中,取,得,其残差绝对值为,故正确;只增加民众的收入,不一定提高民众的幸福感,还需要看生活成本,故错误;当收入是生活成本3倍时,,预报得幸福感分数为,故正确.故选:.【点评】本题考查线性回归方程的应用,考查残差的求法,是基础题.29.(2021•泉州二模)某地卫健委为监测当地居民的某健康指标,随机抽取100人,检测该健康指标的指标值,并按,,,,,,,四个区间分组制作图表如图表所示,根据下列相关信息,则指标区间,,,,男女人数比(男性:女性)城、乡人数比(城市户口:多村户口)A.该地居民的健康指标值的众数的估计值为1 B.该地居民的健康指标值的中位数的估计值为0 C.样本数据中,,的男性中至少有1人是城市户口 D.若从该地居民中随机任选3人,恰有1人的,的概率为【分析】利用频率分布直方图中众数的求解方法判断选项;利用中位数的计算方法即可判断选项;求出指标区间,中男、女的人数以及城乡人数比为,即可判断选项;利用二项分布求解即可判断选项.【解答】解:对于,因为,的频率为0.4,所以众数的估计值为,故选项正确;对于,当时,矩形左右两边面积相等,中位数的估计值为0.5,故选项正确;对于,因为男、女人数比为,所以在指标区间,中有6男、4女,再根据城乡人数比为,所以城市户口中至少有一个是男的,故选项正确;对于,,的概率估计值为0.6,从该地居民中随机任选3人,恰有1人的,的概率为,故选项正确.故选:.【点评】本题考查了频率分布直方图的应用,利用二项分布求事件发生的概率,解题的关键是掌握频率分布直方图中中位数、众数、平均数的求解方法,考查了逻辑推理能力,属于中档题.30.(2023•福州模拟)已知变量和的统计数据如下表:6789103.54566.5若由表中数据得到经验回归直线方程为,则时的残差为(注观测值减去预测值称为残差).【分析】先求出回归方程,再根据回归方程求出预测值,最后计算残差即可.【解答】解:根据题意,,,则,则,所以,当时,,所以时的残差为,故答案为:.【点评】本题考查线性回归方程相关知识,属于中档题.31.(2023•福州模拟)害虫防控对于提高农作物产量具有重要意义.已知某种害虫产卵数(单位:个)与温度(单位:有关,测得一组数据,,2,,,可用模型进行拟合,利用变换得到的线性回归方程为.若,则的值为.【分析】将非线性模型两边同时取对数可得,再将样本中心点,代入回归方程可得,即可计算出.【解答】解:对两边同时取对数可得,即,可得,,由,可得,,代入,可得,即,所以.故答案为:.【点评】本题考查线性回归方程的运用,解题的关键是利用线性回归方程恒过样本中心点,属于中档题.32.(2021•莆田模拟)2021年受疫情影响,国家鼓励员工在工作地过年.某机构统计了某市5个地区的外来务工人员数与他们选择留在当地过年的人数占比,得到如表的表格:区区区区区外来务工人员数50004000350030002500留在当地的人数占比根据这5个地区的数据求得留在当地过年人员数与外来务工人员数的线性回归方程为.该市对外来务工人员选择留在当地过年的每人补贴1000元,该市区有10000名外来务工人员,根据线性回归方程估计区需要给外来务工人员中留在当地过年的人员的补贴总额为818.6万元.(参考数据:取【分析】由表中数据可得,的值,由回归直线方程恒过样本中心点,,可求得的值,再把代入回归直线方程,知的值,进而得解.【解答】解:由表知,,,,,,五个地区的外来务工人员中,留在当地的人数分别为,,,,,所以,因为样本中心点在,上,所以,解得,所以,当时,,所以估计区需要给外来务工人员中留在当地过年的人员的补贴总额为元万元.故答案为:818.6.【点评】本题考查回归直线方程的求法与应用,考查学生对数据的分析与处理能力,属于基础题.33.(2021•漳州模拟)根据下面的数据:123432487288求得关于的回归直线方程为,则这组数据相对于所求的回归直线方程的4个残差的方差为3.2(注:残差是指实际观察值与估计值之间的差.【分析】先求出估计值,然后求出残差,求出残差的平均数,利用方差的计算公式求解即可.【解答】解:将,2,3,4代入回归方程可得的值依次为31.2,50.4,69.6,88.8,所以残差分别为:0.8,,2.4,,则残差的平均数为0,所以残差的方差为.故答案为:3.2.【点评】本题考查了方差的求解,解题的关键是正确理解残差的定义,掌握方差的计算公式,考查了运算能力,属于基础题.一十.独立性检验(共2小题)34.(2021•厦门模拟)福建省采用“”新高考模式,其中“3”为全国统考科目语文、数学和外语;“1”为考生在物理和历史中选择一门;“2”为考生在思想政治地理、化学和生物四门中再选择两门.某中学调查了高一年级学生的选科倾向,随机抽取200人,其中选考物理的120人,选考历史的80人,统计各选科人数如表:选择科目选考类别思想政治地理化学生物物理类35509065历史类50453035则附:0.100.050.0250.0100.0050.0012.7063.8415.0246.6357.87910.828A.物理类的学生中选择地理的比例比历史类的学生中选择地理的比例高 B.物理类的学生中选择生物的比例比历史类的学的中选择生物的比例低 C.有以上的把握认为选择生物与选考类别有关 D.没有有以上的把握认为选择生物与选考类别有关【分析】分别计算物理类中选择地理

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论