2025高考备考数学知识点第2讲 用样本估计总体_第1页
2025高考备考数学知识点第2讲 用样本估计总体_第2页
2025高考备考数学知识点第2讲 用样本估计总体_第3页
2025高考备考数学知识点第2讲 用样本估计总体_第4页
2025高考备考数学知识点第2讲 用样本估计总体_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第2讲用样本估计总体课标要求命题点五年考情命题分析预测1.能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.2.能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义.3.能用样本估计总体的取值规律.4.能用样本估计百分位数,理解百分位数的统计含义.百分位数的估计本讲是高考命题的热点,主要考查百分位数,样本数据的数字特征,统计图中的数字特征,总体趋势估计等.预计2025年高考主要以生产生活实践情境为载体考查样本的数字特征及对总体的估计.样本的数字特征2023新高考卷ⅠT9;2022全国卷乙T19;2022全国卷甲T2;2021新高考卷ⅠT9;2021新高考卷ⅡT9;2021全国卷甲T2;2021全国卷乙T17;2020全国卷ⅢT3;2019全国卷ⅡT5;2019全国卷ⅡT13;2019全国ⅢT17总体数字特征的估计2023全国卷乙T17;2022新高考卷ⅡT19;2022全国卷乙T19;2021全国卷乙T17;2020全国卷ⅡT18;2020全国卷ⅢT18;2019全国卷ⅡT19;2019全国卷ⅢT17分层随机抽样的均值与方差学生用书P2121.百分位数(1)定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有①p%的数据小于或等于这个值,且至少有②(100-p)%的数据大于或等于这个值.(2)四分位数:第25百分位数、中位数(第50百分位数)、第75百分位数把一组由小到大排列后的数据分成四等份,这三个分位数统称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.2.平均数、中位数、众数数字特征概念特征平均数x=③1nx与每一个样本数据有关,样本中任何一个数据的改变都会引起平均数的改变,对样本中的极端值更加敏感.中位数将一组数据按从小到大或从大到小的顺序排列后,处在最④中间的一个数据(当数据个数是奇数时)或最中间两个数据的⑤平均数(当数据的个数是偶数时).只利用了样本数据中间位置的一个或两个值,有的样本数据的改变不一定引起中位数的改变.众数一组数据中出现次数⑥最多的数据(即频数最大值所对应的样本数据).体现了样本数据的最大集中点,对极端值不敏感,一组数据可能有n个众数,也可能没有众数.3.方差和标准差名称定义样本的方差和标准差假设一组数据是x1,x2,…,xn,用x表示这组数据的平均数,那么这n个数的方差s2=⑦1n[标准差s=⑧1n[(总体的方差和标准差一般式如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为Y,则总体方差S2=⑨1N∑加权式如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=⑩1N∑i=1总体标准差:S=S24.分层随机抽样的样本均值与方差以两层随机抽样的情况为例.假设第一层有m个数,分别为x1,x2,…,xm,平均数为x,方差为s2,第二层有n个数,分别为y1,y2,…,yn,平均数为y,方差为t2,则x=1m∑i=1mxi,s2=1m∑i=1m(xi-x)2,y=1n∑j=1nyj,t2=1n∑j=1n(yj-y)2.若记样本均值为a,样本方差为b2常用结论1.平均数的性质(1)若给定一组数据x1,x2,…,xn的平均数为x,则ax1+b,ax2+b,…,axn+b的平均数为ax+b.(2)若两组数据x1,x2,…,xn和y1,y2,…,yn的平均数分别为x和y,则x1+y1,x2+y2,…,xn+yn的平均数为x+y.2.方差的性质若给定一组数据x1,x2,…,xn,其方差为s2,则ax1,ax2,…,axn的方差为a2s2,ax1+b,ax2+b,…,axn+b的方差为a2s2.特别地,当a=1时,有x1+b,x2+b,…,xn+b的方差为s2,这说明将一组数据中的每一个数据都加上一个相同的常数,方差是不变的,即数据经过平移后方差不变.1.下列说法正确的是(D)A.对一组数据来说,平均数和中位数总是非常接近B.一组数据的第p百分位数唯一C.方差与标准差具有相同的单位D.如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变解析平均数指的是这组数据的平均水平,中位数指的是这组数据的中间水平,它们之间没有必然联系,故A错误;一组数据的第p百分位数可以不唯一,故B错误;方差是标准差的平方,故它们的单位不一样,故C错误.2.[全国卷Ⅲ]设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为(C)A.0.01 B.0.1 C.1 D.10解析因为数据axi+b(i=1,2,…,n)的方差是数据xi(i=1,2,…,n)的方差的a2倍,所以所求数据的方差为102×0.01=1.3.[多选/2021新高考卷Ⅱ]下列统计量中可用于度量样本x1,x2,…,xn离散程度的有(AC)A.x1,x2,…,xn的标准差 B.x1,x2,…,xn的中位数C.x1,x2,…,xn的极差 D.x1,x2,…,xn的平均数解析平均数、众数和中位数均刻画了样本数据的集中趋势,一般地,对数值型数据集中趋势的描述,可以用平均数和中位数,对分类型数据集中趋势的描述,可以用众数.方差、标准差和极差均是度量样本数据离散程度的数字特征.故选AC.4.[江苏高考]已知一组数据6,7,8,8,9,10,则该组数据的方差是53解析数据6,7,8,8,9,10的平均数是6+7+8+8+9+106=8,则方差是4+1+0+0+1+46=5.[2023湖南省六校联考]数据:1,2,2,3,4,5,6,6,7,8,其中位数为m,第60百分位数为a,则m+a=10.解析共有10个数据,且为从小到大排列,所以中位数为第5个数和第6个数的平均数,所以m=4+52=4.5,因为10×60%=6,所以第60百分位数为第6个数和第7个数的平均数,所以a=5+62=5.5,所以m+a学生用书P213命题点1百分位数的估计例1(1)一个容量为20的样本,其数据按从小到大的顺序排列为:1,2,2,3,5,6,6,7,8,8,9,10,13,13,14,15,17,17,18,18.则该组数据的第75百分位数为14.5,第86百分位数为17.解析∵75%×20=15,∴第75百分位数为14+152=14.5.∵86%×20=17.2,∴第86百分位数为第18个数据,即(2)[2023重庆二调]如图是根据某班学生在一次体能素质测试中的成绩画出的频率分布直方图,则由直方图得到的80%分位数为78.5.解析∵(0.016+0.030)×10=0.46<0.8,(0.016+0.030+0.040)×10=0.86>0.8,∴80%分位数位于[70,80)中,令其为x,则x-7010解得x=78.5.方法技巧1.计算一组n个数据的第p百分位数的步骤(1)按从小到大排列原始数据;(2)计算i=n×p%;(3)若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第i+12.频率分布直方图中第p百分位数的求解步骤(1)确定第p百分位数所在的区间[a,b);(2)确定小于a和小于b的数据所占的百分比分别为fa%,fb%,则第p百分位数为a+p%-fa%fb%-训练1(1)已知100个数据的第75百分位数是9.3,则下列说法正确的是(C)A.这100个数据中一定有75个数小于或等于9.3B.把这100个数据从小到大排列后,9.3是第75个数据C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数解析因为100×75%=75,为整数,所以第75个数据和第76个数据的平均数为第75百分位数,是9.3,则C正确,其他选项均不正确,故选C.(2)[2023河北名校联考]为科普航天知识,某校组织学生参与航天知识竞答活动,某班8位同学成绩如下:7,6,8,9,8,7,10,m.若去掉m,该组数据的第25百分位数保持不变,则整数m(1≤m≤10)的值可以是7(8,9,10也可).(写出一个满足条件的m的值即可)解析原数据去掉m后,剩余数据从小到大依次为6,7,7,8,8,9,10,因为7×0.25=1.75,所以这7个数的第25百分位数为7,所以数据7,6,8,9,8,7,10,m的第25百分位数为7,又8×0.25=2,所以7为这8个数据从小到大排序后的第2个数与第3个数的平均数,所以m(1≤m≤10)的值可以是7或8或9或10.命题点2样本的数字特征角度1离散型数据的数字特征例2(1)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x,方差为s2,则(A)A.x=4,s2<2 B.x=4,s2=2C.x>4,s2<2 D.x>4,s2>2解析设7个数为x1,x2,x3,x4,x5,x6,x7,则x1+x2+x3+x4+x5+x6+x77=4,17x1−42+x2−42+x3−42+x4−42+x5−42+x6−42+x7−42=2,所以x1+x2+x3+x4+x5+x6+x7(2)[多选/2023新高考卷Ⅰ]有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则(BD)A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差解析取x1=1,x2=x3=x4=x5=2,x6=9,则x2,x3,x4,x5的平均数等于2,标准差为0,x1,x2,…,x6的平均数等于3,标准差为223=663,故A,C均不正确;根据中位数的定义,将x1,x2,…,x6按从小到大的顺序进行排列,中位数是中间两个数的算术平均数,由于x1是最小值,x6是最大值,故x2,x3,x4,x5的中位数是将x2,x3,x4,x5按从小到大的顺序排列后中间两个数的算术平均数,与x1,x2,…,x6的中位数相等,故B正确;根据极差的定义,知x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差,故D综上,选BD.角度2统计图中的数字特征例3[多选/2023重庆市三检]某学校共有2000名男生,为了了解这部分学生的身体发育情况,学校抽查了100名男生的体重情况.根据所得数据绘制样本的频率分布直方图如图所示,则下列结论正确的是(ABD)A.样本的众数为6712B.样本的中位数为662C.样本的平均值为66D.该校男生体重超过70kg的学生大约为600人解析对于A,由频率分布直方图知样本的众数为65+702=6712,故A正确;对于B,设样本的中位数为x,因为前两个矩形面积和为5×0.03+5×0.05=0.4,前三个矩形面积和为5×0.03+5×0.05+5×0.06=0.7,所以中位数位于(65,70]之间,则有5×0.03+5×0.05+x−65×0.06=0.5,解得x=6623,故B正确;对于C,样本的平均值为57.5×0.15+62.5×0.25+67.5×0.3+72.5×0.2+77.5×0.1=66.75,故C不正确;对于D,2000名男生中体重超过70kg方法技巧频率分布直方图中的数字特征(1)众数:在频率分布直方图中,一般用最高小长方形的底边中点的横坐标近似代替;(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等;(3)平均数:平均数在频率分布直方图中近似等于各组区间的中点值与对应频率之积的和.训练2(1)[2022全国卷甲]某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如图,则(B)A.讲座前问卷答题的正确率的中位数小于70%B.讲座后问卷答题的正确率的平均数大于85%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差解析对于A,讲座前问卷答题的正确率的中位数是70%+75%2=72.5%,所以A错误;对于B,讲座后问卷答题的正确率分别是80%,85%,85%,85%,85%,90%,90%,95%,100%,100%,其平均数显然大于85%,所以B正确;对于C,由题图可知,讲座前问卷答题的正确率波动较大,讲座后问卷答题的正确率波动较小,所以讲座前问卷答题的正确率的标准差大于讲座后问卷答题的正确率的标准差,所以C错误;对于D,讲座前问卷答题的正确率的极差是95%-60%=35%,讲座后问卷答题的正确率的极差是100%-80%=20%,所以讲座前问卷答题的正确率的极差大于讲座后问卷答题的正确率的极差,所以D(2)[多选/2021新高考卷Ⅰ]有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c为非零常数,则(CD)A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差相同解析设样本数据x1,x2,…,xn的平均数、中位数、标准差、极差分别为x-,m,σ,t,依题意得,新样本数据y1,y2,…,yn的平均数、中位数、标准差、极差分别为x-+c,m+c,σ命题点3总体数字特征的估计角度1总体集中趋势的估计例4统计局就某地居民的月收入(单位:元)情况调查了10000人,并根据所得数据画出了样本频率分布直方图(如图),每个分组包括左端点,不包括右端点,如第一组表示月收入在[2500,3000)内.(1)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10000人中用分层随机抽样的方法抽出100人进行下一步分析,则月收入在[4000,4500)内的应抽取多少人?(2)估计该地居民的月收入的中位数.(3)假设同组中的数据用该组区间的中点值代替,估计该地居民月收入的平均数.解析(1)因为(0.0002+0.0004+0.0003+0.0001)×500=0.5,所以a=又0.0005×500=0.25,所以月收入在[4000,4500)内的频率为0.25,所以月收入在4000,4500内的应抽取的人数为0.25×100(2)因为0.0002×500=0.1,0.0004×500=0.2,0.0005×500=0.25,0.1+0.2+0.25=0.55>0.5,所以样本数据的中位数是3500+0.5因此估计该地居民月收入的中位数是3900元.(3)样本平均数为2750×0.0002+3250方法技巧平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.角度2总体离散程度的估计例5[2023全国卷乙]某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10),试验结果如下:试验序号i12345678910伸缩率xi545533551522575544541568596548伸缩率yi536527543530560533522550576536记zi=xi-yi(i=1,2,…,10),z1,z2,…,z10的样本平均数为z,样本方差为s2.(1)求z,s2.(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果z≥2s210解析(1)由题意,求出zi的值如表所示,试验序号i12345678910zi968-8151119182012则z=110×(9+6+8-8+15+11+19+18+20+12)=11s2=110×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+(11-11)2+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=(2)因为2s210=26.1=24.4,z=所以可认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.方法技巧总体离散程度的估计标准差(方差)刻画了数据的离散程度或波动幅度,标准差(方差)越大,数据的离散程度越大,越不稳定;标准差(方差)越小,数据的离散程度越小,越稳定.训练3[全国卷Ⅱ]某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.y的分组[-0.20,0)[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)企业数22453147(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:74≈8.602.解析(1)由题意可知,随机调查的100个企业中增长率不低于40%的企业有14+7=21(个),产值负增长的企业有2个,所以这类企业中产值增长率不低于40%的企业比例约为21100,产值负增长的企业比例约为2100=(2)由题意可知,这类企业产值增长率的平均数约为y=1100×[2×(-0.1)+24×0.1+53×0.3+14×0.5+7×0.7]=0.3方差约为s2=1100×[2×(-0.1-0.3)2+24×(0.1-0.3)2+53×(0.3-0.3)2+14×(0.5-0.3)2+7×(0.7-0.3)2]=0.0296所以标准差s=0.0296=0.000命题点4分层随机抽样的均值与方差例6某校开展了为期一年的“弘扬传统文化,阅读经典名著”活动.在了解全校学生每年平均阅读了多少本文学经典名著时,甲同学抽取了一个容量为10的样本,并算得样本的平均数为5,方差为9;乙同学抽取了一个容量为8的样本,并算得样本的平均数为6,方差为16.已知甲、乙两同学抽取的样本合在一起组成一个容量为18的样本,则合在一起后的样本平均数为5.4,方差为12.4.(精确到0.1)解析把甲同学抽取的样本的平均数记为x,方差记为sx2;把乙同学抽取的样本的平均数记为y,方差记为sy2;把合在一起后的样本的平均数记为a则a=10×5+8×610+8s2=10=10≈12.4.即合在一起后样本的平均数为5.4,方差为12.4.方法技巧计算分层随机抽样的方差的步骤(1)确定x1,x2,s1(2)确定x;(3)应用公式s2=n1n1+n2[s12+(x1-x)2]+n2n1+n2训练4[2023安徽省示范高中联考]为了调查公司员工的健康状况,某公司男、女员工比例是2∶3,用分层随机抽样的方法抽取样本,统计样本数据如下:男员工的平均体重为70kg,标准差为5kg;女员工的平均体重为50kg,标准差为6kg.则由此估计该公司员工的平均体重是58kg,方差是127.6kg2.解析设该公司员工的平均体重为xkg,方差为s2kg2,由题意得x=70×25+50×35=58,所以方差s2=[52+(70-58)2]×25+[62+(50-58)2]×1.[命题点1/2023重庆名校联考]从2,3,4,5,6,7,8,9中随机取两个数,这两个数一个比m大,一个比m小的概率为514,已知m为上述数据的第x百分位数,则x的取值可能为(CA.50 B.60 C.70 D.80解析因为514=1028=C21C51C82,所以m=4或m=7.当m=4时,数据的第x百分位数是第3个数据,则2<x%×8<3,解得25<x<37.5,所有选项都不符合;当m=7时,数据的第x百分位数是第6个数据,则5<x%×8<62.[命题点2/多选/2023济南市统考]有一组样本数据x1,x2,…,xn,其平均数为x.现加入一个新数据xn+1,且xn+1<x,组成新的样本数据x1,x2,…,xn,xn+1,与原样本数据相比,新的样本数据可能(BD)A.平均数不变 B.众数不变C.极差变小 D.第20百分位数变大解析x=1n(x1+x2+…+xn),新的样本数据的平均数x新=1n+1x1+x2+…+xn+xn+1=1n+1(nx+xn+1)<1n+1(nx+x)=x,故A错误.新增的数据xn+1可能等于原样本数据的众数,故B正确.当xn+1比原样本数据中最小的数据还小时,会改变极差,且极差变大;当3.[命题点2,4/2023潍坊市高三统考]若一组样本数据x1,x2,…,xn的平均数为10,另一组样本数据2x1+4,2x2+4,…,2xn+4的方差为8,则两组样本数据合并为一组样本数据后的平均数和方差分别为(A)A.17,54 B.17,48 C.15,54 D.15,48解析设样本数据x1,x2,…,xn的平均数为x,则x=10,所以样本数据2x1+4,2x2+4,…,2xn+4的平均数为2x1+4+2x2+4+…+2xn+4n=2(x1+x2+…+xn)+4nn=2×n×x+4nn=2x+4=24,所以将两组样本数据合并为一组样本数据后的平均数为10n+24n2n=17.又样本数据2x1+4,2x2+4,…,2xn+4的方差为1n{[2x1+4-(2x+4)]2+[2x2+4-(2x+4)]2+…+[2xn+4-(2x+4)]2}=4n[(x1-x)2+(x2-x)2+…+(xn-x)2]=8,所以1n[(x14.[命题点3/2021全国卷乙]某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备9.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为x和y,样本方差分别记为s12和(1)求x,y,s12,(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y-x≥2s12解析(1)由表格中的数据易得:x=-0.2+0.3+0+0y=0.1+0.4+0.s12=110×[(9.7-10.0)2+2×(9.8-10.0)2+(9.9-10.0)2+2×(10.0-10.0)2+(10.1-10.0)2+2×(10.2-10.0)2+(10.3-10.0)2]s22=110×[(10.0-10.3)2+3×(10.1-10.3)2+(10.3-10.3)2+2×(10.4-10.3)2+2×(10.5-10.3)2+(10.6-10.3)2(2)由(1)中数据可得y-x=10.3-10.0=0.3,而2s12+s2210=25(s所以认为新设备生产产品的该项指标的均值较旧设备有显著提高.5.[命题点4/2023广州市调研]为调查某地区中学生每天的睡眠时间,采用样本量比例分配的分层随机抽样,现抽取初中生800人,其每天睡眠时间均值为9小时,方差为1,抽取高中生1200人,其每天睡眠时间均值为8小时,方差为0.5,则估计该地区中学生每天睡眠时间的方差为(B)A.0.96 B.0.94 C.0.79 D.0.75解析由题知,样本数据中,初中生人数m=800,每天睡眠时间的平均数x=9,方差s12=1;高中生人数n=1200,每天睡眠时间的平均数y=8,方差s估计该地区中学生每天睡眠时间的平均数w=mx+nym+n=800×9+1200×8800+1学生用书·练习帮P3751.[2024福州市一检]某市抽查一周空气质量指数变化情况,得到一组数据:80,76,73,82,86,75,81.以下关于这组数据判断正确的有(C)A.极差为11 B.中位数为82C.平均数为79 D.方差为124解析对A,B,将这组数据按从小到大的顺序排列为73,75,76,80,81,82,86,则这组数据的极差为86-73=13,这组数据的中位数为80,A错误,B错误;对C,(80+76+73+82+86+75+81)÷7=79,C正确;对D,[(80-79)2+(76-79)2+(73-79)2+(82-79)2+(86-79)2+(75-79)2+(81-79)2]÷7≈17.7,D错误.故选C.2.[2024湖北部分学校联考]为了弘扬体育精神,某学校组织秋季运动会,在一项比赛中,学生甲进行了8组投篮,得分分别为10,8,a,8,7,9,6,8,如果学生甲的平均得分为8分,那么这组数据的第75百分位数为(C)A.8 B.9 C.8.5 D.9.5解析由题意可得10+8+a+8+7+9+6+88=8,解得a将这组数据按从小到大的顺序排列,即6,7,8,8,8,8,9,10.因为8×75%=6,为整数,所以这组数据的第75百分位数为8+92=8.5,(求得整数6时,第6个数据并不是第75百分位数,第6个数据和第7个数据的算术平均数才是第75百分位数)故选3.[全国卷Ⅱ]演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是(A)A.中位数 B.平均数C.方差 D.极差解析记9个原始评分分别为a,b,c,d,e,f,g,h,i(按从小到大的顺序排列),易知e为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A.4.[2024河南名校联考]在某次考试中,某班学生的最高分为100分,最低分为50分,且最高分只有1个,现将全班每个学生的分数按照yi=axi+b(a>0)进行调整,其中xi是第i个学生的原始分数,yi是第i个学生调整后的分数,若调整后,全班的最高分为100分,最低分为60分,则(B)A.调整后分数的平均数和原始分数的平均数相同B.调整后分数的中位数高于原始分数的中位数C.调整后分数的标准差和原始分数的标准差相同D.调整后分数的众数个数多于原始分数的众数个数解析对于A,B:根据题意知100=100a+b,60=50a+b,所以a=0.8,b=20,于是yi=0.8xi+20,则yi-xi=0.8xi+20-xi=20-0.2xi=0.2(100-xi)对于C:根据yi=0.8xi+20,可得调整后分数的标准差等于原始分数的标准差的0.8倍,显然调整后分数的标准差变小了,故C错误.对于D:如果原始分数相同,则调整后的分数也相同,故调整后分数的众数个数和原始分数的众数个数相同,故D错误.5.[多选/2024云南昆明模拟]甲、乙两个旅游景区某月初连续7天的日均气温(单位:℃)数据如图所示(气温均取整数),则关于这7天的日均气温,下列判断正确的是(ABC)A.甲旅游景区日均气温的平均数与乙旅游景区日均气温的平均数相等B.甲旅游景区日均气温的中位数与乙旅游景区日均气温的中位数相等C.甲旅游景区的日均气温波动比乙旅游景区的日均气温波动大D.乙旅游景区日均气温的极差为1℃解析对于A,B项,甲旅游景区的日均气温分别为5℃,3℃,6℃,3℃,7℃,5℃,6℃;乙旅游景区的日均气温分别为5℃,4℃,6℃,5℃,5℃,4℃,6℃.甲旅游景区日均气温的中位数为5℃,平均数为5+3+6+3+7+5+67=5(℃);乙旅游景区日均气温的中位数为5℃,平均数为5+4+6+5+5+4+67=5(℃).故A,B正确.对于C项,根据折线图知甲旅游景区的日均气温波动比乙旅游景区的日均气温波动大,故C正确.对于D项,乙旅游景区日均气温的极差为6-4=2(℃),故D错误.6.[多选/2023合肥市二检]如图是某汽车公司100家销售商2022年新能源汽车销售量(单位:辆)的频率分布直方图,则(ACD)A.a的值为0.004B.估计这100家销售商新能源汽车销售量的平均数为135C.估计这100家销售商新能源汽车销售量的80%分位数为212.5D.若按分层随机抽样原则从这100家销售商中抽取20家,则从销售量在[200,300]内的销售商中抽取5家解析对于A,由频率分布直方图可得,50×0.002+50×0.003+50a+50×0.006+50a+50×0.001=1,得a=0.004,故A正确;对于B,(25×0.002+75×0.003+125×0.004+175×0.006+225×0.004+275×0.001)×50=150,故B错误;对于C,设80%分位数为x,易得x∈[200,250),则50×0.002+50×0.003+50×0.004+50×0.006+x-200×0.004=0.8,解得x=212.5,故C正确;对于D,销售量在[200,300]内的频率为50×0.004+50×7.[多选/2024马鞍山市段考]某学校共有学生2000人,其中高一学生800人,高二、高三学生各600人,学校为了了解学生在暑假期间每天的读书时间(单位:时),按照分层随机抽样的方法从全校学生中抽取100人,其中高一学生、高二学生、高三学生每天读书时间的平均数分别为x1=2.7,x2=3.1,x3=3.3,每天读书时间的方差分别为s12=1,s22=2,sA.从高一学生中抽取了40人B.抽取的高二学生每天的总读书时间是1860小时C.被抽取的学生每天的读书时间的平均数为3小时D.估计该校全体学生每天的读书时间的方差为s2=1.966解析对于A,根据分层随机抽样,分别从高一学生、高二学生、高三学生中抽取40人、30人、30人,故A正确;对于B,抽取的高二学生每天的总读书时间是x2×30=93(时),故B错误;对于C,被抽取的学生每天的读书时间的平均数为40100×2.7+30100×3.1+30100×3.3=3(时),故C正确;对于D,被抽取的学生每天的读书时间的方差为40100×[1+(2.7-3)2]+30100×[2+(3.1-3)2]+30100×[3+(8.[2024新疆喀什模拟]样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为2.解析由样本a,0,1,2,3的平均值为1,可得a+0+1+2+35=1,解得a=-1,所以样本的方差为15×[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)29.[2024陕西商洛联考]某品牌汽车2019—2022年这四年的销量逐年增长,2019年销量为5万辆,2022年销量为22万辆,且这四年销量的中位数与平均数相等,则这四年的总销量为54万辆.解析设2020年的销量为a万辆,2021年的销量为b万辆,5<a<b<22,由题意可知,中位数为a+b2,平均数为5+a+b+224,由a+b2=5+a+b+224,得a10.[2024长沙市雅礼中学月考]某工厂生产内径为28.50mm的一种零件,为了了解零件的生产质量,在某次抽检中,从该厂的1000个零件中抽出60个,测得其内径尺寸(单位:mm)如下:28.51×1328.52×628.50×428.48×1128.49×p28.54×128.53×728.47×q这里用x×n表示有n个尺寸为xmm的零件,p,q均为正整数.若从这60个零件中随机抽取1个,则这个零件的内径尺寸小于28.49mm的概率为415(1)求p,q的值.(2)已知这60个零件内径尺寸的平均数为xmm,标准差为smm,且s=0.02,在某次抽检中,若抽取的零件中至少有80%的零件内径尺寸在[x-s,x+s]内,则称本次抽检的零件合格.试问这次抽检的零件是否合格?说明你的理由.解析(1)依题意可得13+6+4+11+解得p(2)将每个数据都减去28.50后所得新数据的平均数为160×[0.01×13+0.02×6+0×4+(-0.02)×11+(-0.01)×13+0.04×1+0.03×7+(-0.03)×5]=0所以x=0+28.50=28.50,所以x-s=28.48,x+s=28.52.所以这60个零件中内径尺寸在[x-s,x+s]内的个数为60-1-7-5=47,因为4760<4860=0.811.[2023广西联考]某新能源汽车制造公司,为鼓励消费者购买其生产的新能源汽车,约定从2023年1月开始,凡购买一辆该品牌汽车,在行驶三年后,公司将给予适当金额的购车补贴.某调研机构对已购买该品牌汽车的消费者,就购车补贴金额的心理预期值进行了抽样调查,得其样本频率分布直方图如图所示.(1)求实数m的值;(2)估计已购买该品牌汽车的消费群体对购车补贴金额的心理预期值的平均数(同一组数据用该区间的中点值作代表)和中位数;(精确到0.01)(3)现在要从购车补贴金额的心理预期值在区间[3,5)的样本中用分层随机抽样的方法抽取6人,再从这6人中随机抽取2人进行调查,求抽到的2人购车补贴金额的心理预期值都在区间[3,4)的概率.解析(1)由题意知,1×(0.10+0.30+0.30+m+0.10+0.05)=1,解得m=0.15.(2)平均数的估计值x=1.5×0.10+2.5×0.30+3.5×0.30+4.5×0.15+5.5×0.10+6.5×0.05=3.5(万元).因为0.10+0.30<0.50<0.10+0.30+0.30,所以中位数在区间(3,4)内.设中位数为3+t,则0.10+0.30+0.30t=0.50,得t=13≈0.33,所以中位数的估计值为3.33万元(3)从购车补贴金额的心理预期值在区间[3,5)的样本中用分层随机抽样的方法抽取6人,则抽取的购车补贴金额的心理预期值在区间[3,4)的有4人,购车补贴金额的心理预期值在区间[4,5)的有2人.从这6人中随机抽取2人,共有C62=15其中抽到的2人购车补贴金额的心理预期值都在区间[3,4)的有C42=6所以抽到的2人购车补贴金额的心理预期值都在区间[3,4)的概率P=615=212.[多选/2024湖北联考]已知互不相同的20个样本数据,若去掉其中最大和最小的数据,设剩下的18个样本数据的方差为s12,平均数为x1;去掉的两个数据的方差为s22,平均数为x2;原样本数据的方差为s2,平均数为x.若x1A.剩下的18个样本数据的中位数与原样本数据的中位数一样B.x=xC.剩下18个数据的22%分位数大于原样本数据的22%分位数D.10s2=9s12解析设20个样本数据从小到大排列为x1,x2,x3,…,x20,则剩下的18个样本数据为x2,x3,…,x19.对于A,原样本数据的中位数为x10+x112,剩下的18对于B,依题意,x1=118(x2+x3+…+x19),x2=12(x1+x20),x=120(x1+x2+…+x20),由x1=x2,得x1=118(x2+x3+…+x19)=12(x1+x20),即x2+x3+…+x19=18x1,x1+x20=2x1,于是x1+x2+x3+…+x19+x20=20x1,因此120(x1+x2+x3+…+x对于C,因为18×22%=3.96,则剩下的18个数据的22%分位数为x5,又20×22%=4.4,则原样本数据的22%分位数为x5,C错误;对于D,由选项B分析知x=x1=x2,则s12=118(x22+x32+…+x192)-x2,s22=1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论