专题15用样本估计总体_第1页
专题15用样本估计总体_第2页
专题15用样本估计总体_第3页
专题15用样本估计总体_第4页
专题15用样本估计总体_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

体系搭建体系搭建一、用样本的频率分布估计总体分布1.概念:频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图2.频率分布直方图的特征:(1)从频率分布直方图可以清楚的看出数据分布的总体趋势.(2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.注;(1)直方图中各小长方形的面积之和为1.(2)直方图中纵轴表示eq\f(频率,组距),故每组样本的频率为组距×eq\f(频率,组距),即矩形的面积.(3)直方图中每组样本的频数为频率×总体数.3.频率分布折线图、总体密度曲线(1)频率分布折线图的定义:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线的定义:在样本频率分布直方图中,样本容量越大,所分组数越多,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.4.茎叶图当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.5.茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是在统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.6.总体百分位数的估计(1)第p百分位数一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100p)%的数据大于或等于这个值.(2)第p百分位数的计算计算一组n个数据的第p百分位数的步骤:第1步,按从小到大的排列原始数据第2步,计算i=n×p%第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.二、用样本的数字特征估计总体的数字特征1.众数、中位数、平均数①众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.②中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.③平均数:样本数据的算术平均数,即eq\x\to(x)=eq\f(1,n)(x1+x2+…+xn).在频率分布直方图中,中位数左边和右边的直方图的面积相等.2.样本方差、标准差标准差s=eq\r(\f(1,n)[x1-\x\to(x)2+x2-\x\to(x)2+…+xn-\x\to(x)2]).其中xn是样本数据的第n项,n是样本容量,eq\x\to(x)是平均数.标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.例题分析例题分析考点1频率分布直方图【例1】(多选).某学校为了调查学生一周在生活方面的支出情况,抽出了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[50,60]内的学生有60人,则下列说法正确的是()A.样本中支出在[50,60]内的频率为0.03 B.样本中支出不少于40元的人数为132 C.n的值为200 D.若该校有2000名学生,则约有600人支出在[50,60]内解:对于A,样本中支出在[50,60]内的频率为:1﹣(0.010+0.024+0.036)×10=0.3,故A错误;对于B,样本中支出不少于40元的人数为:60+×0.036×10=132,故B正确;对于C,n==200,故C正确;对于D,若该校有2000名学生,则约有2000×0.3=600人支出在[50,60]内,故D正确.故选:BCD.变式训练【变11】.某学校组织学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15人,则参加英语测试的学生人数是50.解:∵成绩低于60分有第一、二组数据,在频率分布直方图中,对应矩形的高分别为0.005,0.01,每组数据的组距为20则成绩低于60分的频率P=(0.005+0.010)×20=0.3,又∵低于60分的人数是15人,则该班的学生人数是=50.故答案为:50【变12】.为了解工厂的1000名工人的生产情况,从中抽取100名工人进行统计,得到如下频率分布直方图,由此可估计该工厂产量在75件以上(含75件)的工人数为150.解:根据频率分布直方图可知:工厂产量在75件以上的频率为:0.010×10+0.005×10=0.15,∴估计该工厂产量在75件以上(含75件)的工人数为1000×0.15=150.故答案为:150.考点2条形图、扇形图和折线图【例2】.某家庭2019年收入的各种用途占比统计如图①所示,2020年收入的各种用途占比统计如图②所示.已知2020年的“旅行”费用比2019年增加了3500元,则该家庭2020年的“衣食住”费用比2019年增加了()A.2000元 B.2500元 C.3000元 D.3500元解:设该家庭2019年的收入为x元,2020年的收入为y元,由已知可得;35%y﹣35%=3500,即y﹣x=10000,所以2020年的衣食住费用比2019年增加了;25%y﹣25x%=2500(元),所以B选项正确.故选:B.变式训练【变21】(多选).如图是2020年2月15日至3月2日武汉市新增新冠肺炎确诊病例的折线统计图.则下列说法正确的是()A.2020年2月19日武汉市新增新冠肺炎确诊病例大幅下降至三位数 B.武汉市在新冠肺炎疫情防控中取得了阶段性的成果,但防控要求不能降低 C.2020年2月19日至3月2日武汉市新增新冠肺炎确诊病例低于400人的有8天 D.2020年2月15日到3月2日武汉市新增新冠肺炎确诊病例最多的一天比最少的一天多1549人解:对于A,由折线图可知,18日病例1660人,19日615人,大幅下降至三位数,故选项A正确;对于B,由折线图可知,病例人数呈大幅下降趋势,故防控取得了阶段性的成果,但防控要求不能降低,故选项B正确;对于C,由折线图可知,病例低于400人的有2月20日、21日、23日、25日、26日、27日、3月1日、2日,共8天,故选项C正确;对于D,由折线图可知,病例最多一天人数1660,比人数最少一天人数111,多了1579人,故选项D错误.故选:ABC.【变22】.某学校某个学期的开支分布的扇形图如图1所示,该学期的水、电、交通开支(单位:万元)如图2所示,则该学期的水、电开支占总开支的百分比为16.25%.解:结合图1和图2可知,该学期的水、电开支占总开支的百分比为=16.25%.故答案为:16.25%.考点3总体百分位数的估计【例3】.某校年级组长为了解本校高三学生某次考试的数学成绩(单位:分),随机抽取30名学生该次考试的数学成绩如下所示:110144125638912145123749697142115688311613912485981321471281339911710711396141估计该校高三学生该次考试数学成绩的25%分位数为96,50%分位数为115.5.解:把这30名学生的数学成绩按从小到大顺序排列为:63,68,74,83,85,89,96,96,97,98,99,107,110,113,115,116,117,121,123,124,125,128,132,133,139,141,142,144,145,147,25%×30=7.5,50%×30=15,∴30名学生一模数学成绩的25%分位数为第8位数96;50%分位数为=115.5;故答案为:96;115.5.变式训练【变31】.已知甲、乙两组按从小到大顺序排列的数据:甲组:14,30,37,a,41,52,53,55,58,80;乙组:17,22,32,b,45,47,51,59.若甲组数据的第30百分位数和乙组数据的中位数相等,则a﹣b等于8.解:甲组共10个数据,10×30%=3,∴第30百分位数为,乙组数据的中位数为,由题意得=,解得:a﹣b=8.故答案为:8.【变32】.9月19日,航天科技集团五院发布消息称,近日在法国巴黎召开的第73届国际宇航大会上,我国首次火星探测天问一号任务团队获得国际宇航联合会2022年度世界航天奖.为科普航天知识,某校组织学生参与航天知识竞答活动,某班8位同学成绩如下:7,6,8,9,8,7,10,m.若去掉m,该组数据的第25百分位数保持不变,则整数m(1≤m≤10)的值可以是7、8、9、10均可.(写出一个满足条件的m值即可)解:7,6,8,9,8,7,10,m,若去掉m,该组数据从小到大排列为:6,7,7,8,8,9,10,则7×0.25=1.75,故第25百分位数为第二个数即7,所以7,6,8,9,8,7,10,m,第25百分位数为7,而8×0.25=2,所以7为第二个数与第三个数的平均数,所以m(1≤m≤10)的值可以是7或8或9或10.故答案为:7、8、9、10均可.考点4平均数、中位数、众数【例4】.随着移动互联网的发展,与餐饮美食相关的APP软件层出不穷.现从某市使用A和B两款订餐软件的商家中分别随机抽取100个商家,对它们的“平均送达时间”进行统计,得到频率分布直方图如图.(1)已知抽取的100个使用A款订餐软件的商家中,甲商家的“平均送达时间”为18分钟.现从使用A款订餐软件的商家中“平均送达时间”不超过20分钟的商家中随机抽取3个商家进行市场调研,求甲商家被抽到的概率;(2)试估计该市使用A款订餐软件的商家的“平均送达时间”的众数及平均数;(3)如果以“平均送达时间”的平均数作为决策依据,从A和B两款订餐软件中选择一款订餐,你会选择哪款?解:(1)使用A款订餐软件的商家中“平均送达时间”不超过20分钟的商家共有:100×0.06×10=6个,分别记为甲、a,b,c,d,e,从中随机抽取3家的情况有20种,分别为:{甲,a,b},{甲,a,c},{甲,a,d},{甲,a,e},{甲,b,c},{甲,b.d},{甲,b,e},{甲,c,d},{甲,c,e},{甲,d,e},{a,b,c},{a,b,d},{a,b,e},{a,c,d},{a,c,e},{a,d,e},{b,c,d},{b,c,e},{b,d,e},{c,d,e},甲商家被抽到的情况有10种,分别为:{甲,a,b},{甲,a,c},{甲,a,d},{甲,a,e},{甲,b,c},{甲,b.d},{甲,b,e},{甲,c,d},{甲,c,e},{甲,d,e},∴甲商家被抽到的概率p==.(2)依题意,使用A款订餐软件的商家中“平均送达时间”的众数为65,平均数为:15×0.06+25×0.34+35×0.12+45×0.04+55×0.4+65×0.04=40.(3)使用B款订餐软件的商家中“平均送达时间”的平均数为:15×0.04+25×0.2+35×0.56+45×0.14+55×0.04+65×0.02=35<40,以“平均送达时间”的平均数作为决策依据,从A和B两款订餐软件中选择B款订餐.变式训练【变41】.下面是某实验中学157班第一小组5位同学的立定跳远、跳绳、800米跑的成绩折线图,则这5位同学立定跳远的中位数,跳绳的平均数,800米跑的众数分别是()A.1.98,131,3.88 B.1.87,130,3.88 C.1.98,130,3.88 D.1.98,130,3.65解:由中图中数据可得立定跳远的数据从小到大排列为:1.75,1.87,1.98,2.05,2.13,所以中位数为1.98;跳绳的平均数为×[(130﹣1)+(130+5)+(130﹣7)+(130+2)+(130+1)]=×(130×5)=130;800米跑出现次数最多的数据是3.88,所以众数为3.88.故选:C.【变42】.为了解中学生课外阅读情况,现从某中学随机抽取200名学生,收集了他们一年内的课外阅读量(单位:本)等数据,以下是根据数据绘制的统计图表的一部分.[0,10)[10,20)[20,30)[30,40)[40,+∞)性别男73125304女82926328学段初中25364411高中下面有四个推断:①这200名学生阅读量的平均数可能是26本;②这200名学生阅读量的75%分位数在区间[30,40)内;③这200名学生的初中生阅读量的中位数一定在区间[20,30)内;④这200名学生中的初中生阅读量的25%分位数可能在区间[20,30)内.所有合理推断的序号是②③④.解:在①中,这200名学生阅读量的平均数为:=[24.5×(7+31+25+30+4)+25.5×(8+29+26+32+8)]=25.015,所以这200名学生阅读量的平均数不可能是26本,故①错误;在②中,200×75%=150,阅读量在[0,30)的人数有7+8+31+29+25+26=126人,在[30,40)的人数有62人,所以这200名学生阅读量的75%分位数在区间[30,40)内,故②正确;在③中,设在区间[0,10)内的初中生人数为x,则x∈[0,15],x∈N*,当x=0时,初中生总人数为25+36+44+11=116人,,此时区间[0,20)内有25人,区间[20,30)内有36人,所以中位数在[20,30)内,当x=15时,初中生总人数为15+25+36+44+11=131人,,区间[0,20)内有15+25=40人,区间[20,30)内有36人,所以中位数在[20,30)内,所以当区间[0,10)内人数取是小和最大值时,中位数都在[20,30)内,所在这200名学生的初中生阅读量的中位数一定在区间[20,30)内,故③正确;在④中,设在区间[0,10)内的初中生人数为x,则x∈[0,15],x∈N*,当x=0时,初中生总人数为116人,116×25%=29,此时区间[0,20)有25人,区间[20,30)有36人,所以25%分位数在[20,30)内,当x=15时,初中生总人数为131人,131×25%=32.75,区间[0,20)有15+25=40人,所以25%分位数在[0,20)内,所以这200名学生中的初中生阅读量的25%分位数可能在区间[20,30)内,故④正确.故选:②③④.考点5方差与标准差【例5】.在对某中学高一学生体重的调查中,采取按样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生30人,其平均数和方差分别为55和15,抽取了女生20人,其平均数和方差分别为45和20.你能由这些数据计算出总样本的平均数和方差吗?若能,则求出,不能,说明理由.解:能由这些数据计算出总样本的平均数和方差,其总样本的平均数为=51,总样本的方差为×[15+(55﹣51)2]+×[20+(45﹣51)2]=41.即总样本的平均数和方差分别为51,41.变式训练【变51】.如果数据x1,x2,…,xn的平均数为,方差为82,则5x1+2,5x2+2,…,5xn+2的平均数和方差分别为()A. B. C. D.解:∵数据x1,x2,…,xn的平均数为,方差为82,∴5x1+2,5x2+2,…,5xn+2的平均数为:5+2,5x1+2,5x2+2,…,5xn+2的方差分别S=25×82.故选:C.【变52】.某医院急救中心随机抽取20位病人等待急诊的时间记录如表:等待时间/分[0,5)[5,10)[10,15)[15,20)[20,25]频数48521用上述分组资料计算出病人平均等待时间的估计值=9.5,病人等待时间方差的估计值s2=28.5.解:根据题意计算平均数为=(2.5×4+7.5×8+12.5×5+17.5×2+22.5×1)=9.5;s2=[(2.5﹣9.5)2×4+(7.5﹣9.5)2×8+(12.5﹣9.5)2×5+(17.5﹣9.5)2×2+(22.5﹣9.5)2×1]=28.5,故答案为:9.5,28.5.考点6由频率分布直方图估计总体的特征量【例6】.某校从高一新生开学摸底测试成绩中随机抽取100人的成绩,按成绩分组并得各组频数如下(单位:分):[40,50),4;[50,60),6;[60,70),20;[70,80),30;[80,90),24;[90,100],16.成绩分组频数频率频率/组距[40,50)[50,60)[60,70)[70,80)[80,90)[90,100]合计(1)列出频率分布表;(2)画出频率分布直方图;(3)估计本次考试成绩的中位数(精确到0.1).解:(1)由题意列出频率分布表如下:成绩分组频数频率频率/组距[40,50)40.040.004[50,60)60.060.006[60,70)200.20.02[70,80)300.30.03[80,90)240.240.024[90,100]160.160.016合计10010.1(2)画出频率分布直方图,如下:(3)由频率分布直方图得:[40,70)的频率为:0.04+0.06+0.2=0.3,[70,80)的频率为0.3,∴估计本次考试成绩的中位数为:70+≈76.7.变式训练【变61】.某校为了了解学生每天平均课外阅读的时间(单位;分钟),从本校随机抽取了100名学生进行调查,根据收集的数据,得到学生每天课外阅读时间的频率分布直方图,如图所示,若每天课外阅读时间不超过30分钟的有45人.(Ⅰ)求a,b的值;(Ⅱ)根据频率分布直方图,估计该校学生每天课外阅读时间的中位数及平均值(同一组中的数据用该组区间的中点值代表).解:(Ⅰ)由题意得:,解得a=0.01,b=0.03.(Ⅱ)[0,30)的频率为:(0.005+0.01+0.03)×10=0.45,[30,40)的频率为0.025×10=0.25,∴中位数为:30+=32.平均数为:5×0.05+15×0.1+25×0.3+35×0.25+45×0.2+55×0.1=32.5.【变62】.今年4月的“西安奔驰女车主哭诉维权事件”引起了社会的广泛关注,某汽车4S店为了调研公司的售后服务态度,对5月份到店维修保养的100位客户进行了回访调查,每位客户用10分制对该店的售后服务进行打分.现将打分的情况分成以下几组:第一组[0,2),第二组[2,4),第三组[4,6),第四组[6,8),第五组[8,10],得到频率分布直方图如图所示.已知第二组的频数为10.(1)求图中实数a,b的值;(2)求所打分值在[6,10]的客户人数;(3)总公司规定,若4S店的客户回访平均得分低于7分,则将勒令其停业整顿.试用频率分布直方图的组中值对总体平均数进行估计,判断该4S店是否需要停业整顿.解:(1)由题意得:,解得a=0.05,b=0.15.(2)所打分值在[6,10]的频率为(0.175+0.15)×2=0.65,∴所打分值在[6,10]的客户人数为:0.65×100=65.(3)由题意得该4S店平均分为:1×0.025×2+3×0.05×2+5×0.1×2+7×0.175×2+9×0.15×2=6.5,∵6.5<7,∴该4S店需要停业整顿.1.学校组织知识竞赛,某班8名学生的成绩(单位:分)分别是65,60,75,78,86,84,90,94,则这8名学生成绩的75%分位数是()A.88分 B.86分 C.85分 D.90分解:8名学生的成绩从小到大排列为:60,65,75,78,84,86,90,94,因为8×75%=6,所以75%分位数为第6个数和第7个数的平均数,即(分).故选:A.2.在某校的“迎新年”歌咏比赛中,6位评委给某位参赛选手打分,6个分数的平均分为8.5分,方差为0.5,若去掉一个最高分9.5分和一个最低分7.5分,则剩下的4个分数满足()A.平均分8.8分,方差0.25 B.平均分8.8分,方差0.4 C.平均分8.5分,方差0.25 D.平均分8.5分,方差0.4解:设这6个数分别为7.5,x1,x2,x3,x4,9.5,平均数为,方差为s2,x1,x2,x3,x4,的平均数为,方差为s'2,由题意可知,,所以,即x1+x2+x3+x4=34,所以,所以,即,所以,所以剩下的4个分数满足平均分85分,方差0.25.故选:C.3.某科技攻关青年团队共有20人,他们的年龄分布如下表所示:年龄45403632302928人数2335241下列说法正确的是()A.29.5是这20人年龄的一个25%分位数 B.29.5是这20人年龄的一个75%分位数 C.36.5是这20人年龄的一个中位数 D.这20人年龄的众数是5解:对选项A:20×25%=5,25%分位数为,正确;对选项B:20×75%=15,75%分位数为,错误;对选项C:这20人年龄的中位数是,错误;对选项D:这20人年龄的众数是32,错误.故选:A.4.冬末春初,人们容易感冒发热,某公司规定:若任意连续7天,每天不超过5人体温高于37.3℃,则称没有发生群体性发热.根据下列连续7天体温高于37.3℃人数的统计量,能判定该公司没有发生群体性发热的为()①中位数是3,众数为2;②均值小于1,中位数为1;③均值为3,众数为4;④均值为2,标准差为.A.①③ B.③④ C.②③ D.②④解:任意连续7天,每天不超过5人体温高于37.3℃的人数为2,2,2,3,3,4,6,则满足中位数是3,众数为2,但第7天是6人高于5人,故①错误;任意连续7天,每天不超过5人体温高于37.3℃的人数为0,1,2,4,4,4,6,则满足均值是3,众数为4,但第7天是6人高于5人,故③错误;对于②,将7个数据从小到大排列为x1,x2,x3,x4,x5,x6,x7,∴中位数x4=1,∴均值为,∴x1+x2+x3+x5+x6+x7<6,又x1,x2,x3,x5,x6,x7是自然数,且0≤x1≤x2≤x3≤1≤x5≤x6≤x7,∴x1,x2,x3,x4,x5,x6,x7都不超过5,∴②正确;对于④,将7个数据从小到大排列为x1,x2,x3,x4,x5,x6,x7,∴均值为,∴x1+x2+x3+x4+x5+x6+x7=14,∴方差为,∴,∵x1,x2,x3,x5,x6,x7是自然数,若自然数x大于5,则(x﹣2)2≥16,相互矛盾,∴x1,x2,x3,x5,x6,x7都不超过5,∴④正确.综上所述,正确的为②④.故选:D.5.2022年第24届冬奥会在北京和张家口成功举办,出色的赛事组织工作赢得了国际社会的一致称赞.经济效益方面,多项收入也创下历届冬奥会新高.某机构对本届冬奥会各项主要收入进行了统计,得到的数据如图所示.已知赛事转播的收入比政府补贴和特许商品销售的收入之和多24.8亿元,则2022年冬奥会这几项收入总和为()A.200亿元 B.220亿元 C.160亿元 D.118亿元解:设收入总和为x,则35.4%x﹣(12.2%+10.8%)x=24.8,解得x=200,即收入总和为200亿元.故选:A.6.某公司为了解用户对其产品的满意度,从使用该产品的用户中随机调查了100个用户,根据用户对产品的满意度评分,得到如图所示的用户满意度评分的频率分布直方图.若用户满意度评分的中位数、众数、平均数分别为a,b,c,则()A.a<b<c B.b<a<c C.a<c<b D.b<c<a解:由频率分布直方图可知众数为65,即b=65,由表可知,组距为10,所以平均数为:45×0.15+55×0.2+65×0.25+75×0.2+85×0.1+95×0.1=67,故c=67,记中位数为x,则有:10×0.015+10×0.02+(x﹣60)×0.025=0.5,解得:x=66,即a=66,所以b<a<c.故选:B.7.如图是国家统计局发布的我国最近10年的人口出生率(单位:‰),根据如图,则()A.这10年的人口出生率逐年下降 B.这10年的人口出生率超过12‰的年数所占比例等于45% C.这10年的人口出生率的80%分位数为13.57‰ D.这10年的人口出生率的平均数小于12‰解:对于选项A:这10年的人口出生率有升有降,故选项A错误;对于选项B:这10年的人口出生率超过12‰的年数所占比例等于50%,故选项B错误;对于选项C:由于10×0.8=8,则这10年的人口出生率的80%分位数为从小到大第8个和第9个数的平均数,故选项C错误;对于选项D:这10年的人口出生率的平均数为小于12‰,故选项D正确;故选:D.8.已知甲、乙两位同学在一次射击练习中各射靶10次,射中环数频率分布如图所示,令,分别表示甲、乙射中环数的均值;,分别表示甲、乙射中环数的方差,则()A. B. C. D.,解:由图可知,,,,,所以,,故选:D.(多选)9.如图所示是根据A,B两个城市2010~2016年GDP数据(单位:百亿元)作出的统计图(称为雷达图),根据图中信息,下列关于A,B两市GDP数据统计结论正确的是()A.在这七年中,A市GDP每年均高于B市 B.与2010年相比,2016年A市GDP增量高于B市 C.A市这七年GDP的平均值高于B市 D.在这七年中,A,B两市GDP在2013年差距最小解:由图可知:在这七年中,A市GDP每年均高于B市,所以A市这七年GDP的平均值高于B市,则AC正确;2010年时,A市GDP增量小于5,2016年时,A市GDP增量大于5,故B正确;2013年,两市GDP差距为5,而2010年、2011年两市差距明显小于5,故D不正确.故选:ABC.(多选)10.如图为2017—2020年中国短视频用户规模和增长率、2021年用户规模和增长率预测,据图分析,下列结论正确的为()A.根据预测,2021年中国短视频用户规模将突破8亿人 B.2017—2020年中国短视频用户规模逐年增加,但增长速度变缓 C.2018年中国短视频用户规模比2017年增加了超过两倍 D.2020年中国短视频用户规模与2017年相比较,增长率约为198.3%解:由题图可知2021年中国短视频用户规模预测为8.09亿人,突破8亿人,A正确;由条形图知用户规模逐年增加,由折线统计图知增长率逐年下降,即增长变缓,故B正确;2018年中国短视频用户规模的增长率为107.0%,即2018年中国短视频用户规模比2017年增加了一倍多一点,不足两倍,C错误;2020年中国短视频用户规模与2017年相比较,增长率为×100%≈198.3%,D正确.故选:ABD.(多选)11.有一组样本数据x1,x2,⋯,xn,其样本平均数为.现加入一个新数据xn+1,且xn+1<,组成新的样本数据x1,x2,⋯,xn,xn+1,与原样本数据相比,新的样本数据可能()A.平均数不变 B.众数不变 C.极差变小 D.第20百分位数变大解:因为xn+1<,所以新的样本数据平均数减小,故A错误;加入一个新数据xn+1,则众数仍有可能为原数据的众数,故B正确;若加入一个新数据xn+1不是最大值也不是最小值,则新数据极差等于原数据极差,故C错误;若xn+1为原数据从小到大排列的第20为后的数,因为样本数增加,所以第20百分位数可能后移,则新数据第20百分位数可能变大,故D正确,故选:BD.(多选)12.在疫情防护知识竞赛中,对某校的2000名考生的参赛成绩进行统计,可得到如图所示的频率分布直方图,其中分组的区间为[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],若同一组中数据用该组区间中间值作代表值,则下列说法中正确的是()A.考生竞赛成绩的平均分为72.5分 B.若60分以下视为不及格,则这次知识竞赛的及格率为80% C.分数在区间[60,70)内的频率为0.02 D.用分层抽样的方法从该校学生中抽取一个容量为200的样本,则成绩在区间[70,80)应抽取30人解:对选项A:平均成绩为,故A正确;对选项B:及格率为1﹣0.05﹣0.15=0.8=80%,故B正确;对选项C:分数在区间[60,70)内的频率为0.02×10=0.2,故C错误;对选项D:区间[70,80)应抽取200×0.3=60人,故D错误.故选:AB.13.为了研究某产品的质量,现随机抽取80个进行测试,得到如右图所示的频率分布直方图,则该样本质量的75%分位数为14.5.​解:∵0.06×5=0.3<0.75,(0.06+0.10)×5=0.8>0.75,∴该样本质量的75%分位数落在区间[10,15)内,设该样本质量的75%分位数为x,则0.3+(x﹣10)×0.1=0.75,解得x=14.5.故答案为:14.5.14.某学校为了调查学生生活方面的日支出情况,抽出了一个容量为n的样本,将数据按[20,30),[30,40),[40,50),[50,60),[60,70]分成5组,制定成如图所示的频率分布直方图,则a=0.005.要从日支出在[50,70]的样本中用分层抽样的方法抽取10人,则日支出在[60,70]中被抽取的人数为2.解:,解得a=0.005,因为[50,60)内和[60,70]内的样本个数比例为0.020:0.005=4:1,根据分层抽样可知,日支出在[60,70]中被抽取的人数为.故答案为:0.005,2;15.已知样本数据x1,x2,⋯,x2022的平均数与方差分别是m和n,若yi=﹣xi+2(i=1,2,⋯,2022),且样本数据的y1,y2,⋯,y2022平均数与方差分别是n和m,则=4044.解:由题意得,,解得m=1,n=1,∴,,.故答案为:4044.16.为了解某企业员工对党史的学习情况,对该企业员工进行问卷调查,已知他们的得分都处在A,B,C,D四个区间内,根据调查结果得到下面的统计图.已知该企业男员工占,则下列结论中,正确结论的个数是1.①男、女员工得分在A区间的占比相同;②在各得分区间男员工的人数都多于女员工的人数;③得分在C区间的员工最多;④得分在D区间的员工占总人数的20%.解:根据题意,设员工总人数为n个,因为女员工人数为20+60+70+50=200,所以,解得n=500,所以男员工人数为500﹣200=300,对于①,女员工得分在A区间的占比为,男员工得分在A区间的占比为1﹣40%﹣35%﹣15%=10%,故①正确;对于②,女员工在A区间有20人,B区间有60人,C区间有70人,D区间有50人;男员工在A区间有300×10%=30人,B区间有300×40%=120人,C区间有300×35%=105人,D区间有300×15%=45人;所以D区间男员工少于女员工,故②错误;对于③,B区间有30+120=180人,C区间有70+105=175人,所以B区间人数比C区间多,故③错误;对于④,D区间有50+45=95人,所以得分在D区间的员工占总人数的,故④错误;综上:①正确,②③④错误,故正确结论的个数是1.故答案为:1.17.2022年,某市教育体育局为了解九年级语文学科教育教学质量,随机抽取100名学生参加某项测试,得到如图所示的测试得分(单位:分)频率分布直方图.(1)根据测试得分频率分布直方图,求a的值;(2)根据测试得分频率分布直方图估计九年级语文平均分;(3)猜测平均数和中位数(不必计算)的大小存在什么关系?简要说明理由.解:(1)(0.003+0.005+a+0.015+0.02)×20=1,解得a=0.007.(2)语文平均分的近似值为(0.003×30+0.005×50+0.015×70+0.02×90+0.007×110)×20=79.2,所以语文平均分的近似值为79.2.(3)中位数大于平均数,因为和中位数相比,平均数总在“长尾巴”那边.18.某单位为了解职工对垃圾回收知识的重视情况,对本单位的200名职工进行考核,然后通过随机抽样抽取其中的50名,统计其考核成绩(单位:分),制成如图所示的频率分布直方图.(1)估计该单位职工考核成绩低于80分的人数;(2)估计该单位职工考核成绩的中位数t(精确到0.1).解:(1)由频率分布直方图得考核成绩低于80分的频率为(0.010+0.030)×4=0.16,∴估计该单位职工考核成绩低于80分的人数为0.16×200=32(人);(2)前三组的频率为(0.010+0.030+0.070)×4=0.44<0.5,前四组的频率为(0.010+0.030+0.070+0.090)×4=0.80>0.5,中位数t∈[84,88].由0.04+0.12+0.28+0.09×(t﹣84)=0.5,得t≈84.7,故该单位职工考核成绩的中位数为84.7分.19.某景点某天接待了1250名游客,老年625人,中青年500人,少年125人,该景点为了提升服务质量,采用分层抽样从当天游客中抽取100人,以评分方式进行满意度回访.将统计结果按照[50,60),[60,70),[70,80),[80,90),[90,100]分成5组,制成如下频率分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论