2025版高考数学一轮总复习10年高考真题分类题组11.4抽样方法与总体分布的估计_第1页
2025版高考数学一轮总复习10年高考真题分类题组11.4抽样方法与总体分布的估计_第2页
2025版高考数学一轮总复习10年高考真题分类题组11.4抽样方法与总体分布的估计_第3页
2025版高考数学一轮总复习10年高考真题分类题组11.4抽样方法与总体分布的估计_第4页
2025版高考数学一轮总复习10年高考真题分类题组11.4抽样方法与总体分布的估计_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.4抽样方法与总体分布的估计考点一随机抽样1.(2015湖南文,2,5分)在一次马拉松竞赛中,35名运动员的成果(单位:分钟)的茎叶图如图所示.若将运动员按成果由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成果在区间[139,151]上的运动员人数是()A.3B.4C.5D.6答案B从35人中用系统抽样方法抽取7人,则可将这35人分成7组,每组5人,从每一组中抽取1人,而成果在[139,151]上的有4组,所以抽取4人,故选B.2.(2015北京文,4,5分)某校老年、中年和青年老师的人数见下表.采纳分层抽样的方法调查老师的身体状况,在抽取的样本中,青年老师有320人,则该样本中的老年老师人数为()类别人数老年老师900中年老师1800青年老师1600合计4300A.90B.100C.180D.300答案C本题考查分层抽样,依据样本中的青年老师有320人,且青年老师与老年老师人数的比为1600∶900=16∶9,可以得到样本中的老年老师的人数为916×320=180,故选3.(2014重庆文,3,5分)某中学有中学生3500人,初中生1500人.为了解学生的学习状况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从中学生中抽取70人,则n为()A.100B.150C.200D.250答案A由分层抽样的特点可知703500=n3500+1500,4.(2014湖南文,3,5分)对一个容量为N的总体抽取容量为n的样本,当选取简洁随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()A.p1=p2<p3B.p2=p3<p1C.p1=p3<p2D.p1=p2=p3答案D在简洁随机抽样、系统抽样和分层抽样中,每个个体被抽中的概率均为nN,所以p1=p2=p3,故选评析随机抽样的要求是每个个体被抽中的概率相等,与详细的方法无关.5.(2014广东文,6,5分)为了解1000名学生的学习状况,采纳系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()A.50B.40C.25D.20答案C由系统抽样的定义知,分段间隔为100040=25.故答案为6.(2013课标Ⅰ理,3,5分)为了解某地区的中小学生的视力状况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、中学三个学段学生的视力状况有较大差异,而男女生视力状况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简洁随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样答案C因为男女生视力状况差异不大,而各学段学生的视力状况有较大差异,所以应按学段分层抽样,故选C.评析本题考查了分层抽样,精确理解分层抽样的意义是解题关键.7.(2013江西理,4,5分)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字起先由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A.08B.07C.02D.01答案D由题意知依次选取的编号为08,02,14,07,01,…(第2个02需剔除),所以选出来的第5个个体的编号为01,选D.8.(2013陕西理,4,5分)某单位有840名职工,现采纳系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为()A.11B.12C.13D.14答案B因为840∶42=20∶1,故编号在[481,720]内的人数为240÷20=12.9.(2024课标Ⅲ文,14,5分)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司打算进行抽样调查,可供选择的抽样方法有简洁随机抽样、分层抽样和系统抽样,则最合适的抽样方法是.

答案分层抽样解析本题考查抽样方法.因为不同年龄段客户对其服务的评价有较大差异,所以依据三种抽样方法的特点可知最合适的抽样方法是分层抽样.10.(2015福建文,13,4分)某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为.

答案25解析男生人数为900-400=500.设应抽取男生x人,则由45900=x500得x=25.即应抽取男生2511.(2014天津理,9,5分)某高校为了解在校本科生对参与某项社会实践活动的意向,拟采纳分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取名学生.

答案60解析420×300=60(名12.(2012天津理,9,5分)某地区有小学150所,中学75所,高校25所.现采纳分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取所学校,中学中抽取所学校.

答案18;9解析应从小学中抽取150150+75+25×30=18(所应从中学中抽取75150+75+25×30=9(所评析本题考查分层抽样及数据处理实力.13.(2012福建文,14,4分)一支田径队有男女运动员98人,其中男运动员有56人.按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员人数是.

答案12解析男女运动员人数比例为5698-56分层抽样中男女人数比例不变,则女运动员人数为28×37=12.故应抽取女运动员人数是评析本题考查分层抽样方法.考查学生运算求解实力.考点二用样本估计总体1.(2017课标Ⅲ理,3,5分)某城市为了解游客人数的改变规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.()依据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,改变比较平稳答案A本题考查统计,数据分析.视察2014年的折线图,发觉从8月至9月,以及10月起先的三个月接待游客量都是削减的,故A选项是错误的.2.(2017山东文,8,5分)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为()A.3,5B.5,5C.3,7D.5,7答案A由茎叶图,可得甲组数据的中位数为65,从而乙组数据的中位数也是65,所以y=5.由乙组数据59,61,67,65,78,可得乙组数据的平均值为66,故甲组数据的平均值也为66,从而有56+62+65+74+70+x5=66,解得x=3.3.(2016山东理,3文3,5分)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].依据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140答案D由频率分布直方图知这200名学生每周的自习时间不少于22.5小时的频率为1-(0.02+0.10)×2.5=0.7,则这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140,故选D.4.(2016课标Ⅲ理,4,5分)某旅游城市为向游客介绍本地的气温状况,绘制了一年中各月平均最高气温柔平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B点表示四月的平均最低气温约为5℃.下面叙述不正确的是()A.各月的平均最低气温都在0℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20℃的月份有5个答案D由雷达图易知A、C正确;七月的平均最高气温超过20℃,平均最低气温约为12℃,一月的平均最高气温约为6℃,平均最低气温约为2℃,所以七月的平均温差比一月的平均温差大,故B正确;由雷达图知平均最高气温超过20℃的月份有3个月.故选D.5.(2015课标Ⅱ理,3,5分)依据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2008年削减二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈削减趋势D.2006年以来我国二氧化硫年排放量与年份正相关答案D由柱形图可知:A、B、C均正确,2006年以来我国二氧化硫年排放量在渐渐削减,所以排放量与年份负相关,∴D不正确.6.(2024课标Ⅲ文,3,5分)设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为()A.0.01B.0.1C.1D.10答案C由已知条件可知样本数据x1,x2,…,xn的平均数x=x1+x2+…+xnn,方差s12=1n[(x1-x)2+(x2-x)2+…+(xn-x)2]=0.01,则数据所以这组数据的方差s22=1n[(10x1-10x)2+(10x2-10x)2+…+(10xn-10x)2]=100n[(x1-x)2+(x2-x)2+…+(xn-x)2]=1007.(2015安徽理,6,5分)若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为()A.8B.15C.16D.32答案C设样本数据x1,x2,…,x10的标准差为s,则s=8,可知数据2x1-1,2x2-1,…,2x10-1的标准差为2s=16.8.(2014陕西文,9,5分)某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其均值和方差分别为x和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为()A.x,s2+1002B.x+100,s2+1002C.x,s2D.x+100,s2答案D设增加工资后10位员工下月工资均值为x',方差为s'2,则x'=110[(x1+100)+(x2+100)+…+(x10+100)]=110(x1+x2+…+x10)+100=x+100;方差s'2=110[(x1+100-x')2+(x2+100-x')2+…+(x10+100-x')2]=110[(x1-x)2+(x2-x)2+…+(x10-x)2]=s9.(2011江苏,6,5分)某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s2=.

答案16解析记星期一到星期五收到的信件数分别为x1,x2,x3,x4,x5,则x=x1+x∴s2=15[(x1-x)2+(x2-x)2+(x3-x)2+(x4-x)2+(x5-x)2]=15[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=评析本题主要考查方差的公式,考查学生的运算求解实力.公式记忆精确,运算无误是解答本题的关键,属中等难度题.10.(2024江苏,3,5分)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为.

8999011答案90解析本题考查茎叶图、平均数.5位裁判打出的分数分别为89,89,90,91,91,则这5位裁判打出的分数的平均数为15方法总结要明确“茎”处数字是十位数字,“叶”处数字是个位数字,正确写出全部数据,再依据平均数的概念进行计算.11.(2015湖北文,14,5分)某电子商务公司对10000名网络购物者2014年度的消费状况进行统计,发觉消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=;

(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为.

答案(1)3(2)6000解析(1)由频率分布直方图可知:0.1×(0.2+0.8+1.5+2.0+2.5+a)=1,解得a=3.(2)消费金额在区间[0.5,0.9]内的购物者的频率为0.1×(3.0+2.0+0.8+0.2)=0.6,所以所求购物者的人数为0.6×10000=6000.12.(2014江苏,文6,5分)为了了解一片经济林的生长状况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有株树木的底部周长小于100cm.

答案24解析60×(0.015+0.025)×10=24(株).13.(2024课标Ⅱ文,19,12分)某行业主管部门为了解本行业中小企业的生产状况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.y的分组[-0.20,0)[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)企业数22453147(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:74≈8.602.解析本题考查了统计的基础学问、基本思想和方法,考查学生对频数分布表的理解与应用,考查样本的平均数,标准差等数字特征的计算方法,以及对现实社会中实际数据的分析处理实力.(1)依据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100产值负增长的企业频率为2100用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)y=1100(-0.10×2+0.10×24+0.30×53+0.5s2=1100∑i=15ni(y=1100[2×(-0.40)2+24×(-0.20)2+53×02+14×0.202+7×0.402s=0.0296=0.02×74所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.方法总结利用频数分布表求平均数估计值的方法:各组区间中点值乘该组频数,并求和,再除以样本容量.利用频数分布表求标准差估计值的方法:用各组区间中点值代表该组,代入标准差公式即可.14.(2024课标Ⅰ文,19,12分)某家庭记录了未运用节水龙头50天的日用水量数据(单位:m3)和运用了节水龙头50天的日用水量数据,得到频数分布表如下:未运用节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7)频数13249265运用了节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)频数151310165(1)作出访用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭运用节水龙头后,日用水量小于0.35m3的概率;(3)估计该家庭运用节水龙头后,一年能节约多少水.(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)解析(1)(2)依据以上数据,该家庭运用节水龙头后50天日用水量小于0.35m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭运用节水龙头后日用水量小于0.35m3的概率的估计值为0.48.(3)该家庭未运用节水龙头50天日用水量的平均数为x1=1该家庭运用了节水龙头后50天日用水量的平均数为x2=1估计运用节水龙头后,一年可节约水(0.48-0.35)×365=47.45(m3).易错警示利用频率分布直方图求众数、中位数与平均数时,应留意区分这三者,在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和.15.(2016北京文,17,13分)某市居民用水拟实行阶梯水价.每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)假如w为整数,那么依据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.解析(1)由用水量的频率分布直方图知,该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频率依次为0.1,0.15,0.2,0.25,0.15.(3分)所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.(5分)依题意,w至少定为3.(6分)(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:组号12345678分组[2,4](4,6](6,8](8,10](10,12](12,17](17,22](22,27]频率0.10.150.20.250.150.050.050.05(10分)依据题意,该市居民该月的人均水费估计为:4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).(13分)思路分析第(1)问,须要计算该市居民月用水量在各区间上的频率,依据样本的频率分布直方图即可获解.第(2)问,由月用水量的频率分布直方图和w=3可计算居民该月用水费用的数据的分组与频率分布表,由此可估计该市居民该月的人均水费.评析本题考查了频率分布直方图及用样本估计总体,属中档题.16.(2015课标Ⅱ理,18,12分)某公司为了解用户对其产品的满足度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满足度评分如下:A地区:6273819295857464537678869566977888827689B地区:7383625191465373648293486581745654766579(1)依据两组数据完成两地区用户满足度评分的茎叶图,并通过茎叶图比较两地区满足度评分的平均值及分散程度(不要求计算出详细值,给出结论即可);A地区B地区456789(2)依据用户满足度评分,将用户的满足度从低到高分为三个等级:满足度评分低于70分70分到89分不低于90分满足度等级不满足满足特别满足记事务C:“A地区用户的满足度等级高于B地区用户的满足度等级”.假设两地区用户的评价结果相互独立.依据所给数据,以事务发生的频率作为相应事务发生的概率,求C的概率.解析(1)两地区用户满足度评分的茎叶图如下:A地区B地区4683513646426245568864373346992865183217552913通过茎叶图可以看出,A地区用户满足度评分的平均值高于B地区用户满足度评分的平均值;A地区用户满足度评分比较集中,B地区用户满足度评分比较分散.(2)记CA1表示事务:“A地区用户的满足度等级为满足或特别满足”;CA2表示事务:“A地区用户的满足度等级为特别满足”;CB1表示事务:“B地区用户的满足度等级为不满足”;CB2表示事务:“B地区用户的满足度等级为满足”,则CA1与CB1独立,CA2与CB2独立,CB1与CB2互斥,C=CB1CA1∪CB2CA2.P(C)=P(CB1CA1∪CB2CA2)=P(CB1CA1)+P(CB2CA2)=P(CB1)P(CA1)+P(CB2)P(CA2).由所给数据得CA1,CA2,CB1,CB2发生的频率分别为1620,420,1020,820,故P(CA1)=1620,P(CA2)=420,P(CB1)=1020,P(CB2)=820,P(C)=17.(2015课标Ⅱ文,18,12分)某公司为了解用户对其产品的满足度,从A,B两地区分别随机调查了40个用户,依据用户对产品的满足度评分,得到A地区用户满足度评分的频率分布直方图和B地区用户满足度评分的频数分布表.B地区用户满足度评分的频数分布表满足度评分分组[50,60)[60,70)[70,80)[80,90)[90,100]频数2814106(1)作出B地区用户满足度评分的频率分布直方图,并通过直方图比较两地区满足度评分的平均值及分散程度(不要求计算出详细值,给出结论即可);(2)依据用户满足度评分,将用户的满足度分为三个等级:满足度评分低于70分70分到89分不低于90分满足度等级不满足满足特别满足估计哪个地区用户的满足度等级为不满足的概率大,说明理由.解析(1)通过两地区用户满足度评分的频率分布直方图可以看出,B地区用户满足度评分的平均值高于A地区用户满足度评分的平均值;B地区用户满足度评分比较集中,而A地区用户满足度评分比较分散.(2)A地区用户的满足度等级为不满足的概率大.记CA表示事务:“A地区用户的满足度等级为不满足”;CB表示事务:“B地区用户的满足度等级为不满足”.由直方图得P(CA)的估计值为(0.01+0.02+0.03)×10=0.6,P(CB)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满足度等级为不满足的概率大.18.(2015广东文,17,12分)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?解析(1)由已知得,20×(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)=1,解得x=0.0075.(2)由题图可知,面积最大的矩形对应的月平均用电量区间为[220,240),所以月平均用电量的众数的估计值为230;因为20×(0.002+0.0095+0.011)=0.45<0.5,20×(0.002+0.0095+0.011+0.0125)=0.7>0.5,所以中位数在区间[220,240)内.设中位数为m,则20×(0.002+0.0095+0.011)+0.0125×(m-220)=0.5,解得m=224.所以月平均用电量的中位数为224.(3)由题图知,月平均用电量为[220,240)的用户数为(240-220)×0.0125×100=25,同理可得,月平均用电量为[240,260),[260,280),[280,300]的用户数分别为15,10,5.故用分层抽样的方式抽取11户居民,月平均用电量在[220,240)的用户中应抽取11×2525+15+10+5=5(户19.(2014课标Ⅰ文,18,12分)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125)频数62638228(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)依据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解析(1)(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.评析本题考查绘制频率分布直方图,计算样本的数字特征,及用样本估计总体等学问,同时考查统计的思想方法.20.(2014课标Ⅱ文,19,12分)某市为了考核甲、乙两部门的工作状况,随机访问了50位市民.依据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:甲部门乙部门4979766533211098877766555554443332100665520063222034567891059044812245667778901123468800113449123345011456000(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)依据茎叶图分析该市的市民对甲、乙两部门的评价.解析(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲、乙部门的评分高于90(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一样,对乙部门的评价较低、评价差异较大.评析本题考查利用茎叶图进行中位数,概率的相关计算,考查用样本的数字特征估计总体的数字特征,运用统计与概率的学问与方法解决实际问题的实力,考查数据处理实力及应用意识.21.(2014北京文,18,13分)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:组号分组频数1[0,2)62[2,4)83[4,6)174[6,8)225[8,10)256[10,12)127[12,14)68[14,16)29[16,18)2合计100(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(2)求频率分布直方图中的a,b的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组.(只需写出结论)解析(1)依据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10名,所以样本中的学生一周课外阅读时间少于12小时的频率是1-10100故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0.9.(2)课外阅读时间落在组[4,6)内的有17人,频率为0.17,所以a=频率组距=0课外阅读时间落在组[8,10)内的有25人,频率为0.25,所以b=频率组距=0(3)样本中的100名学生该周课外阅读时间的平均数在第4组.22.(2013课标Ⅰ文,18,12分)为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.61.22.71.52.81.82.22.33.23.52.52.61.22.71.52.93.03.12.32.4服用B药的20位患者日平均增加的睡眠时间:3.21.71.90.80.92.41.22.61.31.41.60.51.80.62.11.12.51.22.70.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)依据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?解析(1)设A药观测数据的平均数为x,B药观测数据的平均数为y,由观测结果可得x=120y=120由以上计算结果可得x>y,因此可看出A药的疗效更好.(2)由观测结果可绘制如下茎叶图:从以上茎叶图可以看出,A药疗效的试验结果有710的叶集中在茎2,3上,而B药疗效的试验结果有710的叶集中在茎0,1上,由此可看出A评析本题考查数据的平均数和茎叶图,考查数据的分析处理实力和应用意识.23.(2013安徽文,17,12分)为调查甲、乙两校高三年级学生某次联考数学成果状况,用简洁随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成果(百分制)作为样本,样本数据的茎叶图如下:(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成果的及格率(60分及60分以上为及格);(2)设甲、乙两校高三年级学生这次联考数学平均成果分别为x1、x2,估计x1-解析(1)设甲校高三年级学生总人数为n.由题意知,30n=0.05,即样本中甲校高三年级学生数学成果不及格人数为5,据此估计甲校高三年级此次联考数学成果及格率为1-530=5(2)设甲、乙两校样本平均数分别为x'1、x'2,依据样本茎叶图可知,30(x'1-x'2)=30x'1-30x'2=(7-5)+(55+8-14)+(24-12-65)+(26-24-79)+(22-20)+92=2+49-53-77+2+92=15.因此x'1-x'2=0.5.故x1-x2的估计值为0.5评析本题考查随机抽样与茎叶图等统计学的基本学问,考查学生用样本估计总体的思想以及数据分析处理实力.24.(2024课标Ⅰ文,17,12分)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为确定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:甲分厂产品等级的频数分布表等级ABCD频数40202020乙分厂产品等级的频数分布表等级ABCD频数28173421(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?解析(1)由试加工产品等级的频数分布表知,甲分厂加工出来的一件产品为A级品的概率的估计值为40100乙分厂加工出来的一件产品为A级品的概率的估计值为28100(2)由数据知甲分厂加工出来的100件产品利润的频数分布表为利润6525-5-75频数40202020因此甲分厂加工出来的100件产品的平均利润为65×40+25×20-由数据知乙分厂加工出来的100件产品利润的频数分布表为利润70300-70频数28173421因此乙分厂加工出来的100件产品的平均利润为70×28+30×17+0×34-比较甲、乙两分厂加工的产品的平均利润,应选甲分厂承接加工业务.25.(2017课标Ⅰ文,19,12分)为了监控某种零件的一条生产线的生产过程,检验员每隔30min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:抽取次序12345678零件尺寸9.9510.129.969.9610.019.929.9810.04抽取次序910111213141516零件尺寸10.269.9110.1310.029.2210.0410.059.95经计算得x=116∑i=1=116(∑≈18.439,∑i=116(xi-x)(i-8.5)=-2.78,其中xi为抽取的第i个零件的尺寸(1)求(xi,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);(2)一天内抽检零件中,假如出现了尺寸在(x-3s,x+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异样状况,需对当天的生产过程进行检查.(i)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ii)在(x-3s,x+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(xi,yi)(i=1,2,…,n)的相关系数r=∑i0.008解析本题考查统计问题中的相关系数及样本数据的均值与方差.(1)由样本数据得(xi,i)(i=1,2,…,16)的相关系数为r=∑=-2.由于|r|<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)(i)由于x=9.97,s≈0.212,由样本数据可以看出抽取的第13个零件的尺寸在(x-3s,x+3s)以外,因此需对当天的生产过程进行检查.(ii)剔除离群值,即第13个数据,剩下数据的平均数为115这条生产线当天生产的零件尺寸的均值的估计值为10.02.∑i=116xi2剔除第13个数据,剩下数据的样本方差为115×(1591.134-9.222-15×10.022)≈这条生产线当天生产的零件尺寸的标准差的估计值为0.008方法总结样本的数字特征.(1)样本数据的相关系数r,r=∑反映样本数据的相关程度,|r|越大,则相关性越强.(2)样本数据的均值反映样本数据的平均水平;样本数据的方差反映样本数据的稳定性,方差越小,数据越稳定;样本数据的标准差为方差的算术平方根.26.(2017课标Ⅲ文,18,12分)某超市支配按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.依据往年销售阅历,每天需求量与当天最高气温(单位:℃)有关.假如最高气温不低于25,需求量为500瓶;假如最高气温位于区间[20,25),需求量为300瓶;假如最高气温低于20,需求量为200瓶.为了确定六月份的订购支配,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:最高气温[10,15)[15,20)[20,25)[25,30)[30,35)[35,40)天数216362574以最高气温位于各区间的频率估计最高气温位于该区间的概率.(1)估计六月份这种酸奶一天的需求量不超过300瓶的概率;(2)设六月份一天销售这种酸奶的利润为Y(单位:元).当六月份这种酸奶一天的进货量为450瓶时,写出Y的全部可能值,并估计Y大于零的概率.解析本题考查概率的计算.(1)这种酸奶一天的需求量不超过300瓶,当且仅当最高气温低于25,由表格数据知,最高气温低于25的频率为2+16+3690=0.6,所以这种酸奶一天的需求量不超过300瓶的概率的估计值为(2)当这种酸奶一天的进货量为450瓶时,若最高气温不低于25,则Y=6×450-4×450=900;若最高气温位于区间[20,25),则Y=6×300+2×(450-300)-4×450=300;若最高气温低于20,则Y=6×200+2×(450-200)-4×450=-100.所以,Y的全部可能值为900,300,-100.Y大于零当且仅当最高气温不低于20,由表格数据知,最高气温不低于20的频率为36+25+7+490=0.8,因此Y大于零的概率的估计值为27.(2016课标Ⅰ文,19,12分)某公司支配购买1台机器,该种机器运用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器运用期间,假如备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年运用期内更换的易损零件数,得下面柱状图:记x表示1台机器在三年运用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),n表示购机的同时购买的易损零件数.(1)若n=19,求y与x的函数解析式;(2)若要求“需更换的易损零件数不大于n”的频率不小于0.5,求n的最小值;(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?解析(1)当x≤19时,y=3800;当x>19时,y=3800+500(x-19)=500x-5700,所以y与x的函数解析式为y=3800,x≤19,500x-(2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n的最小值为19.(5分)(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3800元,20台的费用为4300元,10台的费用为4800元,因此这100台机器在购买易损零件上所需费用的平均数为1100(3800×70+4300×20+4800×10)=4000(元).(7分若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4000元,10台的费用为4500元,因此这100台机器在购买易损零件上所需费用的平均数为1100(4000×90+4500×10)=4050(元).(10分比较两个平均数可知,购买1台机器的同时应购买19个易损零件.(12分)思路分析先写出y与x的函数关系式(分段函数),然后分别求所需费用的平均数,通过比较两个平均数的大小可得所求结果.评析本题以条形图为载体,考查了函数的综合应用,对考生用图、识图的实力进行了考查,同时体现了数学源于生活又服务于生活的特点.28.(2016课标Ⅱ文,18,12分)某险种的基本保费为a(单位:元),接着购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:上年度出险次数01234≥5保费0.85aa1.25a1.5a1.75a2a随机调查了该险种的200名续保人在一年内的出险状况,得到如下统计表:出险次数01234≥5频数605030302010(1)记A为事务:“一续保人本年度的保费不高于基本保费”.求P(A)的估计值;(2)记B为事务:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”.求P(B)的估计值;(3)求续保人本年度平均保费的估计值.解析(1)事务A发生当且仅当一年内出险次数小于2.由所给数据知,一年内出险次数小于2的频率为60+50200故P(A)的估计值为0.55.(3分)(2)事务B发生当且仅当一年内出险次数大于1且小于4.由所给数据知,一年内出险次数大于1且小于4的频率为30+30200故P(B)的估计值为0.3.(6分)(3)由所给数据得保费0.85aa1.25a1.5a1.75a2a频率0.300.250.150.150.100.05(10分)调查的200名续保人的平均保费为0.85a×0.30+a×0.25+1.25a×0.15+1.5a×0.15+1.75a×0.10+2a×0.05=1.1925a.因此,续保人

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论