2023版高三数学一轮复习(3年真题分类+考情精解读+知识全通关+题型全突破+能力大提升)第12章统计试题文_第1页
2023版高三数学一轮复习(3年真题分类+考情精解读+知识全通关+题型全突破+能力大提升)第12章统计试题文_第2页
2023版高三数学一轮复习(3年真题分类+考情精解读+知识全通关+题型全突破+能力大提升)第12章统计试题文_第3页
2023版高三数学一轮复习(3年真题分类+考情精解读+知识全通关+题型全突破+能力大提升)第12章统计试题文_第4页
2023版高三数学一轮复习(3年真题分类+考情精解读+知识全通关+题型全突破+能力大提升)第12章统计试题文_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGEPAGE23第十二章统计考点1随机抽样用样本估计总体1.(2022·山东,3)某高校调查了200名学生每周的自习时间(单位:小时),制成了如下图的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.1401.解析由题图知,组距为2.5,故每周的自习时间不少于22.5小时的频率为:(0.16+0.08+0.04)×2.5=0.7,∴人数是200×0.7=140人,应选D.答案D2.(2022·北京,8)某学校运动会的立定跳远和30秒跳绳两个单项比赛分成预赛和决赛两个阶段.下表为10名学生的预赛成绩,其中有三个数据模糊.学生序号12345678910立定跳远(单位:米)1.961.921.821.801.781.761.741.721.681.6030秒跳绳(单位:次)63a7560637270a-1B65在这10名学生中,进入立定跳远决赛的有8人,同时进入立定跳远决赛和30秒跳绳决赛的有6人,那么()A.2号学生进入30秒跳绳决赛B.5号学生进入30秒跳绳决赛C.8号学生进入30秒跳绳决赛D.9号学生进入30秒跳绳决赛2.解析由数据可知,进入立定跳远决赛的8人为:1~8号,所以进入30秒跳绳决赛的6人需要从1~8号产生,数据排序后可知第3,6,7号必须进跳绳决赛,另外3人需从63,a,63,60,a-1四个得分中抽取,假设63分的人未进决赛,那么60分的人就会进入决赛,与事实矛盾,所以63分必进决赛.应选B.答案B3.(2022·四川,3)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取局部学生进行调查,那么最合理的抽样方法是()A.抽签法B.系统抽样法C.分层抽样法D.随机数法3.解析结合几种抽样的定义知选C.答案C4.(2022·北京,4)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,那么该样本的老年教师人数为()类别人数老年教师900中年教师1800青年教师1600合计4300A.90B.100C.180D.3004.解析由题意抽样比为eq\f(320,1600)=eq\f(1,5),∴该样本的老年教师人数为900×eq\f(1,5)=180(人).答案C5.(2022·陕西,2)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如下图,那么该校女教师的人数为()A.93B.123C.137D.1675.解析由题干扇形统计图可得该校女教师人数为:110×70%+150×(1-60%)=137.应选C.答案C6.(2022·湖南,2)在一次马拉松比赛中,35名运发动的成绩(单位:分钟)的茎叶图如下图假设将运发动按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,那么其中成绩在区间[139,151]上的运发动人数是()A.3B.4C.5D.66.解析由题意知,将1~35号分成7组,每组5名运发动,成绩落在区间[139,151]的运发动共有4组,故由系统抽样法知,共抽取4名.选B.答案B7.(2022·重庆,4)重庆市2022年各月的平均气温(℃)数据的茎叶图如下:那么这组数据的中位数是()A.19B.20C.21.5D.237.解析由茎叶图,把数据由小到大排列,处于中间的数为20,20,所以这组数据的中位数为20.答案B8.(2022·山东,6)为比拟甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如下图的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为()A.①③B.①④C.②③D.②④8.解析甲地5天的气温为:26,28,29,31,31,其平均数为x甲=eq\f(26+28+29+31+31,5)=29;方差为seq\o\al(2,甲)=eq\f(1,5)[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=3.6;标准差为s甲=eq\r(3.6).乙地5天的气温为:28,29,30,31,32,其平均数为x乙=eq\f(28+29+30+31+32,5)=30;方差为seq\o\al(2,乙)=eq\f(1,5)[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2;标准差为s乙=eq\r(2).∴x甲<x乙,s甲>s乙.答案B9.(2022·陕西,9)某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其均值和方差分别为eq\x\to(x)和s2,假设从下月起每位员工的月工资增加100元,那么这10位员工下月工资的均值和方差分别为()A.eq\x\to(x),s2+1002B.eq\x\to(x)+100,s2+1002C.eq\x\to(x),s2D.eq\x\to(x)+100,s29.解析方法一对平均数和方差的意义深入理解可巧解.因为每个数据都加上了100,故平均数也增加100,而离散程度应保持不变,应选D.方法二由题意知x1+x2+…+xn=nx,s2=eq\f(1,n)[(x1-x)2+(x2-x)2+…+(xn-x)2],那么所求均值y=eq\f(1,n)[(x1+100)+(x2+100)+…+(xn+100)]=eq\f(1,n)(nx+n×100)=x+100,而所求方差t2=eq\f(1,n)[(x1+100-y)2+(x2+100-y)2+…+(xn+100-y)2]=eq\f(1,n)[(x1-x)2+(x2-x)2+…+(xn-x)2]=s2,应选D.答案D10.(2022·山东,8)为了研究某药品的疗效,选取假设干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.以下图是根据试验数据制成的频率分布直方图.第一组与第二组共有20人,第三组中没有疗效的有6人,那么第三组中有疗效的人数为()A.6B.8C.12D.1810.解析由题意,第一组和第二组的频率之和为0.24+0.16=0.4,故样本容量为eq\f(20,0.4)=50,又第三组的频率为0.36,故第三组的人数为50×0.36=18,故该组中有疗效的人数为18-6=12.答案C11.(2022·广东,6)为了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,那么分段的间隔为()A.50B.40C.25D.2011.解析由eq\f(1000,40)=25,可得分段的间隔为25.应选C.答案C12.(2022·重庆,3)某中学有高中生3500人,初中生1500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,从高中生中抽取70人,那么n为()A.100B.150C.200D.25012.解析样本抽取比例为eq\f(70,3500)=eq\f(1,50),该校总人数为1500+3500=5000,那么eq\f(n,5000)=eq\f(1,50),故n=100,选A.答案A13.(2022·湖南,3)对一个容量为N的总体抽取容量为n的样本,中选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,那么()A.p1=p2<p3B.p2=p3<p1C.p1=p3<p2D.p1=p2=p313.解析根据抽样方法的概念可知,简单随机抽样、系统抽样和分层抽样三种抽样,每个个体被抽到的概率都是p=eq\f(n,N),故p1=p2=p3,应选D.答案D(2022·福建,13)某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,那么应抽取的男生人数为________.14.解析由题意知,男生共有500名,根据分层抽样的特点,在容量为45的样本中男生应抽取人数:45×eq\f(500,900)=25.]答案25(2022·江苏,2)一组数据4,6,5,8,7,6,那么这组数据的平均数为________.15.解析这组数据的平均数为eq\f(1,6)(4+6+5+8+7+6)=6.答案6(2022·广东,12)样本数据x1,x2,…,xn的均值eq\x\to(x)=5,那么样本数据2x1+1,2x2+1,…,2xn+1的均值为________.16.解析由x1,x2,…,xn的均值x=5,得2x1+1,2x2+1,…,2xn+1的均值为2x+1=2×5+1=11.答案1117.(2022·湖北,14)某电子商务公司对10000名网络购物者2022年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如下图.(1)直方图中的a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.17.解析由频率分布直方图及频率和等于1可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a×0.1=1,解之得a=3.于是消费金额在区间[0.5,0.9]内频率为0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消费金额在区间[0.5,0.9]内的购物者的人数为:0.6×10000=6000,故应填3,6000.答案(1)3(2)6000(2022·湖北,11)甲、乙两套设备生产的同类型产品共4800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.假设样本中有50件产品由甲设备生产,那么乙设备生产的产品总数为________件.解析分层抽样中各层的抽样比相同.样本中甲设备生产的有50件,那么乙设备生产的有30件.在4800件产品中,甲、乙设备生产的产品总数比为5∶3,所以乙设备生产的产品总数为1800件.答案1800(2022·天津,9)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,那么应从一年级本科生中抽取________名学生.19.解析由分层抽样的特点可得应该从一年级本科生中抽取eq\f(4,4+5+5+6)×300=60(名)学生.答案6020.(2022·北京,17)某市民用水拟实行阶梯水价,每人月用水量中不超过w立方米的局部按4元/立方米收费,超出w立方米的局部按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费.20.解(1)如题图所示,用水量在[0.5,3)的频率的和为:(0.2+0.3+0.4+0.5+0.3)×0.5=0.85.∴用水量小于等于3立方米的频率为0.85,又w为整数,∴为使80%以上的居民在该月的用水价格为4元/立方米,w至少定为3.(2)当w=3时,该市居民该月的人均水费估计为:(0.1×1+0.15×1.5+0.2×2+0.25×2.5+0.15×3)×4+0.15×3×4+[0.05×(3.5-3)+0.05×(4-3)+0.05×(4.5-3)]×10=7.2+1.8+1.5=10.5(元).即该市居民该月的人均水费估计为10.5元.21.(2022·四川,16)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),……,[4,4.5]分成9组,制成了如下图的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数.说明理由;(3)估计居民月均用水量的中位数.21.解(1)由频率分布直方图,可知:月均用水量在[0,0.5)的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)等组的频率分别0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.(2)由(1)知,100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300000×0.12=36000.(3)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5.而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5.所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.22.(2022·新课标全国Ⅰ,19)某公司方案购置1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购置这种零件作为备件,每个200元.在机器使用期间,如果备件缺乏再购置,那么每个500元.现需决策在购置机器时应同时购置几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图.记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购置易损零件上所需的费用(单位:元),n表示购机的同时购置的易损零件数.(1)假设n=19,求y与x的函数解析式;(2)假设要求“需更换的易损零件数不大于n〞的频率不小于0.5,求n的最小值;(3)假设这100台机器在购机的同时每台都购置19个易损零件,或每台都购置20个易损零件,分别计算这100台机器在购置易损零件上所需费用的平均数,以此作为决策依据,购置1台机器的同时应购置19个还是20个易损零件?22.解(1)当x≤19时,y=3800;当x>19时,y=3800+500(x-19)=500x-5700.所以y与x的函数解析式为y=eq\b\lc\{(\a\vs4\al\co1(3800,x≤19,,500x-5700,x>19,))(x∈N).(2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n的最小值为19.(3)假设每台机器在购机同时都购置19个易损零件,那么这100台机器中有70台在购置易损零件上的费用为3800,20台的费用为4300,10台的费用为4800,因此这100台机器在购置易损零件上所需费用的平均数为eq\f(1,100)(3800×70+4300×20+4800×10)=4000,假设每台机器在购机同时都购置20个易损零件,那么这100台机器中有90台在购置易损零件上的费用为4000,10台的费用为4500,因此这100台机器在购置易损零件上所需费用的平均数为eq\f(1,100)(4000×90+4500×10)=4050.比拟两个平均数可知,购置1台机器的同时应购置19个易损零件.23.(2022·新课标全国Ⅱ,18)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图B地区用户满意度评分的频数分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100]频数2814106(1)在答题卡上作出B地区用户满意度评分的频率分布直方图,并通过直方图比拟两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图(2)根据用户满意度评分,将用户的满意度分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意估计哪个地区用户的满意度等级为不满意的概率大?说明理由.23.解(1)通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比拟集中,而A地区用户满意度评分比拟分散.(2)A地区用户的满意度等级为不满意的概率大.记CA表示事件:“A地区用户的满意度等级为不满意〞;CB表示事件:“B地区用户的满意度等级为不满意〞.由直方图得P(CA)的估计值为(0.01+0.02+0.03)×10=0.6,P(CB)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满意度等级为不满意的概率大.24.(2022·安徽,17)某企业为了解下属某部门对本企业职工的效劳情况,随机访问50名职工,根据这50名职工对该部门的评分,绘制频率分布直方图(如下图),其中样本数据分组区间为[40,50),[50,60),…,[80,90),[90,100].(1)求频率分布直方图中a的值;(2)估计该企业的职工对该部门评分不低于80的概率;(3)从评分在[40,60)的受访职工中,随机抽取2人,求此2人的评分都在[40,50)的概率.24.解(1)因为(0.004+a+0.018+0.022×2+0.028)×10=1,所以a=0.006.(2)由所给频率分布直方图知,50名受访职工评分不低于80的频率为(0.022+0.018)×10=0.4.所以该企业职工对该部门评分不低于80的概率的估计值为0.4.(3)受访职工中评分在[50,60)的有:50×0.006×10=3(人),记为A1,A2,A3;受访职工中评分在[40,50)的有:50×0.004×10=2(人),记为B1,B2,从这5名受访职工中随机抽取2人,所有可能的结果共有10种,它们是{A1,A2},{A1,A3},{A2,A3},{A1,B1},{A1,B2},{A2,B1},{A2,B2},{A3,B1},{A3,B2},{B1,B2}.又因为所抽取2人的评分都在[40,50)的结果有1种,即{B1,B2},故所求的概率为p=eq\f(1,10).25.(2022·广东,17)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,那么月平均用电量在[220,240)的用户中应抽取多少户?25.解(1)由(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)×20=1得:x=0.0075,所以直方图中x的值是0.0075.(2)月平均用电量的众数是eq\f(220+240,2)=230.因为(0.002+0.0095+0.011)×20=0.45<0.5,所以月平均用电量的中位数在[220,240)内,设中位数为a,由(0.002+0.0095+0.011)×20+0.0125×(a-220)=0.5得:a=224,所以月平均用电量的中位数是224.(3)月平均用电量为[220,240]的用户有0.0125×20×100=25户,月平均用电量为[240,260)的用户有0.0075×20×100=15户,月平均用电量为[260,280)的用户有0.005×20×100=10户,月平均用电量为[280,300]的用户有0.0025×20×100=5户,抽取比例=eq\f(11,25+15+10+5)=eq\f(1,5),所以月平均用电量在[220,240)的用户中应抽取25×eq\f(1,5)=5户.26.(2022·山东,16)海关对同时从A,B,C三个不同地区进口的某种商品进行抽样检测,从各地区进口此种商品的数量(单位:件)如下表所示.工作人员用分层抽样的方法从这些商品中共抽取6件样品进行检测.地区ABC数量50150100(1)求这6件样品中来自A,B,C各地区商品的数量;(2)假设在这6件样品中随机抽取2件送往甲机构进行进一步检测,求这2件商品来自相同地区的概率.26.解(1)因为样本容量与总体中的个体数的比是eq\f(6,50+150+100)=eq\f(1,50),所以样本中包含三个地区的个体数量分别是:50×eq\f(1,50)=1,150×eq\f(1,50)=3,100×eq\f(1,50)=2.所以A,B,C三个地区的商品被选取的件数分别为1,3,2.(2)设6件来自A,B,C三个地区的样品分别为A;B1,B2,B3;C1,C2.那么抽取的这2件商品构成的所有根本领件为:{A,B1},{A,B2},{A,B3},{A,C1},{A,C2},{B1,B2},{B1,B3},{B1,C1},{B1,C2},{B2,B3},{B2,C1},{B2,C2},{B3,C1},{B3,C2},{C1,C2},共15个.每个样品被抽到的时机均等,因此这些根本领件的出现是等可能的.记事件D:“抽取的这2件商品来自相同地区〞,那么事件D包含的根本领件有{B1,B2},{B1,B3},{B2,B3},{C1,C2},共4个.所以P(D)=eq\f(4,15),即这2件商品来自相同地区的概率为eq\f(4,15).27.(2022·新课标全国Ⅰ,18)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125)频数62638228(1)在下表中作出这些数据的频率分布直方图:(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%〞的规定?27.解(1)(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%〞的规定.28.(2022·广东,17)某车间20名工人年龄数据如下表:年龄(岁)工人数(人)191283293305314323401合计20(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差.28.解(1)由题可知,这20名工人年龄的众数是30,极差是40-19=21.(2)这20名工人年龄的茎叶图如下图:(3)这20名工人年龄的平均数为x=eq\f(1,20)(19+3×28+3×29+5×30+4×31+3×32+40)=30,∴这20名工人年龄的方差为s2=eq\f(1,20)eq\i\su(i=1,20,)(xi-x)2=eq\f(112+6×22+7×12+5×02+102,20)=eq\f(252,20)=12.6.29.(2022·新课标全国Ⅱ,19)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高说明市民的评价越高),绘制茎叶图如下:(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.29.解(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为eq\f(66+68,2)=67,所以该市的市民对乙部门评分的中位数的估计值是67.(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为eq\f(5,50)=0.1,eq\f(8,50)=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.(注:考生利用其他统计量进行分析,结论合理的同样给分.)30.(2022·湖南,17)某企业有甲、乙两个研发小组.为了比拟他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:(a,b),(a,eq\x\to(b)),(a,b),(eq\x\to(a),b),(eq\x\to(a),eq\x\to(b)),(a,b),(a,b),(a,eq\x\to(b)),(eq\x\to(a),b),(a,eq\x\to(b)),(eq\x\to(a),eq\x\to(b)),(a,b),(a,eq\x\to(b)),(eq\x\to(a),b),(a,b)其中a,eq\x\to(a)分别表示甲组研发成功和失败;b,eq\x\to(b)分别表示乙组研发成功和失败.(1)假设某组成功研发一种新产品,那么给该组记1分,否那么记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差,并比拟甲、乙两组的研发水平;(2)假设该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率.30.解(1)甲组研发新产品的成绩为1,1,1,0,0,1,1,1,0,1,0,1,1,0,1,其平均数为x甲=eq\f(10,15)=eq\f(2,3);方差为seq\o\al(2,甲)=eq\f(1,15)[(1-eq\f(2,3))2×10+(0-eq\f(2,3))2×5]=eq\f(2,9).乙组研发新产品的成绩为1,0,1,1,0,1,1,0,1,0,0,1,0,1,1,其平均数为x乙=eq\f(9,15)=eq\f(3,5);方差为seq\o\al(2,乙)=eq\f(1,15)[(1-eq\f(3,5))2×9+(0-eq\f(3,5))2×6]=eq\f(6,25).因为x甲>x乙,seq\o\al(2,甲)<seq\o\al(2,乙),所以甲组的研发水平优于乙组.(2)记E={恰有一组研发成功}.在所抽得的15个结果中,恰有一组研发成功的结果是(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),共7个,故事件E发生的频率为eq\f(7,15).将频率视为概率,即得所求概率为P(E)=eq\f(7,15).考点2变量间的的相关关系与统计案例1.(2022·新课标全国Ⅱ,3)根据下面给出的2022年至2022年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的选项是()A.逐年比拟,2022年减少二氧化硫排放量的效果最显著B.2022年我国治理二氧化硫排放显现成效C.2022年以来我国二氧化硫年排放量呈减少趋势D.2022年以来我国二氧化硫年排放量与年份正相关1.解析从2022年起,将每年的二氧化硫排放量与前一年作差比拟,得到2022年二氧化硫排放量与2022年排放量的差最大,A选项正确;2022年二氧化硫排放量较2022年降低了很多,B选项正确;虽然2022年二氧化硫排放量较2022年多一些,但自2022年以来,整体呈递减趋势,即C选项正确;自2022年以来我国二氧化硫年排放量与年份负相关,D选项错误.应选D.答案D2.(2022·湖北,4)变量x和y满足关系y=-0.1x+1,变量y与z正相关,以下结论中正确的选项是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关2.解析因为y=-0.1x+1,-0.1<0,所以x与y负相关.又y与z正相关,故可设z=ay+b(a>0),所以z=-0.1ax+a+b,-0.1a<0,所以x与z负相关.应选C.答案C(2022·江西,7)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,那么与性别有关联的可能性最大的变量是()表1表2性别成绩不及格及格总计男61420女102232总计163652性别视力好差总计男41620女122032总计163652表3表4性别阅读量丰富不丰富总计男14620女23032总计163652性别智商偏高正常总计男81220女82432总计163652成绩B.视力C.智商D.阅读量3.解析因为χeq\o\al(2,1)=eq\f(52×〔6×22-14×10〕2,16×36×32×20)=eq\f(52×82,16×36×32×20),χeq\o\al(2,2)=eq\f(52×〔4×20-16×12〕2,16×36×32×20)=eq\f(52×1122,16×36×32×20),χeq\o\al(2,3)=eq\f(52×〔8×24-12×8〕2,16×36×32×20)=eq\f(52×962,16×36×32×20),χeq\o\al(2,4)=eq\f(52×〔14×30-6×2〕2,16×36×32×20)=eq\f(52×4082,16×36×32×20),答案D4.(2022·湖北,6)根据如下样本数据x345678y4.02.5-0.50.5-2.0-3.0得到的回归方程为eq\o(y,\s\up6(^))=bx+a,那么()A.a>0,b<0B.a>0,b>0C.a<0,b<0D.a<0,b>04.解析由散点图知b<0,a>0,选A.答案A5.(2022·北京,14)高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级中的排名情况如以下图所示,甲、乙、丙为该班三位学生.从这次考试成绩看,①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是________;②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是________.5.解析①由散点图可知:越靠近坐标原点O名次越好,乙同学语文成绩好,而总成绩年级名次靠后;而甲同学语文成绩名次比总成绩名次差,所以应是乙同学语文成绩名次比总成绩名次靠前.②丙同学总成绩年级名次比数学成绩年级名次差,所以丙同学成绩名次更靠前的是数学.答案乙数学6.(2022·新课标全国Ⅰ,19)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.eq\x\to(x)eq\x\to(y)eq\x\to(w)eq\i\su(i=1,8,)(xi-eq\x\to(x))2eq\i\su(i=1,8,)(wi-eq\x\to(w))2eq\i\su(i=1,8,)(xi-eq\x\to(x))·(yi-eq\x\to(y))eq\i\su(i=1,8,)(wi-eq\x\to(w))·(yi-eq\x\to(y))46.65636.8289.81.61469108.8表中wi=eq\r(xi),eq\x\to(w)=eq\f(1,8)eq\i\su(i=1,8,w)i.(1)根据散点图判断,y=a+bx与y=c+deq\r(x)哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果答复以下问题:①年宣传费x=49时,年销售量及年利润的预报值是多少?②年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为eq\o(β,\s\up6(^))=eq\f(\i\su(i=1,n,)ui-\x\to(u)vi-\x\to(v),\i\su(i=1,n,)ui-\x\to(u)2),eq\o(α,\s\up6(^))=eq\x\to(v)-eq\o(β,\s\up6(^))eq\x\to(u).6.解(1)由散点图可以判断,y=c+deq\r(x)适宜作为年销售量y关于年宣传费x的回归方程类型.(2)令w=eq\r(x),先建立y关于w的线性回归方程,由于eq\o(d,\s\up6(^))==eq\f(108.8,1.6)=68,eq\o(c,\s\up6(^))=y-eq\o(d,\s\up6(^))w=563-68×6.8=100.6,所以y关于w的线性回归方程为eq\o(y,\s\up6(^))=100.6+68w,因此y关于x的回归方程为eq\o(y,\s\up6(^))=100.6+68eq\r(x).(3)①由(2)知,当x=49时,年销售量y的预报值eq\o(y,\s\up6(^))=100.6+68eq\r(49)=576.6,年利润z的预报值eq\o(z,\s\up6(^))=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z的预报值eq\o(z,\s\up6(^))=0.2(100.6+68eq\r(x))-x=-x+13.6eq\r(x)+20.12.所以当eq\r(x)=eq\f(13.6,2)=6.8,即x=46.24时,eq\o(z,\s\up6(^))取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.7.(2022·重庆,17)随着我国经济的开展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份20222022202220222022时间代号t12345储蓄存款y(千亿元)567810(1)求y关于t的回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))t+eq\o(a,\s\up6(^));(2)用所求回归方程预测该地区2022年(t=6)的人民币储蓄存款.附:7.解(1)列表计算如下itiyiteq\o\al(2,i)tiyi11515226412337921448163255102550∑153655120这里n=5,t=eq\f(1,n)eq\i\su(i=1,n,t)i=eq\f(15,5)=3,y=eq\f(1,n)eq\i\su(i=1,n,y)i=eq\f(36,5)=7.2.又ltt=lty=从而=eq\f(lty,ltt)=eq\f(12,10)=1.2,a^=y-b^t=7.2-1.2×3=3.6,故所求回归方程为y^=1.2t+3.6.(2)将t=6代入回归方程可预测该地区2022年的人民币储蓄存款为y^=1.2×6+3.6=10.8(千亿元).回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))t+eq\o(a,\s\up6(^))中,eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,t)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论