2023年高考数学一轮复习习题:第十章算法、统计与统计案例、概率_第1页
2023年高考数学一轮复习习题:第十章算法、统计与统计案例、概率_第2页
2023年高考数学一轮复习习题:第十章算法、统计与统计案例、概率_第3页
2023年高考数学一轮复习习题:第十章算法、统计与统计案例、概率_第4页
2023年高考数学一轮复习习题:第十章算法、统计与统计案例、概率_第5页
已阅读5页,还剩105页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第1节算法与程序框图考纲要求1.了解算法的含义,了解算法的思想;2.理解程序框图的三种基本逻辑结构:顺序结构、条件结构、循环结构;3.了解几种基本算法语句——输入语句、输出语句、赋值语句、条件语句、循环语句的含义.知识梳理1.算法(1)算法通常是指按照一定规则解决某一类问题的明确和有限的步骤.(2)应用:算法通常可以编成计算机程序,让计算机执行并解决问题.2.程序框图定义:程序框图又称流程图,是一种用程序框、流程线及文字说明来表示算法的图形.3.三种基本逻辑结构名称内容顺序结构条件结构循环结构定义由若干个按先后顺序执行的步骤组成,这是任何一个算法都离不开的基本结构算法的流程根据条件是否成立而选择执行不同的流向的结构形式从某处开始,按照一定的条件反复执行某些步骤的情况,反复执行的步骤称为循环体程序框图4.基本算法语句(1)输入、输出、赋值语句的格式与功能语句一般格式功能输入语句INPUT“提示内容”;变量输入信息输出语句PRINT“提示内容”;表达式输出常量、变量的值和系统信息赋值语句变量=表达式将表达式的值赋给变量(2)条件语句的格式①IF-THEN格式②IF-THEN-ELSE格式(3)循环语句的格式①WHILE语句②UNTIL语句eq\x(\a\al(DO,循环体,LOOPUNTIL条件))1.赋值号左边只能是变量(不是表达式),在一个赋值语句中只能给一个变量赋值.2.直到型循环是“先循环,后判断,条件满足时终止循环”;当型循环则是“先判断,后循环,条件满足时执行循环”,两者的判断框内的条件表述在解决同一问题时是不同的,它们恰好相反.诊断自测1.判断下列结论正误(在括号内打“√”或“×”)(1)一个程序框图一定包含顺序结构,但不一定包含条件结构和循环结构.()(2)条件结构的出口有两个,但在执行时,只有一个出口是有效的.()(3)输入框只能紧接开始框,输出框只能紧接结束框.()(4)输入语句可以同时给多个变量赋值.()(5)在算法语句中,x=x+1是错误的.()答案(1)√(2)√(3)×(4)√(5)×2.给出如图程序框图,其功能是()A.求a-b的值 B.求b-a的值C.求|a-b|的值 D.以上都不对答案C解析当a≥b时,输出结果为a-b;当a<b时,输出结果为b-a,故其功能是求|a-b|的值.故选C.3.执行如图所示的程序框图,若输出的S为4,则输入的x应为()A.-2 B.16C.-2或8 D.-2或16答案D解析程序框图是求函数S=eq\b\lc\{\rc\(\a\vs4\al\co1(log2x,x>1,,2-x,x≤1))的函数值,S=4时,x=-2或16.故选D.4.(2020·全国Ⅱ卷)执行如图所示的程序框图,若输入的k=0,a=0,则输出的k为()A.2 B.3 C.4 D.5答案C解析程序框图运行如下:a=2×0+1=1<10,k=1;a=2×1+1=3<10,k=2;a=2×3+1=7<10,k=3;a=2×7+1=15>10,k=4.此时输出k=4,程序结束.5.(2020·江苏卷)如图是一个算法流程图.若输出y的值为-2,则输入x的值是________.答案-3解析由算法流程图知该程序是求函数y=eq\b\lc\{\rc\(\a\vs4\al\co1(2x,x>0,,x+1,x≤0))的值.当x>0时,令2x=-2,无解;当x≤0时,令x+1=-2,解得x=-3.故输入x的值是-3.6.(2021·西安调研)如图为计算y=|x|函数值的程序框图,则此程序框图中的判断框内应填________.答案x<0解析输入x应判断x是否大于等于零,由图知判断框应填x<0.考点一顺序结构与条件结构1.阅读如图所示程序框图.若输入x值为9,则输出的y的值为()A.8 B.3 C.2 D.1答案B解析a=92-1=80,b=80÷10=8,y=log28=3.2.给出一个如图所示的程序框图,若要使输入的x的值与输出的y的值相等,则x的可能值的个数为()A.1 B.2 C.3 D.4答案C解析由已知可知,该程序框图的作用是计算并输出分段函数y=eq\b\lc\{\rc\(\a\vs4\al\co1(x2,x≤2,,2x-3,2<x≤5,,\f(1,x),x>5))的值.因为输入的x值与输出的y值相等,所以当x≤2时,令x=x2,解得x=0或x=1;当2<x≤5时,令x=2x-3,解得x=3;当x>5时,令x=eq\f(1,x),解得x=±1(舍去).故满足条件的x值共有3个.故选C.3.如图所示的程序框图的算法思路源于我国古代数学名著《九章算术》中的“更相减损术”.执行该程序框图,若输入的a,b分别为14,18,则输出的a=()A.0 B.2 C.4 D.14答案B解析第一次执行,输入a=14,b=18,因为a<b,所以b=18-14=4;第二次执行,因为a=14,b=4,a>b,所以a=14-4=10;第三次执行,因为a=10,b=4,a>b,所以a=10-4=6;第四次执行,因为a=6,b=4,a>b,所以a=6-4=2;第五次执行,因为a=2,b=4,a<b,所以b=4-2=2,此时a=b=2.故选B.感悟升华应用顺序结构与条件结构的注意点(1)顺序结构:顺序结构是最简单的算法结构,语句与语句之间、框与框之间是按从上到下的顺序进行的.(2)条件结构:利用条件结构解决算法问题时,重点是判断框,判断框内的条件不同,对应的下一程序框中的内容和操作要相应地进行变化,故要重点分析判断框内的条件是否得到满足.提醒条件结构的运用与数学的分类讨论有关.设计算法时,哪一步要分类讨论,哪一步就需要用条件结构.考点二循环结构角度1由程序框图求输出结果【例1】(2020·全国Ⅰ卷)执行如图所示的程序框图,则输出的n=()A.17 B.19 C.21 D.23答案C解析由程序框图可知S=1+3+5+…+(2m-1)=m2(m∈N*),由S>100,得m>10(m∈N*),故当m=11时循环结束,输出的值为n=2m-1=21.故选C.角度2完善程序框图【例2】如图是求eq\f(1,2+\f(1,2+\f(1,2)))的程序框图,图中空白框中应填入()A.A=eq\f(1,2+A) B.A=2+eq\f(1,A)C.A=eq\f(1,1+2A) D.A=1+eq\f(1,2A)答案A解析对于选项A,第一次循环,A=eq\f(1,2+\f(1,2));第二次循环,A=eq\f(1,2+\f(1,2+\f(1,2))),此时k=3,不满足k≤2,输出A=eq\f(1,2+\f(1,2+\f(1,2)))的值.故A正确;经验证选项B,C,D均不符合题意.故选A.感悟升华1.已知程序框图,求输出的结果,可按程序框图的流程依次执行,最后得出结果.2.完善程序框图问题,应结合初始条件和输出结果,分析控制循环的变量应满足的条件或累加、累乘变量的表达式.【训练1】(1)如图(1)所示程序框图是为了求出满足3n-2n>1000的最小偶数n,那么在

和▭两个空白框中,可以分别填入()A.A>1000?和n=n+1B.A>1000?和n=n+2C.A≤1000?和n=n+1D.A≤1000?和n=n+2图(1)图(2)(2)执行如图(2)所示的程序框图,为使输出S的值小于91,则输入的正整数N的最小值为()A.5 B.4 C.3 D.2答案(1)D(2)D解析(1)程序框图中A=3n-2n,故判断框中应填入A≤1000,由于初始值n=0,要求满足A=3n-2n>1000的最小偶数,故执行框中应填入n=n+2,选D.(2)若N=2,第一次进入循环,t=1≤2成立,S=100,M=-eq\f(100,10)=-10,t=1+1=2≤2成立,第二次进入循环,此时S=100-10=90,M=-eq\f(-10,10)=1,t=2+1=3≤2不成立,所以输出S=90<91成立,所以输入的正整数N的最小值是2.考点三基本算法语句【例3】(1)根据下列算法语句,当输入x为60时,输出y的值为()A.25 B.30 C.31 D.61(2)下列程序执行后输出的结果是________.eq\x(\a\al(i=11,S=1,DO,S=S*i,i=i-1,LOOPUNTILi<9,PRINTS,END))答案(1)C(2)990解析(1)该语句为分段函数,y=eq\b\lc\{\rc\(\a\vs4\al\co1(0.5x,x≤50,,25+0.6x-50,x>50.))当x=60时,y=25+0.6×(60-50)=31,故选C.(2)程序反映出的算法过程为i=11⇒S=11×1,i=10;i=10⇒S=11×10,i=9;i=9⇒S=11×10×9,i=8;i=8<9退出循环.执行“PRINTS”.故S=990.感悟升华1.本题主要考查条件语句、输入与输出语句,要注意赋值语句一般格式中的“=”不同于等式中的“=”,其实质是计算“=”右边表达式的值,并将该值赋给“=”左边的变量.2.解决算法语句的一般思路是:首先通读全部语句,把它翻译成数学问题;其次领悟该语句的功能,注意WHILE语句中是当条件满足时执行循环体,而UNTIL语句中是当条件不满足时执行循环体.【训练2】如图为一个求20个数的平均数的程序,在横线上应填充的语句为()eq\x(\a\al(S=0,i=1,WHILE,INPUTx,S=S+x,i=i+1,WEND,a=S/20,PRINTa,END))A.i>20 B.i<20 C.i>=20 D.i<=20答案D解析根据功能是求20个数的平均数可知,循环体共需要执行20次,由循环变量的初始值为1,步长为1可知,当循环20次时,循环变量的值为21,应退出循环.又因为当型循环是不满足条件退出循环,所以i>20时退出循环,故选D.A级基础巩固一、选择题1.(2021·郑州质检)执行如图所示的程序框图,若输入n=eq\f(1,2),则输出的n的值为()A.eq\f(3,2) B.2 C.eq\f(5,2) D.3答案C解析程序的运行过程为neq\f(1,2)1eq\f(3,2)2eq\f(5,2)aeq\f(5,2)2eq\f(3,2)1eq\f(1,2)blneq\f(1,2)0lneq\f(3,2)ln2lneq\f(5,2)n=2时,1>ln2;n=eq\f(5,2)时,eq\f(1,2)<lneq\f(5,2),此时输出n=eq\f(5,2).2.(2020·西安模拟)如图所示的框图中,若输入的x=eq\f(15,16),则输出的i的值为()A.3 B.4 C.5 D.6答案B解析模拟程序的运行,可得x=eq\f(15,16),i=0,执行循环体,x=eq\f(7,8),i=1,不满足条件x=0,执行循环体,x=eq\f(3,4),i=2,不满足条件x=0,执行循环体,x=eq\f(1,2),i=3,不满足条件x=0,执行循环体,x=0,i=4,此时,满足条件x=0,退出循环,输出i的值为4.故选B.3.(2021·昆明一模)执行如图所示的程序框图,则输出的T=()A.eq\f(3,2) B.eq\f(12,7) C.eq\f(5,3) D.eq\f(8,5)答案D解析模拟程序的运行,可得k=1,S=0,T=0,S=1,满足条件S<15,执行循环体,T=1,k=2,S=3,满足条件S<15,执行循环体,T=eq\f(4,3),k=3,S=6,满足条件S<15,执行循环体,T=eq\f(3,2),k=4,S=10,满足条件S<15,执行循环体,T=eq\f(8,5),k=5,S=15,此时,不满足条件S<15,退出循环,输出T的值为eq\f(8,5).故选D.4.(2020·南昌调研)我国古代名著《庄子·天下篇》中有一句名言“一尺之棰,日取其半,万世不竭”,其意思是:一尺的木棍,每天截取一半,永远都截不完.现将该木棍依此规律截取,如图所示的程序框图的功能是计算截取7天后所剩木棍的长度(单位:尺),则①②③处可分别填入的语句是()A.i<7,s=s-eq\f(1,i),i=2iB.i≤7,s=s-eq\f(1,i),i=2iC.i<7,s=eq\f(s,2),i=i+1D.i≤7,s=eq\f(s,2),i=i+1答案D解析由题意可知第一天后剩下eq\f(1,2),第二天后剩下eq\f(1,22),……,由此得出第7天后剩下eq\f(1,27),则①处应为i≤7,②处应为s=eq\f(s,2),③处应为i=i+1,故选D.5.(2021·安徽江南十校质检)执行下面的程序框图,则输出S的值为()A.-eq\f(1,12) B.eq\f(23,60) C.eq\f(11,20) D.eq\f(43,60)答案D解析由程序框图可知S=eq\f(1,5)×(1+2+3+4+5)-eq\b\lc\(\rc\)(\a\vs4\al\co1(1+\f(1,2)+\f(1,3)+\f(1,4)+\f(1,5)))=eq\f(43,60),故选D.6.执行如图所示的程序框图,正确的是()A.若输入a,b,c的值依次为1,2,4,则输出的值为5B.若输入a,b,c的值依次为2,3,5,则输出的值为7C.若输入a,b,c的值依次为3,4,5,则输出的值为15D.若输入a,b,c的值依次为2,3,4,则输出的值为10答案C解析模拟程序的运行过程可知,该程序的功能是利用选择结构找出a,b的最小值并输给变量c,再变换变量a=b,b=c,计算并输出ac+b的值;当输入的a,b,c的值依次为1,2,4时,交换变量得c=1,a=2,b=1,输出结果是2×1+1=3,所以A错误;当输入的a,b,c的值依次为2,3,5时,交换变量得c=2,a=3,b=2,输出结果是3×2+2=8,所以B错误;当输入的a,b,c的值依次为3,4,5时,交换变量得c=3,a=4,b=3,输出结果是4×3+3=15,所以C正确;当输入的a,b,c的值依次为2,3,4时,交换变量得c=2,a=3,b=2,输出结果是3×2+2=8,所以A错误;故选C.7.阅读下边的程序框图,运行相应的程序,输出S的值为()A.5 B.8 C.24 D.29答案B解析i=1,S=0,i不是偶数;第一次循环:S=1,i=2<4;第二次循环:i是偶数;j=1,S=5,i=3<4;第三次循环:i不是偶数,S=8,i=4,满足i≥4,输出S,结果为8.故选B.8.1927年德国汉堡大学的学生考拉兹提出一个猜想:对于任意一个正整数,如果它是奇数,对它乘3加1,如果它是偶数,对它除以2,这样循环,最终结果都能得到1.有的数学家认为“该猜想任何程度的解决都是现代数学的一大进步,将开辟全新的领域”,这大概与其蕴含的“奇偶归一”思想有关.如图是根据考拉兹猜想设计的一个程序框图,则输出i的值为()A.8 B.7 C.6 D.5答案A解析a=3时,不满足a=1,满足a是奇数,a=10,i=2;a=10时,不满足a=1,不满足a是奇数,a=5,i=3;a=5时,不满足a=1,满足a是奇数,a=16,i=4;a=16时,不满足a=1,不满足a是奇数,a=8,i=5;a=8时,不满足a=1,不满足a是奇数,a=4,i=6;a=4时,不满足a=1,不满足a是奇数,a=2,i=7;a=2时,不满足a=1,不满足a是奇数,a=1,i=8;a=1时,满足a=1,输出i=8,故选A.二、填空题9.如图是一个算法流程图.若输入x的值为eq\f(1,16),则输出y的值是________.答案-2解析由流程图得y=eq\b\lc\{\rc\(\a\vs4\al\co1(2x,x≥1,,2+log2x,0<x<1.))∴当输入的x=eq\f(1,16)时,y=2+log2eq\f(1,16)=2-4=-2.10.按照如图程序运行,则输出k的值是________.答案3解析第一次循环,x=7,k=1;第二次循环,x=15,k=2;第三次循环,x=31,k=3;终止循环,输出k的值是3.11.某程序的框图如图所示,若输入的z=i(其中i为虚数单位),则输出的S值为________.答案i解析读程序框图知,n=9时,S=i9=i,当n=10时,终止循环,输出S=i.12.已知实数x∈[2,30],执行如图所示的程序框图,则输出的x不小于103的概率为________.答案eq\f(9,14)解析由程序框图可知,经过3次循环跳出,设输入的初始值为x=x0,则输出的x=2[2(2x0+1)+1]+1≥103,所以8x0≥96,即x0≥12,故输出的x不小于103的概率为p=eq\f(30-12,30-2)=eq\f(18,28)=eq\f(9,14).B级能力提升13.阅读如图所示的程序框图,该算法的功能是()A.计算(1+20)+(2+21)+(3+22)+…+(n+1+2n)的值B.计算(1+21)+(2+22)+(3+23)+…+(n+2n)的值C.计算(1+2+3+…+n)+(20+21+22+…+2n-1)的值D.计算[1+2+3+…+(n-1)]+(20+21+22+…+2n)的值答案C解析初始值k=1,S=0,第1次进入循环体时,S=1+20,k=2;第2次进入循环体时,S=1+20+2+21,k=3;第3次进入循环体时,S=1+20+2+21+3+22,k=4;…;给定正整数n,当k=n时,最后一次进入循环体,则有S=1+20+2+21+…+n+2n-1,k=n+1,终止循环体,输出S=(1+2+3+…+n)+(20+21+22+…+2n-1).14.(2021·兰州诊断)执行如图所示的程序框图,若输出的值S=30,则P的取值范围为()A.(18,30] B.[18,30]C.(0,30] D.[18,30)答案A解析模拟程序的运行,可得n=1,S=0,执行循环体,S=3,n=2,执行循环体,S=9,n=3,执行循环体,S=18,n=4,执行循环体,S=30,n=5,由题意,此时应该不满足条件S<P,退出循环,输出S的值为30,可得18<P≤30,即P的取值范围为(18,30].故选A.15.在数学名著《几何原本》中介绍了求两个正整数的最大公约数的方法——辗转相除法,而我国名著《九章算术》中的“更相减损术”与“辗转相除法”的实质相同.下边程序框图的算法思路源于“更相减损术”,执行该程序,若输入a,b,i的值分别为18,12,0,则输出a的值为________.答案9解析根据题意,初始值a=18,b=12,i=0;i=1,满足a>b,a=18-12=6,i=2,不满足a>b,不满足a=b,b=12-6=6,i=3,不满足a>b,满足a=b,输出a=6+3=9.16.某地区为了了解70~80岁老人的平均日睡眠时间(单位:h),随机选择了50位老人进行调查.如下表所示是这50位老人日睡眠时间的频率分布表.序号(i)分组(睡眠时间)组中值(Gi)频数(人数)频率(Fi)1[4,5)4.560.122[5,6)5.5100.203[6,7)6.5200.404[7,8)7.5100.205[8,9]8.540.08在上述统计数据的分析中,一部分计算见如下程序框图,则输出的S值是________.答案6.42解析由程序框图知,S为5组数据中的组中值(Gi)与对应的频率(Fi)之积的和,则S=G1F1+G2F2+G3F3+G4F4+G5F5=4.5×0.12+5.5×0.20+6.5×0.40+7.5×0.20+8.5×0.08=6.42.

第2节随机抽样考纲要求1.理解随机抽样的必要性和重要性;2.会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.会用随机抽样的基本方法解决一些简单的实际问题.知识梳理1.简单随机抽样(1)定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:抽签法和随机数法.2.系统抽样(1)定义:当总体中的个体数目较多时,可将总体分成均衡的几个部分,然后按照事先定出的规则,从每一部分抽取一个个体得到所需要的样本,这种抽样方法叫做系统抽样.(2)系统抽样的操作步骤假设要从容量为N的总体中抽取容量为n的样本.①先将总体的N个个体编号;②确定分段间隔k,对编号进行分段,当eq\f(N,n)(n是样本容量)是整数时,取k=eq\f(N,n)(否则,先剔除一些个体);③在第1段用简单随机抽样确定第一个个体编号l(l≤k);④按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),……,依次进行下去,直到获取整个样本.3.分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.(2)应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.2.系统抽样一般也称为等距抽样,入样个体的编号相差分段间隔k的整数倍.3.分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.诊断自测1.判断下列结论正误(在括号内打“√”或“×”)(1)简单随机抽样每个个体被抽到的机会不一样,与先后有关.()(2)系统抽样在起始部分抽样时采用简单随机抽样.()(3)分层抽样中,每个个体被抽到的可能性与层数及分层有关.()(4)要从1002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.()答案(1)×(2)√(3)×(4)×2.在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5000名居民的阅读时间的全体是()A.总体 B.个体C.样本的容量 D.从总体中抽取的一个样本答案A解析由题目条件知,5000名居民的阅读时间的全体是总体;其中每1名居民的阅读时间是个体;从5000名居民某天的阅读时间中抽取的200名居民的阅读时间是从总体中抽取的一个样本,样本容量是200.3.一个公司共有N名员工,下设一些部门,要采用等比例分层抽样的方法从全体员工中抽取样本容量为n的样本,已知某部门有m名员工,那么从该部门抽取的员工人数是________.答案eq\f(nm,N)解析每个个体被抽到的概率是eq\f(n,N),设这个部门抽取了x个员工,则eq\f(x,m)=eq\f(n,N),∴x=eq\f(nm,N).4.(2020·上饶一模)总体由编号为00,01,02,…,48,49的50个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,则选出的第3个个体的编号为()附:第6行至第9行的随机数表如下:26357900337091601620388277574950321149197306491676778733997467322748619871644148708628888519162074770111163024042979799196835125A.3 B.16 C.38 D.20答案D解析按随机数表法,从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,超出00~49及重复的不选,则编号依次为33,16,20,38,49,32,…,则选出的第3个个体的编号为20,故选D.5.(2021·郑州调研)某校有高中生1500人,现采用系统抽样法抽取50人作问卷调查,将高一、高二、高三学生(高一、高二、高三分别有学生495人、490人、515人)按1,2,3,…,1500编号,若第一组用简单随机抽样的方法抽取的号码为23,则所抽样本中高二学生的人数为()A.15 B.16 C.17 D.18答案C解析采用系统抽样法从1500人中抽取50人,所以将1500人平均分成50组,每组30人,并且在第一组抽取的号码为23,所以第n组抽取的号码为an=23+(n-1)×30=30n-7,而高二学生的编号为496到985,所以496≤30n-7≤985,又n∈N*,所以17≤n≤33,则共有17人,故选C.6.(2018·全国Ⅲ卷)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.答案分层抽样解析因为不同年龄段的客户对公司的服务评价有较大差异,所以需按年龄进行分层抽样,才能了解到不同年龄段的客户对公司服务的客观评价.考点一简单随机抽样及其应用1.下面的抽样方法是简单随机抽样的是()A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见D.用抽签方法从10件产品中选取3件进行质量检验答案D解析A,B不是简单随机抽样,因为抽取的个体间的间隔是固定的;C不是简单随机抽样,因为总体中的个体有明显的层次;D是简单随机抽样.故选D.2.用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是()A.eq\f(1,10),eq\f(1,10) B.eq\f(3,10),eq\f(1,5)C.eq\f(1,5),eq\f(3,10) D.eq\f(3,10),eq\f(3,10)答案A解析在抽样过程中,个体a每一次被抽中的概率是相等的,因为总体容量为10,故个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性均为eq\f(1,10),故选A.3.(2021·南昌一模)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A.08 B.07 C.02 D.01答案D解析从第1行第5列和第6列组成的数65开始由左到右依次选出的数为08,02,14,07,01,所以第5个个体编号为01.感悟升华1.简单随机抽样需满足:(1)被抽取的样本总体的个体数有限;(2)逐个抽取;(3)是不放回抽取;(4)是等可能抽取.2.简单随机抽样常有抽签法(适用于总体中个体数较少的情况)、随机数法(适用于个体数较多的情况).考点二系统抽样及其应用【例1】(1)(2021·太原调研)某校三个年级共有24个班,学校为了了解同学们的心理状况,将每个班编号,依次为1到24,现用系统抽样法,抽取4个班进行调查,若抽到的最小编号为3,则抽取的最大编号为()A.15 B.18 C.21 D.22(2)(2019·全国Ⅰ卷)某学校为了解1000名新生的身体素质,将这些学生编号为1,2,…,1000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是()A.8号学生 B.200号学生C.616号学生 D.815号学生(3)中央电视台为了解观众对某综艺节目的意见,准备从502名现场观众中抽取10%进行座谈,现用系统抽样的方法完成这一抽样,则在进行分组时,需剔除________个个体,抽样间隔为________.答案(1)C(2)C(3)210解析(1)由已知得间隔数为k=eq\f(24,4)=6,则抽取的最大编号为3+(4-1)×6=21.(2)根据题意,系统抽样是等距抽样,所以抽样间隔为eq\f(1000,100)=10.因为46除以10余6,所以抽到的号码都是除以10余6的数,结合选项知应为616.故选C.(3)把502名观众平均分成50组,由于502除以50的商是10,余数是2,所以每组有10名观众,还剩2名观众,采用系统抽样的方法抽样时,应先用简单随机抽样的方法从502名观众中抽取2名观众,这2名观众不参加座谈;再将剩下的500名观众编号为1,2,3,…,500,并均匀分成50段,每段含eq\f(500,50)=10个个体.所以需剔除2个个体,抽样间隔为10.感悟升华1.如果总体容量N能被样本容量n整除,则抽样间隔为k=eq\f(N,n),否则,可随机地从总体中剔除余数,然后按系统抽样的方法抽样,特别注意,每个个体被抽到的机会均是eq\f(n,N).2.系统抽样中依次抽取的样本对应的号码就是一个等差数列,首项就是第1组所抽取样本的号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码.【训练1】(1)(2021·衡水调研)衡水中学高三(2)班现有64名学生,随机编号为0,1,2,…,63,依编号顺序平均分成8组,组号依次为1,2,3,…,8.现用系统抽样方法抽取一个容量为8的样本,若在第一组中随机抽取的号码为5,则在第6组中抽取的号码为________.(2)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示:若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.答案(1)45(2)4解析(1)分组间隔为eq\f(64,8)=8,∵在第一组中随机抽取的号码为5,∴在第6组中抽取的号码为5+5×8=45.(2)依题意,可将编号为1~35号的35个数据分成7组,每组有5个数据,从每组中抽取一人.成绩在区间[139,151]上共有20个数据,分在4个小组内,每组抽取1人,共抽取4人.考点三分层抽样及其应用角度1求某层入样的个体数【例2】某电视台在网上就观众对其某一节目的喜爱程度进行调查,参加调查的一共有20000人,其中各种态度对应的人数如下表所示:最喜爱喜爱一般不喜欢4800720064001600电视台为了了解观众的具体想法和意见,打算从中抽取100人进行详细的调查,为此要进行分层抽样,那么在分层抽样时,每类人中应抽取的人数分别为()A.25,25,25,25 B.48,72,64,16C.20,40,30,10 D.24,36,32,8答案D解析法一因为抽样比为eq\f(100,20000)=eq\f(1,200),所以每类人中应抽取的人数分别为4800×eq\f(1,200)=24,7200×eq\f(1,200)=36,6400×eq\f(1,200)=32,1600×eq\f(1,200)=8.法二最喜爱、喜爱、一般、不喜欢的比例为4800∶7200∶6400∶1600=6∶9∶8∶2,所以每类人中应抽取的人数分别为eq\f(6,6+9+8+2)×100=24,eq\f(9,6+9+8+2)×100=36,eq\f(8,6+9+8+2)×100=32,eq\f(2,6+9+8+2)×100=8.角度2求总体或样本容量【例3】(1)(2021·东北三省四校联考)某中学有高中生960人,初中生480人,为了了解学生的身体状况,采用分层抽样的方法,从该校学生中抽取容量为n的样本,其中高中生有24人,那么n等于()A.12 B.18 C.24 D.36(2)(2020·西安调研)甲、乙两套设备生产的同类型产品共4800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.答案(1)D(2)1800解析(1)根据分层抽样方法知eq\f(n,960+480)=eq\f(24,960),解得n=36.(2)由题设,抽样比为eq\f(80,4800)=eq\f(1,60).设甲设备生产的产品为x件,则eq\f(x,60)=50,∴x=3000.故乙设备生产的产品总数为4800-3000=1800.感悟升华1.求某层应抽个体数量:按该层所占总体的比例计算.2.已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.3.分层抽样的计算应根据抽样比构造方程求解,其中“抽样比=eq\f(样本容量,总体容量)=eq\f(各层样本数量,各层个体数量)”.【训练2】(1)(2020·郴州二模)已知我市某居民小区户主人数和户主对户型结构的满意率分别如图1和图2所示,为了解该小区户主对户型结构的满意程度,用分层抽样的方法抽取30%的户主进行调查,则样本容量和抽取的户主对四居室满意的人数分别为()A.240,18 B.200,20 C.240,20 D.200,18(2)(2021·合肥模拟)某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种,10种,30种,20种,现从中抽取一个容量为20的样本进行食品安全检测,若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是________.答案(1)A(2)6解析(1)样本容量n=(250+150+400)×30%=240,抽取的户主对四居室满意的人数为150×30%×40%=18.(2)抽样比为eq\f(20,40+10+30+20)=eq\f(1,5),则抽取的植物油类种数是10×eq\f(1,5)=2,抽取的果蔬类食品种数是20×eq\f(1,5)=4,所以抽取的植物油类与果蔬类食品种数之和是2+4=6.A级基础巩固一、选择题1.(2020·兰州二模)某学校为响应“平安出行”号召,拟从2019名学生中选取50名学生加入“交通志愿者”,若采用以下方法选取:先用简单随机抽样方法剔除19名学生,剩下的2000名再按照系统抽样的方法抽取,则每名学生入选的概率()A.不全相等 B.均不相等C.都相等,且为eq\f(1,40) D.都相等,且为eq\f(50,2019)答案D解析先用简单随机抽样方法剔除19名学生,剩下的2000名再按照系统抽样的方法抽取,则每名学生入选的概率相等,且为p=eq\f(50,2019),故选D.2.(2021·永州模拟)现从已编号(1~50)的50位同学中随机抽取5位以了解他们的数学学习状况,用选取的号码间隔一样的系统抽样方法确定所选取的5位同学的编号可能是()A.5,10,15,20,25 B.3,13,23,33,43C.1,2,3,4,5 D.2,10,18,26,34答案B解析抽样间隔为eq\f(50,5)=10,只有选项B符合题意.3.(2020·长春一模)完成下列两项调查:①从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户,调查社会购买能力的某项指标;②从某中学的15名艺术特长生中选出3名调查学习负担情况.宜采用的抽样方法依次是()A.①简单随机抽样,②系统抽样B.①分层抽样,②简单随机抽样C.①系统抽样,②分层抽样D.①②都用分层抽样答案B4.在一个容量为N的总体中抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()A.p1=p2<p3 B.p2=p3<p1C.p1=p3<p2 D.p1=p2=p3答案D解析由随机抽样的知识知,三种抽样中,每个个体被抽到的概率都相等,故选D.5.(2021·襄阳联考)如图是调查某学校高三年级男女学生是否喜欢数学的等高条形图,阴影部分的高表示喜欢数学的频率.已知该年级男、女生各500名(所有学生都参加了调查),现从所有喜欢数学的学生中按分层抽样的方式抽取32人,则抽取的男生人数为()A.16 B.32 C.24 D.8答案C解析由题中等高条形图可知喜欢数学的女生和男生的人数比为1∶3,,所以抽取的男生人数为24.故选C.6.某中学400名教师的年龄分布情况如图,现要从中抽取40名教师作样本,若用分层抽样方法,则40岁以下年龄段应抽取()A.40人 B.200人C.20人 D.10人答案C解析由图知,40岁以下年龄段的人数为400×50%=200,若采用分层抽样应抽取200×eq\f(40,400)=20(人).7.为了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()A.50 B.40 C.25 D.20答案C解析由系统抽样的定义知,分段间隔为eq\f(1000,40)=25.8.某工厂在12月份共生产了3600双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为a,b,c,且a,b,c构成等差数列,则第二车间生产的产品数为()A.800双 B.1000双C.1200双 D.1500双答案C解析因为a,b,c成等差数列,所以2b=a+c,即第二车间抽取的产品数占抽样产品总数的eq\f(1,3),根据分层抽样的性质可知,第二车间生产的产品数占12月份生产总数的eq\f(1,3),即为1200双皮靴.二、填空题9.某单位在岗职工共620人,为了调查工人用于上班途中的时间,决定抽取62名工人进行调查,若采用系统抽样方法将全体工人编号等距分成62段,再用简单随机抽样法得到第1段的起始编号为4,则第40段应抽取的个体编号为________.答案394解析将620人的编号分成62段,每段10个编号,按系统抽样,所抽取工人编号成等差数列,因此第40段的编号为4+(40-1)×10=394.10.假设要考察某公司生产的500克袋装牛奶的三聚氰胺是否超标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,将800袋牛奶按000,001,…,799进行编号,若从随机数表第7行第8列的数开始向右读,则得到的第4个样本个体的编号是________(下面摘取了随机数表第7行至第9行).答案068解析由随机数表知,前4个样本的个体编号分别是331,572,455,068.11.某企业三月中旬生产A,B,C三种产品共3000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:产品类别ABC产品数量(件)1300样本容量(件)130由于不小心,表格中A,C产品的有关数据已被污染看不清楚,统计员记得A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C的产品数量是________件.答案800解析设样本容量为x,则eq\f(x,3000)×1300=130,∴x=300.∴A产品和C产品在样本中共有300-130=170(件).设C产品的样本容量为y,则y+y+10=170,∴y=80.∴C产品的数量为eq\f(3000,300)×80=800(件).12.某校高三年级共有30个班,学校心理咨询室为了了解同学们的心理状况,将每个班编号,依次为1到30,现用系统抽样的方法抽取5个班进行调查,若抽到的编号之和为75,则抽到的最小的编号为________.答案3解析系统抽样的抽取间隔为eq\f(30,5)=6.设抽到的最小编号为x,则x+(6+x)+(12+x)+(18+x)+(24+x)=75,所以x=3.B级能力提升13.我国古代数学算经十书之一的《九章算术》有一衰分问题:今有北乡八千一百人,西乡七千四百八十八人,南乡六千九百一十二人,凡三乡,发役三百人,则北乡遣()A.104人 B.108人 C.112人 D.120人答案B解析由题意知,抽样比为eq\f(300,8100+7488+6912)=eq\f(1,75),所以北乡遣eq\f(1,75)×8100=108(人).14.下列抽取样本的方式属于简单随机抽样的个数为()①从无限多个个体中抽取100个个体作为样本.②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.③从20件玩具中一次性抽取3件进行质量检验.④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.A.0 B.1 C.2 D.3答案A解析①不是简单随机抽样,因为被抽取样本的总体的个数是无限的,而不是有限的;②不是简单随机抽样.因为它是有放回抽样;③不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取;④不是简单随机抽样.因为不是等可能抽样.故选A.15.某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数减少1人,在采用系统抽样时,需要在总体中先剔除2个个体,则n=________.答案18解析总体容量为6+12+18=36,当样本容量为n时,由题意知,系统抽样的间隔为eq\f(36,n),分层抽样的比例是eq\f(n,36),抽取的工程师人数为eq\f(n,36)×6=eq\f(n,6),技术员人数为eq\f(n,36)×12=eq\f(n,3),技工人数为eq\f(n,36)×18=eq\f(n,2),所以n应是6的倍数,36的约数,即n=6,12,18.当样本容量为(n-1)时,总体容量剔除以后是34人,系统抽样的间隔为eq\f(34,n-1),因为eq\f(34,n-1)必须是整数,所以n只能取18,即样本容量n=18.16.一个总体中有90个个体,随机编号0,1,2,…,89,依从小到大的编号顺序平均分成9个小组,组号依次为1,2,3,…,9.现用系统抽样方法抽取一个容量为9的样本,规定:如果在第1组随机抽取的号码为m,那么在第k组(k≥2)中抽取的号码个位数字与m+k的个位数字相同,若m=8,则k的值为________,在第8组中抽取的号码是________.答案876解析由题意知m=8,k=8,则m+k=16,也就是第8组抽取的号码个位数字为6,十位数字为8-1=7,故抽取的号码为76.

第3节用样本估计总体考纲要求1.了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率分布折线图、茎叶图,体会它们各自的特点;2.理解样本数据标准差的意义和作用,会计算数据标准差;3.能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;4.会用样本的频率分布估计总体的频率分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想;5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.知识梳理1.频率分布直方图(1)频率分布表的画法:第一步:求极差,决定组数和组距,组距=eq\f(极差,组数);第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表.(2)频率分布直方图:反映样本频率分布的直方图(如图)横轴表示样本数据,纵轴表示eq\f(频率,组距),每个小矩形的面积表示样本落在该组内的频率.2.茎叶图统计中一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数.3.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把eq\f(a1+a2+…+an,n)称为a1,a2,…,an这n个数的平均数.(4)标准差与方差:设一组数据x1,x2,x3,…,xn的平均数为eq\x\to(x),则这组数据的标准差和方差分别是s=eq\r(\f(1,n)[x1-\x\to(x)2+x2-\x\to(x)2+…+xn-\x\to(x)2]),s2=eq\f(1,n)[(x1-eq\x\to(x))2+(x2-eq\x\to(x))2+…+(xn-eq\x\to(x))2].1.频率分布直方图与众数、中位数、平均数的关系(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.2.平均数、方差的公式推广(1)若数据x1,x2,…,xn的平均数为eq\x\to(x),那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是meq\x\to(x)+a.(2)数据x1,x2,…,xn的方差为s2.①数据x1+a,x2+a,…,xn+a的方差也为s2;②数据ax1,ax2,…,axn的方差为a2s2.诊断自测1.判断下列结论正误(在括号内打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.()(2)一组数据的方差越大,说明这组数据越集中.()(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越大.()(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.()答案(1)√(2)×(3)√(4)×解析(1)正确.平均数、众数与中位数都在一定程度上反映了数据的集中趋势.(2)错误.方差越大,这组数据越离散.(3)正确.小矩形的面积=组距×eq\f(频率,组距)=频率.(4)错误.茎相同的数据,相同的数据叶要重复记录,故(4)错误.2.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为()A.4 B.8 C.12 D.16答案B解析设频数为n,则eq\f(n,32)=0.25,∴n=32×eq\f(1,4)=8.3.若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是()A.91.5和91.5 B.91.5和92C.91和91.5 D.92和92答案A解析这组数据由小到大排列为87,89,90,91,92,93,94,96,∴中位数是eq\f(91+92,2)=91.5,平均数eq\x\to(x)=eq\f(87+89+90+91+92+93+94+96,8)=91.5.4.(2020·全国Ⅱ卷)在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1200份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,许多志愿者踊跃报名参加配货工作.已知该超市某日积压500份订单未配货,预计第二天的新订单超过1600份的概率为0.05.志愿者每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者()A.10名 B.18名 C.24名 D.32名答案B解析由题意,第二天完成积压订单及当日订单的配货的概率不小于0.95,即第二天确保完成新订单1600份,减去超市每天能完成的1200份,再加上积压的500份,共有1600-1200+500=900(份),至少需要志愿者900÷50=18(名).5.(2020·全国Ⅲ卷)设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为()A.0.01 B.0.1 C.1 D.10答案C解析10x1,10x2,…,10xn的方差为102×0.01=1.故选C.6.(2020·新高考海南卷)某中学的学生积极参加体育锻炼,其中有96%的学生喜欢足球或游泳,60%的学生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是()A.62% B.56% C.46% D.42%答案C解析如图,用Venn图表示该中学喜欢足球和游泳的学生所占的比例之间的关系,设既喜欢足球又喜欢游泳的学生占该中学学生总数的比例为x,则(60%-x)+(82%-x)+x=96%,解得x=46%.故选C.考点一频率分布直方图【例1】某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90].并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.解(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计值为0.4.(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,故样本中分数小于50的频率为0.1,故分数在区间[40,50)内的人数为100×0.1-5=5.所以总体中分数在区间[40,50)内的人数估计为400×eq\f(5,100)=20.(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60.所以样本中分数不小于70的男生人数为60×eq\f(1,2)=30.所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.感悟升华1.频率分布直方图的性质.(1)小长方形的面积=组距×eq\f(频率,组距)=频率;(2)各小长方形的面积之和等于1;(3)小长方形的高=eq\f(频率,组矩).2.要理解并记准频率分布直方图与众数、中位数及平均数的关系.【训练1】某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频率分布表.A地区用户满意度评分的频率分布直方图图①B地区用户满意度评分的频率分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100]频数2814106(1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图图②(2)根据用户满意度评分,将用户和满意度分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意估计哪个地区用户的满意度等级为不满意的概率大?说明理由.解(1)作出频率分布直方图如图:通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区用户的满意度等级为不满意的概率大.记CA表示事件:“A地区用户的满意度等级为不满意”;CB表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(CA)的估计值为(0.01+0.02+0.03)×10=0.6,P(CB)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满意度等级为不满意的概率大.考点二统计图表及应用角度1扇形图【例2】某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案A解析法一设新农村建设前经济收入为a,则新农村建设后经济收入为2a,则由饼图可得新农村建设前种植收入为0.6a,其他收入为0.04a,养殖收入为0.3a.新农村建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业收入的总和为1.16a,所以新农村建设后,种植收入减少是错误的.法二因为0.6<0.37×2,所以新农村建设后,种植收入增加,而不是减少,所以A是错误的.角度2折线图【例3】(2021·银川模拟)某运动健康App可以记录跑步(里程数)或行走情况(步数),用户通过该App可查看自己某时间段的运动情况.某人根据2020年1月至2020年11月期间每月跑步的里程(单位:十公里)的数据绘制了下面的折线图.根据该折线图,下列结论不正确的是()A.月跑步里程逐月增加B.月跑步里程最大值出现在10月C.月跑步里程的中位数为5月份对应的里程数D.相对6月至11月,1月至5月的月跑步里程波动性更小、变化比较平稳答案A解析由折线图可知,月跑步里程并不是逐月增加,A错误;月跑步里程最大值出现在10月,B正确;月跑步里程的中位数为5月份对应的里程数,C正确;相对6月至11月,1月至5月的月跑步里程波动性更小、变化比较平稳,D正确.角度3茎叶图【例4】(2021·石家庄综合训练)从甲、乙两种树苗中各抽测了10株树苗的高度,其茎叶图数据如图.根据茎叶图,下列描述正确的是()A.甲种树苗的中位数大于乙种树苗的中位数,且甲种树苗比乙种树苗长得整齐B.甲种树苗的中位数大于乙种树苗的中位数,但乙种树苗比甲种树苗长得整齐C.乙种树苗的中位数大于甲种树苗的中位数,且乙种树苗比甲种树苗长得整齐D.乙种树苗的中位数大于甲种树苗的中位数,但甲种树苗比乙种树苗长得整齐答案B解析甲种树苗的中位数为eq\f(25+30,2)=27.5,乙种树苗的中位数为eq\f(24+26,2)=25,所以甲种树苗的中位数大于乙种树苗的中位数.从茎叶图上看,乙种树苗的高度基本上分布在2和3两个茎上,而甲种树苗的高度分布比较分散,所以乙种树苗比甲种树苗长得整齐,故选B.感悟升华1.通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系.2.折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.3.茎叶图的三个关注点(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一.(2)重复出现的数据要重复记录,不能遗漏.(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.【训练2】(1)(2021·洛阳模拟)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A.200,20 B.100,20C.200,10 D.100,10(2)(2021·昆明诊断)“搜索指数”是网民通过搜索引擎,以每天搜索关键词的次数为基础所得到的统计指标.搜索指数越大,表示网民搜索该关键词的次数越多,对该关键词相关的信息关注度也越高.如图是2019年9月到2020年2月这半年来某个关键词的搜索指数变化的统计图.根据该统计图判断,下列结论正确的是()A.这半年来,网民对该关键词相关的信息关注度呈周期性变化B.这半年来,网民对该关键词相关的信息关注度不断减弱C.从该关键词的搜索指数来看,2019年10月的方差小于11月的方差D.从该关键词的搜索指数来看,2019年12月的平均值大于2020年1月的平均值答案(1)A(2)D解析(1)由图①得样本容量为(3500+2000+4500)×2%=10000×2%=200,抽取的高中生人数为2000×2%=40(人),则近视人数为40×0.5=20(人),故选A.(2)由统计图可知,这半年来,该关键词的搜索指数变化的周期性并不显著,排除A;由统计图可知,这半年来,该关键词的搜索指数的整体减弱趋势不显著,排除B;由统计图可知,2019年10月该关键词的搜索指数波动较大,11月的波动较小,所以2019年10月的方差大于11月的方差,排除C;由统计图可知,2019年12月该关键词的搜索指数大多高于10000,该月平均值大于10000,2020年1月该关键词的搜索指数大多低于10000,该月平均值小于10000,选D.考点三样本的数字特征【例5】(1)(2019·全国Ⅱ卷)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数 B.平均数C.方差 D.极差(2)(2021·贵阳诊断)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的统计表如下表所示,甲乙环数45678569频数11111311有以下四种说法:①甲成绩的平均数小于乙成绩的平均数;②甲成绩的中位数等于乙成绩的中位数;③甲成绩的方差小于乙成绩的方差;④甲成绩的极差小于乙成绩的极差.其中正确命题的个数是()A.1 B.2 C.3 D.4答案(1)A(2)A解析(1)中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响.故选A.(2)由表中数据,得eq\x\to(x)甲=eq\f(1,5)×(4+5+6+7+8)=6,eq\x\to(x)乙=eq\f(1,5)×(5×3+6+9)=6,所以eq\x\to(x)甲=eq\x\to(x)乙,①错误;甲成绩的中位数是6,乙成绩的中位数是5,所以甲成绩的中位数大于乙成绩的中位数,②错误;seq\o\al(2,甲)=eq\f(1,5)×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,seq\o\al(2,乙)=eq\f(1,5)×[3×(5-6)2+(6-6)2+(9-6)2]=2.4,所以seq\o\al(2,甲)<seq\o\al(2,乙),③正确;甲成绩的极差为8-4=4,乙成绩的极差为9-5=4,所以甲成绩的极差等于乙成绩的极差,④错误.综上知,正确命题的个数是1.感悟升华1.平均数反映了数据取值的平均水平,而方差、标准差描述了一组数据围绕平均数波动的大小,标准差、方差越大,数据离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.2.用样本估计总体就是利用样本的数字特征来描述总体的数字特征.【训练3】(1)(2021·济南高三针对训练)“平均增长量”是指一段时间内某一数据指标增长量的平均值,其计算方法是将每一期增长量相加后,除以期数,即eq\f(\o(∑,\s\up6(n),\s\do4(i=2))ai-ai-1,n-1).国内生产总值(GDP)被公认为是衡量国家经济状况的最佳指标,下表是我国2015—2019年GDP数据:年份20152016201720182019国内生产总值/万元68.8974.6483.2091.9399.09根据表中数据,2015—2019年我国GDP的平均增长量为()A.5.03万亿元 B.6.04万亿元C.7.55万亿元 D.10.07万亿元(2)甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):甲108999乙1010799如果甲、乙两人中只有1人入选,则入选的最佳人选应是________.答案(1)C(2)甲解析(1)由题意知,2015—2019年我国GDP增长量之和为99.09-68.89=30.2(万亿元),所以2015—2019年我国GDP的平均增长量为eq\f(30.2,4)=7.55(万亿元),故选C.(2)由题意可得eq\x\to(x)甲=eq\x\to(x)乙=9,又∵seq\o\al(2,甲)=eq\f(1,5)×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=eq\f(2,5),seq\o\al(2,乙)=eq\f(1,5)×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=eq\f(6,5)>seq\o\al(2,甲),∴甲更稳定,故最佳人选应是甲.A级基础巩固一、选择题1.某班的全体学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是()A.45 B.50 C.55 D.60答案B解析由频率分布直方图,知低于60分的频率为(0.010+0.005)×20=0.3.∴该班学生人数n=eq\f(15,0.3)=50.2.(2021·甘肃、青海、宁夏联考)从某小学随机抽取100名学生,将他们的身高(单位:厘米)分布情况汇总如下:身高[100,110](110,120](120,130](130,140](140,150]频数535302010由此表估计这100名小学生身高的中位数为(结果保留4位有效数字)()A.119.3 B.119.7 C.123.3 D.126.7答案C解析由题意知身高在[100,110],(110,120],(120,130]的频率依次为0.05,0.35,0.3,前两组频率和为0.4,组距为10,设中位数为x,则(x-120)×eq\f(0.3,10)=0.1,解得x≈123.3.故选C.3.(2020·天津卷)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为()A.10 B.18 C.20 D.36答案B解析因为直径落在区间[5.43,5.47)内的频率为0.02×(6.25+5.00)=0.225,所以个数为0.225×80=18.故选B.4.在如图所示一组数据的茎叶图中,有一个数字被污染后模糊不清,但曾计算得该组数据的极差与中位数之和为61,则被污染的数字为()A.1 B.2 C.3 D.4答案B解析由图可知该组数据的极差为48-20=28,则该组数据的中位数为61-28=33,设污染数字为x,则eq\f(30+x+34,2)=33,x=2,则被污染的数字为2.5.(2021·全国大联考)近年来,随着4G网络的普及和智能手机的更新换代,各种方便的App相继出世,其功能也是五花八门.某大学为了调查在校大学生使用App的主要用途,随机抽取了56290名大学生进行调查,各主要用途与对应的人数的结果统计如图所示.现有如下说法:①可以估计使用App主要听音乐的大学生人数多于主要看社区、新闻、资讯的大学生人数;②可以估计不足10%的大学生使用App主要玩游戏;③可以估计使用App主要找人聊天的大学生超过总数的eq\f(1,4).其中正确的个数为()A.0 B.1 C.2 D.3答案C解析使用App主要听音乐的人数为5380,使用App主要看社区、新闻、资讯的人数为4450,所以①正确;使用App主要玩游戏的人

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论