第13讲统计(11个知识点13种题型强化训练)_第1页
第13讲统计(11个知识点13种题型强化训练)_第2页
第13讲统计(11个知识点13种题型强化训练)_第3页
第13讲统计(11个知识点13种题型强化训练)_第4页
第13讲统计(11个知识点13种题型强化训练)_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第13讲统计(11个知识点+13种题型+强化训练)知识导图知识清单知识点一全面调查与抽样调查及相关概念1.全面调查对每一个调查对象都进行调查的方法,称为全面调查,又称普查.2.总体、个体(1)我们把调查对象的全体称为总体.(2)组成总体的每一个调查对象称为个体.3.抽样调查根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查.4.样本、样本量、样本数据(1)我们把从总体中抽取的那部分个体称为样本.(2)样本中包含的个体数称为样本量.(3)调查样本获得的变量值称为样本的观测数据,简称样本数据.知识点二简单随机抽样的定义1.放回简单随机抽样和不放回简单随机抽样一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤n<N)个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.2.简单随机样本通过简单随机抽样获得的样本称为简单随机样本.知识点三常用的简单随机抽样的方法1.常用的简单随机抽样的方法(1)抽签法;(2)随机数法.2.随机数的生成(1)用随机试验生成随机数;(2)用信息技术生成随机数.知识点四总体均值与样本均值总体均值一般地,总体中有N个个体,它们的变量值分别为则称为总体均值,又称总体平均数。如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为其中出现的频数为,则总体均值还可以写成加权平均数的形式样本均值如果从总体中抽取一个容量为n的样本,他们的变量值分别为则称为样本均值,又称样本平均数。3.样本均值与总体均值的关系我们常用样本均值eq\o(y,\s\up6(-))估计总体均值eq\o(Y,\s\up6(-)).1.抽签法的优缺点与操作步骤(1)优点:简单易行.当总体的个数不多时,使总体处于“搅拌均匀”的状态比较容易,这时,每个个体都有均等的机会被抽中,从而能够保证样本的代表性.(2)缺点:仅适用于个体数较少的总体.当总体容量非常大时,费时费力又不方便,况且,如果号签搅拌的不均匀,可能导致抽样不公平.(3)用抽签法从容量为N的总体中抽取一个容量为n的样本的步骤:①编号:给总体中的所有个体编号(号码可以从1到N);②制作号签:将1~N这N个号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作);③均匀搅拌:将号签放在一个不透明的容器里,搅拌均匀;④抽取号码:每次从容器中不放回地抽取一个号签,连续抽取n次;⑤构成样本:从总体中将与抽到的号签上的号码一致的个体抽取,就构成了一个容量为n的样本.2.随机数表法的优缺点及操作步骤(1)优点:简单易行.它很好地解决了当总体中的个体数较多时抽签法制签难的问题.(2)缺点:当总体中的个体数很多,需要的样本量也较大时,用随机数表法抽取样本仍不方便.(3)随机数表法抽取样本的步骤:①编号:对总体的个体进行编号(每个号码位数一致);②选定初始值:在随机数表中任选一个数作为开始;③选号:从选定的数开始按一定的方向读下去,得到的号码若不在编号中,则跳过,若在编号中,则取出,如果得到的号码前面已经取出,也跳过,如此继续下去,直到取满为止;④确定样本:根据选定的号码抽取样本.3.抽签法与随机数法的区别抽签法适用于总体中个体数较少,样本量也较小的抽样,随机数法适用于总体中个体数较多,但样本量较小的抽样.4.用样本估计总体,主要基于以下两点:一是在很多情况下总体的个数往往很多,甚至无限,不能一一加以考察;二是有些从总体中抽取个体的试验常有破坏性,因而抽取的个体不允许太多。知识点五、分层随机抽样的相关概念(1)分层随机抽样的定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.(2)比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.2.样本平均数的计算公式在分层随机抽样中,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n,第1层和第2层样本的平均数分别为eq\x\to(x)和eq\x\to(y),则样本的平均数eq\x\to(ω)=eq\f(m,m+n)eq\o(x,\s\up6(-))+eq\f(n,m+n)eq\o(y,\s\up6(-))=eq\f(M,M+N)eq\o(x,\s\up6(-))+eq\f(N,M+N)eq\o(y,\s\up6(-)).思考1:分层随机抽样的总体具有什么特性?[提示]分层随机抽样的总体按一个或多个变量划分成若干个子总体,并且每一个个体属于且仅属于一个子总体.思考2:简单随机抽样和分层随机抽样有什么区别和联系?[提示]区别:简单随机抽样是从总体中逐个抽取样本;分层随机抽样则首先将总体分成几层,在各层中按比例分配抽取样本.联系:(1)抽样过程中每个个体被抽到的可能性相等;(2)每次抽出个体后不再将它放回,即不放回抽样.知识点六获取数据的基本途径获取数据的基本途径适用类型注意问题通过调查获取数据对于有限总体问题,我们一般通过抽样调查或普查的方法获取数据要充分有效地利用背景信息选择或创建更好的抽样方法,并有效地避免抽样过程中的人为错误通过试验获取数据没有现存的数据可以查询严格控制实验环境,通过精心的设计安排试验,以提高数据质量通过观察获取数据自然现象要通过长久的持续观察获取数据通过查询获得数据众多专家研究过,其收集的数据有所存储必须根据问题背景知识“清洗数据”,去伪存真思考1:利用统计报表和年鉴属于那中获取数据的途径?[提示]属于通过查询获取数据的途径.思考2:要了解一种新型灯管的寿命,能通过观察获取数据吗?[提示]不能,应该通过试验获取数据.知识点七频率分布表与频率分布直方图1.一般地,当总体很大或不便获取时,用样本的频率分布估计总体的频率分布.把反应总体频率分布的表格称为频率分布表.2.把表示样本数据分布规律的图形称为频率分布直方图.3.制作频率分布表与频率分布直方图的一般步骤:(1)求极差,即计算最大值与最小值的差.(2)决定组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.知识点八、常用的统计图1.条形图条形图能清楚地表示出每个项目的具体数量.2.折线图折线图能够清晰地反映数据的变化趋势或情况.3.扇形图扇形图能直观、生动地反映各部分在总体中所占的比例情况.1.频率分布直方图能够直观、形象地反映样本的分布规律,可以大致估计出总体的分布,但是从频率分布直方图中得不出原始的数据内容,把数据绘制成频率分布直方图后,原有的具体数据信息就被抹掉了.在频率分布直方图中,由于长方形的面积S=组距×eq\f(频率,组距)=频率,所以各个小长方形的面积表示相应各组的频率,这样频率分布直方图就以面积的形式反映了数据在各个小组的频率的大小,各个小长方形的面积总和等于1.2.一般地,样本量越大,这种估计就越精确.总体估计要掌握:(1)“表”(频率分布表);(2)“图”(频率分布直方图).提醒:直方图的纵轴(小长方形的高)一般是频率除以组距的商,横轴一般是数据的大小,小长方形的面积表示频率.知识点九总体百分位数的估计1.第p百分位数的定义一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.2.计算一组n个数据的第p百分位数的步骤第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.3.四分位数25%,50%,75%这三个分位数把一组数据由小到大排列后的数据分成四等份,因此称为四分位数.思考:(1)班级人数为50的班主任老师说“90%的同学能够考取本科院校”,这里的“90%”是百分位数吗?(2)“这次数学测试成绩的第70百分位数是85分”这句话是什么意思?[提示](1)不是.是指能够考取本科院校的同学占同学总数的百分比.(2)有70%的同学数学测试成绩在小于或等于85分.知识点十总体集中趋势的估计1.众数、中位数和平均数的定义(1)众数:一组数据中出现次数最多的数.(2)中位数:一组数据按大小顺序排列后,处于中间位置的数.如果个数是偶数,则取中间两个数据的平均数.(3)平均数:一组数据的和除以数据个数所得到的数.2.众数、中位数和平均数的比较名称优点缺点平均数与中位数相比,平均数反映出样本数据中更多的信息,对样本中的极端值更加敏感任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大中位数不受少数几个极端数据(即排序靠前或靠后的数据)的影响对极端值不敏感众数体现了样本数据的最大集中点众数只能传递数据中的信息的很少一部分,对极端值不敏感3.众数、中位数、平均数与频率分布直方图的关系(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.(3)众数:众数是最高小矩形底边的中点所对应的数据.思考1:中位数一定是样本数据中的一个数吗?[提示]不一定.一组数据按大小顺序排列后,如果有奇数个数据,处于中间位置的数是中位数;如果有偶数个数据,则取中间两个数据的平均数是中位数.思考2:一组数据的众数可以有几个?中位数是否也具有相同的结论?[提示]一组数据的众数可能有一个,也可能有多个,中位数只有唯一一个.知识点十一总体离散程度的估计1.一组数据x1,x2,…,xn的方差和标准差数据x1,x2,…,xn的方差为=,标准差为.2.总体方差和标准差(1)总体方差和标准差:如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体的平均数为eq\x\to(Y),则称S2=为总体方差,S=eq\r(S2)为总体标准差.(2)总体方差的加权形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=.3.样本方差和标准差如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为eq\x\to(y),则称s2=为样本方差,s=eq\r(s2)为样本标准差.4.标准差的意义标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.5.分层随机抽样的方差设样本容量为n,平均数为eq\x\to(x),其中两层的个体数量分别为n1,n2,两层的平均数分别为eq\o(x,\s\up6(-))1,eq\o(x,\s\up6(-))2,方差分别为seq\o\al(2,1),seq\o\al(2,2),则这个样本的方差为s2=eq\f(n1,n)[seq\o\al(2,1)+(eq\o(x,\s\up6(-))1-eq\o(x,\s\up6(-)))2]+eq\f(n2,n)[seq\o\al(2,2)+(eq\o(x,\s\up6(-))2-eq\o(x,\s\up6(-)))2].知识复习题型一、简单随机抽样特征及适用条件一、单选题1.(2022高三·全国·专题练习)下列抽取样本的方式是简单随机抽样的是(

)A.从无限多个个体中抽取100个个体作为样本B.盒子里共有80个零件,从中逐个不放回地选出5个零件进行质量检验C.从100部中一次性抽取5部进行质量检验D.某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛【答案】B【分析】根据题意,结合简单的随机抽样的定义,逐项判定,即可求解.【详解】简单随机抽样的定义:设一个总体中含有N个个体,从中逐个抽取个个体作为样本,每个个体被抽取的概率是均等的.对于A中,根据简单的随机抽样的定义,从无限多个个体中抽取100个个体作为样本不满足简单的随机抽样的定义,所以A不符合题意;对于B中,根据简单的随机抽样的定义,80个零件,从中逐个不放回地选出5个零件进行质量检验,满足简单的随机抽样的条件,所以B符合题意;对于C中,根据简单的随机抽样的定义,从100部中一次性抽取5部进行质量检验,不满足简单的随机抽样的定义,所以C不符合题意;对于D中,根据简单的随机抽样的定义,从56名同学,指定个子最高的5名同学参加学校组织的篮球赛,不满足简单的随机抽样的定义,所以D不符合题意.故选:B.2.(2324高二上·上海·期末)已知一个总体含有N个个体,要用简单随机抽样方法从中抽取一个个体,则在抽样过程中,每个个体被抽取的概率(

)A.变小 B.变大 C.相等 D.无法确定【答案】C【分析】由简单随机抽样的定义可知每个个体被抽取的概率相等.【详解】一个总体含有N个个体,要用简单随机抽样方法从中抽取一个个体,则在抽样过程中,每个个体被抽取的概率为.故选:C.二、多选题3.(2324高一上·全国·课后作业)对于简单随机抽样,下列说法正确的是(

)A.它要求总体的个体数有限B.它是从总体中按排列顺序逐个地进行抽取C.它是一种不放回抽样D.它是一种等可能抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的可能性相等,而且在整个抽取过程中,各个个体被抽取的可能性也相等,从而保证了这种抽样方法的公平性【答案】ACD【分析】结合简单随机抽样的特征进行判断.【详解】对于A,简单随机抽样中总体的个体数有限,正确;对于B,简单随机抽样是从总体中逐个地进行抽取,原说法不正确;对于C,简单随机抽样是一种不放回抽样,正确;对于D,简单随机抽样是一种等可能抽样,即每个个体被抽取的可能性相等,正确.故选:ACD.三、填空题4.(2223高一下·黑龙江哈尔滨·期末)二战期间盟军的统计学家主要是将缴获的德军坦克序列号作为样本,用样本估计总体的方法得出德军某月生产的坦克总数.假设德军某月生产的坦克总数是N,缴获的该月生产的n辆坦克编号从小到大为,,…,,即最大编号为,且缴获的坦克是从所生产的坦克中随机获取的,因为生产坦克是连续编号的,所以缴获坦克的编号,,…,,,相当于从中随机抽取的n个整数,这n个数将区间分成个小区间,由于N是未知的,除了最右边的区间外,其他n个区间都是已知的.由于这n个数是随机抽取的,所以可以用前n个区间的平均长度估计所有个区间的平均长度,进而得到N的估计值.例如,缴获坦克的编号是3,5,12,18,20,则统计学家利用上述方法估计德军每月生产的坦克数为.

【答案】24【分析】根据统计学家利用的方法列比例式计算,即可求得答案.【详解】由于用前n个区间的平均长度估计所有个区间的平均长度,而缴获坦克的编号是3,5,12,18,20,即,故,即则统计学家利用上述方法估计德军每月生产的坦克数为24,故答案为:24四、解答题5.(2223高一·全国·随堂练习)现在想估计某寒带地区旅游城市一年的游客量,能采用在1月—3月随机抽取10天的游客量作为全年每天游客量的一组样本,合理吗?为什么?如果这种抽样方法不合理,请你设计一个你认为合理的抽样方案.【答案】见解析【分析】简单随机抽样要注意样本的随机性,代表性.【详解】不合理;采用1月到3月随机抽取10天的游客量,该游客量只代表了1月到3月的游客量状况,无法代表全年游客量,具有特殊性,无法作为全年每天游客量的一组标准.应从全年中随机抽取20天的游客量作为全年每天游客量的一组样本.五、判断题6.(2324高一上·全国·课时练习)判断正误(正确的填“正确”,错误的填“错误”)(1)抽签法和随机数法都是不放回抽样.()(2)抽签法抽签时,先抽签的人占便宜.()(3)利用随机数表抽样时,开始位置和读数方向可以任意选择.()(4)对任意抽样调查均可使用随机数法.()【答案】正确错误正确错误【分析】由简单随机抽样的特点逐一判断即可.【详解】解:因为简单随机抽样是指:不放回逐一抽取的方法,并且每个个体被抽中的机会相等,常用的方法有抽签法和随机数法.故(1)正确;(2)错误;在采用随机数表时,开始位置和读数方向可以任意选择,故(3)正确;随机数表法适用于总体个数较多,抽取的样本容量也较多的情况,故(4)错误.故答案为:正确;错误;正确;错误题型二、抽签法和随机数表法一、单选题1.(2324高一上·安徽蚌埠·期末)为了解高一新生的体质健康状况,某校将组织高一学生进行体质健康抽测.已知该校高一年级共有800名学生,将他们依次编号,拟利用随机数表随机抽取80名同学参加体质健康测试,随机数表的一部分如下:781665720802631407024369972801983204924349358200362348696938748129763413284142412424198593132322在随机数表中从第2行第4列开始,横向依次读取三个数字,则被抽中的第5个编号是(

)A.036 B.341 C.328 D.693【答案】D【分析】根据随机数表的用法,依次列出有关数据即可.【详解】由题意,从第2行,第4列开始,横向依次读取的三个数字是:492,434,935(无效,舍去),820(无效,舍去),036,234,869(无效,舍去),693,所以抽中的第5个编号是:693.故选:D2.(2024·陕西西安·一模)某高校对中文系新生进行体测,利用随机数表对650名学生进行抽样,先将650名学生进行编号,001,002,…,649,650.从中抽取50个样本,下图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第6个样本编号是(

)3221183429

7864540732

5242064438

1223435677

35789056428442125331

3457860736

2530073286

2345788907

23689608043256780843

6789535577

3489948375

2253557832

4577892345A.623 B.328 C.072 D.457【答案】A【分析】按照随机数表提供的数据,三位一组的读数,并取001到650内的数,重复的只取一次即可【详解】从第5行第6列开始向右读取数据,第一个数为253,第二个数是313,第三个数是457,下一个数是860,不符合要求,下一个数是736,不符合要求,下一个是253,重复,第四个是007,第五个是328,第六个数是623,,故A正确.故选:A.二、解答题3.(2023高一·全国·专题练习)某高校共有50名志愿者被选中参加某志愿服务活动,暑假期间,该校欲从这50名志愿者中选取8人组成志愿服务小组,请用抽签法设计抽样方案.【答案】答案见解析【分析】根据抽签法的步骤即可求解.【详解】(1)将50名志愿者编号,号码分别是1,2,…,50.(2)将号码分别写在外观、质地等无差别的小纸片上作为号签.(3)将小纸片放入一个不透明的盒子里,充分搅匀.(4)从盒子中不放回地逐个抽取8个号签,使与号签上编号对应的志愿者进入样本,组成志愿服务小组.4.(2122高一·全国·课时练习)新型冠状病毒疫情暴发后,某医院为了支援前线,要在100名志愿者中选取10人组成医疗小组去参加救治工作,请分别用抽签法和随机数表法设计抽样方案.【答案】答案见解析【分析】根据抽签法和随机数表法的定义和抽取方法,即可求解【详解】解:抽签法:(1)将100名志愿者编号,号码分别为1,2,3,…,100,(2)将号码分别写在相同的纸条上,制成号签,(3)将得到的号签放到一个不透明的盒子中,搅拌均匀,(4)从盒子中每次不放回地抽取1个号签,连续抽10次,并记录上面的号码,(5)与所得号码对应的志愿者就是医疗小组成员;随机数法:(1)将100名志愿者编号,号码分别为00,01,02,03,…,99,(2)在随机数表中随机地确定一个数字,(3)从该数字开始按一定的方向读下去,每次读两位,凡不在00~99中以及重复的数都跳过,依次得到10个号码,(4)与所得号码对应的志愿者就是医疗小组成员.题型三、简单随机抽样的概率1.(2223高一下·陕西宝鸡·阶段练习)某校在一次期中作业检查中,对高一(6)班61位同学的作业进行抽样调查,先采用抽签法从中剔除一个人,再从余下的60人中随机抽取6人,下列说法正确的是(

)A.这种抽样方法对于被剔除的个体是不公平的,因为他们失去了被抽到的机会B.每个人被抽到的机会不相等C.每个人在整个抽样过程中被抽到的机会相等,因为每个人被剔除的可能性相等,那么,不被剔除的机会也是相等的D.由于采用了两步进行的抽样,所以无法判断每个人被抽的可能性是多少【答案】C【分析】根据随机抽样的特征,即可判断出结果.【详解】由于第一次剔除时采用抽签法,对每个人来说可能性相等,然后随机抽取6人对每个人的机会也是均等的,所以总的来说每个人的机会都是均等的,被抽到的可能性都是相等的.故选:C.2.(2023高二上·新疆·学业考试)对总数为的一批零件抽取一容量为20的样本,若每个零件被抽取的可能性为20%,则为(

)A.150 B.120 C.100 D.40【答案】C【分析】由题意可得:,求解即可.【详解】解:由题意可得:,解得.故选:C.3.(2223高一下·陕西西安·期中)对总数为200的一批零件,抽一个容量为的样本,若每个零件被抽到的可能性为0.25,则为()A.50 B.100C.25 D.120【答案】A【分析】利用简单随机抽样的性质直接计算即可.【详解】因为每个零件被抽到的可能性相等,所以由解得,故选:A二、填空题4.(2223高一下·广东广州·期末)采用简单随机抽样从含15个个体的总体中抽取一个容量为5的样本,个体前两次末被抽到,第三次被抽到的概率为.【答案】【分析】根据简单随机抽样的特点,结合等可能事件的性质计算作答.【详解】依题意,由等可能事件的性质,个体每次被抽到的概率均相等,均为,所以个体前两次末被抽到,第三次被抽到的概率为.故答案为:三、解答题5.(2122高一·全国·课时练习)从总体容量为500的一批商品中抽取出一个容量为A的样本,若每个商品个体被抽到的可能性为12%,求A的值.【答案】60【分析】根据抽样比例计算可得答案.【详解】由题意,得,所以.6.(1920高一·全国·课时练习)某单位拟从40名员工中选1人赠送电影票,可采用下面两种选法:选法一:将这40名员工按1至40进行编号,并相应地制作号码为1至40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的员工是幸运人选;选法二:将39个白球与1个红球(除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名员工逐一从中不放回地摸取1个球,则摸到红球的员工是幸运人选.试问:(1)这两种选法是否都是抽签法,为什么?(2)这两种选法中每名员工被选中的可能性是否相等?【答案】(1)选法一是抽签法,选法二不是抽签法;理由见解析(2)相等【分析】(1)根据抽签法的特征,分析即得解(2)由于选法一中抽取每个签和选法二中摸到每个球都是等可能的,分析即得解【详解】(1)选法一满足抽签法的特征,是抽签法.选法二不是抽签法,因为抽签法要求所有的号签编号互不相同,而选法二中的39个白球无法相互区分;(2)由于选法一中抽取每个签和选法二中摸到每个球都是等可能的,因此选法一中抽取1个号签的概率和选法二中摸到红球的概率相等,均为故这两种选法中每名员工被选中的可能性相等,均为.题型四、简单随机抽样估计总体一、单选题1.(2223高一下·安徽阜阳·期末)中国古典数学先后经历了三次发展高潮,即两汉时期、魏晋南北朝时期和宋元时期,并在宋元时期达到顶峰,而南宋时期的数学家秦九韶正是其中的代表人物.作为秦九韶的集大成之作,《数书九章》一书所承载的数学成就非同一般.可以说,但凡是实际生活中需要运用到数学知识的地方,《数书九章》一书皆有所涉及,例如“验米夹谷”问题:今有谷3318石,抽样取谷一把,数得168粒内有秕谷22粒,则粮仓内的秕谷约为(

)A.321石 B.166石 C.434石 D.623石【答案】C【分析】根据给定条件,利用样本的数字特征估计总体的相应特征作答.【详解】设粮仓内的秕谷有石,依题意,,解得,所以粮仓内的秕谷约为434石.故选:C二、多选题2.(2022·湖北·模拟预测)某地区公共部门为了调查本地区中学生的吸烟情况,对随机抽出的编号为1~1000的1000名学生进行了调查.调查中使用了两个问题,问题1:你的编号是否为奇数?问题2:你是否吸烟?被调查者从设计好的随机装置(内有除颜色外完全相同的白球50个,红球50个)中摸出一个小球(摸完放回):摸到白球则如实回答问题1,摸到红球则如实回答问题2,回答“是”的人在一张白纸上画一个“√”,回答“否”的人什么都不用做,由于问题的答案只有“是”和“否”,而且回答的是哪个问题也是别人不知道的,因此被调查者可以毫无顾忌的给出真实的答案.最后统计得出,这1000人中,共有265人回答“是”,则下列表述正确的是(

)A.估计被调查者中约有15人吸烟 B.估计约有15人对问题2的回答为“是”C.估计该地区约有3%的中学生吸烟 D.估计该地区约有1.5%的中学生吸烟【答案】BC【分析】先求出回答问题2且回答的“是”的人数,从而估计出该地区中学生吸烟人数的百分比,即得解.【详解】随机抽出的1000名学生中,回答第一个问题的概率是,其编号是奇数的概率也是,所以回答问题1且回答的“是”的学生人数为,回答问题2且回答的“是”的人数为,从而估计该地区中学生吸烟人数的百分比为,估计被调查者中吸烟的人数为.故选:BC.三、填空题3.(2324高一上·北京房山·期末)为估计某森林内松鼠的数量,使用以下方法:先随机从森林中捕捉松鼠100只,在每只松鼠的尾巴上作上记号后放回森林.再随机从森林中捕捉50只,若尾巴上有记号的松鼠共有5只,估计此森林内约有松鼠只.【答案】【分析】直接根据比例求解.【详解】估计此森林内约有松鼠只.故答案为:四、解答题4.一只装有红豆的袋子中混入了绿豆,怎样获取数据可以估计出袋子中绿豆所占的比率?怎样做可以提高估计结论的准确程度?(假定两种豆子的大小、质量相同)【答案】答案见解析【分析】可以从袋子中拿出几把豆子,统计取出的豆子中绿豆子所占的比率,多试验几次可以提高准确率.【详解】可以从袋子中拿出几把豆子,统计取出的豆子中绿豆子所占的比率,估计出袋子中绿豆所占的比率.充分搅拌豆子且多试验几次计算平均值可以提高结论的准确程度.题型五、分层抽样特征及适用条件总体;抽样比,样本总量,各层总数,总体容量的计算一、单选题1.(2024·青海·一模)某中学的高中部共有男生1200人,其中高一年级有男生300人,高二年级有男生400人.现按分层抽样抽出36名男生去参加体能测试,则高三年级被抽到的男生人数为(

)A.9 B.12 C.15 D.18【答案】C【分析】由题意按分层抽样的方法用36乘以高三年级的男生数占总男生数的比例即可求解.【详解】高三年级被抽到的男生人数为.故选:C.2.(2324高二上·内蒙古锡林郭勒盟·期末)树人中学高一年级有712名学生,男生有326名,女生有386名,想抽取样本了解高一年级的平均身高,为减少“极端”样本的出现,你认为比较合适的抽样方法为(

)A.抽签法 B.随机数法 C.分层抽样 D.其他方法【答案】C【分析】按照比例抽取,故为分层抽样.【详解】为减少“极端”样本的出现,可按照男生与女生的比例抽取,因此用分层抽样.故选:C.3.(2023·湖南岳阳·模拟预测)现有以下两项调查:①从40台刚出厂的大型挖掘机中抽取4台进行质量检测;②在某校800名学生中,型、型、B型和型血的学生依次有人.为了研究血型与色弱的关系,需从中抽取一个容量为40的样本.完成这两项调查最适宜采用的抽样方法分别是(

)A.①②都采用简单随机抽样B.①②都采用分层随机抽样C.①采用简单随机抽样,②采用分层随机抽样D.①采用分层随机抽样,②采用简单随机抽样【答案】C【分析】由简单随机抽样、分层随机抽样的概念即可判断.【详解】由题意对于①,40台刚出厂的大型挖掘机被抽取的可能性一样,故为简单随机抽样,对于②,为了研究血型与色弱的关系,说明某校800名学生被抽取的可能性要按照血型比例分层抽取,故为分层随机抽样.故选:C.4.(2024·四川南充·二模)某工厂生产A,B,C三种不同型号的产品,它们的产量之比为2∶3∶5,用分层抽样的方法抽取一个容量为n的样本.若样本中A型号的产品有30件,则样本容量n为(

)A.150 B.180 C.200 D.250【答案】A【分析】直接由分层抽样的定义按比例计算即可.【详解】由题意样本容量为.故选:A.二、填空题5.(2324高三下·辽宁·开学考试)据统计,某段时间内由内地前往香港的老、中、青年旅客的比例依次为,现使用分层抽样的方法从这些旅客中随机抽取n人,若青年旅客抽到60人,则.【答案】200【分析】根据分层抽样得到老、中年旅客的人数,相加后得到答案.【详解】青年旅客抽到60人,则老、中年旅客的人数分别为和,故.故答案为:2006.(2324高一上·江西景德镇·期末)某校有高级教师90人,中级教师150人,其他教师若干人.为了了解教师的健康状况,从中抽取60人进行体检.已知高级教师中抽取了18人,则从中级教师中抽取的人数是.【答案】30【分析】由题意可先计算抽样比,再由抽样比求出结果.【详解】由题意知,抽取的比例为,则中级教师抽取人.故答案为:30三、解答题7.(2425高一上·全国·课后作业)某学校开展学生对教师任教满意度的调查活动.首先,通过问卷对全体学生进行普查,然后根据普查结果,抽取一部分学生进行访谈.下表是该学校在普查中对某位教师任教的所有班级(4个班级)的满意度调查结果:班级编号1234满意度/%98979091现在,想从这4个班级中选取一部分学生进行访谈.有4名同学是这样操作的:同学甲从2号班级、4号班级中抽取一部分同学进行访谈.同学乙从1号班级、2号班级中抽取一部分同学进行访谈.同学丙从1号班级、3号班级中抽取一部分同学进行访谈.同学丁从3号班级、4号班级中分别抽取一部分同学进行访谈.你认为哪名同学的调查更合理?【答案】同学甲和同学丙的抽样更合理一些.【分析】注意到总体是该教师任教班级每一名同学对其任教的满意度,所以应该使得样本的分布与总体的分布近似相同,由此即可得解.【详解】在这个调查中,总体是该教师任教班级每一名同学对其任教的满意度.从普查结果来看,总体的分布呈现了满意度“高高低低”的现象.因此,在选取访谈学生的抽样时,既不能只选择两个满意度高的班级,也不能只选择两个满意度低的班级,而是要让样本的分布与总体的分布近似相同,也就是说同学甲和同学丙的抽样更合理一些.8.(2425高一上·全国·课后作业)某地农田分布在山地、丘陵、平原、洼地不同的地形上,要对这个地区的农作物产量进行调查,应当如何抽样?【答案】采用分层随机抽样的方法【分析】注意到不同类型农田的产量有较大差异,由此即可得解.【详解】因为不同类型农田的产量有较大差异,所以应当采用分层随机抽样的方法,对不同类型的农田按其占总数的比例抽取样本.9.(2425高一上·全国·课后作业)某市有大、中、小型的商店共1500家,且这三种类型商店的数量之比为.要调查全市商店的每日零售额情况,要求抽取30家商店进行调查,应当采用怎样的抽样方法?【答案】应用分层抽样,抽取2(家)大型商店,10(家)中型商店,18(家)小型商店【分析】在这个问题中,调查的总体是1500家商店的每日零售额,而且在总体中,大、中、小型商店的比例是已知的,从而可以采用分层抽样的方法求解.【详解】在随机抽样过程中,抽取的样本中三种类型商店的比例,应与总体中三种类型的商店比例相同.因此,抽取的30家商店样本应按照分层抽样,以的比例从大、中、小型商店中抽取,使样本比较好地代表总体的特征.所以,可以抽取(家)大型商店,(家)中型商店,(家)小型商店,组成样本.题型六、分层抽样的概率一、单选题1.(2122高二上·海南省直辖县级单位·期末)白沙中学高一、高三、初一学生的人数之比为,从中随机抽取400名学生参加军训结业演练,若每人被抽取的概率都是0.2,则该高一年级的人数为(

)A.1000 B.900 C.800 D.700【答案】B【分析】利用分层抽样中的比例求解即可.【详解】因为高一、高三、初一的人数之比为,从中抽取400名学生作为样本,所以高一年级抽取的人数为:,又每人被抽取的概率为0.2,则该高一年级的人数有.故选:B二、多选题2.某公司生产三种型号的轿车,产量分别为1500辆,6000辆和2000辆为检验该公司的产品质量,公司质监部门要抽取57辆进行检验,则下列说法正确的是(

)A.应采用分层随机抽样抽取B.应采用抽签法抽取C.三种型号的轿车依次应抽取9辆,36辆,12辆D.这三种型号的轿车,每一辆被抽到的概率都是相等的【答案】ACD【分析】根据分层抽样逐项分析判断.【详解】因为三种型号轿车的产量具有明显的差异性,所以应采用分层随机抽样抽取,故A正确;B错误;又因为三种型号轿车的产量之比为,所以三种型号的轿车依次应抽取辆,辆,辆,故C正确;根据随机抽样可知:每个个体被抽到的可能性均等,即每一辆被抽到的概率都是相等的,故D正确;故选:ACD.3.对一个容量为的总体抽取容量为的样本,当选取抽签法抽样、随机数法抽样和分层随机抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为,三者关系不可能是(

)A. B. C. D.【答案】ABC【分析】根据抽样的概念,每个个体被抽中的概率是均等的,即可求解.【详解】在抽签法抽样、随机数法抽样和分层随机抽样中,每个个体被抽中的概率均为,所以.故选:ABC.三、填空题4.(2023高三上·全国·专题练习)在120个零件中有一级品24个、二级品36个、三级品60个,从中抽取一个容量为20的样本,若用简单随机抽样法抽取样本,则总体中每个个体被抽到的可能性为;若按比例分配的分层随机抽样法抽取样本,则总体中每个个体被抽到的可能性为.【答案】【分析】由简单随机抽样的概念计算可能性即可,由分层抽样的概念确定每层被抽到的个体,从而计算每个个体被抽到的可能性即可.【详解】因为总体中的个体数,样本容量,若用简单随机抽样法抽取样本,则每个个体被抽到的可能性均为;因为一、二、三级品的数量之比为,,,,故从一、二、三级品中分别抽取4个、6个、10个产品,若按比例分配的分层随机抽样法抽取样本,则每个个体被抽到的可能性分别为,,,都为.故答案为:;题型七、设计分层抽样过程一、单选题1.某单位有老年人28人、中年人54人、青年人81人,为了调查他们的身体状况,从中抽取一个容量为36的样本,则最适合抽取样本的方法是A.随机数表法 B.抽签法C.分层抽样 D.先从老年人中剔除1人,再用分层抽样【答案】D【解析】根据总体的特征,考虑用分层抽样,按照分层抽样方法的进行判断即可.【详解】解析:因为总体是由差异明显的三部分组成,所以考虑用分层抽样.因为总人数为,样本容量为36,由于按抽样,无法得到整数解,因此考虑先剔除1人,将抽样比变为.若从老年人中随机地剔除1人,则老年人应抽取(人),中年人应抽取(人),青年人应抽取(人),从而组成容量为36的样本.故选:D【点睛】本题考查了分层抽样的方法,属于基础题.二、填空题2.分层抽样的步骤①将总体按一定标准分层;②计算各层的个体数与总体的个数的;③按各层的个体数占总体的个体数的确定各层应抽取的样本容量;④在每一层进行抽样(可用简单随机抽样).【答案】比值比值【分析】由分层抽样的步骤判断.【详解】因为分层抽样的步骤是:①将总体按一定标准分层;②计算各层的个体数与总体的个数的比值;③按各层的个体数占总体的个体数的比值确定各层应抽取的样本容量;④在每一层进行抽样(可用简单随机抽样).故答案为:比值,比值三、解答题3.学校要在高一年级450名同学中随机选取45人参加暑假的夏令营,试完成以下工作:(1)设计一个随机抽样方案;(2)设计一个分层抽样方案,使得选取出男生23名,女生22名;(3)如果全年级有9个班,设计一个分层抽样方案,使得各班随机选取5人.【答案】(1)以全体学生的学籍号为编号,用计算机在450名学生的学籍号中随机抽取45个学籍号,这45个学籍号对应的学生就是要抽取的对象;(2)将总体450名同学分为男、女两部分,把所有男生进行编号,再进行简单随机抽样进行抽取23人,再把所有女生进行编号,进行简单随机抽样抽取22人;(3)将每班男女进行分层抽样,如果第个班的人数为,则为抽取的比例数,按照此比例对男生和女生进行抽取.【分析】根据题目要求,选择合适的抽样方法即可.【详解】(1)以全体学生的学籍号为编号,用计算机在450名学生的学籍号中随机抽取45个学籍号,这45个学籍号对应的学生就是要抽取的对象;(2)将总体450名同学分为男、女两部分,把所有男生进行编号,再进行简单随机抽样进行抽取23人,再把所有女生进行编号,进行简单随机抽样抽取22人;(3)将每班男女进行分层抽样,如果第个班的人数为,则为抽取的比例数,按照此比例对男生和女生进行抽取.4.(2223高一·全国·课时练习)一个单位的职工有500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁以上的有95人,为了了解这个单位职工与身体状况有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?【答案】答案见解析【分析】根据题意可得用分层随机抽样的方法来抽取样本,根据分层抽样的步骤抽取即可.【详解】由题意可得用分层抽样的方法抽取样本,步骤如下:(1)按年龄将职工分层三层:不到35岁的职工,35岁到49岁的职工,50岁以上的职工;(2)确定每层应抽取个体的个数,抽样比为,则在不到35岁的职工中抽取人,在35岁到49岁的职工中抽取人,在50岁以上的职工中抽取人;(3)在各层中分别按简单随机抽样抽取样本;(4)综合每层抽样,组成样本.题型八、普查与抽查的定义辨析及合理选择一、单选题1.(2324高一上·广西南宁·开学考试)下列调查中,适宜采用全面调查的是(

)A.调查某池墙中现有鱼的数量B.调查某批次汽车的抗撞击能力C.选出某班短跑最快的学生参加全校短跑比赛D.调查市场上某种食品的色素含量是否符合国家标准【答案】C【分析】选择全面调查还是抽样调查要根据所要考查的对象的特征灵活选用,一般来说,对于具有破坏性的调查、无法进行普查、普查的意义或价值不大,应选择抽样调查,对于精确度要求高的调查,事关重大的调查往往选用全面调查.【详解】调查某池塘中现有鱼的数量,应采用抽样调查,故选项A不合题意;调查某批次汽车的抗撞击能力,应采用抽样调查,故选项B不合题意;选出某班短跑最快的学生参加全校短跑比赛,适宜采用全面调查,故选项C符合题意;调查市场上某种食品的色素含量是否符合国家标准,应采用抽样调查,故选项D不合题意.故选:C.2.(2324高一上·江西景德镇·期末)下列调查方式中,可用普查的是(

)A.调查某品牌电动车的市场占有率 B.调查2023年杭州亚运会的收视率C.调查某校高三年级的男女同学的比例 D.调查一批玉米种子的发芽率【答案】C【分析】根据普查适合调查对象数目较少的情况来判断即可.【详解】选项ABD调查对象的数目较多,适合采用抽查;C调查对象的数目较少,适合采用普查.故选:C二、多选题3.(2023高一上·全国·专题练习)(多选)下列选项中,是直接获取数据的方法有(

)A.从《中华人民共和国人口统计资料汇编》当中获取的数据 B.试验C.统计调查 D.企业的经营报表数据【答案】BC【分析】根据直接获取数据的概念及间接获取数据的形式,逐项分析即可.【详解】直接获取数据的最基本的形式是进行统计调查和进行试验.统计调查是指根据统计研究预定的目的、要求和任务,运用科学的方法,有计划、有组织地向客观实际搜集资料的过程.通过统计调查得到的数据,一般称为观测数据.试验是直接获得统计数据的又一重要来源.而数据的间接来源有:公开出版的统计数据,主要来自政府、组织、学校、科研机构;尚未公开发表的数据,如各企业的经营报表数据由直接获取数据的概念可知,选项是直接获取数据的方法,选项A,D是间接获取数据的方法.故选:BC.三、解答题4.(2324高一上·全国·课时练习)为调查某小区平均每户居民的月用水量,下面是2名同学设计的方案:学生甲:我把这个小区用水量调查表放在互联网上,只要登录网站的人就可以看到这张表,他们填的表可以很快地反馈到我的电脑中,这样就可以很快估算出小区平均每户居民的月用水量;学生乙:我给我们居民小区的每一个住户发一张用水量调查表,大概需要一周左右的时间就可以统计出小区平均每户居民的月用水量.请你分析上述2名学生设计的调查方案能够获得平均每户居民的月用水量吗?为什么?【答案】答案见解析【分析】甲同学的方案收集的数据针对性较差些,乙同学的方案用时长,但是数据较为准确.【详解】学生甲的方案得到的样本不能够反映不上网的居民的用水情况,它是一种方便样本,所得到的样本代表性差,不能准确地获得平均每户居民的月用水量.学生乙的方案实际上是普查,花费的人力、物力更多一些,但是只要统计过程不出错,就可以准确地得到平均每户居民的月用水量.5.(2223高一·全国·随堂练习)动物学家想在某种鸟类身上安装卫星定位仪,以便考查该种鸟类的迁徙规律.你认为这项试验可以实施普查吗?【答案】不可以【分析】结合普查的含义进行判断.【详解】一是由于某种鸟类的数量庞大,实施普查难度太大,二是研究同一种鸟类的迁徙规律,利用抽样调查即可,无需普查.题型九、总体与样本一、单选题1.(2324高二上·上海·期末)某校有学生1800人,为了解学生的作业负担,学校向学生家长随机抽取了1000人进行调查,其中70%的家长回答他们孩子每天睡眠时间大致在67小时,28%的家长回答他们孩子回家做作业的时间一般在34小时,下列说明正确的是(

).A.总体是1000 B.个体是每一名学生C.样本是1000名学生 D.样本容量是1000【答案】D【分析】根据总体、个体、样本和样本容量的概念依次判断选项即可.【详解】A:总体是1800学生每天睡眠时间和作业时间,故A错误;B:个体是每一名学生每天睡眠时间和作业时间,故B错误;C:样本是1000名学生每天睡眠时间和作业时间,故C错误;D:样本容量是1000,故D正确.故选:D.二、多选题2.(2324高一上·陕西汉中·期末)为了了解参加运动会的1000名运动员的年龄情况,从中抽取了10名运动员的年龄进行统计分析.下列说法中正确的有(

)A.1000名运动员的年龄是总体 B.所抽取的10名运动员是一个样本C.样本容量为10 D.每个运动员被抽到的机会相等【答案】ACD【分析】根据抽样方法,利用总体、样本、样本容量的定义逐项判断作答.【详解】对于A,1000名运动员的年龄是总体,故A正确;对于B,所抽取的10名运动员的年龄是一个样本,故B错误;对于C,样本容量为10,故C正确;对于D,每个运动员被抽到的机会相等,故D正确.故选:ACD.三、填空题3.(2023高二上·上海·专题练习)从含有6件次品的50件产品中任取4件,观察其中次品数,这个试验的样本空间Ω=.【答案】【分析】取出的4件产品中,最多有4件次品,最少是没有次品,由此能求出样本空间.【详解】取出的4件产品中,最多有4件次品,最少是没有次品,所以样本空间.故答案为:.4.(2324高二上·上海长宁·期末)从总体容量为的一批电子元件中抽取一个容量为30的样本,若每个电子元件被抽到的可能性为,则总体容量.【答案】【分析】根据条件列出总体容量和样本容量的关系式,由此可求结果.【详解】由条件可知:,所以,故答案为:.四、解答题5.(2223高一·全国·随堂练习)如果想调查左利手们(指生活中从事主要活动惯用左手的人)对社会公共设施的满意程度,需要调查的总体是什么?你计划如何开展这项调查?【答案】全社会所有的左利手们【分析】利用条件,根据总体的定义及抽样调查即可求出结果.【详解】因为调查的内容为左利手们对社会公共设施的满意程度,故调查的总体是全社会所有的左利手们;可以采取分层抽样调查的方式进行,从全国随机选取若干个城市,同时兼顾大、中、小城市和的比例,然后这些城市再每个城市选取一定数量的左利手人,注意兼顾年龄、人群等,调查其对社会公共设施的满意程度,用样本的调查结果可以大致反映总体的情况.题型十、总体取值规律的估计一、单选题1.(2324高三下·内蒙古锡林郭勒盟·开学考试)为了积极推进国家乡村振兴战略,某示范村不断自主创新,拓宽村民增收渠道,近年来取得了显著成效.据悉该村2023年经济总收入是2022年的2倍,为了更好地了解该村经济收入变化情况,统计了该村两年的经济收入构成比例,得到如图所示的条形图和饼图.则以下说法错误的是(

)A.2023年“种植收入”和2022年“种植收入”一样多B.2023年“养殖收入”与“第三产业收入”之和比2022年的全年总收入还多C.2023年“外出务工收入”是2022年“外出务工收入”的D.2023年“其他收入”比2022年“其他收入”的2倍还多【答案】C【分析】设2022年总收入为m,则2023年总收入为,A选项,分别计算出2022年和2023年种植收入,得到A正确;B选项,计算出,B正确;C选项,分别计算出2022年和2023年外出务工收入,得到C错误;D选项,分别计算出2022年和2023年其他收入,得到D正确.【详解】设2022年总收入为m,则2023年总收入为,对于A,2022年种植收入为,2023年种植收入为,A正确;对于B,2023年养殖收入和第三产业收入之和为,B正确;对于C,2022年外出务工收入为,2023年外出务工收入为,是2022年外出务工收入的,C不正确;对于D,2022年其他收入为,2023年其他收入为,由于,故2023年其他收入比2022年其他收入的2倍还多,D正确.故选:C.2.(2324高三上·安徽亳州·期末)如图所示为某企业员工年龄(岁)的频率分布直方图,从左到右依次为第一组、第二组、……、第五组,若第五组的员工有80人,则第二组的员工人数为(

)A.140 B.240 C.280 D.320【答案】C【分析】根据频率分布直方图的性质,求得的值,进一步计算即可

.【详解】由已知得,所以,因为第五组的员工人数为80,所以第二组的员工人数为.故选:C.二、多选题3.(2024高三下·浙江杭州·专题练习)我国于2015年10月宣布实施普遍二孩政策,为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄群体中随机抽取了容量为200的调查样本,其中城镇户籍与农村户籍各100人;男性120人,女性80人,绘制的不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图如图所示,其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述正确的是(

)A.是否倾向选择生育二胎与户籍有关B.是否倾向选择生育二胎与性别无关C.调查样本中倾向选择生育二胎的群体中,男性人数与女性人数相同D.倾向选择不生育二胎的群体中,农村户籍人数多于城镇户籍人数【答案】AB【分析】根据题中数据结合比例图逐项分析判断.【详解】由不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图,知:在A中,城镇户籍倾向选择生育二胎的比例为,农村户籍倾向选择生育二胎的比例为,所以是否倾向选择生育二胎与户籍有关,故A正确;在B中,男性倾向选择生育二胎的比例为,女性倾向选择生育二胎的比例为,所以是否倾向选择生育二胎与性别无关,故B正确;在C中,男性倾向选择生育二胎的比例为,人数为人,女性倾向选择生育二胎的比例为,人数为人,所以倾向选择生育二胎的人员中,男性人数与女性人数不相同,故C错误;在D中,倾向选择不生育二胎的人员中,农村户籍人数为人,城镇户籍人数为人,所以倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数,故D错误.故选:AB.三、填空题4.(2024高三·全国·专题练习)已知统计某校1000名学生的某次数学水平测试成绩得到样本频率分布直方图如图所示,则直方图中实数a的值是.【答案】0.020【详解】由频率分布直方图的性质,得10(0.005+0.015+a+0.035+0.015+0.010)=1,解得a=0.020.5.(2324高三下·北京海淀·开学考试)某直播间从参与购物的人群中随机选出200人,并将这200人按年龄分组,得到的频率分布直方图如图所示,则在这200人中年龄在的人数,直方图中.【答案】【分析】利用频率分布直方图求出年龄在的频率即可求出;由各小矩形面积和为1求出.【详解】由频率分布直方图知,年龄在的频率为,所以;由于,所以.故答案为:30;0.035四、解答题6.(2324高二下·上海奉贤·阶段练习)某城市100户居民的月平均用电量(单位:度),以分组的频率分布直方图如图:(1)求直方图中的值,并说明在这100户居民中,月平均用电量不低于220度的有多少户?(2)在月平均用电量为的四组居民中,用分层抽样的方法抽取11户居民,则在月平均用电量为的居民中应抽取多少户?【答案】(1);55(2)5【分析】(1)由直方图的性质可得关于的方程,解方程即可;再根据频数的计算公式即可求解月平均用电量不低于220度的用户数;(2)由(1)可得抽取比例,从而可得要抽取的户数.【详解】(1)因直方图中,各组数据频率之和即所有矩形面积之和为1,则,得;月平均用电量为的用户有户月平均用电量为的用户有户月平均用电量为的用户有户月平均用电量为的用户有户所以月平均用电量不低于220度的有户(2)由(1)可知,抽取比例所以月平均用电量在的用户中应抽取户7.(2024·四川成都·二模)2024年1月,某市的高二调研考试首次采用了“”新高考模式.该模式下,计算学生个人总成绩时,“”的学科均以原始分记入,再选的“2”个学科(学生在政治、地理、化学、生物中选修的2科)以赋分成绩记入.赋分成绩的具体算法是:先将该市某再选科目原始成绩按从高到低划分为五个等级,各等级人数所占比例分别约为.依照转换公式,将五个等级的原始分分别转换到五个分数区间,并对所得分数的小数点后一位进行“四舍五入”,最后得到保留为整数的转换分成绩,并作为赋分成绩.具体等级比例和赋分区间如下表:等级比例赋分区间已知该市本次高二调研考试化学科目考试满分为100分.(1)已知转换公式符合一次函数模型,若学生甲、乙在本次考试中化学的原始成绩分别为84,78,转换分成绩为78,71,试估算该市本次化学原始成绩B等级中的最高分.(2)现从该市本次高二调研考试的化学成绩中随机选取100名学生的原始成绩进行分析,其频率分布直方图如图所示,求出图中的值,并用样本估计总体的方法,估计该市本次化学原始成绩等级中的最低分.【答案】(1)90分(2),70分【分析】(1)根据已知条件及待定系数法即可求解;(2)根据已知条件及频率分布直方图的特点即可求解.【详解】(1)设转换公式中转换分关于原始成绩的一次函数关系式为.则,解得,转换分的最高分为85,.解得.故该市本次化学原始成绩B等级中的最高分为90分.(2),.设化学原始成绩等级中的最低分为,综上,化学原始成绩等级中的最低分为70.题型十一、总体百分位数的估计一、单选题1.(2324高二下·广东广州·阶段练习)《“健康中国2030”规划纲要》提出,健康是促进人类全面发展的必然要求,是经济社会发展的基础条件,实现国民健康长寿,是国家富强、民族振兴的重要标志,也是全国各族人民的共同愿望,为普及健康知识,某公益组织为社区居民组织了一场健康知识公益讲座,为了解讲座效果,随机抽取了10位居民在讲座后进行健康知识问卷(百分制),这十位居民的得分情况如下表所示:答题居民序号12345678910得分72836576889065909576则下列说法正确的是(

)A.该10位居民的答卷得分的极差为32B.该10位居民的答卷得分的中位数为79.5C.该10位居民的答卷得分的下四分位数为65D.该10位居民的答卷得分的平均数为79【答案】B【分析】将十位居民的成绩从小到大排列后,根据统计的相关概念计算即可求解答案.【详解】依题意该10位居民的答卷得分从小到大排列为、、、、、、、、、,所以极差为,故A错误;中位数为,故B正确;因为,所以下四分位数为,故C错误;平均数为,故D错误;故选:B.2.(2324高三下·河南·阶段练习)高二年级进行消防知识竞赛,统计所有参赛同学的成绩,成绩都在内,估计所有参赛同学成绩的第75百分位数为(

A.65 B.75 C.85 D.95【答案】C【分析】先利用各矩形的面积之和为1,求得,再利用第75百分位数的定义求解.【详解】因为,所以.参赛成绩位于内的频率为,第75百分位数在内,设为,则,解得,即第75百分位数为85,故选:C.二、多选题3.(2324高二下·湖南长沙·开学考试)某学校组织了一次劳动技能大赛,共有100名学生参赛,经过评判,这100名参赛者的得分都在内,得分60分以下为不及格,其得分的频率分布直方图如图所示(按得分分成,,,,这五组),则下列结论正确的是(

)A.直方图中B.此次比赛得分及格的共有60人C.以频率为概率,从这100名参赛者中随机选取1人,其得分在,的概率为0.75D.这100名参赛者得分的第80百分位数为75【答案】ABD【分析】根据直方图的性质求出,并逐项分析即可可得答案.【详解】对于A,由得,故A正确;对于B,此次比赛得分及格的共有人,故B正确;对于C,以频率为概率,从这100名参赛者中随机选取1人,其得分在的概率为,故C错误;对于D,因为,所以第80百分位数在内,可得这100名参赛者得分的第80百分位数为,故D正确.故选:ABD.三、填空题4.(2324高二下·江苏宿迁·阶段练习)一组数据,,,,,,,,,,,的第百分位数是.【答案】50【分析】将数据按从小到大的顺序排列,根据百分位数的概念以及求法,即可求得答案.【详解】将数据按从小到大的顺序排列为:,,,,,,,,,,,,因为,故第百分位数是,故答案为:505.(2324高二下·四川成都·阶段练习)样本数据13,12,6,7,14,7,10,13的分位数为.【答案】12【分析】首先将数据从小到大排列,再根据百分位数计算规则计算可得.【详解】将样本数据从小到大排列为、、、、、、、,其中,所以分位数为从小到大排列的第个数,即为.故答案为:四、解答题6.(2324高二下·重庆·阶段练习)随机抽取100名男学生,测得他们的身高(单位:cm),按照区间,,,,分组,得到样本身高的频率分布直方图如图所示(1)求这100名男学生身高在170cm及以上的学生人数;(2)估计该校100名学生身高的75%分位数.【答案】(1)60人(2)176.25【分析】(1)根据频率和为1列出方程,可得,进而结合频率公式进行求解即可;(2)先求出,和,的人数占比,可得该校100名生学身高的分位数落在,,进而列出方程即可求解;【详解】(1)由频率分布直方图可知,解得,身高在及以上的学生人数(人;(2),的人数占比为,,的人数占比为,所以该校100名生学身高的分位数落在,,设该校100名生学身高的分位数为,则,解得,故该校100名生学身高的分位数为176.25;题型十二、总体集中趋势的估计一、单选题1.(2024·辽宁葫芦岛·一模)从某班所有同学中随机抽取10人,获得他们某学年参加社区服务次数的数据如下:4,4,4,7,7,8,8,9,9,10,这组数据的众数是(

)A.9 B.8 C.7 D.4【答案】D【分析】借助众数定义即可得.【详解】由数据可知,其中服务次数为4的个数最多,故众数为4.故选:D.2.(2324高三上·浙江绍兴·期末)平均数、中位数和众数都是刻画一组数据的集中趋势的信息,它们的大小关系和数据分布的形态有关.在下图分布形态中,分别对应这组数据的平均数、中位数和众数,则下列关系正确的是(

)A. B.C. D.【答案】C【分析】根据直方图矩形高低以及数据的分布趋势,判断即可得出结论.【详解】众数是最高矩形的中点横坐标,因此众数在第二列的中点处.因为直方图第一、二、三、四列高矩形较多,且在右边拖尾低矩形有三列,所以中位数大于众数,右边拖尾的有三列,所以平均数大于中位数,因此有.故选:C.3.(2024·陕西西安·二模)某教育机构为调查中小学生每日完成作业的时间,收集了某位学生100天每天完成作业的时间,并绘制了如图所示的频率分布直方图(每个区间均为左闭右开),根据此直方图得出了下列结论,其中正确的是(

)A.估计该学生每日完成作业的时间在2小时至2.5小时的有50天B.估计该学生每日完成作业时间超过3小时的概率为0.3C.估计该学生每日完成作业时间的平均数为2.75小时D.估计该学生每日完成作业时间的中位数与平均数相等【答案】C【分析】直接根据直方图来计算判断每一个选项.【详解】对于A:估计该学生每日完成作业的时间在2小时至2.5小时的有天,A错误;对于B:估计该学生每日完成作业时间超过3小时的概率为,B错误;对于C:,C正确;对于D:估计该学生每日完成作业时间的中位数为,则,解得,D错误.故选:C.二、多选题4.(2024·黑龙江吉林·二模)社区卫生服务中心(站)是我国医疗卫生服务和公共卫生应急管理体系的网底,是政府履行提供基本卫生服务职能的平台.社区卫生服务中心(站)可促进社区居民的基本需求(如疫苗接种、基本诊疗等)就近在社区得到解决,图中记录的是从2010年起十二年间我国社区卫生服务中心(站)的个数,根据此图可得关于这十二年间卫生服务中心(站)个数的结论正确的是(

)A.逐年增多 B.中位数为34324C.每年相对于前一年的增量连续增大 D.从2013年到2021年的增幅约6%【答案】ABD【分析】根据题意,利用折线图中的数据,结合数据的变换趋势,中位数、数据差,以及增幅得的计算公式,逐项判定,即可求解.【详解】对于A中,由折线图可得,这十二年减卫生服务中心(站)个数逐年增多,所以A正确;对于B中,由折线图,将数据从小到大排列,共有12个数据,根据中位数的定义和计算,可得,所以B正确;对于C中,由折线图中的数据,可得,,所以C不正确;对于D中,由折线图中的数据,可得从2013年到2021年的增幅约为:,所以D正确.故选:ABD.三、填空题5.(2324高一下·江西·阶段练习)2024年3月1日,某蛋糕店共有10位顾客预订生日蛋糕,他们的年龄按预订的顺序依次是6,12,54,30,8,10,18,24,30,32,则这10位顾客年龄的中位数是.【答案】【分析】利用中位数的定义计算即可.【详解】由题意将顾客的年龄从小到大排列:,则中位数为.故答案为:6.(2024·陕西咸阳·二模)已知总体的各个个体的值由小到大依次为2,4,4,6,a,b,12,14,18,20,且总体的平均值为10.则的最小值为.【答案】/【分析】根据平均数的概念可求的值,再利用不等式可求的最小值.【详解】因为各个个体的值是有小到大排列的,所以,又总体平均值为,所以.所以(当且仅当时取“”).故答案为:四、解答题7.(2324高一下·辽宁朝阳·开学考试)对某校高三年级学生参加社区服务的次数进行统计,随机抽取M名学生,得到这M名学生参加社区服务的次数,根据此数据作出如下频率分布表和频率分布直方图.分组频数频率100.2024nmp20.04合计M1(1)求出表中M,p及图中a的值;(2)若该校有高三学生300人,试估计该校高三学生参加社区服务的次数在区间内的人数;(3)估计该校高三学生参加社区服务次数的众数、中位数及平均数.(保留一位小数)【答案】(1),,(2)144(3),18.1,18.3【分析】(1)借助频数、频率与总数之间的关系计算即可得;(2)以所得频率估计概率计算即可得;(3)借助众数、中位数及平均数的定义计算即可得.【详解】(1)由分组对应的频数是10,频率是0.20,知,所以,所以,解得,所以,;(2)估计该校高三学生参加社区服务的次数在区间内的人数为;(3)估计该校高三学生参加社区服务次数的众数是.因为,所以估计该校高三学生参加社区服务次数的中位数x满足:,解得,所以该校高三学生参加社区服务次数的中位数约为18.1,由,所以估计该校高三学生参加社区服务次数的平均数是18.3.题型十三、总体离散程度的估计一、单选题1.(2024·广东韶关·二模)已知一组数据:12,16,22,24,25,31,33,35,45,若去掉12和45,将剩下的数据与原数据相比,则(

)A.极差不变 B.平均数不变 C.方差不变 D.上四分位数不变【答案】D【分析】根据原数据和现数据的相关数字特征计算即可对选项一一判断.【详解】在这组数据:12,16,22,24,25,31,33,35,45中去掉12和45后,得到16,22,24,25,31,33,35,显然极差由变成了,故A项错误;原平均数为,现平均数为,故B项错误;原方差为,现方差为,显然方差不同,故C项错误;对于D项,由,知原数据的上四分位数是第三个数据22,又由,知现数据的上四分位数是第二个数据22,即D项正确.故选:D.二、多选题2.(2024·吉林延边·一模)今年第5号台风“杜苏芮”于7月28日9时55分在福建晋江登陆,为1949年以来登陆福建的第二强台风,登陆后强度迅速减弱并一路北上影响黄淮、华北,给华北、黄淮等地带来较大范围的特大暴雨.华中地区某市受此次台风影响,最高气温同比有所下降,测得七天的最高气温分别是28,26,25,27,29,27,25(单位:℃),则(

)A.该组数据的极差为4B.该组数据的众数为27C.该组数据的中位数为27D.该组数据的第70百分位数为28【答案】AC【分析】根据极差、众数、中位数和百分位数的定义求解即可.【详解】将这组数据按照从小到大的顺排列得,则该组数据的极差为,故A正确;该组数据的众数为和,故B错误;该组数据的中位数为27,故C正确;因为,所以该组数据的第70百分位数为第个数据,即,故D错误.故选:AC.3.(2024·广东汕头·一模)某次数学考试后,为分析学生的学习情况,某校从某年级中随机抽取了名学生的成绩,整理得到如图所示的频率分布直方图.为进一步分析高分学生的成绩分布情况,计算得到这名学生中,成绩位于内的学生成绩方差为,成绩位于内的同学成绩方差为.则(

)参考公式:样本划分为层,各层的容量、平均数和方差分别为:、、;、、.记样本平均数为,样本方差为,.A.B.估计该年级学生成绩的中位数约为C.估计该年级成绩在分及以上的学生成绩的平均数为D.估计该年级成绩在分及以上的学生成绩的方差为【答案】BCD【分析】利用频率分布直方图中,所有直方图的面积之和为,列等式求出实数的值,可判断A选项;利用中位数的定义可判断B选项;利用总体平均数公式可判断C选项;利用方差公式可判断D选项.【详解】对于A选项,在频率分布直方图中,所有直方图的面积之和为,则,解得,A错;对于B选项,前两个矩形的面积之和为,前三个矩形的面积之和为,设计该年级学生成绩的中位数为,则,根据中位数的定义可得,解得,所以,估计该年级学生成绩的中位数约为,B对;对于C选项,估计成绩在分以上的同学的成绩的平均数为分,C对;对于D选项,估计该年级成绩在分及以上的学生成绩的方差为,D对.故选:BCD.4.(2024·辽宁·一模)下图是样本甲与样本乙的频率分布直方图,下列说法判断正确的是(

A.样本乙的极差一定大于样本甲的极差B.样本乙的众数一定大于样本甲的众数C.样本甲的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论