高一数学下学期考点精讲+精练(人教A版2019必修第二册)第02讲用样本估计总体(原卷版+解析)_第1页
高一数学下学期考点精讲+精练(人教A版2019必修第二册)第02讲用样本估计总体(原卷版+解析)_第2页
高一数学下学期考点精讲+精练(人教A版2019必修第二册)第02讲用样本估计总体(原卷版+解析)_第3页
高一数学下学期考点精讲+精练(人教A版2019必修第二册)第02讲用样本估计总体(原卷版+解析)_第4页
高一数学下学期考点精讲+精练(人教A版2019必修第二册)第02讲用样本估计总体(原卷版+解析)_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第2讲用样本估计总体知识点1频率分布表与频率分布直方图1、频率与频数将一批数据按要求分为若干个小组,各个小组内数据的个数,叫做该组的频数;每组数据的频数除以全体数据的个数的商,叫做该组数据的频率.频率反映各个小组数据在样本量中所占比例的大小.2、样本的频率分布及频率分布表根据随机抽取的样本量的大小,分别计算某一事件出现的频率,这些频率的分布规律(取值状况),就叫做样本的频率分布.为了能直观的显示样本的频率分布情况,通常将样本量、样本中出现该事件的频数以及计算所得的相应频率列在一张表中,这张表叫做频率分布表.分组、频数、频率是频率分布表中最基本也是必要的三列.在实际操作中,每组的频数是通过类似统计选票时的“唱票”的方式进行统计的,所以通常频率分布表中还会有“频数累计”一列.注:①对频率分布表的理解:频率分布表给出了各个区间的频数和频率。由此可以估计这组数的分布情况,样本频率分布是总体分布的一种近似情况.②样本的抽取必须是随机的:用样本频率分布来估计总体分布时,要使样本很好地反映总体的特征,必须随机抽取样本.如果随机抽取另外一个样本量相同的样本,所形成的样本频率分布一般会与前一个样本频率分布有所不同,但是他们都可以近似的估计总体的分布.3、频率分布直方图为了将频率分布表中的结果直观形象地表现出来,常画出频率分布直方图.画图时应以横轴表示分组,纵轴表示各组频率与组距的比值,以各个组距为底,以各频率除以组距的商为高,画成小长方形,这样得到的直方图就是频率分布直方图.①绘制频率分布直方图的步骤(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多.(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数.(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.注:①频数分布直方图的纵坐标是频数,每一组数对应的矩形的高度与频数成正比;频率分布直方图的纵坐标是eq\f(频率,组距),每一组数对应的矩形高度与频率成正比,而且每个矩形的面积等于这一组数对应的频率,所有矩形的面积之和为1.②样本组数、组距与分点的确定:(1)对样本数据进行分组,组距的确定没有固定的标准,组数太多或太少都会影响我们了解数据的分布情况.数据分组的组数与样本量有关,一般样本量越大,所分组数越多,当样本量不超过100时,按照数据的多少,通常分成5~12组,且根据组数=极差/组距来大致确定组数(2)为了实际操作方便,组距的选择应结合极差尽量“取整”,例如极差约为1,组距可以选择0.1的整数倍,比如以0.1或0.2为组距;极差约为10,组距可以选择1的整数倍,比如以1或2为组距;极差约为100,组距可以选择10的整数倍,比如以10或20为组距.如果极差不利于分组,不能被组距整除,可以适当增加极差,如在左右两端各增加适当范围,并尽量使两端增加量相同(3)分点的确定:若数据为整数,则分点数据减去0.5;若数据是小数点后有一位数字的数,则分点数据减去0.05,以此类推.分组时,通常对组内数值所在的区间取左闭右开区间,最后一组取闭区间.知识点2统计图表条形图、折线图及扇形图(1)条形图:建立直角坐标系,用横轴(横轴上的数字)表示样本数据类型,用纵轴上的单位长度表示一定的数量,根据每个样本(或某个范围内的样本)的数量多少画出长短不同的等宽矩形,然后把这些矩形按照一定的顺序排列起来,这样一种表达和分析数据的统计图称为条形图.优点:条形统计图不但可以直观的反映数据分布的大致情况,还可以清晰地表示出各个区间的具体数目,易于比较数据间的差别.缺点:会损失数据的部分信息,且不能明确显示部分与整体的关系.(2)折线图:建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,根据样本值和数量的多少描出相应各点,然后把各点用线段顺次连接,得到一条折线,用这种折线表示出样本数据的情况,这样的一种表示和分析数据的统计图称为折线图.优点:折线统计图不但可以表示数量的多少,还可以通过折线的起伏清楚直观地表示数量的增减变化情况.缺点:折线统计图不能直观反映数据的分布情况,且不适合总体分布较多的情况(3)扇形图:用一个圆表示总体,圆中各扇形分别代表总体中的不同部分,每个扇形的大小反映所表示的那部分占总体的百分比的大小,这样的一种表示和分析数据的统计图称为扇形图.优点:扇形统计图可以很清楚的表示各部分与总体之间的关系,即扇形统计图能清楚地表示出各部分在总体中所占的百分比缺点:会损失数据的部分信息,且不能明确显示部分与整体的关系.知识点3百分位数(1)一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)计算一组几个数据第p百分位数的步骤第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.(3)四分位数即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.知识点4总体集中趋势的估计1.众数、中位数、平均数的理解(1)一组数据中,某个数据出现的次数称为这个数据的频数,出现次数最多的数据称为这组数据的众数.注:如果有几个数据出现的次数相同,并且比其他数据出现的次数都多,那么这几个数据都是这组数据的众数;若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数.(2)如果一组数有奇数个数,且按照从小到大排列后为x1,x2,…,x2n+1,则称xn+1为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为x1,x2,…,x2n,则称eq\f(xn+xn+1,2)为这组数的中位数.(3)如果给定的一组数是x1,x2,…,xn,则这组数的平均数为eq\x\to(x)=eq\f(1,n)(x1+x2+…+xn).众数、中位数、平均数都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.2.众数、中位数、平均数的比较名称优点缺点众数①体现了样本数据的最大集中点;②容易计算①它只能表达样本数据中很少的一部分信息;②无法客观地反映总体的特征中位数①不受少数几个极端数据(即排序靠前或靠后的数据)的影响;②容易计算,便于利用中间数据的信息对极端值不敏感平均数代表性较好,是反映数据集中趋势的量.一般情况下,可以反映出更多的关于样本数据全体的信息任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大知识点5总体离散程度的估计1、方差、标准差的定义一组数据x1,x2,…,xn,用eq\x\to(x)表示这组数据的平均数,则这组数据的方差为=(-),方差可用s2表示,标准差为.如果a,b为常数,则ax1+b,ax2+b,…,axn+b的方差为s2a2.2、总体方差、总体标准差的定义如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为,则称S2=eq\f(1,N)为总体方差,S=eq\r(S2)为总体标准差.如果总体的N个变量值中,不同的值共有k(k≤N)个,记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=eq\f(1,N).3、样本方差、样本标准差的定义如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为,则称为样本方差,s=eq\r(s2)为样本标准差.4、方差、标准差特征(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.(2)标准差、方差的取值范围:[0,+∞).标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.(3)标准差的平方s2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.(4)标准差的单位与样本数据一致.考点一绘制频率分布直方图解题方略:绘制频率分布直方图应注意的2个问题(1)在绘制出频率分布表后,画频率分布直方图的关键就是确定小矩形的高.一般地,频率分布直方图中两坐标轴上的单位长度是不一致的,合理的定高方法是“以一个恰当的单位长度”(没有统一规定),然后以各组的“频率/组距”所占的比例来定高.如我们预先设定以“”为一个单位长度,代表“0.1”,则若一个组的eq\f(频率,组距)为0.2,则该小矩形的高就是“”(占两个单位长度),如此类推.(2)数据要合理分组,组距要选取恰当,一般尽量取整,数据为30~100个左右时,应分成5~12组,在频率分布直方图中,各个小长方形的面积等于各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和为1.【例1】从一群学生中抽取一个一定容量的样本对他们的学习成绩进行分析,已知不超过70分的人数为8,其累计频率为0.4,则这个样本的容量是()A.20 B.40C.70 D.80变式1:将容量为100的样本数据,按由小到大排列分成8个小组,如下表所示:组号12345678频数101314141513129第3组的频率和累积频率为()A.0.14和0.37B.eq\f(1,14)和eq\f(1,27)C.0.03和0.06 D.eq\f(3,14)和eq\f(6,37)变式2:一个容量为80的样本中,数据的最大值为152,最小值为60,组距为10,应将样本数据分为()A.10组 B.9组C.8组 D.7组变式3:某校高三(1)班共有40名学生,他们每天自主学习的时间全部在180分钟到330分钟之间,按他们学习时间的长短分5个组统计,得到如下频率分布表:第一组[180,210)40.10第二组[210,240)8s第三组[240,270)120.30第四组[270,300)100.25第五组[300,330]6t则分布表中s,t的值分别为________,________.变式4:一个农技站为了考察某种大麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度如下(单位:cm):6.56.46.75.85.95.95.24.05.44.65.85.56.06.55.16.55.35.95.55.86.25.45.05.06.86.05.05.76.05.56.86.06.35.55.06.35.26.07.06.46.45.85.95.76.86.66.06.45.77.46.05.46.56.06.85.86.36.06.35.65.36.45.76.76.25.66.06.76.76.05.66.26.15.36.26.86.64.75.75.75.85.37.06.06.05.95.46.05.26.06.35.76.86.14.55.66.36.05.86.3根据上面的数据列出频率分布表,绘制出频率分布直方图,并估计在这块试验田里长度在5.75~6.35cm之间的麦穗所占的百分比.变式5:某中学从高一年级随机抽取50名学生进行智力测验,其得分如下(单位:分):4864528671486441867971688284686462688157905274735678476655645688694073976856675970527944556962583258根据上面的数据,回答下列问题:(1)这次测验成绩的最高分和最低分分别是多少?(2)将区间[30,100]平均分成7个小区间,试列出这50名学生智力测验成绩的频率分布表,进而画出频率分布直方图.考点二频率分布直方图的应用解题方略:频率分布直方图的性质(1)每个小矩形的面积表示样本数据落在该组内的频率.(2)所有小矩形的面积和等于1.(3)利用一组的频数和频率,可以求样本量.【例2】如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为()A.20 B.30C.40 D.50变式1:某厂对一批产品进行抽样检测,如图是抽检产品净重(单位:克)的频率分布直方图,样本数据分组为[76,78),[78,80),…,[84,86].若这批产品有120个,估计其中净重大于或等于78克且小于84克的产品的个数是()A.12 B.18C.25 D.90变式2:如图是某班50名学生期中考试数学成绩的频率分布直方图,其中成绩分组区间是[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x的值等于()A.0.120 B.0.180C.0.012 D.0.018变式3:某工厂对一批元件进行抽样检测.经检测,抽出的元件的长度(单位:mm)全部介于93至105之间.将抽出的元件的长度以2为组距分成6组:[93,95),[95,97),[97,99),[99,101),[101,103),[103,105],得到如图所示的频率分布直方图.若长度在[97,103)内的元件为合格品,根据频率分布直方图,估计这批元件的合格率是()A.80% B.90%C.20% D.85.5%变式4:在样本的频率分布直方图中,某个小长方形的面积是其他小长方形面积之和的eq\f(1,4),已知样本量是80,则该组的频数为()A.20 B.16C.30 D.35变式5:从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:组号分组频数1[0,2)62[2,4)83[4,6)174[6,8)225[8,10)256[10,12)127[12,14)68[14,16)29[16,18]2合计100(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(2)求频率分布直方图中的a,b的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组.变式6:某电子商务公司对10000名网络购物者2019年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________人.考点三统计图【例3】某地农村2004年到2019年间人均居住面积的统计图如图所示,则增长最多的5年为()A.2004年~2009年 B.2009年~2014年C.2014年~2019年 D.无法从图中看出变式1:甲、乙两个城市2019年4月中旬,每天的最高气温统计图如图所示,这9天里,气温比较稳定的城市是________.变式2:观察下图所示的统计图,下列结论正确的是()A.甲校女生比乙校女生多B.乙校男生比甲校男生少C.乙校女生比甲校男生少D.甲、乙两校女生人数无法比较变式3:如图是根据某中学为地震灾区捐款的情况而制作的统计图.已知该校在校学生3000人,根据统计图计算该校共捐款________元.考点四总体百分位数的估计解题方略:总体百分位数估计需要注意的两个问题(1)总体百分位估计的基础是样本百分位数的计算,因此计算准确是关键;(2)由于样本量比较少,因此对总体的估计可能存在误差,因此对总体百分位数的估计一般是估计值而非精确值.【例4】900,920,920,930,930的20%分位数是________.变式1:5,6,7,8,9,10,11,12,13,14的25%分位数为________,75%分位数为________,90%分位数为________.变式2:为了解毕业生工作情况,某高校对12名应届毕业生起始月薪作了统计如下:毕业生起始月薪毕业生起始月薪123456285029503050288027552710789101112289031302940332529202880则第85百分位数是________.变式3:考察某校高二年级男生的身高,随机抽取40名高二男生,实测身高数据(单位:cm)如下:171163163166166168168160168165171169167169151168170160168174165168174159167156157164169180176157162161158164163163167161请估计该校高二年级男生身高的第25,50,75百分位数.考点五众数、中位数、平均数的计算解题方略:平均数、众数、中位数的计算方法平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.【例5】下列说法中,不正确的是()A.数据2,4,6,8的中位数是4,6B.数据1,2,2,3,4,4的众数是2,4C.一组数据的平均数、众数、中位数有可能是同一个数据D.8个数据的平均数为5,另3个数据的平均数为7,则这11个数据的平均数是eq\f(8×5+7×3,11)变式1:抽样调查了某班30位女生所穿鞋子的尺码,数据如下(单位:码).在这组数据的平均数、中位数和众数中,鞋厂最感兴趣的是()码号3334353637人数761511A.平均数 B.中位数C.众数 D.无法确定变式2:有13位同学参加学校组织的才艺表演比赛,已知他们所得的分数互不相同,共设7个获奖名额,某同学知道自己的比赛分数后,要判断自己能否获奖,在这13名同学成绩的统计量中只需知道一个量,它是__________(填“众数”“中位数”或“平均数”).【例6】某班50名学生的一次安全知识竞赛成绩分布如表所示:(满分10分)成绩(分)012345678910人数(人)0001013561915这次安全知识竞赛成绩的众数是()A.5分 B.6分C.9分 D.10分变式1:某校举行“社会主义核心价值观”演讲比赛,学校对30名参赛选手的成绩进行了分组统计,结果如下表:分数x(分)4≤x<55≤x<66≤x<77≤x<88≤x<99≤x<10频数268554由上可知,参赛选手分数的中位数所在的分数段为()A.5≤x<6 B.6≤x<7C.7≤x<8 D.8≤x<9变式2:假期里小菲和小琳结伴去超市买水果,三次购买的草莓价格和数量如下表,从平均价格看,买得比较划算的是()价格/(元/kg)12108合计/kg小菲购买的数量/kg2226小琳购买的数量/kg1236A.一样划算 B.小菲划算C.小琳划算 D.无法比较变式3:某市4月份日平均气温统计图情况如图所示,则在日平均气温这组数据中,众数和中位数分别是()A.13,13 B.13,13.5C.13,14 D.16,13变式4:某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各1人,则该小组成绩的平均数、众数、中位数分别是()A.85分,85分,85分 B.87分,85分,86分C.87分,85分,85分 D.87分,85分,90分变式5:统计学校排球队员的年龄,发现有12、13、14、15等四种年龄,统计结果如下表:年龄(岁)12131415人数(个)2468根据表中信息可以判断该排球队员年龄的平均数、众数、中位数分别为()A.13,15,14 B.14,15,14C.13.5,15,14 D.15,15,15变式6:某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):甲群:13,13,14,15,15,15,15,16,17,17;乙群:54,3,4,4,5,6,6,6,6,56.(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?变式6:如果5个数x1,x2,x3,x4,x5的平均数是7,那么x1+1,x2+1,x3+1,x4+1,x5+1这5个数的平均数是()A.5 B.6C.7 D.8变式7:某企业三个分厂生产同一种电子产品,三个分厂的产量分布如图所示.现在用分层抽样方法从三个分厂生产的产品中共抽取100件进行使用寿命的测试,则第一分厂应抽取的件数为________件;测试结果为第一、二、三分厂取出的产品的平均使用寿命分别为1020小时,980小时,1030小时,估计这个企业生产的产品的平均使用寿命为________小时.考点六总体集中趋势的估计解题方略:用频率分布直方图估计众数、中位数、平均数(1)众数:取最高小长方形底边中点的横坐标作为众数.(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x轴交点的横坐标称为中位数.(3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.【例7】某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.(1)求这次测试数学成绩的众数、中位数、平均分;(2)估计该校参加高二年级学业水平测试的学生的众数、中位数和平均数.变式1:为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图,则:(1)这20名工人中一天生产该产品的数量在[55,75)的人数是________;(2)这20名工人中一天生产该产品的数量的中位数为________;(3)这20名工人中一天生产该产品的数量的平均数为________.变式2:某学校对100间学生公寓的卫生情况进行综合评比,考核分数分为A,B,C,D四个等级,其中分数在[60,70)内为D等级,分数在[70,80)内为C等级,分数在[80,90)内为B等级,分数在[90,100]内为A等级.考核评估后,得其频率分布折线图如图所示,估计这100间学生公寓评估得分的平均数是()A.80.25 B.80.45C.80.5 D.80.65考点七标准差、方差、极差的计算解题方略:计算标准差的5步骤(1)求出样本数据的平均数eq\x\to(x).(2)求出每个样本数据与样本平均数的差xi-eq\x\to(x)(i=1,2,…,n).(3)求出xi-eq\x\to(x)(i=1,2,…,n)的平方值.(4)求出上一步中n个平方值的平均数,即为样本方差.(5)求出上一步中平均数的算术平方根,即为样本标准差.【例8】甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差变式1:某高三学生在连续五次月考中的数学成绩(单位:分)为:90,90,93,94,93,则该学生在这五次月考中数学成绩数据的平均数和方差分别为()A.92,2.8 B.92,2C.93,2 D.93,2.8变式2:一农场在同一块稻田中种植一种水稻,其连续8年的产量(单位:kg)如下:450,430,460,440,450,440,470,460,则该组数据的方差为________.变式3:某班20位女同学平均分为甲、乙两组,她们的劳动技术课考试成绩如下(单位:分):甲组:60,90,85,75,65,70,80,90,95,80;乙组:85,95,75,70,85,80,85,65,90,85.试分别计算两组数据的极差、方差和标准差.【例9】样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均数为1,则样本方差为()A.eq\r(\f(6,5))B.eq\f(6,5)C.eq\r(2)D.2变式1:一组样本数据a,3,5,7的平均数是b,且a,b是方程x2-5x+4=0的两根,则这个样本的方差是()A.3 B.4C.5 D.6变式2:小明5次上学途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x-y|的值为________.变式3:已知一组正数x1,x2,x3,x4的方差s2=eq\f(1,4)(xeq\o\al(2,1)+xeq\o\al(2,2)+xeq\o\al(2,3)+xeq\o\al(2,4)-16),则数据x1+2,x2+2,x3+2,x4+2的平均数为________.变式4:已知总体的各个个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,21,且总体的中位数为10,若要使该总体的方差最小,则ab=________.考点八总体离散程度的估计解题方略:研究两个样本的波动情况或比较它们的稳定性、可靠性等性能好坏的这类题,先求平均数,比较一下哪一个更接近标准,若平均数相等,则再比较两个样本方差的大小来作出判断.【例10】为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,xn的平均数B.x1,x2,…,xn的标准差C.x1,x2,…,xn的最大值D.x1,x2,…,xn的中位数变式1:北京市2017年12个月的PM2.5平均浓度指数如图所示.由图判断,四个季度中PM2.5的平均浓度指数方差最小的是()A.第一季度 B.第二季度C.第三季度 D.第四季度【例11】研究两个样本的波动情况或比较它们的稳定性、可靠性等性能好坏的这类题,先求平均数,比较一下哪一个更接近标准,若平均数相等,则再比较两个样本方差的大小来作出判断.甲、乙两名战士在相同条件下各打靶10次,每次命中的环数分别是:甲:8,6,7,8,6,5,9,10,4,7;乙:6,7,7,8,6,7,8,7,9,5.(1)分别计算以上两组数据的平均数;(2)分别求出两组数据的方差;(3)根据计算结果,估计两名战士的射击情况.若要从这两人中选一人参加射击比赛,选谁去合适?变式1:甲、乙两机床同时加工直径为100cm的零件,为检验质量,从中抽取6件,测量数据为:甲:9910098100100103乙:9910010299100100(1)分别计算两组数据的平均数及方差;(2)根据计算说明哪台机床加工零件的质量更稳定.练习一绘制频率分布直方图1、一个容量为32的样本,已知某组样本的频率为0.125,则该组样本的频数为()A.2 B.4C.6 D.82、某班学生在一次数学考试中各分数段以及人数的成绩分布为:[0,80),2人;[80,90),6人;[90,100),4人;[100,110),10人;[110,120),12人;[120,130),5人;[130,140),4人;[140,150],2人.那么分数在[100,130)中的频数以及频率分别为()A.27,0.56 B.20,0.56C.27,0.60 D.13,0.293、某班50名同学参加数学测验,成绩的分组及各组的频数如下:[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.(1)列出样本的频率分布表;(2)画出频率分布直方图.4、为了了解某片经济林的生长情况,随机测量其中的100棵树的底部周长,得到如下数据(单位:cm):135981021109912111096100103125971171131109210210910411210912487131971021231041041281051231111031059211410810410212912697100115111106117104109111891101218012012110410811812999909912112310711191100991011169710210810195107101102108117991181061199712610812311998121101113102103104108(1)列出频率分布表;(2)画出频率分布直方图及频率折线图;(3)估计该片经济林中底部周长小于100cm的树占多少,底部周长不小于120cm的树占多少.练习二频率分布直方图的应用1、200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,时速在[50,60)内的汽车有()A.30辆B.40辆C.60辆D.80辆2、某车站在春运期间为了了解旅客购票情况,随机抽样调查了100名旅客从开始在售票窗口排队到购到车票所用的时间t(以下简称为购票用时,单位为min),下面是这次调查统计分析得到的频率分布表和频率分布直方图(如图所示).分组频数频率一组0≤t<500二组5≤t<10100.10三组10≤t<1510②四组15≤t<20①0.50五组20≤t≤25300.30合计1001.00解答下列问题:(1)这次抽样的样本量是多少?(2)在表中填写出缺失的数据并补全频率分布直方图;(3)旅客购票用时的平均数可能落在哪一组?练习三统计图1、【多选】比较甲、乙两名学生的数学学科素养的各项能力指标值(满分为5分,分值高者为优),绘制了如图所示的六维能力雷达图,例如图中甲的数学抽象指标值为4,乙的数学抽象指标值为5,则下面叙述正确的是()A.甲的逻辑推理能力指标值优于乙的逻辑推理能力指标值B.甲的数学建模能力指标值优于乙的直观想象能力指标值C.乙的六维能力指标值整体水平优于甲的六维能力指标值整体水平D.甲的数学运算能力指标值优于甲的直观想象能力指标值2、【多选】2018年11月~2019年11月某工厂工业原油产量的月度走势图如图所示,则以下说法错误的是()A.2019年11月份原油产量约为51.8万吨B.2019年11月份原油产量相对2018年11月增加1.0%C.2019年11月份原油产量比上月减少54.9万吨D.2019年1~11月份原油的总产量不足15000万吨练习四总体百分位数的估计1、某中学甲、乙两名同学最近几次的数学考试成绩情况如下:甲的得分:95,81,75,89,71,65,76,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,101.则甲得分的第50百分位数为________;乙得分的第75百分位数为_______.2、某良种培育基地正在培育一种小麦新品种A,将其种植了25亩,所得亩产数据(单位:千克)如下:421,399,445,359,415,443,367,454,368,375,392,400,423,405,412,427,414,423,430,388,430,357,434,445,451试估计该品种小麦亩产的第80,95百分位数.3、调查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下:171163163166166168168160168165171169167169151168170168160174165168174159167156157164169180176157162161158164163163167161试估计该校高三年级男生的身高数据的30%分位数.练习五众数、中位数、平均数的计算1、某医院急救中心随机抽取20位病人等待急诊的时间记录如下表:等待时间(分钟)[0,5)[5,10)[10,15)[15,20)[20,25]频数48521用上述分组资料计算出病人平均等待时间的估计值eq\x\to(x)=________.2、若有一个企业,70%的员工年收入1万元,25%的员工年收入3万元,5%的员工年收入11万元,则该企业员工的年收入的平均数是________万元,中位数是________万元,众数是________万元.3、10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有()A.a>b>c B.b>c>aC.c>a>b D.c>b>a4、甲、乙、丙三个家电厂家在广告中都声称,他们的某品牌节能灯在正确使用的情况下,使用寿命都不低于8年.后来质量检测部门对他们的产品进行抽查,抽查的各8个产品使用寿命的统计结果如下(单位:年):甲厂:6,6,6,8,8,9,9,12;乙厂:6,7,7,7,9,10,10,12;丙厂:6,8,8,8,9,9,10,10.(1)把以上三组数据的平均数、众数、中位数填入下表:平均数众数中位数甲厂乙厂丙厂(2)估计这三个厂家的推销广告分别利用了哪一种统计量;(3)如果你是顾客,应该选哪个厂家的节能灯?为什么?5、某中学开展演讲比赛活动,高一(1)、高一(2)班根据初赛成绩各选出5名选手参加复赛,两个班各选出的5名选手的复赛成绩(满分为100分)如下图所示.(1)根据上图填写下表:平均分(分)中位数(分)众数(分)高一(1)班8585高一(2)班8580(2)结合两班复赛成绩的平均数和中位数,分析哪个班级的复赛成绩较好;(3)如果在每班参加复赛的选手中分别选出2人参加决赛,你认为哪个班的实力更强一些?说明理由.6、在喜迎“中华人民共和国成立70周年”之际,某校举办校园唱红歌比赛,选出10名同学担任评委,并事先拟定从如下四种方案中选择合理方案来确定演唱者的最后得分(每个评委打分最高10分).方案1:所有评委给分的平均分;方案2:在所有评委中,去掉一个最高分和一个最低分,再计算剩余评委的平均分;方案3:所有评委给分的中位数;方案4:所有评委给分的众数.为了探究上述方案的合理性,先对某个同学的演唱成绩进行统计实验,下图是这个同学的得分统计图:(1)分别按上述四种方案计算这个同学演唱的最后得分;(2)根据(1)中的结果,请用统计的知识说明哪些方案不适合作为这个同学演唱的最后得分?练习六总体集中趋势的估计1、某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.求:(1)高一参赛学生的成绩的众数、中位数;(2)高一参赛学生的平均成绩.练习七标准差、方差、极差的计算1、某班有48名学生,在一次考试中统计出平均分为70分,方差为75,后来发现有2名同学的分数登记错了,甲实得80分,却记了50分,乙实得70分,却记了100分,更正后平均分和方差分别是________,________.2、若一个样本量为8的样本的平均数为5,方差为2.现样本中又加入一个新数据5,此时样本量为9,平均数为eq\x\to(x),方差为s2,则()A.eq\x\to(x)=5,s2<2 B.eq\x\to(x)=5,s2>2C.eq\x\to(x)>5,s2<2 D.eq\x\to(x)>5,s2>23、某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其平均数和方差分别为eq\x\to(x)和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的平均数和方差分别为()A.eq\x\to(x),s2+1002 B.eq\x\to(x)+100,s2+1002C.eq\x\to(x),s2 D.eq\x\to(x)+100,s24、某工厂36名工人的年龄数据如下表:工人编号年龄工人编号年龄工人编号年龄工人编号年龄140103619272834244113120432939340123821413043441133922373138533144323343242640154524423353745163925373437842173826443549943183627423639(1)用随机数法抽取一个容量为9的样本,并且第一次随机抽到的年龄数据为44,列出样本的年龄数据;(2)计算(1)中样本的均值eq\x\to(x)和方差s2;(3)36名工人中年龄在eq\x\to(x)-s与eq\x\to(x)+s之间有多少人?所占的百分比是多少(精确到0.01%)?练习八总体离散程度的估计1、甲、乙两名同学6次考试的成绩统计如图所示,甲、乙两组数据的平均数分别为eq\x\to(x)甲,eq\x\to(x)乙,标准差分别为s甲,s乙,则()A.eq\x\to(x)甲<eq\x\to(x)乙,s甲<s乙 B.eq\x\to(x)甲<eq\x\to(x)乙,s甲>s乙C.eq\x\to(x)甲>eq\x\to(x)乙,s甲<s乙 D.eq\x\to(x)甲>eq\x\to(x)乙,s甲>s乙2、对甲、乙两名同学的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:甲6080709070乙8060708075(1)甲、乙的平均成绩谁最好?(2)谁的各门功课发展较平衡?3、从甲、乙两种玉米的苗中各抽10株,分别测它们的株高如下(单位:cm):甲:25,41,40,37,22,14,19,39,21,42;乙:27,16,44,27,44,16,40,40,16,40.问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?4、甲、乙两人参加某体育项目训练,近期的五次测试成绩(单位:分)如图所示:(1)分别求出甲、乙两人成绩的平均数与方差;(2)根据(1)的结果,对两人的成绩作出评价.5、甲、乙两人在相同的条件下各射靶10次,每次射靶成绩(单位:环)如图所示:(1)填写下表:平均数中位数命中9环以上甲7________1乙________________3(2)请从四个不同的角度对这次测试进行分析:①结合平均数和方差,分析偏离程度;②结合平均数和中位数,分析谁的成绩好些;③结合平均数和命中9环以上的次数,看谁的成绩好些;④结合折线图上两人射击命中环数及走势,分析谁更有潜力.第2讲用样本估计总体知识点1频率分布表与频率分布直方图1、频率与频数将一批数据按要求分为若干个小组,各个小组内数据的个数,叫做该组的频数;每组数据的频数除以全体数据的个数的商,叫做该组数据的频率.频率反映各个小组数据在样本量中所占比例的大小.2、样本的频率分布及频率分布表根据随机抽取的样本量的大小,分别计算某一事件出现的频率,这些频率的分布规律(取值状况),就叫做样本的频率分布.为了能直观的显示样本的频率分布情况,通常将样本量、样本中出现该事件的频数以及计算所得的相应频率列在一张表中,这张表叫做频率分布表.分组、频数、频率是频率分布表中最基本也是必要的三列.在实际操作中,每组的频数是通过类似统计选票时的“唱票”的方式进行统计的,所以通常频率分布表中还会有“频数累计”一列.注:①对频率分布表的理解:频率分布表给出了各个区间的频数和频率。由此可以估计这组数的分布情况,样本频率分布是总体分布的一种近似情况.②样本的抽取必须是随机的:用样本频率分布来估计总体分布时,要使样本很好地反映总体的特征,必须随机抽取样本.如果随机抽取另外一个样本量相同的样本,所形成的样本频率分布一般会与前一个样本频率分布有所不同,但是他们都可以近似的估计总体的分布.3、频率分布直方图为了将频率分布表中的结果直观形象地表现出来,常画出频率分布直方图.画图时应以横轴表示分组,纵轴表示各组频率与组距的比值,以各个组距为底,以各频率除以组距的商为高,画成小长方形,这样得到的直方图就是频率分布直方图.①绘制频率分布直方图的步骤(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多.(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数.(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.注:①频数分布直方图的纵坐标是频数,每一组数对应的矩形的高度与频数成正比;频率分布直方图的纵坐标是eq\f(频率,组距),每一组数对应的矩形高度与频率成正比,而且每个矩形的面积等于这一组数对应的频率,所有矩形的面积之和为1.②样本组数、组距与分点的确定:(1)对样本数据进行分组,组距的确定没有固定的标准,组数太多或太少都会影响我们了解数据的分布情况.数据分组的组数与样本量有关,一般样本量越大,所分组数越多,当样本量不超过100时,按照数据的多少,通常分成5~12组,且根据组数=极差/组距来大致确定组数(2)为了实际操作方便,组距的选择应结合极差尽量“取整”,例如极差约为1,组距可以选择0.1的整数倍,比如以0.1或0.2为组距;极差约为10,组距可以选择1的整数倍,比如以1或2为组距;极差约为100,组距可以选择10的整数倍,比如以10或20为组距.如果极差不利于分组,不能被组距整除,可以适当增加极差,如在左右两端各增加适当范围,并尽量使两端增加量相同(3)分点的确定:若数据为整数,则分点数据减去0.5;若数据是小数点后有一位数字的数,则分点数据减去0.05,以此类推.分组时,通常对组内数值所在的区间取左闭右开区间,最后一组取闭区间.知识点2统计图表条形图、折线图及扇形图(1)条形图:建立直角坐标系,用横轴(横轴上的数字)表示样本数据类型,用纵轴上的单位长度表示一定的数量,根据每个样本(或某个范围内的样本)的数量多少画出长短不同的等宽矩形,然后把这些矩形按照一定的顺序排列起来,这样一种表达和分析数据的统计图称为条形图.优点:条形统计图不但可以直观的反映数据分布的大致情况,还可以清晰地表示出各个区间的具体数目,易于比较数据间的差别.缺点:会损失数据的部分信息,且不能明确显示部分与整体的关系.(2)折线图:建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,根据样本值和数量的多少描出相应各点,然后把各点用线段顺次连接,得到一条折线,用这种折线表示出样本数据的情况,这样的一种表示和分析数据的统计图称为折线图.优点:折线统计图不但可以表示数量的多少,还可以通过折线的起伏清楚直观地表示数量的增减变化情况.缺点:折线统计图不能直观反映数据的分布情况,且不适合总体分布较多的情况(3)扇形图:用一个圆表示总体,圆中各扇形分别代表总体中的不同部分,每个扇形的大小反映所表示的那部分占总体的百分比的大小,这样的一种表示和分析数据的统计图称为扇形图.优点:扇形统计图可以很清楚的表示各部分与总体之间的关系,即扇形统计图能清楚地表示出各部分在总体中所占的百分比缺点:会损失数据的部分信息,且不能明确显示部分与整体的关系.知识点3百分位数(1)一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)计算一组几个数据第p百分位数的步骤第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.(3)四分位数即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.知识点4总体集中趋势的估计1.众数、中位数、平均数的理解(1)一组数据中,某个数据出现的次数称为这个数据的频数,出现次数最多的数据称为这组数据的众数.注:如果有几个数据出现的次数相同,并且比其他数据出现的次数都多,那么这几个数据都是这组数据的众数;若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数.(2)如果一组数有奇数个数,且按照从小到大排列后为x1,x2,…,x2n+1,则称xn+1为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为x1,x2,…,x2n,则称eq\f(xn+xn+1,2)为这组数的中位数.(3)如果给定的一组数是x1,x2,…,xn,则这组数的平均数为eq\x\to(x)=eq\f(1,n)(x1+x2+…+xn).众数、中位数、平均数都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.2.众数、中位数、平均数的比较名称优点缺点众数①体现了样本数据的最大集中点;②容易计算①它只能表达样本数据中很少的一部分信息;②无法客观地反映总体的特征中位数①不受少数几个极端数据(即排序靠前或靠后的数据)的影响;②容易计算,便于利用中间数据的信息对极端值不敏感平均数代表性较好,是反映数据集中趋势的量.一般情况下,可以反映出更多的关于样本数据全体的信息任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大知识点5总体离散程度的估计1、方差、标准差的定义一组数据x1,x2,…,xn,用eq\x\to(x)表示这组数据的平均数,则这组数据的方差为=(-),方差可用s2表示,标准差为.如果a,b为常数,则ax1+b,ax2+b,…,axn+b的方差为s2a2.2、总体方差、总体标准差的定义如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为,则称S2=eq\f(1,N)为总体方差,S=eq\r(S2)为总体标准差.如果总体的N个变量值中,不同的值共有k(k≤N)个,记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=eq\f(1,N).3、样本方差、样本标准差的定义如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为,则称为样本方差,s=eq\r(s2)为样本标准差.4、方差、标准差特征(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.(2)标准差、方差的取值范围:[0,+∞).标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.(3)标准差的平方s2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.(4)标准差的单位与样本数据一致.考点一绘制频率分布直方图解题方略:绘制频率分布直方图应注意的2个问题(1)在绘制出频率分布表后,画频率分布直方图的关键就是确定小矩形的高.一般地,频率分布直方图中两坐标轴上的单位长度是不一致的,合理的定高方法是“以一个恰当的单位长度”(没有统一规定),然后以各组的“频率/组距”所占的比例来定高.如我们预先设定以“”为一个单位长度,代表“0.1”,则若一个组的eq\f(频率,组距)为0.2,则该小矩形的高就是“”(占两个单位长度),如此类推.(2)数据要合理分组,组距要选取恰当,一般尽量取整,数据为30~100个左右时,应分成5~12组,在频率分布直方图中,各个小长方形的面积等于各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和为1.【例1】从一群学生中抽取一个一定容量的样本对他们的学习成绩进行分析,已知不超过70分的人数为8,其累计频率为0.4,则这个样本的容量是()A.20 B.40C.70 D.80【解析】由已知不超过70分的人数为8,累计频率为0.4,则这个样本量n=eq\f(8,0.4)=20.故选A.变式1:将容量为100的样本数据,按由小到大排列分成8个小组,如下表所示:组号12345678频数101314141513129第3组的频率和累积频率为()A.0.14和0.37B.eq\f(1,14)和eq\f(1,27)C.0.03和0.06 D.eq\f(3,14)和eq\f(6,37)【解析】由表可知,第三小组的频率为eq\f(14,100)=0.14,累积频率为eq\f(10+13+14,100)=0.37.故选A.变式2:一个容量为80的样本中,数据的最大值为152,最小值为60,组距为10,应将样本数据分为()A.10组 B.9组C.8组 D.7组【解析】由题意知,eq\f(152-60,10)=9.2,故应分成10组.变式3:某校高三(1)班共有40名学生,他们每天自主学习的时间全部在180分钟到330分钟之间,按他们学习时间的长短分5个组统计,得到如下频率分布表:第一组[180,210)40.10第二组[210,240)8s第三组[240,270)120.30第四组[270,300)100.25第五组[300,330]6t则分布表中s,t的值分别为________,________.【解析】s=eq\f(8,40)=0.2,t=1-0.1-s-0.3-0.25=0.15.答案:0.200.15变式4:一个农技站为了考察某种大麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度如下(单位:cm):6.56.46.75.85.95.95.24.05.44.65.85.56.06.55.16.55.35.95.55.86.25.45.05.06.86.05.05.76.05.56.86.06.35.55.06.35.26.07.06.46.45.85.95.76.86.66.06.45.77.46.05.46.56.06.85.86.36.06.35.65.36.45.76.76.25.66.06.76.76.05.66.26.15.36.26.86.64.75.75.75.85.37.06.06.05.95.46.05.26.06.35.76.86.14.55.66.36.05.86.3根据上面的数据列出频率分布表,绘制出频率分布直方图,并估计在这块试验田里长度在5.75~6.35cm之间的麦穗所占的百分比.【解析】(1)计算极差:7.4-4.0=3.4.(2)决定组距与组数:若取组距为0.3,因为eq\f(3.4,0.3)≈11.3,需分为12组,组数合适,所以取组距为0.3,组数为12.(3)决定分点:使分点比数据多一位小数,并且把第1小组的起点稍微减小一点,那么所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55.(4)列频率分布表:分组频数频率[3.95,4.25)10.01[4.25,4.55)10.01[4.55,4.85)20.02[4.85,5.15)50.05[5.15,5.45)110.11[5.45,5.75)150.15[5.75,6.05)280.28[6.05,6.35)130.13[6.35,6.65)110.11[6.65,6.95)100.10[6.95,7.25)20.02[7.25,7.55]10.01合计1001.00(5)绘制频率分布直方图如图.从表中看到,样本数据落在5.75~6.35之间的频率是0.28+0.13=0.41,于是可以估计,在这块试验田里长度在5.75~6.35cm之间的麦穗约占41%.变式5:某中学从高一年级随机抽取50名学生进行智力测验,其得分如下(单位:分):4864528671486441867971688284686462688157905274735678476655645688694073976856675970527944556962583258根据上面的数据,回答下列问题:(1)这次测验成绩的最高分和最低分分别是多少?(2)将区间[30,100]平均分成7个小区间,试列出这50名学生智力测验成绩的频率分布表,进而画出频率分布直方图.【解析】(1)这次测验成绩的最低分是32分,最高分是97分.(2)根据题意,列出样本的频率分布表如下:分组频数频率[30,40)10.02[40,50)60.12[50,60)120.24[60,70)140.28[70,80)90.18[80,90)60.12[90,100]20.04合计501.00频率分布直方图如图所示.考点二频率分布直方图的应用解题方略:频率分布直方图的性质(1)每个小矩形的面积表示样本数据落在该组内的频率.(2)所有小矩形的面积和等于1.(3)利用一组的频数和频率,可以求样本量.【例2】如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为()A.20 B.30C.40 D.50【解析】样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.故选B.变式1:某厂对一批产品进行抽样检测,如图是抽检产品净重(单位:克)的频率分布直方图,样本数据分组为[76,78),[78,80),…,[84,86].若这批产品有120个,估计其中净重大于或等于78克且小于84克的产品的个数是()A.12 B.18C.25 D.90【解析】净重大于或等于78克且小于84克的频率为(0.100+0.150+0.125)×2=0.75,所以在该范围内的产品个数为120×0.75=90.故选D.变式2:如图是某班50名学生期中考试数学成绩的频率分布直方图,其中成绩分组区间是[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x的值等于()A.0.120 B.0.180C.0.012 D.0.018【解析】由图可知纵坐标表示频率/组距,故x=0.1-0.054-0.010-0.006×3=0.018.故选D.变式3:某工厂对一批元件进行抽样检测.经检测,抽出的元件的长度(单位:mm)全部介于93至105之间.将抽出的元件的长度以2为组距分成6组:[93,95),[95,97),[97,99),[99,101),[101,103),[103,105],得到如图所示的频率分布直方图.若长度在[97,103)内的元件为合格品,根据频率分布直方图,估计这批元件的合格率是()A.80% B.90%C.20% D.85.5%【解析】由频率分布直方图可知元件长度在[97,103)内的频率为1-(0.0275+0.0275+0.0450)×2=0.8,故这批元件的合格率为80%.故选A.变式4:在样本的频率分布直方图中,某个小长方形的面积是其他小长方形面积之和的eq\f(1,4),已知样本量是80,则该组的频数为()A.20 B.16C.30 D.35【解析】设该组的频数为x,则其他组的频数之和为4x,由样本量是80,得x+4x=80,解得x=16,即该组的频数为16.故选B.变式5:从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:组号分组频数1[0,2)62[2,4)83[4,6)174[6,8)225[8,10)256[10,12)127[12,14)68[14,16)29[16,18]2合计100(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(2)求频率分布直方图中的a,b的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组.【解析】(1)根据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10(名),所以样本中的学生一周课外阅读时间少于12小时的频率是1-eq\f(10,100)=0.9.故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0.9.(2)课外阅读时间落在[4,6)组内的有17人,频率为0.17,所以a=eq\f(频率,组距)=eq\f(0.17,2)=0.085.课外阅读时间落在[8,10)组内的有25人,频率为0.25,所以b=eq\f(频率,组距)=eq\f(0.25,2)=0.125.(3)同一组中的每个数据用该组区间的中点值代替,则数据的平均数为:1×0.06+3×0.08+5×0.17+7×0.22+9×0.25+11×0.12+13×0.06+15×0.02+17×0.02=7.68(小时)所以样本中的100名学生该周课外阅读时间的平均数在第4组.变式6:某电子商务公司对10000名网络购物者2019年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________人.【解析】(1)由0.1×1.5+0.1×2.5+0.1a+0.1×2.0+0.1×0.8+0.1×0.2=1,解得a=3.(2)区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故[0.5,0.9]内的频率为1-0.4=0.6.因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10000=6000(人).答案:(1)3(2)6000考点三统计图【例3】某地农村2004年到2019年间人均居住面积的统计图如图所示,则增长最多的5年为()A.2004年~2009年 B.2009年~2014年C.2014年~2019年 D.无法从图中看出【解析】2004年~2009年的增长量为3.1,2009年~2014年的增长量为3.2,2014年~2019年的增长量为3.8.故选C.变式1:甲、乙两个城市2019年4月中旬,每天的最高气温统计图如图所示,这9天里,气温比较稳定的城市是________.【解析】从折线统计图中可以很清楚的看到乙城市的气温变化较大,而甲城市气温相对来说较稳定,变化基本不大.答案:甲变式2:观察下图所示的统计图,下列结论正确的是()A.甲校女生比乙校女生多B.乙校男生比甲校男生少C.乙校女生比甲校男生少D.甲、乙两校女生人数无法比较【解析】图中数据只是百分比,甲、乙两个学校的学生人数不知道,因此男生、女生的具体人数也无法得知.故选D.变式3:如图是根据某中学为地震灾区捐款的情况而制作的统计图.已知该校在校学生3000人,根据统计图计算该校共捐款________元.【解析】根据统计图,得高一人数为3000×32%=960(人),捐款960×15=14400(元);高二人数为3000×33%=990(人),捐款990×13=12870(元);高三人数为3000×35%=1050(人),捐款1050×10=10500(元).所以该校学生共捐款14400+12870+10500=37770(元).答案:37770考点四总体百分位数的估计解题方略:总体百分位数估计需要注意的两个问题(1)总体百分位估计的基础是样本百分位数的计算,因此计算准确是关键;(2)由于样本量比较少,因此对总体的估计可能存在误差,因此对总体百分位数的估计一般是估计值而非精确值.【例4】900,920,920,930,930的20%分位数是________.【解析】因为5×20%=1,所以该组数据的20%分位数是eq\f(900+920,2)=910.变式1:5,6,7,8,9,10,11,12,13,14的25%分位数为________,75%分位数为________,90%分位数为________.【解析】由于共有10个数字,则10×25%=2.5,10×75%=7.5,10×90%=9.故25%分位数为7,75%分位数为12,90%分位数为eq\f(13+14,2)=13.5.答案:71213.5变式2:为了解毕业生工作情况,某高校对12名应届毕业生起始月薪作了统计如下:毕业生起始月薪毕业生起始月薪123456285029503050288027552710789101112289031302940332529202880则第85百分位数是________.【解析】首先对数据排序:271027552850288028802890292029402950305031303325所以i=12×85%=10.2.即第85百分位数是3130.变式3:考察某校高二年级男生的身高,随机抽取40名高二男生,实测身高数据(单位:cm)如下:171163163166166168168160168165171169167169151168170160168174165168174159167156157164169180176157162161158164163163167161请估计该校高二年级男生身高的第25,50,75百分位数.【解析】把这40名男生的身高数据按从小到大排序,可得151156157157158159160160161161162163163163163164164165165166166167167167168168168168168168169169169170171171174174176180由25%×40=10,50%×40=20,57%×40=30,可知样本数据的第25百分位数为161.5,第50百分位数为166,第75百分位数为168.5.据此可估计该校高二男生身高的第25,50,75百分位数分别约为161.5,166和168.5.考点五众数、中位数、平均数的计算解题方略:平均数、众数、中位数的计算方法平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.【例5】下列说法中,不正确的是()A.数据2,4,6,8的中位数是4,6B.数据1,2,2,3,4,4的众数是2,4C.一组数据的平均数、众数、中位数有可能是同一个数据D.8个数据的平均数为5,另3个数据的平均数为7,则这11个数据的平均数是eq\f(8×5+7×3,11)【解析】数据2,4,6,8的中位数为eq\f(4+6,2)=5,显然A是错误的,B、C、D都是正确的.故选A.变式1:抽样调查了某班30位女生所穿鞋子的尺码,数据如下(单位:码).在这组数据的平均数、中位数和众数中,鞋厂最感兴趣的是()码号3334353637人数761511A.平均数 B.中位数C.众数 D.无法确定【解析】由于众数是数据中出现最多的数,故鞋厂最感兴趣的是销售量最多的鞋号即这组数据的众数.故选C.变式2:有13位同学参加学校组织的才艺表演比赛,已知他们所得的分数互不相同,共设7个获奖名额,某同学知道自己的比赛分数后,要判断自己能否获奖,在这13名同学成绩的统计量中只需知道一个量,它是__________(填“众数”“中位数”或“平均数”).【解析】因为7位获奖者的分数肯定是13名参赛选手中最高的,所以把13个不同的分数按从小到大排序,只要知道自己的分数和中位数就可以知道是否获奖了.答案:中位数【例6】某班50名学生的一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论