版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第九章统计9.1随机抽样9.1.1简单随机抽样素养目标·定方向素养目标学法指导1.了解简单随机抽样的含义及其解决问题的过程.(数学抽象)2.掌握两种简单随机抽样方法:抽签法和随机数法.(数学抽象)3.会计算样本均值,了解样本与总体的关系.(数学抽象)1.要熟练掌握简单随机抽样的两种方法之间的差异分析与优缺点判断.2.通过设计抽签法或随机数法完成抽样,体会抽样的必要性和重要性.必备知识·探新知知识点1普查与抽查调查方式普查抽查定义对每一个调查对象都进行__调查__的方法,称为全面调查,又称普查根据一定目的,从总体中__抽取一部分__个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法相关概念总体:在一个调查中,我们把__调查对象__的全体称为总体.个体:组成总体的每一个调查对象称为个体样本:我们把从__总体__中抽取的那部分个体称为样本.样本量:样本中包含的__个体数__称为样本量知识点2简单随机抽样1.简单随机抽样的概念放回简单随机抽样不放回简单随机抽样一般地,设一个总体含有N(N为正整数)个个体,从中__逐个__抽取n(1≤n<N)个个体作为样本如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都__相等__,我们把这样的抽样方法叫做放回简单随机抽样如果抽取是不放回的,且每次抽取时总体内__未进入样本的各个个体__被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样简单随机抽样:放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本2.抽签法:先把总体中的个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也可以使卡片、小球等)上作为号签,并将这些小纸片放在一个__不透明__的盒里,充分__搅拌__.最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的个体数.3.随机数法(1)定义:先把总体中的个体编号,用随机数根据产生与总体中个体数量__相等__的整数随机数,把产生的随机数作为抽中的编号,并剔除__重复__的编号,直到抽足样本所需要的个体数.(2)产生随机数的方法:①用随机试验生成随机数;②用信息技术生成随机数.4.总体均值和样本均值(1)总体均值:一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称eq\o(Y,\s\up6(-))=__eq\f(Y1+Y2+…+YN,N)__=__eq\f(1,N)eq\i\su(i=1,N,Y)i__为总体均值,又称总体平均数.(2)总体均值加权平均数的形式:如果总体的N个变量值中,不同的值共有k个(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数fi(i=1,2,…,k),则总体均值还可以写成加权平均数的形式eq\o(Y,\s\up6(-))=__eq\f(1,N)eq\i\su(i=1,k,f)iYi__.(3)如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称eq\o(y,\s\up6(-))=__eq\f(y1+y2+…+yn,n)__=__eq\f(1,n)eq\i\su(i=1,n,y)i__为样本均值,又称样本平均数.在简单随机抽样中,我们常用样本平均数eq\o(y,\s\up6(-))去估计总体平均数eq\o(Y,\s\up6(-)).[知识解读]1.简单随机抽样有如下四个特征:(1)它要求被抽取样本的总体的个数确定,且较少,个体之间差异不明显.(2)它是从总体中逐个抽取.(3)它是一种不放回抽取.(4)它是一种等概率抽样.不仅每次从总体中抽取一个个体时,各个个体被抽到的概率都相等,而且在整个抽样过程中,各个个体被抽到的概率也相等,从而保证了这种抽样方法的公平性.2.抽签法与随机数法的异同点相同点①都属于简单随机抽样,并且要求被抽取样本的总体的个体数有限;②都是从总体中逐个不放回地进行抽取不同点①抽签法比随机数法操作简单;②随机数法更适用于总体中个体数较多的时候,而抽签法适用于总体中个体数较少的情况,所以当总体中的个体数较多时,应当选用随机数法,可以节约大量的人力和制作号签的成本关键能力·攻重难题型探究题型一简单随机抽样的概念理解典例1(1)关于简单随机抽样的特点有以下几种说法,其中不正确的是(D)A.要求总体中的个体数有限B.从总体中逐个抽取C.这是一种不放回抽样D.每个个体被抽到的机会不一样,与先后顺序有关(2)下列问题中最适合用简单随机抽样方法的是(C)A.某学校有学生1320人,卫生部门为了了解学生身体发育情况,准备从中抽取一个容量为300的样本B.为了准备省政协会议,某政协委员计划从1135个村庄中抽取50个进行收入调查C.从全班30名学生中,任意选取5名进行家访D.为了解某地区癌症的发病情况,从该地区的5000人中抽取200人进行统计[解析](1)简单随机抽样,除具有A,B,C三个特点外,还具有等可能性,每个个体被抽取的机会相等,与先后顺序无关.(2)A中不同年级的学生身体发育情况差别较大,B,D的总体容量较大,C的总体容量较小,适宜用简单随机抽样.[归纳提升]可用简单随机抽样抽取样本的依据(1)总体中的个体之间无明显差异;(2)总体中个体数N有限;(3)抽取的样本个体数n小于总体中的个体数N;(4)逐个不放回地抽取;(5)每个个体被抽到的可能性均为eq\f(n,N)·【对点练习】❶下列5个抽样中,简单随机抽样的个数是(B)①从无数个个体中抽取50个个体作为样本;②仓库中有1万支奥运火炬,从中一次性抽取100支火炬进行质量检查;③一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽出6个号签;④箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出1个零件进行质量检验后,再把它放回箱子里.A.0 B.1C.2 D.3[解析]根据简单随机抽样的特点逐个判断.①不是简单随机抽样.因为简单随机抽样要求被抽取的样本总体的个数是有限的.②不是简单随机抽样.虽然“一次性抽取”和“逐个抽取”不影响个体被抽到的可能性,但简单随机抽样要求的是“逐个抽取”.③是简单随机抽样.因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回、等可能的抽样.④不是简单随机抽样,因为它是有放回抽样.综上,只有③是简单随机抽样.题型二抽签法的应用典例2从20架钢琴中抽取5架进行质量检查,请用抽签法确定这5架钢琴.[解析]第一步,将20架钢琴编号,号码是1,2,…,20.第二步,将号码分别写在外观、质地等无差别的小纸片上作为号签.第三步,将小纸片放入一个不透明的盒里,充分搅匀.第四步,从盒中不放回地逐个抽取5个号签,使与号签上编号相同的钢琴进入样本.[归纳提升]1.一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是个体之间差异不明显.2.应用抽签法时应注意以下几点:(1)编号时,如果已有编号可不必重新编号;(2)号签要求大小、形状完全相同;(3)号签要均匀搅拌;(4)根据实际需要采用有放回或无放回抽取.【对点练习】❷为迎接2022年北京冬奥会,奥委会现从报名的某高校30名志愿者中选取6人组成奥运志愿小组,请用抽签法设计抽样方案.[解析](1)将30名志愿者编号,号码分别是1,2,…,30.(2)将号码分别写在外观、质地等无差别的小纸片上作为号签.(3)将小纸片放入一个不透明的盒里,充分搅匀.(4)从盒中不放回地逐个抽取6个号签,使与号签上编号相同的志愿者进入样本.题型三随机数法及综合应用典例3某市质监局要检查某公司某个时间段生产的500克袋装牛奶的质量是否达标,现从500袋牛奶中抽取10袋进行检验.(1)利用随机数法抽取样本时,应如何操作?(2)如果用随机试验生成部分随机数如下所示,据此写出应抽取的袋装牛奶的编号.162,277,943,949,545,354,821,737,932,354,873,520,964,384,263,491,648,642,175,331,572,455,068,877,047,447,672,172,065,025,834,216,337,663,013,785,916,955,567,199,810,507,175,128,673,580,667.(3)质监局对该公司生产的袋装牛奶检验的质量指标有两个:一是每袋牛奶的质量满足500±5g,二是10袋质量的平均数≥500g,同时满足这两个指标,才认为公司生产的牛奶为合格,否则为不合格.经过检测得到10袋袋装牛奶的质量(单位:g)为:502,500,499,497,503,499,501,500,498,499.计算这个样本的平均数,并按照以上标准判断牛奶质量是否合格.[解析](1)第一步,将500袋牛奶编号为001,002,…,500;第二步,用随机数工具产生1~500范围内的随机数;第三步,把产生的随机数作为抽中的编号,使编号对应的袋装牛奶进入样本;第四步,重复上述过程,直到产生的不同编号等于样本所需要的数量.(2)应抽取的袋装牛奶的编号为:162,277,354,384,263,491,175,331,455,068.(3)eq\o(y,\s\up6(-))=eq\f(502+500+499+497+503+499+501+500+498+499,10)=499.8<500,所以该公司的牛奶质量不合格.[归纳提升]用样本平均数估计总体平均数的步骤(1)求样本平均数eq\o(y,\s\up6(-));如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,y3,…,yn,则称eq\o(y,\s\up6(-))=eq\f(y1+y2+…+yn,n)=eq\f(1,n)eq\i\su(i=1,n,y)i为样本均值.(2)用样本平均数eq\o(y,\s\up6(-))去估计总体平均数eq\o(Y,\s\up6(-)),即eq\o(Y,\s\up6(-))≈eq\o(y,\s\up6(-)).【对点练习】❸(1)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法:从随机数表第1行的第5列和第6列数字开始由左到右一次选取两个数字,则选出来的第5个个体的编号为(D)7816657208026314070243699728019832049234493582003623486969387481A.08 B.07C.02 D.01(2)对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:甲273830373531乙352940343036分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数并判断选谁参加比赛比较合适?[解析](1)从随机数表第1行的第5列和第6列数字开始由左到右一次选取两个数字开始向右读,第一个数为65,不符合条件,第二个数为72,不符合条件,第三个数为08,符合条件,以下符合条件的数字依次为02,14,07,01,故第5个数为01.故选D.(2)eq\o(y,\s\up6(-))甲=eq\f(27+38+30+37+35+31,6)=33.eq\o(y,\s\up6(-))乙=eq\f(35+29+40+34+30+36,6)=34.因为eq\o(y,\s\up6(-))甲<eq\o(y,\s\up6(-))乙,故选乙参加比赛较合适.易错警示对简单随机抽样的等可能性理解不透致误典例4在简单随机抽样中,某一个个体被抽到的可能性(C)A.与第几次抽样有关,第一次抽到的可能性最大B.与第几次抽样有关,第一次抽到的可能性最小C.与第几次抽样无关,每一次抽到的可能性相等D.与第几次抽样无关,与样本量也无关[错解]B[错因分析]简单随机抽样在每一次抽取时被抽到的可能性相等,都是eq\f(n,N),但是要将每个个体被抽到的可能性与第n次被抽到的可能性区分开来,避免出错.[正解]由简单随机抽样的定义知简单随机抽样与第几次抽样无关,在每一次抽取时被抽到的可能性相等,不能认为先抽可能性大,后抽可能性小.故C正确.【对点练习】❹对于简单随机抽样,每个个体被抽到的机会(B)A.不相等 B.相等C.不确定 D.与抽样次序有关9.1.2分层随机抽样9.1.3获取数据的途径素养目标·定方向素养目标学法指导1.了解分层随机抽样的特点和适用范围.(数学抽象)2.了解分层随机抽样的必要性,掌握各层样本量比例分配的方法.(数据分析)3.结合具体实例,掌握分层随机抽样的样本均值.(数学运算)4.知道获取数据的基本途径,包括:统计报表和年鉴、社会调查、试验设计、普查和抽样、互联网等.(数据分析)1.对比简单随机抽样的特点,感受分层随机抽样中“层”的含义.2.通过具体的案例,体会层次的差异性,并感受“层”与“层”之间的异同以及比例分配的必要性.3.在简单随机抽样的基础上,深化对分层随机抽样样本平均数的理解.必备知识·探新知知识点1分层随机抽样一般地,按__一个或多个__变量把总体划分成若干个__子总体__,每个个体__属于且仅属于__一个子总体,在每个子总体中独立地进行__简单随机抽样__,再把所有子总体中抽取的样本合在一起作为__总样本__,这样的抽样方法称为分层随机抽样.(1)每一个子总体称为层,在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为__比例分配__.(2)如果总体分为2层,两层包含的个体数分别为M,N,两层抽取的样本量分别为m,n,两层的样本平均数分别为eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-)),两层的总体平均数分别为eq\o(X,\s\up6(-)),eq\o(Y,\s\up6(-)),总体平均数为eq\o(W,\s\up6(-)),样本平均数为eq\o(w,\s\up6(-)).则eq\o(w,\s\up6(-))=__eq\f(m,m+n)eq\o(x,\s\up6(-))+eq\f(n,m+n)eq\o(y,\s\up6(-))__.eq\o(W,\s\up6(-))=__eq\f(M,M+N)eq\o(X,\s\up6(-))+eq\f(N,M+N)eq\o(Y,\s\up6(-))__.(3)在比例分配的分层随机抽样中,可以直接用__样本平均数eq\o(w,\s\up6(-))__估计__总体平均数eq\o(W,\s\up6(-))__.知识点2获取数据的途径获取数据的基本途径有__通过调查获取数据__、__通过试验获取数据__、__通过观察获取数据__、__通过查询获得数据__等.[知识解读]1.分层随机抽样的实施步骤第一步,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体;第二步,在每个子总体中独立地进行简单随机抽样;第三步,把所有子总体中抽取的样本合在一起作为总样本.2.分层随机抽样适用于总体中个体之间差异较大的情形3.在比例分配的分层抽样中需注意两点(1)抽样比=eq\f(样本量,总样本量).(2)可以直接用样本平均数估计总体平均数.4.分层随机抽样下总体平均数的估计在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n.我们用X1,X2,…,XM表示第1层各个个体的变量值,用x1,x2,…,xm表示第1层样本的各个个体的变量值;用Y1,Y2,…,YN表示第2层各个个体的变量值,用y1,y2,…,yn表示第2层样本的各个个体的变量值,则第1层的总体平均数和样本平均数分别为eq\o(X,\s\up6(-))=eq\f(X1+X2+…+XM,M)=eq\f(1,M)eq\i\su(i=1,M,X)i,eq\o(x,\s\up6(-))=eq\f(x1+x2+…+xm,m)=eq\f(1,m)eq\i\su(i=1,m,x)i.第2层的总体平均数和样本平均数分别为eq\o(Y,\s\up6(-))=eq\f(Y1+Y2+…+YN,N)=eq\f(1,N)eq\i\su(i=1,N,Y)i,eq\o(y,\s\up6(-))=eq\f(y1+y2+…+yn,n)=eq\f(1,n)eq\i\su(i=1,n,y)i.总体平均数和样本平均数分别为eq\o(W,\s\up6(-))=eq\f(\i\su(i=1,M,X)i+\i\su(i=1,N,Y)i,M+N),eq\o(w,\s\up6(-))=eq\f(\i\su(i=1,m,x)i+\i\su(i=1,n,y)i,m+n).在比例分配的分层随机抽样中,eq\f(m,M)=eq\f(n,N)=eq\f(m+n,M+N),eq\f(M,M+N)eq\o(x,\s\up6(-))+eq\f(N,M+N)eq\o(y,\s\up6(-))=eq\f(m,m+n)eq\o(x,\s\up6(-))+eq\f(n,m+n)eq\o(y,\s\up6(-))=eq\o(w,\s\up6(-)).因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数eq\o(w,\s\up6(-))估计总体平均数eq\o(W,\s\up6(-)).关键能力·攻重难题型探究题型一对分层随机抽样概念的理解典例1(1)某政府机关在编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人,用下列哪种方法最合适(D)A.抽签法 B.随机数C.简单随机抽样 D.分层随机抽样(2)分层随机抽样又称类型抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层随机抽样为保证每个个体被等可能抽取,必须进行(C)A.每层等可能抽样B.每层可以不等可能抽样C.所有层按同一抽样比等可能抽样D.所有层抽取的个体数量相同[分析]是否适合用分层随机抽样,首先判断总体是否可以“分层”.[解析](1)总体由差异明显的三部分构成,应选用分层随机抽样.(2)为了保证每个个体等可能的被抽取,分层随机抽样时必须在所有层都按同一抽样比等可能抽取.[归纳提升]1.使用分层抽样的前提分层随机抽样的总体按一个或多个变量划分成若干个子总体,并且每一个个体属于且仅属于一个子总体,而层内个体间差异较小.2.使用分层随机抽样应遵循的原则(1)将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;(2)分层随机抽样为保证每个个体等可能抽取,需遵循在各层中进行简单随机抽样,每层样本量与每层个体数量的比等于抽样比.【对点练习】❶下列问题中,最适合用分层随机抽样抽取样本的是(B)A.从10名同学中抽取3人参加座谈会B.某社区有500个家庭,其中高收入的家庭125户,中等收入的家庭280户,低收入的家庭95户,为了了解生活购买力的某项指标,要从中抽取一个容量为100的样本C.从1000名工人中,抽取100人调查上班途中所用时间D.从生产流水线上,抽取样本检查产品质量[解析]A中总体所含个体无差异且个数较少,适合用简单随机抽样;C和D中总体所含个体无差异但个数较多,不适合用分层随机抽样;B中总体所含个体差异明显,适合用分层随机抽样.题型二分层随机抽样的应用典例2一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人.为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?[解析]用分层随机抽样来抽取样本,步骤如下:(1)分层.按年龄将500名职工分成三层:不到35岁的职工;35岁至49岁的职工;50岁及50岁以上的职工.(2)确定每层抽取个体的个数.抽样比为eq\f(100,500)=eq\f(1,5),则在不到35岁的职工中抽取125×eq\f(1,5)=25(人);在35岁至49岁的职工中抽取280×eq\f(1,5)=56(人);在50岁及50岁以上的职工中抽取95×eq\f(1,5)=19(人).(3)在各层分别按简单随机抽样抽取样本.(4)汇总每层抽样,组成样本.[归纳提升]分层随机抽样的步骤【对点练习】❷某市的3个区共有高中学生20000人,且3个区的高中学生人数之比为2︰3︰5,现要从所有学生中抽取一个容量为200的样本,调查该市高中学生的视力情况,试写出抽样过程.[解析]①由于该市高中学生的视力有差异,按3个区分成三层,用分层随机抽样来抽取样本.②确定每层抽取个体的个数,在3个区分别抽取的学生人数之比也是2︰3︰5,所以抽取的学生人数分别是200×eq\f(2,2+3+5)=40;200×eq\f(3,2+3+5)=60;200×eq\f(5,2+3+5)=100.③在各层分别按随机数法抽取样本.④综合每层抽样,组成容量为200的样本.题型三分类抽样的相关计算典例3(1)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层随机抽样调查,假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为(B)A.101 B.808C.1212 D.2012(2)将一个总体分为A,B,C三层,其个体数之比为5︰3︰2,若用分层随机抽样方法抽取容量为100的样本,则应从C中抽取__20__个个体.(3)分层随机抽样中,总体共分为2层,第1层的样本量为20,样本平均数为3,第2层的样本量为30,样本平均数为8,则该样本的平均数为__6__.[解析](1)因为甲社区有驾驶员96人,并且在甲社区抽取的驾驶员的人数为12人,所以四个社区抽取驾驶员的比例为eq\f(12,96)=eq\f(1,8),所以驾驶员的总人数为(12+21+25+43)÷eq\f(1,8)=808(人).(2)∵A,B,C三层个体数之比为5︰3︰2,又有总体中每个个体被抽到的概率相等,∴分层随机抽样应从C中抽取100×eq\f(2,10)=20(个)个体.(3)eq\o(w,\s\up6(-))=eq\f(20,20+30)×3+eq\f(30,20+30)×8=6.[归纳提升](1)进行分层随机抽样的相关计算时,常用到的两个关系①eq\f(样本量n,总体的个数N)=eq\f(该层抽取的个体数,该层的个体数);②总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.(2)样本的平均数和各层的样本平均数的关系为:eq\o(w,\s\up6(-))=eq\f(m,m+n)eq\o(x,\s\up6(-))+eq\f(n,m+n)eq\o(y,\s\up6(-))=eq\f(M,M+N)eq\o(x,\s\up6(-))+eq\f(N,M+N)eq\o(y,\s\up6(-)).【对点练习】❸(1)某公司生产三种型号的轿车,产量分别是1200辆,6000辆和2000辆,为检验该公司的产品质量,现用分层随机抽样的方法抽取46辆进行检验,这三种型号的轿车依次应抽取__6__辆、__30__辆、__10__辆.(2)在本例(2)中,若A,B,C三层的样本的平均数分别为15,30,20,则样本的平均数为__20.5__.[解析](1)三种型号的轿车共9200辆,抽取样本量为46辆,则按eq\f(46,9200)=eq\f(1,200)的比例抽样,所以依次应抽取1200×eq\f(1,200)=6(辆),6000×eq\f(1,200)=30(辆),2000×eq\f(1,200)=10(辆).(2)由题意可知样本的平均数为eq\o(w,\s\up6(-))=eq\f(5,5+3+2)×15+eq\f(3,5+3+2)×30+eq\f(2,5+3+2)×20=20.5.易错警示忽略抽样的公平性致错典例4某单位有老年人28人、中年人54人、青年人81人,为了调查他们的身体情况,需从中抽取一个样本量为36的样本,则下列抽样方法适合的是__②__.①简单随机抽样;②直接运用分层随机抽样;③先从老年人中剔除1人,再用分层随机抽样.[错解]③[错因分析]由于按eq\f(36,163)抽样,无法得到整数解,因此先剔除1人,将抽样比变为eq\f(36,162)=eq\f(2,9).若从老年人中随机地剔除1人,则老年人应抽取27×eq\f(2,9)=6(人),中年人应抽取54×eq\f(2,9)=12(人),青年人应抽取81×eq\f(2,9)=18(人),从而组成样本量为36的样本.事实上,若用简单随机抽样法先从老年人中剔除1人,则老年人中每个人被抽到的机会显然比中年人、青年人中每个人被抽到的机会小了,这不符合随机抽样的特征——每个个体入样的机会都相等.[正解]因为总体由差异明显的三部分组成,所以考虑用分层随机抽样.因为总人数为28+54+81=163,样本量为36,所以抽样比为eq\f(36,163).因此,从老年人、中年人和青年人中应抽取的人数分别为eq\f(36,163)×28≈6,eq\f(36,163)×54≈12,eq\f(36,163)×81≈18.[误区警示]分层随机抽样的一个很重要的特点是每个个体被抽到的机会是相等的.当按照比例计算出的值不是整数时,一般采用四舍五入的方法取值.若四舍五入后得到的样本量与要求的不尽相同,则可根据问题的实际意义适当处理,使之相同,这只是细节性问题,并未改变分层随机抽样的本质.【对点练习】❹为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,且男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是(C)A.简单随机抽样 B.按性别分层随机抽样C.按学段分层随机抽样 D.随机数法抽样[解析]依据题意,了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,且男女生视力情况差异不大,故要了解该地区学生的视力情况,应按学段分层随机抽样.故选C.9.2用样本估计总体9.2.1总体取值规律的估计素养目标·定方向素养目标学法指导1.能选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性.(数据分析)2.结合实例,能用样本估计总体的取值规律.(数据分析)1.在初中条形图作图的基础上,进一步感受数据处理过程中,用频率分布直方图的必要性.2.通过具体的案例感受制作频率分布表和频率分布直方图的全过程(流程).3.通过具体案例感受分组与组数对数据整理后信息分析的影响.必备知识·探新知知识点1画频率分布直方图的步骤1.求极差:极差是一组数据中__最大值__与__最小值__的差.2.决定组距与组数:当样本容量不超过100时,常分成__5~12__组,一般取等长组距,并且组距应力求“取整”.3.将数据分组.4.列频率分布表:一般分四列,即分组、__频数累计__、频数、__频率__.其中频数合计应是样本容量,频率合计是__1__.5.画频率分布直方图:横轴表示样本数据,纵轴表示eq\f(频率,组距).小长方形的面积=组距×eq\f(频率,组距)=__频率__.各小长方形的面积和等于1.知识点2其它统计图表统计图表主要应用扇形图直观描述各类数据占总数的比例条形图和直方图直观描述不同类别或分组数据的频数和频率折线图描述数据随时间的变化趋势[知识解读]1.频率分布直方图频数分布直方图的纵坐标是频数,每一组数对应的矩形的高度与频数成正比;频率分布直方图的纵坐标是eq\f(频率,组距),每一组数对应的矩形高度与频率成正比,而且每个矩形的面积等于这一组数对应的频率,所有矩形的面积之和为1.2.条形图、折线图及扇形图(1)条形图:建立直角坐标系,用横轴(横轴上的数字)表示样本数据类型,用纵轴上的单位长度表示一定的数量,根据每个样本(或某个范围内的样本)的数量多少画出长短不同的等宽矩形,然后把这些矩形按照一定的顺序排列起来,这样一种表达和分析数据的统计图称为条形图.(2)折线图:建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,根据样本值和数量的多少描出相应各点,然后把各点用线段顺次连接,得到一条折线,用这种折线表示出样本数据的情况,这样的一种表示和分析数据的统计图称为折线图.(3)扇形图:用一个圆表示总体,圆中各扇形分别代表总体中的不同部分,每个扇形的大小反映所表示的那部分占总体的百分比的大小,这样的一种表示和分析数据的统计图称为扇形图.关键能力·攻重难题型探究题型一频率分布直方图作法典例1为了检测某种产品的质量,抽取了一个样本量为100的样本,数据的分组如下:[10.75,10.85),3;[10.85,10.95),9;[10.95,11.05),13;[11.05,11.15),16;[11.15,11.25),26;[11.25,11.35),20;[11.35,11.45),7;[11.45,11.55),4;[11.55,11.65],2.(1)列出频率分布表;(2)画出频率分布直方图.[分析]题目要求列出样本的频率分布表、画出频率分布直方图,应注意到已知条件中虽未提供原始数据,但组距、组数及频数都已给出,可由此来列表、画图.[解析](1)频率分布表如下:分组频数频率[10.75,10.85)30.03[10.85,10.95)90.09[10.95,11.05)130.13[11.05,11.15)160.16[11.15,11.25)260.26[11.25,11.35)200.20[11.35,11.45)70.07[11.45,11.55)40.04[11.55,11.65]20.02合计1001.00(2)频率分布直方图如图[归纳提升]绘制频率分布直方图应注意的问题(1)在绘制出频率分布表后,画频率分布直方图的关键就是确定小矩形的高.一般地,频率分布直方图中两坐标轴上的单位长度是不一致的,合理的定高方法是“以一个恰当的单位长度”(没有统一规定),然后以各组的“eq\f(频率,组距)”所占的比例来定高.如我们预先设定以“”为1个单位长度,代表“0.1”,则若一个组的eq\f(频率,组距)为0.2,则该小矩形的高就是“”(占两个单位长度),如此类推.(2)数据要合理分组,组距要选取恰当,一般尽量取整,数据为30~100个左右时,应分成5~12组,在频率分布直方图中,各个小长方形的面积等于各组的频率,小长方形的高与频数成正比,各组频数之和等于样本量,频率之和为1.【对点练习】❶在生产过程中,测得纤维产品的纤度(表示纤细的一种量)共有100个数据,将数据分组如下表:分组频数频率[1.30,1.34)4[1.34,1.38)25[1.38,1.42)30[1.42,1.46)29[1.46,1.50)10[1.50,1.54]2合计100(1)完成频率分布表,并画出频率分布直方图;(2)估计纤度落在[1.38,1.50)内的可能性及纤度小于1.42的可能性各是多少?[解析](1)频率分布表如下:分组频数频率[1.30,1.34)40.04[1.34,1.38)250.25[1.38,1.42)300.30[1.42,1.46)290.29[1.46,1.50)100.10[1.50,1.54]20.02合计1001.00频率分布直方图如图所示.(2)利用样本估计总体,则纤度落在[1.38,1.50)的可能性即为纤度落在[1.38,1.50)的频率,即为0.30+0.29+0.10=0.69=69%.纤度小于1.42的可能性即为纤度小于1.42的频率,即为0.04+0.25+0.30=0.59=59%.题型二频率分布直方图的应用典例2从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)求直方图中x的值;(2)在这些用户中,求用电量落在区间[100,250)内的户数.[解析](1)由频率分布直方图知[200,250)小组的频率为1-(0.0024+0.0036+0.0060+0.0024+0.0012)×50=0.22,于是x=eq\f(0.22,50)=0.0044.(2)∵数据落在[100,250)内的频率为(0.0036+0.0060+0.0044)×50=0.7,∴所求户数为0.7×100=70.[归纳提升]频率分布直方图的性质(1)因为小矩形的面积=组距×eq\f(频率,组距)=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.(2)在频率分布直方图中,各小矩形的面积之和等于1.(3)样本量=频数/相应的频率.【对点练习】❷如图是样本量为200的频率分布直方图.根据样本的频率分布直方图估计,下列说法正确的是(A)A.样本数据落在[6,10)内的频数为64,数据落在[2,10)内的百分比为0.4B.样本数据落在[6,10)内的频数为16,数据落在[2,10)内的百分比为0.1C.样本数据落在[10,14)内的频数为18,数据落在[6,14)内的百分比为0.68D.样本数据落在[14,22]内的频数为48,数据落在[10,18)内的百分比为0.12[解析]根据样本的频率分布直方图,样本数据落在[6,10)内的频率为0.08×4=0.32,所以频数为0.32×200=64;样本数据落在[2,6)内的频率为0.02×4=0.08,所以频数为0.08×200=16,故数据落在[2,10)内的百分比约为eq\f(64+16,200)=0.4.故选A.题型三折线图、条形图、扇形图及应用典例3如图是根据某市3月1日至3月10日的最低气温(单位:℃)的情况绘制的折线统计图,试根据折线统计图反映的信息,绘制该市3月1日到10日最低气温(单位:℃)的扇形统计图和条形统计图.[解析]该城市3月1日至10日的最低气温(单位:℃)情况如下表:日期12345678910最低气温(℃)-3-20-1120-122其中最低气温为-3℃的有1天,占10%,最低气温为-2℃的有1天,占10%,最低气温为-1℃的有2天,占20%,最低气温为0℃的有2天,占20%,最低气温为1℃的有1天,占10%,最低气温为2℃的有3天,占30%,扇形统计图如图所示.条形统计图如下图所示:[归纳提升]1.条形图是用一个单位长度表示一定的数量或频率,根据数量的多少或频率的大小画成长短不同的矩形条,条形图能清楚地表示出每个项目的具体数目或频率.2.扇形图是用整个圆面积表示总数(100%),用圆内的扇形面积表示各个部分所占总数的百分数.3.在画折线图时,要注意明确横轴、纵轴的实际含义.【对点练习】❸如图是甲、乙、丙、丁四组人数的扇形统计图的部分结果,根据扇形统计图的情况可以知道丙、丁两组人数和为(A)A.250 B.150C.400 D.300[解析]甲组人数是120,占30%,则总人数是eq\f(120,30%)=400.则乙组人数是400×7.5%=30,则丙、丁两组人数和为400-120-30=250.易错警示误将频率分布直方图中的纵坐标当作频率典例4中小学生的视力状况受到社会的广泛关注.某市有关部门从全市6万名高一学生中随机抽取400名学生,对他们的视力状况进行一次调查统计,将所得到的有关数据绘制成频率分布直方图,如图.从左至右五个小组的频率之比为5︰7︰12︰10︰6,则该市6万名高一学生中视力在[3.95,4.25)内的学生约有多少人?[错解]由图可知,第五小组的频率为0.5,所以第一小组的频率为0.5×eq\f(5,6)=eq\f(5,12).所以该市6万名高一学生中视力在[3.95,4.25)内的学生约有60000×eq\f(5,12)=25000(人).[错因分析]造成错解的原因是将该频率分布直方图中的纵坐标(频率与组距的比)看成频率.[正解]由图可知,第五小组的频率为0.5×0.3=0.15,所以第一小组的频率为0.15×eq\f(5,6)=0.125.所以该市6万名高一学生中视力在[3.95,4.25)内的学生约有60000×0.125=7500(人).[误区警示]频率分布直方图中的纵轴上所标数据是小矩形的高,表示eq\f(频率,组距),计算频率时不要忘了乘组距.【对点练习】❹如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为(B)A.20 B.30C.40 D.50[解析]样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.9.2.2总体百分位数的估计9.2.3总体集中趋势的估计素养目标·定方向素养目标学法指导1.学会计算样本百分位数,会对总体百分位数做出合理估计.(数学运算)2.理解平均数、众数、中位数的定义,会从已知数据中获得上述特征数值.(数据分析)1.对比中位数,感受百分位数的含义,进一步体会四分位数的特征和价值.2.要始终基于具体的案例体会数据向均值集中的趋势.必备知识·探新知知识点1百分位数1.第p百分位数的定义一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有__p%__的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.2.计算一组n个数据的第p百分位数的步骤第1步,按__从小到大__排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的__平均数__.3.四分位数25%,50%,75%这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数,其中第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数.知识点2众数、中位数和平均数的定义(1)众数:一组数据中__出现次数最多__的数.(2)中位数:一组数据按大小顺序排列后,处于__中间__位置的数.如果个数是偶数,则取__中间__两个数据的平均数.(3)平均数:一组数据的__和__除以数据个数所得到的数.[知识解读]1.众数、中位数、平均数的理解(1)一组数据中,某个数据出现的次数称为这个数据的频数,出现次数最多的数据称为这组数据的众数.说明:如果有几个数据出现的次数相同,并且比其他数据出现的次数都多,那么这几个数据都是这组数据的众数;若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数.(2)如果一组数有奇数个数,且按照从小到大排列后为x1,x2,…,x2n+1,则称xn+1为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为x1,x2,…,x2n,则称eq\f(xn+xn+1,2)为这组数的中位数.(3)如果给定的一组数是x1,x2,…,xn,则这组数的平均数为eq\o(x,\s\up6(-))=eq\f(1,n)(x1+x2+…+xn).众数、中位数、平均数都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.2.众数、中位数和平均数的比较名称优点缺点众数体现了样本数据的最大集中点众数只能传递数据中的信息的很少一部分,对极端值不敏感中位数不受少数几个极端数据(即排序靠前或靠后的数据)的影响对极端值不敏感平均数与中位数相比,平均数反映出样本数据中更多的信息,对样本中的极端值更加敏感任何一个数据的改变都会引起平均数的改变,数据越“离群”,对平均数的影响越大关键能力·攻重难题型探究题型一百分位数的计算典例1从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.(1)分别求出这组数据的第25,50,95百分位数;(2)请你找出珍珠质量较小的前15%的珍珠质量;(3)若用第25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.[解析](1)将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,因为共有12个数据,所以12×25%=3,12×50%=6,12×95%=11.4,则第25百分位数是eq\f(8.0+8.3,2)=8.15,第50百分位数是eq\f(8.5+8.5,2)=8.5,第95百分位数是第12个数据为9.9.(2)因为共有12个数据,所以12×15%=1.8,则第15百分位数是第2个数据为7.9.即产品质量较小的前15%的产品有2个,它们的质量分别为7.8,7.9.(3)由(1)可知样本数据的第25百分位数是8.15g,第50百分位数为8.5g,第95百分位数是9.9g,所以质量小于或等于8.15g的珍珠为次品,质量大于8.15g且小于或等于8.5g的珍珠为合格品,质量大于8.5g且小于或等于9.9g的珍珠为优等品,质量大于9.9g的珍珠为特优品.[归纳提升]1.计算一组n个数据的第p百分位数的一般步骤:(1)排列:按照从小到大排列原始数据;(2)算i:计算i=n×p%;(3)定数:若i不是整数,大于i的最小整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.2.根据频率分布直方图计算样本数据的百分位数,首先要理解频率分布直方图中各组数据频率的计算,其次估计百分位数在哪一组,再应用方程的思想方法,设出百分位数,解方程可得.【对点练习】❶(1)求下列数据的四分位数.13,15,12,27,22,24,28,30,31,18,19,20.(2)某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1︰3︰7︰6︰3,那么成绩的70%分位数约为__16.5__秒.[解析](1)把12个数据按从小到大的顺序排列可得:12,13,15,18,19,20,22,24,27,28,30,31,计算12×25%=3,12×50%=6,12×75%=9,所以数据的第25百分位数为eq\f(15+18,2)=16.5,第50百分位数为eq\f(20+22,2)=21,第75百分位数为eq\f(27+28,2)=27.5.(2)设成绩的70%分位数为x,因为eq\f(1+3+7,1+3+7+6+3)=0.55,eq\f(1+3+7+6,1+3+7+6+3)=0.85,所以x∈[16,17),所以0.55+(x-16)×eq\f(6,1+3+7+6+3)=0.70,解得x=16.5(秒).题型二众数、中位数、平均数的计算典例2某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):甲群:13,13,14,15,15,15,15,16,17,17;乙群:54,3,4,4,5,6,6,6,6,56.(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?[解析](1)甲群市民年龄的平均数为eq\f(13+13+14+15+15+15+15+16+17+17,10)=15(岁),中位数为15岁,众数为15岁.平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.(2)乙群市民年龄的平均数为eq\f(54+3+4+4+5+6+6+6+6+56,10)=15(岁),中位数为6岁,众数为6岁.由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.[归纳提升]平均数、众数、中位数的计算方法平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.【对点练习】❷某班甲、乙两位同学在5次阶段性检测中的数学成绩(百分制)如下所示,甲的成绩是75,83,85,85,92,乙的成绩是74,84,84,85,98,甲、乙两位同学得分的中位数分别为x1,x2,得分的平均数分别为y1,y2,则下列结论正确的是(D)A.x1<x2,y1<y2 B.x1<x2,y1>y2C.x1>x2,y1>y2 D.x1>x2,y1<y2[解析]由题意可得x1=85,x2=84,故x1>x2,而甲的平均数y1=eq\f(1,5)×(75+83+85+85+92)=84,乙的平均数y2=eq\f(1,5)×(74+84+84+85+98)=85,故y1<y2.题型三总体集中趋势的估计典例3某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.(1)求这次测试数学成绩的众数、中位数、平均分;(2)估计该校参加高二年级学业水平测试的学生的众数、中位数和平均数.[解析](1)①由题图知众数为eq\f(70+80,2)=75.②由题图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x-70),所以x≈73.3.③由题图知这次数学成绩的平均分为:eq\f(40+50,2)×0.005×10+eq\f(50+60,2)×0.015×10+eq\f(60+70,2)×0.02×10+eq\f(70+80,2)×0.03×10+eq\f(80+90,2)×0.025×10+eq\f(90+100,2)×0.005×10=72.(2)由于数据是来自高二年级全部参加学业水平测试的学生的简单随机样本,所以可以估计高二年级参加学业水平测试的学生的众数是75,中位数是73.3,平均分是72.[归纳提升]用频率分布直方图估计众数、中位数、平均数(1)众数:取最高小长方形底边中点的横坐标作为众数.(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x轴交点的横坐标称为中位数.(3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.【对点练习】❸某工厂对一批新产品的长度(单位:mm)进行检测,如图是检测结果的频率分布直方图,据此估计这批产品的中位数为(C)A.20 B.25C.22.5 D.22.75[解析]产品的中位数出现在概率是0.5的地方.自左至右各小矩形面积依次为0.1,0.2,0.4,…,设中位数是x,则由0.1+0.2+0.08·(x-20)=0.5,得x=22.5,故选C.易错警示不能正确理解平均数的含义典例4下列判断正确的是(D)A.样本平均数一定小于总体平均数B.样本平均数一定大于总体平均数C.样本平均数一定等于总体平均数D.样本量越大,样本平均数越接近于总体平均数[错解]A或B或C.[错因分析]错解的原因是对样本平均数与总体平均数之间关系的理解不到位.对用样本数据估计总体要有一个辩证的理解,即要考虑到它有时会出现偏差,要解决这一问题,可适度增加样本量,样本量越大,它与总体的接近程度就越大,可信度也就越大.[正解]D[误区警示]对于样本平均数与总体平均数,若样本的选取较为合理,能够代替总体,则它们间的平均数差距较小,否则样本与总体之间不具备可比性.【对点练习】❹判断:样本的平均数是频率分布直方图中最高长方形的中点对应的数据.(×)9.2.4总体离散程度的估计9.3统计案例公司员工的肥胖情况调查分析素养目标·定方向素养目标学法指导1.理解方差、标准差的含义,会计算方差和标准差.(数学运算)2.掌握求分层随机抽样总样本的平均数及方差的方法.(数据分析,数学运算)要始终基于具体的案例体会数据总体的离散程度的特点.必备知识·探新知知识点1一组数据x1,x2,…,xn的方差和标准差数据x1,x2,…,xn的方差为__eq\f(1,n)eq\i\su(i=1,n,)(xi-eq\o(x,\s\up6(-)))2__=__eq\f(1,n)eq\i\su(i=1,n,x)eq\o\al(2,i)-eq\o(x,\s\up6(-))2__,标准差为__eq\r(\f(1,n)\i\su(i=1,n,)xi-\o(x,\s\up6(-))2)__.知识点2总体方差和标准差(1)总体方差和标准差:如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体的平均数为eq\o(Y,\s\up6(-)),则称S2=__eq\f(1,N)eq\i\su(i=1,N,)(Yi-eq\o(Y,\s\up6(-)))2__为总体方差,S=__eq\r(S2)__为总体标准差.(2)总体方差的加权形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=__eq\f(1,N)eq\i\su(i=1,k,f)i(Yi-eq\o(Y,\s\up6(-)))2__.知识点3样本方差和标准差如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为eq\o(y,\s\up6(-)),则称s2=__eq\f(1,n)eq\i\su(i=1,n,)(yi-eq\o(y,\s\up6(-)))2__为样本方差.s=__eq\r(s2)__为样本标准差.知识点4标准差的意义标准差刻画了数据的__离散程度__或__波动幅度__,标准差越大,数据的离散程度越__大__;标准差越小,数据的离散程度越__小__.知识点5分层随机抽样的方差设样本容量为n,平均数为eq\o(x,\s\up6(-)),其中两层的个体数量分别为n1,n2,两层的平均数分别为eq\o(x,\s\up6(-))1,eq\o(x,\s\up6(-))2,方差分别为seq\o\al(2,1),seq\o\al(2,2),则这个样本的方差为s2=__eq\f(n1,n)[seq\o\al(2,1)+(eq\o(x,\s\up6(-))1-eq\o(x,\s\up6(-)))2]+eq\f(n2,n)[seq\o\al(2,2)+(eq\o(x,\s\up6(-))2-eq\o(x,\s\up6(-)))2]__.[知识解读]对方差、标准差的理解(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.(2)标准差、方差的取值范围:[0,+∞).标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.(3)标准差的平方s2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.(4)标准差的单位与样本数据一致.(5)方差s2=eq\f(1,n)eq\i\su(i=1,n,x)eq\o\al(2,i)-eq\o(x,\s\up6(-))2.关键能力·攻重难题型探究题型一标准差、方差的计算与应用典例1从甲、乙两种玉米苗中各抽10株,分别测它们的株高如下:(单位:cm)甲:25,41,40,37,22,14,19,39,21,42;乙:27,16,44,27,44,16,40,40,16,40.问:(1)哪种玉米苗长得高?(2)哪种玉米苗长得齐?[解析](1)eq\o(x,\s\up6(-))甲=eq\f(1,10)(25+41+40+37+22+14+19+39+21+42)=eq\f(1,10)×300=30(cm),eq\o(x,\s\up6(-))乙=eq\f(1,10)(27+16+44+27+44+16+40+40+16+40)=eq\f(1,10)×310=31(cm).所以eq\o(x,\s\up6(-))甲<eq\o(x,\s\up6(-))乙.即乙种玉米苗长得高.(2)seq\o\al(2,甲)=eq\f(1,10)[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=eq\f(1,10)(25+121+100+49+64+256+121+81+81+144)=eq\f(1,10)×1042=104.2(cm2),seq\o\al(2,乙)=eq\f(1,10)[2×(27-31)2+3×(16-31)2+2×(44-31)2+3×(40-31)2]=eq\f(1,10)×1288=128.8(cm2).所以seq\o\al(2,甲)<seq\o\al(2,乙).即甲种玉米苗长得齐.[归纳提升]用样本的标准差、方差估计总体的方法用样本估计总体时,样本的平均数、标准差只是总体平均数、标准差的近似.在实际应用中,常常把平均数与方差结合起来进行决策.在平均值相等的情况下,比较标准差以确定稳定性.【对点练习】❶(1)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为eq\o(x,\s\up6(-)),方差为s2,则(A)A.eq\o(x,\s\up6(-))=4,s2<2 B.eq\o(x,\s\up6(-))=4,s2>2C.eq\o(x,\s\up6(-))>4,s2<2 D.eq\o(x,\s\up6(-))>4,s2>2(2)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:运动员第1次第2次第3次第4次第5次甲8791908993乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为__2__.[解析](1)∵某7个数的平均数为4,∴这7个数的和为4×7=28,∵加入一个新数据4,∴eq\o(x,\s\up6(-))=eq\f(28+4,8)=4.又∵这7个数的方差为2,且加入一个新数据4,∴这8个数的方差s2=eq\f(7×2+4-42,8)=eq\f(7,4)<2,故选A.(2)∵eq\o(x,\s\up6(-))甲=eq\f(1,5)(87+91+90+89+93)=90,eq\o(x,\s\up6(-))乙=eq\f(1,5)(89+90+91+88+92)=90,∴seq\o\al(2,甲)=eq\f(1,5)[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4,seq\o\al(2,乙)=eq\f(1,5)[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.题型二分层随机抽样的方差典例2在了解全校学生每年平均阅读了多少本文学经典名著时,甲同学抽取了一个容量为10的样本,并算得样本的平均数为5,方差为9;乙同学抽取了一个容量为8的样本,并算得样本的平均数为6,方差为16.已知甲、乙两同学抽取的样本合在一起组成一个容量为18的样本,求合在一起后的样本平均数与方差.(精确到0.1)[解析]把甲同学抽取的样本的平均数记为eq\o(x,\s\up6(-)),方差记为seq\o\al(2,x);把乙同学抽取的样本的平均数记为eq\o(y,\s\up6(-)),方差记为seq\o\al(2,y);把合在一起后的样本的平均数记为eq\o(a,\s\up6(-)),方差记为s2.则eq\o(a,\s\up6(-))=eq\f(10×5+8×6,10+8)≈5.4,s2=eq\f(10×[s\o\al(2,x)+\o(x,\s\up6(-))-\o(a,\s\up6(-))2]+8×[s\o\al(2,y)+\o(y,\s\up6(-))-\o(a,\s\up6(-))2],10+8)=eq\f(10×[9+5-5.42]+8×[16+6-5.42],18)≈12.4.即样本的平均数为5.4,方差为12.4.[归纳提升]两层及以上的分层随机抽样的平均数及方差1.分层随机抽样的平均数的求法设样本中不同层的平均数和相应权重分别为eq\o(x,\s\up6(-))1,eq\o(x,\s\up6(-))2,…,eq\o(x,\s\up6(-))n和w1,w2,…,wn,则这个样本的平均数:eq\o(x,\s\up6(-))=w1eq\o(x,\s\up6(-))1+w2eq\o(x,\s\up6(-))2+…+wneq\o(x,\s\up6(-))n.2.方差计算公式设样本中不同层的平均数分别为eq\o(x,\s\up6(-))1,eq\o(x,\s\up6(-))2,…,eq\o(x,\s\up6(-))n,方差分别为seq\o\al(2,1),seq\o\al(2,2),…,seq\o\al(2,n),相应的权重分别为w1,w2,…,wn,则这个样本的方差为s2=eq\i\su(i=1,n,w)i[seq\o\al(2,i)+(eq\o(x,\s\up6(-))i-e
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度年福建省高校教师资格证之高等教育心理学押题练习试题B卷含答案
- 2024年度山西省高校教师资格证之高等教育法规题库综合试卷B卷附答案
- 2024年度年福建省高校教师资格证之高等教育学能力提升试卷B卷附答案
- 一年级数学(上)计算题专项练习汇编
- 职业培训学校计划及实施方案
- 2024年度合作伙伴保密义务协议
- 吊车租赁协议:2024年详细
- 2024年度工程承包施工协议范本
- 大理石产品购买与销售专项协议范本
- 2024年企业对外担保协议样式
- 皮炎湿疹诊断治疗课件
- Python程序设计课件第7章面向对象程序设计
- 空运提单格式
- 课件零件手册vespa gts250ie2011-2013cina
- 咽喉解剖生理医学课件
- 幼儿园课件《挠挠小怪物》
- 骨质疏松症-PPT课件
- 调查问卷-“职工之家”建设调查问卷
- 2019年11月系统集成项目管理工程师真题
- 小小建筑师公开课-PPT课件
- 完整版老旧住宅小区综合整治工程施工组织设计方案
评论
0/150
提交评论