数学名师导航抽样方法_第1页
数学名师导航抽样方法_第2页
数学名师导航抽样方法_第3页
数学名师导航抽样方法_第4页
数学名师导航抽样方法_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学必求其心得,业必贵于专精学必求其心得,业必贵于专精学必求其心得,业必贵于专精6.1抽样方法名师导航三点剖析一、总体与样本总体是指考察对象的全体;其中每一个考察对象是个体;从总体中所抽取的一部分个体叫做总体的一个样本;样本中个体的数目叫做样本容量.样本的抽取要具有随机性。例如:某学校高一年级为了了解全年级1200名学生的体重,从中抽取100名学生进行测量分析。在这个问题中总体是指“某学校高一年级全年级1200名学生的体重”,而样本则是指“从中抽取的100名学生的体重",样本容量则是100.统计的基本思想方法就是用样本估计总体,即当总体容量很大或检测过程具有一定的破坏性时,不去直接研究总体,而是从总体中抽取一个样本,根据样本的情况去估计总体的相应情况。如为了检测一批小麦良种的发芽率,我们可以从中随机地选出100粒进行试验。通过这100粒小麦的发芽率来估计这批小麦的发芽率。二、简单随机抽样1.定义一般地,从个体数为N的总体中不重复地取出n(n〈N)个个体,每个个体都有相同的机会被取到。这样的抽样方法称为简单随机抽样。2.简单随机抽样的特点与适用范围(1)它要求被抽取样本的总体的个体数是有限的,以便对其中各个个体被抽取的概率进行分析;(2)这种抽样是从总体中不重复地进行抽取,这样才能使得总体中的每个个体被抽到的机会相等,才能使得抽取的样本具有代表性,这就使得它具有可操作性。这种可操作性主要体现在用这种方法抽取样本简单易行,且抽出的样本中个体的性质能很好的代表总体中个体的性质;(3)这是一种不放回抽样(当个体被抽出后不再放回总体中).由于在抽样的实践中常常采用不放回抽样,使简单随机抽样具有较广泛的实用性,而且由于在所抽取的样本中没有被重复抽取的个体,所以便于进行分析与计算;(4)这是一种等可能性抽样。不仅从总体中抽取一个个体时,每个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性也相等,从而保证了这种抽样方法的公平性.这里所说的“等可能性”是指在抽样时,总体中每个个体被抽到的机会或者说概率是相等的.例如:设一个总体中个体的个数是6,从中抽取一个容量为2的样本,则在抽样过程中每个个体被抽到的概率都是.简单随机抽样的适用范围是:总体中个体的个数较少.3.实施简单随机抽样的方法:抽签法和随机数表法(1)抽签法的实施步骤:①先将总体中的所有个体(共N个)编号(号码可以从1到N);②将1到N这N个号码写在形状、大小相同的号签上;③将这些号签放在同一个箱子中,进行均匀搅拌;④从箱中每次抽出一个号签,并记录其号码,连续抽取n次;⑤从总体中将与抽到编号相一致的个体取出.这样就可以得到一个容量为n的样本。在实际操作对个编号时,可以利用已有的编号,如从全班学生中抽取样本时,可以利用学生的座位号或考号作为编号。(2)抽签法的适用范围和特点:抽签法简单易行。当总体的个体数不多时,适宜采用这种方法。当总体的个数较多时不宜采用这种方法,这是因为用这种方法抽样时需要对总体中个体标号和制作标签,当总体中个体的个体数比较多时,标号和制作标签将是一个复杂的过程,不易操作.(3)抽签法的优点和缺点抽签法简单易行,当总体的个体数不多时,使总体处于“搅拌均匀”的状态比较容易,这时每个个体有均等的机会被抽中,从而能保证样本的代表性.但是,抽签法也有缺点,尤其是当总中个体数较多时.这时制签比较麻烦,而且将总体“搅拌均匀"也比较困难,用抽签法产生的样本的代表性差的可能性很大.(4)随机数表法随机数表中的数是用随机的方法产生的(具体方法有:抽签法、抛掷骰子法和计算机生成法),表中的数在每一个位置上出现的机会是等可能的.随机数表法就是我们在随机数表中,按一定的规则选取号码,从而抽取样本的方法。(5)随机数表法的步骤:①对总体中的个体进行编号(每个号码位数一致,即所选出的第一个数是几位数,则其余的也应是几位数)。②在随机数表中任选出一个数作为开始。③从选出的数开始按一定的方向读下去,个体编号是几位就需将几个数码视为一个整体。在读取的过程中,得到的数码不在编号内的,则跳过;若在编号内的取出;如果得到的号码前面已经取出,则跳过。如此继续下去,直到取满为止.④根据选定的号码抽取样本.下面就以实例来说明用随机数表法抽取样本的过程和步骤;例如为了检验某种产品的质量,决定从40件产品中抽取10件进行检查。在利用随机数表抽取这个样本时,可以按下面的步骤进行:第一步,先将这40件产品编号,可以编为00,01,02,…,39.第二步,在附录1随机数表中任选出一个数作为开始。例如从第8行第9列的数5开始.第三步,从选定的数字5开始,向右读下去,得到第一个两位数字号码59,由于59>39,将它去掉;继续向右读,得到16,将它取出;继续下去,又得到19,10,12,07,39,38,33,21,随后的两位数字号码是12,由于它在前面已经取出,将它去掉,再继续下去,得到34.至此,10个样本已经取满,于是,所要抽取的样本号码是:16,19,10,12,07,39,38,33,21,34.(6)使用随机数表法的注意事项:利用随机数表抽取样本时,数表中的数字可以两两连在一起,也可以三三连在一起,这就要视总体中个体的个数而言.如果总体中个体的个数不多于100个,我们一般用两位数表,即将数表中的数码两两连在一起,如01,23,99,…;如果总体中个体的个数多于100个而不多于1000个,我们一般用三位数,就是将数码三三连在一起,如012,567,999,…;….除此之外,当选定开始读数的数后,读数的方向可以向右,也可以向左、向上、向下等等。如在上一个实例中,当选定数码5后,我们也可以向左读取数码,这样得到样本号码分别是:01,06,12,25,33,21,04,24,31,17.(7)随机数表法的适用范围:适用于总体中个体个数较少时抽取样本的抽样方法.当总体中个体数较多时,利用随机数表选数将变得比较麻烦.三、系统抽样1.定义当总体中个体的个数较多时,采用简单随机抽样显得较为费事.这时,可将总体平均分成几部分,然后按照预先定出的规则,从每个部分中抽取一个个体,得到所需要的样本,这样的抽样方法称为系统抽样。例如,为了了解参加某种知识竞赛的1000名学生的成绩,打算从中抽取一个容量为50的样本。假定这1000名学生的编号是1,2,…,1000,由于50∶1000=1∶20,我们将总体分成50部分,其中每一部分包括20个个体,例如第1部分的编号是1,2,…,20.然后在第1部分利用简单随机抽样的方法随机抽取一个号码,比如它是18,那么可以从第18号起,按事先确定的规则,如每隔20个抽取一个号码,这样得到一个容量为50的样本:18,38,58,…,978,998.上例中,由于总体中的个体数1000恰好是50的倍数,可以被样本容量50整除,可以用它们的比值作为进行系统抽样的间隔。如果不能整除,比如总体中的个体为1003,样本容量仍为50,这时可用简单随机抽样先从总体中剔除3个个体(抽签法和随机数表法均可),使剩下的个体数1000能被样本容量50整除,然后再按系统抽样方法往下进行.2.系统抽样的步骤(1)采用随机的方式将总体中的个体编号.(2)将整个的编号按一定的间隔分段(样本容量是几,就分成几部分),要确定分段的间隔。当(N为总体中的个体数,n为样本容量)是整数时,k=;当不是整数时,通过从总体中剔除一些个体使剩下的总体中个体个数N`能被n整除,这时k=.(3)在第1段中用简单随机抽样的方法确定起始号m。(4)将编号为m,m+k,m+2k,…,m+(n—1)k的个体抽出.3.系统抽样与简单随机抽样的联系系统抽样与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样.4.系统抽样的优点和缺点系统抽样的优点是简便易行;当对总体结构有一定了解时,充分利用已有信息对总体中的个体进行排队再抽样,可提高抽样的效率;当总体中的个体存在一种自然编号时,便于施行系统抽样法。系统抽样的缺点是在不了解样本总体的情况下,所抽出的样本可能有一定的偏差。四、分层抽样1.定义一般地,当已知总体由差异明显的几部分组成时,为了使样本更客观地反映总体的情况,通常将总体中的个体按不同的特点分层次比较分明的几部分,然后按照各部分在总体中所占的比实施抽样,这样的抽样方法就叫分层抽样。其中所分成的各部分称为层。例如,一个单位的职工有500人,其中不到35岁的有125人,35岁到49岁之间的有280人,50岁以上的有95人。为了了解这个单位职工与身体状况有关的某项指标,要从中抽取一个容量为100的样本.总体是由差异明显的几部分组成的.不同年龄的职工的身体状况差异比较大,不能在这500人中随机地抽取100人,也不宜在这三个年龄段的职工中平均抽取样本.这时,前面所学的两种抽样方法都不适用,因为这两种抽样方法都不能准确地反映客观实际,这就需要一个更有效的抽样方法——分层抽样.具体的操作过程是:(1)确定各年龄段被抽的人数.由于样本容量与总体中的个体数的比为100∶500=1∶5,所以在各年龄段抽取的个体数依次为,,,即25,56,19.(2)用简单随机抽样或系统抽样的方法抽出各年龄段作为样本的职工.分层抽样的特点是:分层抽样时,每个个体被抽到的可能性是相等的。由于分层抽样充分利用了已知信息,使样本具有较好的代表性,而且在各层抽样时,可以根据具体情况采取不同的抽样方法,因此分层抽样在实践中有着非常广泛的应用.2.分层抽样的步骤(1)将总体按一定的标准(分层的标准由题意来确定)分层;(2)计算各层的个体数与总体的个体的比;(3)按各层中个体数占总体的比确定各层应抽取的样本容量;(4)在每一层进行抽样,抽样时根据各层中个体的个数选择适当的抽样方法:个体数较少时用简单随机抽样,当个体数较多时可采用系统抽样.3.三种抽样方法的特点与适用范围分层抽样和简单随机抽样、系统抽样的联系:将总体分成几层,分层抽取样本时采用简单随机抽样或系统抽样.简单随机抽样、系统抽样和分层抽样关系密切,对抽取样本来说,可谓异曲同工.无论采取哪一种抽样方法,必须保证在整个抽样过程中每个个体被抽到的可能性相等。为了对三种抽样方法进行比较,加深对三者的理解,以达到在抽样实践中正确地对它们进行选择的功效,教材又将三种抽样方法的特点和适用范围进行了归纳,现列表如下:类别特点相互联系适用范围共同点简单随机抽样从总体中逐个抽取总体中个体个数较少抽样过程中每个个体被抽到的可能性相等系统抽样将总体均分为几部分,按事先确定的规则在各部分抽取在起始部分抽样时采用简单随机抽样总体中个体个数较多分层抽样将总体分成几层,分层进行抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成抓住三种抽样方法的本质特征是正确应用这三种抽样方法的前提。问题探究问题1:吸烟有害健康。你知道吗?被动吸烟(在吸烟的环境中被动地吸入烟气)也大大危害着人类的健康.为此,联合国规定每年的5月31日为世界无烟日。让我们行动起来,在无烟的环境中健康地成长和生活.请你想一想,如果让你统计你们地区居民的吸烟状况,你会采用什么方法,注意什么问题?探究:由于不论是哪一个地区,人口都很多,我们不可能对每个对象都进行调查,只能从其中抽取一部分来进行调查.这就涉及到了抽样方法的选取.我们学的抽样方法有三种:简单随机抽样、系统抽样和分层抽样.这三种抽样方法有着各自的特点和适用范围。简单随机抽样简便易行,但它只适用于个体数较少的总体,当总体中个体个数较多时我们常采用系统抽样的方法抽取样本。当总体由差异明显的几部分组成时我们宜采用分层抽样的方法。由于不论是哪个地区吸烟的人群中年龄、性别、经济基础和工作性质都有着很大的区别,所以在抽取样本时宜采用分层抽样的方法(如可按年龄分层,也可以按性别分层).而在每层抽取样本时,再根据实际情况来选取是用简单随机抽样还是采用系统抽样.问题2:抽样方法在实际生活中有着广泛的应用.你能说说都有哪些吗?探究:我们生活在一个数字化的时代,时时刻刻都在与数据打交道,如产品的合格率、农作物的产量、商品销售量、当地的气温、就业状况、电视台的收视率等。这些数据都是通过抽样的方法得到的。常用的抽样方法有三种:简单随机抽样、系统抽样和分层抽样,这三种抽样方法关系密切,对抽取样本来说,可谓异曲同工.无论采取哪一种抽样方法,必须保证在整个抽样过程中每个个体被抽到的可能性是相等的.而在实际操作时,应根据总体中的个体数和个体的特点来选择适当的抽样方法.例如:要从高一(1)班40名学生中随机抽选8人去参加一项活动,我们应采用简单随机抽样的方法。但应注意:由于总体的复杂性,在实际抽样中,为了使样本具有代表性,通常要同时使用几种抽样方法。问题3:1936年,美国《文学文摘》杂志根据1000万户电话用户和从该杂志订户所收回的意见,断言兰登将以370∶161的优势在总统选举中击败罗斯福.但结果是,罗斯福当选了,《文学文摘》大丢面子.你知道原因何在吗?探究:在实际抽样中,应使样本具有代表性,对于美国选民来说他们在年龄、性别、经济基础和工作性质等方面都有着很大的区别.因此在抽样调查时,应采用分层抽样的方法进行抽样,这样才能使样本具有一定代表性。在1936年使用电话或订阅《文学文摘》杂志的人,在经济上都相对富裕,而收入不高的是大多数的选民,他们选择了罗斯福.《文学文摘》的教训表明,抽样抽查时,既要关注样本的大小,又要关注样本的代表性。精题精讲例1.某工厂有工人1200人,为了调查某种情况打算抽取一个样本容量为50的样本,问此样本若采用简单随机抽样将如何获得?思路解析简单随机抽样分两种:抽签法和随机数表法.尽管此题的总体中的个数不算少,但依题意其操作过程能保障每一个个体被抽到的机会等可能.所以,可将这1200个工人进行编号,利用抽签法或随机数表法来进行抽样。解法一:首先,把该工厂的工人都编上号码:0001,0002,0003,…,1200.如用抽签法,则作1200个形状、大小相同的号签(号签可以用小球、卡片、纸条等制作),然后将这些号混合放在同一个箱子里,进行均匀搅拌。抽签时,每次从中抽一个号签,连续抽50次,就得到一个容量为50的样本.解法二:首先,把该工厂的工人都编上号码:0001,0002,0003,…,1200.如用随机数表法,则可在数表上随机选定一个起始位置.假如起始位置是表中第5行第9列的数字从6开始向右连续取数字,以4个数为一组,碰到右边线时向下错一行向左继续取,所得数字如下:6438,5482,4622,3162,4309,9006,1844,3253,2383,0130,3046,1943,6248,3469,0253,7887,3239,7371,2845,3445,9493,4977,2261,8442,….所录取的4位数字如果小于或等于1200,则对应此号的工人就是被抽取的个体;如果所取的4位数大于1200而小于2400,则减去1200剩余数即是被抽取的号码;如果所取的4位数大于2400而小于3600,则减去2400剩余数即是被抽取的号码…(出现重复数则去掉)可得下列数字:0438,0682,1022,0762,0709,0606,0644,0853,1183,0130,0646,0743,0248,1069,0253,0687,0839,0171,0445,1045,1093,0177,1061,0042,…,一直取够50人为止.绿色通道本题的解法体现了简单随机抽样的适用范围和步骤。规范的、不带主观意向的随机抽样,才能保证公平性、客观性、准确性和可信性。而利用随机数表法进行抽样时,数表中数字的位数要与编号的位数一致.例2.某单位有在岗职工1244人,为了调查工人上班时,从离开家到来到单位的路上平均所用时间,决定从中抽取10%的工人调查这一情况。如何采用系统抽样方法完成这一抽样?思路解析由于总体中个体数比较多,且抽取的样本中个体的个数也比较多,如果此时再用简单随机抽样,则操作过程将比较麻烦.所以此时可以考虑系统抽样。抽样时总体中的每个个体,都必须等可能地入样。本题中总体中个体数为1244,而为了抽取一个容量为120的样本,只有先剔除总体中的一部分个体才能实现“等距"入样,且又具有等可能性。因此,解此题时,应选用系统抽样法,且应先剔除,再“分段”,后定起始位置。解:首先,将在岗的工人1244人,用随机方式编号(如按出生年月顺序),0000,0001,0002,0003,…,1243.第二步,由题意知,应取124人的样本。因为不是整数,所以应从总体中剔除4个人,(剔除方法用随机数表法或抽签法)将余下的1200人,按编号顺序补齐0000,0001,0002,0003,…,1239分成120段,每段10人,在第一段0000,0001,0002,…,0009这十个编号中随机定一起始号为m,则编号m,m+10,m+20,…,m+119×10为所取的样本。绿色通道采用系统抽样可以减少工作量,提高可操作性,减少人为的导向和误差.当总体中个体数不能被所抽样本中个体数整除时,必须先用简单随机抽样的方法从中抽取几个样本,以使余下的总体中的个体数被样本中的个体数整除。利用随机抽样的方法抽取样本时,总体中的个体数必须是样本中个体的倍数,否则必须先用简单随机抽样的方法从中抽取几个样本,使余下的总体中的个体数被样本中的个体数整除.例3.要从高一(1)班40名学生中随机抽选8人去参加一项活动,分别用抽签法和随机数表法进行抽签,并写出过程.思路解析本题考查抽签法和随机数表法的步骤应用。先将40名学生编号,然后按抽签法和随机数表法的步骤进行抽样即可.解:抽签法:将全班40名学生编号,可编号为00,01,02,…,39,并把号码写在形状、大小相同的小球上,然后将这些号签放在同一个箱子中,搅拌均匀.每次从中抽出一个号签,连续抽取8次,便可得到一个容量为8的样本,参加比赛的8人便产生了.当然,也可以一次从中取出8个号签.随机数表法:第一步,先将这40名学生编号,可以编为00,01,02,…,39.第二步,在附录1随机数表中任选出一个数作为开始.例如从第8行第9列的数5开始。第三步,从选定的数字5开始,向右读下去,得到第一个两位数字号码59,由于59〉39,将它去掉;继续向右读,得到16,将它取出;继续下去,又得到19,10,12,07,39,38,33.至此,8个样本已经取满,于是,所要抽取的样本号码是:16,19,10,12,07,39,38,33.参加比赛的8人便产生了.绿色通道简单随机抽样的方法适用于总体中个体数较少时。在用抽签法抽取样本时,为了体现抽签的客观性和公平性,在制作号签时,一定要注意使号签的大小、形状都相同.利用随机数表法抽样本时,起始数字可以随便选择,在读数时,读数的方向可以向右,也可以向左、向上、向下等等,只要具有一定的规律就可以.如果总体中个体的个数不多于100个,我们一般用两位数表,即将数表中的数码两两连在一起,如01,23,…,99.例4.在1000个有机会中奖的号码(编号为000~999)中,在公证部门监督下按照随机抽取的方法确定后两位为88的号码为中奖号码,这是运用哪种抽样方法来确定中奖号码的?依次写出这10个中奖号码。思路解析由于总体中个体的个数较多,且被抽取的号码有一定的规律性,故不宜采用随机抽样,因为随机抽样抽取的号码具有随机性,所以宜采用系统抽样。解:题中运用了系统抽样的方法来确定中奖号码,中奖号码依次为088,188,288,388,488,588,688,788,888,988.绿色通道若题目中出现判断采用何种抽样方法时,可根据各抽样方法的定义来判断.利用系统抽样的方法抽取样本时,如果规则已给出,则按题中给出的规则抽取样本即可.例5.为了考察某校的教学水平,将抽查这个学校高三年级的部分学生的本学年考试成绩。为了全面地反映实际情况,采用以下三种方式进行抽查(已知该校高三年级共有20个教学班,并且每个班内的学生已经按随机方式编好了学号,假定该校每班学生人数都相同):①从全年级20个班中任意抽取一个班,再从该班中任意抽取20人,考察他们的学习成绩;②每个班抽取1人,共计20人,考察这20个学生的成绩;③把学生按成绩分成优秀、良好、普通三个级别,从中抽取100名学生进行考察(已知:若按成绩分,该校高三学生中优秀生共150人,良好生共600人,普通生共250人)。根据上面的叙述,试回答下列问题:(1)上面三种抽取方式中,其中总体、个体、样本分别指的是什么?每一种抽取方式抽取的样本中,其样本容量分别是多少?(2)上面三种抽取方式中各自采用何种抽取样本的方法?(3)试分别写出上面三种抽取方式各自抽取样本的步骤。思路解析本题目主要考查数理统计中的一些基本概念和基本方法。做这种题目时,应该注意叙述的完整性和条理性.解:(1)这三种抽取方式中,其总体都是指该校高三全体学生本年度的考试成绩;个体都是指高三年级每个学生本年度的考试成绩.其中第一种抽取方式中样本为所抽取的20名学生本年

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论