(1.4)-第4章 抽样与抽样分布_第1页
(1.4)-第4章 抽样与抽样分布_第2页
(1.4)-第4章 抽样与抽样分布_第3页
(1.4)-第4章 抽样与抽样分布_第4页
(1.4)-第4章 抽样与抽样分布_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

抽样与抽样分布抽样的基本问题1抽样的常用方法2抽样中常用的几种分布3样本均值的抽样分布4本章学习内容样本比例和方差的抽样分布5抽样的基本问题什么是抽样调查1抽样调查的相关概念2抽样估计3抽样方法4本节学习内容抽样误差5影响抽样误差的因素6什么是抽样调查【例】一汽车轮胎制造商生产一种被认为寿命更长的新型轮胎。【例】某党派想支持某一候选人参选美国某州议员,为了决定是否支持该候选人,该党派领导需要估计支持该候选人的民众占全部登记投票人总数的比例。由于时间及财力的限制:120个样本平均里程36,500公里新轮胎平均寿命36,500公里测试推断400个样本支持人数160人支持该候选人的选民占全部选民的比例160/400=40%测试推断什么是抽样调查抽样调查的概念按照一定方式,从调查总体中抽取能代表总体的一部分(即样本)进行调查,然后用样本所包含信息对总体的状况进行估计和推算的一种调查方法。抽样调查的适用范围对一些不可能或不必要进行全面调查的项目;经费、人力、物力和时间有限的情况;运用抽样调查对全面调查或普查进行验证;对某种总体的假设进行检验,判断这种假设的真伪,以决定行为的取舍。抽样调查的相关概念全及总体和样本总体全及总体研究对象的全体,即第一章中学过的总体。全及总体中所包括的单位数一般用N表示。有限总体和无限总体。样本总体按随机原则从全及总体中抽取一部分单位组成的集合体,又叫抽样总体。样本总体中所包括的单位数叫样本容量,一般用n表示。大样本(n≥30)和小样本(n≤30)。抽样调查的相关概念全及指标和样本指标全及指标指被估计的总体指标,又被称为总体参数。设总体中个总体单位某项标志的标志值分别为,其中具有某种属性的有个单位,不具有某种属性的有个单位,则(1)总体平均数(又叫总体均值):抽样调查的相关概念全及指标和样本指标全及指标指被估计的总体指标,又被称为总体参数设总体中个总体单位某项标志的标志值分别为,其中具有某种属性的有个单位,不具有某种属性的有个单位,则(2)总体标准差:抽样调查的相关概念全及指标和样本指标全及指标指被估计的总体指标,又被称为总体参数设总体中个总体单位某项标志的标志值分别为,其中具有某种属性的有个单位,不具有某种属性的有个单位,则(3)总体方差:抽样调查的相关概念全及指标和样本指标全及指标指被估计的总体指标,又被称为总体参数设总体中个总体单位某项标志的标志值分别为,其中具有某种属性的有个单位,不具有某种属性的有个单位,则(4)总体比例:抽样调查的相关概念全及指标和样本指标样本指标指根据样本单位的标志值计算的用以估计和推断相应总体指标的综合指标,又被称为估计量或统计量。设样本中个样本单位某项标志的标志值分别为,其中具有和不具有某种属性的样本单位数目分别为和个,则(1)样本平均数(又叫样本均值)抽样调查的相关概念全及指标和样本指标样本指标指根据样本单位的标志值计算的用以估计和推断相应总体指标的综合指标,又被称为估计量或统计量。设样本中个样本单位某项标志的标志值分别为,其中具有和不具有某种属性的样本单位数目分别为和个,则(2)样本比例抽样调查的相关概念全及指标和样本指标样本指标指根据样本单位的标志值计算的用以估计和推断相应总体指标的综合指标,又被称为估计量或统计量。设样本中个样本单位某项标志的标志值分别为,其中具有和不具有某种属性的样本单位数目分别为和个,则(3)样本单位标志值的标准差:为的无偏估计为自由度抽样调查的相关概念全及指标和样本指标样本指标指根据样本单位的标志值计算的用以估计和推断相应总体指标的综合指标,又被称为估计量或统计量。设样本中个样本单位某项标志的标志值分别为,其中具有和不具有某种属性的样本单位数目分别为和个,则(4)样本单位标志值的方差:为自由度为的无偏估计抽样估计抽样的价值:用样本指标估计、推算总体指标。抽样估计:按照随机原则,从调查对象中抽取一部分单位进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法。随机原则:指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会。抽样估计抽样的价值:用样本指标估计、推算总体指标样本总体指标:统计量(已知量)全及总体指标:参数(未知量)统计推断抽样估计并非所有的抽样估计都按随机原则抽取样本,也有非随机抽样总体随机样本非随机样本与总体分布特征相同与总体分布特征不同抽样估计的特点及一般步骤抽样估计的特点按随机原则抽取样本单位目的是推断总体的数量特征抽样推断的结果具有一定的可靠程度,抽样误差可以事先计算并控制抽样估计的一般步骤设计抽样方案抽取样本单位收集样本数据计算样本统计量推断总体参数抽样方法重复抽样又被称作重置抽样、有放回抽样特点:同一总体单位有可能被重复抽中,而且每次抽取都是独立进行不重复抽样又被称作不重置抽样、不放回抽样特点:同一总体中每个单位被抽中的机会并不均等,在连续抽取时,每次抽取都不是独立进行抽出个体登记特征放回总体继续抽取抽出个体登记特征继续抽取是最为常用的抽样方法,用于无限总体和许多有限总体样本单位的抽样。抽样误差抽样误差,又称随机误差或代表性误差,是遵循随机原则抽样而产生的样本指标(抽样估计值)与总体相应指标的离差。【例】某班4名学生统计学考试成绩分别为70分、75分、80分、85分,其平均分为77.5分,若用抽样方法推算平均数,从中随机抽取2名学生若假设抽到第一、二位学生,则样本平均数为72.5分,此时抽样误差的绝对值为5分。若抽中的是第二、第三位学生,则样本均值为77.5分,相应的抽样误差的绝对值为0分。注:按随机原则抽样时,由于抽到的样本不同,会得到不同的样本指标,具有随机性和偶然性,这种误差是抽样调查本身所固有的、无法避免的误差,这部分误差数值大小不同。影响抽样误差的因素抽样单位的数目(样本容量)个体数目越多,误差越小总体被研究标志的变异程度总体的方差和均方差越大,抽样误差就越大,反之,误差越小。抽样方法的选择不重复抽样比采用重复抽样的抽样误差小抽样组织方式不同利用抽样误差,作为判断各种抽样组织方式的比较标准常用的抽样方法简单随机抽样1系统抽样2分层抽样3整群抽样4本节学习内容随机抽样如何抽取样本,直接关系到对总体估计的准确程度,因此在抽样时要保证每个个体被抽到的机会是均等的,满足这样条件的抽样叫做随机抽样。【例】一个布袋中有6个同样质地的球,从中先后不放回地抽取三个球。第一次抽取时,6个球中的每一个球被抽到的可能性都是____;第二次抽取时,余下的5个球中的每一个被抽到的可能性都是____;第三次抽取时,余下的4个球被抽到的可能性都是____。也就是说,每次抽取时,每个球都有相同的可能性被抽到!常用方法——概念一般地,从元素个数为N的总体中逐个、不放回地抽取容量为n的样本,如果每次抽取时各个个体被抽到的概率相等,这样的抽样方法叫做简单随机抽样,这样抽取的样本,叫做简单随机样本。注意它要求被抽取样本的总体的个体数有限;它是从总体中逐个进行抽取;它是一种不放回抽样;它是一种等概率抽样。简单随机抽样常用方法——方法:抽签法和随机数表法抽签法步骤将总体中的所有个体(共N个)编号(号码可以从1到N),对个体编号时,也可以利用已有的编号。例如学生的学号,座位号等。把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌。抽签时,每次从中抽出1个号签,连续抽取n次,就得到一个容量为n的样本。【例1】从50名同学中随机抽取3人参加心理测试,请设计抽样方法。简单随机抽样常用方法——方法:抽签法和随机数表法抽签法优缺点优点:简单易行缺点:仅适用于个体数较少的总体。当总体个数较多时,搅拌得有可能不均匀,导致抽样不公平。费时费力。简单随机抽样常用方法——方法:抽签法和随机数表法随机数表法随机数表是统计工作者用计算机生成的随机数,并保证表中的每个位置上的数字是等可能出现的。随机数表并不是唯一的,因此可以任选一个数作为开始,读数的方向可以向左,也可以向右、向上、向下等等。用随机数表进行抽样的步骤:将总体中个体编号;选定开始的数字;获取样本号码。由于随机数表是等概率的,因此利用随机数表抽取样本保证了被抽取个体的概率是相等的。简单随机抽样常用方法——方法:抽签法和随机数表法随机数表法注意随机抽样并不是随意或随便抽取,因为随意或随便抽取都会带有主观或客观的影响因素优缺点优点:简单易行,很好地解决了当总体个数较多时抽签法制签难的问题。缺点:当总体个数很多,需要的样本容量也很大时,用此法很不方便简单随机抽样常用方法——方法:抽签法和随机数表法随机数表法【例2】某地举行了一次数字竞赛,参加竞赛的学生300人,为了解竞赛成绩分布情况,试从中抽取一个容量为15的样本。简单随机抽样【解】给300名参赛者进行三位数编号,编号为000,001,002,003……299;选定开始抽样的数字,如从随机数表中任选第5行第10列位置的数4为开始抽样的数字;从选定的数4开始向右三位,三位读下去,得到一系列三位数号码,在得到的三位数号码中去掉大于299的,重复的号码只取一个,则得容量为15的样本号码为246,223,162,061,130,217,209,258,120,163,199,175,128,238,123常用方法——概念当总体的个数较多时,采用简单随机抽样太麻烦,这时将总体分成均衡的部分,然后按照预先定出的规则,从每一部分中抽取1个个体,得到所需要的样本,这种抽样称为系统抽样,也被称为等距抽样。说明系统抽样时,将总体中的个体均分后的每一段进行抽样时,采用简单随机抽样;系统抽样每次抽样时,总体中各个个体被抽取的概率也是相等的;若总体的个体数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行。系统抽样常用方法——步骤先将总体中的N个体编号,有时可直接利用个体自身所带的号码。根据样本容量n把总体均分为n段,确定分段间隔k。是整数时,;不是整数时,先从N中随机剔除一些个体,使得其为整数为止。第一段用简单随机抽样确定起始号码l。按照规则抽取样本:l,l+k,l+2k,……l+(n-1)k适用情况总体容量较大,并且个体之间无明显差异系统抽样常用方法——优缺点优点:操作简便,可提高估计的精度缺点:对估计量方差的估计比较困难练习要从已编号(1~50)的50件产品中随机抽取5件进行检查,用系统抽样可能的编号是(

A、5,10,15,20,25B、3,13,23,33,43

C、1,2,3,4,5,D、2,4,8,16,32从2005个编号中抽取20个号码入样,采用系统抽样的方法,则抽样的间隔为(

A、99B、99.5C、100D、100.5系统抽样B

C常用方法——系统抽样与简单随机抽样的比较方法取舍当总体个数较少,样本容量也较小时当总体个数较多,样本容量较小时当总体个数较多,样本容量也较大时系统抽样类别特点相互联系适用范围共同点简单随机抽样从总体中逐个抽取系统抽样在起始部分抽样时,采用简单随机抽样。总体个数较少在抽样过程中每个个体被抽到的可能性相等系统抽样将总体平均分成几部分,按事先确定的规则分别在各部分抽取总体个数较多且分布均衡抽签法或随机数表法随机数表法系统抽样法常用方法——概念当总体由明显差别的几部分组成时,将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样注分层抽样的一个重要问题是一个总体如何分层。分层抽样中分多少层,要视具体情况而定。总的原则是:层内样本的差异要小,而层与层之间的差异尽可能地大,否则将失去分层的意义。分层抽样常用方法——分层抽样的抽取步骤确定样本容量与总体抽取的比例。由分层情况,确定各层抽取的样本数。各层的抽取数之和应等于样本容量。有些层面上除法算出的结果不是整数时,求其近似整数值。优缺点优点:保证样本的结构与总体的结构比较相近,从而提高估计的精度;组织实施调查方便;既可以对总体参数进行估计,也可以对各层的目标量进行估计。缺点:难以选择相关的分层变

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论