概率、概率分布与抽样分布.ppt_第1页
概率、概率分布与抽样分布.ppt_第2页
概率、概率分布与抽样分布.ppt_第3页
概率、概率分布与抽样分布.ppt_第4页
概率、概率分布与抽样分布.ppt_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计推断的过程,第三章概率、概率分布与抽样分布,第一节常用的抽样方法第二节抽样分布,1、理解常用的概率抽样方法概念2、掌握抽样分布的概念3、掌握单一总体的样本统计量的分布及特征4、理解中心极限定理的内涵,学习目标与要求,第一节常用的抽样方法,一、概率抽样(probabilitysampling),1、含义:根据一个已知的概率来抽取样本单位,也称随机抽样。2、特点:按随机原则抽取样本:每个单位都有机会每个单位被抽取的概率是已知或可计算的当用样本对总体估计时,要考虑每个样本单位被抽中的概率,随机原则:在从总体中抽取样本单位时,每一个单位被抽中的可能性相等,且不被人为确定。,3、常用的概率抽样方法,(1)简单随机抽样(simplerandomsampling)从总体N个单位中随机抽取n个单位作为样本,使得每一个单位都有相同的概率被抽中的抽样方式。两种抽取方法:重复抽样(samplingwithreplacement)不重复抽样(samplingwithoutreplacement优点:简单、直观用样本统计量对总体参数进行估计比较方便局限性:当N和n很大时,工作量太大抽出的单位分散,给实施调查增加了困难,(2)分层抽样(stratifiedsampling)将总体单位按某种特征划分为若干不同的层,然后从各个层中抽取一定数量的单位共同构成样本的抽样方式。优点:保证样本与总体结构相近,可提高估计精度组织实施调查方便既可估计总体,也可估计各层子总体分层注意事项:层的划分应尽可能符合数据规律,使样本很好代表总体,应遵循“层间差异大,层内差异小”。,(3)系统抽样(systematicsampling)将总体所有单位按一定顺序排列后,按某种规则随机地确定一个单位为抽样起点,每间隔一定距离抽取一个单位组成样本的抽样方式。也称等距抽样或机械抽样实施方法:排序后,将单位编号1,2,N;确定距离k=N/n,随机取r1,k作为初始位置;依次取r+k,r+2k,r+(n-1)k等位置单位,组成样本。,优点:操作简便;总体数量均匀分布时可提高估计精度缺点:对估计量方差的估计比较困难,(4)整群抽样(clustersampling)将总体划分为若干个组(群),随机抽取部分群,然后对中选群中的所有单位进行调查的抽样方式。优点:抽样时只需群的抽样框,简化工作量调查相对集中,节省调查费用,方便调查实施缺点:估计的精度较差整群抽样注意事项:组群的划分应尽可能符合数据规律,体现出“群内差异大,群间差异小”的原则。,二、非概率抽样(non-probabilitysampling),1、含义:抽取样本时不是依据随机原则,而是根据研究目的的要求,采用从总体中人为的选取部分单位实施调查。2、主要抽样方式:方便抽样:确定样本单位时主要考虑到方便抽取的因素。判断抽样:研究人员根据研究内容和以往的经验来确定所抽取的样本单位。3、特点:不能对总体进行推断,第二节抽样分布,一、参数与统计量二、抽样分布的概念三、样本均值的抽样分布四、样本比率的抽样分布五、样本方差的抽样分布,一、参数与统计量,1、参数(Parameter)用来描述总体特征的综合指标。基于总体资料计算:,2、统计量(Statistic)用来描述样本特征的指标。基于样本资料计算得到:,或,、,、,相关提示:统计量是根据具体样本数据计算而得的一个函数统计量中不包含任何未知参数,3、参数与统计量的关系,对于一个既定总体来说,参数是确定的、唯一的。而从同一个总体由于抽取的样本组成单位不同,由此计算出的统计量则是随机变量。实践工作中,总体特征往往未知,需要由样本资料进行估计,即由统计量来估计参数。,1、总体分布:总体各元素的观察值所形成的分布。2、样本分布:一个样本容量为n的样本中n个观察值的分布。3、抽样分布:统计量所有可能取值形成的概率分布。1)是一种理论概率分布2)样本统计量是随机变量样本均值,样本比例等3)结果来自容量相同的所有可能样本,二、抽样分布,三、样本均值的抽样分布,、概念要点1)在重复选取容量为n的样本时,由样本均值的所有可能取值形成的概率分布。2)一种理论概率分布3)是推断总体均值的理论基础,、形成过程(一个例子),【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4个个体分别为X1=1、X2=2、X3=3、X4=4。总体的均值、方差及分布如下,均值和方差,现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下表,计算出各样本的均值,如下表。并给出样本均值的抽样分布,3、抽样分布形式,抽样分布,=2.52=1.25,总体分布,的分布形式与原有总体和样本容量n的大小有关,当总体服从正态分布N(,2)时,来自该总体的所有容量为n的样本的均值X也服从正态分布,X的数学期望为,方差为2/n。即XN(,2/n)。,中心极限定理,中心极限定理:从均值为,方差为2的总体中抽取容量为n的样本,当n充分大时(通常n=30),样本均值的抽样分布近似服从均值为、方差为2/n的正态分布。,中心极限定理,x的分布趋于正态分布的过程,样本均值的抽样分布与总体分布的关系,4、样本均值抽样分布的特征,1样本均值的数学期望2样本均值的方差重复抽样不重复抽样,从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本均值的结果如下表:,式中:M为可能样本数目,是指从一个有N个单位的总体中抽取容量为n的样本时,出现的所有可能样本的个数。结论:)样本均值的均值(数学期望)等于总体均值)样本均值的方差等于总体方差的1/n,三、样本比率的抽样分布(适于研究品质数据),、比率的概念:比率:又叫成数,总体(或样本)中具有某种属性的单位与全部单位总数之比。不同性别的人与全部人数之比合格品(或不合格品)与全部产品总数之比1)总体比率可表示为2)样本比率可表示为,2、概念要点,)在重复选取容量为n的样本时,由样本比率的所有可能取值形成的概率分布。)一种理论概率分布。)当样本容量很大时(np5和n(1-p)5)样本比率的抽样分布可用正态分布近似。)推断总体比例的理论基础。,3、样本比例的抽样分布特征,1)样本

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论