统计基础 课件 项目五 抽样推断_第1页
统计基础 课件 项目五 抽样推断_第2页
统计基础 课件 项目五 抽样推断_第3页
统计基础 课件 项目五 抽样推断_第4页
统计基础 课件 项目五 抽样推断_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计基础新时代高等院校课证融合新形态一体化教材抽样推断项目五01抽样推断概述抽样推断的理论基础——大数定律与中心极限定理随机抽样方法与抽样分布0203CONTENTS参数估计Excel在抽样推断中的应用0405PART01抽样推断概述一、抽样推断的概念和特点(一)抽样推断的概念抽样推断是指,按照随机原则从总体中抽取一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对总体做出数量上的推断分析的一种统计方法。(二)抽样推断的特点4.抽样推断的抽样误差不可避免,但可以计算,并且可以加以控制。抽样推断则对部分单位进行统计调查,在实际观察标志值的基础上,去推断总体的综合数量特征。3.抽选部分单位时要遵循随机原则。从总体中抽取部分单位时,必须非常客观,毫无偏见,也就是严格按照随机原则抽取调查单位,不受调查人员任何主观意图的影响。2.有些情况下,抽样推断的结果比全面调查的结果要准确。抽样推断的调查单位少,参加调查汇总的人员也少,可以进行严格的培训,因而发生登记误差的可能性就小。在这种情况下,抽样推断的结果会比全面调查的结果更为准确。1.和全面调查相比较,抽样推断能节省人力、费用和时间,且比较灵活。抽样推断的调查单位比全面调查少得多,因而既能节约人力、费用和时间,又能比较快地得到调查的结果,这对许多工作都是很有利的。(1)在不可能进行全面调查的情况下可以使用抽样推断的方法。(5)用于生产管理。抽样推断可以用于生产过程中的质量控制,检查生产工艺过程是否正常。(2)有些总体从理论上讲可以进行全面调查,但实际办不到或没有必要,可以用抽样推断的方法解决。(4)对全面调查资料进行评价与修正。(3)用于那些具有破坏性与消耗性的产品的质量检查。二、抽样推断的作用抽样推断主要具有以下五个方面的作用。三、抽样推断中的几个基本概念(一)全及总体和抽样总体在抽样调查中,有两种不同的总体,即全及总体和抽样总体。1.全及总体全及总体简称总体,它是指所要认识对象的全体,总体是由具有某种共同性质的许多单位组成的,因此,总体也就是具有同一性质的许多单位的集合体。1.全及指标根据全及总体各个单位的标志值或标志特征计算的、反映总体某种属性的综合指标,称为全及指标。由于全及总体是唯一确定的,根据全及总体计算的全及指标也是唯一确定的。2.抽样总体抽样总体简称样本,是从全及总体中随机抽取出来的,代表全及总体部分单位的集合体。抽样总体的单位数通常用小写英文字母n表示。2.抽样指标由抽样总体各个标志值或标志特征计算得到的综合指标称为抽样指标。和全及指标相对应还有抽样平均数

、抽样成数

p、样本标准差

S

和样本方差

S2

等。(二)全及指标和抽样指标三、抽样推断中的几个基本概念(三)重置抽样与不重置抽样1.重置抽样重置抽样又称有放回的抽样,它是指从全及总体

N

个单位中随机抽取一个容量为n的样本,每次抽中的单位经登记其有关标志表现后又放回总体中重新参加下一次抽选的抽样。1.抽样框抽样框又称抽样结构,它是指对可以选择作为样本的总体单位列出名册或排序编号,以确定总体的抽样范围和结构。设计出了抽样框后,便可采用抽签的方式或按照随机数表来抽选必要的单位数。2.不重置抽样不重置抽样又称无放回的抽样,它是指从全及总体

N

个单位中随机抽取一个容量为

n

的样本,每次抽中的单位经登记其有关标志表现后不再放回总体中参加下一次抽选的抽样。2.样本数样本数是指从总体

N

个单位中随机抽选

n

个单位构成样本,通常有多种抽选方法,每一种抽选方法实际上是

n

个总体单位的一种排列组合,一种排列组合便构成一个可能的样本,n

个总体单位的排列组合总数,称为样本的可能数目。(四)抽样框与样本数PART02抽样推断的理论基础——大数定律与中心极限定理大数定律是指,在随机试验中,每次出现的结果不同,但是大量重复试验出现的结果的平均值却几乎总是接近于某个确定的值。其原因是,在大量的观察试验中,个别的、偶然的因素影响所产生的差异会相互抵消,从而使现象的必然规律性显示出来。例如,观察个别或少数家庭的婴儿出生情况,发现有的生男,有的生女,没有一定的规律性,但是通过大量的观察试验,就会发现,男婴和女婴占婴儿总数的比重均趋于50%。抽样推断的理论基础主要是概率论的极限定理中的大数定律与中心极限定理。一、大数定律二、中心极限定理中心极限定理是统计学中一个十分重要的定理,它奠定了抽样的理论基础,并把正态分布广泛应用于抽样推断。其内容为给出一个具有任意函数形式的总体,其平均值μ和方差σ2有限。在对该总体进行抽样时,随着样本容量n的增加,由这些样本算出的样本平均数x的抽样分布将近似服从平均数为μ和方差为σ2/n的正态分布。简言之,若统计量

,则z近似服从标准正态分布。PART03随机抽样方法与抽样分布随机抽样的方法有重复简单随机抽样与不重复简单随机抽样两种,下面研究这两种抽样方法及其分布。一、重复简单随机抽样与抽样分布重复简单随机抽样又称重置抽样,是从具有

N

个单位的总体中随机抽取n个单位为样本,每次从总体中抽取一个单位登记其序号或标志值之后,又将它重新放回总体参加下一次抽选,连续进行

n

次抽选便构成了一个容量为

n

的样本。该抽样方法的特点是:第一,总共可以构成Nn

个可能的样本,每个样本被抽取的概率都是相同的.第二,由于是重复抽样,因此在n次抽样中,总体中每个单位在各次抽样中被抽取的概率都相同,n次抽样就是n次相互独立的试验。随机抽样的方法有重复简单随机抽样与不重复简单随机抽样两种,下面研究这两种抽样方法及其分布。二、不重复简单随机抽样与抽样分布不重复简单随机抽样也称不重置简单随机抽样,是从具有N个单位的总体中随机抽取一个容量为n的样本,但每一次抽取一个单位登记其序号或标志值之后,不再将其重新放回总体参加下一次的抽选,因此这种抽样方法实际上也就是一次同时从总体中抽取n个单位组成一个样本。该种抽样方法的特点是:(1)总共可构成AnN=N!(N-n)!个可能的样本,每个样本被抽取的概率都是相同的。(2)由于是不重复抽样,每抽样一次,总体就少了1个单位数,因此在n次抽样中,每个单位在各次抽样中被抽取的概率不同,n次抽样不是相互独立的n次试验。PART04参数估计一、点估计点估计也称定值估计,是用样本的统计量直接估计和代表总体参数,即用样本指标直接代表总体指标的参数估计方法。例如,用样本平均数x直接估计总体平均数X,用样本成数p直接估计总体成数P,用修正样本方差S2直接估计总体方差σ2。点估计简单易行,但不考虑抽样误差及可靠程度,只适用于对推断的准确程度与可靠程度要求不高的情况。参数估计是用样本统计量估计总体参数的方法,即以计算的样本指标来估计相应全及指标的方法。参数估计的方法有两种:点估计和区间估计。二、区间估计区间估计就是用点估计量和它的标准误差(抽样平均误差)构成的区间估计总体参数,并说明总体参数落在这样一个区间的可能性或置信度。区间估计必须具备三个基本要素:一是点估计量,可以是样本的平均数

,也可以是样本成数p;二是误差范围,即抽样极限误差Δx,通常都用样本指标(点估计量)±抽样极限误差来表示总体指标的估计区间,这个区间也叫作置信区间;三是置信度

F(t)=1-α,表示总体指标落入估计区间有多大的概率保证。可以用数学公式简洁地表示区间估计P(样本指标-极限误差≤总体指标≤样本指标+极限误差)=F(t)=1-α抽样极限误差可以用概率度t和抽样平均误差

μ

相乘得到,即Δx=tμ概率度t可以通过查正态分布概率表得到。当

F(t)=0.9500时,查正态分布概率表t=1.96;当

F(t)=0.9545时,t=2;当

F(t)=0.9973时,t=3。(一)总体平均数的区间估计(二)总体成数的区间估计用区间估计的方法来估计总体平均数,必须具备三要素:点估计量即样本平均数

、平均数的抽样极限误差Δx

和置信度F(t)。公式如下式中,.用区间估计的方法来估计总体成数P,同样必须具备三要素:点估计量即样本成数

p,成数的抽样极限误差Δp

和置信度F(t)。公式如下式中,.三、必要抽样数目的确定在开始组织抽样之前,确定抽多少样本是个很重要的问题,抽得多浪费,抽得少误差大,用样本指标估计总体指标的可靠性就小。因此,确定抽样数目具有非常重要的意义。(一)影响抽样数目的因素影响抽样数目的因素有:(1)被调查标志的变异程度,即总体标准差σ。(2)允许误差(极限误差),即Δx的数值。(4)抽样方法。在同等条件下,重置抽样需要多抽一些样本单位,不重置抽样则可少抽一些样本单位。(3)概率度t。(5)抽样的组织方式。简单随机抽样、类型随机抽样、等距随机抽样、整群随机抽样、阶段随机抽样等都是抽样的组织方式,由于采用的组织方式不同,必要抽样数目也不相同。(二)必要抽样数目的计算1.重复抽样条件下平均数的必要抽样数目的确定因为故2.重复抽样条件下成数的必要抽样数目的确定因为故3.不重复抽样条件下平均数的必要抽样数目的确定因为故4.不重复抽样条件下成数的必要抽样数目的确定因为故PART05Excel在抽样推断中的应用一、利用Excel抽取样本(1)Excel中输入所有总体单位,切换到“数据”选项卡,单击“数据分析”按钮,打开“数据分析”对话框,在“分析工具”列表框中选择“抽样”选项,单击“确定”按钮,打开“抽样”对话框,如图5-5-1所示。(2)在“抽样”对话框的“输入区域”输入框中输入所有的总体单位,然后选择抽样方法为“周期”或者“随机”,单击“确定”按钮即得到需要的样本数据。抽样方法主要有“周期”和“随机”两种抽样模式。“周期”模式即所谓的等距抽样。“随机”模式适用于简单随机抽样,只需在“样本数”中填好所需抽取的样本单位数即可。Excel提供了从众多总体单位中抽取样本的功能。具体步骤为:图5-5-1“抽样”对话框二、利用Excel进行区间估计Excel提供了计算总体平均值的置信区间的CONFIDENCE函数,但是主要针对重复抽样方法。如果采取的是不重复抽样,则需要对求出的结果进行转化。例5-5-1以任务五中任务引入的实例为例说明利用Excel进行区间估计的操作步骤。(1)切换到“公式”选项卡,单击“插入函数”按钮,打开“插入函数”对话框,展开“或选择类别”下拉列表,选择“全部”选项,再在“选择函数”列表框中选择“CONFIDENCE”选项,单击“确定”按钮。(2)打开CONFIDENCE“函数参数”对话框,如图5-5-2所示。对话框中的“Alpha”代表显著水平,指的是估计总体参数落在某一区间内,可能犯错误的概率,如概率保证程度为0.95,那么“Alpha”为“0.05”。“Standard_dev”代表总体标准差,“Size”为样本容量。图5-5-2

CONFIDENCE“函数参数”对话框(3)求出的结果为抽样极限误差

,或Δp,这时可利用公式进行区间估计。如果资料是利用不重复抽样试验获取的,那么这时需要注意在求得抽样极限误差的结果后乘以

。本任务中利用CONFIDENCE

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论