抽样设计培训课件(共62页).ppt_第1页
抽样设计培训课件(共62页).ppt_第2页
抽样设计培训课件(共62页).ppt_第3页
抽样设计培训课件(共62页).ppt_第4页
抽样设计培训课件(共62页).ppt_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、抽样设计抽样设计抽样设计 第一节第一节 抽样概述抽样概述 第二节第二节 抽样方法抽样方法 第三节第三节 样本容量的确定样本容量的确定第一节 抽样概述 一、总体、个体和样本一、总体、个体和样本 二、抽样程序二、抽样程序一、总体、个体和样本(概念要点) 总体总体(Population):调查研究的事物或现象的全体 个体个体(Item unit):组成总体的每个元素 样本样本(Sample):从总体中所抽取的部分个体 样本容量样本容量(Sample size):样本中所含个体的数量 抽样误差(抽样误差(Sampling error):样本统计量与总体参数之差,受样本样本统计量与总体参数之差,受样本量

2、的影响。量的影响。 样本偏差样本偏差(Sample bias):样本的选择性误差,受抽样程序的影响。样本的选择性误差,受抽样程序的影响。样本偏差属于非抽样误差。样本偏差属于非抽样误差。二、抽样程序 1、定义总体 2、识别抽样框 3、确定抽样方法和样本容量 4、执行抽样计划定义总体 定义总体单元:个人、家庭、公司案例:油田地质资料服务 设定总体边界:地域因素、人口统计因素、使用情况。例如:18岁以上,在过去三个月里至少喝过一次白酒,长久居住在武汉市的男性。识别抽样框 抽样框:所定义的总体的清单 完整的抽样框:沪深两地上市公司 不完整的抽样框:最近三个月购买过风影洗发水的武汉市民。一次失败的抽样调

3、查 抽样框误差:遗漏、无被选资格、加倍问题第二节:抽样方法 基本的定量研究的抽样方法分为两类: 概率抽样,总体中的每个样本的中选概率是已知的,因此可以计算抽样误差。 非概率抽样,是靠调研者个人的判断来进行的抽样,所以不能计算抽样误差。抽样方法-概率抽样法a. 简单随机抽样。是指调研人员随机地从总体中抽取预定数量的样本,总体中的每一个单位被选中的概率都是均等的,这个概率等于样本容量与总体容量之商。 必须以一个完整的总体元素列表为依据 b. 等距抽样(系统抽样)。等距抽样是指在总体列表中,先随意选择一个起点,然后按照一个固定的间隔逐一选择起点之后的元素,直到达到预定的样本容量,其中样本间的间隔等于

4、总体容量与样本容量之商。 c. 分层抽样。首先将总体分成相互独立的完全的子集,然后再按照独立的随机抽样方法在各个子集中抽取一定数量的元素构成所需的样本。 d. 整群抽样 。一组一组地从总体中被抽取样本,因此整群抽样也需经过两个步骤:首先将总体分成相互独立的完全的子集合,然后按照随机抽样的方法抽选子集来构成样本。使用SPSS进行简单随机抽样6抽样方法-非概率抽样法a. 便利抽样便利抽样。是指运用最方便的方式来取得样本,又称偶遇抽样。是指运用最方便的方式来取得样本,又称偶遇抽样。b. 判断抽样判断抽样。调研人员依靠自己的主观判断来选择样本,而这些。调研人员依靠自己的主观判断来选择样本,而这些主观判

5、断往往是建立在历史数据或是个人经验的基础上。主观判断往往是建立在历史数据或是个人经验的基础上。 c. 配额抽样配额抽样。首先根据主观判断对总体进行分类,并根据主观标准。首先根据主观判断对总体进行分类,并根据主观标准在每一小类中按一定的比例选取元素构成样本。在每一小类中按一定的比例选取元素构成样本。 d. 滚雪球抽样滚雪球抽样。亦称参考抽样,该法中,研究人员会要求初始被。亦称参考抽样,该法中,研究人员会要求初始被调查者推荐其他样本人群并加以选择,这样样本容量会随着调查者推荐其他样本人群并加以选择,这样样本容量会随着调查的进行而逐步地增加,因此被称为调查的进行而逐步地增加,因此被称为“滚雪球法滚雪

6、球法”。 第三节:样本容量的确定 一、样本均值及比例的抽样分布 二、参数估计的基本方法 三、样本容量的确定方法三种不同性质的分布总体分布总体分布样本分布样本分布抽样分布抽样分布总体中各元素的观察值所形成的概率分布 分布通常是未知的可以假定它服从某种分布 总体分布(population distribution)一个样本中各观察值的分布 也称经验分布 当样本容量n逐渐增大时,样本分布逐渐接近总体的分布 样本分布(sample distribution)样本统计量的概率分布。例如:均值分布是一种理论概率分布随机变量是 样本统计量样本统计量样本均值, 样本比例,样本方差等结果来自容量相同的所有可能样

7、本抽样分布 (sampling distribution)抽样分布 (sampling distribution)湖北理工学院 经济与管理学院样本均值的抽样分布容量相同的所有可能样本的样本均值的概率分布一种理论概率分布进行推断总体总体均值的理论基础样本均值的抽样分布样本均值的抽样分布(例题分析)5 . 21NxNii25. 1)(122NxNii样本均值的抽样分布 (例题分析)3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第二个观察值第一个第一个观察值观察值所有可能的所有可能的n = 2 的样本(共的样本(共16个)

8、个)样本均值的抽样分布 (例题分析)3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第二个观察值第一第一个个观察观察值值16个样本的均值(个样本的均值(x)所有样本均值的均值和方差22211222()()(1.02.5)(4.02.5)0.62516nnixixiixxxMnnn5 . 2160 . 45 . 10 . 11Mxniix样本均值的分布与总体分布的比较 (例题分析)5 . 2X625. 02X样本均值的均值样本均值的方差重复抽样不重复抽样样本均值的抽样分布(均值与方差)(XEnX22122NnNnX均值的

9、抽样标准误所有可能的样本均值的标准差,测度所有样本均值的离散程度小于总体标准差计算公式为nX中心极限定理(central limit theorem) xn x 湖北理工学院 经济与管理学院样本比例的抽样分布总体(或样本)中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品(或不合格品) 与全部产品总数之比总体比例可表示为样本比例可表示为比例(proportion)NNNN101或nnPnnP101或容量相同的所有可能样本的样本比例的概率分布当样本容量很大时,样本比例的抽样分布可用正态分布近似 一种理论概率分布推断总体总体比例的理论基础样本比例的抽样分布样本比例的数学期望样本

10、比例的方差重复抽样不重复抽样样本比例的抽样分布(数学期望与方差)(PE2(1)( )1( )PE PE Pnn1)1 (2NnNnP湖北理工学院 经济与管理学院二、 参数估计基本方法点估计与区间估计点估计与区间估计参数估计的优良性准则参数估计的优良性准则总体均值和比例的区间估计总体均值和比例的区间估计参数估计在统计方法中的地位参数估计参数估计假设检验假设检验描述统计描述统计推断统计推断统计 统计方法统计方法统计推断的过程湖北理工学院 经济与管理学院点估计与区间估计点估计 (point estimate)用样本的估计量直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估计没有给出估计值接

11、近总体参数程度的信息区间估计 (interval estimate)在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样误差而得到的根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量比如,某班级平均分数在7585之间,置信水平是95% 区间估计的图示(以均值估计为例)X2nXzX总体均值的真值,为一次抽样的样本均值总体均值的区间估计 如果一次抽样的均值为,那么我们有90%的把握认为它与总体的实际均值的误差不超过正负1.65个标准误; 称为总体均值的置信区间(confidence interval),90%则被称为置信度。 这里的1.65就是,Z

12、的基本形式为:XXnn( 1 . 6 5, 1 . 6 5),0.1/2ZzXn总体均值的区间估计(例题分析)总体均值的区间估计(例题分析)28.109,44.10192.336.105251096.136.1052nzx36.105x总体均值的区间估计( 未知) 一般情况下,总体的标准差是未知的。 如果样本量大于30个,则可用样本的标准差代替总体的标准差来进行总体均值的区间估计。 这种情况下,总体也不需要服从正态分布.此时,总体均值的置信区间为:S2n sXzX总体均值的真值, 为样本标准差为一次抽样的样本均值总体均值的区间估计(例题分析)总体均值的区间估计(例题分析)27.7739.51.

13、6453639.52.1337.37,41.63sxzn5 .39x77. 7s总体均值的区间估计 (正态总体、未知、小样本)1.假定条件总体服从正态分布,且方差() 未知小样本 (n 30)2.使用 t 分布统计量)1(ntnSXtnStX2t 分布总体均值的区间估计(例题分析)总体均值的区间估计(例题分析)2s24.771490221476.8,1503.2xtn1490 x77.24s湖北理工学院 经济与管理学院总体比例的区间估计总体比例的区间估计1. 假定条件总体服从二项分布可以由正态分布来近似2.使用正态分布统计量) 1 , 0()1 (NnPPPZ)()-

14、1 ()1 (22未知时或nPPzPnzP总体比例的区间估计(例题分析)%35.74%,65.55%35.9%65100%)651%(6596.1%65)1 (2nppzp湖北理工学院 经济与管理学院样本容量的确定案例:KFC对武汉大学学生快餐消费的调查KFC的经理希望能够在武汉大学校园附近开一家KFC餐厅,他想了解大学生一个月内的快餐消费量。总体:长期居住在武汉大学(除医学部外)内的在校学生。调研要求:误差不能超过0.1次,可靠性在95%以上样本容量:?KFC以前做过类似的调查,调查发现大学生在30天内吃快餐的平均次数的标准差为1.39次。样本容量的确定 总体均值区间估计的误差计算公式为:

15、如果误差事先给定,l置信度又给定,则可以确定给定的置信度下,满足这一误差要求所需要的样本容量02Ex-u =zn 2222222()1.961.39n=(0.1) 742znE上例中:估计总体均值时样本容量的确定 (例题分析)估计总体均值时样本容量的确定 (例题分析)9704.964002000)96. 1 ()(2222222Ezn估计总体比例时样本容量的确定 根据比例区间估计公式可得样本容量n为222)1 ()(EznnzE)1 (2估计总体比例时样本容量的确定 (例题分析)1393 .13805. 0)9 . 01 (9 . 0)96. 1 ()1 ()(22222Ezn样本容量的确定(实例)【例例】一家市场调研公司想估计某地区有彩色电视机的家庭所占的比例。该公司希望对比例p的估计误差不超过0.05,要求的可靠程度为95%,应抽多大容量的样本(没有可利用的p估计值)。22222(1)E(1.96) (0.5)(10.5)(0.5)385Zppn有限总体抽样时的修正系数(Finite population correction factor) 如果总体是无限,重复抽样

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论