第六章(系统抽样)_第1页
第六章(系统抽样)_第2页
第六章(系统抽样)_第3页
第六章(系统抽样)_第4页
第六章(系统抽样)_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、抽样调查课抽样调查课-系统抽样系统抽样 单位: 浙江财经学院数统学院 课程: 抽样调查课 教师: 张锐 一、系统抽样的基本思想 二、系统抽样的基本方式 直线等距抽样 循环等距抽样 不等概率系统抽样 三、总体单元的排序 四、问题的改进 首尾校正法 中心位置抽样法 对称系统抽样法 目录目录 问题的提出 各种抽样方法都有优点和不足 难题:在一个连续的生产线上进行产品质 量抽样检查。 设计:在开始的时候先抽取一个样本点, 然后按照某种规律顺次得到整个样本的一 种抽样组织方式。 系统抽样:等距抽样,机械抽样,规律性 抽样 一、系统抽样的基本思想一、系统抽样的基本思想 对于一个容量为N的总体,首先,将总

2、体中各单位按某种顺序编为从1到A 的号 码。若要从中抽出一个容量为n的样本, 则应先从编号为1到k(kN)的k个单位中, 随机地抽取一个单位,然后,按照一定 的规律,如每隔k个单位抽出一个单位等, 顺次地抽出n个样本单位。 优点: v样本分布比较均匀,在现实生活中比较容易接受 v样本单位抽取简便,有很高适用价值 工业企业为检查产品质量,在连续生产线上每隔2 小时抽选一个或若干个样品进行检验;农作物产量 实测或对农作物害虫进行调查,对一大片农田每隔 一定距离抽取一块进行测量或调查等等,都是系统 抽样的直观案例。 系统抽样的特点 q 优点:简便易行,简化抽样手续优点:简便易行,简化抽样手续。 简便

3、易行,容易确定抽样单元。其他抽样方法在抽取样本前需简便易行,容易确定抽样单元。其他抽样方法在抽取样本前需 要对总体单元编号,然后再利用随机数表等方法进行抽取样本。要对总体单元编号,然后再利用随机数表等方法进行抽取样本。 而系统抽样,只需要总体单元的顺序排列,只要随机确定初始而系统抽样,只需要总体单元的顺序排列,只要随机确定初始 单元。单元。 整个样本就确定了,在某些场合甚至不用编制抽样框。比如要整个样本就确定了,在某些场合甚至不用编制抽样框。比如要 对杭州市区的机动车辆进行调查,抽样比为对杭州市区的机动车辆进行调查,抽样比为1%,则可以在尾,则可以在尾 数数0099中随机抽取一个整数,比如是中

4、随机抽取一个整数,比如是63,则只需对车辆牌,则只需对车辆牌 照号末位为照号末位为63的号进行调查。容易为非专业人员掌握。而且容的号进行调查。容易为非专业人员掌握。而且容 易保存抽样的原始记录。易保存抽样的原始记录。 q 缺点:缺点:如果单元的排列存在周期性的变化,而抽样者对此缺乏如果单元的排列存在周期性的变化,而抽样者对此缺乏 了解或处理经验,抽取的样本可能代表性很差。系统抽样的方了解或处理经验,抽取的样本可能代表性很差。系统抽样的方 差很复杂,对估计带来很大困难。差很复杂,对估计带来很大困难。 二、系统抽样的基本方式二、系统抽样的基本方式 系统抽样与其他抽样方法所不同的一个最系统抽样与其他

5、抽样方法所不同的一个最 显著的特点,就是系统抽样只需要抽取一个显著的特点,就是系统抽样只需要抽取一个 样本单位,然后按照某种规律,顺次地得到样本单位,然后按照某种规律,顺次地得到 整个样本。整个样本。 “某种规律某种规律”,就是指样本单位抽取的一种,就是指样本单位抽取的一种 事先的规定和安排事先的规定和安排。在此基础上,系统抽样。在此基础上,系统抽样 又可以划分为若干种具体的系统抽样方法。又可以划分为若干种具体的系统抽样方法。 其中,线性系统抽样是一种最基本的方法其中,线性系统抽样是一种最基本的方法 。 (一)直线等距抽样(线性系统抽样) q 假设总体单元数为假设总体单元数为N,样本容量为,样

6、本容量为n, N是是n的整数倍。的整数倍。 首先计算抽样间距首先计算抽样间距 k=N/n, 把总体分为把总体分为n段,每段段,每段k个个 单元,然后,在第一段的单元,然后,在第一段的k个单元中随机抽取一个单元,个单元中随机抽取一个单元, 假设为假设为r,然后每隔然后每隔k个单元抽取一个单元,即抽取个单元抽取一个单元,即抽取 r,r+k,r+2k,r+(n-1)k,这这n个单元为样本。个单元为样本。 抽样模型为:抽样模型为: r + (j-1)k (j = 1,2,nr + (j-1)k (j = 1,2,n; r r为随机数为随机数) ) 例如:某学院要共例如:某学院要共200个学生,要抽个学

7、生,要抽10个学生做样本。怎么个学生做样本。怎么 进行直线等距抽样?进行直线等距抽样? (二)循环等距抽样 当当N不是不是n的整数倍,即抽样间距的整数倍,即抽样间距k=N/n不是整数不是整数 时,应采取什么方法?时,应采取什么方法? 总体有总体有21个单元,拟抽取个单元,拟抽取n=4,怎么抽取样本?,怎么抽取样本? D.B.D.B.拉希里(拉希里(D.B.LahiriD.B.Lahiri) 于于19521952年提出了一年提出了一 种改进的系统抽样法种改进的系统抽样法循环系统抽样。循环系统抽样。 将总体将总体N N个单位的排序看作为一个首尾相连的圆圈,个单位的排序看作为一个首尾相连的圆圈, 取

8、最接近取最接近N/n N/n 的整数为的整数为k , k , 在总体在总体N N个单位中随机个单位中随机 地抽取一个单位为随机起点地抽取一个单位为随机起点i i,沿圆圈按顺时针方,沿圆圈按顺时针方 向每隔向每隔k k 个单位抽取一个单位,直到抽出个单位抽取一个单位,直到抽出n n个单位个单位 为止。为止。 N=21,n=4,取 k=5。 设随机起点为 i=3,则应 抽取的样本单位编号依次 为:3,8,13,18, 如下图所示, 表示随机起点,表示 所抽中的其它样本单位。 三 总体单元的排序 按无关标志排序(按无关标志排序(总体单位随机排序)总体单位随机排序) o 各单元的排序顺序与所研究的内容

9、无关。各单元的排序顺序与所研究的内容无关。 o 要调查学生的视力情况,按学号顺序排列。要调查职工平均年龄,要调查学生的视力情况,按学号顺序排列。要调查职工平均年龄, 按职工姓氏笔画排列。按职工姓氏笔画排列。 o 无序系统排列无序系统排列 按有关标志排列按有关标志排列 o 各单元的排序顺序与所研究的内容有关。各单元的排序顺序与所研究的内容有关。 o 要调查学生的平均身高,按照学生入学时体检的身高顺序排列。要调查学生的平均身高,按照学生入学时体检的身高顺序排列。 要对农产品产量进行调查,按当年的估产或前几年的实产由高到要对农产品产量进行调查,按当年的估产或前几年的实产由高到 低排列。这样称为有序系

10、统抽样低排列。这样称为有序系统抽样 处于两者之间处于两者之间 工厂中的工人名单按原有的工资名册顺工厂中的工人名单按原有的工资名册顺 序排列。主要是为了调查方便序排列。主要是为了调查方便。 排序可能出现的问题 总体单位排序与其标志值的大小有某种周期性的关系。总体单位排序与其标志值的大小有某种周期性的关系。 对某个商场的日销售额进行系统抽样时,设抽样距离为对某个商场的日销售额进行系统抽样时,设抽样距离为7 7天,样本日销售天,样本日销售 额正好都是星期天。额正好都是星期天。 在直线系统抽样(线性系统抽样)应注意避免抽样的规律与现象变动的周在直线系统抽样(线性系统抽样)应注意避免抽样的规律与现象变动

11、的周 期一致。期一致。 总体单位排序有线性趋势总体单位排序有线性趋势 总体呈现这种总体呈现这种“线性趋势线性趋势”(“单调上升或下降趋势单调上升或下降趋势”) 可以证明:其抽样估值精度虽优于简单随机抽样,但劣于分层随机抽样。可以证明:其抽样估值精度虽优于简单随机抽样,但劣于分层随机抽样。 其原因在于对有线性趋势的总体,采用直线系统抽样法其原因在于对有线性趋势的总体,采用直线系统抽样法 采用中心位置的系统抽样法或对称的系统抽样法,可以大大地改善系统抽采用中心位置的系统抽样法或对称的系统抽样法,可以大大地改善系统抽 样法的估值精度。样法的估值精度。 总体各单位按某种总体各单位按某种“负相关负相关”

12、的趋势排列的趋势排列 分为两种情况:一种是总体各单位的标志值奇数层顺排分为两种情况:一种是总体各单位的标志值奇数层顺排 列而偶数层反排列;另一种是总体中上一半单位的标志列而偶数层反排列;另一种是总体中上一半单位的标志 值顺排列而下一半单位的标志值反排列。值顺排列而下一半单位的标志值反排列。 这种负相关趋势排列的情况下,线性系统抽样法的估值这种负相关趋势排列的情况下,线性系统抽样法的估值 精度最高。精度最高。 对线性趋势总体下的系统抽样或称为有序排列对线性趋势总体下的系统抽样或称为有序排列 下的系统抽样的研究是十分重要的。下的系统抽样的研究是十分重要的。 四四.估计量估计量 设系统抽样的随机起点

13、值为设系统抽样的随机起点值为r,则其相应系统样本的均值为:,则其相应系统样本的均值为: nn 11 11 nn rjrjsy jj yyY 的估计量。的估计量。 为总体均值为总体均值 当当Nn k时,可以证明这个估计量是无偏的。时,可以证明这个估计量是无偏的。 111 11 kkn rjsyr rrj EyyyY knk Y 系统抽样与整群抽样和分层抽样的关系 特殊的整群抽样 特殊的分层抽样 五、问题的改进(1) 当总体呈线性趋势时,样本观测值可能会偏低或偏高,产生当总体呈线性趋势时,样本观测值可能会偏低或偏高,产生 “趋向性的偏差趋向性的偏差”,对此统计学家们采用了很多方法来弥补这一,对此统

14、计学家们采用了很多方法来弥补这一 不足。不足。 (一一)首尾校正法首尾校正法(1948年年 耶茨耶茨皇家学会会刊皇家学会会刊发表名为发表名为系统抽样系统抽样 的文章提出。)的文章提出。) 假设总体单元数为假设总体单元数为N,样本容量为,样本容量为n, N是是n的整数倍。的整数倍。 抽取抽取 r,r+k,r+2k,r+(n-1)k,这这n个单元为样本,每单元的权重都个单元为样本,每单元的权重都 1/n,改变第一个单元和第,改变第一个单元和第n个单元的权重个单元的权重 21 21 21 (1) 21 nrk r nk nrk rnk nk 第 一 个 单 元 的 权 重1+ 第 一 个 单 元 的

15、 权 重1- 问题的改进(2) 中心位置抽样法(麦多中心位置抽样法(麦多 1953年年数理统计年刊数理统计年刊发表发表 论系统抽样的理论论系统抽样的理论III:中心起点与随机起点系统抽样:中心起点与随机起点系统抽样 的比较的比较) 论文提出:当总体为单调上升趋势时,中心系统抽样法论文提出:当总体为单调上升趋势时,中心系统抽样法 优于随机起点系统抽样法(直线系统抽样法)。优于随机起点系统抽样法(直线系统抽样法)。 初始样本不是随机产生,取第一段的中间位置。初始样本不是随机产生,取第一段的中间位置。 例子:例子:27个学生抽取个学生抽取3个学生做样本,用中心位置抽样个学生做样本,用中心位置抽样 法

16、,求学生的平均零花钱。法,求学生的平均零花钱。 样本编号Y样本编号Y样本编号Y 1210111920 2311122020 3412132121 4513142222 5614152323 6715172425 7816172525 8917192625 91018192726 3 44 )23156( 3 1 23145 y 号。号,号,抽取的样本编号为: 解: 对称系统抽样法对称系统抽样法 N/n=k (1)Sethi对称系统抽样对称系统抽样 v 将总体分成将总体分成 n/2 (n为偶数时)组,每组有为偶数时)组,每组有2k个单元,在组内对个单元,在组内对 称。称。 (2)Singn对称系统抽样对称系统抽样 总体对称总体对称 问题的改进(3) 例子:用例子:用Sethi对称系统抽样,从20个学生中,抽取四个学 生,并且求他们的平均零花钱。设随机数为2 样本 编号 Y样本 编号 Y样本 编号 Y样本 编号 Y 126711121617 237812131719 348913141819 4591014151920 56

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论