赵娜《应用统计分析》课件-(02)第2章 数据的搜集_第1页
赵娜《应用统计分析》课件-(02)第2章 数据的搜集_第2页
赵娜《应用统计分析》课件-(02)第2章 数据的搜集_第3页
赵娜《应用统计分析》课件-(02)第2章 数据的搜集_第4页
赵娜《应用统计分析》课件-(02)第2章 数据的搜集_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学

STATISTICS第2章数据的搜集

(第六版)

统计学

作者:中国人民大学统计学院

贾俊平

2-1作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS第2章数据的搜集

(第六版)

2.1数据的来源

2.2调查数据

2.3实验数据

2.4数据的误差

2-2作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS学习目标

(第六版)

1.数据的来源

2.搜集数据的调查方法

3.问卷设计

4.搜集数据的实验方法

5.数据的误差

6.数据的质量要求

2-3作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS2.1数据的来源

(第六版)

2.1.1数据的间接来源

2.1.2数据的直接来源

2-4作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS

(第六版)

数据的间接来源

2-5作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS系统外部的数据

(第六版)

1.统统计计部部门门和和政政府府部部门门公公布布的的有有关关资资料料,,如如各各类类

统计年鉴统计年鉴

2.各各类类经经济济信信息息中中心心、、信信息息咨咨询询机机构构、、专专业业调调查查

机构等提供的数据机构等提供的数据

3.各类专业期刊、报纸、书籍所提供的资料各类专业期刊、报纸、书籍所提供的资料

4.各各种种会会议议,,如如博博览览会会、、展展销销会会、、交交易易会会及及专专业业

性、学术性研讨会上交流的有关资料性、学术性研讨会上交流的有关资料

5.从互联网或图书馆查阅到的相关资料从互联网或图书馆查阅到的相关资料

2-6作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS系统内部的数据

(第六版)

1.业务资料,如与业务经营活动有关的各

种单据,记录

2.经营活动过程中的各种统计报表

3.各种财务,会计核算和分析资料等

2-7作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS二手数据的特点

(第六版)

1.搜集容易,采集成本低

2.作用广泛

n分析所要研究的问题分析所要研究的问题

n提供研究问题的背景提供研究问题的背景

n帮助研究者更好地定义问题帮助研究者更好地定义问题

n检验和回答某些疑问和假设检验和回答某些疑问和假设

n寻找研究问题的思路和途径寻找研究问题的思路和途径

3.搜集二手资料在研究中应优先考虑

2-8作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS二手数据的评估

(第六版)

1.数据是谁搜集的?

n可信度评估可信度评估

2.为什么目的而搜集的?

3.数据是怎样搜集的?

4.什么时候搜集的?

2-9作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS

(第六版)

数据的间接来源

2-10作者:贾俊平,中国人民大学统计学院

统计学数据的直接来源

STATISTICS

(第六版)(原始数据)

1.调查数据

n通过调查方法获得的数据通过调查方法获得的数据

n通常是对社会现象而言通常是对社会现象而言

n通常取自有限总体通常取自有限总体

2.实验数据

n通过实验方法得到的数据通过实验方法得到的数据

n通常是对自然现象而言通常是对自然现象而言

n也被广泛运用到社会科学中也被广泛运用到社会科学中

l如心理学、教育学、社会学、经济学、管理学等

2-11作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS2.2调查数据

(第六版)

2.2.1概率抽样与非概率抽样

2.2.2搜集数据的基本方法

2-12作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS

(第六版)

概率抽样和非概率抽样

2-13作者:贾俊平,中国人民大学统计学院

统计学概率抽样

STATISTICS

(第六版)(probabilitysampling)

1.也称随机抽样

2.特点

n按一定的概率以随机原则抽取样本按一定的概率以随机原则抽取样本

l抽取样本时使每个单位都有一定的机

会被抽中

n每每个个单单位位被被抽抽中中的的概概率率是是已已知知的的,,

或是可以计算出来的或是可以计算出来的

n当当用用样样本本对对总总体体目目标标量量进进行行估估计计时时,,

要要考考虑虑到到每每个个样样本本单单位位被被抽抽中中的的概概

率率

2-14作者:贾俊平,中国人民大学统计学院

统计学简单随机抽样

STATISTICS

(第六版)(simplerandomsampling)

1.从从总总体体NN个个单单位位中中随随机机地地抽抽取取nn个个单单位位作作为为样样本本,,

每个单位入抽样本的概率是相等的每个单位入抽样本的概率是相等的

2.最基本的抽样方法,是其它抽样方法的基础最基本的抽样方法,是其它抽样方法的基础

3.特点特点

n简单、直观,在抽样框完整时,可直接从中抽取样

n用样本统计量对目标量进行估计比较方便

4.局限性局限性

n当N很大时,不易构造抽样框

n抽出的单位很分散,给实施调查增加了困难

n没有利用其它辅助信息以提高估计的效率

2-15作者:贾俊平,中国人民大学统计学院

统计学分层抽样

STATISTICS

(第六版)(stratifiedsampling)

1.将抽样单位按某种特征或某种规则划分为

不同的层,然后从不同的层中独立、随机

地抽取样本

2.优点

n保保证证样样本本的的结结构构与与总总体体的的结结构构比比较较相相近近,,从从

而提高估计的精度而提高估计的精度

n组织实施调查方便组织实施调查方便

n既既可可以以对对总总体体参参数数进进行行估估计计,,也也可可以以对对各各层层

的目标量进行估计的目标量进行估计

2-16作者:贾俊平,中国人民大学统计学院

统计学整群抽样

STATISTICS

(第六版)(clustersampling)

1.将总体中若干个单位合并为组(群),抽样

时直接抽取群,然后对中选群中的所有单

位全部实施调查

2.特点

n抽样时只需群的抽样框,可简化工作量抽样时只需群的抽样框,可简化工作量

n调调查查的的地地点点相相对对集集中中,,节节省省调调查查费费用用,,方方便便

调查的实施调查的实施

n缺点是估计的精度较差缺点是估计的精度较差

2-17作者:贾俊平,中国人民大学统计学院

统计学系统抽样

STATISTICS

(第六版)(systematicsampling)

1.将总体中的所有单位(抽样单位)按一定顺

序排列,在规定的范围内随机地抽取一个

单位作为初始单位,然后按事先规定好的

规则确定其它样本单位

n先先从从数数字字11到到kk之之间间随随机机抽抽取取一一个个数数字字rr作作为为

初始单位,以后依次取初始单位,以后依次取r+kr+k,,r+2k…r+2k…等单位等单位

2.优点:操作简便,可提高估计的精度

3.缺点:对估计量方差的估计比较困难

2-18作者:贾俊平,中国人民大学统计学院

统计学多阶段抽样

STATISTICS

(第六版)(multi-stagesampling)

1.1.先先抽抽取取群群,,但但并并不不是是调调查查群群内内的的所所有有单单位位,,而而是是再再

进进行行一一步步抽抽样样,,从从选选中中的的群群中中抽抽取取出出若若干干个个单单位位进进

行调查行调查

n二阶抽样中群是初级抽样单位,第二阶段抽取的是最终

抽样单位。将该方法推广,使抽样的阶段数增多,就称

为多阶段抽样

2.2.具具有有整整群群抽抽样样的的优优点点,,保保证证样样本本相相对对集集中中,,节节约约调调

查费用查费用

3.3.需需要要包包含含所所有有低低阶阶段段抽抽样样单单位位的的抽抽样样框框;;同同时时由由于于

实行了再抽样,使调查单位在更广泛的范围内展开实行了再抽样,使调查单位在更广泛的范围内展开

4.4.在大规模的抽样调查中,是经常被采用的方法在大规模的抽样调查中,是经常被采用的方法

2-19作者:贾俊平,中国人民大学统计学院

统计学非概率抽样

STATISTICS

(第六版)(non-probabilitysampling)

1.相对于概率抽样而言

2.抽取样本时不是依据随机原则,而是根据研

究目的对数据的要求,采用某种方式从总体

中抽出部分单位对其实施调查

3.有方便抽样、判断抽样、自愿样本、滚雪球

抽样、配额抽样等方式

2-20作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS方便抽样

(第六版)

1.调查过程中由调查员依据方便的原则,自行

确定入抽样本的单位

n调调查查员员在在街街头头、、公公园园、、商商店店等等公公共共场场所所进进行行拦拦

截调查截调查

n厂家在出售产品柜台前对路过顾客进行的调查厂家在出售产品柜台前对路过顾客进行的调查

2.优点:容易实施,调查的成本低

3.缺点:样本单位的确定带有随意性,样本无

法代表有明确定义的总体,调查结果不宜推

断总体

2-21作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS判断抽样

(第六版)

1.研究人员根据经验、判断和对研究对象的了

解,有目的选择一些单位作为样本

n有重点抽样,典型抽样,代表抽样等方式有重点抽样,典型抽样,代表抽样等方式

2.判断抽样是主观的,样本选择的好坏取决于

调研者的判断、经验、专业程度和创造性

3.抽样成本比较低,容易操作

4.样本是人为确定的,没有依据随机的原则,

调查结果不能用于推断总体

2-22作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS自愿样本

(第六版)

1.被调查者自愿参加,成为样本中的一分子,

向调查人员提供有关信息

n例例如如,,参参与与报报刊刊上上和和互互联联网网上上刊刊登登的的调调查查问问

卷卷活活动动,,向向某某类类节节目目拨拨打打热热线线电电话话等等,,都都属属

于自愿样本于自愿样本

2.自愿样本与抽样的随机性无关

n样本是有偏的样本是有偏的

n不能依据样本的信息推断总体不能依据样本的信息推断总体

2-23作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS滚雪球抽样

(第六版)

1.先选择一组调查单位,对其实施调查之后,

再请他们提供另外一些属于研究总体的调查

对象,调查人员根据所提供的线索,进行此

后的调查。这个过程持续下去,就会形成滚

雪球效应

2.适合于对稀少群体和特定群体研究

3.优点:容易找到那些属于特定群体的被调查

者,调查的成本也比较低

2-24作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS配额抽样

(第六版)

1.先将总体中的所有单位按一定的标志(变

量)分为若干类,然后在每个类中采用方

便抽样或判断抽样的方式选取样本单位

2.操作简单,可以保证总体中不同类别的单

位都能包括在所抽的样本之中,使得样本

的结构和总体的结构类似

3.抽取具体样本单位时,不是依据随机原则,

属于非概率抽样

2-25作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS概率抽样与非概率抽样的比较

(第六版)

1.概率抽样

n依据随机原则抽选样本

n样本统计量的理论分布存在

n可根据调查的结果推断总体

2.非概率抽样

n不是依据随机原则抽选样本

n样本统计量的分布是不确定的

n无法使用样本的结果推断总体

2-26作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS

(第六版)

搜集数据的基本方法

2-27作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS搜集数据的基本方法

(第六版)

2-28作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS自填式问卷调查

(第六版)

1.没没有有调调查查员员协协助助的的情情况况下下由由被被调调查查者者自自己己完完成成

调查问调查问卷卷

n问卷递送方法有:调查员分发、邮寄、网络、媒体

2.要求要求调查问调查问卷卷结结构构严谨严谨,有清楚的,有清楚的说说明明

3.弱点弱点

n问卷的返回率比较低

n不适合结构复杂的问卷

n调查周期比较长

n数据搜集过程中出现的问题难于及时采取调改措施

2-29作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS面访式问卷调查

(第六版)

1.调查员与被调查者面对面提问、被调查

者回答的一种调查方式

2.优点

n可提高可提高调查调查的回答率的回答率

n可提高可提高调查调查数据的数据的质质量量

n能能调节调节数据搜集所花数据搜集所花费费的的时间时间

3.弱点

n调查调查的成本的成本较较高高

n调查过调查过程的程的质质量控制有一定量控制有一定难难度度

2-30作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS电话式问卷调查

(第六版)

1.通过电话向被调查者实施调查

2.特点

n速度快,能在短时间内完成调查速度快,能在短时间内完成调查

n适合于样本单位十分分散的情况适合于样本单位十分分散的情况

3.局限

n如果被调查者没有电话,调查将无法实施如果被调查者没有电话,调查将无法实施

n访问的时间不能太长访问的时间不能太长

n使用的问卷需要简单使用的问卷需要简单

n被访者不愿意接受调查时,难以说服被访者不愿意接受调查时,难以说服

2-31作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS观察式调查

(第六版)

1.就调查对象的行动和意

识,调查人员边观察边

记录以收集所需信息

2.调查人员不是强行介入

3.能够在被调查者不察觉

的情况下获得资料

n如交通流量的调查如交通流量的调查

2-32作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS各调查方法的比较

(第六版)

自填式面访式电话式

调查时间慢中等快捷

调查费用低高低

问卷难度要求容易可以复杂要求容易

有形辅助物的使用中等利用充分利用无法利用

调查过程控制简单复杂容易

调查员作用的发挥无法发挥充分发挥一般发挥

回答率最低较高一般

2-33作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS2.3实验数据

(第六版)

2.3.1实验组和对照组

2.3.2实验中的若干问题

2.3.3实验中的统计

2.3.4实验法案例

2-34作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS实验组和对照组

(第六版)

1.将研究对象分为两组:实验组和对照组

2.实验组和随机组的产生应遵循随机原则,

而且应该匹配

n匹匹配配指指对对实实验验单单位位的的背背景景材材料料进进行行分分析析比比较较,,

将将情情况况类类似似的的每每对对单单位位分分别别随随机机地地分分配配到到实实

验组和对照组验组和对照组

2-35作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS实验中的若干问题

(第六版)

1.人的意愿

n研研究究的的对对象象是是人人的的时时候候,,在在划划分分实实验验组组和和对对

照照组时组时的随机原的随机原则则将面将面临临挑战挑战

2.心理问题

n人人们们对对被被研研究究非非常常敏敏感感,,这这使使得得他他们们更更加加注注

意自我,从而走到事物的另意自我,从而走到事物的另一个极端一个极端

3.道德问题

n当当某某种种实实验验涉涉及及道道德德问问题题时时,,人人们们会会处处于于进进

退两难的尴尬境地退两难的尴尬境地

2-36作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS实验中的统计

(第六版)

1.实验设计本身就是一个统计问题

2.确定进行实验所需要的单位的个数,以保

证实验可以达到统计显著的结果

3.将统计的思想融入到实验设计中,使实验

设计符合统计分析的标准

4.对实验数据进行分析时,统计可以提供最

恰当的分析方法

2-37作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS2.4数据的误

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论