版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第2章数据的搜集2.1数据的来源2.2数据的误差2.3数据文件2.1数据的来源2.1.1数据的间接来源中华人民共和国2012年国民经济和社会发展统计公报2.1.2数据的直接来源2.1.2调查数据2.1.2.1概率抽样和非概率抽样好样本必须: 1.针对研究的问题 2.具有最好的性能价格比总体随机样本1.概率抽样
遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本排除主观上有意识的抽取调查单位每个单位被抽中的概率是已知或可计算的当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率(1)简单随机抽样
只适用于总体单位数量有限的情况,否则编号工作繁重;对于复杂的总体,样本的代表性难以保证;不能利用总体的已知信息等每个样本单位被抽中的概率相等,样本的每个单位完全独立,彼此间无一定的关联性和排斥性从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式(2)分层抽样
先将总体的单位按某种特征分为若干次级总体(层),然后再从每一层内进行单纯随机抽样,组成一个样本的方法分组减小了各抽样层变异性的影响,抽样保证了所抽取的样本具有足够的代表性当总体是由差异明显的几部分组成时,往往选择分层抽样的方法例如,一个单位的职工有500人,其中不到35岁有125人,35岁至49岁的有280人,50岁以上的有95人.为了了解这个单位职工与身体状况有关的某项指标,要从中抽取一个容量为100的样本,由于职工年龄与这项指标有关,决定采用分层抽样方法进行抽取.因为样本容量与总体的个数的比为1:5,所以在各年龄段抽取的个数依次为125/5,280/5,95/5,即25,56,19。(3)整群抽样将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式.优点是实施方便、节省经费;缺点是抽样误差往往大于简单随机抽样例如,调查中学生患近视眼的情况,抽某一个班做统计;进行产品检验;每隔8h抽1h生产的全部产品进行检验等(4)系统抽样首先将总体中各单位按一定顺序排列,根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式。是纯随机抽样的变种最主要的优势就是经济性。最大的缺陷在于总体单位的排列上。一些总体单位数可能包含隐蔽的形态或者是“不合格样本”,调查者可能疏忽,把它们抽选为样本先将总体从1~N相继编号,并计算抽样距离K=N/n。式中N为总体单位总数,n为样本容量。然后在1~K中抽一随机数k1,作为样本的第一个单位,接着取k1+K,k1+2K……,直至抽够n个单位为止(5)多阶段抽样先从总体中抽取范围较大的单元,称为一级抽样单元,再从每个抽得的一级单元中抽取范围更小的二级单元,依此类推,最后抽取其中范围更小的单元作为调查单位2.非概率抽样
又称为不等概率抽样或非随机抽样,就是调查者根据自己的方便或主观判断抽取样本的方法
虽然根据样本调查的结果也可在一定程度上说明总体的性质、特征,但不能从数量上推断总体非概率抽样方便抽样判断抽样自愿样本滚雪球抽样配额抽样(1)方便抽样
调查人员本着随意性原则去选择样本的抽样方式两种最常见的方法:“街头拦人法”“空间抽样法”
一般在调查总体中每一个体都是同质时,才能采用此类方法。(2)判断抽样
根据调查人员的主观经验从总体样本中选择那些被判断为最能代表总体的单位作样本的抽样方法例如,要对安徽省旅游市场状况进行调查,有关部门选择黄山、九华山等旅游风景区做为样本调查,这就是判断抽样。(3)自愿样本被调查者自愿参加,成为样本中的一份子,向调查人员提供信息。如:网络调查先随机选择一些被访者并对其实施访问,再请他们提供另外一些属于所研究目标总体的调查对象,根据所形成的线索选择此后的调查对象在特定总体的成员难以找到时最适合的一种抽样方法(4)滚雪球抽样(5)配额抽样
将调查总体样本按一定标志分类或分层,确定各类(层)单位的样本数额,在配额内任意抽选样本的抽样方式。
与分层抽样的区别:分层抽样是按随机原则在层内抽选样本,而配额抽样则是由调查人员在配额内主观判断选定样本3.概率抽样与非概率抽样的比较概率抽样非概率抽样抽样原则特点非随机原则,统计量的分布不确定,无法进行参数估计.操作简便、时效快、成本低,适用于探索性研究抽样原则特点随机原则,可以据以对总体参数进行估计更精确,技术含量高,调查成本高2.1.2.2搜集数据的基本方法1.自填式调查者将调查问卷发送给(或者邮寄给)被调查者,由被调查自己阅读和填答,然后再由调查者收回的方法优点:1、节省时间、经费和人力.2、具有很好的匿名性.3、可避免某些人为误差缺点:1、问卷的回收革有时难以保证2、自填问卷法对被调查者的文化水平有一定要求3、调查资料的质量常常得不到保证2.面访式调查者直接走访被调查者,当面听取被调查者的意见。形式上可以个别面谈,也可以小组座谈提高调查的回答率,提高调查数据的质量,对数据搜集所花费的时间进行调节
调查成本高,对调查的质量控制有一定的难度对不起,打扰了!3.电话式
调查者利用电话与被调查者进行语言交流以获得信息优点:时效快、成本低缺点:问题的数量不宜过多 您好,我是××调查公司调查员4.数据搜集方法的选择实施调查的资源抽样框中的有关信息管理与控制质量要求目标总体的特征调查问题的内容有形辅助物的使用考虑因素
是指在实验中控制实验对象而搜集到的变量的数据。在实验中,研究人员要控制某一情形的所有相关方面,操纵少数感兴趣的变量,然后观察实验的结果。2.3实验数据
2.3.1实验组和对照组
实验的基本逻辑:改变A的情况,观察B是否随A的变化而变化
实验组对照组2.3.2实验中的若干问题人的意愿心理问题道德问题2.3.3实验中的统计Textinhere实验设计多变量研究实验次数实验2.2数据误差2.2.1抽样误差一、概念:指由于抽样的随机性引起的样本结果与总体真值之间的误差“实际抽样误差”“抽样平均误差”影响因素样本单位数总体变异性抽样方法§2.4.1抽样误差二、抽样误差大小的影响因素样本量的大小:样本量越大,抽样误差越小。总体的变异性:总体的变异性越大,即各单位之间的差异越大,抽样误差也就越大。在公布任何一次抽样调查的结果时,负责任的报告都应说明抽样误差的大小。282.2.2非抽样误差
抽样框误差1回答误差2无回答误差3调查员误差4测量误差5
非抽样误差是指除抽样误差以外所有的误差的总和
任何一个环节出错都有可能导致非抽样误差增加而使数据失真§4.2.2未响应误差未响应误差非抽样误差中的一种。它是指由于种种原因,包含在样本中的一部分人未对调查做出反应或回答,而造成的误差。
未响应误差是随机的可以通过增大样本量的方式解决
未响应误差是系统性的预防采取补救措施30§2.2.2响应误差
响应误差指在调查过程中,由于问题的提问方式、问题所处的位置、访员的影响或受访者自身的原因,而使受访者在回答问题时产生的误差。
响应误差的类型问题的措辞问题所处的位置访员的影响受访者的影响312.2.3误差的控制
抽样误差是不可避免的,能够在调查过程中进行控制的只有非抽样误差。抽样误差可以计算,因此可以通过统计学专业知识根据允许误差确定样本量,以控制抽样误差§3数据文件
数据
由一些变量和它们的观测值所组成。数据文件将数据以表格的形式录入计算机,这样的一个数据表通常叫做数据阵或数据文件。文件由行和列组成。一般行代表样本单位,每一行称为一个观测值。列表示不同的变量,每一列为一个变量的不同观测值。33§3数据文件
原始数据文件的一般格式34§3数据文件编码
男——1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 散客旅游合同范本在线查看
- 企业车辆交易协议书模板
- 2024体育赛事场地租赁合同
- 2024版土石方运输合同
- 农村个人购房合同范例
- 合伙协议书范例
- 如何签订借款合同避免风险
- 个人汽车买卖合同样本模板
- 2023年高考地理专题复习新题典题精练-洋流(原卷版)
- 致大海选择性必修中册 第四单元课件
- 假期补课协议书
- 电子商务支付结算系统开发合同
- 服务质量、保证措施
- (必练)广东省军队文职(经济学)近年考试真题试题库(含答案)
- 含羞草天气课件
- 2024年安全生产知识竞赛考试题库及答案(共五套)
- 22《鸟的天堂》课件
- 农业灌溉装置市场环境与对策分析
- 新疆乌鲁木齐市第十一中学2024-2025学年八年级上学期期中道德与法治试卷
- 2024年江西省高考地理真题(原卷版)
- 部编版小学五年级上册道法课程纲要(知识清单)
评论
0/150
提交评论