统计学+第二章+一二节白云飞_第1页
统计学+第二章+一二节白云飞_第2页
统计学+第二章+一二节白云飞_第3页
统计学+第二章+一二节白云飞_第4页
统计学+第二章+一二节白云飞_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章第二章 统计数据调查统计数据调查与整理与整理第一节 统计数据一、统计数据的概念 统计数据是对客观现象计量的结果,表现形式有两种:数值型和文字型。二、统计数据的分类(一)按数据的计量层次分类1、定类数据。数据最低级,将数据按类别属性进行分类,类别间是平等并列的关系。如,某商场将顾客喜爱的顔色分为红色、白色、黄色等。定类数据之间是平行并列关系,不能进行排序。2.定序数据。数据的中间级,不仅可将数据分成不同类别,且各类别间可通过排序来比较优势。如人的受教育程度可分为:文盲半文盲、小学、初中、高中、大学、硕士、博士。 定序数据可以比较顺序。3.定距数据。是具有一定单位的实际测量值。不仅可知两不同

2、变量值之间存在差异,还可通过加、减运算准确计算出各变量值间的实际差距。如考试成绩、智商、摄食温度。 是对事物类别或次序之间距离的测度。通常使用自然或物理单位作为计量尺度。例:30C和20之间相差10,-30C和-20之间也是相差10。再比如,1等星比2等星亮10倍,0等星比1等星亮10倍,-1等星又比0等星亮10倍。定距数据可以进行加、减运算,不能进行乘、除运算。其原因为定距尺度中没有绝对零点(定距尺度中的“0”是作为比较的标准,不表示没有)。4.定比数据。 它与定距数据的唯一区别是:在定比数据中存在绝对零点,而定距数据中不存在绝对零点(零点是人为制定的)。如收入、产量均为定比数据。定比变量除

3、了具有定距变量的特性外,还具有一个真正的零点,因而它具有乘与除(、)的数学特质。要求达到定比变量这一测量层次。 例如,绝对温度300K(27)时理想气体的体积273K(0)时的1.1倍,温度比也是1.1倍,则绝对温度和体积都是定比数据。 例如,年龄和收入这两个变量,固然是定距变量,同时又是定比变量,因为其零点是绝对的,可以作乘除的运算。如A月收入是60元,而B是30元,我们可以算出前者是后者的两倍。智力商数这个变量是定距变量,但不是定比变量,因为其0分只具有相对的意义,不是绝对的或固定的,不能说某人的智商是0分就是没有智力;同时,由于其零点是不固定的,即使A是140分而B是70分,我们也不能说

4、前者的智力是后者的两倍,只能说两者相差70分。因为0值是不固定的,如果将0点向上移高20分,则A的智商变为120分而B变成50分,两者的相差仍是70分,但A却是B的2.4倍,而不是原先的两倍了。 摄氏温度这一变量也如此。定比变量是最高测量层次的变量。当前的社会学研究所应用的统计方法还很少。 一般来说,定比数据不可能取负值。一般也不会取零值,因为要么就是不存在了,要么就是极限情况。如,绝对零度只能无限接近,不可能完全达到。如果一个物体的体积为零,那么它要么不存在,要么是数学中的抽象概念,比如,几何中的点、线、面的体积都为零。而一个人的年龄为0时呢?作为社会学意义上的人,可以认为它是极限(开始),

5、所以,年龄在社会意义上被认为是等比数据。 但从生物学意义上,人的年龄则是定距数据,因为什么?(二)按数据来源分类按数据的来源可将数据分为:第一手数据和第二手数据。(三)按时间状况分类1.时间序列数据。指在不同的时间上搜集到的数据,反映现象随时间变化的发展情况。2.截面型数据。指在相同或近似相同的时间点上搜集到的数据,描述现象在某一时刻的变化情况。3.面板数据(panel data)时间序列数据与截面数据的结合 统计调查就是对统计资料的搜集,它是根据统计研究的目的和任务要求,有组织、有计划地搜集原始资料的工作过程。包括对原始资料和对二手资料的搜集。统计调查专指对原始资料的搜集。而对二手资料的调查

6、不属于统计调查范围。 统计调查工作的要求:准确、及时、全面、系统。调查对象范围全面调查非全面调查调查时间经常调查一次性调查组织形式定期报表专门调查普查全面报表抽样调查重点调查典型调查普查重点调查典型调查抽样调查定期(周期性)不定期一、统计调查的种类和方法(一)按调查对象范围可分为全面调查和非全面调查 全面调查,是对构成调查对象总体的所有总体单位,一一进行调查登记的一种调查方式方法。普查和全面统计报表都属于全面调查。 非全面调查,是对构成调查对象总体的一部分总体单位进行调查登记的一种调查方式方法。重点调查、抽样调查、典型调查均属于这一类调查。 1.普查。普查是专门组织的一次性的全面调查,它主要用

7、于调查有关国情国力的重要资料在一定时点状态下的数量。如人口普查、工业普查等。普查的特点: (1)普查是一次性或周期性的。(2)普查要规定统一的调查时点。(3)普查所得数据较全面、详尽、规范。(4)普查使用范围较窄。2.统计报表。是按照国家或上级部门统一规定的表式、统一的指标、统一的报送程序和报送时间自下而上逐级提供基本资料的一种调查方式。 统计报表的优点:(1)内容全面,资料连续(2)报送时间统一、及时(3)资料准确 缺点:费时、费力、易受干扰、缺乏灵活性。种类按报表内容和实施范围:国家的、部门的和地方的统计报表。按报送周期长短的不同:日报、旬报、月报、季报、半年报和年报。按报送方式不同:邮寄

8、报表和电讯报表 电话、电报、传真、网络数据传送。3.抽样调查。按照随机原则从总体中抽取一部分单位作为样本进行观察,取得数据资料,根据样本特征以此对总体数量特征做出具有一定可靠程度的推算的调查方法。 抽样调查的特点:(1)样本单位是按照随机原则选取(2)结论可用于推断总体(3)抽样误差可事先计算并控制(4)节省大量的人力、财力、物力(5)适用范围广4.重点调查。在调查对象中, 只选择其中的一部分重点单位进行的调查, 用以掌握所研究现象总体的基本情况。在总体中,这些单位虽数目不多, 但就调查的标志值来说, 它们的总量在总体中却占有绝对的比重, 能够反映出总体的基本情况。 重点调查的特点:(1)重点

9、单位的选择不带主观因素,但有量的限制(2)其目的在于反映总体的基本情况5.典型调查。根据调查目的,经过对实际情况作了全面的大赂考察以后,在被研究对象中有意识地选出个别或少数有代表性的典型单位, 进行深入的、周密的调查研究的方法。选择典型单位的基本准则是:要对被研究的社会经济现象进行全面的科学分析,并能反映调查的目的和任务及调查对象本身的特点, 总的原则是典型单位不宜选得过多。 (二)按调查时间可分为经常性调查与一次性调查 经常性调查,要随着调查单位情况的变化,随时将变化的情况进行连续不断的登记。例如,产品产量。这类指标的数值变动很大,必须进行经常登记,才能满足需要。一次性调查是间隔一定时间,一

10、般是相当长的时期(比如说,一年以上)进行的调查。例如,固定资产总值。这类指标的数值在一定时期内变动不大,往往可以采用一次性调查的方式搜集资料。 经常性调查都是定期调查。一次性调查,可以是定期进行的,也可以是不定期进行的。(三)按组织形式可分为统计报表和专门调查 统计报表,是按定的表式和要求,自上而下统一布置,自下而上提供统计资料的一种统计调查方式方法。 专门调查,是为了研究某些专门问题,由进行调查的单位专门组织的调查。这种调查,多属一次性调查如普查、抽样调查、典型调查等。 一个完整的统计调查方案应包括:确定调查目的,明确调查对象和调查单位,确定调查项目和设计调查表,确定调查时间和调查期限,拟订

11、调查的组织实施计划。我国统计调查方法体系 以定期性的普查资料为基础,以抽样调查为主,辅以其他的典型调查、重点调查、全面统计报表、数据推算等方法(一)确定调查目的 明确调查所要研究和解决的问题。 要求目的明确,任务具体,以免造成理解不同而使搜集来的资料口径不一。例如:了解银行的基本情况了解各项方针政策在银行的执行情况了解银行机构设置和人员配备情况 对农民经济情况进行调查从农业生产方面来研究 从农民消费方面来研究 (二)确定调查对象和调查单位 明确调查的范围以及向谁调查,由谁来提供具体资料。 调查对象是需要研究的社会经济现象的全体,它是由性质相同的许多个别单位所组成的。 调查单位是构成调查对象的个

12、体,是所要调查的具体单位,因此是调查标志的直接承担者。 (三)确定调查项目和调查表 调查项目是调查中所要了解的具体内容,是所要反映的调查单位的特征(标志)。调查表是把已确定的调查项目按照一定的结构和顺序排列成的表格。 分为: 单一表:适用于调查项目多,调查单位少时。 一览表:适用于调查项目不多时,调查单位多时。单一表: 年末职工家庭就业人口调查表家庭人口人就业人口人姓名姓名与户主与户主关系关系性性别别年龄年龄工作单工作单位位职业职业 职务职职务职称称备备注注适用于调查项目多,调查单位少时。一览表: 身体发育状况调查表 编号检查检查序号序号姓姓名名性性别别出生出生年月日年月日年龄年龄(周(周岁)

13、岁)身身高高体体重重胸胸围围呼吸呼吸差差肺活肺活量量适用于调查项目不多时,调查单位多时。 我国人口普查规定月日零时为标准时点,要求普查登记工作在月10日完成。调查时间调查期限例如:生产经营月报,规定基层单位填报时间为次月3日。一个月 三天时间 7月1日零时 十天 (四)确定调查时间和调查期限 调查时间是指调查资料所属的时间。 调查期限是指进行调查工作的时限,包括搜集和报送资料需要的时间。 (五)确定调查的组织实施计划主要内容: 调查的组织领导机构和调查人员的组成; 调查的方式和方法; 调查前的准备工作,如宣传教育、干部培训、文件印刷等; 调查资料的报送办法; 调查经费的预算开支; 提供或者公布

14、调查成果的时间,以及其他。(三)、统计调查问卷 问卷是调查者根据调查目的和要求所设计的,由一系列问题、调查项目、备选答案、说明等组成的一种调查工具。1.问卷类型按问卷的填写者不同可分为:访问式问卷。由调查者向被调查者提问,然后据被调查者的回答填写调查表。应答率、完整率较高;但费用高、压力大、可能拒答、谎答。 自填式问卷。尊重隐私权,资料可靠;但应答率、完整率降低,而且不一定独立完成,会影响到质量。据传递方式不同可分为:报刊问卷、邮政问卷、送发问卷、访问问卷、网络问卷等。前言部分:题目、问候语、填写说明、问卷编号等。主体部分:调查事项的问题和答案,以及答题说明,是调查问卷的核心内容。结语部分:调

15、查的基本信息,如时间、地点、调查员姓名等。 1.问卷设计的程序事前准备问卷设计事后检查确定所需资料确定调查方式确定分析方法提问项目的设计回答项目的设计问题顺序的设计模拟试验问卷修正问卷完成版面格式的设计(1)开放式问题。(2)封闭式问题。(3)量表式问题。 评比量表。 李克特量表。 配对比较量表。(一)统计调查误差的含义和种类 统计调查误差,就是调查结果所得的统计数字与调查总体实际数量表现的差别。例如,如果对某森林的林木蓄积量进行统计调查的结果为100亿立方米,而该森林实际为101亿元,那么,统计调变的误差就是亿立方米,或0.99%。四、统计调查误差登记性误差 登记误差是由于调查过程中各个有关环节上的工作不准确而带来的。 产生登记误差的主要原因是计量错误,记录错误,计算错误,抄录错误,在逐级上报道程中的汇总错误,被调查者所报不实或调查者有意虑报瞒报,以及调查方案的规定不明确,等等。登记误差在全面调查和非全面调查中都会产生。 代表性误差 非全面调查从总体产抽出一部分单位进行观察,并用根据这部分单位算出的指标来估计总体的指标,这同总体的实际指标会有一定差别,这就是代表性误差产生的原因。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论