02-数据的调查与整理.docx_第1页
02-数据的调查与整理.docx_第2页
02-数据的调查与整理.docx_第3页
02-数据的调查与整理.docx_第4页
02-数据的调查与整理.docx_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章 数据的调查与整理 第一节 数据调查的方式与程序 P46一1、数据调查:统计数据的调查是根据统计研究目的要求,对所研究总体中个体的相应特征进行观测记录取得数据的工作过程。(名词)一2、数据调查活动取得的各种数据资料是进行统计分析或推断的基础,因此保证调查到的数据资料具有代表性和真实性是对统计资料调查的基本要求。代表性是要求所抽取的样本必须对所研究总体具有代表性;真实性是要求所调查的数据必须真实可靠。两者是统计数据调查活动的根本。一3、根据研究目的和研究对象的不同,统计数据的调查方式主要有现场调查和试验观测两种。在对实物产品研制与生产工艺革新过程中,采集数据资料的主要方式是试验观测;在对社会经济和大自然现象的研究过程中,采集数据资料的主要方式则是现场调查。一4、现场调查与试验观测两种采集数据的方式主要有什么不同?各适用于什么场合?现场调查指为了了解客观对象的实际情况而对其进行的直观的观测。试验观测是指为揭示事物之间的因果关系而在人为安排的环境条件下对所研究对象进行的观测。(名词)这两种采集数据的方式各有不同的目的和特点,适用于不同的场合。在对实物产品研制与生产工艺革新过程中,采集数据资料的主要方式是试验观测;而在对社会经济和大自然现象的研究过程中,采集数据资料的主要方式是现场调查。一5、现场调查由于是在事物处于自然条件下进行的,所得到的数据资料都是反映事物在自然状态下的现状,这种数据资料通常称为原始资料。是人们观察和认识客观世界的基本现状及其发展变化的重要依据。现场调查过程中对影响所观测事物的各种因素无法加以控制,所得观测数据是各种影响因素交织作用于观测事物的结果,很难准确地将各种因素的作用效果分解开来。试验观测主要特点是:试验观测中对事物的观测都是在人为安排的环境条件下进行的,在试验观测过程中,人们对影响所观测事物的各种主要因素都进行了严格的控制,所得到的数据除各种随机因素的影响外单纯反映了所考察的因素对观测事物的影响,从而能够准确揭示所考察因素与观测事物之间的内在联系。一6、简述数据调查的一般程序:1. 数据调查方案的制订;2.现场观察登记取得数据;3.数据的整理与显示。一7、制订数据调查方案是对整个数据的调查活动过程做出全面的计划和安排,一个完全的数据调查方案应包括:1.确定调查目的:2.确定调查对象和调查单位:3.确定调查项目和调查表;4.确定调查时间和调查期限;5.调查的组织实施。一8、确定调查目的是调查方案必须明确的首要问题,是调查项目和调查方法选择的依据和出发点,数据调查目的不同,调查的项目和使用的方法也有所不同,因此调查的目的应具体明确。一9、确定调查对象和调查单位:调查对象是指需要进行调查的客观现象总体,是由性质上相同的许多个体所组成的集合体,确定调查对象就是要明确规定总体的界限,以防止在调查过程中产生重复和遗漏。调查单位是调查对象中所要调查的具体单位,它与总体中的个体可能一致,也可能不一致。总体中的个体是观察指标的具体数值的承担者,是统计分析的基本单位,而调查单位则是数据调查过程中进行观测记录的基本单位。在对调查对象进行全面调查时,总体中的个体都是调查单位,而在抽样调查的条件下,调查单位是样本单位。一10、调查项目是调查中所要登记的调查单位特征。(名词)一11、简述拟定调查项目应注意的问题:1.调查项目的确定必须依据研究的目的来进行,使其既能够反映研究的目的需要,又能在力所能及的条件下取得所需的项目资料;2.调查项目必须明确、具体,使人一目了然;3.调查项目之间应彼此衔接,这样既能对现象从整体上全面了解,又便于有关项目相互核对,以便提高调查资料的质量。一12、调查表:将各个调查项目按照一定的顺序排列在一定的表格上,就构成了调查表。一般有两种形式:单一表:每个调查单位填写一份调查表,可容纳较多的调查项目;一览表:把许多调查单位填写在一张调查表上。一13、确定调查时间指调查资料所属的时间,如果所调查的客观现象属于时期现象,就要明确规定调查资料所反映的起止时间。调查期限是指进行调查工作的时限,包括搜集资料和报送资料的工作所需要的时间。一14、现场观测登记:这是数据调查活动中工作量最大的一个环节,其工作质量的好坏直接影响着调查所得数据资料的质量。一15、数据的整理显示:是数据资料调查活动的最后一个环节,既是数据资料调查过程的结束,又是统计分析推断过程的开始。第二章 数据的调查与整理 第二节 现场调查 P48二1、现场调查的主要目的是要了解研究对象的实际状况,它是在研究对象处于自然环境的条件下对其进行的观测,主要适用适用于对自然和社会经济现象的数据调查。由于样本的抽取方式通常有随机抽取和非随机抽取,相应的现场调查也分为随机抽样调查和非随机抽样调查。二2、抽样调查的样本抽取方式主要有哪几种?各有什么特点?各适用于什么场合?1.抽样调查的样本抽取方式主要包括:随机抽样和非随机抽样调查。2.随机抽样调查:又称概率抽样调查,指在抽样调查中,被调查总体中的每个个体被抽中或不被抽中的概率是相同的,调查样本的抽取是完全随机的,样本中的个体完全是凭机遇抽取出来,每个可能的样本被抽出的概率大小可以计算。当总体变异性大时,随机抽得的样本代表性差,因此只适合于总体变异不大的情况。 3. 非随机抽样调查:又称非概率抽样调查,其调查样本的抽取或是凭调查人员的主观判断进行选取,或是完全由调查人员视调查的便利而随意选取,每个样本被选中的机遇无法计算出来,更不能用概率表示。适用场合包括:1.严格的概率抽样几乎无法进行;2.调查目的仅是对问题的初步探索或提出假设;3.调查对象不确定或根本无法确定;4.总体各单位间离散程度不大,且调查人员有丰富的调查经验。二3、概率抽样调查与非概率抽样调查主要有什么不同?各有哪些优缺点?概率抽样和非概率抽样二者所得到的数据资料虽然都可以用来推算总体的指标数值,但是由于非概率抽样不能计算出每个可能样本被抽出的概率,无法计算用样本估计总体所产品的误差大小;而概率抽样则可以计算其所产生的误差,并可对此误差加以控制。因此,从估计误差的计算和控制上来说,概率抽样明显地比非概率抽样优越。在实践中,重要的抽样调查均采用概率抽样调查方式,推断统计学的主要研究内容就是围绕概率抽样及其所得数据资料的分析方法而展开的。二4、随机抽样调查的基本方法主要有:1.简单随机抽样:以总体中的个体为抽样单位,并使得每个个体被抽中的机会都相等,是最基本的随机抽样方式(名词)。可利用随机数表抽签法得以实现,分放回抽样或重复抽样和不放回抽样和不重复抽样。2.等距抽样:又称系统抽样,先将总体中各个个体按照某种特征值的顺序排队,然后按固定的顺序和间隔在总体中抽取若干个个体组成样本,优点是抽样组织方式简单,易于实施。3.分层抽样:又称类型抽样,先将总体中各个个体按照某种特征分成若干大类或组,每类或组内部各个个体都相差不大,类与类之间则相差较大,在每一类内采用简单随机抽样方式抽取若干个体,所有类中抽出的个体的集合构成样本。这种方式能够使总体中的每个类型都有一些个体被抽入样本,有助于提高样本的代表性,当总体内部差异较大且有明显的不同类型界限或标志时,采用这种方式较为适合。4.整群抽样:先将总体分成若干个群,当总体内部差异较大而又无明显的类型标志或界限时,便不能将总体分成内部相似而外部差异较大的不同类型,只能依据其他外观或地域标志将总体分成若干个相互之间差异很小,内部差异很大的群体,再随机抽取一些群体组成样本进行调查。如果对被抽取出群体中的个体全部进行调查,称为单级整群抽样;如在被抽出的群体中再进行以个体为单位的随机抽样,则称为两级抽样或两阶段抽样(还可有三、四阶段抽样等,称为多阶段抽样)整群抽样编制抽取单位的名单即抽样框比较容易,只需要群体的名单而不需各个个体名单,并且被调查的个体相对集中便于调查的组织和实施,在大规模社会经济调查和我国农村经济调查中广泛采用。二5、非随机抽样调查主要有三种形式:任意抽样、立意调查、配额抽样。1.任意抽样:又称便利抽样或偶遇抽样。是任由调查者的使得而随意选取一些个体作为样本。特点:使用最方便,但所抽取样本可能仅出自总体的某一阶层,对总体的代表性较低,所得结果可能存在很大的系统性偏差,一般只在正式调查之前的试验性调查中使用。.(名词)2.立意调查:又称判断抽样或典型调查,是在对所研究总体中各个体的一般情况已有相当了解的基础上,选择出一个或少数几个比较具有代表性的典型个体即与大多数个体相似的个体为样本,进行更深入细致的调查,是一种专家判断抽样方式。其选取的样本中个体很少且都具有代表性,故可对其做更深入细致的调查研究,了解很多详细资料,但由于其样本完全是凭主观判断选取,极易产生抽样偏误。最早由法国社会经济学家黎伯莱提出,毛泽东一直倡导。(名词)3.配额抽样:又称定额抽样,是在调查总体中依据一定的标准规定地区别或职业别等不同群体的样本个体数配额,然后在每个群体中由调查人员按照配额主观判断抽出一定数额的个体组成样本,其实质是一种分层判断抽样即划类选典抽样方式。实施简单,所抽出的样本不致偏重某一阶层或地区,代表性高,在市场调查中有着广泛应用。二6、现场调查的个体指标观测方式有哪些?各有哪些优缺点?P50现场调查的目的是取得所研究总体中个体指标的数据资料,其主要方法有访问法、观察法。(名词)1.访问法是将所要调查的个体指标拟成问题,用口头或书面形式向被调查者提出询问,根据被调查者的回答取得所需的数据资料。包括口头访问、书面访问;口头访问:可以是当面访问,也可以是电话访问。当面访问的优点是访问时间可长些,并可在询问时观察被调查者的反应,能得到较深入的资料,且问卷回收率较高;缺点是调查成本较高,调查结果正确与否受调查人员访问的影响很大。电话访问是利用电话来对被调查者进行访问,调查成本较低,并可在短时间内访问很多被调查者,但不易获得被调查者的合作,也不能询问较为复杂的问题。书面访问:邮局邮寄和利用互联网传递的方式成本较低,但问卷回收率一般也较低,且可能只来自某一阶层,影响调查结果的代表性。调查人员登门送收方式成本较高,但问卷回收率也较高。2.观察法是调查人员到调查现场,对被调查对象亲自进行观察、计数和记录,以获取所需要的数据资料。优点是调查过程中被调查者并不知晓自己正在接受调查,一切动作行为均为自然状态,所得资料真实可靠,若在调查中能使用仪器如摄像机等则所得资料会更为真实详细。缺点是调查过程中观察不到诸如行为动机等内在因素,并且有时需要作较长时间的观察才能得到结果,调查成本较高,而且实践中使用这种方法的限制性条件也较多,对有些现象的调查如居民家庭收支情况调查就不能采用这种方法进行。二7、调查问卷的设计:问卷设计技术主要包括提问方式和提问次序。二8、提问方式:封闭型提问和开放型提问(名词)封闭型提问:在问卷上同时列出问题和各种可能的答案,由被调查者在已给出的答案中选出一项或几项作为回答。开放型提问:是在问卷上仅给出问题,并不给出可供选择的答案,由被调查者根据问题自由回答;在一份调查问卷中经常是简单的事实性问题采用封闭型提问,复杂的建议性问题采用开放型提问。二9、提问次序:一般来说应该是先易后难,先一般后特殊,即漏斗式提问。若采用口头访问法,问卷开始应安排一些开放型问题,以便被调查者多说话,创造和谐轻松调查气氛,便于调查工作的开展;若采用书面访问方式,可将封闭型问题安排在问卷开头,使被调查者感到易于回答,开放性问题放在后面,便于被调查者在对前面问题思考的基础上提出自己独特的见解。为避免提问次序对调查结果产生不良影响,可将问卷分成几部分,各部分的提问次序或封闭问题答案的次序不同,从而使提问次序所产生的偏差相抵消,以保证调查结果的质量。二10、论述题:试述封闭型提问与开放型提问的优缺点。封闭型提问优点主要是调查时节省时间,可多问一些问题,且资料分类整理易于处理;缺点是被调查者不能自由表达看法,答案可能并不包含被调查者想要给出的答案,降低了调查所得资料的客观性。开放型提问优点是拟定的问题不受拘束,比较容易,对被调查者不限制回答范围,能收到一些建设性的意见和调查者所忽略的答案与资料;缺点主要在于对资料的整理与分析比较困难。由于被调查者的回答可能五花八门,所用词语各愤,因此在答案分类时难免出现困难,整理过程相当耗费时间,而且免不了加进一些整理者自己的偏见在内。第三节试验观测 P53三1、试验观测是在对其他各种主要因素加以控制的条件下,令所考察的因素变动,以观测所研究事物的反应,从而提示所考察因素与所研究事物之间的因果规律。在试验观察中,所要考察的因素称为因子,所考察因素的各种不同状态称为水平或位级。P53三2、影响所要研究事物的因素有许多影响程度往往是十分微小的,可统统看作随机干扰或称为随机误差。为测定某一个或某几个主要因素对所研究事物的影响程度,需要对其他各主要因素加以控制,只让所考察的因素变动,所以,试验观测是一种有控制的观测,这是试验观测与现场调查的根本区别。P53三3、进行试验观测设计时都应遵循哪些原则?为什么要遵循?P53为能充分提示所考察因素与事物之间的因果规律,进行试验观测必须遵循两个原则:1.均衡分散性原则:所进行的试验应均衡地分散在各个因素的不同水平或位级的全部各种可能配合之中,以便保证试验结果具有较强的代表性。2.整齐可比性原则:试验考察某个因素的各个水平或位级的效应时,其他因素应保持相同的水平,以便保证在该因素各个水平或位级的效应中能最大限度地排除其他因素的干扰,从而能有效地进行比较。三4、均衡分散性原则说明:如果所做试验都集中于部分水平的特定配合之上,则试验结果就可能具有某种偏差,不能全面准确地反映所考察。当试验所要考察的因素较少且每个因素的水平或位级也很少时,可对每个因素水平的全部配合逐一进行一次或若干次试验,满足均衡分散性要求;当试验所要考察的因素很多或各个因素的不同水平或位级很多,要对各个因素水平的全部配合逐一进行试验就因工作量大难以做到,只能在各个因素水平的全部配合之中随机抽取一部分进行试验。要保证所抽取部分水平配合的代表性,必须使所抽取的部分水平配合均衡地散布在全部因素水平配合之中,要做到这点,就要对试验进行巧妙的设计和安排。P53三5、整齐可比性原则说明:倘若在试验某个因素的各个水平效应的过程中,其他因素的水平不同,就难以分清试验所得数据之间的差异究竟是由于该因素水平不同造成的还是其他因素水平不同引起的,从而难以进行比较,无法提示该因素与所考察事物之间的因果关系。当试验所考察的因素和水平均较少时,要满足整体可比性比较容易,当试验所考察的因素和水平都很多时,要满足整齐可比性就比较困难,要在较少或不太多的试验观测中满足整齐可比性的要求,同要要对实验进行巧妙的设计和安排。P53三6、试验单位:在试验观测中,承受试验的个体称为试验单位。如何挑选考察各因素水平的配合以及如何将各个实验单位安排到所迁出的因素水平配合之中,是试验观测设计的基本问题。三7、试验观测的方法主要有哪几种?各适用于什么场合?试验观测的方法有完全随机试验观测和随机区组试验观测。1.完全随机试验观测:类似于现场调查中的随机抽样调查,即将各试验单位随机地安排到所要进行试验的因素与水平配合之中进行试验观测。完全随机试验观测可满足均衡分散性和整齐可比性的要求。各个试验单位本身必须具有同质性,如果各个试验单位本身就存在较大差异,则各因素水平配合的试验结果之间的差异将难以判明究竟是因素水平差异引起的还是试验单位本身的差异引起的。2.随机区组试验观测:类似于现场调查中的分层随机抽样调查。先将各个试验单位按其差异程度大小分成若干类,每类称为一个,再将每个区组中的各个试验单位按其差异程度的大小分成若干类,每类称为一个区组,将每个区组中的各个试验单位随机地指派到各个因素水平上进行试验观测。配对试验观测是随机区组试验观测的一个重要类型,当所考察的因素水平只有两种不同情形时,可将试验单位酿成两两相似的若干对组合,随机抽取每对中的一个试验单位进行一种水平的试验观测,另一个试验单位则进行另一种水平的试验观测。广泛应用于心理学、医学等。由于进行某种水平试验观测的任何一个试验单位都有一个相应的相似试验单位在进行另一咱水平的试验观测,二者相互对照,最大限度地排除了试验单位之间的差异的影响,保证了两个水平试验观测数据的整齐可比性,也给试验观测数据的分析带来了极大的方便。第四节数据整理与显示P55四1、观测个体的分类:分类比较是科学研究中经常使用的一种很有效的方法;将其中的各个观测个体按照在某个项目上的取值或者属性差异进行分类,将观测个体划分成若干个性质不同的类,然后进行类与类之间的分析和比较研究,以揭示事物的本质和内在规律性。P55四2、数据分类功能:分类具有两个方面的功能,对总体和样本而言是分,即将总体或样本划分成若干个不同的组;对个体而言是合,即将相似或相同的个体合并为一个组。数据的分类功能使得分类后的研究对象缩减为少数若干个组,便于分析比较发现事物的内在结构;又使得每类个体都通过合并相互抵消各自所受随机因素的影响,能够充分显示出事物的统计规律性。P55四3、分类体系:对同一总体或样本采用若干个不同的分类项目进行一系列的分类所形成的体系称为分类体系。四4、简述分类的含义及其必须遵循的原则。P55 分类是对总体或样本的划分和对个体的合并,任何分类都必须遵循两个原则:1.互斥性:即所分各类不能交叉重叠,每个个体只能划归入一个类别之中;2.完备性:即所分的类能够涵盖全部个体,总体中的任何一个个体都有一个类可以归入,而且只能有一个类可归入,不能有遗漏。四5、课后题目:什么是单值分类?什么是组距分类?各在什么场合下应用?由于作为分类依据的个体项目的取值个数有多与少两种不同情况,所以对观测个体进行分类也就有单值分类和组距分类两种。单值分类:如果作为分类依据的个体项目只能取很少的几个数值,那么就可以将每个不同的取值作为一类,分类项目有几个不同的取值就可分成多少类,这种分类称为单值分类。如人口按性别分类,只能分为男性和女性,居民家庭按人数(单位:人)分类,分为1,2,3,4等。组距分类:如果作为分类依据的个体项目的不同取值个数很多,那么就可将该个体项目的取值范围划分成若干个不同数值的区间,称为组距分类。在同一区间内取值的个体为一类,一共划分多少个区间就有多少类,这种分类称为组距分类。如工业企业按职工人数(单位:人)分类,可分为99以下,100999,10009999、10000以上。四6、对观测个体进行分类的方法有哪几种?平行分类体系与复合分类体系各有哪些特点?对观测个体进行分类,有单值分类和组距分类两种不同的分类方法。在一个分类体系中,若各种不同项目的分类是相互独立平行的,则这种分类体系称为平行分类体系,其类别总数等于各种分类的类别数之和;若各种不同项目的分类是逐一嵌套复合的,则这种分类体系称为复合分类体系,其类别总数等于各种分类的类别数之积,因此它比平行分类体系可提供更多信息,一般分类项目不宜过多。如:企业职工按性别可分为男

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论