市场调查与预测(第3版) 课件 第5、6章 抽样调查方法、市场调查资料的整与分析_第1页
市场调查与预测(第3版) 课件 第5、6章 抽样调查方法、市场调查资料的整与分析_第2页
市场调查与预测(第3版) 课件 第5、6章 抽样调查方法、市场调查资料的整与分析_第3页
市场调查与预测(第3版) 课件 第5、6章 抽样调查方法、市场调查资料的整与分析_第4页
市场调查与预测(第3版) 课件 第5、6章 抽样调查方法、市场调查资料的整与分析_第5页
已阅读5页,还剩116页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

市场调查与预测2024/9/111第五章抽样调查方法5.1抽样调查概述抽样调查是,一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行调查,并据以对全部调查研究对象做出估计和推断的一种调查方法。2024/9/1122024/9/113抽样调查是,一种

[填空1]

,它是从

[填空2]

调查研究对象中,抽选

[填空3]

单位进行调查,并据以对全部调查研究对象做出

[填空4]

[填空5]

的一种调查方法。作答正常使用填空题需3.0以上版本雨课堂可为此题添加文本、图片、公式等解析,且需将内容全部放在本区域内。正常使用需3.0以上版本抽样调查是,一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行调查,并据以对全部调查研究对象做出估计和推断的一种调查方法。答案解析答案解析填空题5分5.1.1抽样调查的特点(1)调查样本是按随机的原则抽取的,在总体中每一个单位被抽取的机会是均等的(2)是以抽取的全部样本单位作为一个“代表团”,用整个“代表团”来代表总体(3)所抽选的调查样本数量,是根据调查误差的要求,经过科学的计算确定的,在调查样本的数量上有可靠的保证。(4)抽样调查的误差,是在调查前就可以根据调查样本数量和总体中各单位之间的差异程度进行计算,并控制在允许范围以内,调查结果的准确程度较高。2024/9/1145.1.2抽样调查中常用的名词1、总体2、个体3、样本4、样本的容量5、抽样框6、抽样比7、置信度8、抽样误差9、偏差10、均方差2024/9/1155.1.3抽样调查的适用范围1.实际工作不可能进行全面调查观察,而又需要了解其全面资料的事物。2.虽可进行全面调查观察,但比较困难或并不必要。3.对普查或全面调查统计资料的质量进行检查和修正。4.抽样方法适用于对大量现象的观察,即组成事物总体的单位数量较多的情况。5.利用抽样推断的方法,可以对于某种总体的假设进行检验,判断这种假设的真伪,以决定取舍。2024/9/1165.2抽样方案设计抽样方案是由样本量和对样本的要求两部分组成。抽样方案有计数型和计量型两种类型。计数型抽样方案可记为:(n,C),n表示样本量,C表示对样本的要求,即从一批产品中抽取n个样品,(n当然不能大于批量),逐个检验这n个产品,若在其中发现有d个不合格品,若d不大于C,判为总体可接收,若d大于C,判为总体不可接收。计数型抽样方案又分为计件和计点两种情况。2024/9/1171.计量型抽样检验有些产品的质量特性,如灯管寿命、棉纱拉力、炮弹的射程等,是连续变化的。用抽取样本的连续尺度定量地衡量一批产品质量的方法称为计量抽样检验方法。2.计数抽样检验有些产品的质量特性,如焊点的不良数、测试坏品数以及合格与否,只能通过离散的尺度来衡量,把抽取样本后通过离散尺度衡量的方法称为计数抽样检验。计数抽样检验中对单位产品的质量采取计数的方法来衡量,对整批产品的质量,一般采用平均质量来衡量。计数抽样检验方案又可分为:标准计数一次抽检方案、计数挑选型一次抽检方案、计数调整型一次抽检方案、计数连续生产型抽检方案、二次抽检、多次抽检等。2024/9/118(1)一次抽检方案一次抽检方案是最简单的计数抽样检验方案,通常用(N,n,C)表示。即从批量为N的交验产品中随机抽取n件进行检验,并且预先规定一个合格判定数C。如果发现n中有d件不合格品,当d≤C时,则判定该批产品合格,予以接收;当d>C时,则判定该批产品不合格,予以拒收。例如,当N=100,n=10,C=1,则这个一次抽检方案表示为(100,10,1)。其含义是指从批量为100件的交验产品中,随机抽取10件,检验后,如果在这10件产品中不合格品数为0或1,则判定该批产品合格,予以接收;如果发现这10件产品中有2件以上不合格品,则判定该批产品不合格,予以拒收。2024/9/119(2)二次抽检方案和一次抽检方案比,二次抽检方案包括五个参数,即(N,n1,n2;C1,C2)。其中:n1—第一次抽取样本的大小;n2—第二次抽取样本的大小;C1—第一次抽取样本时的不合格判定数;C2—第二次抽取样本时的不合格判定数。2024/9/1110二次抽检方案的操作程序是:在交验批量为N的一批产品中,随机抽取n1件产品进行检验。若发现n1件被抽取的产品中有不合格品d1,则:若d1≤C1,判定批产品合格,予以接收;若d1>C2,判定批产品不合格,予以拒收;若C1<d1≤C2,不能判断。在同批产品中继续随机抽取第二个样本n2件产品进行检验。若发现n2中有d2件不合格品,则根据(d1+d2)和C2的比较做出判断:若d1+d2≤C2,则判定批产品合格,予以接收;若d1+d2>C2,则判定批产品不合格,予以拒收。2024/9/11112024/9/1112请解释二次抽检方案(500,40,60;2,4)的含义作答正常使用主观题需2.0以上版本雨课堂可为此题添加文本、图片、公式等解析,且需将内容全部放在本区域内。正常使用需3.0以上版本其含义是指从批量为100件的交验产品中,随机抽取第一个样本n1=40件进行检验,若发现n1中的不合格品数为d1:若d1<2,则判定该批产品合格,予以接收;若d1>4,则判定该批产品不合格,予以拒收;若2<d1≤4(即在n1,件中发现的不合格品数为3,4件),则不对该批产品合格与否做出判断,需要继续抽取第二个样本,即从同批产品中随机抽取60件进行检验,记录中的不合格品数:若d1+d2≤4,则判定该批产品合格,予以接收;若d1+d2>4,则判定该批产品不合格,予以拒收。答案解析答案解析主观题10分5.3抽样方法抽样方法按照抽取时遵循的原则不同可以分为随机抽样和非随机抽样两大类。而根据抽取过程的实施步骤和方法不同,随机抽样又分为简单随机抽样、等距抽样、分层抽样、整群抽样、多阶段抽样和双重抽样几种不同的方法;非随机抽样分为任意抽样、重点抽样、典型抽样、配额抽样和滚雪球抽样几种方法。2024/9/11135.3.1随机抽样方法5.3.1.1简单随即抽样1.定义简单随机抽样也称为单纯随机抽样、纯随机抽样、SPS抽样,是指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。一般地,设一个总体含有N个个体,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,则这样的抽样方法叫做简单随机抽样。2024/9/11142.特点(1)简单随机抽样要求被抽取的样本的总体个数N是有限的。(2)简单随机样本数n小于等于样本总体的个数N。(3)简单随机样本是从总体中逐个抽取的。(4)简单随机抽样是一种不放回的抽样。3.抽样方法(1)直接抽选法(2)抽签法(3)随机数表法2024/9/11155.3.1.2系统抽样1.定义等距抽样也称为系统抽样、机械抽样、SYS抽样,它是首先将总体中各单位按一定顺序排列,根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式。是纯随机抽样的变种。2024/9/11162024/9/1117等距抽样也称为

[填空1]

[填空2]

、SYS抽样,它是首先将总体中各单位按一定顺序排列,根据

[填空3]

要求确定抽选

[填空4]

,然后随机确定起点,每隔一定的间隔抽取

[填空5]

单位的一种抽样方式。作答正常使用填空题需3.0以上版本雨课堂可为此题添加文本、图片、公式等解析,且需将内容全部放在本区域内。正常使用需3.0以上版本等距抽样也称为系统抽样、机械抽样、SYS抽样,它是首先将总体中各单位按一定顺序排列,根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式。答案解析答案解析填空题5分在系统抽样中,先将总体从1~N相继编号,并计算抽样距离K=[N/n]。式中N为总体单位总数,n为样本容量。然后在任意一段中抽一随机数k1,作为样本的第一个单位,接着取k1+K,k1+2K,……,直至抽够n个单位为止。2024/9/11182.等距抽样的分类根据总体单位排列方法,可分为三类:(1)按有关标志排队、(2)按无关标志排队、(3)介于两者之间的按自然状态排列。按照抽样的方法,分为(1)直线等距抽样、(2)对称等距抽样、(3)循环等距抽样。3.等距抽样特征等距抽样的特点是:抽出的单位在总体中是均匀分布的,且抽取样本可少于纯随机抽样。2024/9/11194.等距抽样要求等距抽样既可以用同调查项目相关的标志排队,也可以用同调查项目无关的标志排队。等距抽样要防止周期性偏差,因为它会降低样本的代表性。5.等距抽样方法(1)随机起点等距抽样(2)半距起点等距随机抽样(3)随机起点对称等距抽样(4)循环等距抽样2024/9/11206.等距抽样排序方法(1)按无关标志排序(2)按有关标志排序(3)介于前两种方法之间的排序7.等距抽样的优缺点最主要的优势就是经济性。最大的缺陷在于总体单位的排列上,可能包含隐蔽的形态或者是“不合格样本”。2024/9/11212024/9/1122根据总体单位排列方法,可分为:按有关标志排队按无关标志排队对称等距抽样介于有关标志排队和无关标志排队之间的自然排队ABCD提交直线等距抽样E可为此题添加文本、图片、公式等解析,且需将内容全部放在本区域内。正常使用需3.0以上版本根据总体单位排列方法,等距抽样可分为:(1)按有关标志排队、(2)按无关标志排队、(3)介于两者之间的按自然状态排列。按照抽样的方法,分为(1)直线等距抽样、(2)对称等距抽样、(3)循环等距抽样。答案解析答案解析多选题1分2024/9/1123总体中有100个单位,按照随机起点对称等距抽样方法,从总体中抽取5个单位,假设第一个被抽取单位的位置为5,请确定第2~5个被抽取单位的位置。作答正常使用主观题需2.0以上版本雨课堂可为此题添加文本、图片、公式等解析,且需将内容全部放在本区域内。正常使用需3.0以上版本解:N=100,n=5

k=N/n=20

因第一个被抽取单位的位置为5,即i=5,则根据偶数项位置为jk-i+1(j=2、4、6…)和奇数项位置为jk+i(j=0、2、4、6…)有:No.2:2×20-5+1=36No.3:2×20+5=45No.4:4×20-5+1=76No.5:4×20+5=85答案解析主观题10分答案解析5.3.1.3分层抽样分层抽样就是将总体按某个主要标志进行分组(分层),再按随机原则采用随机抽样方式从各组中抽取一定数目的调查单位组成样本的抽样组织方式。2024/9/1124分层抽样又称分类抽样或类型抽样。将总体划分为若干个同质层,再在各层内随机抽样或机械抽样,分层抽样的特点是将科学分组法与抽样法结合在一起,分组减小了各抽样层变异性的影响,抽样保证了所抽取的样本具有足够的代表性。分层抽样有分层比例抽样、分层最佳抽样和分层最低成本抽样三种方式。2024/9/11252024/9/1126分层抽样就是将总体按某个

[填空1]

进行

[填空2]

,再按随机原则采用随机抽样方式从

[填空3]

中抽取一定数目的

[填空4]

组成样本的抽样组织方式。作答正常使用填空题需3.0以上版本雨课堂可为此题添加文本、图片、公式等解析,且需将内容全部放在本区域内。正常使用需3.0以上版本分层抽样就是将总体按某个主要标志进行分组(分层),再按随机原则采用随机抽样方式从各组中抽取一定数目的总体单位组成样本的抽样组织方式。答案解析答案解析填空题4分1.分层比例抽样分层比例抽样是指分层后,按随机原则根据各层中单位数量占总体单位数量的比例抽取各层的样本数量。每层抽取的样本数计算公式为:

式中:ni为第i层抽出的样本数Ni为第i层的总单位数N为总体单位数n为总体样本数,即样本容量2024/9/1127例1:某市有各类型书店500家,其中大型50家,中型150家,小型300家。为了调查该市图书销售情况,现计划从中抽取30家书店进行调查,采用分层比例抽样法应从各层中抽取多少家书店调查?解:根据分层比例抽样公式的计算公式(5-1),有(1)大型书店应抽取的样本数为:n大=50家/500家*30家=3家(2)中型书店应抽取的样本数为:n中=150家/500家*30家=9家(3)小型书店应抽取的样本数为:n小=300家/500家*30家=18家2024/9/11282.分层最佳抽样分层最佳抽样是指不仅按各层单位数占总体单位数的比例分配各层的样本数,而且还要根据各层标准差的大小来调整各层样本数目的抽样方法。每层抽取的样本数计算公为:

式中:ni为第i层抽出的样本数Ni为第i层的总单位数σi为第i层的标准差n为样本容量2024/9/1129例2:仍用例1的资料,假设各类型书店图书销售额的标准差估计值为:大型20000元;中型8000元;小型5000元。按照最佳抽样法应从各层中抽取多少家书店进行调查?解:根据分层最佳抽样法的计算公式(5-2),有

从计算结果看,与例1中对应的3家、9家、18家有了明显的差异。2024/9/11303.分层最低成本抽样分层最低成本抽样是指在考虑统计效果的前提下,根据费用支出来确定各层应抽取的样本数,以节省调查费用。每层抽取的样本数计算公式为:

式中:ni为第i层抽出的样本数Ni为第i层的总单位数σi为第i层的标准差ci为第i层每单位的调查费用n为样本容量2024/9/1131例3:仍用例1的资料,现假设对不同类型书店进行调查,每调查一家大型书店需要的调查费用为600元,中型书店需要500元,小型书店需要400元,其他情况不变。按照最低成本抽样法应从各层中抽取多少家书店进行调查?2024/9/1132解:根据最低成本抽样法的计算公式(5-3)有

从计算结果看,与前两种抽取方法的抽取数量均不一样。所以,当根据不同的要求,采用不同的方法对样本进行抽取时,会有不同的结果。2024/9/11334.分层抽样的优缺点不断增加样本规模的前提下降低抽样的误差,提高抽样的精度;另一个方面是非常便于了解总体内不同层次的情况,便于对总体不同的层次或类别进行单独研究。分层抽样的缺点是抽样框较复杂,费用较高,误差分析也较为复杂。2024/9/11342024/9/1135某市有各类型书店500家,其中大型50家,中型150家,小型300家。假设各类型书店图书销售额的标准差估计值为:大型20000元,中型8000元,小型5000元;每调查一家大型书店需要的调查费用为600元,中型书店需要500元,小型书店需要400元,为了调查该市图书销售情况,现计划从中抽取30家书店进行调查,分别采用分层比例抽样、分层最佳抽样、最低成本抽样,应从各层中抽取多少家书店调查?作答正常使用主观题需2.0以上版本雨课堂可为此题添加文本、图片、公式等解析,且需将内容全部放在本区域内。正常使用需3.0以上版本详见书上分层比例抽样、分层最佳抽样、最低成本抽样部分内容答案解析答案解析主观题10分5.3.1.4整群抽样整群抽样又称聚类抽样。是指将总体全部单位分为若干“群”,然后随机抽取一部分“群”,然后对被抽中群体的所有单位进行全面调查的抽样组织方式。1.整群抽样与分层抽样的区别(1)分层抽样要求各层之间的差异很大,层内个体或单元差异小,而整群抽样要求群与群之间的差异比较小,群内个体或单元差异大;(2)分层抽样的样本时从每个层内抽取若干单元或个体构成,而整群抽样则是要么整群抽取,要么整群不被抽取。2024/9/11362.整群抽样的实施步骤先将总体分为i个群,然后从i个群中随机抽取若干个群,对这些群内所有个体或单元均进行调查。抽样过程可分为以下几个步骤:首先,确定分群的标志。其次,根据确定的分群标准,将总体(N)分成若干个互不重叠的部分,每个部分为一群。第三,据各样本量,确定应该抽取的群数。第四、采用简单随机抽样或系统抽样方法,从i个群中抽取确定的群数。2024/9/11373.整群抽样的优缺点整群抽样的优点是简单、方便,易于组织,能节省人力、物力、财力和时间。缺点是往往由于不同群之间的差异较大,由此而引起的抽样误差往往大于简单随机抽样;样本分布面不广、样本对总体的代表性相对较差等缺点。2024/9/11385.3.2非随机抽样方法非随机抽样的样本是由调研者凭经验主观选定的,因而代表性依赖于调研者的经验,具有主观性,所以调研结果误差较大,不能正确的反映总体和实际情况。非随机抽样分为任意抽样、重点抽样、判断抽样、配额抽样和滚雪球抽样几种方法。2024/9/11391.任意抽样,是指随意抽取调查单位进行调查(与随机抽样不同,不保证每个单位相等的入选机会)如:柜台访客调查,街头路边拦人调查。任意抽样,是一种由调查人员根据其工作便利而随意选取样本的方法。是非随机抽样中最简便、费用最省的一种方法。一般多用于市场初步调查或对市场情况不甚明了时采用,在正式市场调查中较少采用。2024/9/11402.重点抽样,只对总体中为数不多但影响大(如标志值在总体中所占比重颇大)的重点单位调查。2024/9/11413.判断抽样,是由市场调查人员根据经验判断而选定样本的一种非几率抽样方法。判断抽样具有简便易行,符合调查目的和特殊需要,可以充分利用调查样本的已知资料,被调查者配合较好,资料回收率高等优点。缺点是该类抽样结果受研究人员的倾向性影响大,一旦主观判断偏差,则根易引起抽样偏差;不能直接对调查总体进行推断。因此,判断抽样适用于总体的构成单位极不相同而样本数很小,同时调查者对总体的有关特征具有相当的了解的情况下,适合特殊类型的研究(如产品口味测试等);操作成本低,方便快捷,在商业性调研中较多用。2024/9/1142市场调查与预测2024/9/1143第六章市场调查资料的整理与分析

市场调查资料整理是指根据研究目的,运用科学的方法,对调查资料进行接收、审核、校订、编码、录入、净化、存储及一些简单的统计预处理,使之系统化和条理化,并以集中、简明的方式反映调查对象总体情况的工作过程。2024/9/11442024/9/1145市场调查资料整理是指根据研究目的,运用科学的方法,对调查资料进行

[填空1]

[填空2]

[填空3]

[填空4]

[填空5]

[填空6]

[填空7]

及一些简单的统计预处理,使之系统化和条理化,并以集中、简明的方式反映调查对象总体情况的工作过程。作答正常使用填空题需3.0以上版本雨课堂可为此题添加文本、图片、公式等解析,且需将内容全部放在本区域内。正常使用需3.0以上版本市场调查资料整理是指根据研究目的,运用科学的方法,对调查资料进行接收、审核、校订、编码、录入、净化、存储及一些简单的统计预处理,使之系统化和条理化,并以集中、简明的方式反映调查对象总体情况的工作过程。答案解析答案解析填空题7分6.1市场调查资料的接收和检查6.1.1市场调查资料的接收根据实际工作的情况,做好调查资料的接收工作主要包括一下几个方面的工作。1.认真仔细地管理好数据的收集和问卷的回收工作,掌握每天完成和接收的问卷数;2.在完成的问卷上记录完成的日期和接收的日期,以便有必要时在分析的过程中对先接收的数据和后接收数据进行比较;3.多个项目同时进行时,要清楚地记录交付实施的项目数、仍在实施的项目数和已经完成并返回的项目数;4.每份返回的问卷都应有一个唯一的、有顺序的识别号码,作为原始的文件;5.在有人进行资料的核对、事后编码、数据的录入等工作时,应按识别号码,准确地记录,明确是谁掌握着哪些原始文件;6.所有参与资料整理工作的人员都应清楚,他们不但负有保证工作质量的责任,还负有保证不丢失任何原始文件的责任。2024/9/11466.1.2市场调查资料的审核6.1.2.1审核的内容在对市场调查资料进行审核时,审核的内容主要有:1.完备性2.完整性3.准确性4.时效性5.真伪性2024/9/11472024/9/1148在对市场调查资料进行审核时,审核的内容主要有:完备性完整性准确性时效性ABCD提交真伪性E多选题2分6.1.2.2审核的方法1.逻辑审核利用逻辑和经验判断的方法,检查问卷的可信度。2.计算审核通过对资料内部的一些数据进行计算来发现问题。通过审核将问卷分成有效问卷、有疑问问卷和无效问卷三类,有效问卷可以直接使用,对于有疑问问卷需要校订以后才可以使用,无效问卷需要作废。2024/9/11496.1.3市场调查资料的分类6.1.3.1文字资料的分类(1)穷举原则。(2)相斥原则。对开放式问题的答案整理一般按照如下程序进行:1.集中所有同一个开放式问题的全部文字性答案,通过阅读、思考和分析,把握被调查者的思想认识。2.将被调查者的全部文字性答案,按照其思想认识不同归纳为若干类型,并计算各种类型出现的频数后,制成全部答案分布表。3.对全部答案分布表中的答案进行挑选归并,确定可以接受的分组数。4.为确定的分组,选择正式的描述词汇或短语。5.根据分类归纳的结果,制成正式的答案分布表2024/9/11506.1.3.2数字资料的分组数字资料分组一般按照如下步骤进行1.确定分组标志2.组数和组距的确定(1)组数和组距如何确定。(2)组距应否相等。(3)组距的位置如何确定。(4)组限如何表示。2024/9/11516.2市场调查资料的编码编码是指将各种类别的市场信息资料用代码来表示的过程。代码是用来代表事务的标记,它是用数字、字母或特殊的符号或者他们之间的组合来表示。根据对调查问卷的编码相对于问卷完成的时间,可以分为事前编码和事后编码两种情况。事前编码主要是针对答案类别事先已知的问题,事后编码主要是针对答案类别事先无法确定的问题。2024/9/11526.2.1编码的原则1.相关性原则,即相关的类别应有相关的编码。2.标准化原则,即编码的编制要标准化。3.系统化原则,即代码要以整体目标为标准,要系统化。4.周密性原则,即编码时尽可能考虑周全并预留一定的位置以备接收意外数据。5.一致性原则,即编码的内容要保持一致性。2024/9/11536.2.2编码设计编码设计的具体内容包括:问卷的代码、变量的定义(名称、类型、位数、对应问题等)、取值的定义(范围、对应含义等)。将这些内容列成表格形式,称为编码表,如表6-4所示。2024/9/11546.2.2.1事前编码设计单选题的编码设计:只需规定一个变量,取值即为选项号例6-1:请问您最近一年内买过DVD光盘吗?1、买过2、没买过2024/9/11552.多选题的编码设计:对多选题需规定多个变量,取值即为选项号。一般有两种做法:一种做法是将各个可能回答的答案选项都设为一个0---1指示变量,如果被调查者选择了该答案,此变量的取值为1,否则为0。例6-2:请问您观看的DVD光盘的主要来源是?

[][][]1.自己购买2.租借3.向朋友/同事/亲戚借的4.别人送的5.单位的6.其他2024/9/1156另一种做法是将变量定义为所选题号,变量值为选项号,变量排列顺序即为选择答案的顺序。用这种方法对例6-2的编码如表6-7所示:2024/9/11573.排序题的编码设计:需规定多个变量,有三种方法一种方法是,变量个数即选项个数,按照选项排列顺序,分别定义各变量为对应选项所排次序号,取之即为次序号。另一种方法是,变量个数即要求排序项数,依照次序号排列顺序,分别定义各变量为各次序号对应的选项项数,取值即为选项号。例6-3:请您根据信任程度由大到小对下列广告排序(信任度最高的广告前填1,其次信任的填2,依次类推,最不信任的填5):

[]1.电视广告[]2.报纸广告

[]3.广播广告[]4.杂志广告

[]5.路牌广告2024/9/1158例6-4:Q12请问下列广告中,您最信任哪个广告?[]

其次呢?[]

再次呢?[]1.电视广告2.报纸广告3.广播广告4.杂志广告5.路牌广告利用上述两种方法的对例6-3和6-4进行编码结果一样,如表6-8所示2024/9/1159还有一种做法,就是将变量定义为所选题号,变量值为选项号,变量排列顺序即为选择答案的顺序。利用这种方法对例6-3进行的编码如表6-9所示:2024/9/11604.数字型开放题的编码设计:对此类题也只需设一个变量即可,变量取值即为该数字。例如,直接询问被调查者的年龄,可以做如表6-10。2024/9/11616.2.2.2事后编码设计事后编码设计分为开放题和无结构问卷两种情况,这两种情况要想进行定量分析,都必须将问题转化为一个或几个变量,并将所有可能的答案类别赋予相应代码。事后编码设计时,应遵守准确性、便利性、完整性、惟一性、有效率、标准化、维护性等原则。开放性问题编码一般遵循以下步骤:第一步录入答案;第二步尝试用不同方法对录入的答案进行排序、归类;第三步编码人员及问卷设计者根据调查的目的对超出的答案进一步归纳,形成类别数量适当的“编码表”;第四步调查人员根据“编码表”中的编码对所有开放题的答案进行逐一归类,并在每个问题旁边写上实际答案在编码表中对应的号码。2024/9/1162例6-5:请问您不喜欢吃巧克力的原因有哪些?第一步,录入所有原因,并统计选择各种原因的频数(见表6-11)2024/9/1163第二步,对答案进行归纳,形成数量适当原因类别(见表6-12)第三步,对表6-12归纳出的原因类别进行编码(见表6-13)2024/9/1164第四步,根据表6-13的编码表,对每一份问卷的每一个具体答案,以追问的形式,归并到相应的原因类别下,并确定其对应的编码(见表6-14).至此才完成了对开放式问题的编码工作。2024/9/11656.2.2.3编制编码本编码本一般包含变量的以下几方面的信息:(1)所在列的位置(列数)(2)变量的顺序编号(3)变量名称及变量说明(变量及变量标识)(4)问答题编码(5)编码说明(变量值及变量值标识)2024/9/1166例6-6下列是一份关于消费者购买行为的调查问卷,请为其编制编码本消费者购买行为调查问卷(1)您购买日常生活用品经常到()购买(限选2项)A、百货商场B、小超市C、大超市D、购物中心E、街市(2)您购买化妆品经常到()购买(限选2项)A、百货商场B、小超市C、大超市D、购物中心E、街市(3)好企业生产好产品,请您根据认同程度圈选一个答案()5.非常同意4.同意3.无所谓2.不同意1.非常不同意(4)产品销售不是靠广告而是靠口碑,请您根据认同程度圈选一个答案()5.非常同意4.同意3.无所谓2.不同意1.非常不同意2024/9/1167根据编码的原则和编码表的结构,可以为该调查问卷编制编码本如表6-15所示:2024/9/1168对于回收的问卷,可以根据上表的编码,整理出消费者行为调查问卷的综合表,如表6-16所示:2024/9/11696.3调查数据的录入与净化6.3.1数据的录入数据录入前应做好以下工作:(1)给每个数据录入人员提供一份记录格式的详细说明文件;(2)开始录入前几份问卷时,研究人员必须在场;(3)决不能假设录入人员是懂得如何录入数据的;(4)如果有可能,应对录入的数据进行全面核查;(5)如果全面核查不可行,就应采取抽查的方式进行核查。2024/9/11706.3.2数据的净化数据净化主要是尽可能地处理错误的或不合理的数据,以及进行一致性检查。数据净化通常可以采用一些统计分析软件进行,例如SAS、SPSS等统计分析软件都可以很方便、快捷地寻找超出范围、有极端值或逻辑上不一致的数据。通常做法是:首先绘制一张所有非连续变量的频数表,以及计算连续变量的均值、标准差、最小值、最大值等统计量,如果有超出范围的数据或极端值就可以检查出来。例如,假设某个问题有A、B、C、D、E五个选项,分别用数值1~5对应表示A~E选项,用0表示缺失数据,则该问题答案的编码应该是0~5的六个数值,如果绘制出的频数表中出现了大于5的数据就是超出范围的。2024/9/1171逻辑上不一致的数据也可以通过SAS、SPSS等统计分析软件找出来。方法之一就是做出交叉表,从而可以方便地发现逻辑上不合理的数据。如表6-12,在一张“产品使用频度”和“熟悉程度”的交叉表中,有两个“从未听说过”该产品,但却在“经常使用”这种产品的被调查者。根据这两个被调查者的变化、变量编码、记录号码、列号码及变量值等,就可以进行必要的修改。2024/9/11726.4统计表和统计图6.4.1统计表统计表是调查资料、整理结果最常用的表示方法。它主要有以下几方面的作用:第一,能使大量的统计资料系统化、条理化,能更清晰地表述统计资料的内容;第二,利用统计表便于比较各项目(指标)之间的关系,便于计算;第三,利用统计表易于检查数字的完整性和正确性;第四,采用统计表表述统计资料显得紧凑、简明、醒目,使人一目了然。2024/9/11732024/9/11746.4.1.1统计表的构成1.表头:表头应放在表的上方,它所说明的是统计表的主要内容,是表的名称2.行标题(也就是主词)和列标题(也就是宾词):行标题和列标题通常安排在统计表的第一列和第一行,它所表示的主要是所研究问题的类别名称和指标名称,通常也被称为“类”3.数字资料:数字资料是表格中行和列交叉部分除行标题所在列与列标题所在行外的表格即为存放数字资料的区域。4.表外附加:如果有必要,需要在表外进行附加说明或注释。2024/9/11756.4.1.2统计表的设计要求设计统计表时要注意以下几点:1.合理安排统计表的结构。2.表头一般应包括表号、总标题和表中数据的单位等内容。3.如果表中的全部数据都是同一计量单位,可放在表的右上角标明,若各指标的计量单位不同,则应放在每个指标后或单列出一列标明。4.主词与宾词位置可互换。5.填写数字资料不留空格,即在空格处划上斜线。6.表中的上下两条线一般用粗线,中间的其他线要用细线,这样使人看起来清楚、醒目。7.在使用统计表时,必要时可在表的下方加上注释,特别要注明资料来源,以表示对他人劳动成果的尊重,方便读者查阅使用。2024/9/11766.4.1.3统计表的分类1.按统计表的作用不同,分为:(1)调查表(2)整理表(3)分析表2.按分组情况不同,分为:(1)简单表(2)单式统计表(3)复式统计表3.按统计表所显示的数列性质分类:时间数列表、空间数列表、时空数列结合表。2024/9/11776.4.2统计图统计图的类型主要有:1.条形图2024/9/11782.扇形图2024/9/11793.直方图2024/9/11804.折线图5.散点图2024/9/11816.茎叶图除了上述六种常用的统计图外,还有圆环图、网状图、百分条图、趋势图等,在选择绘制统计图时,应遵循实际需要、能够清晰表达统计意图、方便有效等原则,有时甚至可以将几种图形绘制在一张图中,以便于能够全面反映统计信息或便于各种指标的直观比较。6.5调查数据的描述性统计分析描述性统计分析是一种非常有效的概括大规模数据特征的方法,是指对调查总体所有单位的有关数据作搜集、整理和计算综合指标等加工处理,用来描述总体特征的统计分析方法。描述性统计分析是统计分析的重要组成部分,在统计研究中有着广泛的应用。市场调查分析中最常用的描述性统计分析主要包括数据的集中趋势分析、离散程度分析和相对程度分析。2024/9/11826.5.1数据的集中趋势分析集中趋势反映的是一组数据向某一中心值靠拢的倾向,在中心附近的数据数目较多,而远离中心的较少。对集中趋势进行描述就是寻找数据一般水平的中心值或代表值。根据取得这个中心值的方法不同,我们把测度集中趋势的指标分为两类:数值平均数和位置平均数。2024/9/11836.5.1.1数值平均数

2024/9/1184

2024/9/1185

2024/9/11866.5.1.2位置平均数1.中位数与分位数(1)由未分组数据确定中位数对未分组数据资料,需先将各变量值按大小顺序排列,并按公式(n+1)/2确定中位数的位置。当一个序列中的项数为奇数时,则处于序列中间位置的变量值就是中位数。当一个序列的项数是偶数时,则应取中间两个数的中点值作为中位数,即取中间两个变量值的平均数为中位数。2024/9/1187(2)由单项数列确定中位数根据单项数列资料确定中位数与根据未分组资料确定中位数方法基本一致。它是先计算各组的累计次数(或频数),再按公式(∑fi+1)/2确定中位数的位置,并对照累计次数确定中位数。例6-14某班同学按年龄分组资料如表6-18所示,求中位数。2024/9/1188

式中:Me——中位数;L——中位数所在组下限;U——中位数所在组上限;fm——为中位数所在组的次数;2024/9/1189fi——每组次数;d——中位数所在组的组距;Sm−1——中位数所在组以下的累计次数;Sm+1——中位数所在组以上的累计次数。例6-15某企业的工人在一段时间内的零件加工数据统计情况如表6-19所示,求中位数。2024/9/1190

(4)分位数将统计数据分割成若干等分,在等分点位置的数据就是分位数。常用的分位数有:第一四分位数、第二四分位数和第三四分位数,记作Q1,Q2和Q3;以及十分位数(Dectile)和百分位数(Percentile)2024/9/11912.众数众数是在一个统计总体或分布数列中出现次数最多的变量值,通常用Mo表示。如果在数据中恰有两个众数,称此数据为双众数;如果在数据中有两个以上的众数,则称此数据为多众数。2024/9/11926.5.1.3各种平均数之间的关系1.数值平均数和位置平均数的比较(1)数值平均数是根据总体内各个标志值计算的,位置平均数是根据总体中某一个特殊位置上的标志值确定的。数值平均数对数据的概括能力显然比位置平均数要强一些。(2)数值平均数容易受极端值的影响,对于极端值的“耐抗性”较低;位置平均数却相反,数列中某些数据的变动不一定会影响到它们的水平,个别或少数极端值对于位置平均值几乎没有影响,“耐抗性”较高。(3)适用的数据类型不同。2024/9/11932.各种数值平均数的比较(1)适用的场合不同。一般来说,在计算单位标志平均数时,用算术平均数或调和平均数;在计算动态比率平均数时,用几何平均数。(2)计算的繁简程度不同。算术平均数的计算过程最简单,其他数值平均数的计算都相对复杂一些。(3)某些数值平均数对变量的取值有特殊的限制。几何平均数要求被平均变量不能为负或零,调和平均数则要求被平均变量不能为零。2024/9/11946.5.2数据的离散程度分析在统计中,把反映现象总体中各个体的变量值之间差异程度的指标称为离散程度。反映离散程度的指标有绝对数,如极差、平均差和标准差和相对数,如离散系数两类。1.极差与四分位差(1)极差(Range)也叫全距,是一组数据的最大值与最小值之离差

R=Xmax-Xmin(2)四分位差(quartiledeviation)是指第三四分位数(沿用前面分位数内容中使用的符号Q3)与第一四分位数沿用前面分位数内容中使用的符号Q1)之差,也称为内距或四分间距,用Qd表示。四分位差的计算公式为:

Qd=Q3-Q1四分位差反映了中间50%数据的离散程度。其数值越小,说明中间的数据越集中;数值越大,说明中间的数据越分散。四分位差不受极值影响,因此,在某种程度上弥补了极差的一个缺陷。2024/9/11952024/9/1196

2024/9/11972024/9/1198

6.5.3数据的相对程度分析

2024/9/11992024/9/11100

2024/9/11101

7.计算和运用相对指标应注意的问题统计相对数是一种抽象化的指标数值,是现象进行对比分析的一种重要手段,要使对比分析准确、深刻地反映出现象之间的关系,发挥相对数的作用,在计算和应用相对指标时应注意以下几个问题:(1)注意指标的可比性。(2)要把各种相对数结合起来。(3)把相对数和绝对数结合起来使用2024/9/111026.5.4数据的交叉列表分析交叉分析表又称列联表、交互分析表,是指同时将两个或两个以上有一定联系的变量及其变量取值按一定的顺序交叉排列在同一张统计表内,使各变量值成为不同变量的结点,进而分析变量之间的相互关系,最终得出结论的一种数据分析技术。交叉列表分析方法在市场调查中被广泛应用的原因一是交叉列表分析及其结果能很容易地为那些并不具有较深统计知识的经营管理人员接受和理解;二是许多市场调研项目的资料整理分析可以依赖交叉列表分析方法解决;三是通过一系列的交叉列表分析,可以深入分析和认识那些复杂的事物或现象;四是清楚明确的解释能使调研结果很快成为经营管理措施的有力依据;五是这种技术简便易行,尤其被一般市场调研人员更易接受。2024/9/111036.5.4.1双变量交叉列表分析双变量和多变量交叉列表分析,是用于提供基本调查结果的最常用形式。例如,表6-20给出了对某品牌“知悉程度”和对该产品“购买量”之间某种关系。从表中可以看出,对该品牌产品知悉程度高的消费者购买量似乎也比较铰多。2024/9/11104为了更进一步考察这两个变量之间的关系,一般要求计算百分数。一般准则是按照自变量各类的合计来计算因变量各类的百分数。如表6-21所示。从表中可以看出,在对该品牌产品知悉程度高的消费者中,购买量多者占71.1%;而对该品牌产品知悉程度低的消费者中,购买量多者只占60%。2024/9/11105在处理和分析数据时,研究者可能难以确定哪个变量用作自变量更为合适,因此提供给客户的交叉表一般是包含四部分数字的完整的交叉表,每格内的四个数字分别表示频数、行百分数、列百分数和总百分数(见表6-22)。2024/9/111066.5.4.2多变量交叉列表分析多维交叉列表分析大致分为以下几种情况。在原来两个变量具有相关关系的情况下,引入第三个变量作多维交叉列表分析后,可能出现三种结果:更精确地显示原来两个变量间的联系;证明原来的两个变量没有相关关系;原来两个变量之间的关系没有变化。在原来两个变量没有相关关系的情况下,引入第三个变量作多维交叉列表分析后,可能出现两种结果:原来两个变量之间的关系没有变化;揭示原来两个变量之间被隐含的某种相关关系。2024/9/11107下面重点分析说明通过多维交叉列表分析揭示原来两个变量之间关系发生变化的几种情情形。1.在原来两个变量具有相关关系的情况下引入第三个变量,多维交叉列表更精确地显示原来两个变量之间的相关关系。在表6-23的双变量交叉列表分析中,可以发现“婚姻状况”与“时装购买量”两个变量之间存在一定的相关关系,即“未婚”者购买时装多的比例明显高于“已婚”者。2024/9/11108为避免错误判断,在上述双变量交叉列表的基础上再引入第三个变量,如教育程度、职业、居住区域或性别。这里引入“性别”变量,列出包括婚姻状况、性别与时装购买量的多维交叉列表(见表6-24)。从表中可以看出,在引入“性别”变量后,“婚姻状况”与“时装购买量”之间的关系变得更加具体和清晰了,即在“男性”中,“未婚”者“时装购买量”多的比例比“已婚”者高,但是关系较弱;但在“女性”中,“未婚”者“时装购买量”多的比例则高出“已婚”者很多,相关关系显著。2024/9/111092.在原来两个变量具有相关关系的情况下引入第三个变量,多维交叉列表证明原来的两个变量没有相关关系。例如,在表6-21

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论