




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
/第5章制定营销测量方案学习目标理解测量的基本概念了解测量的各种尺度及其应用掌握营销调研常用量表掌握信度与效度之间的关系引例“世界新七大奇迹"评选结果将于2007年7月7日在葡萄牙首都里斯本正式公布。对于这一由全世界网民“海选"产生“世界新七大奇迹”的做法,不少人士提出了批评意见.有人认为,这种将文化遗产娱乐化的做法,权威性和可信度值得怀疑;还有人表示,主办方多方推销广告和纪念品,有借评选“圈钱”之嫌。争议一:评选的权威性20世纪末,加拿大商人贝尔纳·韦伯提出重新确定世界七大奇迹的想法,并通过一个名叫“新开放世界公司"的机构进行操作.1999年,他与一些专家学者提出了200个候选名单,后来将名单缩减到21个,全世界的选民可以通过互联网或电话方式投票,从中选出新的七大奇迹。但这场评选的权威性和是否存在商业炒作成为外界争论的焦点。埃及最高文物委员会主席扎西·哈瓦斯曾指出,世界奇迹的评选是个专业技术工作,应当由联合国教科文组织发起,由各界专家考察后评判,这样才能保证其严肃性和可信度。还有人指出,候选遗产和选民来自世界不同国家,选民在投票时容易受情感因素影响而把票投给本国景观,这样评选就难免沦为国家间“自立山头式"的拉票大战,其结果也就无法客观体现遗产的真正历史文化价值.对此,主办方认为,世界奇迹是文化遗产,文化是属于各国人民的,各国人民当然有权利通过投票方式进行评选。“每个人都可以评选他们心中的奇迹,难道他们没有这样的权利?”争议二:主办方圈钱是否借此“圈钱”是“新七大奇迹”评选的第二个争议焦点。记者注意到,登录“新七大奇迹"网站投票是免费的,但只能投一次票。而如果通过购买纪念证书的方式评选,则可以多次投票,每个纪念证书售价2美元。此外,“新七大奇迹”网站还在线销售各种徽章和纪念品,推销去这些地方的旅游团,销售揭晓仪式门票和电视转播权等。难怪墨西哥《改革报》评论说,“这是一种颇为新颖的生财之道”。对此主办方表示,他们已为整个评选活动投入超过1000万欧元。而在收入部分,其中一半用于日常的行政开销,另一半将不纳入私人收入,而用于“新七大奇迹”的文化宣传和保护工作。这是一个当前常见的各种排名的例子之一,各方争议的焦点主要集中在其测量方法的有效性.这正是本章要讨论的问题.案例来源:涂平营销研究方法与应用2008年北京大学出版社—————-—-———————-————--——————————————测量的基本概念测量是指调研者根据特定的规则对研究对象的某些特征分派数字或其它符号的过程.需要注意的是,所测量的不是物体本身,而是它的某些特征。例如,不能测量桌子,只能测量它的宽度、高度、重量、颜色或其它的相关特征。另外,科学的测量不是随意地将数字或其它符号分派给研究对象,而是按照特定的规则进行的.测量的过程是一个从抽象到具体的过程。测量的基本步骤有四步,一是概念操作化;二是分派指标;三是实施测量;四是信度与效度的评估。一、概念操作化概念操作化也叫概念化,是将数字或符号所指代的内涵,用可测量的事实或行为表达出来,对某一概念达成共识的过程。概念操作化的实质是将抽象的概念回归到经验事实与现象。对于具体的属性,例如高度,通常都有比较清晰的共识;对于一些抽象的概念,例如产品质量,却可能存在多种理解。有人认为质量好就是指做工精细;有人认为就是指服务态度好;有人认为就是指价格昂贵;有人认为就是指品牌好,等等。因此,在进行测量之前,一定要清楚测量什么,要在对概念的内涵达成共识的基础上,确定概念包括哪几个主要方面(也称维度)。———-——-——-———————————————————————【例5-1】“消费行为"的概念操作化(1)对概念进行界定“消费行为”指消费者对产品的购买和使用,以及对产品的处置(如对喝完的奶茶包装的处理、对未喝完的饮料进行储存)(2)确定维度根据需要,选择三个维度:消费观念、对品牌的忠诚度、购买和使用行为(3)确定最终测定问题在每个维度上确定要测定的问题,其表现为多个问题形式。也就是说,确定在“消费观念”方面应当提哪些问题,在“对品牌的忠诚度”方面应当提哪些问题,在“行为”方面应当提哪些问题。在“消费观念”维度上提以下几个问题:对产品的感觉,是否购买品牌产品,购买该产品的预期支出。在“对品牌的忠诚度"维度上提以下几个问题:对该品牌的特定偏好,对该品牌的重复购买,品牌转换的情况在“购买和使用行为”维度上就提以下几个问题:购买次数、消费量、消费场所、购买地点、消费情景、重复购买的次数.资料来源:作者根据相关资料整理二、分派指标给指标分派数字或者其它符号就是确定测量规则的过程.对于许多抽象的概念,例如某品牌的知名度,消费者的态度,产品质量是无法直接观察测量的,因此要用一系列可以测量的指标来反映。例如,在市场调研中,对于测量某品牌的知名度,我们可以用“消费者中知道该品牌的人数百分比”进行测量。--—-——————-————————-——-———————--—--——-—【例5-2】分派“消费量”和“购买量”的测量指标平时,你平均每天大概喝几瓶饮料?(单选)不喝2、一瓶3、两瓶4、三瓶5、三瓶以上在当地,如果购买饮料,你会选择去哪里购买?大型商场2、连锁超市3、小商店4、报刊亭5、其它地方资料来源:作者根据相关资料整理——————-——-——-—-———--——-—-———————-—--———三、实施测量实施测量是指按照已确定的规则,对测量对象进行测量,收集信息,并用数字或符号记录测量结果的过程。例如,顾客对产品的评价信息通过口头报告收集;而购买行为通过口头报告和日志记录来收集信息。四、信度与效度的评估信度与效度的评估是对测量结果的精确度和准确度的评估,旨在保证测量结果能很好地反映所测属性的真实值.测量的基本尺度测量尺度也称测量的等级或测量的层次。指的是赋予测量对象的数字和其它符号的含义及其所允许的数学运算,可分为定类、定序、定距和定比四种主要测量尺度。一、定类尺度定类尺度是各类测量尺度中最低的一种,在本质上是一种分类体系。即将测量对象的不同属性或特征加以区分,标以不同的数字或符号。在市场调查中,对诸如消费者的性别、职业、婚姻状况、宗教信仰等特征的测量,都是常见的定类尺度的测量.它们分别将消费者分成“男性与女性",“干部,教师,白领,商人,专业技术人员……”或者“未婚者,已婚者,离婚者……"“佛教,伊斯兰教,耶稣教……不信教”等各种不同的群体或类别,而每一个消费者则分别属于或者不属于其中某个类别。定类尺度的测量实质是一种分类体系,设计这类尺度时应注意其互斥性、穷尽性和完备性。即所分的类别既要相互排斥,互不重叠,又要对各种可能的情况包罗无遗。这样,我们所测量的每一个调查对象都会在我们的分类体系中占据并且只占据一个类别。例如将性别分成“男性”和“女性”两类。定类尺度是市场调研中使用率最高的,也是四种测量尺度中测量等级最低的,其他三类尺度中,无一例外的包含着定类尺度的分类功能。二、定序尺度定序尺度也称等级尺度或排序尺度,其数字和符号不仅代表类别,而且还反映事物或现象的高低、大小和先后顺序的差异.定序尺度能够表示一个调研对象具有的某种特征是否比另一个调研对象更多还是更少,但没有表明相差多少。排在前面的调研对象与后面的相比有更多的某种特性,但是到底相差多少是未知的。在营销研究中,调研人员可以用定序尺度对相对的态度、观点、感受和偏好进行等级排列。必须注意的是这一尺度上的间距不能准确代表其测量的特征量的相差多少。因此,对于定序变量,除了计数操作外还可以计算其众数、百分位数、中位数,但不能计算均值和方差,也不能进行加、减、乘、除等运算.三、定距尺度定距尺度也称为等距尺度或区间尺度。定距尺度除了包含定序尺度的所有信息外,还能够确定不同等级的间隔距离和数量差别。日常生活中常见的例子有温度、成绩等。营销调研中用评价量表获得的分值通常被看做是定距数据。定距尺度的零点以及测量的单位都是人为设定的.因为没有自然零点,例如在冬天,我们可以测得北京的气温是0℃,但这并不代表北京“没有温度”,而只是代表北京的气温达到了水的“结冰点的温度”.从测量的角度看,此时的“0”只不过是一个特定的数字而已,它是人为决定的。变量可以进行加减运算,但乘除却没有意义。对于定距变量,除了计算其众数、中位数、均数外,还可以计算算术平均值、标准差、简单相关系数等营销研究中常用的统计量。那些可用于定类和定序数据的统计分析方法也可以用于定距数据.在实际调研中,有时定序和定距尺度的区分并不是绝对的.一个定序变量可以传达部分有关距离的信息,因此有时在统计分析时,可能会把它近似地看成定距变量对待。四、定比尺度定比尺度也称为等比尺度或比例尺度。不仅具备前面三种尺度的所有功能,而且还有自然零点,因此可以进行加减乘除运算。如对人们的收入、年龄、出生率、性别比等所进行的测量都是定比尺度的测量。对于定比变量,计算比值是有意义的.身高体重、年龄、销售额、购买频率等都是以定比尺度测量的变量.不过,在态度、观点、感受和偏好等方面的测量,定比尺度就非常困难。除了前面提到的统计方法以外,还可以计算定比变量的几何均值、调和平均值和变异系数等。测量水平量表描述涉及的典型变量描述性统计定类用数字识别对象类别,判断属于/不属于归类,如男性/女性、用户/非用户频数、百分比/众数、中位数定序除识别外,数字还用于确定顺序,判断更大/更小排序,如对酒店或银行的偏好、对食品口味打分均值/中位数、方差矩阵定距除类别和顺序外,数字还用于判断距离,判断间距的相等性复杂构架的偏好,如温度、有关品牌的认知水平均值/全距、方差定比综合上面三种特性,再加上绝对零点,判断比例的相等性可获得精确测量时,如销售数额、年龄、收入几何平均数、调和平均数表5-1四种测量尺度的比较———-———-—-—————————-——-—-—————-—-———【例5-3】对洗发水的偏好表中以某个消费者对洗发水品牌的偏好和购买为例,给出了各种测量尺度的虚拟例子。表中第2列的编号属定类变量,用来识别不同的品牌(例如1代表力士洗发水,3代表海飞丝洗发水,6代表舒蕾洗发水),数字的大小并不代表洗发水的优劣;偏好排序(表中第3列)是定序变量,表示调查对象对不同品牌的偏好顺序,其中潘婷是最受欢迎的品牌,其次是力士,对清扬的偏好排在最后;第4列的偏好等级用的是定距尺度,其中偏好排序列前两位的品牌的得分相同,都是7分,而排最后的品牌最低,只有3分,表明对力士和潘婷的偏好程度其实相差很小;最后一列的购买量是定比变量,从中可以看出潘婷的购买量最大,约为力士的1.7倍,飘柔的5倍。主要测量尺度的例子(虚拟数据)名牌名称定类尺度编号定序尺度偏好排序定距尺度偏好等级(1—7)定比尺度购买量(支)力士1273潘婷2175海飞丝3440飘柔4361清扬5630舒蕾6540资料来源:作者根据相关资料整理——————--—————-—-——-——-——-——-——-—-———-—-第三节营销调研常用量表量表是一个纽带,它连接着研究目标与被研究者。调研的目的必须转化为具体的问题和测量指标才能从被访者那里搜集到所需的数据和信息。量表在营销调研中起着重要的作用。如果量表设计的不合理,那么精心编制的抽样计划、训练有素的访问人员、科学的数据分析技术都将徒然无用。不恰当的设计必将导致信息收集的不完整和数据的不准确,最终导致资源的浪费。一、量表的定义和特征量表是一种测量工具,它是用来对主观的或抽象的概念进行定量化测量的程序,对事物的特征变量根据特定的规则分派数字或符号,因此形成了不同测量水平的测量量表,又称为测量尺度。量表相当于一把“尺子”,用于精确度量一个较抽象的或综合性较强的概念,特别是态度和观念(如生育态度、种族偏见、政治倾向)的不同程度和差异。量表的基本特征是描述性、比较性、程度和起点.其中,描述性是指用某一特定的词或标识来代表划分的每个等级;比较性指的是描述的相对规模;当比较了所有的不同点并且分级表示以后,量表还有另外的特征——程度;如果某个量表有一特定的起点或零点,那么我们就说它有起点这个特性.量表的每个特征都是建立在前一个特征上的,如果一个量表有高一级的特性,那么它一定有低一级的特性;反之则不成立。量表比单一指标或单项问题的测量能获得更多、更真实、更准确的信息,能通过间接的、定量的方式衡量那些能够直接观察和度量的社会现象。二、量表的常用形式营销调研中常见的量表形式可以从比较量表和非比较量表来分类。如图5—其中常用的比较量表有配对比较量表、等级顺序量表、常量和量表。常用的非比较量表有李克特量表、语义差异量表和沙氏通量表。量表分类如图5-1李克特量表非比较量表比较量表分项评分量表配对比较等级顺序常量和连续评分列表语义差异沙氏通李克特量表非比较量表比较量表分项评分量表配对比较等级顺序常量和连续评分列表语义差异沙氏通图5—1量表分类图(一)李克特量表(总加量表)李克特量表是由伦斯·李克特根据一般量表方法发展而来的,该量表后来又被许多调研组采用并进行改动.李克特量表是社会研究中用得最多的一种量表形式.李克特量表要求被调查者对有关研究对象的每一个陈述语句表示同意或不同意的反应态度。一般每个量表项目有5个反映类别,从强烈反对到强烈赞成,数值可以是-2—2,或者是1—5。分析可以逐项进行,或者通过对项目求和计算每个调查对象的总评分。1.李克特量表的特征:(1)由一套态度项目构成,假设每一项目具有同等的态度数值,根据受试者反应同意与不同意的程度给予分数,所有项目分数的总合即为个人的态度分数,这个分数的高低即代表个人在量表上或连续函数上的位置,表示同意或不同意的程度。(2)因素量表可含不同构面,为多元量表,李克特也属于因素量表之一.2.李克特量表的制作过程:(1)收集50~100与测量主题有关的陈述语句,各种陈述和说法应当比较分散,以覆盖所研究问题的一个足够宽的范围.(2)对每个陈述语句,设定项目选项,对每个选项赋予一个分值。有些说法是正向表述的,有些是负向的。在计算累加的态度总分时,需要对负向说法的得分作逆向处理。(3)选择部分(20人以上)受测者对全部项目进行预测试,根据受测者的各个项目的分数计算代数和,得到个人态度总得分,并依据总分高低将受测者排序。(4)将调查中得分最高的25%的人与得分最低的25%的人进行比较,然后计算出每道题的分辨系数。分辨力系数是绝对数。分辨力系数=∣(得分最高的25%的人在这一问题上的平均分-得分最低的25%的人这一问题上的平均分)/总分均值∣(5)根据试调查的数据进行量表的信度和效度分析.根据分析的结果,去除影响信度和效度的陈述或说法,从而得到有较高信度和效度的李克特量表——--——————--————-————————————-—--—-———-【例5—4】关于工作倦怠感的李克特量表从未如此很少如此有时如此经常如此总是如此1、对工作感觉到有挫折感……123452、觉得自己不被了解…………123453、我的工作让我情绪疲惫……123454、我觉得我过度努力工作……123455、面对工作时,有力不从心的感觉…………123456、工作时感到心灰意冷…………123457、觉得自己推行工作的方式不适当…………123458、想暂时休息一阵子或另调其他职务…………123459、只要努力就能得到好的结果………………1234510、我能肯定这份工作的价值………………12234511、认为这是一份相当有意义的工作…………1234512、我可以由工作中获得心理上的满足……1234513、我有自己的工作目标和理想………………1234514、我在工作时精力充沛……1234515、我乐于学习工作上的新知………………1234516、我能够冷静的处理情绪上的问题…………1234517、从事这份工作后,我觉得对人变得更冷淡………………1234518、对某些同事所发生的事我并不关心……1234519、同事将他们遭遇到的问题归咎于我……1234520、我担心这份工作会使我逐渐失去耐性……1234521、面对民众时,会带给我很大的压力…………1234522、常盼望有假期,可以不用上班………………12345资料来源:作者根据相关资料整理———--———--————-——--——--—--———-———-——-——【例5-5】对民生商店评价的李克特量表请根据下面提示表达你对每种观点同意或反对的态度。提示:1=完全不同意2=不同意3=有些不同意4=中立5=有些同意6=同意7=完全同意完全不同同意不同意有些不同意中立有些同意同意完全同意1.民生商店的商品品质高2.民生商店服务很差3.我喜欢在民生商店购物4.我不喜欢民生商店的广告5.民生商店的商品花样多6.民生商店的商品价格公道资料来源:作者根据相关资料整理(二)语义差异量表语义差异量表又叫语义分化量表,这是美国心理学家(奥斯古德、萨奇、泰尼邦Osgood,Suci,Tannenbaum,1957)发展的一种态度测量技术。20世纪50年代后发展起来。是一次性集中测量被测者所理解的某个单词或概念含义的测量手段。针对这样的词或概念设计出一系列双向形容词量表,请被测者根据对词或概念的感受和理解,在量表上选定相应的位置。语意差异量表是由两个意义对立的形容词构成一组双极标度,以评价产品、品牌、企业或观念等。在意义对立的两个形容词中间,又分为不同级别,一般有五级、七级、九级或十一级等.1。语义量表的使用方法=1\*GB2⑴确定每一片断的维度供受访者判断.=2\*GB2⑵界定两个相反的术语代表每一维度的两极。(为防止回答偏差,最好将彼此有关系的项目位置加以变化。)=3\*GB2⑶做出语义差异的计分表。可以对语义差别量表中的不同项目根据受访者的回答进行打分。结果数据可用来分析不同测量对象、不同受访者的相同点和不同点。还可将各项目的得分加总,用以比较不同测量对象整体形象的偏好等级。通过语义差异量表,我们可以对相互比较的两组或者多组品牌或者研究对象作出比较。因为在受访者的心目中,不同比较对象的差异程度以通过连点画线和计算的方式表现出来。2.语意差别量表的分析方法(1)总分分析法总分析法是对各评价等级赋值,然后把每一个被调查者所选择的评价分数加总,其总分就是该被调查者对调查事物的总体评价.(2)图上分析法图上分析法是在对各评价等级赋值后,把所有被调查者对每一对评价项目的打分加总,然后计算平均值,并把各评价项目的平均值用折线连接起来,根据图中折线对调查事物进行分析。——————————-——--—-—————————————————-————【例5—5】图上分析法分析消费者对某超市的评价+3+2+10-1-2-3态度热情——————-态度冷淡价格便宜———-——-价格昂贵环境清洁———--——环境肮脏光线明亮———————光线灰暗商品新颖———--——陈旧商品资料来源:作者根据相关资料整理—-———————-——-——-———-—--——-——-—-—-———【例5-6】用语义差异量表请消费者对某个品牌饮料的进行评价:请你从以下几个方面对饮料进行评价,在最能表明您的评价的位置上做上标记1234567品牌名气大+—--—---+--—---—+-—----—+—————--+—--—-—-+—-—-+名气小品质好+——--—--+--——-—-+——-——-—+——-—--—+—-—--——+-——-—--+品质差档次高+---—--—+-———--—+——--+———+—---——-+—-—————+档次低包装精美+—-—--——+—+—-—--——+----+-——-—-—+-—-——--+包装部精美品味好+--—--—-+-——---—+----+-—--——-+—-—-—-—+---—+品位差包装时尚+————+----———+—-——+-—----—+—------+—---+包装无时尚感广告动人+——-—---+-—--—--+——----—+---—--—+----—-—+-—----—+广告不动人促销吸引人+-----——+———-——-+----—--+--——---+—-—----+—----—-+促销不吸引人资料来源:作者根据相关资料整理-———————-—————--—————————-————-————-———(三)沙氏通量表沙氏通量表通过应答者在若干(一般9—15条)与态度相关的语句中选择是否同意的方式,获得应答者关于主题的看法。每条语句根据其类别都有一个分值,要求受测者指出他同意的陈述,根据受测者所同意的陈述或意见的分值,通过分值平均数求得受测者的态度分数.分数越高,说明受测者对某一问题持有的态度越有利;分数越低,说明持有的态度越不利1。沙氏通量表的制作=1\*GB2⑴由调查者提出若干个表述;=2\*GB2⑵将这些表述提供给一组评判人员,通常在20-50人左右,要求他们将这些表述划分为若干组(一般为7、9、11组)=3\*GB2⑶根据评定人员所确定的各组语句的次数,删除次数分配过于分散的语句,计算各保留语句的中位数,并按中位数进行归类。=4\*GB2⑷每个类别中选出一、二条代表语句,将这些语句混合排列,即得到一个沙氏通量表——-—————-—-————-——————-—-—--————————-——【例5—7】电视商业广告态度测量的沙氏通量表:所有的电视商业广告都应该由法律禁止看电视广告完全是浪费时间大部分电视商业广告是非常差的电视商业广告是非常差的电视商业广告并不过分干扰欣赏电视节目对大多数电视商业广告我无所谓好恶我有时喜欢看电视商业广告大多数电视商业广告是挺有趣的只要有可能,我愿意电视上看过广告的商品大多数商业广告能帮助人们选择更好的商品电视商业广告比一般电视节目更有趣资料来源:作者根据相关资料整理(四)连续评分量表连续评分量表也称作图示评分量表,是要求被调查者在一条直线上的适当位置作出标记为研究对象打分,这条直线从一个极端到另一个极端。评分分数可以是数字的或文字描述的。————--—————--———————-————-—————————————【例5-8】用连续评分列表对百货公司进行评价①请你为民生百货公司的服务态度打分。态度很差-—--—-----—-—-——---———--——--态度很好②请你为民生百货公司的商店环境打分。环境很差--—-—--—-—————-—--—-—--—-----——-—环境很好0102030405060708090100③请你为民生百货公司的商场布置打分。布置很零乱-—-—----—----—----—-—-——---布置有特色很差一般很好资料来源:作者根据相关资料整理———————————--—————--—--———————-—-—————-(五)配对比较量表在配对比较量表中,受测者被要求对一系列对象两两进行比较,在两个被比较中的对象中做出选择。“1"表示受测者认为这一项目更重要,“0”表示认为另一个项目更重要。将各行取值进行加总,得到比较得分.被测量的对象的个数不宜太多,以免使受测者产生厌烦而影响应答的质量.配对比较方法克服了等级排序量表存在的缺点。首先,对受测者来说,从一对对象中选出一个肯定比从一大组对象中选出一个更容易;其次,配对比较也可以避免等级量表的顺序误差。但是,因为一般要对所有的配对进行比较,所以对于有n个对象的情况,要进行n(n-1)/2次配对比较。因此,被测量的对象的个数不宜太多,以免使受测者产生厌烦而影响应答的质量。例如,某电脑经销商非常想了解几种电脑品牌在消费者心目中的地位,就可以采用配对比较量表。如果将A品牌和B,C,D另外三种品牌的电脑进行比较,即可将A品牌与其余三种品牌组合成6对,要求受访人员成对比较并指出哪一种品牌较好。假设在本次调查中选用的样本量为100,如果A与B的比较回答中回答A佳,则在A较B佳栏目下记录一人,如果共有20人这样认为,则频数为20。全部6对电脑品牌比较后所得的结果见表5—4—-————————-————-——————--————————-——-【例5-9】认为i品牌较j品牌为佳的人数分布ﻩij ABCDA----807040B20---—3015C307035D608565--—-为了更进一步分析,可将频数转化为频率,见下表ﻩij ABCDA0.500.800。700.40B0。200.500.300.15C0.300.700.500.35D0.600.850。650。50合计1.602。852.151。40表中,各品牌与自身比较的比率均是0。5,将每栏的比率相加,就可得到受访者对各个品牌的态度值。四种电脑品牌的态度值相比,显然B品牌最受欢迎。调查所得的结果是:B(2。85)>C(2.15)〉A(1.60)〉D(1.40)资料来源:作者根据相关资料整理-————--—-—--——————————-———————-——————-—配对比较量表适用于商品品牌(或规格、花色等)不多,而且消费者对各种品牌的商品比较了解的情况.(六)等级顺序量表等级顺序量表将许多研究对象同时展示给受测者,并要求他们根据某个标准对这些对象排序或分成等级。这种测量水平,不仅能区分不同类别,而且能排出等级或顺序,如胖瘦、大小、高矮、上中下、名次等。等级量表反映事物的类别的差不必相同,不具有等距性。排序的对象不能太多,否则易出现错误或遗漏。———-———-———--——-————--———-———-———-—【例5—10】教学评价的等级量表
4321观点提出观点并且解释了为什么引起争论出观点但并没有解释为什么引起争论观点不明确、混淆或者不清晰没有提出自己的观点支持该观点的理由提出清晰的,适当的理由及逻辑推理来支持自己的观点理由很清晰,但忽视了一些重要的理由能够提出1-2条说服力很弱的理由,但不足以支持该观点没有提出能够支持该观点的理由反对该观点的理由论述了反对该观点的理由并解释它们的有效性论述了反对该观点的理由但是忽视或者没有解释该观点成立的理由能够提出反对该观点的一些理由,但是没有加以论述没有讨论反对该观点的理由组织文章开头很吸引人,内容信息丰富,结论令人信服文章的开头、内容、结尾一般组织显得很粗糙,论述过程中有时跑题目的性不明确,组织得很混乱语气和语调感觉到我十分关注我的观点,我正在告诉他人我是怎么想的和我的感觉感觉很好,但给人的感觉是:这种文章很多人都可以写出来文章中没有真情实感,或者感觉到作者在杜撰某些东西文章太正式或者太不正式,感觉到作者特别偏好文章的某一命题用词自然、生动、形式多样有一些“出彩”的词,但更多的是一些常用的词用词枯燥乏味,给人一种堆砌辞藻,过分想表现一些东西的感觉词语重复使用频率过高语句流利语句清晰、完整,综合运用多种句型有一些结构较好的句子,但整体上冗长、枯燥句子笨拙、破碎句子笨拙、破碎,文章令人读起来特别不舒服语法语法、标点符号、拼写正确虽然有一些小错误,但整体感觉还可以错误较多,不能吸引读者错误太多.阅读困难资料来源:学业成绩评价网———————————————————-————————--————-—(七)常量和量表常量和量表也叫做数值分配量表,是要求被调查者在固定数值范围内(10—100),对所测事物依次分配一定数值,从而作出不同评价。———-————-—————-——--———————-————————【例5-11】用常量和量表对三种品牌进行调查对某种商品的三种品牌在消费者心中的信誉高低进行调查,要求消费者按喜爱程度对三种品一一打分,每个评价项目总分为100分。例如某消费者的打分结果如下表所示:品牌项目ABC合计170201010025030201003304030100总计1509060从各品牌的总得分可以看出,A品牌得分最高,说明A品牌是该消费者最喜欢的品牌.如果调查了100个消费者,就需把100个人得分数值相加后再除以人数,从而得到该项目的最后得分.资料来源:作者根据相关资料整理——————--—————--——--——-—————————-—李克特量表语义差异量表沙氏通量表配对量表等级量表常量和方法加总量表法因素法等距法配对法顺序等级法数值分配法内容要求受测者对一组与测量主题有关的陈述语句发表自己的看法。在每一个形容词和反义词的区间,反映人们对性质完全相反的不同词汇的反应强度。通过应答者在若干与态度相关的语句中选择是否同意的方式,获得应答者关于主题的看法。受测者被要求对一系列对象两两进行比较得分。将许多研究对象同时展示给受测者,并要求他们根据某个标准对这些对象排序或分成等级.要求被调查者在固定数值范围内(10-100),对所测事物依次分配一定数值,从而作出不同评价。优点易于构建和执行,被调查者容易理解如何使用量表可以清楚有效地描绘形象。如果同时测量几个对象的形象,还可以将整个形象轮廓进行比较。避免了由调查者设计问题可能产生的主观片面性,调查结果相对准确可靠。应用广泛,特别适用于比较对象的数量较少时.便于被调查者进行比较衡量,资料统计整理较为简便。比较简单,并且能够得到人们对事物的微小区别看法。缺点调查过程费时设计量表比较费时问题设计费时繁琐,实际应用并不广泛当比较对象很多时,调查结果偏差大。不能反映各调查事项重要性程度的差异量级,只能获得定序数据.分配的数字可能比规定的多或少,给事后的资料整理带来困难.表5-2常用量表的比较三、设计量表的基本步骤(图5—2)1.编拟预试问卷在预试问卷的编制或修订上,应根据研究目的、相关文献数据与研究结构等方面加以考虑,如果有类似的研究工具,可根据研究当时的实际情形,加以修订、增删;如果是自己重新编制问卷,问卷内容应依据研究结构的层面,加以编制.在编制量表时,应注意:(1)在大多数情况下,5点量表时最可靠的,选项超过5点,一般人难有足够的辨别力。(2)3点量表限制了温和的意见与强烈意见的表达,五点量表则正好可以表示温和意见与强烈意见之间的区别.(3)由于人口变量的异质性关系,对于没有足够辨别力的人而言,使用七点量表法,会导致信度的丧失;对于具有足够辨别力的人而言,使用5点量表,又令人有受限的不适感。以上问题至目前还没有一个很好解释理由,然而通过预试,可以发现这些问题的存在。(4)量表的点数愈多,选答分布的情形就愈广,变异数也会变得更大,有些人认为这种情形在统计检验上会具有很好的区别力,然而,(1)这种选答很广的分布缺乏可信度,故完全没有意义而言;(2)较大的选答变异数表示也会有较大的抽样误差,就统计数据分析而言,是不该有太大的变异数的.2。预试ﻫ预试问卷编拟完成后,应实施预试,预试对象的性质应与将来正式问卷要抽取得对象性质相同,如研究对象为中学生,则预试的受试者也应为中学生,预试对象人数以问卷中包括最多题项分别为40题、35题、25题,则预试对象,最好在120位至200位中间,如果样本较为特殊,在预试人数的选取上可考虑再酌减一些。预试时选取样本数应考虑问卷量是否进行因素分析.因为因素分析时,以较大样本分析所呈现的因素组型,比一个只用较小样本所出现的因素组型要稳定.进行因素分析时,量表的题项数愈多及预期要有较多的因素层面的话,进行因素分析时,应包括愈多的受试者。有关学者建议,进行因素分析时,量表题项数与预试人数比例约为1:1最为合适。3.整理问卷与编号
问卷回收后,应一份一份检查筛选,对于数据不全或不诚实填答的问卷,应考虑将其删除;对于填答时皆填同一性答案者,是否删除,研究者应考虑问卷题项本身的内容与描述,自行审慎判断。筛选完后的问卷应加以编号,以便将来核对数据之用;之后再给予各变量、各题项一个不同代码,并依问卷内容,有顺序的键入计算机。窗口版SPSS可以读取传统文书文件的数据(配合简短愈发文件程序)、微软Office应用软件中Excel、Access之文件、传统数据文件等,研究者可依自己的习惯,挑选一种自己最熟悉的应用软件,以快速、有效的方式将数据键入计算机中。(研究者最好是选用一种office软件输入数据或直接在SPSS数据窗口编辑区键入数据)4。项目分析ﻫ项目分析即在求出每一个题项的“临界比率”,简称CR值,其求法是将所有受试者在预试量表的得分总和依高低排列,得分前25%至33%者为高分组,得分后25%至33%者为低分组,求出高低二组受试者在每题得分平均数差异的显著性检验(多数数据分析时,均以测验总分最高的27%及最低的27%,作为高低分组界限),如果题项的CR值达显著水准(<.05或<.01),即表示这个题项能鉴别不同受试者的反应程度,此为题项是否删除首先考虑的。5.再测信度ﻫ如果要继续求出量表的再测信度,要以正式量表对同一组受试者前后测验两次,根据受试者前后两侧测验分数得分,求其积差相关系数.再测信度又称稳定系数,反应量表的稳定与一致性程度,一般而言,间隔实践愈长,稳定系数愈低。至于最后定稿的正式量表题项数,应该为多少题最为适宜,实无一定而绝对的标准。就一般情形而论,若该份量表是测量一种“普通的”或多重向度的变量,其题数在20~25题,即已足够;若要测量的是特定的变量,以7~10题为宜;若每个量表包括不同因素层面之子量表时,每个子量表(因素层面)所包括的题项以3~7题较为适宜。6.因素分析项目分析后,为检验量表的结构有效度,应进行因素分析。所谓结构效度是指态度量表能测量理论的概念或特征的程度。因素分析目的即找出量表潜在的结构,减少题项的数目,使之变为一组较少而彼此相关较大的变量,此种因素分析方法,是一种“探索性的因素分析".ﻫ
7.信度分析因素分析完成后,继续要进行分析的是量表各层面与总量表的信度检验。所谓信度就是量表的可靠性或稳定性.8.再测信度如果要继续求出量表的再测信度,要以正式量表对同一组受试者前后测验两次,根据受试者前后两侧测验分数得分,求其积差相关系数。再测信度又称稳定系数,反应量表的稳定与一致性程度,一般而言,间隔时间愈长,稳定系数愈低.9。确定最终量表ﻫ
在这些评价的基础上,确定最终量表.至于最后定稿的正式量表题项数,应该为多少题最为适宜,实无一定而绝对的标准设计量表的基本步骤,见图5-2理论基础或研究目的理论基础或研究目的项目分析编拟或修订量表初稿选取受试者预试因素分析建构量表效度第一次施测正式量表信度分析求出量表与各层面信度因素命名第二次施测删除CR值未达到显著的值删除题项CR值显著题项图5-2量表设计步骤-——-—————-———--—--—-————-——-—-—-—--————【例5-12】名人推荐者道德名誉对名人广告效果的影响自20世纪初力士香皂在其广告中使用女明星以来,名人广告在商业广告中所占的比例及所受到的关注都大幅增长.在中国国内,20世纪80年代末,潘虹、李默然等明星开创名人参与广告拍摄的先河后,众多的广告主都不惜重金请各类名人拍摄广告,以求达到更好的营销效果。但是,由于一些名人的绯闻,导致人们对名人的道德声誉的关注。为了研究推荐者道德声誉对名人广告效果的影响,丁夏齐等(2004)开展了一项研究。在这项研究中,为了设计测量名人道德声誉的量表,首先进行了一项预实验,设定某唱片公司为一张音乐CD做促销广告的情景,并提供了多位真实歌星作为备选的名人推荐者。60名普通消费者和30名广告专业工作者参加问卷调查,部分人还参加了小组访谈。预实验的结果表明,中国人对个人道德修养比较重视,广告效果受消费者对名人推荐者道德声誉评价的影响很大.在预实验的基础上,通过文献回顾和借鉴Ohanian(1991)开发的量表,构建了一个测量名人推荐者吸引力、一致性、专业性、可信赖性和道德声誉的初始量表,该量表含26个条目。150名大学生被试参加了问卷的预测验,共同度(communality)小于0.40的条目被删除,将初始的26个条目简化为22个.接着,在北京对普通中国消费者实施了问卷测量。第一次测量的数据被用于探索性因素分析,第二次的被用于验证性因素分析。每次分析都使用了300个有效被试的数据。问卷构建时包含了对名人推荐者道德声誉进行评价的条目,并得到了五因子的结构.诸如“吸引力”、“一致性”、“专业性”、“可信赖性”等,与前人的结果相当一致.“道德声誉”则是新得到的,该因子包括“名人推荐者有良好声誉"、“名人推荐者尊重社会道德”、“名人推荐者没有丑闻”等条目。探索性因子分析和验证性因子分析的结果均表明,所设计的量表具有较好的信度与效度。最终的量表由22个条目构成,其名称及因子负载见表条目因子载荷(n=300)因子1因子2因子3因子4因子5Q4。名人推荐者有吸引力Q18。名人推荐者长得漂亮Q5。名人推荐者令人愉快Q15。我喜欢名人推荐者Q22。我知道名人推荐者Q6.名人推荐者能给产品带来积极的联想Q11.名人推荐者的身份和产品相适应Q10.名人推荐者可以代表消费者的身份Q16.名人推荐者的形象与产品相一致Q13.我认同这种推荐Q9.产品可以和名人推荐者联系起来Q14。产品适合于我Q1。名人推荐者有产品知识Q2.名人推荐者有产品使用经验Q17.名人推荐者可以熟练使用产品Q12。名人有资格做产品的推荐Q21.名人推荐者是可靠的Q20。名人推荐者是可信赖的Q3.名人推荐者是诚实的Q7。名人推荐者有良好声誉Q8.名人推荐者尊重社会公德Q19.名人推荐者没有丑闻0。7910.7640.6950.6480。5180.4910。7330。6790.6100.5860.5390.5040.7060.6350。5280.5120。7210.6890。6520.7640.6990.642案例来源:丁夏齐等:《名人推荐者道德声誉对名人广告效果的影响:中国消费者的研究》,《“宝洁”奖论文集》,中国信息协会市场研究业分会,2004—-——--—-—-——-—-—-——-———————-———————--——第4节信度与效度评估理想的营销调研能够提供精确、清晰、及时的数据.由于概念的定义,指标的分派和实际测量的误差,测量值和真实值往往有一定的误差,即测量误差.我们以M表示测量值,A表示真实值,E表示误差,则它们之间的关系可由下式表示:W=A+E误差分为系统性误差和随机性误差。系统误差是由于概念操作化过程中的偏差所造成的持续性误差,常导致测量结果普遍偏高和偏低.例如小商贩对秤砣做了手脚,那么每次称的东西都会高估物品实际的重量,这就是系统误差。随机性误差也会影响测量结果,但从本质上讲是暂时的,并不是规律性产生的。为了保证测量的准确性,能够很好地反映所测属性的真实水平,通常要进行信度和效度评估(见图5-3)。测量的评估测量的评估效度信度内部一致性信度复本信度重测信度内容效度标准关联效度结构效度图5-3一、信度信度指的是测量数据的可靠性,主要指实际测量的内容与应当测量的内容之间的一致性和稳定性。信度系数描述测量信度的数量指标,以相关系数来表示。信度可用不同时间重复测量的结果或不同测量方法所给出的结果之间的一致性来衡量。具体的评估方法包括重测法、复本法和折半法.(一)重测信度1。定义重测信度是在类似的条件下,在两个不同的时间先后测量两次,根据两次测量的结果计算两次测量值之间的相似程度,相关系数越高,表示重测信度越高。这是一种最常用、最普遍的信度检查方法。用重复测试的方法确定信度要注意,它对时间间隔非常敏感,即在两次测量之间发生的某些事件、活动,会使后一次测量的结果在客观上发生改变,使两次的相关系数不能准确地反映两次测量的实际情况。一般重复测试法最好与其他方法结合使用.2.形式施测施测再测时间间隔相关系数3、使用的前提条件:(1)测验所测的特质必须是稳定的,即被测的特征和属性在两次测验之间没有发生变化.(2)把握适当的时间间隔(3)两次施测期间被试的效果没有差别(二)复本信度1.定义复本信度采取的是另一种思路:通过构建了两个等价的量表形式,对同一个调查对象进行测量,对所得到的测量结果进行相关分析以评价信度。这种方法克服了上述重测信度的缺点,但它要求两个量表完全等价,这是一件非常困难的事.2.形式测验A测验A测验B最短时间相关系数3、使用的前提条件:(1)施测所用的两个复本必须是真正平行的测验各份测验测量的是同一种心理特性。各份测验具有相同的内容和形式。各份测验的题目不应重复。各份测验题目数量相等,难度和区分度大体相同。各份测验的分数分布(平均数和标准差)大致相等。复本编好后,应再测一次,以确保各份测验的等值。(2)被试要有条件接受两个测验.(三)内部一致性信度1、定义:指的是测验内容的一致性或测验内部所有题目的一致性(项目同质性)程度。又称同质性信度。2、计算方法内部一致性信度最常用计算方法的是分半法.分半法指将测量对象在测量结果中按测量项目的奇偶号分成两组,计算这两组分数之间的相关系数,即折半信度.例如,一个忠诚度测量包括50个项目,如果用折半信度来衡量其内在的一致性,则需要把50个项目分为两部分,再求相关系数。一般用系数进行内部一致性分析.系数值在0~1之间变化,一般等于或小于0.6时,就说明内部一致性信度差。在提高测量的信度方面并无捷径可走,只有坚持科学严谨的工作作风和实事求是的科学态度,尽可能采用科学的测量指标与方法,选择合适的测量工具并进行必要的预测试,以及开展必要的人员培训和良好的现场监督与指导等,才能获得比较可信的测量结果。三、效度效度指的是测量的准确程度或有效程度,理想的效度要求没有测量误差。信度好是效度好的必要条件,但不是充分条件.即有效的测量必须是可信的,但可信的测量不一定有效。当一项测量所测的是它希望测量的事物时,我们就说它是一项有效的测量。反之就称为测量不具有效度。测量的效度具有三种不同的类型,即内容效度、标效关联效度和结构效度,他们分别从不同的方面反映测量的准确程度.同时,人们在评价各种测量的效度时,也往往用这三种类型作为标准。(一)内容效度1。定义内容效度指测量所选择的项目是否符合测量目的和要求.首先需要知道所测量的概念是如何定义的;其次,需要知道这种测量所收集的信息是否和该概念密切相关;然后,评价者才能做出这一测量是否具有内容效度的结论.2.特点(1)所选的项目是一个有限的内容范围(2)选出的项目包含所测的内容范围的主要方面,而且各部分项目所占比例适当.(3)最适合于成就测验,知识和技能的掌握程度。也适合于某些选拔和分类的人事测验3.检验方法(1)专家判断法由专家对测验项目与想要测验的内容范围的吻合程度进行系统的比较判断,具体步骤如下:定义好内容总体,并描绘出有关知识与技能的轮廓。划分细纲目,并根据重要性规划好各个纲目的加权比例,作出尽可能详细的描述.确定没道题所测的知识与技能,将自己的分类与测验编制者的纲目作比较。制定评定量表以评定测验的整个效度及其他特点。例如,为了评估普通话能力考试能够真实地反映考生运用普通话进行口头交流的能力,可以请有丰富教学经验的普通话老师,对考试内容是否很好地包括了有关听说读的内容进行评价;同样,为了评价顾客忠诚度量表能否很好地反映顾客忠诚度这一构念的主要内容,可以聘请专业人员对量表的内容进行评价审查。(2)经验法.根据以往的经验对数据和结果进行评估,如果符合以往的经验,则具有较高的内容效度。反之,则不具有。(3)再测法对同一项目进行重复测量,并计算相关系数,如果相关系数较大,则具有较高的内容效度。反之,则不具有。(4)复本法从同一个总体中抽取两套独立的平行测验,用这两个测验来测同一组被试,计算出他们的相关系数,把这个相关系数作为内容效度的数量估计.相关系数较高,则具有较高的内容效度.反之,则不具有。(二)效标关联效度1.定义效标关联效度又称实证效度、经验效度、准则关联效度。它是指测验对个体的效标行为表现进行估计的有效程度。一般有预测效度与同时效度、效标和效标测量两类。例如,可以通过调查,询问消费者在今后一段时间内购买某种产品的意愿,然后再收集其实际购买数据。将预测的购买与实际的购买相比较,就可以评价所测量的购买意愿对实际购买行为的标准效度.2。.分类(1)预测效度和同时效度。预测效度的效标资料需要过一段时间才可搜集到。此种效度对人员的选拔和安置工作非常重要.常用的效标是专业训练的成绩、实际工作的表现等。同时效度的效标资料是与测验分数同时搜集的。例如大学入学考试可以用中学成绩作效标.同时效度常用的效标是在校的学业成绩、教师的等级评定、临床检查等。(2)效标和效标测量所谓效标指的是衡量测验有效性的外在标准,通常是指我们所要预测的行为。可以用来作为效标的变量有很多。效标可以是连续变量(如分数),也可以是分类变量(如职业);可以是然的现成的指标(如产量、薪水),也可以是人为设计的指标(如课堂测验);可以是主观评判,也可以是客观测量。归纳起来,常见的效标主要有学业成就、等级评定、临床诊断、特殊训练成绩、实际工作表现、对团体的区分、其他测验成绩。观念效标是一个概念,效标测量则是对观念效标的数量化。例如:对于大学入学考试来说,我们感兴趣的是大学学习的成功,这是观念效标,而大学的学习成绩,则是效标测量。如果无效标测量,观念效标是毫无用处的。3.估计方法标准关联效度一般可以通过统计分析得到一个数量指标,因此有人又叫它统计效度。常用的估计方法有相关法、分组法、预期表法等。(1)相关法确定效标效度最常用的方法是计算测验分数与效标测量的相关。根据变量的性质不同,可分别采用积差相关法、等级相关法、二列相关法等。(2)分组法确定效标效度的另一种方法是看测验分数能否区分由效标测量所定义的不同团体。例如在大学里,我们根据
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 产品评价表格-产品数据
- 农产品产地直销物流配送协议
- 工作进度跟踪表格:工作进度管理表
- 水处理技术服务合同
- 车辆租赁及交通服务协议条款说明
- 健康医疗信息系统运维服务合同
- 企业经营指标统计表-收入、利润3个关键指标
- 被动语态在中考英语中的考查点教案
- 经典童话故事对幼儿的成长影响
- 新时代绿色农业标准化生产推广方案
- GA/T 992-2012停车库(场)出入口控制设备技术要求
- 2、组织供应、运输、售后服务方案
- 体育测量与评价-第一章绪论课件
- 航空机载设备履历本
- 企业风险管理-战略与绩效整合(中文版)
- 高效能人士的七个习惯The7HabitsofHighlyEffectivePeople课件
- 小学体育与健康教育科学二年级下册第一章体育基本活动能力立定跳远教案 省一等奖
- 工程分包管理计划
- 民事诉讼法学整套ppt课件完整版教学教程最全电子讲义(最新)
- 河北省自然科学基金资助项目申请书模板
- 四年级奥数-容斥问题
评论
0/150
提交评论