测量与量表非比较量表技术第9章_第1页
测量与量表非比较量表技术第9章_第2页
测量与量表非比较量表技术第9章_第3页
测量与量表非比较量表技术第9章_第4页
测量与量表非比较量表技术第9章_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

测量与量表非比较量表技术第9章ChapterObjectives

学习目标描述非比较量表技术,区分连续链表技术和分项评分量表,并解释Likert量表、语义差别量表和斯坦普尔量表讨论在构造分项评分量表时所涉及的有关量表类别数目、平衡量表与非平衡量表、奇偶数类别、强制与非强制性选择、语言描述程度及量表的物理形式等决策问题讨论评价量表时所用的标准,并解释如何评估信度、效度和可推论性讨论在国际背景下执行非比较量表时所要考虑的问题理解在构造非比较量表时所涉及的伦理道德问题讨论因特网和计算执行连续评分量表和分项评分量表时的应用2011/2/172ChapterOutline

学习内容概要非比较量表技术

连续评分量表

分项评分量表Likert量表语义差异量表斯坦普尔量表2011/2/173ChapterOutline

学习内容非比较分项评分决策

量表类别的数目平衡量表与非平衡量表类别的奇偶数强制性评分量表与非强制性评分量语言描述的性质和程度物理形式或结构

多项量表2011/2/174ChapterOutline

学习内容量表的评价

测量的准确性信度效度信度和效度的关系推论性量表技术选择

数学推导的量表8.9SPSS窗口小结2011/2/175Reliable?Valid?Generalizable?NoncomparativeScalingTechniques

非比较量表技术使用非比较量表的调查对象采用任何他们认为合适的评分标准,不对被评价的物体与另一物体或一些指定的标准进行比较。调查对象一次只评估一个对象,因此非比较量表经常被单胞量表。非比较量表由连续评分量表和分项评分量表组成2011/2/176ContinuousRatingScale

连续评分量表Respondentsratetheobjectsbyplacingamarkattheappropriatepositiononalinethatrunsfromoneextremeofthecriterionvariabletotheother.连续评分量表也称为图示评分量表。调查对象通过在一条直线上的适当位置做出标记为物体评分。Theformofthecontinuousscalemayvaryconsiderably.连续量表的形式可能变化相当大。

HowwouldyourateSearsasadepartmentstore?就百货商店而言,你将如何斯尔斯评分?Version1形式1Probablytheworst-------I----------------------Probablythebest

可能最差-------I----------------------可能最好Version2形式2Probablytheworst-------I------------------------------Probablythebest0102030405060708090100

Version3形式3 VerybadNeithergoodnorbadVerygood

Probablytheworst-------I------------------------------Probablythebest01020304050607080901002011/2/177PerceptionAnalyzer感知分析仪Arelativelynewresearchtool,theperceptionanalyzer,providescontinuousmeasurementof“gutreaction.”Agroupofupto400respondentsispresentedwithTVorradiospotsoradvertisingcopy.Themeasuringdeviceconsistsofadialthatcontainsa100-pointrange.Eachparticipantisgivenadialandinstructedtocontinuouslyrecordhisorherreactiontothematerialbeingtested.Astherespondentsturnthedials,theinformationisfedtoacomputer,whichtabulatessecond-by-secondresponseprofiles.Astheresultsarerecordedbythecomputer,theyaresuperimposedonavideoscreen,enablingtheresearchertoviewtherespondents'scoresimmediately.Theresponsesarealsostoredinapermanentdatafileforuseinfurtheranalysis.Theresponsescorescanbebrokendownbycategories,suchasage,income,sex,orproductusage.2011/2/178ItemizedRatingScales

分项评分量表Therespondentsareprovidedwithascalethathasanumberorbriefdescriptionassociatedwitheachcategory.Thecategoriesareorderedintermsofscaleposition,andtherespondentsarerequiredtoselectthespecifiedcategorythatbestdescribestheobjectbeingrated.ThecommonlyuseditemizedratingscalesaretheLikert,semanticdifferential,andStapelscales.提供给调查对象的分项评分量表上面每个类别都有一个数字或与每一个类别相关的简要描述。类别按照量表的位置来排序,调查对象需要选出最能描述被评物体的特定类别。通常使用的分项评分量表为Likert量表、语义差异量表和斯坦普尔量表。2011/2/179LikertScale利克特量表TheLikertscalerequirestherespondentstoindicateadegreeofagreementordisagreementwitheachofaseriesofstatementsaboutthestimulusobjects.Theanalysiscanbeconductedonanitem-by-itembasis(profileanalysis),oratotal(summated)scorecanbecalculated.Whenarrivingatatotalscore,thecategoriesassignedtothenegativestatementsbytherespondentsshouldbescoredbyreversingthescale.利克特量表需要调查对象对关于刺激物体的一系列陈述中的每一个,指出同意或不同意的程度。分析可以逐项进行(轮廓分析),也可以对项目加总和计算每位调查对象的总评分(求和)。需要对那些消极陈述的原始得分进行倒置转换2011/2/1710百货商店项目:Likert量表StronglyDisagree强烈反对Disagree反对NeitherAgreenordisagree及不同意也不反对agree同意Stronglyagree强烈赞成Searssellshigh-qualitymerchandise.西尔斯销售高质量的商品

12X345Searshaspoorin-storeservice.西尔斯店内服务很差12X345IliketoshopatSears.我喜欢在西尔斯购物123X45Likert量表有几个优点:它易于执行。调查对象很容易理解如何使用量表,因而它适合邮件访谈、电话访谈或人员访谈。主要缺点:比其他分项评分量表花费时间长。2011/2/1711SemanticDifferentialScale

语义差异量表Thesemanticdifferentialisaseven-pointratingscalewithendpointsassociatedwithbipolarlabelsthathavesemanticmeaning.SEARSIS:Powerful--:--:--:--:-X-:--:--:WeakUnreliable--:--:--:--:--:-X-:--:ReliableModern--:--:--:--:--:--:-X-:Old-fashionedThenegativeadjectiveorphrasesometimesappearsattheleftsideofthescaleandsometimesattheright.Thiscontrolsthetendencyofsomerespondents,particularlythosewithverypositiveorverynegativeattitudes,tomarktheright-orleft-handsideswithoutreadingthelabels.Individualitemsonasemanticdifferentialscalemaybescoredoneithera-3to+3ora1to7scale.语义差异量表是一个7级评分量表,两端由极端的词组组成。西尔斯是:强有力的--:--:--:--:-X-:--:--:虚弱的不可信的--:--:--:--:--:-X-:--:可信的时髦的--:--:--:--:--:--:-X-:老式的负面的形容词或短语有时出现在量表的左端,有时出现在右端。这样控制了有些调查对象,尤其是那些有着极端正面或极端负面态度的调查对象,不读标示就在左端或右端标记的倾向。语义差异量表上的项目可以在一个-3到+3或1到7的尺度上评分。2011/2/1712当度量某个商店、公司或品牌的形象时,语义差别量表形式是非常有用的在下列每组词中,画出最能反映你对****的印象的线条价格高______________价格低不方便的位置______________方便的位置适合我______________不适合我舒适的环境______________不舒适的环境菜单不够丰富______________菜单足够丰富服务很快______________服务很慢饭菜质量不好______________饭菜质量不较高一个有特色的地方______________一个普通的地方132011/2/17调查结果14在下列每组词中,画出最能反映你对****的印象的线条价格高______________价格低不方便的位置______________方便的位置适合我______________不适合我舒适的环境______________不舒适的环境菜单不够丰富______________菜单足够丰富服务很快______________服务很慢饭菜质量不好______________饭菜质量不较高一个有特色的地方______________一个普通的地方2011/2/17ASemanticDifferentialScaleforMeasuringSelf-Concepts,PersonConcepts,andProductConcepts

测量自我概念、个人概念和产品概念的一个语义差异量表Rugged :---:---:---:---:---:---:---:Delicate

Excitable :---:---:---:---:---:---:---:Calm Uncomfortable

:---:---:---:---:---:---:---:Comfortable Dominating :---:---:---:---:---:---:---:Submissive

Thrifty :---:---:---:---:---:---:---:Indulgent

Pleasant :---:---:---:---:---:---:---:Unpleasant

Contemporary

:---:---:---:---:---:---:---:Obsolete

Organized :---:---:---:---:---:---:---:Unorganized Rational :---:---:---:---:---:---:---:Emotional

Youthful :---:---:---:---:---:---:---:Mature

Formal :---:---:---:---:---:---:---:Informal

Orthodox :---:---:---:---:---:---:---:Liberal

Complex :---:---:---:---:---:---:---:Simple Colorless :---:---:---:---:---:---:---:ColorfulModest :---:---:---:---:---:---:---:Vain2011/2/1715ASemanticDifferentialScaleforMeasuringSelf-Concepts,PersonConcepts,andProductConcepts

测量自我概念、个人概念和产品概念的一个语义差异量表1.粗糙的

:---:---:---:---:---:---:---:精致的

2.兴奋的

:---:---:---:---:---:---:---:冷静的

3.不舒适的:---:---:---:---:---:---:---:舒适的

4.专横的

:---:---:---:---:---:---:---:顺从的

5.节俭的

:---:---:---:---:---:---:---:挥霍的

6.愉快的

:---:---:---:---:---:---:---:不愉快的

7.现代的:---:---:---:---:---:---:---:非现代的

8.组织的

:---:---:---:---:---:---:---:无组织的

9.理性的

:---:---:---:---:---:---:---:感性的

10.年轻的:---:---:---:---:---:---:---:成熟的

11.正式的:---:---:---:---:---:---:---:非正式的

12.正统的

:---:---:---:---:---:---:---:自由主义的

13.复杂的:---:---:---:---:---:---:---:简单的

14.无趣味的:---:---:---:---:---:---:---:多姿多彩的15.谦虚的:---:---:---:---:---:---:---:自负的2011/2/1716StapelScale

斯坦普尔量表TheStapelscaleisaunipolarratingscalewithtencategoriesnumberedfrom-5to+5,withoutaneutralpoint(zero).Thisscaleisusuallypresentedvertically.斯坦普尔量表是一个单极的评分量表,有10个从+5到-5编号的类别,没有中立点(零点)

SEARS

+5 +5 +4 +4 +3 +3 +2 +2X +1 +1HIGHQUALITY高品质 POORSERVICE糟糕的服务 -1 -1 -2 -2 -3 -3 -4X -4 -5 -5ThedataobtainedbyusingaStapelscalecanbeanalyzedinthesamewayassemanticdifferentialdata.用斯坦普尔量表获得的数据,可以用语义差异量表相同的方式进行分析。2011/2/1717BasicNoncomparativeScales

基本的非比较量表Table9.1量表基本特征例子优点缺点连续评分量表在连续的线上做出标记商业电视的反应容易构建评分麻烦除非计算机化分项评分量表Likert

量表从1(强烈反对)到5(强烈赞同)赞同的程度态度测量容易构建、执行和理解费时语义差异量表7级评分,两端由极端的词组组成品牌、产品及公司形象多变的取得的数据是否应该看作定距尺度存争议斯坦普尔量表单极,从+5到-5,没有中立点态度和形象的测量容易构建,经电话执行令人迷惑,难以应用2011/2/1718SummaryofItemizedScaleDecisions

分项评分量表决策的小结Table9.2NumberofcategoriesAlthoughthereisnosingle,optimalnumber,traditionalguidelinessuggestthatthereshouldbebetweenfiveandninecategories.Balancedvs.unbalancedIngeneral,thescaleshouldbebalancedtoobtainobjectivedataOdd/evenno.ofcategoriesIfaneutralorindifferentscaleresponseis

possibleforatleastsomerespondents,anoddnumberofcategoriesshouldbeused.Forcedvs.non-forcedInsituationswheretherespondentsare

expectedtohavenoopinion,theaccuracyof

thedatamaybeimprovedbyanon-forcedscale.VerbaldescriptionAnargumentcanbemadeforlabelingallor

manyscalecategories.ThecategorydescriptionsshouldbelocatedasclosetotheresponsecategoriesaspossiblePhysicalformAnumberofoptionsshouldbetriedandthebestselected.2011/2/1719SummaryofItemizedScaleDecisions

分项评分量表决策的小结Table9.2所用量表类别的数目一般建议类别的适宜数目是5至9之间平衡表对非平衡表一般来说,为了获得可观的数据,量表应该是平衡的类别的奇数数目或偶数数目如果至少有一些调查对象可能有一种中立或无所谓的答案,则应该使用奇数的类别数目强制性选择与非强制性选择在预料到调查对象可能没有意见的情况下,数据的精确性可以通过一个非强制式量表得到改善。语言描述的性质和程度为所有或许多量表类别做标注会减少量表的不明确性。类别的描述应该放在离答案类别尽可能近的位置量表的外观形式应该尝试大量的选择,选出最好的一种2011/2/1720BalancedandUnbalancedScales

平衡和非平衡量表Fig.9.1BalancedScale平衡量表JovanMuskforMenis:Jovan男士香水是:Extremelygood-----------------极好Verygood-----------------很好Good-----------------好Bad-----------------差Verybad-----------------很差Extremelybad-----------------极差UnbalancedScale非平衡量表JovanMuskforMenis:Jovan男士香水是:Extremelygood-----------------极好Verygood-----------------很好Good-----------------好Somewhatgood-----------------略好Bad-----------------差Verybad-----------------很差

2011/2/1721RatingScaleConfigurations评分表结构-3-10+1+2-2+3Cheer

Cheerdetergentis: 1)Veryharsh--- --- --- --- --- ------Verygentle 2)Veryharsh1 2 3 4 5 67Verygentle 3).Veryharsh . . .Neitherharshnorgentle . . .Verygentle 4)____________________________ VeryHarshSomewhatNeitherharshSomewhatGentleVery harsh harshnorgentlegentlegentle 5)

Very Neitherharsh Very harsh norgentlegentle

Fig.9.22011/2/1722ThermometerScale温度计量表

Instructions:PleaseindicatehowmuchyoulikeMcDonald’shamburgersbycoloringinthethermometer.Startatthebottomandcoloruptothetemperaturelevelthatbestindicateshowstrongyourpreferenceis.

SmilingFaceScale笑脸量表

Instructions:PleasepointtothefacethatshowshowmuchyouliketheBarbieDoll.IfyoudonotliketheBarbieDollatall,youwouldpointtoFace1.Ifyoulikeditverymuch,youwouldpointtoFace5.

1 2 3 4 5LikeverymuchDislikeverymuch1007550250SomeUniqueRatingScaleConfigurations

一些独特的评分图表结构Fig.9.32011/2/1723SomeCommonlyUsedScalesinMarketing市场营销中一些常用的量表Table9.3Construct结构ScaleDescriptors尺度描述Attitude态度Importance重要性Satisfaction满意度PurchaseIntent购买意向PurchaseFreq购买频率VeryBad很差NotatAllImportant一点也不重要VeryDissatisfied很不满意DefinitelywillNotBuy绝对不买Never从不Bad差NotImportant不重要Dissatisfied不满意ProbablyWillNotBuy可能不会买Rarely很少NeitherBadNorGood不好也不差Neutral中立NeitherDissat.NorSatisfied既不不满意也不满意MightorMightNotBuy可能会也可能不会买Sometimes有时Good好Important重要Satisfied满意ProbablyWillBuy可能会买Often经常VeryGood很好VeryImportant很重要VerySatisfied很满意DefinitelyWillBuy绝对会买VeryOften很经常DevelopmentofaMulti-itemScale

多项量表的开发2011/2/1725DevelopmentofaMulti-itemScale

多项量表的开发2011/2/1726ScaleEvaluation

量表的评价ScaleEvaluation量表评价Reliability信度Test/Retest重复测试信度AlternativeForms复本信度InternalConsistency内部一致性信度Validity效度Content

内容效度Criterion准则效度Construct结构效度Convergent

收敛效度Discriminant判别效度Nomological法则效度Generalizability推论性Fig.9.52011/2/1727MeasurementAccuracy

测量的准确性测量值是反映一个物体某种特征的数字。测量值并不是我们感兴趣的特征的真实值,而是对他的一次观察。测量误差(measurementerror)许多因素可以引起测量误差,测量值或观察值与真实值偏离。系统误差(systematicerror)以一种不变的方式影响测量值,代表了每次进行测量时已同意方式影响观察得分的稳定因素。随机误差(randomerror)每次测量时以不同的方式影响观察得分的暂时因素,比如瞬时的人员和场所因素。2011/2/1728MeasurementAccuracy

测量的准确性Thetruescoremodelprovidesaframeworkforunderstandingtheaccuracyofmeasurement.XO=XT+XS+XRwhereXO=theobservedscoreormeasurementXT=thetruescoreofthecharacteristicXS=systematicerrorXR=randomerror真实得分模型为理解的测量准确性提供了一个框架。XO=XT+XS+XRXO=观察到的分数或测量值XT=特征的真实值XS=系统误差XR=随机误差2011/2/1729PotentialSourcesofErroronMeasurement

测量的误差可能来源Fig.9.6Otherrelativelystablecharacteristicsoftheindividualthatinfluencethetestscore,suchasintelligence,socialdesirability,andeducation.Short-termortransientpersonalfactors,suchashealth,emotions,

andfatigue.Situationalfactors,suchasthepresenceofotherpeople,noise,anddistractions.Slingofitemsincludedinthescale:addition,deletion,orchangesinthescaleitems.Lackofclarityofthescale,includingtheinstructionsortheitemsthemselves.Mechanicalfactors,suchaspoorprinting,overcrowdingitemsinthequestionnaire,andpoordesign.Administrationofthescale,suchasdifferencesamonginterviewers.Analysisfactors,suchasdifferencesinscoringandstatisticalanalysis.影响测试分值的其他相对稳定的个人特性,比如智力、社会愿望和教育等。短期或临时人员因素,如健康、情感和疲劳。情境因素如其他人的存在、噪声和分心的事物。量表中所列项目的取样:量表项目的添加、删除或更改。量表的说明或项目本身不够清楚。机械因素,如质量差印刷、问卷中的项目国与拥挤以及拙劣的设计。量表的执行,如访问员之间的差异。分析因素,如计分和统计分析中的差异。2011/2/1730Reliability

信度Reliabilitycanbedefinedastheextenttowhichmeasuresarefreefromrandomerror,XR.IfXR=0,themeasureisperfectlyreliable.Intest-retestreliabilityrespondentsareadministeredidenticalsetsofscaleitemsattwodifferenttimesandthedegreeofsimilaritybetweenthetwomeasurementsisdetermined.Inalternative-formsreliabilitytwoequivalentformsofthescaleareconstructedandthesamerespondentsaremeasuredattwodifferenttimes,withadifferentformbeingusedeachtime.信度可以定义为测量中免除随机误差XR的程度。如果XR=0,那么测量是完全可行的。重复测试信度调查对象在尽可能相同的条件下,在两次不同的时间(间隔2-4周),执行完全相同量表项目,通过计算两个测量之间的相关系数确定两次测量之间的相似程度,相关系数越高,信度越高。复本信度构建两个等价的量表形式,在两个不同的时间测量相同的调查对象。2011/2/1731Reliability

信度Internalconsistencyreliabilitydeterminestheextenttowhichdifferentpartsofasummatedscaleareconsistentinwhattheyindicateaboutthecharacteristicbeingmeasured.Insplit-halfreliabilitytheitemsonthescalearedividedintotwohalvesandtheresultinghalfscoresarecorrelated.Thecoefficientalpha,orCronbach'salphaistheaverageofallpossiblesplit-halfcoefficientsresultingfromdifferentwaysofsplittingthescaleitems.Thiscoefficientvariesfrom0to1,andavalueof0.6orlessgenerallyindicatesunsatisfactoryinternalconsistencyreliability.内部一致性信度用来评价一个求和量表的信度,量表中的几个项目被累加起来构建一个总分值。每个项目测量的是整个量表测量的构念的某个方面。分半信度量表中的项目被分为两半,对两半的分值进行相关分析。两部分之间的高度相关表面高的内部一致性。α系数或Cronbachα是来自分割量表项目的不同方法的所有可能的分半系数的平均数。这个系数在0~1之间。一个等于或小于0.6的值通常代表令人不满意的内部一致性。该系数有随量表项目数的增加而增加。2011/2/1732Validity

效度Thevalidityofascalemaybedefinedastheextenttowhichdifferencesinobservedscalescoresreflecttruedifferencesamongobjectsonthecharacteristicbeingmeasured,ratherthansystematicorrandomerror.Perfectvalidityrequiresthattherebenomeasurementerror(XO=XT,XR=0,XS=0).Contentvalidity

isasubjectivebutsystematicevaluationofhowwellthecontentofascalerepresentsthemeasurementtaskathand.Criterionvalidityreflectswhetherascaleperformsasexpectedinrelationtoothervariablesselected(criterionvariables)asmeaningfulcriteria.量表的效度定义为观察值之间的差异所反映的物体之间被测特性的真是差异的程度,而不是系统误差或随机误差。完美的效度要

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论