量表研制与量表资料的统计分析方法_第1页
量表研制与量表资料的统计分析方法_第2页
量表研制与量表资料的统计分析方法_第3页
量表研制与量表资料的统计分析方法_第4页
量表研制与量表资料的统计分析方法_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,第二十四章量表研制与量表资料的统计分析方法Development and Statistical Analysis of Scale,2,Content,IntroductionDevelopment methods of scale Evaluation methods of scale Statistical analysis of scale,3,第一节 概述一、量表的基本概念 量表(scale)是由若干问题或自我评分指标组成的标准化测定表格,用于测量研究对象的某种状态、行为或态度。量表又常称为测量工具(instrument)。 在医学研究中,许多疾病状态是可以准确测量的,如原发性高血压患者的血压,白血病患者的白细胞数,乙型病毒性肝炎患者的病毒抗原。但也有许多疾病状态是无法精确测量的,如疼痛、失眠、心理压抑、认知障碍、生存质量、生活自理能力等,在医学实践中只能对通过测量这些状态的某些表征或通过研究对象的自我主观感受来间接地测评,这时候量表就成为最常用的和可行的工具。,4,例24-1 如何评价治疗疼痛的效果,即如何测量疼痛的程度 ?,将病人自我测评疼痛的程度、病人疼痛时的面部表情、皮肤湿润程度、肌肉紧张程度、脉搏等多项测量指标组成一个测量表,通过统计分析和测评确定各指标的权重,对各指标作标准化后,就构成一个疼痛测评量表。,5,量表指标(或问题): 指标或问题中的各项涉及总目标的某些方面,因此又可以将其分成若干领域(又称维度domain),显然量表的测评结果具有多维性。量表的指标和问题可以是定性的,也可以是定量的,但最终都会得到一个总的定量的评分。该总评分将定量地描述研究对象的测评特征,并且方便进行对象间的比较。因此量表测评具有定量化特性。,各项指标或问题都必须标准化和规范化,包括测量手段、过程、记录结果的形式,问题的询问方式、语气、答案选择等,都采取统一、固定的格式。 各指标(项目)的权重和总分的计算都要作出明确规定。 一般量表研制过程,还做出了正常参照人群的量表常模,即标准值,供使用时参考。因此量表具有标准化的特性。,6,获得指标值的方式: 1) 通过测量研究对象的某些特征而获得的定量数据 2) 通过询问获得研究对象对某些感觉、特征、态度和行为的定性或定量的答案。,7,量表的结构设计形式: 多数与调查表相似,都是问卷(questionnaire)的形式,但量表与调查表仍有区别。,调查表-可以包含完全不同的独立的内容,用于评价不同的指标。如调查表可以询问调查对象的吸烟史、生育史、体育锻炼情况和饮食嗜好,这些内容可能是完全独立互不相关的,用于评价研究人群的不同特征。,量表-是用于描述研究对象的一个特征,虽然量表用多个条目(问题)从各个方面来描述该特征,但各条目一般都是相关联的。例如评价医院医疗服务满意度的量表,可以包含对医院诊疗程序安排、医生诊疗的水平和态度、护士服务和态度、诊疗收费等各方面的问题,但这些问题都是围绕着一个核心,就是医院医疗服务提供的质量,因此各指标都是关联的。,量表和调查表的设计和质量考核时考虑的问题和评价指标有所不同。,8,二、量表的适用范围 适合评价无法直接作客观定量测量的指标。例如许多生理、心理和社会特征属于这种类型。量表的适用范围可以具体地分成以下几种情形:1.无法直接测量的指标,如临床医学研究中常见的病痛评价指标,包括疼痛、失眠、疲乏、活动能力障碍、残疾等,特别是近几十年来发展的评价健康水平的生存质量(quality of life)。 2.抽象的概念和态度,如社会医学中常常涉及的指标,包括幸福感、满意度、社会交流能力等。3.复杂的行为或神经心理状态,如心理学研究中的儿童多动症、认知障碍、阅读障碍、运动协调性低下、情绪抑郁、焦虑症等。,9,三、量表评价的优缺点优点:量表测评具有客观性强,可比性好,程序标准化,易于操作的优点。缺点:受研究对象个体差异影响大,量表制定要求高,如果量表设计有缺陷,可能导致结果偏倚。,10,一、量表的结构特点量表由若干领域组成-称子量表或亚量表。领域是指测评特征涵盖的内容或层次每个领域又可由若干个方面(facet)组成-每个方面实际上是与测评特征有关的项目每个方面可包含若干条目(item)-条目实际上就是问题,对测评特征的某方面(项目)从不同的侧面提出问题或进行测量,了解被测者的状况,例如 医院医疗服务满意度量表就应该包含最基本的服务态度、医疗水平和收费等领域。服务态度的领域中包括挂号过程、就医过程、检查和治疗过程、取药过程等方面。其中就医过程方面中的条目可以包含就医指引的服务、医生接诊的态度、诊室的环境等条目。,第二节 量表的研制方法,11,二、量表的编制原则 理想的量表:准确地测定目标特征,获取可靠的资料。(1)适合性原则:设计量表时要考虑研究的需要,同时也要考虑被调查者的实际情况。所以,量表设计的一个首要原则就是要从被调查者的角度出发,为他们着想,设计适合他们的问题,尽可能地减少他们在填答问题时的困难与麻烦,减少他们填答问题所需要的时间和精力。(2)有效性原则:量表的问题必须围绕研究课题和研究假设进行设计,凡是对于研究课题及其理论假设来说是多余的问题,都必须删去,可有可无的问题,一律不列入问卷,不知道以后如何分析的问题,也不要提出。设计者对问卷的设计要有一个总体框架,对设计的每一个问题所起的作用十分清楚,对一个理论假设需要哪些指标来测量,也应十分明确。(3)可行性原则:量表调查需要被调查者的密切合作,因此,在设计量表时,量表中的问题必须符合被调查者回答问题的能力和意愿。问卷的问题要简洁,语言要通俗易懂,使被调查者能够顺利地完成。同时要考虑完成调查的时间要合适,量表内容太多,调查时间太长,都可能影响调查质量。,12,三、量表的编制步骤1.明确目标(假设与概念)的范畴和内容 首先设立研究工作组,研究工作组应该包括研究领域有关的专家,例如医院医疗服务满意度的量表研究,涉及的专家有医院行政领导、医院管理学专家、卫生行政部门人员、医生、护士等。还应该包括服务的对象,例如病人及正常人等各层次人员组成。研究工作组包括议题小组(nominal group)和选题小组(focus group又称核心小组)。在这步工作中,任务是复习文献著作,通过讨论明确量表要评价的目标,包括目标的概念定义、范畴、内容等。2.探索量表的维度(内涵)和方面 这步工作是定义测量概念及分解,由核心小组给出所测定概念的可操作化定义及构成,如满意度指什么,包含哪些领域和方面,每项领域和方面的含义与内涵等。该过程需要核心小组充分讨论,并请专家组评议完成。,13,3. 建立条目池和筛选条目 核心小组向议题小组成员解释所测概念、领域和方面的定义和内容,然后由议题小组成员分别独立地根据其个人的理解和经验写出与以上概念有关的条目建议。然后将提出的量表条目整理汇总,形成条目池(item pool)。4. 设计可操作性条目 这步是确定条目的形成及答案选项,较多的量表答案采用线性或等级形式。前者给出标准化单位的线段和两端选项,由被测者决定答案在线段上的位置;后者则需要选择适当的程度副词表达答案的等距选项。程度副词的选择一般采用反应尺度(response scale)分析确定,例如中文反映频度的副词有:总是、经常、有时、较少、偶尔、罕见、从不等。请一批有代表性的受试者,让每一受试者独立地按其对这些词程度的理解标记在标准化线段上,然后分析这些词的平均位置,选出合适位置的程度副词。例如表24-1列出关于重要性的各种量词的平均分(满分是10分)。,14,表24-1 关于重要性量词的反应尺度分析,15,5.量表的定性评价 当完成条目池后,必须对条目进行测评和筛选,方法有两类:定性评价和定量评价。定性评价常用专家咨询法和Delphi法。专家咨询一般采用座谈会形式,邀请有关专家对每项条目的重要性、关联性、可行性等进行讨论,寻求一个共同的意见。这里要注意,如果参加座谈会的专家较多,应该将专家按专业、年龄等分组,以组为单位召开座谈会,以提高效率。Delphi法一般采用向专家发信,由专家单独对各条目的重要性进行评价。信中可要求专家对每项条目的重要性、必要性和可行性进行定量评分,并可以对个别条目提出具体的修改意见。根据Delphi法调查的结果,可对各条目进行排序,淘汰排列在后面的条目,修改条目的措词,并帮助拟定各条目的权重。,16,6.量表的预调查和定量评价 当形成初步量表后,可以进行小样本测量对象的预调查,对量表的可理解性,使用语言的流畅性,以及量表的信度、效度和反应度进行定量评价(具体的统计分析方法见后面的第三节)。根据预调查和量表定量考评的结果,进一步对量表进行修订完善,形成最终量表。7.建立常模 某些量表在完成量表的研制后,还必须进行一个较大样本量的正常测试对象的抽样调查,根据抽样调查的结果建立量表各条目的权重值,各领域的权重值和总评分的计算公式。以及正常人群的标准值范围,好、中、差等不同等级人群的评分值范围等,供应用时参考。这就是所谓的常模。,17,四、条目定量分析和筛选的统计方法 量表条目的定量分析和筛选类似于综合评价指标的筛选,所使用的统计方法也基本相同。一个好的条目应具有意义重要、敏感性高、独立性强、代表性好、确定性好的特点,并具有一定的可操作性和可接受性。,18,具体可以从以下方面分析和筛选。(1)主观评价法:也称专家法,属于条目的定性评价,主要测评条目的重要性。(2)离散趋势法:主要测评条目的敏感性。显然条目的变异程度越小,说明其区别能力差,对被测对象的差异不敏感。一般可用标准差或变异系数表示,如果测定值不呈正态分布,需先作适宜的变量变换,然后再计算标准差。(3)相关系数法:这主要测评条目的代表性和独立性。任意两条目的相关系数反映这两条目的独立性和代表性。,19,(4)主成分分析和因子分析法:这是从代表性角度筛选指标,根据各主成分与各指标的相关性大小分别考虑各个主成分主要由哪些指标决定,选择系数较大的指标。(5)聚类分析法:也是从代表性角度筛选指标。先采用聚类分析方法(一般采用系统聚类法)对各指标进行R型聚类分析,把相关密切的指标聚成一类,然后从每一类中选择有代表性的指标。(6)基于重要性评价的逐步筛选法:是主观评价法的推广,类似于德尔斐(Delphi)预测法。(7)逐步回归法:在预调查中除要求被测者回答各条目外,还要求对其目标值进行总的评分。将总评分作为应变量Y,各条目作为自变量X=X1,X2,Xm。进行多重逐步回归分析,筛选对应变量Y影响较大的指标。,20,(8)逐步判别法:选择不同状态的人群,如评价测试对象的生存质量时,可选择健康人、一般慢性病病人和严重疾病患者或残疾人,用待评量表测定其生存质量。用逐步判别分析筛选对不同健康状态人群鉴别能力有较大贡献的条目,这些条目将使量表具有较好的区分度。 总之,条目的筛选可以用多种多样方法,各种方法的筛选结果可能不尽相同。在实际应用中可结合各种方法,筛选结果较一致的条目。,21,德尔斐法,该方法采用寄发调查表的形式,以不记名方式征询专家对某类问题的看法,在随后进行的意见征询中,将经过整理的上轮调查结果反馈给各位专家,让其重新考虑后再提出看法,并特别要求那些持极端意见的专家详细说明其理由。 德尔斐法的应用程序主要包括以下步骤: A 挑选专家人数以20个左右为宜。 B 提出预测问题 C 收集、整理专家意见 D 修改预测 E 最后预测 为了提高预测效果,一方面要慎重挑选专家;另一方面要将征询的问题限制在下述几方面: A 对预测期间提出各种课题的重要性进行评价。 B 对课题范围内各种事件发生的可能性和发生时间进行评价。 C 对各种技术决策、技术装备以及课题任务等之间的相互关系和相对重要性进行评价。 D 对为了实现某一目标而需要采取的重大措施以及这些措施实施与完成的可能性、必要性进行评价。 另外,在提出问题时,应考虑到如何获得同类或可以相互比较的回答,以便在专家调查的最后阶段对评审资料进行数字处理与汇总。,22,例24-2 在206例高血压病例与正常人的生存质量预调查中,对生理领域的3个方面(即疼痛、精力和睡眠)12个条目的质量进行分析,结果见表24-2。,23,表24-2量表条目的筛选分析结果,* 相关系数假设检验P0.05, * P0.05,不拒绝前后相等的假设。 克朗巴赫系数:,34,三、量表的效度分析 效度(validity)主要评价量表的准确度、有效性和正确性,即测定值与目标真实值的偏差大小。效度意在反映某测量工具是否有效地测定到了它所打算测定的内容,即实际测定结果与预想结果的符合程度。由于无法确定目标真实值,因此效度的评价较为复杂,常常需要与外部标准作比较才能判断。,35,常用的效度指标:内容效度(content validity):指量表的各条目是否测定其希望测量的内容,即测定对象对问题的理解和回答是否与条目设计者希望询问的内容一致。内容效度一般通过专家评议打分。 标准关联效度(criterion-related validity) :又称标准效度,是以一个公认有效的量表作为标准,检验新量表与标准量表测定结果的相关性,以两种量表测定得分的相关系数表示标准效度。 结构效度(contract validity) :又称构想效度,说明量表的结构是否与制表的理论设想相符,测量结果的各内在成分是否与设计者打算测量的领域一致,结构效度主要用证实性因子分析(confirmatory factor analysis, CFA)评价。 内容效度与结构效度也有相关性,因此评价结构效度的量化指标也间接反映了内容效度。,36,例24-4中,被测者自评总分与量表总分的相关系数为r=0.487,标准关联效度不佳。进一步分析发现被测者自评分主要与自身感受、工作能力、社会支持医疗保障和精神支柱有关。由于对象是健康人,因此其对生存质量的理解与病人有不同,造成量表的许多内容没反映在其自评分中。,37,证实性因子分析是确定存在几个因子,以及各实测变量与各因子的关系,用实际数据拟合特定的因子模型,分析拟合优度,评价实测指标性质与设计目标是否吻合。证实性因子分析将量表的每个条目作为一项指标,分析所有指标的内在公因子。如果因子分析提取的公因子与量表设计时确定的各领域有密切的逻辑关系,则说明量表有较好的结构效度。,38,四、量表的反应度分析 临床医学用的量表常用于评价不同治疗措施的治疗效果比较,因此量表必须反映出对象细微的疗效差别,即具有一定的反应度(responsibility)。反应度指量表能测出不同对象、不同时间目标特征变化的能力,即反映对象特征值变化的敏感度。量表得分( )评价常用的统计量是效应尺度(effect size) 效应尺度 (24-3),39,例24-5 某医院心理科医生研制神经症量表评价心理障碍病人神经症状改善情况,对72例心理科住院病人(焦虑症30 例,强迫症20 例,癔症12 例,恐怖症10 例)分别在治疗前后用该量表进行评价, 结果治疗前病人的平均得分25.74,标准差5.69,治疗后平均得分31.18,效应尺度为(31.18-25.74)/5.69=0.956。经配对t检验,t=7.14,P0.01,差异有统计学意义,说明量表能区分治疗前后症状的改善。,40,第四节 量表资料的统计分析方法一、量表评价资料的特点 量表评价研究的试验设计可以是描述性的,也可以是比较性的。无论如何,首先是将研究对象按不同处理因素分成若干组,比较其测评量表值的差别; 其次,量表评价极少是一次性测评,一般需要做多次的重复测评,比较疾病治疗的不同时期量表测评特征的变化,因此为重复测量资料; 最后,量表评价一定是多维度的,最复杂的是每项条目就是一个变量,即一个维度, 总结起来,量表评价资料需要做多处理组间重复测量资料比较的多变量分析,显然这涉及相当复杂的统计分析方法。,41,1)由于是重复测量资料,量表评价过程不可避免地会出现缺失值。2)如果缺失值出现较多,则可能使整个资料无法分析。,缺失值:,如何补缺是量表评价资料分析时必须考虑的问题。,42,二、量表资料的统计分析概述 与一般资料的统计分析相似,量表评价资料的统计分析包括描述性统计和推断性统计。,43,描述性统计是任何统计分析的第一步,通过统计描述,得到资料的主要信息和分布特征,为确定进一步统计提供依据。统计描述就是按分组、按时点计算各条目、方面、领域和合计等指标的统计量,如构成比、均数和标准差等。采用统计图,如散点图、线图和直条图等描述量表测定值的分布,时间变化趋势和主要特征比较。,44,推断性统计分析:按分析方向可以分成 1)横向资料比较:比较同一时点不同处理组的量表时使用。包括单变量分析和多变量分析。 单变量分析可以用常规的t检验、方差分析和秩和检验等比较两组或多组量表总分和各领域或方面的得分。要注意的是量表指标常常是多维的,如分别比较各领域或方面的得分,因此需要做多个假设检验。由此可能增加犯假阳性错误的概率。为避免假阳性错误概率增加,可以对检验水准作Bonferroni校正。即如果需要做k次假设检验,总的检验水准为,则每次的检验水准为/k。,如果在评价量表时需分别比较各领域的得分,又需要做出总的结论,则要用多变量分析。,45,2)纵向资料比较:当研究设计不是一次性地测量研究对象的某量表测定值,而是在不同时间多次重复测量研究对象的该量表测定值,则需要做纵向资料比较的统计分析。,46,纵向资料分析的目的:对同一组人群不同时点的量表测定值进行比较,说明量表测定值在时间上的变化规律; 比较两组或多组人群的量表测定值在时间上的变化规律,其实质是两条曲线的比较,说明不同处理对人群某量表测定值变化规律的影响; 既比较不同组间又比较不同时点某量表测定值的变化规律,实际上是以上两种分析的结合。 如果把不同时点同一指标看作多个指标,可以用多变量的Hotelling T2或多元方差分析比较两组或多组间的差异,但这方法没有考虑重复测量值间的相关性。此外也可以用重复测量资料的方差分析,分别比较不同处理组间量表测定值是否有差异和不同时点间的量表是否有差异。最后可以考虑轮廓分析比较不同组量表测定值变化曲线的轮廓是否有差异。,47,三、量表评价资料统计分析的实例 例24-6 评价2002年某省医学科研成果申报项目共38项,其中19项为落选项目,19项获得二等以上奖励。各项项目的量表评价一级指标得分和和总得分见表24-5。表中一级指标分别是研究投入(T1)、学术水平(T2)、科学界公认(T3)、成果效益(T4)和知识产权(T5),TT是量表总分。,48,表24-5 获奖项目与落选项目的量表评价各领域得分,49,据表24-5计算两组对象各领域的平均得分,结果见表24-6。表24-6获奖项目与落选项目量表评价的平均得分与标准差,经做多变量方差分析,两组间总的差异有统计学意义,F=12.361 P0.001。其中差异主要是领域1、领域2、领域3和领域4,F值分别为14.85,64.57,23.66和34.29,P值均小于0.001。结果说明目前医学科研成果获奖主要体现在前面4个领域,在知识产权方面差别不大。,50,四、量表的应用 量表测评早期多用于心理学、教育学和社会学的调查测评中,上世纪60年代逐渐引入医学研究中。特别是当医学模式从生理学模式向生理、心理和社会综合模型转变后,量表测评显得日益重要,并且已经改变了一些传统的医学研究指标。,(1)心理学和精神病学应用 量表测评在医学最早应用于心理学和精神病学中,包括心理和精神疾患的诊断和疗效评价。例如应用心理测评量表评价运动员、军人、飞行员等从事高风险职业人员的心理素质。许多心理和精神疾病的诊断主要通过量表测评,在现代社会中,心理精神疾病已经成为常见病、多发病,如忧郁症、情绪抑郁、自闭症等。这些疾病没有明显的生物医学体征和实验室检查指标,而量表测评则是这些疾病诊断的主要参考标准,并且可以用量表测量评价治疗后这些疾病的改善程度。,51,(2)临床

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论