二十四章量表研制与量表的统计分析方法_第1页
二十四章量表研制与量表的统计分析方法_第2页
二十四章量表研制与量表的统计分析方法_第3页
二十四章量表研制与量表的统计分析方法_第4页
二十四章量表研制与量表的统计分析方法_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、华中科技大学公卫学院流行病与卫生统计系量表研制与量表资料的统计分析方法Development and Statistical Analysis of Scale 24章章23问问 题题p经过长期临床实践,某医生发现疼痛的性质、经过长期临床实践,某医生发现疼痛的性质、发作特点、程度对胃十二肠溃疡的诊断、治发作特点、程度对胃十二肠溃疡的诊断、治疗和预后起着至关重要的作用。但是,疼痛疗和预后起着至关重要的作用。但是,疼痛具有主观性,他应比较客观地度量疼痛?具有主观性,他应比较客观地度量疼痛?p多动症是一种常见的儿童疾患。目前,主要多动症是一种常见的儿童疾患。目前,主要依据多动症行为量表予以诊断、评估

2、。一旦依据多动症行为量表予以诊断、评估。一旦误诊,就会产生伤害。如,误诊儿童心理生误诊,就会产生伤害。如,误诊儿童心理生理上的长期伤害,家庭心理、经济等负担。理上的长期伤害,家庭心理、经济等负担。因此,作为多动症诊断依据的行为量表,应因此,作为多动症诊断依据的行为量表,应如何科学地评价、改进现有的量表?如何科学地评价、改进现有的量表?4第一节 概述5概概 述述特特 点点医学指标医学指标常用指标常用指标血压、白细胞血压、白细胞数、癌细胞分数、癌细胞分型、抗体型、抗体认知障碍、疼认知障碍、疼痛、生存质量、痛、生存质量、心理压抑心理压抑患者反应性患者反应性客观客观主观主观测量结果测量结果直接、较精确

3、直接、较精确间接、不精确间接、不精确检测过程检测过程易于标准化易于标准化难以标准化难以标准化医生诊断过程医生诊断过程不易主观干扰不易主观干扰易于主观干扰易于主观干扰6p量表(量表(scale),亦称测量工具),亦称测量工具(instrument),是由若干问题或自我评分指标组成的标准化是由若干问题或自我评分指标组成的标准化测定表格,用于测量研究对象的某种状态、测定表格,用于测量研究对象的某种状态、行为或态度。行为或态度。p在医学实践中,只能对通过测量这些状态的在医学实践中,只能对通过测量这些状态的某些表征或通过研究对象的自我主观感受来某些表征或通过研究对象的自我主观感受来间接地测评,量表是最常

4、用的和可行的工具。间接地测评,量表是最常用的和可行的工具。基本概念基本概念7例例1 如何评价治疗疼痛的效果,即,如何测如何评价治疗疼痛的效果,即,如何测量疼痛的程度量疼痛的程度 ?疼痛测评量表疼痛测评量表疼痛程度疼痛程度评分评分面部表情面部表情评分评分皮肤湿润程度皮肤湿润程度评分评分肌肉紧张程度肌肉紧张程度评分评分脉搏脉搏评分评分1. 8量表指标量表指标(或问题或问题)定量化定量化定量化定量化总目标总目标领域领域1 1领域领域mm方面方面1 1方面方面n n方面方面1 1方面方面n n指标指标1 1指标指标p p指标指标1 1指标指标p p领域领域(domain(domain维度维度(dime

5、nsion)(dimension)方面方面(facet)(facet)指标指标1 1指标指标p p9量表指标量表指标(或问题或问题)标准化标准化标准化标准化指标规范指标规范量表常模量表常模计算规范计算规范测量手段测量手段测量过程测量过程测量结果测量结果问题询问问题询问询问语气询问语气答案选择答案选择分权重分权重总分总分正常参照正常参照人群人群( (标准值标准值) )10指标值获得方式指标值获得方式: 1) 通过测量研究对象的某些特征通过测量研究对象的某些特征而获得的定量数据而获得的定量数据 2) 通过询问获得研究对象对某些通过询问获得研究对象对某些感觉、特征、态度和行为的定性感觉、特征、态度和

6、行为的定性或定量的答案。或定量的答案。11量表与问卷量表与问卷(questionnaire)区别区别项目项目分项分项量表量表问卷问卷架构架构特征特征反映研究对象一个反映研究对象一个特征特征反映研究对象多个反映研究对象多个特征特征指标指标相关,理论支撑相关,理论支撑可独立,主题支撑可独立,主题支撑维度维度分量表表示唯一维分量表表示唯一维度度分表可以表示多个分表可以表示多个维度维度计分计分计分单位计分单位分量表分量表各问题各问题计算指标计算指标分数分数次数次数分析分析描述统计描述统计均数,标准差、相均数,标准差、相关系数关系数率、百分比率、百分比推断统计推断统计t t检验,检验,ANOVAANOV

7、A,回归回归2检验检验生存质量(量表),医德医风调查(问卷),患者满意度?生存质量(量表),医德医风调查(问卷),患者满意度?12p无法直接测量的指标。无法直接测量的指标。如疼痛、失眠、疲乏、如疼痛、失眠、疲乏、活动能力障碍、生存质量(活动能力障碍、生存质量(quality of life)。)。 p抽象的概念和态度。抽象的概念和态度。如,智商、情商、幸福如,智商、情商、幸福感、满意度、社会适应能力等。感、满意度、社会适应能力等。p复杂的行为或神经心理状态。复杂的行为或神经心理状态。如,儿童多动如,儿童多动症、认知障碍、阅读障碍、运动协调性低下、症、认知障碍、阅读障碍、运动协调性低下、情绪抑郁

8、、焦虑症等。情绪抑郁、焦虑症等。适用范围适用范围13p 优点:量表测评具有客观性强优点:量表测评具有客观性强可比性好可比性好程序标准化程序标准化易于操作的优点。易于操作的优点。p 缺点:受研究对象个体差异影响大缺点:受研究对象个体差异影响大量表制定要求高量表制定要求高量表设计有缺陷,会导致结果偏倚。量表设计有缺陷,会导致结果偏倚。量表评价的优缺点量表评价的优缺点14第二节 量表的研制方法1.1.量表的结构特点量表的结构特点2.2.量表的编制原则量表的编制原则3.3.量表的编制步骤量表的编制步骤4.4.条目定量分析和筛选的统计方法条目定量分析和筛选的统计方法5.5.量表编制的注意事项量表编制的注

9、意事项15量表的结构特点量表的结构特点量表量表分量表分量表1 1领域领域1 1领域领域mm方面方面1 1方面方面n n方面方面1 1方面方面n n条目条目1 1条目条目p p条目条目1 1条目条目p p条目条目1 1条目条目p p分量表分量表k k测评特征涵盖的内容或层次实际上是与测评特征有关的项目条目实际上就是指标或问题16实实 例例医疗服务医疗服务满意度满意度服务态度服务态度医疗收费医疗收费医疗水平医疗水平挂号过程挂号过程就医过程就医过程检查过程检查过程取药过程取药过程就医指引就医指引接诊态度接诊态度诊室环境诊室环境条目条目1 1条目条目p p治疗过程治疗过程17p 适合性适合性:被调查者

10、的角度出发,设计适合:被调查者的角度出发,设计适合他们的问题,减少答题困难、时间与精力。他们的问题,减少答题困难、时间与精力。p 有效性有效性:问题必须围绕研究课题和研究假:问题必须围绕研究课题和研究假设进行设计。要有一个总体框架,领域作设进行设计。要有一个总体框架,领域作用清楚,指标(问题)明确。用清楚,指标(问题)明确。p 可行性可行性:必须符合被调查者回答问题的能:必须符合被调查者回答问题的能力和意愿。问题简洁,语言通俗,内容长力和意愿。问题简洁,语言通俗,内容长度适中,答题时间合适。度适中,答题时间合适。三大编制原则三大编制原则18编制步骤编制步骤第一步第一步明确目标(假设与概念)的范

11、畴和内容明确目标(假设与概念)的范畴和内容 第二步第二步探索量表的维度(内涵)和方面探索量表的维度(内涵)和方面 第三步第三步建立条目池和筛选条目建立条目池和筛选条目 第四步第四步设计可操作性条目设计可操作性条目 第五步第五步量表的定性评价量表的定性评价 第六步第六步量表的预调查和定量评价量表的预调查和定量评价 第七步第七步建立常模建立常模 19p任务:明确量表要评价的目标,包括目标任务:明确量表要评价的目标,包括目标的概念定义、范畴、内容等。的概念定义、范畴、内容等。p工作:设立研究工作组,包括专家,研究工作:设立研究工作组,包括专家,研究的对象。设立议题小组的对象。设立议题小组(nomin

12、al group)和选和选题小组题小组(focus group又称核心小组又称核心小组)。复习。复习文献著作。文献著作。1.明确目标(假设与概念)的范畴和内容明确目标(假设与概念)的范畴和内容 20p任务:定义测量概念及分解,由核心小组任务:定义测量概念及分解,由核心小组给出所测定概念的可操作化定义及构成,如给出所测定概念的可操作化定义及构成,如满意度指什么,包含哪些领域和方面,每项满意度指什么,包含哪些领域和方面,每项领域和方面的含义与内涵等。领域和方面的含义与内涵等。p工作:核心小组充分讨论,并请专家组评工作:核心小组充分讨论,并请专家组评议完成。议完成。2.探索量表的维度(内涵)和方面探

13、索量表的维度(内涵)和方面 21p任务:整理汇总量表条目,形成条目池任务:整理汇总量表条目,形成条目池(item pool)。p工作:核心小组向议题小组成员解释所测工作:核心小组向议题小组成员解释所测概念、领域和方面的定义和内容,然后由议概念、领域和方面的定义和内容,然后由议题小组成员分别独立地根据其个人的理解和题小组成员分别独立地根据其个人的理解和经验写出与以上概念有关的条目建议。经验写出与以上概念有关的条目建议。3. 建立条目池和筛选条目建立条目池和筛选条目 22p任务:确定条目的形成及答案选项。任务:确定条目的形成及答案选项。线性形式。线性形式。等级形式。程度副词的选择一般采用反应等级形

14、式。程度副词的选择一般采用反应尺度尺度(response scale)分析确定,如频度副词:分析确定,如频度副词:总是、经常、有时、较少、偶尔、罕见、从总是、经常、有时、较少、偶尔、罕见、从不等。不等。p工作:请一批有代表性的受试者,独立地在工作:请一批有代表性的受试者,独立地在标准化线段上标记程度副词,并选出合适副词。标准化线段上标记程度副词,并选出合适副词。4. 设计可操作性条目设计可操作性条目 01023表表24-1 24-1 关于重要性量词的反应尺度分析关于重要性量词的反应尺度分析量词量词平均分平均分量词量词平均分平均分非常不重要非常不重要0.900.90重要重要5.965.96不重要

15、不重要1.101.10比较重要比较重要7.147.14比较不重要比较不重要2.402.40相当重要相当重要8.048.04基本重要基本重要4.414.41很重要很重要8.598.59有些重要有些重要4.724.72非常重要非常重要8.698.6924p任务:对条目进行测评和筛选。任务:对条目进行测评和筛选。p工作:定性评价和定量评价。定性评价常工作:定性评价和定量评价。定性评价常用专家咨询法和用专家咨询法和Delphi法。法。专家咨询一般采用座谈会形式。专家咨询一般采用座谈会形式。Delphi法常采用多轮方式,向专家发信,法常采用多轮方式,向专家发信,由专家单独对各条目重要性进行评价。由专家单

16、独对各条目重要性进行评价。确定条目重要性、必要性和可行性,修确定条目重要性、必要性和可行性,修改条目,定量权重等。改条目,定量权重等。5.量表的定性评价量表的定性评价 25p任务:修订完善量表,形成最终量表。任务:修订完善量表,形成最终量表。p工作:进行预调查和量表定量考评。工作:进行预调查和量表定量考评。抽取样本量较小的样本,对量表予以预抽取样本量较小的样本,对量表予以预调查。调查。从量表的可理解性、语言的流畅性、信从量表的可理解性、语言的流畅性、信度、效度和反应度等方面,予以定量评价。度、效度和反应度等方面,予以定量评价。6.量表的预调查和定量评价量表的预调查和定量评价 26p任务:建立量

17、表各条目的权重值,各领域任务:建立量表各条目的权重值,各领域的权重值和总评分的计算公式。以及正常人的权重值和总评分的计算公式。以及正常人群的标准值范围,好、中、差等不同等级人群的标准值范围,好、中、差等不同等级人群的评分值范围等,供应用时参考。即,建群的评分值范围等,供应用时参考。即,建立量表的常模。立量表的常模。p工作:进行较大样本量的正常测试对象的工作:进行较大样本量的正常测试对象的抽样调查。抽样调查。 7.建立常模建立常模 27p意义重要意义重要p敏感性高敏感性高p独立性强独立性强p代表性好代表性好p确定性高确定性高p可操作性好可操作性好p可接受性强可接受性强条目确定标准条目确定标准28

18、条目定量分析和筛选的统计方法条目定量分析和筛选的统计方法主观评价法主观评价法( (专家法专家法) ) 测评条目的重要性。测评条目的重要性。离散趋势法离散趋势法测评条目的敏感性。测评条目的敏感性。选择标准差和变异系数大的条目。选择标准差和变异系数大的条目。相关系数法相关系数法测评条目的代表性和独立性。测评条目的代表性和独立性。主成分分析主成分分析因子分析法因子分析法从代表性角度筛选指标。从代表性角度筛选指标。选择系数较大的指标。选择系数较大的指标。聚类分析法聚类分析法从代表性角度筛选指标。从代表性角度筛选指标。R R型聚类分析,选择有代表性的指标。型聚类分析,选择有代表性的指标。基于重要性评价的

19、基于重要性评价的逐步筛选法逐步筛选法主观评价法的推广,类似于主观评价法的推广,类似于DelphiDelphi预测法。预测法。逐步回归法逐步回归法筛选对总评分筛选对总评分Y Y影响较大的条目评分影响较大的条目评分X X。逐步判别法逐步判别法筛选对不同状态人群鉴别能力有较大贡献的筛选对不同状态人群鉴别能力有较大贡献的条目,使量表具有较好的区分度。条目,使量表具有较好的区分度。29例例2 在在206例高血压病例与正常人的生存质量例高血压病例与正常人的生存质量预调查中,对生理领域的预调查中,对生理领域的3个方面(即疼痛、个方面(即疼痛、精力和睡眠)精力和睡眠)12个条目的质量进行分析,结个条目的质量进

20、行分析,结果见表果见表2。 30表表2 2量表条目的筛选分析结果量表条目的筛选分析结果条目相关系数变异系数因子载荷逐步回归逐步判别(%)F1F2F3F11-0.166*40.900.2220.013-0.478F12-0.226*42.510.762-0.046-0.143F13-0.240*44.250.812-0.069-0.175F14-0.08940.580.7060.020-0.265F210.243*42.06-0.1120.2330.801F22-0.181*39.090.657-0.255-0.197F23 0.227*32.24-0.1260.2240.812F24-0.27

21、6*41.150.741-0.293-0.016F310.212*32.140.0250.8300.297F32-0.317*51.740.512-0.665-0.017F330.237*35.24-0.0370.8240.308F34-0.316*55.730.480-0.6690.112* 相关系数假设检验P0.05, * P0.01; 逐步回归和逐步判别筛选入模型的变量。疼痛与不适疼痛与不适睡眠与休息睡眠与休息精力与疲倦精力与疲倦311.1.条目数量条目数量量表条目数量与完成时间相协调。量表条目数量与完成时间相协调。根据经验表明,个人访谈的时间在根据经验表明,个人访谈的时间在153015

22、30分钟分钟左右比较合适。左右比较合适。根据这一限制,量表的条目应该在根据这一限制,量表的条目应该在30503050项项左右。左右。如果条目数超出此范围,需要采取相应的如果条目数超出此范围,需要采取相应的措施保证调查质量。措施保证调查质量。量表编制的注意事项量表编制的注意事项322.2.问题措词问题措词明确具体明确具体避免一个条目包含多个问题避免一个条目包含多个问题避免提引导性、断定性的问题避免提引导性、断定性的问题避免提笼统、抽象的问题。避免提笼统、抽象的问题。3.3.测评内容测评内容客观指标。提问要具体,客观和数量化。客观指标。提问要具体,客观和数量化。主观指标。提问要更注重被访者的感受主

23、观指标。提问要更注重被访者的感受和态度,定量也更模糊。和态度,定量也更模糊。33第三节 量表的考评方法1.1. 量表的量表的定性定性考评考评2. 2. 量表的量表的信度信度分析分析3. 3. 量表的量表的效度效度分析分析4. 4. 量表的量表的反应度反应度分析分析34图示图示圆形靶圆形靶 人形靶人形靶(体育)(体育) (军事)(军事)35定性考评形式:定性考评形式:通过专家座谈会或专家咨询的方式,对量通过专家座谈会或专家咨询的方式,对量表及各条目进行定性评价表及各条目进行定性评价目的:目的:完善量表的结构完善量表的结构修饰条目的措词修饰条目的措词筛选条目筛选条目确定各条目的权重等。确定各条目的

24、权重等。 定性考评定性考评36例例3 某医学成果评价量表的研制。某医学成果评价量表的研制。专家组专家组:35位专家,其中临床医学专家位专家,其中临床医学专家19人,基础医学专家人,基础医学专家9人,科研管理专家人,科研管理专家7人。人。方法方法:Delphi法进行量表初稿的评价,调法进行量表初稿的评价,调查结果见表查结果见表3。结果结果:确定了一级条目和二级条目的重要:确定了一级条目和二级条目的重要性和权重。对部分条目进行了修改,删除部性和权重。对部分条目进行了修改,删除部分重要性得分低的条目,并增加个别条目。分重要性得分低的条目,并增加个别条目。37表表3 3 医学科技成果评价量表专家咨询结

25、果医学科技成果评价量表专家咨询结果一级指标平均权重重要程度二级指标平均权重重要程度研究投入0.13045.5课题来源0.35506.6经费额度0.31296.4课题组规模0.26755.8学术水平0.26438.9科学性0.29009.3创新性与先进性0.31119.1难易程度与复杂程度0.18547.6成熟程度0.18287.2科学界公认0.26888.9论文发表档次0.28548.8论文引用0.25048.5SCI收录0.24047.8推广应用程度0.20597.7影响因子总和0.25008.0成果效益0.19297.9直接经济效益0.46868.0社会效益0.52078.2知识产权0.1

26、4736.7专利0.24647.6版权登记0.14826.4新药(药械)证书0.27238.0专著著作权0.14916.4准入、标准或指南0.17146.538信度信度(reliability)(reliability),主要评价量表的精确性、,主要评价量表的精确性、稳定性和一致性,即测量过程中随机误差造成稳定性和一致性,即测量过程中随机误差造成的测定值的变异程度的大小。的测定值的变异程度的大小。常用的信度指标有:常用的信度指标有:(1 1)重测信度)重测信度(test-retest reliability)(test-retest reliability) 相同量表相同量表前后两次测量前后两

27、次测量同一批被访者。同一批被访者。 计算前后两次得分的简单相关系数计算前后两次得分的简单相关系数r r,一般要,一般要求达到求达到0.70.7以上。以上。信度分析信度分析39 (2 2)分半信度)分半信度(split-half reliability)(split-half reliability) 相同量表的调查项目相同量表的调查项目分成两半分成两半,如分前后,如分前后两个部分、按提问项目号的奇数和偶数分两个部分、按提问项目号的奇数和偶数分两个部分。两个部分。计算两个部分得分的简单相关系数计算两个部分得分的简单相关系数r r,分,分半信度的半信度的Spearman-BrownSpearman

28、-Brown公式为:公式为:rrR 1240(3 3)克朗巴赫)克朗巴赫 系数系数(Cronbachs alpha (Cronbachs alpha coefficient)coefficient):评价多个调查项目和谐水平的克朗巴赫评价多个调查项目和谐水平的克朗巴赫 系系数数计算公式为计算公式为式中式中k k为调查项目数,为调查项目数,Si2为第为第i个调查项目得个调查项目得分的方差,分的方差, ST2为量表总得分的方差。为量表总得分的方差。克朗巴赫克朗巴赫 系数应达到系数应达到0.70.7以上。以上。 )1(122TiSSkk 41例例4 某医生用某医生用WHOQOL-100量表调查了量表

29、调查了50例正常人的生存质量,一周后重复调查一次,例正常人的生存质量,一周后重复调查一次,结果见表结果见表4。表中。表中F1-F24是第是第1次调查次调查24个方个方面的得分,面的得分,T1是第是第1次调查的总分,次调查的总分,T2是第是第2次调查的总分。次调查的总分。Q1是第是第1次调查,被访者对次调查,被访者对自己生存质量的总评分,满分是自己生存质量的总评分,满分是100分。分。 42表 24-4 50 名正常人生存质量调查得分 Q1 F1 F2 F3 F4 F5 F6 F7 F8 F9 F10 F11 F12 F13 F14 F15 F16 F17 F18 F19 F20 F21 F22

30、 F23 F24 T1 T2 80 10 11 9 14 12 14 9 6 13 10 4 16 12 13 13 13 14 10 14 14 13 11 10 13 278 296 80 7 12 11 11 15 15 13 9 18 12 4 17 13 13 10 10 9 9 11 9 12 11 8 13 272 257 90 6 12 10 13 15 16 9 8 18 12 4 18 11 14 8 11 12 12 13 12 15 11 10 13 283 270 98 8 11 10 17 18 19 12 8 17 11 4 20 13 18 12 12 8 8

31、11 12 17 11 10 19 306 317 60 12 13 13 11 13 16 9 10 14 9 8 15 10 7 13 11 10 8 11 13 14 10 14 11 275 281 75 14 11 11 8 13 7 12 14 13 13 7 14 8 10 10 7 9 12 8 10 9 6 11 4 241 257 90 8 12 11 15 16 16 12 7 19 11 4 17 12 15 9 13 7 7 11 15 15 5 8 15 280 259 60 6 12 9 12 13 12 9 11 18 11 5 16 12 13 17 11 1

32、5 11 14 12 13 8 9 6 275 278 96 5 10 9 12 14 14 12 7 12 12 4 16 11 14 11 11 14 8 12 13 15 10 9 8 263 264 70 9 12 10 10 14 13 11 10 12 11 4 18 12 14 11 11 4 9 15 16 12 9 11 9 267 284 50 9 12 10 7 9 9 10 13 16 10 5 12 12 8 10 10 5 8 11 11 10 10 9 6 232 243 75 10 13 11 13 12 16 13 9 18 12 5 17 13 14 13

33、10 4 10 11 12 12 11 9 16 284 304 60 7 9 11 10 13 14 11 9 13 11 4 17 12 14 10 10 4 11 9 10 13 8 9 18 257 264 70 8 10 9 11 12 12 9 10 14 11 4 16 11 11 11 10 7 9 9 8 8 10 11 11 242 238 80 8 13 12 16 16 16 12 8 14 12 4 16 14 13 13 14 12 11 13 12 14 11 11 16 301 328 43该资料计算的有关信度指标该资料计算的有关信度指标重测信度重测信度:r=0

34、.82前后差值检验前后差值检验:前后差值的均数为:前后差值的均数为d=3.87,t=1.544,P=0.129克朗巴赫克朗巴赫 系数系数:80. 0)3588.6613710.1511(2324 )3588.6618371.13.3571. 32552. 61(2324 44效度效度(validity)(validity),主要评价量表的准确度、有,主要评价量表的准确度、有效性和正确性,即测定值与目标真实值的偏效性和正确性,即测定值与目标真实值的偏差大小。差大小。效度反映某测量工具是否有效地测定到了它效度反映某测量工具是否有效地测定到了它所打算测定的内容,即所打算测定的内容,即实际测定结果与预

35、想实际测定结果与预想结果的符合程度结果的符合程度。由于无法确定目标真实值,因此效度的评价由于无法确定目标真实值,因此效度的评价较为复杂,常常较为复杂,常常需要与外部标准作比较需要与外部标准作比较。效度分析效度分析45(1 1)内容效度)内容效度(content validity)(content validity)量表的各条目是否测定其希望测量的内容,即量表的各条目是否测定其希望测量的内容,即测定对象对问题的理解和回答是否与条目设计测定对象对问题的理解和回答是否与条目设计者希望询问的者希望询问的内容一致内容一致。内容效度一般通过内容效度一般通过专家评议专家评议打分。打分。 (2 2)标准关联效

36、度)标准关联效度(criterion-related validity) (criterion-related validity) 又称标准效度,是以一个又称标准效度,是以一个公认有效的量表公认有效的量表作为作为标准,检验新量表与标准量表测定结果的相关标准,检验新量表与标准量表测定结果的相关性。性。以两种量表测定得分的以两种量表测定得分的相关系数相关系数表示标准效度。表示标准效度。 常用的效度指标常用的效度指标46(3 3)结构效度)结构效度(contract validity) (contract validity) 又称构想效度,说明量表的结构是否与制表的又称构想效度,说明量表的结构是否与

37、制表的理论设想相符理论设想相符,测量结果的各内在成分是否与,测量结果的各内在成分是否与设计者打算测量的设计者打算测量的领域一致领域一致。结构效度主要用结构效度主要用证实性因子分析证实性因子分析(confirmatory factor analysis, CFAconfirmatory factor analysis, CFA)评价。)评价。内容效度与结构效度也有相关性,因此评价结内容效度与结构效度也有相关性,因此评价结构效度的量化指标也间接反映了内容效度。构效度的量化指标也间接反映了内容效度。 47p 分析指标:分析指标:拟合优度,评价实测指标性质拟合优度,评价实测指标性质与设计目标是否吻合。

38、与设计目标是否吻合。p 如果因子分析提取的公因子与量表设计时如果因子分析提取的公因子与量表设计时确定的各领域有密切的逻辑关系,则说明量确定的各领域有密切的逻辑关系,则说明量表有较好的结构效度。表有较好的结构效度。 证实性因子分析证实性因子分析X1Xne1enF1Fm条目条目领域领域48例例4(续)(续) 被测者自评总分与量表总分被测者自评总分与量表总分的相关系数为的相关系数为r=0.487,标准关联效度不,标准关联效度不佳。进一步分析发现被测者自评分主要佳。进一步分析发现被测者自评分主要与自身感受、工作能力、社会支持医疗与自身感受、工作能力、社会支持医疗保障和精神支柱有关。由于对象是健康保障和

39、精神支柱有关。由于对象是健康人,因此其对生存质量的理解与病人有人,因此其对生存质量的理解与病人有不同,造成量表的许多内容没反映在其不同,造成量表的许多内容没反映在其自评分中。自评分中。49WHOQOL100WHOQOL100量表有量表有6 6个领域共个领域共2424个方面,按照量表设计个方面,按照量表设计的结构做证实性因子分析。的结构做证实性因子分析。方面方面1 1、2 2、3 3反映第反映第1 1因子因子F1F1方面方面4 4、5 5、6 6、7 7、8 8反映第反映第2 2因子因子F2F2方面方面9 9、1010、1111、1212反映第反映第3 3因子因子F3F3方面方面1313、141

40、4、1515反映第反映第4 4因子因子F4F4方面方面1616、1717、1818、1919、2020、2121、2222、2323反映第反映第5 5因子因子F5F5方面方面2424反映第反映第6 6因子因子F6F6iiiFFFFFFaX 654321100000iiiFFFFFaFX 654322100000iiiFFFFaFFX 654332100000iiiFFFaFFFX 654432100000iiiFFaFFFFX 655432100000iiiFaFFFFFX 66543210000050p基于例基于例4的样本数据对假设的模型进行拟的样本数据对假设的模型进行拟合。考察模型对数据的

41、总的拟合程度的指合。考察模型对数据的总的拟合程度的指标主要有标主要有 2统计量;统计量;拟合优度指数拟合优度指数(goodness of fit index,GFI)。p例例4的计算结果为的计算结果为GFI=0.6073, 2=1844.28,P0.01。p该结果说明实际量表测量结果与设计结构该结果说明实际量表测量结果与设计结构拟合效果仍拟合效果仍不够理想不够理想,可能与样本较小有,可能与样本较小有关,也可能设计的模型结构不合理,需要关,也可能设计的模型结构不合理,需要修改模型设计,再进一步做证实性因子分修改模型设计,再进一步做证实性因子分析。析。 51p医学量表常用于比较不同治疗措施的疗效,

42、医学量表常用于比较不同治疗措施的疗效,因此,量表必须反映出对象细微的疗效差别,因此,量表必须反映出对象细微的疗效差别,即具有一定的反应度即具有一定的反应度(responsibility)。p反应度指量表能测出不同对象、不同时间目反应度指量表能测出不同对象、不同时间目标特征变化的能力,即反映对象特征值变化的标特征变化的能力,即反映对象特征值变化的敏感度。敏感度。p常用的统计量是效应尺度(常用的统计量是效应尺度(effect size)反应度分析反应度分析治治疗疗前前治治疗疗前前治治疗疗后后效效应应尺尺度度SXX 52例例5 某医院心理科医生研制神经症量表评价心某医院心理科医生研制神经症量表评价心

43、理障碍病人神经症状改善情况,对理障碍病人神经症状改善情况,对72例心理科例心理科住院病人(焦虑症住院病人(焦虑症30 例例,强迫症强迫症20 例例,癔症癔症12 例例,恐怖症恐怖症10 例)分别在治疗前后用该量表进行评例)分别在治疗前后用该量表进行评价,价, 结果治疗前病人的平均得分结果治疗前病人的平均得分25.74,标准,标准差差5.69,治疗后平均得分,治疗后平均得分31.18,效应尺度为,效应尺度为(31.18-25.74)/5.69=0.956。经配对。经配对t检验,检验,t=7.14,P0.01,差异有统计学意义,说明量,差异有统计学意义,说明量表能区分治疗前后症状的改善。表能区分治

44、疗前后症状的改善。 53第四节量表资料的统计分析方法54p资料基本特点:资料基本特点:多处理因素分组多处理因素分组反复多次测评,比较不同时期量表测反复多次测评,比较不同时期量表测评特征的变化(重复测量)评特征的变化(重复测量)多维度的多维度的缺失值较多缺失值较多p量表评价涉及相当复杂的统计分析方法。量表评价涉及相当复杂的统计分析方法。如,多处理组间重复测量分析,缺失值插如,多处理组间重复测量分析,缺失值插补,等。补,等。量表评价资料的特点量表评价资料的特点551. 1. 描述性统计描述性统计2. 2. 推断性统计推断性统计 量表资料的统计分析概述量表资料的统计分析概述56探索资料的初步信息和分

45、布特征,为推断探索资料的初步信息和分布特征,为推断性统计提供相应的线索与证据。性统计提供相应的线索与证据。按分组、按时点计算各条目、方面、按分组、按时点计算各条目、方面、领域和合计等指标的统计量,常用统计领域和合计等指标的统计量,常用统计指标有:构成比、均数和标准差等。指标有:构成比、均数和标准差等。采用统计图,如散点图、线图和直条采用统计图,如散点图、线图和直条图等描述量表测定值的分布,时间变化图等描述量表测定值的分布,时间变化趋势和主要特征比较。趋势和主要特征比较。描述性统计描述性统计57按分析方向可以分成:按分析方向可以分成:横向资料比较。比较同一时点不同处横向资料比较。比较同一时点不同

46、处理组的量表特性。包括单变量分析、多理组的量表特性。包括单变量分析、多变量分析、综合评价法。变量分析、综合评价法。纵向资料比较。比较不同时间多次重纵向资料比较。比较不同时间多次重复测量的量表特性。需要做纵向资料比复测量的量表特性。需要做纵向资料比较的统计分析。较的统计分析。 推断性统计推断性统计58p单变量分析:比较两组或多组量表总分单变量分析:比较两组或多组量表总分和各领域或方面的得分。常用方法有:和各领域或方面的得分。常用方法有:t t检验、方差分析和秩和检验等。但量表的检验、方差分析和秩和检验等。但量表的多维性,需要做多个假设检验,可能增加多维性,需要做多个假设检验,可能增加犯假阳性错误

47、的概率。常对检验水准作犯假阳性错误的概率。常对检验水准作BonferroniBonferroni校正:校正:aa= = / /k k。p多变量分析:评价量表时,既要分别比多变量分析:评价量表时,既要分别比较各领域的得分,又需要做出总的结论。较各领域的得分,又需要做出总的结论。横向资料比较横向资料比较59p综合评价法:量表属于多指标的综合状综合评价法:量表属于多指标的综合状况评价。常用综合评价法有:模糊判别法、况评价。常用综合评价法有:模糊判别法、OBrienOBrien综合法、秩和比法、综合法、秩和比法、TOPSISTOPSIS法等。其详细介绍,可以参考本书的第二法等。其详细介绍,可以参考本书

48、的第二十三章。十三章。 60p主要目的:主要目的:对同一组人群不同时点的测量,说明量对同一组人群不同时点的测量,说明量表测定值在时间上的变化规律表测定值在时间上的变化规律; ; 对两组或多组人群不同时点的比较,说对两组或多组人群不同时点的比较,说明处理对量表产生影响的变化规律明处理对量表产生影响的变化规律; ; 将以上二者相结合,综合分析量表特性。将以上二者相结合,综合分析量表特性。p常用方法:常用方法:Hotelling THotelling T2 2,多元方差分析,多元方差分析,重复测量资料的方差分析,等。重复测量资料的方差分析,等。 纵向资料比较纵向资料比较61例例6 6 续例续例3 3

49、,某研究者用例,某研究者用例3 3的量表回顾性评的量表回顾性评价价20022002年某省医学科研成果申报项目共年某省医学科研成果申报项目共3838项,其中项,其中1919项为落选项目,项为落选项目,1919项获得二等以项获得二等以上奖励。各项项目的量表评价一级指标得分上奖励。各项项目的量表评价一级指标得分和和总得分见表和和总得分见表5 5。表中一级指标分别是研。表中一级指标分别是研究投入究投入(T1)(T1)、学术水平、学术水平(T2)(T2)、科学界公认、科学界公认(T3)(T3)、成果效益成果效益(T4)(T4)和知识产权和知识产权(T5)(T5),TTTT是量表总是量表总分。分。 62表

50、表5 5 获奖项目与落选项目的量表评价各领域得分获奖项目与落选项目的量表评价各领域得分落选项目落选项目获奖项目获奖项目TTT1T2T3T4T5TTT1T2T3T4T51.740.430.480.400.280.142.400.460.970.350.490.142.350.540.910.350.400.142.840.371.010.550.760.142.120.200.750.390.560.232.910.471.060.730.500.141.970.380.750.410.290.142.660.501.010.500.500.142.140.350.910.410.290.183

51、.250.381.280.850.610.141.750.250.620.350.400.142.830.551.060.570.500.141.670.220.610.410.290.142.630.291.010.320.750.261.250.160.270.290.400.142.670.370.980.440.750.141.840.350.610.340.400.142.940.471.060.780.400.221.150.220.320.290.190.143.730.501.240.850.850.292.120.540.750.290.400.142.240.240.880

52、.410.570.142.080.160.830.450.490.142.550.451.060.400.500.141.360.130.360.220.400.243.390.591.150.840.680.141.580.170.530.330.400.143.020.481.060.560.680.241.280.260.370.220.290.142.590.550.960.350.590.141.910.160.830.380.400.143.130.461.140.520.760.241.420.320.270.290.400.142.640.251.010.560.680.141

53、.910.340.750.290.400.143.190.551.060.840.590.142.060.210.710.510.490.142.060.250.910.460.290.1463XX项目项目落选项目落选项目获奖项目获奖项目均数均数标准差标准差均数均数标准差标准差总分总分(TT)(TT)1.771.770.350.352.822.820.410.41研究投入研究投入(T1)(T1)0.280.280.120.120.430.430.110.11学术水平学术水平(T2)(T2)0.610.610.210.211.051.050.100.10科学界公认科学界公认(T3)(T3)0.3

54、50.350.080.080.570.570.190.19成果效益成果效益(T4)(T4)0.380.380.090.090.600.600.140.14知识产权知识产权(T5)(T5)0.150.150.030.030.170.170.050.05多变量方差分析,两组间总的差异有统计学意义,多变量方差分析,两组间总的差异有统计学意义,F F=14.93=14.93,P P0.0010.001。其中,领域。其中,领域1 1、领域、领域2 2、领域、领域3 3和领域和领域4 4,有统计学意义。结果说明,目前医学科,有统计学意义。结果说明,目前医学科研成果获奖主要体现在前面研成果获奖主要体现在前面

55、4 4个领域,在知识产权方个领域,在知识产权方面差别不大。面差别不大。表表6 6 获奖项目与落选项目量表评价的平均得分与标准差获奖项目与落选项目量表评价的平均得分与标准差64例例7 7 目的:目的:在评价两种化疗方案疗效的临床研在评价两种化疗方案疗效的临床研究中,应用生存质量作为疗效评价指标。究中,应用生存质量作为疗效评价指标。分组:分组:A A组,联合方案低剂量化疗,组,联合方案低剂量化疗,1010例例B B组,单药大剂量化疗,组,单药大剂量化疗,1010例。例。指标:指标:分别在化疗后分别在化疗后1 1个月、个月、3 3个月和个月和1 1年年进行生存质量测定。进行生存质量测定。量表特征:量

56、表特征:有有5 5个条目,每个条目的答案个条目,每个条目的答案最低得分为最低得分为1 1分,最高为分,最高为5 5分,即总分最低分,即总分最低5 5分,满分为分,满分为2525分。分。两组调查结果见表两组调查结果见表7 7。65表表7 7 肿瘤病人经两种化疗方案治疗后的生存质量测定值肿瘤病人经两种化疗方案治疗后的生存质量测定值组别组别测定时间测定时间1 1月月3 3月月1 1年年A A组组12, 6, 12, 21, 98, 7, 14, 10, 2113, 10, 18, 21, 1018, 13, 20, 20, 2424, 13, 22, 24, 2224, 24, 24, 22, 24

57、均数均数12.016.722.3B B组组11, 12, 16, 11, 612, 8, 19, 11, 1016, 11, 15, 14, 128, 11, 18, 9, 1223, 18, 22, 19, 1620, 14, 9, 21, 21均数均数11.612.618.366轮廓分析方法。轮廓分析方法。平行性检验:平行性检验:F F=2.88=2.88,P P0.050.05差异无统差异无统计学意义,可以认为两曲线平行。计学意义,可以认为两曲线平行。重合性检验:重合性检验:( ( 1 1- - 2 2)=)= e e,e e=(1,1,1)=(1,1,1)是是p p维取值为维取值为1 1的向量,的向量, 是两组在各时点均是两组在各时点均值之差的期望值,值之差的期望值, 的点估计为的点估计为3.473.47, 的的95%95%可信区间为可信区间为3.473.47 3.23=(0.243.23=(0.24,6.70)6.70),95%95%可信区间没有包含零,说明差异有统计可信区间没有包含零,说明差异有统计学意义,联合方案病例的生存质量较好。学意义,联合方案病例的生存质量较好。67 当医学模式从生理学模式向生理、心理和社会综合当医学模式从生理学模式向生理、心理和社会综合模型转变后,量表测评显得日益重要,并且已经改变模型转变后,量表测评显得日益重要,并且已经改变

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论