版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
素质测评的质量分析方法素质测评的质量分析Hr-pku本讲内容效度的概念及其分析方法信度的概念及其分析方法区分度的概念及其分析方法选题质量分析及其分析方法结构效度结构效度又称作构想效度、构思效度、构念效度、构建效度等。结构效度是指实际所测评的结果与想测评素质的同构程度。它表明了在多大程度上,实际测评结果能够被看作是索要测评的素质在结构上的替代物。在素质测评中,它是人们最关心的一种效度。这是由素质测评的间接性所决定的。人们总是通过选取一些具体的行为测评来判断实际的素质水平。结构效度与检验效度的人对素质结构的理解有直接关系。如果李某认为忠诚这一素质即对本企业的忠诚,张某认为忠诚这一素质表现为实事求是的态度,那么对于向其他企业说明本企业产品所存在的问题这一行为,显然李某与张某会把它归类到不同的素质成分中给与不同的素质成分中并给与不同的评价。因此结构效度的检验分析也是一种定性的主观判断。在分析考评过程中,要采取有力措施把主观影响控制在最低点上。结构效度结构效度的分析可按一下几步进行:1.给所要测评的素质的结构模式下一个操作化的定义“我们所要测评的素质是对的态度、有关的品质、有关的技能。”像这样一些表述所测评素质的具体形象是什么,结构是什么,我们并不清楚,它仍然是从具体行为概括出某种意识或观念,因此对结构效度的分析没有多大意义。这里的构建不是从行为向观念构建,而是相反,由观念向具体行为的构建。不是简单还原,而是在更高的水平上抓住所测素质的本质特征,确定一个可感觉可操作的结构模式,由这种具体的结构模式作为抽象观念建构的替代物。这种替代物的成分显然应该是我们世纪能够看到的、听到的、感觉到的东西。例如:外显行为、客观性生理反应等。素质测评的目标体系实际上就是所测素质的一个行为构建模型,这种结构模型分别由项目、指标、权重、标度等组成。这种模型的建构,在很大程度上取决于所测素质本身的特征及其抽象程度等组成。2.收集事实资料,评判结构效度,具体方法有:排除法如果测评结果能明确的排除它所对应素质结构模型的其他解释,那就表明所获得的测评结果具有较好的结构效度。咨询法可以请一些有经验的专家就你所获得的测评结果、所对应的素质结构进行判断或推断,问他们该测评结果实际测评的素质是什么。如果大家的回答与你所想测评的素质结构几乎一致,那么说明你的测评有较好的结构效度。相关法找一个具有较高结构效度的测评工具或结果,与你所获得的测评结果进行相关性分析,如果相关性很高,说明你的测评结果具有较高的结构效度。例如:某一个具有“自尊”结构效度的测评量表,它的测评结果就应该与自信、社交能力及领导作用等测评量表的测评结果成正比,而与诸如内向性、自卑、孤独等测评量表测评的结果成反比。逻辑分析法当大家对所测素质的结构模型具有比较一致的认识时,只要能判定测评内容(工具)选择正确,且整个测评过程除了一切外来干扰因素,就可以说测评结果具有较好的结构效度。例如:测评时间足以保证被测评者完成所有的工作,被测评者没有受到催促因素的影响;测评工具的指导十分明确,被测操作准确。多元分析多元分析就是采取聚类分析与主成分分析等数学手段,对测评结果进行分析,看分析的结果。例如:所找出的主要因素与分类结果与所想测评素质的结构是否一致,如果一致,则说明所获得的测评记过具有较好的结构效度。关联效度又称实证效度、效标效度、效标关联效度,是指测评结果与效标的一致性程度。效标是一种用来衡测评有效性的外在参照标准,它可以是一种测评的结果,也可以是标准测评分数。根据效标是否可以同时获得,可将关联效度分为同时效度与预测效度。作为效标的结果与预测结果同时获得,这种效度称之为同时效度。当作为效标的结果是后来测评中获得,这种效度称为预测效度。它反映了现在的测评结果对未来素质发展的预测程度。例如:两个人同时采用观察评定与问卷测验测评同一个人的工作态度,两个测评结果相关系数很高,例如0.80,那么以后在类似的情况下,可以用问卷测验代替花时太多的行为观察法。效度分析中的几个理论问题关于效度概念的研究1921年美国教育研究指导协会提出,效度是“测验在多大程度上测到所要测的东西”。同时被提出的还有“预测效度”和“共时效度”,后来被统称为“效标效度”。19世纪30年代,人们将更多的注意力放在测验对于具体目标课程的代表性高低上。于是引入“课程效度”,后更名为“内容效度”。1954年美国心理学会出版了《关于心里测验和诊断的技术建议书》,明确列举了四种类型的效度:预测效度、同时效度、构想效度、内容效度。美国心理学会、美国教育研究学会和国家教育测量委员会1966年联合出版的《教育与心理测验的标准和指南》中,将效度类型进一步简化为效标关联效度、构想效度和内容效度三种。Cronbach和Meehl又进一步把前两类归结为准则关联效度。这是一种三位一体的分类法观点。Cronbach指出,延续了30年的旧观念(即把效度分为相互分离且并列的三类)已经过时,取而代之的是一元论的产生。Messick以建构效度概念为中心,提出了检验测验效度的四个层面(渐进矩阵)。
测试解释测验使用证据基础结构效度结构效度+适切性和实用性后果基础结构效度+隐含的价值结构效度+适切性和实用性+社会效果关于效度概念的研究结构效度概念产生后第二年,L.J.Cronbach和P.E.Meehl提出了5种验证方法,即分组区分法、相关矩阵与因素分析法、内部结构研究、不同场合下的变化研究、过程研究。提到,效度指的是一个测验准确测量它所要测的东西的能力,包括内容效度、效标关联效度和结构效度。张厚粲、孙晓敏、王晶、叶映华、郑全全对效度概念演进及其新发展进行了研究。张厚粲、孙晓敏(孙晓敏、张厚粲,2004)回顾了心理测量学中效度概念发展的三个阶段,早期效度概念关注的是两个变量之间的相关.随后重点转向效度的多种类型,现阶段则注重考察测验的构想效度。总之,效度确证成为一个持续不断的动态过程;在这个过程中,运用各种技术不断地评价、质疑和检查由测验分数所作推论和解释的有效性成为心理与教育测量研究中不可或缺的组成部分。关于效度概念的研究效度应用内容效度分析适用于某些对员工进行选拔和分类的职业测验,舍恩菲尔特、阿克、柏尔森(,,1976)清楚而详细的说明了编织工业阅读测验是怎样应用各种内容效度分析法。在编制联邦政府和州政府公务员测验时,这种方法得到了广泛的采用。郭庆科(郭庆科,2002)对各种效度的应用进行了分析,他指出效标关联资料可以应用于对个人分数的预测(包括简单回归法、多种测验信息的综合)、人员的分类与安置(人员分类的性质、人员分类的优点、差异效度)。信度信度的概念信度是指测评结果所反映素质的准确性。对于这种准确性的考评目前大致有稳定系数、等值系数、分半系数、内部一致系数、评分一致性系数等。以上几种信度都是针对常模参照测验而言的,标准参照测验中的信度计算通常使用分类一致性信度,这种信度的的常用估计方法是考察同一批被测者在两次是册或者复本测验中的分类是否一致。标准参照测验中的信度也可以使用K系数计算,较分类一致性信度在统计上更合理(,1968,1988)。再测信度指以同样的测评与选拔工具,按照同样的方法,对于相同的对象再次进行测评与选拔,所得先后结果的一致性程度。再测信度的计算一般采用皮尔逊积差相关系数。个体的素质测评在测评过程中会涉及许多因素的影响,素质本身有时也无法精确定义。我们常常把对个体测评结果的准确性检验,置于群体测评结果的相互关系中,转化为两次位置关系的一致性分析。当同一对象的测评结果以同样的测评方式再次获得后,其顺序位置关系变异很小时,则说明测评结果比较准确。例如:在技能测评中李某的分数是88,在全体被测者中排名第一,这到底准不准呢?我们再重复测评一次,结果李某的分数是95,还是排名第一,而且其他被测的位置顺序变化很小,我们就可以说第一次的技能测评结果很可靠。一致性信度一致性信度又称同质性信度,是一种常用的估计信度的方法,反映了测验题目与所测量内容的一致性程度。一致性信度的计算公式主要有分半信度,主要采用斯皮尔曼-布朗修正公式计算;库德-理查逊公式和克伦巴赫а系数。如果被测在第一个项目上比其他人分数高,在第二个项目上又比其他人高,在第三个项目上也比其他人高......相反另一个人在第一个项目上比其他人分数低,在第二个项目上又比其他人低,在第三个项目上也比其他人低......那么毫无疑问,我们会认为测评结果比较可靠。评分者信度评分者信度指多个测评者给同一组被测样组进行评分的一致性程度。测评与选拔结果的差异程度来自两方面一是被测评者自身,二是被测评者及其测评。信度主要是对后者的度,测评者及其测评的无关差异越小,测评与选拔结果就越可靠。测评者的评分是引起主观性测评结果差异的主要原因。客观性测评是利用计算机评分,不受主观因素影响,不存在评分误差。评分者信度主要采用肯德尔和谐系数计算。信度多高才算可靠对人事测评中信度系数与测评质量的关系,以下给出了几种心理测验的信度系数:测验类型信度低中高成套成就测验0.660.920.98学术能力测验0.560.900.97成套倾向测验0.260.880.96客观人格测验0.460.850.97兴趣问卷0.420.840.93态度量表0.470.790.98各种信度系数应用信度系数类型估计方法应用稳定性系数重测法(积差相关)人格、速度测验等值性系数复本法(积差相关)智力、学绩、速度测验等值稳定性系数复本法(积差相关)智力、学绩、人格测验内部一致性系数分半法(积差相关,用斯-布公式校正)库德尔-理查森公式法α系数法智力、学绩、选拔测验评分信度系数斯皮尔曼等级相关法肯德尔和谐系数法作文、创造力、投射、道德判断测验项目分析适合度在素质测评中,项目不仅仅是试题,更多的是一些咨询问题或观察评定点(指标),它们无难易之分,适合度指的是被测者行为符合项目测评标准的程度。当项目为试题时,适合度即难度;当项目是问卷中的问题时,符合度即所有选对的被测者人数与总人数之比;当项目为观察评定量表中的指标时,符合程度即所有被测得分平均值与指标满分值之比。区分度又称鉴别力,指项目得分对被试实际能力或心理特质水平的区分能力或鉴别力,也即项目得分的高低与被试实际能力或心理特质水平高低的一致性程度。项目区分度的计算方法主要有相关分析法(包括积差相关法、二列相关法和点二列相关法)、极端组法(鉴别度指数、临界比)和因素分析法独立性在能力测评中,常常需要项目之间有一定的独立性。所谓独立性即非相关性或低相关性。独立性的分析一般采用项目间分数的相关系数揭示,根据实际得分分布是否均匀,可以分别采用rφ系数法和列联表χ²检验法。项目分析选项质量对于诱答或正答质量的分析方法有两种:诱惑力分析法这种方法是采用表格形式,分别统计高分组与低分组中的被测者对同一项目各选项的选择次数。“白智”试测法这种方法是找一些对测验内容一无所知或十分陌生的人作为被测者进行测试,通过分析这些人对每个诱答选择的人次来分析选项的质量。趋中心理误差趋中心理误差是指因为测评者既不愿把被测评的过好,也不愿把被测评的过差而过于集中在中间段而产生的误差。这种误差使有差异的被测得到相同或相近的分数,缺乏区分性。可以通过测量结果的分布及差异量分析来揭示这种误差的情况。宽大心理误差宽大心理误差指因测评者不坚持测评的标准要求就高不就低的测评而产生的误差。这种误差表现为皆大欢喜,高分低能。另一种负向宽大心理误差,则是过于严格,以一些脱离实际的高标准去测评人的素质,测评结果普遍较低。逻辑误差逻辑误差指测评者不是实事求是的对每个素质独立地测评,而是依据其是否相关的特点而进行逻辑上的推断。对比效应误差对比效应误差指测评者在测评过程中因被测与标准间存在某种明显的反差而产生的误差。这种误差又叫托衬
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度个人二手房居住权买卖及售后服务保障合同
- 2025年全球及中国电子级二氧化硅微粉行业头部企业市场占有率及排名调研报告
- 2025-2030全球固态开关继电器行业调研及趋势分析报告
- 2025年全球及中国紫外波段高光谱成像(HSI)设备行业头部企业市场占有率及排名调研报告
- 2025-2030全球H级三相干式电力变压器行业调研及趋势分析报告
- 2025版智慧社区项目投资合同范本3篇
- 二零二五年度银行存款账户冻结与解冻服务合同3篇
- 2025年度个人与个人电子商品购销合同3篇
- 小学生文明上网礼仪指南
- 2025版收藏品版权授权与买卖合同范本3篇
- 2025年春新人教版物理八年级下册课件 第十章 浮力 第4节 跨学科实践:制作微型密度计
- 2024-2025学年人教版数学六年级上册 期末综合试卷(含答案)
- 收养能力评分表
- 山东省桓台第一中学2024-2025学年高一上学期期中考试物理试卷(拓展部)(无答案)
- 2024年全国统一高考英语试卷(新课标Ⅰ卷)含答案
- 幼儿园公开课:大班健康《国王生病了》课件
- 小学六年级说明文阅读题与答案大全
- 人教pep小学六年级上册英语阅读理解练习题大全含答案
- 国寿增员长廊讲解学习及演练课件
- 同等学力申硕英语考试高频词汇速记汇总
- GB 11887-2012首饰贵金属纯度的规定及命名方法
评论
0/150
提交评论