第七章人员测评的信度与效度案例_第1页
第七章人员测评的信度与效度案例_第2页
第七章人员测评的信度与效度案例_第3页
第七章人员测评的信度与效度案例_第4页
第七章人员测评的信度与效度案例_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2021/2/71 第七章第七章 人员测评的信度与效度人员测评的信度与效度 2021/2/72 6.1人员测评的可靠性信度 6.1.1信度的定义 信度主要是指测评结果的可靠性或一致性。 由测评工具否精确引起的误差叫系统误差。 由操作是否到位引起的误差叫随机误差。 信度考虑两方面的问题。 一是稳定性:不同时间、不同测评条件下所得 分数之间的一致性有多大;一个人的所得分数与 “真实分数”之间接近程度有多大;是否可以达 到实际应用的程度等。 二是影响稳定性的原因:什么因素造成了这种 差异;这些影响的相对作用有多大。 2021/2/73 6.1.2 信度的作用 信度高低的指标通常以相关系数表示,称为

2、信度系数。信度系数一般是同一样本所得的两 组资料的相关,在理论上表示为实得分数与真实 分数相关的平方。信度系数公式信度系数公式: : 2 X 2 T 2 xrxx S S rr 它是它是 X T xr S S r 其中其中: 真实分数标准差与实得分数标准差的比率。真实分数标准差与实得分数标准差的比率。 其中,r rxr 有时也称为信度指数,它是真实分数标 准差与实得分数标准差的比率。 2021/2/74 还可通过分析个人分数再测时的变化(误 差)来考察信度。两次测评分数的差异越大,信 度就越低。 在人员测评中,对信度系数进行确定通常有 以下两方面的作用: N xx S x 2 2 N xx S

3、 x 2 方差:即每个被测评者得分与其算术平均数 差的平方和与总个数之商。公式: 标准差公式: 2021/2/75 1解释真实分数与实得分数的相关性 总的方差(即标准差的平方的缩略语)中 有多少比例是由真实分数的方差决定的。 2说明可以接受的信度水准 一般的能力与成就测评的信度系数在090 以上;人格、兴趣等测评的信度系数通常在 0800.85之间。 rxx070时,不能用测评对 个人作评价,也不能在团体间作比较; 当rxx070时,可用于团体间比较;rxx085时, 可用于鉴别个人情况。 6.1.3 如何评估人员测评的信度 1.重测信度又称为稳定性系数 用同一测评,在不同时间对同一群体施测

4、2021/2/76 N为两次测评结果数据配对总数;x被分析的测评结果;y 为重复测评得到的结果。在进行重测信度的评估 时,还应注意以下两个重要问题: 1)重测信度一般只反映由随机因素导致的变化, 而不反映被试行为的长久变化。 2)不同行为受随机误差的影响不同。 2 2 2 2 yyNxxN yxxyN r 两次,这两次测评分数的相关系数即为重测系 数。一个测评的重测信度越高,说明测评的结 果越一致、越可靠。积差相关公式: 2021/2/77 2.复本信度又称等值性系数。 它是以两个测评复本(功能等值但题目内 容不同)来测评同一群体,然后求得应试者在这 两个测评上得分的相关系数(积差相关)。复

5、本信度的高低反映了这两个测评复本在内容上 的等值性程度。两个等值的测评互为复本。 3内部一致性信度 内部一致性信度主要反映的是测评内部题 目之间的关系,考察测评的各个题目是否测评了 相同的内容或特质。 1)分半信度 分半信度系数是通过将测评分成两半,计算 这两半测评之间的相关性而获得的信度系数。 2021/2/78 分半法经常会低估信度,必须进行修正。斯皮尔 曼一布朗公式可以估计增长或缩短一个测评对 其信度系数的影响,用这个公式进行修正的前提 条件为:两半测评的方差相等。 分半法中的斯皮尔曼一布朗修正公式为: hh hh xx r r r 1 2 其中其中, ,r rhh hh为两半测评的相关

6、系数 为两半测评的相关系数, ,r rxx xx为估计或 为估计或 修正后的信度。修正后的信度。 当两半测评的方差不同时,应采用卢伦公式 或弗拉纳根公式进行修正。 2021/2/79 卢伦公式只要求将被试在两半测评的分数 之差的方差(Sd2)和测评总分的方差(Sx2)代入 如下公式即可直接计算分半信度: 2 2 1 Sx S r d xx 其中其中Sd2为两测评分数之差的方差为两测评分数之差的方差;Sx2为测为测 评总分的方差。评总分的方差。 也可以采用弗拉纳根公式直接计算分半信 度: 2 22 12 Sx SS r ba xx Sa2与Sb2为两个分测评分数的方差;S Sx x2 2为总分方

7、差。 2021/2/710 2)同质性信度 同质性是指所有测评题目测评的只是单一 特质或内容,表现为所有测评题目得分的一致性。 乐观情绪特质和外向特质、预测和决策、监督 与控制等都是不太容易区分的。 如果需要在一个测评中测评不同的内容,就 应该将测评设计为几个分测评,每个分测评测评 一种内容。例如,16PF人格测评就是包含16个分 量表的测评,每个分量表只对一种人格特质进行 测评。 常用的同质性信度计算方法是库德理查 逊估计方法。计算公式有库德理查逊20号公 式(简称(KR20)和21号公式(KR21)。 2021/2/711 下面是KR20公式: 2 1 20 1 1Sx qP n n r

8、n i ii KR 其中其中n n为测评题目数为测评题目数, , 为通过为通过 题的人数比例题的人数比例; ;q qi i 为未通过该题的人数比例为未通过该题的人数比例; =1; ; =1; 为所有题目答对与答错人数百分比乘积的总和。为所有题目答对与答错人数百分比乘积的总和。 i p i ii qp n i iiq P 1 2021/2/712 6.1.4 评分者信度 在有些测评中,评分者的评判也是误差的来 源之一。 评分者信度是指不同评分者对同样对象进 行评定时的一致性。最简单的估计方法就是随 机抽取若干份答卷,由两个独立的评分者打分, 再求每份答卷两个评判分数的相关系数。这种 相关系数的计

9、算可以用积差相关方法。 如果评分者在三人以上,而且又采用等级记 分时,就需要用肯德尔和谐系数来求评分者信度。 其公式为: 2021/2/713 其中,K为评分者人数,N为被评定的人数或 答卷数;Ri为评分者给某人(或某一答卷)评分 之和。 为每一个对象被评等级。 NNK N R R NNK S W N i N i i i 32 1 2 1 2 32 12 1 12 1 2 11 2 1 N i i N i i R N RS 2021/2/714 评分者 答卷编号 一二三四五六 甲 431256 乙 532146 丙 412356 丁 641235 Ri 1911681723 例如,有4名评分者

10、,对6份答卷进行评分,所评等 级如下: 2021/2/715 6.1.5 影响信度的因素 1样本团体的性质 1)样本团体的分数分布 分数分布越广,信度系数就相对越高,分数 分布越窄,信度系数就会越低。 80.0 664 12 1 224 2246/841400 14002317861119 842317861119 32 2 222222 2 W S R R i i 2021/2/716 2)样本团体的异质性 一般来说,取样团体的异质性越大,信度系 数就相对越高。 但是在测评中,往往会因为团体过于同质或 过于异质而出现信度被低估或高估的情况。这 种情况下,可以采用下面的公式对求出的信度进 行修

11、正: 2 2 / 1 / SxSxxxr SxSxrxx xxr 其中, 为估计的信度; 为取样的信度;SX为 取样团体的标准差; 为估计团体(取样的总 体)的标准差。 xxr rxxSx Sx 2021/2/717 3)不同团体间能力水平的差异 2.测评的长度 信度还会受测评长度(即题目的多 少)的影响。一般来说,测评越长,信度值 越高。 3.测评的难度 测评的难度也会对信度产生影响。 如果一个测评的难度太低,出现天花板效 应;如果难度太大,出现地板效应, 2021/2/718 6.2人员测评的效度 测评的效度就是指测评的有效性,即能测评 到所要测评目标的程度。效度是评价测评好坏、 选择测评

12、的重要标准之一。 效度的作用比信度的作用更为重要。强调 测评目标、工具与测评对象的统一。 6.2 .1人员测评的有效性 效度的理论定义:与测评目标有关的真实分 数方差与总分方差的比率。 公式: 2 2 X V xr S S r 其中, 为测评效度; 为有效方差; 为总方差。 xr r 2 V S 2 X S 2021/2/719 信度和效度的关系 信度考虑系统误差和随机误差;效度误差还 包括对测评目的无关的变量所引起的系统误差。 效度的性质 实际上效度指的是“测评结果的效度”,是 指测评结果的准确性程度,而并不是指测评本身。 也反映了测评结果对测评目标的体现程度。 6.2 .2如何评估人员测评

13、的效度 6.2 .2 .1内容效度 1内容效度的定义 内容效度是指测评内容取样是否反映测评 的目标,适用于测评对象。 2021/2/720 2内容效度的评估方法 测评内容范围明确; 测评内容的取样有代表性。 采用如下步骤: 1)确定总体范围; 2)编制双向细目表; 3)制定评定量表。 还可采用经验的方法、统计分析方法。 3内容效度的应用 内容效度最适合于评估教育和职业成就测评。 也适合于某些用于人员选拔和分类的测评。 2021/2/721 6.2 .2 .2效标关联效度 效标关联效度,也称效标效度,它反映的是 测评分数与外在标准(效标)的相关程度,即测 评分数对个体的效标行为表现进行预测的有效

14、 性程度。 效标是考察测评效用的外在参照标准。效 标关联效度往往用于预测性测评。 1预测效度和同时效度 预测效度的效标资料往往是测评结束后隔 一段时间才获得,它反映被试行为表现的预测程 度。 同时效度的效标材料可以和测评分数差不 多同时搜集。 2021/2/722 同时效度多用于诊断现在的状态,预测效度 多预测未来的结果。 如:1)“某人成功了吗?” 2)“某人会成功吗?” 2效标和效标测评 效标是衡量测评有效性的参照标准。 把效标转化为某种可以操作的测评指标,称 为效标测评。 效标可以细分为观念效标(即效标的实质 概念内容)和效标测评(即效标的具体度量方 法)。例如,对于筛选销售人员的观念效

15、标是 “销售工作的成功” ,而效标测评是“年销售 量” 。 2021/2/723 3常用的效标 (1)学术成就 (2)特殊训练成绩 (3)实际工作表现 (4)团体对照 (5)等级评定 (6)先前有效的测评 6.2 .2 .3构想效度 构想效度是指测评能够测评到理论上的构 想或特质的程度。所谓构想通常指一些抽象的、 假设性的概念或特质,如智力、创造力、言语流 畅性、焦虑等。 2021/2/724 1确定构想效度的步骤 建立理论框架,以解释被试在测评上的表现; 依据理论框架,推演出各种有关测评成绩的假 设; 以逻辑和实证的方法来验证假设,根据累积材 料决定这种理论是否能恰当地解释现有材料;如 果不

16、能做出恰当解释,则应该修正上述假设,直 到能做出恰当的解释为止。 如:创造力测评构想效度。以测评分数与根 据创造力的心理学理论观察被试行为所做出的 判断做相关分析。 2021/2/725 2常见的确定构想效度的指标 (1)发展变化 (2)与其他测评的相关 (3)因素分析 因素分析是分析行为资料内部关系、结构 特性的一种统计技术。 (4)内部一致性 如果测评的所有题目被验证为具有很高的 内部一致性,说明它们都是关于同一内容的,属 于同一种构想。 用来考察内部一致性的方法主要有三种: 1)考察总分数较高和较低两类人在各 2021/2/726 题目上通过率的大小 ,如果通过率低,应淘汰或 修改。 2

17、)计算题目与总分的相关,如未达显著水 准,应予淘汰。 3)求分测评与总分的相关。各分测评与 总分有显著相关,如果不是,则应予删除。 (5)会聚效度和区分效度 会聚效度:测评与测评相同特质或构想等理 论上有关的变量高相关; 区分效度:测评与测评不同特质或构想等理 论上无关的变量低相关。 如,一个数学推理能力测评与数学课成绩的 相关就是会聚效度;而该测评与阅读理解能力测 评的相关显著低,就是区分效度。 2021/2/727 6.2 .3影响效度的因素 测评本身带来的影响因素 1测评题目的质量 2实施测评时的于扰因素 3被试的影响因素 4测评的长度 样本团体的性质 效标的性质 如果其他条件相同,所测评的行为或心理特 质与效标行为或特质越相似,效度系数就越高。 2021/2/728 概念与思考题: 重测信度、复本信度、内部一致性、信度、 分半信度、同质性信度、评分者信度、内容效 度、效标关联效度、构想效度、效标效度、相 容效度、预测效度、同时效度、会聚效度、观 念效度、区分效度、效标测评 1什么是测评的系统误差和随机误差? 2重测信度和复本信度考察的内容有区别吗? 3什么是内部一致性信度?它的意义是什么? 4用分半法求信度为什么通常要进行修正? 5怎样检查评分者评定的可靠性? 2021/2/729 6.信度和效度是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论