测试效果的测量和有效性_第1页
测试效果的测量和有效性_第2页
测试效果的测量和有效性_第3页
测试效果的测量和有效性_第4页
测试效果的测量和有效性_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、? 有效性? 可靠性? 测试效果的测量有效性有效性是对选择测试的一个基本要求,是评价测试效果 的一个指标。有效性( validity )是指一项测试所能测量出的 其所要测量的容的程度,它表明一种测试在预测参加者在未 来业绩方面成功与否。即选拔过程中得分较高的应聘者其工 作表现也比测试得分较低的应试者好。如果一项测试不能表 明某人是否具有完成某项工作的能力那么它就毫无价值。 在我们测试有效性之前,要确定一些指标说明哪些反映工作 中的成功业绩,哪些只反映出应聘面试和测试中的成功表 现。 有效性用效度来衡量。效度就是指一个测验在测量中要测的 行为特征所具有的准确度,也就是说这个测验的测量结果与 想要

2、测量的容的相关系数。它概括了两个变量间的联系,其 差异围在 0 至正(负)1 之间,效度最高是。 效度达到 就相当不错了,而在之间也可以接 受。根据问题的不同的侧重,可以把效度主要分为两类,即容效 度和效表关联效度。() 容效度,又叫形式有效度。容效度主要就是指测量所 选的项目是否符合有关的容,就是测验在性质上与收集方法 上与事先所建立的标准是否一致。要确定一个测试方法的容 效度是高还是低,最常用的方法就是请有关的专家对测量的 有关项目进行全面的考核,看其是否代表所要测试的容,这 样来确定它的容效度。() 效表关联效度,又叫试验有效度。效表关联效度是指 测验能否达到预期要求的程度。心理测量的作

3、用,往往是为 了预测将来的行为,如果在招聘中,某一个被试者在通过某 一项心理测试时显示他的管理才能很高,但是在以后实践中 发现他的管理能力并不高,这样我们说该心理测试的效度不 高,效表关联效度的确定是由心理测量的结果与有关人员对 被试的有关心理活动进行评价的相关的系数来决定的。测量有效性的方法可分为:、结构有效性( construct validity ):是测量有效性的一种方法。它是一种确定测试是否能衡量出对完成某项工作十 分重要的特性的有效性的测试方法。例如,如果工作要求高 度的配合协作(这一点在全面质量管理导向的企业中尤为重 要),测试可能会被用来衡量求职者在小组中有效工作能力。、容有效

4、性( content validity ):是测量有效性中容效度 的一种方法。它是以一个人完成实际工作所要求的某些任 务,或完成量相关工作知识的一篇论文或笔试卷为基础的有 效性的测试方法,当采用这种形式的有效性测试时,需要仔 细的工作分析和精心准备的工作说明。采用容有效性的常见 例子是对主要工作为打字的求职者进行打字测试。 、与标准相关的有效性 ( criterion-related Validity ):是测量 有效性中效表关联效度的一种方法。它是通过比较选择测试 分数与工作业绩的某些方面而确定的。业绩衡量可以包括工 作的数量和质量、工作调动和缺勤情况。测试分数与工作业 绩密切相关。表明测试

5、是有效的。 与标准相关的有效性有两种基本形式:并存有效性和预测有 效性。 并存有效性是指测试分数与标准数据基本上同时获得的形 式。例如,对所有目前在职的电视人员进行一次测试,公司 记录有当前第位职员业绩的信息,如果测试能够确定出哪些 人工作较好,哪些人工作不太好,那么就可以说测试是有效 的。但是采用这种有效性的潜在问题是,工作组织部可能发 生一些变化,工作不好的员工可能被解雇。而工作好的员工可能被提升到其他部门预测有效性 ( predictive validity )是指进行测试后方获得标 准信息的形式。例如,对所有求职者进行测试,但测试结果 不用于选择决策,而是根据其他选择标准决定是否雇用。

6、在 对员工的观察一段时间后才分析测试结果是否能将成功与 不成功的员工区分开,预测有效性被认为是一种技术上合理 的程序, 但是, 由于时间和成本问题, 其在应用常不太可行。可靠性可靠性( reliability )是评价测试效果的一个指标,它是 指一个人在同一心理测量中,几次测量结果一致性,它反映 测试所提供结果的一致程度。 可靠性数据提示了测试的可信程度。如果可靠性很低,则测 验也就无有效性可言。但是可靠性存在本身并不能保证其有 效性。测试的可靠性应是测试的围对所有测试对象保持一 致。可靠性可以分为以下几类:再次信度。这种信度是检验时间间隔对测试分数的影 响,也就是说同一个测验对同一个被度者进

7、行前后两次测 试,求其两次测试结果之间的相关,所得的相关系数就是再 次信度。 这个时间间隔, 一般在两个月以上, 这样比较准确副本信度,又叫等值信度。就是指一种心理测试的结 果与另外副本的心理测试结果进行相关性分析得出的信度。 这种评价方法的缺点在于,副本有的时候比较难找到。 分半信度。就是说题目分成对等的两半,根据两半测验所 得的分数,计算其相关系数,评为信度指标,其意义与等值 信度一样解释。所不同的是一个心理测验里边包括两个独立 的副本,这样,一次测验以后就可以找到测试信度。测量可靠性的方法有:、标准形式方法 (equivalent forms method) 是测量可靠性 中副本信度的一

8、种方法。它是通过对类似但不完全相同的测 试结果做相关分析来检验可靠性。这种方法克服了测试再 测试方法遇到的一些问题,但是一个测试采用两种形式进行 的成本也较高。为了克服这上缺点,可采用均分方法。、测试 -再测试方法( test-retest method)是测量可靠性 中再次信度的一种方法。它是通过对同一组人进行两次测 试,并对两组测试得分做相关分析,以确定选择测试可靠性 的一种方法。 两个分值完全正相关时的系数是 1.0。可靠性 系数接近该值,表明测试结果越一致,测试就越可靠。、均分方法 (split-halves method) 是测量可靠性中分半信 度的一种方法。它是通过将一个测试的结果

9、分成两部分,再 对两部分的结果做相关分析,进行一次测试最大的优点是成本低,并且没有机会学习或回忆,而学习或回忆会使第二次 测试的分数不真实。测验的可靠性体现在两个方面:() 测验本身的一贯性,即如果发生误差,乃是由于应试 者表现上的不稳定,而不是由于测验本身性质的差异造成 的。() 一次测验与多次测验的结果大致相同, 具有稳定的预 测。可靠性是由信度来衡量的。其差异围在 0 至正(负) 1 之间。 心理测试的信度最高可以达到。心理测试的信度达到是 一种理想的状态,在实际中是办不到的。一般的智力测验的 信度系数在以上,就可以认为该测验信度相当好。一 般信度在 80% 以上就令人相当满意, 如果低

10、于 80%,在没有 更好的测验时也可以作为参考,但对于测验所得的分数不宜 寄予过高的信赖。影响信度的因素: 信度的准确与否与误差,特别是随机误差的关系十分密切, 这种误差是各种各样的。比如,被试者的身心健康,参加测 试的动机、态度,主试的专业水平,空气的温度,测试场地 的环境, 指导语的差异, 题意的明确与否, 项目的多少等等, 那会影响到测试的信度。因此,为了使心理测试获得有意义 的信度,必须严格控制可能影响测试结果的各种主观变量。可靠性与有效性的关系:一般来讲,测验必须先具有相当的可靠性,然后才可以预测 有效性,但是可靠性高的测验并不一定保证高的有效性,因 为可靠性表示测验本身可靠的程度,

11、而有效性则涉及到测验 所测量的容是否与工作的决定因素发生关联的问题,如果测 验的目标侧重个人职业的指导以分析其性格和能力时,则测 验的有效性越高,其指导正确的可能性越大,故应特别重视 有效性,有效性越高越好。如果测验目标是为了考选大批新 进人员,为了达到考选的目的,通过具有一定有效性的测验 而录取的人员比未经测验而录用的人员的实际绩效好,那么 人力资源管理人员在即使测验有效性不高的情况下也可以 使用,因为这毕竟比漫无目标的情况好。测试效果的测量测试的效果是指测试是否尽可能地选择了符合要求的人,和 尽可能地排除了不符合要求的人。如何测量测试效果呢?有 下面几个要素标准:() 标准化。标准化( s

12、tandardization )是指与实施测试有 关的过程和条件的一致性。为了能根据同样的测试来比较若 干求职者的表现,所有人都必须在尽可能相似的条件下接受测试。例如,提供的容说明和允许的时间必须相同,测试环境也必须相似。如果一个人在一间喧闹的房间接受测试,另一人在安静的环境中接受测试,测试结果很可能有差别。尽 管测试的设计者对测试实施过程有详细的说明,但确保测试 条件标准化是测试实施者的职责。() 客观性。当给测试者评分的每个人所得结论相同时, 测试就具客观性( objectivity )。多项选择和判断对错的测试 是客观的。这种测试的评分是高度机械化的过程,即利用机 器评分。() 规。规( norm)为将一个求职者的表现与其他求职者 相比较提供了一种参考框架。尤其是,一种规反映了类似于 受测试者的许多人的分数分布状态,这些分数将根据正态概 率曲线分布。标准差表明数据的离散程度。一个规化的测试,将有大约的分数落在 ±个标 准差的围。该围的每个分值都被认为是平均值。落在 &#

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论