第四节 测验的效度_第1页
第四节 测验的效度_第2页
第四节 测验的效度_第3页
第四节 测验的效度_第4页
第四节 测验的效度_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四节测验的效度

效度的概念效度评估的方法效度的功能影响效度的因素第一单元效度的概念效度的概念是指所测量的与所要测量的心理特点之间符合的程度,或者说是一个心理测验的准确性。效度的性质效度具有相对性:评鉴测验的效度时,必须考虑其目的与功能。效度是测验的随机误差和系统误差的综合反映。判断一个测验是否有效要从多方面搜集证据第一单元效度的概念效度测量学定义在一组测量中,与测量目标有关的真实方差(有效方差)与总方差的比率。SX2=ST2+

SE2=

SV2+SI2+

SE2SE2

:随机误差方差,

SI2

:无关而稳定的方差(系统误差);

ST2

:真分数方差,SV2

:有效方差。

rXY2=SV2/SX2

rXY代表测量的效度系数

SV2

SI2

SE2

ST2

SX2

信度和效度的关系注:SX2=ST2+

SE2ST2=

SV2+SI2SE2

:随机误差方差,

SI2

:无关而稳定的方差(系统误差);

ST2

:真分数方差,SV2

:有效方差。

信度:rXX=ST2/SX2,效度:rXY2=SV2/SX2第一单元效度的概念信度和效度的关系信度是效度的必要而非充分条件。效度是信度的充分条件。效度高,信度肯定高;但信度高,效度不一定高。效度是受信度制约的。rXY2=SV2/SX2=ST2-SI2/SX2=

rXX-SI2/SX2

∵SI2/SX2≥0

∴rXY2≤

rXX一个测验的效度不会超过它的信度的平方根,即测验与外在效标的相关,不会超过与它自身相关的平方和。效度与信度的关系第二单元效度评估的方法一、内容效度(逻辑效度)什么是内容效度是指测量中的项目在多大程度上包含了欲测的内容范围。常用推理判断而非定量的方法确定。测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。编制测验过程对测量的心理特征有个明确的概念;测验题目应是多界定的内容范围的代表性样本;分测验内部同质,分测验之间不要求同质。第二单元效度评估的方法内容效度的评估方法专家判断法:三个步骤定义好测验内容的总体范围编制双向细目表制定评估量表来测验测验的整个效度。统计分析法计算两个评分者之间评定的一致性,及评分者信度。克伦巴赫:同一组被试在独立取自同样内容范围的两个测验复本上得分之相关来作估计。再测法:先前测,再让被试学习新的知识或参与某种训练,然后再测。如果成绩提高,效度高。经验推测法对一个内容领域的详细描述要测量的领域:在一个标准的七年级课程中涵盖的世界历史知识。在这个领域中包括的区域:

A、问题1、社会的2、政治的3、文化的

B、区域1、欧洲2、美国3、非洲和亚洲

C、时间范围1、18世纪2、19世纪涵盖区域的相对重要性

社会的政治的文化的欧洲18世纪19世纪5%5%10%8%3%2%美国18世纪19世纪6%9%17%13%2%5%非洲和亚洲18世纪19世纪2%6%0%5%0%2%100%第二单元效度评估的方法内容效度的特征不是普遍适用的,测验分析者和使用者定义的内容范围相同,才有意义;有时间上的特定性;与表面效度的区别内容效度:由专家详尽地、系统地对测验作评价而建立的,要考虑题目与测量目地和内容总体之间的逻辑关系。表面效度:测验表面上看来好像是测量所要测的东西,只考虑了题目与测量目标之间的明显的、直接的关系。表面效度关注的是参试着感知到一个测验的吸引力和适用性如何。评估内容效度对内容效度不存在精确地、统计上的测量。代表的是对一个测验提供的一个特定内容领域样本的充分程度的判断。对内容效度的判断既不是最终的也不是绝对的。测验显示出各种水平的内容效度,而专家对它们的判断不是总能达成一致。对内容领域的界限和结构提供的细节越多,对它的判断就可以越自信。一个测验为某个特定的领域提供具有代表性的样本保证测量的有效且精确。第二单元效度评估的方法二、构想效度(结构效度)什么是构想效度是指测验对某种理论构想或特质所能体现测量的程度。即理论构想是否能真实反应实际状况。建立构想效度的过程:从某一构想的理论出发,提出关于某一心理特质的假设;设计和编制测验并进行施测;采用相关或因素分析等实证研究的方法进行分析,验证与理论假设的符合程度。第二单元效度评估的方法构想效度的估计方法对测验本身的分析内容效度可作为构想效度的证据;内部一致性指标(如分半信度、α系数、KR20等)可以推断测验是测量单一特质还是测量多种特质,为评估构想效度提供证据;分析被试对题目的反应特点也可以作为构想效度的证据。班杜拉的自我效能感的四种来源:成功的表现、替代经历、口头劝说和情感激励——内容效度;测验问题确实反映了自我效能感来源的四个方面——构想效度;第二单元效度评估的方法构想效度的估计方法测验间的相互作用相容效度(聚合效度):一个测验与测量相同特质的其他高效度测验相关的程度。(高相关)同时效度(校标关联效度的一种):提供了测验与校标有高相关的依据,而不是另一个测验。校标,是对行为主观或客观的测量,如工作表现评定、课程成绩和面试结果。区分效度:一个测验与其他不同特质的测验相区分的程度。(低相关)因素分析:求量表各项目之因素结构矩阵,再由结构矩阵所表列之因素负荷量大小来判定建构效度好坏。多特质多方法矩阵(HLM)第二单元效度评估的方法构想效度的估计方法校标效度的研究证明理想的校标的性质和种类可以作为分析测验构想效度的指标。根据发展变化特点来验证构想效度。仅限于发展变化特点的理论构想。实验法和观察法证实如果潜在的理论预测一些处理和训练将会增加或减少心理构想,前测分数和后测分数之间的显著差别为构想效度提供了证据。第二单元效度评估的方法三、校标效度(实证效度、关联效度)什么是校标效度反映的是测验预测个体在某种情境下行为表现的有效性程度。校标:被预测的行为是检验效度的标准。常用的有:学业成绩、行为的等级评定、临床诊断、实际工作表现、先前有效的测验、团体对照等。根据测验目的分类:同时效度:测验分数与校标同时验证;建立了提供现在的独立事件或者行为的信息的测验(诊断现状的测验)预测效度:校标资料需一段时间之后才能搜集到。建立了提供未来事件信息的测验(预测将来)。校标效度(实证效度)两种形式:同时效度:反映测验能在什么程度上取代效标。

例:以“口袋中零用钱”(属测量工具)衡量受访者的“所得”(属效标)高低,假如两者相关很高,则“同时效度”高。又如:心理测验、星座、血型、行为之人格分析

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论