




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
心理测量
第五章学业成就测验CONTENTS目录学业成就测验概述综合学业成就测验单科学业成就测验标准化成就测验的现状和发展趋势1234PART01第一节学业成就测验概述01第一节学业成就测验概述一、成就测验的起源、含义和种类成就测验一词最早可能出现于20世纪20年代。1923年,美国斯坦福大学的推孟及其同事首次编制并出版了具有标准化测验特征的斯坦福成就测验(Stanfordachievementtest,简称SAT),适用对象是一到九年级的学生,测试内容有阅读、听力、拼写,数学,科学,社会科学和环境等不同学科(Robert,2007;John&James,1998)。随着SAT的广泛应用,其影响力随之扩大,成就测验一词也很快深入人心,并广为接受。到今天,尽管学界关于成就测验的描述不尽相同,但普遍认为成就测验是针对知识和技能的测验。可以认为成就测验是测量学生或者受试者对某学科或某组学科,或者经过学习或者训练之后所获得的知识和技能的测验。其类别分为教育成就测验和职业成就测验。第一节学业成就测验概述二、成就测验与教育测验教育测验特征是以学业成绩为主要测量目标,依科目的不同可分为阅读测验、算术测验、史地测验等(陈选善,1947)至于成就测验与教育测验的关系,可以认为,成就测验一词最初是心理和教育测量学家对教育测验的另一诠释,主要是为了与智力测验等能力及倾向测验相区别。早期的成就测验主要以学科知识和技能为测量内容,故成就测验在测量界一度就是教育测验的代名词。随着成就测验应用领域的扩展,成就测验至少可以分成教育成就测验和职业成就测验两大类;同时由于更多类型的测验,比如能力、能力倾向、态度等测验应用于教育背景,教育测验的范围亦大大扩展,成就测验与教育测验不再完全重合,而是彼此区别又相互交融,其交融的部分就是教育成就测验或者学业成就测验(academicachievementtest)。第一节学业成就测验概述三、标准化成就测验(一)标准化成就测验的意义、分类和功用1.标准化成就测验的意义所谓标准化成就测验(standardizedachievementtest),就是通常由编制测验的专业人员根据测验原理和具体的教学目标编制而成,旨在测量受测者学习某学科或某组学科之后,或者参加训练后所获得的知识和技能,为评价教育目标实现的程度、衡量学生学习的状况提供依据的测验(John&James,1998)。第一节学业成就测验概述三、标准化成就测验2.标准化成就测验的分类(1)根据内容所涉及学科的多少可以把标准化成就测验分成单科成就测验和综合成就测验。(2)根据内容是否具有特殊性和缜密性分为诊断性成就测验和非诊断性成就测验。(3)根据同时参加测验的受测人员的多寡把标准化成就测验分为个别测验和团体测验。(4)根据测验结果解释的参照的不同,成就测验还可以分为常模参照成就测验和标准参照成就测验。第一节学业成就测验概述三、标准化成就测验3.标准化成就测验的功用根据萨尔维亚(JohnSalvia)和耶塞尔代克(JamesE.Yesseldyke,1998)的观点,标准化成就测验的功能大致如下。(1)筛选和鉴定。这可能是大多数成就测验的主要目的。(2)诊断。经过筛选测验鉴别出来的学生,需要用诊断测验进一步评价,以确定个体具体所需的教育干预措施。(3)权利判定(entitlementdecision)。(4)进展评估。即对照国家标准来评估不同年级水平的学生所取得学业进展的程度。第一节学业成就测验概述三、标准化成就测验(二)标准化成就测验与能力测验的区别与联系1.区别一般认为,成就测验与能力测验(包括能力倾向测验和智力测验在内)的主要区别在于测量内容所依据的经验有所不同。2.联系一方面,成就和能力这两个构念本身并非完全独立,而是彼此联系,相互影响。另一方面,成就测验和能力测验归根到底测量的都是个体的行为表现,多多少少都要受到已有的学习和生活经验的影响。PART02第二节综合学业成就测验02一、斯坦福成就测验系列(一)分测验简介音和字母(soundsandletters),单词学习技能(wordsstudyskills),单词阅读(wordreading),句子阅读(sentencereading),阅读词汇(readingvocabulary),阅读理解(readingcomprehension),听力理解(listeningcomprehension),语言(language),学习技能(studyskills),拼写(spelling),数学(mathematics),科学(science),社会科学(socialscience),环境(environment)第二节综合学业成就测验(二)测验分数和解释整个测验系列提供了多种转换分数:九级记分,年级当量,百分位数,以及各种标准分数。一、斯坦福成就测验系列(三)常模、信度和效度1.常模1995年,斯坦福成就测验系列同时制定了秋季和春季常模。根据多个变量(地区、社会经济地位,社区性质(城市或农村),公立还是私立)来选择样本。约250000个学生参加了测验系列的标准化工作。2.信度提供SESAT、SAT、TASK每个水平的KR20,KR21内在一致性系数和复本系数。3.
效度内容效度:题目经过学科专家组审核,保证了内容准确度;题目经过测量专家的检验和修订,编者再次对题目表达的清晰度做了检查。经验效度:题目的难度随年级水平的提高而增加;与系列测验的第8版具有中度到高度的相关;与斯坦福各分测验存在交互相关。第二节综合学业成就测验二、加利福尼亚成就测验(一)CAT/5的组成全套测验由三大领域组成:阅读/语言文科(reading/languagearts)、数学(mathematics)和补充内容(supplementarycontentarea)。(二)分数、常模和信效度1.三套分数:CAT/5能提供常模参照分数、标准参照分数和预期分数。2.三套常模:CAT/5测验在1991年的1月(冬季)、4月(春季)和10月(秋季)进行了三次标准化,相应提供冬季、春季和秋季三套常模。3.信度和效度信度:提供了每个分测验的KR21内在一致性估计值。
效度:作者努力加强了内容效度,并在编制题目时尽量排除了文化偏差;描述了随着年龄的增加,学生掌握的目标也随之提高;汇报了测验与其他测验的相关。第二节综合学业成就测验三、河畔2000评价系列(一)衣阿华基础技能测验(ITBS)
ITBS诞生于1935年,是最早为每个年级提供测验水平信息的成套成就测验,由美国衣阿华大学的林奎斯特(E.F.Lindquist)教授与其同事编制而成。1996年版由胡佛(Hoover)、耶罗尼米斯(Hieronymus)、福瑞斯比(Frisbie)和邓巴(Dunbar)编制。该测验的目的在于提供学生个体是否具备学校学科学习基本技能的信息,用以制定班级普通教学指导计划、个人指导计划、监控个体进程、课程评估以及为家长提供报告。ITBS有三种形式:K和L(1994出版),M(1996出版)。M是K和L的最新常模版。第二节综合学业成就测验三、河畔2000评价系列(二)成就和熟练度测验(TAP)
成就和熟练度测验(TAP)最早于1992年推出,1995年更新了常模,包括成套完整测验和成套调查测验。成套完整测验的施测时间需要4小时,成套调查测验只需要1小时40分钟。TAP有5个目的:鉴别学生个体和班级在技能发展上的优势和弱点;监控学生的进展;决定学生应该选学哪些初中课程;为向家长汇报提供基础;项目和课程评估。第二节综合学业成就测验(三)衣阿华教育发展测验(ITED)
ITED由费尔特(Feldt)、福赛斯(Forsyth)、安斯利(Ansley)和阿尔诺(Alnot)于1996编制,属于常模参照和标准参照测验。包括两种格式:成套完整测验和成套调查测验。完整成套测验需要3小时55分钟。ITED主要有3个目的:评价学生完成中等(secondary)教育主要目标的能力;监控学生的进程;评估课程/方案。成套完整测验的各分测验简介如下。三、河畔2000评价系列(四)河畔2000评价系列的分数、常模和信、效度三套测验提供6种分数:原始分,发展标准分数,年级当量,全美百分位等级,全美标准九,全美曲线当量。
常模方面,河畔2000评价系列于1992年进行了标准化,精心抽取了全美170000名学生,1996年更新了常模。信度和效度方面,河畔2000评价系列只报告了内在一致性信度。第二节综合学业成就测验四、大城市成就测验(一)分测验单词识别(wordrecognition),阅读词汇(readingvocabulary)阅读理解(readingcomprehension),前阅读(prereading),数学(mathematics),语言(language)写作前的构思/作文/编辑(prewriting/composing/editing),概念和问题解决(conceptsandproblemsolving),程序(procedures),科学,社会研究,研究技能/思考技能(researchskills/thinkingskills)(二)分数可以得到各分测验的原始分数和数种导出分数。导出分数包括量表分数,百分等级,年级当量,常态曲线当量,阅读功能水平,内容分组成绩类别,熟练能力确认(,以及对学术潜能测验和美国大学测验成绩范围的预期。第二节综合学业成就测验四、大城市成就测验(三)常模、信度和效度常模:MAT7在1992年春季和秋季进行了标准化。春季标准化包括300个学校的100000学生,秋季标准化则有79000名学生。根据地区、社会经济状态(socioeconomicstatus,简称SES)、社区类别(城市或农村)和种族特点进行统计加权抽样。信度:提供了复本信度和KR20.、KR21等信度证据,大多数的信度系数都超过了0.8。说明测验足以用来进行团体报告和筛选,但研究者认为不适合用来做个体决策。效度:在编制测验时,作者在加强内容效度方面做了一些工作,包括参考学校课程、邀请不同种族的人修改题目;结构效度提供了测验(分数)在跨等级/水平上出现了增长的趋势,测题能区分出不同的年级水平。第二节综合学业成就测验PART03第三节单科学业成就测验03一、伍德科克掌握阅读测验(一)测验组成
WRMTR有6个分测验,包括视觉听觉学习、字母辨认,词语辨认、拼读单词、词语理解、段落理解。(二)分数、常模和信效度
WRMTR提供三种精确性不同的解释,解释信息分为四种水平,共计9种导出分数。其中,四种水平的信息包括:分析被试错答的每一个题目;描述被试的年级当量和年龄当量;通过相对表现指数、差异分数等描述学生表现的特点和质量;汇报学生在团体中的百分等级或标准分数。导出分数有的很复杂,比如由拉希标度得来的W分数,也有简单的原始分数,以及相对表现指数、教学区间、年龄当量、年级当量、百分等级和标准分数等。第三节单科学业成就测验二、斯坦福阅读诊断测验(一)测验组成
语音分析(phoneticanalysis):考查学生字母和词段与用元音和辅音联系起来的技能。
词汇(vocabulary):测量听词汇、辨别同义词和词语归类的技能。理解(comprehension):从初步理解、解释、批判性分析、阅读技巧四个方面来测量理解。快速查阅(scanning):测量学生快速阅读课文、获取重要信息的技能。此外,SDRT4还提供三套非正式的测评工具:一份阅读策略调查,一份阅读态度、兴趣等方面的问卷和一份故事复述量表。第三节单科学业成就测验二、斯坦福阅读诊断测验(二)分数、常模和信效度同时提供常模参照和标准参照两种结果解释。根据测验使用的目的,SDRT4可提供6种分数:各分测验的原始分数、进步指标、百分等级、标准九、年级当量以及量表分。
常模样组的建立采用了分层随机抽样技术,考虑了社会经济地位、城市性、种族和地理区域等,于1994年秋季到1995年春季进行了标准化,共计400个学校参与,标准化样组包含60000名学生。信度方面,SDRT4各个水平测验(包括部分水平的平行形式)几乎均超过了0.8,有一个测验的内在一致性系数为0.79,平行测验之间的稳定等值系数在0.62到0.88之间。效度方面,提供了内容效度和准则关联效度证据。第三节单科学业成就测验三、关键数学测验修订版(一)测验组成
KeyMathR把整个数学表现分为基础概念、运算和应用三个部分。基础概念部分包括计数,有理数和几何等三个分测验。运算部分包括加法、减法、乘法、除法、心算等五个分测验。应用部分包括测量、时间和金钱、估计、数据解释、问题解决等五个分测验。每个分测验又包含3—4个子领域。例如,实数分测验包括分数、小数和百分位数三个子领域。(二)分数、常模和信效度KeyMathR为测验总体表现和三个部分表现提供了6种导出分数,分别是标准分、正态曲线当量、标准九、百分等级、年龄当量和年级当量。KeyMathR采取分层抽样的方法在全美范围内进行了标准化。KeyMathR提供的信度证据比较充分。效度方面,没有提供明确的结构效度证据,仅给出了各年级逐渐提高的均分;内容效度证据是用于编制测题的指导细则表。第三节单科学业成就测验四、斯坦福数学诊断测验(一)测验组成测验考查概念与应用、计算两大领域的技能。(二)分数、常模和信效度
SDMT4同时提供常模参照解释和标准参照解释,因此既能对学生与其他学生进行比较,也能具体指出学生在数学技能上的强弱之处。与SDRT4相似,SDMT4也提供6种分数,即各个分测验的原始分数、进步指标、百分位数、标准九、年级当量和量表分数。制定常模之前,研究者对来自32个州的27000名学生试用了大约3000道题目,并做了题目筛检。
SDMT4的信度证据充分,提供了各分测验以及全量表在不同水平上的内在一致性系数、复本信度以及评分者信度。效度方面,SDMT4提供了内容效度、准则关联效度和结构效度证据。第三节单科学业成就测验PART04第四节标准化成就测验的现状和发展趋势04一、国外标准化成就测验发展现状和趋势(一)国外标准化成就测验的发展现状
以美国为代表的西方国家,标准成就测验发展到今天已经相当成熟,不仅种类齐全、数量众多,而且应用广泛,产生了极大的社会影响。1.测验数量巨大和种类齐全2.测验内容领域广泛而深入3.测验编制严密、质量优良4.测验应用广泛、相关研究多、社会影响大5.标准化成就测验的不足第四节标准化成就测验的现状和发展趋势一、国外标准化成就测验发展现状和趋势(二)国外标准化成就测验的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 职业生涯中的保安证考试试题及答案
- 南方医科大学《市场营销专业英语》2023-2024学年第二学期期末试卷
- 广州现代信息工程职业技术学院《剪辑与特效》2023-2024学年第二学期期末试卷
- 整合资源保安证考试试题及答案
- 河南省鹤壁市淇滨高级中学2025年高三4月诊断考试英语试题试卷含解析
- 湖南省株洲市攸县第四中学2024-2025学年高三下学期防疫期间“停课不停学”网上周考(二)数学试题含解析
- 2024-2025学年甘肃省兰化一中高三下学期期末目标检测试题英语试题含解析
- 苏州大学应用技术学院《装饰材料构造与预算》2023-2024学年第二学期期末试卷
- 2025年保安证考试实务试题及答案
- 江苏护理职业学院《民宿设计》2023-2024学年第二学期期末试卷
- 标准预防与隔离技术教学培训课件
- 第七届石油工程设计大赛-单项组地面工程获奖作品
- 《生物质热电联产工程设计规范》
- (高清版)DZT 0276.18-2015 岩石物理力学性质试验规程 第18部分:岩石单轴抗压强度试验
- 中铁快运股份有限公司2024年招聘笔试参考题库附带答案详解
- 《幼儿文学》课程标准
- 护理中的病人隐私保护和信息安全
- 5G及6G通信关键技术研究
- 客诉案列分析报告
- 高校公寓管理总结汇报
- 老人预防保健品诈骗
评论
0/150
提交评论