




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章教育测验
教育测验概述
测验的信度
测验效度
测验的难度和区分度
第一节教育测验概述一、教育测验分类(一)、按行为目标和测验内容分
1、智力测验智力测验是用来测人的智力水平高低的。
智力测验的目的是为了区别人的智力差异,预测人的发展趋势以便选拔人才,或诊断学生智力发展情况,以便因材施教,提高学习效果。智力测验的结果用智商(IQ)来表示。
IQ=智力年龄/实际年龄×100。
例如5岁儿童智龄为6岁,则其智商IQ=6/5x100=120
著名的智力测验有比奈——西蒙测验、韦克斯勒智力测验、瑞文渐进推理测验、考夫曼儿童成套评估测验。(1)、比奈—西蒙智力测验中国修订版
此量表是比奈——西蒙智力测验传入我国后经三次修订而成的,适用于2—18岁被试。测验共51个题目,依难度顺序排列,每岁三个题目。
操作要点:首先根据被试的实际年龄从测验指导书的附表中查到测验的起点题,然后按指导书的测验程序和要求进行测验。每通过一题记一分,连续五题不通过即停止测验。最后根据被试答对题目的分数,加上承认他能通过的题目的分数(补加分),得到测验总分,从指导书的智商表中查出该被试者的智商。(2)、韦克斯勒智力量表
韦氏量表分为幼儿、儿童和成人3种,分别适用于4—6.5岁、6—16岁、16—74岁被试。量表包括言语和操作两部分。实施测验时言语和操作分测验交替进行。以韦氏儿童智力量表为例。
言语量表操作量表
①常识(30项)②图画补缺(26项)
③类同(17项)④图片排列(13项)⑤算术(9项)⑥积木图案(11项)⑦词汇(32项)⑧物体拼图(4项)⑨理解(17项)⑩译码A(45项,用于8岁以下)⑾背数⑿迷津韦克斯勒儿童智力量表1、常识该分测验共有30道题,包括被试日常生活中常见的内容。如:狗有几条腿?[4条]2、填图该分测验有26张图片,每张图片上的图形都缺少了一个主要部分,要求被试说出或指出图中缺少的这个部分。如:图形是只狐狸,但缺少耳朵。每张图观察时限20秒,测验主要考察被试的观察能力。
3、类同该分测验有17对配对的名词要求被试概括出二者共同之处,如轮子和球相象的地方在哪里?测验主要考察被试的抽象概括能力。
4、图片排列
该分测验有几组图片,每组图片3—5张不等,均按统一打乱的顺序呈现给被试,要求被试在一定的时间内对图片进行正确的排列。如量体重:有3张图片,打乱顺序摆在儿童面前,主试说:“这些图片是关于一个人在磅秤上量体重的故事,现在图片的顺序是错误的,看看你会不会把它们按正确的顺序排好,使它们成为一个有意义的故事。”
5、算术
该分测验共有19道算术题,被试不能用铅笔和纸演算。如主试说:“如果我把一个苹果切成两半,我有几块苹果?”[时限:30秒,答案:2]测验主要考察被试的推理能力。
6、积木
该分测验要求被试按给定图案拼搭11个图形,有时间限制,完成得快还可以加分。材料为9块正方形积木,每一块是两面红色,两面白色,另两面按对角线分成红白两色,另外图案卡片11张。7、词汇
该分测验要求对32个按难易程度排列的词作出解释。材料为32张词汇小卡片,每张上分别写着一个词,主试按词汇的顺序对每个词提问,如:“什么是勇敢?”或“勇敢是什么意思?”
8、拼图
该分测验材料有4套图象组合拼版,要求被试将其组合成一物体,如:主试按规定摆好拼版的部件并呈现给被试,然后说:“这些块块可以拼成一匹马,你尽快地把它们拼在一起”[时限:150秒,速度快可加分。]
9、理解
该分测验要求被试回答17道有关社会规则方面的问题,如“如果你把小朋友的排球丢了,你应该怎么办?”[赔偿损失]
10、理解
该分测验要求被试按图例的样子分别给图形加符号或数字,材料为测验纸和红铅笔。如主试说:“看这儿,你看到一颗星、一个圆球,一个三角和其他东西。看,星星当中有一道从上到下的线;圆球里面有两道横线;三角上有一道横线;十字形当中有一个圆;方块里面有两条直线。现在在下面,这儿有圆球、星星、方块和其他东西,掺杂在一起,但它们没有任何符号。我要你用上面的同样符号填在这些图形里。”[测验时限:120秒]
11、背数
为备用测验,当语言测验失效时使用。分顺背和倒背两部分。12、迷津
为备用测验。该分测验共有9个从易到难的迷津。
2、能力倾向测验。
测被试潜在的某种能力,以了解其发展的可能性,如音乐、美术、体育、创造力、想象力、记忆力等方面的才能的测验。3、成就测验
测被试经过某种形式的学习后对知识、技能的掌握或熟练程度。依测验内容、编制程序及测验目的等的不同,可以分为不同种类。按测量科目的多少不同成套成就测验单科成就测验按测验编制程序不同标准化成就测验教师自编测验按测验目的的不同预测性测验诊断性测验按解释时的参照标准不同
常模参照测验
标准参照测验(1)、标准化成就测验至今还没有一个公认的确切定义。一般地说,如果某次考试从确定考试目的和进行考试设计,到编制试卷、实施考试、阅卷评分和对分数的处理解释等全过程都严格执行统一的标准,这样的考试就可以称为标准化成就测验。
①、编制试卷科学化
②、实施考试统一化
③、阅卷评分公正化④、分数解释合理化
(2)、教师自编测验①、制定考试计划确定考试目的,即为什么要考试。分析考试目标,即明确考哪些东西。设计考试蓝图,绘制双向细目表。
②、编写试题选择试题类型。两大类型:客观性试题,主观性试题。试题编写。审查试题,编写试卷。编写标准答案,决定计分方法。目标比例内容
识记理解应用综合运用合计第一章7108025第二章3710525第三章711121040第四章320510合计203030201004、个性人格测验
是用心理测验方法对人的个性进行的测验,即测量一个人在一定情境下,经常表现出来的典型行为与情感反应。较为著名的有明尼苏达多相个性测验、卡特尔16项人格因素测验、罗夏墨迹测验等。①、明尼苏达多相个性测验
这项测验是由美国明尼苏达大学的哈萨维和麦肯利教授编制的,是目前应用最广的人格测验。适用于16岁以上的成年人,要求被试有小学以上文化水平。已由中科院心理所宋维真等同志引进修订。
该量表共有566个题目(有16个为重复题目,实际上是550题)。题目的内容非常广泛,包括健康状况,精神状态,对婚姻、家庭、宗教、社会、政治、法律等问题的态度。明尼苏达多相个性测验包括10个临床量表和4个效度量表。10个临床量表分别是:疑病、抑郁、癔病、精神变态、男子气——女子气、妄想狂、精神衰弱、精神分裂、轻躁狂、社会内向,这10个量表所得分数代表10种人格特质。4个效度量表主要是考察被试在测验是有无粗心、不明题意、掩饰、反应定势等现象,参加测验时的态度如何。这些量表分数出现异常,表示测验的效度值得怀疑。这4个量表是:疑问量表、说谎量表、诈病量表、校正量表。②、卡特尔16项人格因素测验
由美国伊利诺州立大学卡特尔教授编制的,适用于16岁以上的成人。已由台湾学者刘永和做了修订。
该量表现有5个复本,其中A、B本为全版本,各有187个题目;C、D本为缩减本,各有106个题目;E本适用于文化水平较低的被试,有128个题目。卡特尔16项人格因素测验的16种人格特质分别是:乐群性、聪慧性、稳定性、恃强性、兴奋性、有恒性、敢为性、敏感性、怀疑性、幻想性、世故性、忧虑性、实验性、独立性、自律性、紧张性。③、罗夏墨迹测验
是由瑞士精神病学家罗夏首创的。罗夏墨迹测验由十张墨汁图构成。施测方法分自由联想和询问两阶段。
(二)、按测验方式分1、个别测验2、团体测验(三)、按测验材料分1、语言、文字测验2、非语言、文字测验(操作测验)(四)、按测验的参照系分
1、常模参照测验2、目标参照测验
(五)、按测验的标准化程度分1、标准化测验2、非标准化测验二、教育测验的要求
1、保证测验的信度
2、提高测验的效度
3、把握试题的难度、区分度
第二节测验的信度一、信度的定义
信度指测验结果的可靠性和稳定性,即同一个测验对同一组被试先后实施两次,所得测量的一致性程度。
信度实际上就是对测验误差大小的一种描述。一般来说,误差越小,信度越大;误差越大,信度越小。X=T+EX表示实测值,T表示真值,E表示误差。
信度指两次重复测量或等值测量之间的关联程度。
如果对同一对象进行两次重复测量或者等值测量后,计算两次测量的相关系数,相关系数越高,说明测量的信度就越高;反之,就越低。对于信度的这种理解,有利于信度的计算。二、信度的种类
(一)、重测信度
用同一种测验对同一组被试实施两次或更多次的测验,前后两次或多次测验分数的相关系数即为重测信度。估计重测信度的基本程序是:测验A1----(适当时距)A2。使用重测法要注意几点:(1)、重测法只适用于速度测验而不适用于难度测验;(2)、所测的信度大小,常常受两次测验时间间隔长短影响;(3)、第二次测验没有吸引力,不易引起学生的兴趣;
(4)、要实施两次,耗费人力、物力和时间较多。
10名考生两次测验的得分情况测验
考生平均分标准差12345678910X17885636887927573817277.58.54X27279686983907968826175.19.53(二)、复本信度
当同测验的一种型式不能或不适合实施两次时,就需要采用该测验的另一个平行型测验或者复本。其基本程序为:测验A1————(最短时距)测验B1采用复本法估计信度系数要注意:(1)两次测验试卷要等值,即在内容范围、题型、题数、难度、区分度等方面要基本相同;(2)、两次测验要尽可能在较短的时距内进行;
(3)、确定两次测验是否等值,还要考察两次测验结果的平均数与标准差。
A、B两型测验的得分情况
考生平均分标准差
12345678910
A8879678376989162708777.510.85
B8372768083889071698579.706.90(三)、分半信度
这种方法是将一个测验中的题目按编号分成两半,例如一半为奇数题,另一半为偶数题,分别计算出每个被试两部分的得分。然后计算这两部分的相关系数。最后用斯皮尔曼---布郎公式校正,求得整个测验的信度系数。rxx=2r/1+2r
10个学生在奇数题和偶数题的得分被试编号01020304050607080910奇数题得分38373841403638394035偶数题得分37373639393438393936三、提高信度的方法(一)、信度系数以多大为宜
对于学科测验,信度系数要求达到0.9以上,智力测验要求达到0.8以上,品德测验能达到0.6以上就算不错了。
(二)、测量误差的来源
1、测验本身引起的误差2、测验的实施所引起的误差3、被试所引起的误差(三)、提高测验信度的方法1、适当增加测验长度2、测验的难度要适中
3、测验的内容应尽量同质
4、测验的时间要充分
5、测验的实施和评分方法应统一和客观。
第三节测验效度一、效度的概念
1、效度是指测量结果的准确性和有效性的程度,即一个测验能够测量出其所要测量的东西的程度。2、信度和效度(1)、一个测验的效度首先取决于测验的目的和测验工具的匹配程度。(2)、一个测验可以有很高的信度,而效度却很低;但如果信度低,则效度一定低。
二、效度的类型(一)、内容效度指测验题目对所要测的内容的覆盖程度,即测验题目对有关内容或行为范围取样的适当性和代表性。内容效度主要用于成就测验,内容效度的值常由该领域的专家判定。估计内容效度的方法:用测验题目与教材内容比较的方法。
需要先制定两个表。一个是测验的双向细目表,表的顶端横行列出了应测量的教学目标。表的左断列出了要测量的教学内容。第二个表是测验试题分类表。
小学二年级语文综合水平检测双向细目表(二)、效标关联效度是指一个测验与选定的效标的相关系数。例如,一个初中毕业班英语教师出了一份模拟试题进行测验,对于该测验,学生升高中的英语统考成绩就可以作为一个效标。如果两者相关高,则模拟测验的效度高。三、提高效度的方法1、提高测验的信度。
2、精心编制测验3、选择好的效标
第四节测验的难度和区分度一、难度(一)、难度的定义和计算1、难度是指题目的难易程度。2、难度的计算(1)、客观题的难度计算P=R/NP代表试题难度,R为答对试题的人数,N代表参加测验的总人数。
例如,100人参加测验,某题有60人答对,则此题的难度为:P=R/N=60/100=0.6。此题通过率60%,难度适中。(2)、主观题的难度计算
P=X/WP表示试题的难度,X为被试在该题上的平均得分,W为该题的满分值。
例如,某道论述题满分为12分,所有考生在这道题上的平均得分为3.6分,则此题的难度为:P=X/W=3.6/12=0.3(此题偏难)。(3)、测验的平均难度公式计算P=∑WiPi/W其中,W是测验的满分值,Wi是各个题目的满分值,Pi是各个题目的难度。例,一份试题经过实测,得到下表的数据各题的满分值和难度题号123456789满分33420510152515难度0.500.550.300.400.700.600.700.600.60(二)、难度对测验的影响
1、测验难度影响测验分数的分布形态
2、测验难度影响测验分数的离散程度3、测验难度影响测验的鉴别能力(三)、测验的适宜难度难度值P的取值范围为:0≦P≦1,当P=0时,试题的实际困难程度最大(所有考生得0分),当P=1时,试题的实际难度最小(所有考生全答对)。
在常模参照性测验中要求试题难度适中,即大多数题目的难度在0.3—0.7之间,少数题目可在这一范围之两边且题数(或题分)大体相当,使整个试卷的平均难度为0.5左右(0.45—0.55之间)。只有适中的题目难度,才能使试题产生区分不同程度考生的最大效果,也才能使考生得分呈正态分布。
对于其他类型的测验,目的不同对难度的要求也不同。比如,选拔奥林匹克数学竞赛的学生,难度值就得偏小;而选择补习功课的学生,难度值就得偏大。(四)、控制题目难度的基本方法(1)、考查知识点的多少;(2)、考查能力的复杂程度或层次高低;(3)、考生对题目的熟悉程度(4)、命题的技巧性二、区分度(一)、区分度的概念区分度是指测验对考生实际水平的区分程度,用符号D表示。区分分为正区分(D>0)、零区分(D=0)和负区分(D<0),正区分又称积极区分,负区分又称消极区分。
区分度高的试题,可以准确地鉴别学生的实际水平,使不同水平的学生的考试成绩落在不同的分数段上,分成多样层次,学习好的学生得分高,学习差的学生得分低.
区分度低的试题,难以鉴别学生的学习水平,往往不同水平的学生的考试成绩落在同一分数段上,显示不出学生之间的明显差异。(二)、区分度的计算用被试在某个题目上的得分与被试的测验总分的相关系数作为该题目的区分度。
计算区分度的方法通常包括求鉴别指数D和点二列相关系数等。D=PH—PLD为该试题的鉴别指数,PH和PL分别为高分组和低分组的通过人数的比率。
例:某题高分组的通过率为0.73,低分组的通过率为0.25,那么,该题的区分度为D=0.73-0.25=0.48(三)、提高区分度的方法
1、使题目的难度适中,使整个考试难度适中区分度的最大值与难度的关系难度(P)1.000.900.700.500.300.100.00区分度的最大值0.000.200.601.000.600.200.002、着重考察复杂的学习结果(四)、区分度的评价标准区分度评价
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025房地产销售合同范本2
- 2025民宿客栈装修合同模板
- 2025新入职员工试用期合同协议
- 企业融资合同模板
- 运输及仓储合同范例二零二五年
- 二零二五常用房屋租赁合同模板
- 租房退房协议书
- 业务员合作合同二零二五年
- 2025型材供应商采购合同
- 2025商业广场绿化养护合同
- 专题03全等模型-手拉手模型(原卷版+解析)
- 售后文员的工作职责模版(2篇)
- 沿街商铺、合用场所消防安全培训课件
- 静脉炎的预防及处理-李媛
- 2024年湖北省中考语文真题(学生版+解析版)
- 2024旋翼无人机巡检作业规范
- (部编版)统编版小学语文教材目录(一至六年级上册下册齐全)
- 允许孩子犯错课件
- 二年级上册音乐教案 第五单元 邮递马车苏少版
- 港口与船舶协同运营优化
- 苏州工业园区应急管理系统招聘笔试真题2023
评论
0/150
提交评论