第七章教育测量标准及其建立_第1页
第七章教育测量标准及其建立_第2页
第七章教育测量标准及其建立_第3页
第七章教育测量标准及其建立_第4页
第七章教育测量标准及其建立_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章 教育测量标准及其建立参照标准的分数参照标准的分数p参照常模的分数是将被试的分数和常模团体测验分数进行比较来的,并且主要以个人在常模团体中所处的相对位置来确定。p参照标准的分数不同,一个人的测验成绩不是和其他人比较,而是和某种特定的标准比较。它关心的是一个人是否达到某种标准,它反映的是一个人的行为水平或成就水平如何。p标准参照分数可分为和。(一)(一) 内容参照分数内容参照分数p内容参照分数主要依据被试对某个确定的材料内容或技能的掌握和熟悉程度来确定的。p使用内容参照分数,关键是要预先制定一个能判定被试是否已掌握某种内容或熟练程度的标准,这种标准主要有:p1. 掌握分数n最简便的方法是订

2、出一个判别被试是否通过或掌握某种内容的最低分数线,即最低标准水平。在此分数以上,表明被试已达到掌握或熟练的水平;在此分数以下,表明被试没有达到掌握或熟练的水平。n如何确定这个水平?通常是选择有80%到90%的人通过的那一水平。n如:考查科分合格与不合格两级。p2.正确百分数n正确百分数指被试在测验中答对题目的百分比。n这一指标更为常用,因为它能更好地反映被试对所测内容的掌握或熟练程度。n采用这一指标解释测验分数时必须注意测题应该确是该目标范围的代表性的取样,否则答对多少题并不反映对该目标的掌握程度。 p3. 内容标准分数n内容标准分数是把内容分数与常模分数结合起来使用。n编制内容标准量表时,不

3、但要明确界定内容、范围,还要详细说明每一种水平的“典型”人物正确回答和不正确回答的问题的类型。这样,将一个人的测验分数与此种量表对照,便既能指出他正确反应的百分比,又能指出他的成绩达到了哪种人的水平以及他能解决哪一类问题。n 如:智力年龄p4.等级评定量表 n在某些情况下,我们感兴趣的不是人们是否掌握了某种知识,而是一个人完成某种过程或生产出某种产品的技能。 n通常我们需要采用等级评定量表来报告一种活动的熟练水平或一种产品的质量。n为了使评定尽可能客观,需要对各种等级定出标准。对每种水平都定出标准样本,并作出详细说明。n如:各种等级考试 p内容参照分数的主要优点是用个人所掌握的知识或技能的水平

4、来描述行为,指出一个人知道什么和能做什么。在大多数情况下,这比知道一个人在团体中的相对位置更有价值。p内容参照分数主要用于成就测验以及能确定出可接受的最低标准的资格测验(如医生或司机的证书考试),对于大多数能力倾向和人格测验来说,由于所测的范围很难确定,因而一般不用内容参照分数。(三)(三)结果参照分数结果参照分数p结果参照又叫效标参照。它是将效标材料直接结合到测验结果的解释过程中。这种分数适合于用测验来作预测的情况。n例如,高考平均分数在80分(各科满分为100分)以上的人,我们可以预测其入大学后的学习成绩将为优等。这里,是用结果来解释测验分数,而不是用常模和内容来解释。p要得到结果参照分数

5、必须有两个前提条件:n需要有效度证据,即测验分数必须与一个重要的效标具有高相关。n要有将测验分数和效标之间的关系结合起来的方法,如转换图表。n例如,如果一个学生在大学入学考试委员会的学术测验(SAT)上得530分,他在一所具体大学的一年级平均成绩处于A、B、C、D、F等类的可能性各是多少?考察预测分数(SAT)对效标成绩(一年级平均成绩)的双变量分布,就能获得这类信息。 n如果把这种双变量分布的每个单元的人数转换成百分比,结果就是期望表。n例:预测分数是第一学期末 “区别能力倾向测验”中的数推理测验(DAT),效标则是第二学期最后一次考试的课程成绩。数据从211名六年级学生中得出。测验分数和效

6、标的相关是0.60。 :(见下表)。表:211名六年级学生DAT数推理测验与数学课程成绩之间的关系DAT分数人 数 数学课程成绩的百分比DCBA30225036592029104921432710197137362439144336147三、三、测验分数的解释测验分数的解释4.3.1 如何看待测验分数的意义4.3.2 如何向受测者报告测验分数 (一)(一) 如何看待测验分数的意义如何看待测验分数的意义p施测者进行测验结果的解释必须:n对所做的测验(包括它的常模的代表性、信度、效度、难度等)要熟悉了解。n对受测者的情况(文化程度、职业、是否可能接触测验中的有关问题等)也要有所了解。n对当时测验的

7、具体情况,例如是否有干扰,受测者当时有无情绪波动或身体不适等情况的了解。n同一个分数可能是由于不同原因造成的,应结合以上三方面的因素对测验分数作出解释。同一分数可作出不同解释。n例如,用具有初中文化程度的标准化样本常模的智力测验来测量一个小学文化程度的受测者,如果测得IQ为85,就可以认为他基本上是中等智力水平;如果受测者原来文化程度是大学毕业,也测得IQ为85,就可解释为受测者可能由于某种原因而使智力有所减退,属于中下水平。p解释测验分数有4种类型:n(1)叙述的解释:指描述个人的心理特征状态。例如,这个学生是一位怎样的学生,聪明的?中等的?或愚笨的?他的语文推理是否优于非语文推理?他喜欢做

8、些什么?有什么样的性格特点?n(2)溯因的解释:指追溯过去以解释个人目前的发展情况。例如,他为什么会这样?他的阅读困难是否是情绪困扰的结果?或缺乏基本的阅读技能?或缺乏学习的兴趣?他拒绝机械的学习活动是否由于父母的压力?或过去的失败?或兴趣太广泛所致?n(3)预测的解释:指推估个人未来的可能发展情形。例如,他上高中的成绩会怎样?他升入大学的可能性有多大?他在理科方面的发展是否比在文科方面的发展更能成功?他是否可能成为一个问题青年?n(4)判断(利评价)的解释:指作价值的判断或做决定。此种解释是依据上述几种解释而作的判断。例如,准许入高中或大学。他应该学习什么样课程。进什么样大学。他应该成为工程

9、师或商务经理。p解释分数的意义应遵循的基本原则n(1)主试应充分了解测验的性质与功能。测验使用者必须具备心理测验的基本知识。使用者在解释之前必须从其编制手册中,详细了解编制过程的标准化及测验的信度、效度、常模等是否适当。更重要的,应知道测验能测量什么,不能测量什么,分数在使用上有何限制。有时两个测验的类型虽然相同,但测量的功能往往不同。p例如,卡特尔测验16PF与明尼苏达多相人格调查表MMPI都是人格测验,但后者更多地发挥临床诊断的功能,前者则更多地针对正常人。n(2)对导致测验结果的原因的解释应慎重,谨防片面极端。p遗传特征、测验前的学习与经验以及测验情境对一个人的测验成绩都会产生影响。所以

10、我们应该把测验分数看成对受测者目前状况的测量,至于他是如何达到这一状况的,则受许多因素的影响。为了能对分数作出有意义的解释,必须将个人在测验前的经历或背景因素考虑在内,比如,在词汇上得到相同的分数,对于大城市的孩子与边远山区的孩子具有不同的意义。 n(3)必须充分估计测验的常模和效度的局限性p 对测验分数作出确切的解释,只有常模资料是不够的,还必须有效度资料。没有效度证据的常模资料,只告诉我们一个人在一个常模团体中的相对等级,不能做预测或更多的解释。在解释分数时人们最常犯的错误就是仅根据测验的标题和常模数据去推论测验分数的意义,而忽略效度的不足或缺乏。假若一个测验的名称是内外向量表,并有可利用

11、的常模资料,那么就很容易把得高分的人说成是内向性格。n(4)解释分数应参考其他有关资料。测验分数不是了解学生的唯一资料,为正确了解其心理特质尚需参考其他有关资料。p 例如,某生智力测验上得到IQ为80,在不考虑其他资料的情况下,只能解释:“某生的智力属于中等偏下”。但是,如果考虑他的在校成绩时,解释可能大不相同,如果他的在校成绩经常保持在年级前五名,则不可能作出如上的解释,可能需要进一步探讨他在做测验时的动机,态度,情绪与健康状况等,有了这些资料作为佐证,才能正确判断其智力是否全部正常发挥,测验结果是否可靠。n解释时亦可参考其它的测验资料,只凭单一的测验分数加以解释,可能全然不同于综合考虑几个

12、测验分数。p 例如,根据自陈量表测验的分数,某生的性压抑分数高于平均数两个标准差;但在投射测验中有关性的反应,却高于平均数一个标准差,如仅依自陈量表的分数解释时,只能解释说:“某生的性压抑倾向甚强。”但如果结合投射测验的分数作出综合解释,则可解释说:“某生的性兴趣强于一般人(投射测验),但他却将性兴趣加以严重的压抑(自陈量表)。 n总之,测验分数的解释应尽可能多种资料相互参照,综合评定。n(5)对测验分数应以“一段分数”来解释,而不应以“特定的数值”来解释。 由于每个测验均会受到测量误差的影响,因此在解释测验分数时也应考虑到测量误差的存在。测量误差的大小与信度的高低有关,信度越高,则误差越小,

13、但永远不可能完全消除误差,因此,应该把测验分数视为一个范围而不是一些确定的点,也就是要对测验分数提供带状的解释。倘若使用确切的分数,应说明这些分数不是精确的指标,而是我们对某人真实分数的大体估计。n(6)对来自不同测验的分数不能直接加以比较。 即使两个测验名称相同,由于所包含的具体内容不同(因而所测量的特质不完全相同),建立标准化样本的组成不同,量表的单位(如标准差)不同,其分数也不具备可比性。如来自两个智力测验的分数,在没有其他信息的情况下,我们无法判断谁高谁底。必须把它们放在统一的量表上进行比较。 具体做法是:将两个测验都对同一个样本进行施测,并把两种测验的原始分数都转换成百分等级,然后用

14、该百分等级作为中转点,就可以做出一个等价的原始分数表。 如果某人在测验A中原始分数55是90百分等级,而测验B中原始分数36也是90百分等级,那么他在测验A获得的55分就与在测验B 获得的36分等值。(二)(二) 如何向受测者报告测验分数如何向受测者报告测验分数 p.93n如何向当事人及与当事人有关的人员(如家长,教师,雇主等)报告测验分数,使他们更好地理解分数的意义是一件非常重要的事,下面所列举的一些原则,可供报告测验分数时作参考。p1.使用当事人所理解的语言n 测验具有自己的词汇,你所理解的词并不意味着当事人也一定理解。你懂得标准差和标准分数,然而当事人可能不懂。因此你必须用非技术性的用语

15、来解释标准分数,可以把它解释成相对位置(如百分等级)。p2. 要保证当事人知道测验的目的 n这里并不需要作详细的技术性解释。n例见 P.93。p3. 如果分数是以常模为参考的,就要使当事人知道他是和什么团体在进行比较。n例如,同一个百分等级对于普通学校和重点学校其意义是不同的。p4 .要使当事人认识到分数只是一个估计。n 由于测验的信度、效度不足,分数可能有误差,而且对于一个团体总体来说有效的测验,不一定对每个人都同样有效,但也不能让受测者感到分数是毫不可信的。p5. 要使当事人知道如何运用他的分数n当测验用于人员选拔和安置问题时这点是特别重要的。要向当事人讲清测验分数在作决定过程中起什么作用

16、,是完全由分数决定取舍,还是只把分数作为参考;有没有规定最低分数线;测验上的低分数能否由其他方面补偿等等。p6. 要考虑测验分数将给受测者带来什么心理影响。n由于对分数的解释会影响受测者的自我认识、自我体验和自我评价,所以在解释分数时要把对分数意义的解释和必要的咨询工作结合起来。p7. 测验结果应向无关的人员保密n当事人的测验分数不应让其他无关的人员知道,以免对当事人造成不良的影响。因此,分数的报告采用个人的解释为宜,不宜采用团体解释或公告通知的方式行之。p8. 报告测验分数时设法了解当事人的心理感受。n报告测验分数时,宜先让当事人充分表达测验时的心理感受,如他的动机、态度、情绪、注意、健康等

17、,以便知道他的测验分数是否代表在最佳的情况下所作的反应。n例如,某学生表示他在做智力测验验时情绪很恶劣,心不在焉;而另一位则表示他在做测验时,动机强烈,注意力集中,虽然两位学生得到相同IQ为115,但代表的意义可能迥然不同。n同样的,解释完分数后宜鼓励当事人表达对测验结果的感受,如发现当事人对分数有误解或不良态度,应立即配以咨询,予以适当的引导,以免给当事人造成自卑心理或其它不良影响。男性正性量表(男性正性量表(M量表)量表)p大而化之、重理性、勇敢、冷静、对政治与经济很有兴趣、遇事果断而有魄力、有责任心的、行为像领导者、自我信赖、信仰独立、强烈个人风格、有宽广见识、有说服力的、愿意冒险、奔放

18、的、乐群的、喜欢运动的、侠义心肠的、不屈不挠的、心胸宽广的、善交际的、自立的、好动的、有创造力的、有幽默感的、主动的、豪放的、乐观的、有能力团结众人女性正性量表(女性正性量表(F量表)量表)p善体人意的、温柔体贴的、颇具耐心的、重感情的、慈爱的、有同情的、对他人需要敏感的、注意流行的趋势、有母性的、重感情的、有礼貌的、喜欢照顾他人的、爱整洁的、节俭的、有耐心的、文静的、守本分的、含蓄的、洁身自好的、善良的、和气的、勤俭的、柔情的、纯真的、安分的、文雅的、心细的、娴淑的小测验小测验p取样误差与样本大小成反比。对不对?p对。若要提高测量的精确度,减少抽样误差,就必须加大样本容量(n)。 p年龄常模对哪些人适用,哪些人不再适用?p人在很多方面发展的速率是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论