教育测量法培训课件_第1页
教育测量法培训课件_第2页
教育测量法培训课件_第3页
教育测量法培训课件_第4页
教育测量法培训课件_第5页
已阅读5页,还剩97页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十一章教育测量法第十一章教育测量法1优选第十一章教育测量法优选第十一章教育测量法2一、教育测量的涵义测量就是根据某种规则把所观察的对象的属性予以数值化的过程,以表明被测对象通过作业和活动所达到的程度或量的多少。一、教育测量的涵义测量就是根据某种规则把所观察的对象的属性予3教育测量是指对教育领域内的各种事物或现象,根据一定法则进行考核,并将考核结果用数量描述。包括对学生德、智、体各方面的测量(狭义),也包括对教师的教育教学效果、学校办学水平、学校办学效益等方面的测量。教育测量是指对教育领域内的各种事物或现象,根据一定法则进行考4

通俗地说,就是根据一定的规则,给事物分派数字。1、2、3、4、5这些数字本身是没有数量或质量意义的,只是个符号。当我们规定1代表学业成绩的最低等级“不及格”;2代表“及格”;3代表“中等”;4代表“良好”;5代表“优秀”,这时1、2、3、4、5才具有实际意义,数字按规则被赋予了意义。通俗地说,就是根据一定的规则,给事物分派数字。1、2、5测量的要素(1)测量客体。指测量的对象。测量的客体可以是人,也可以是教育研究中的事物或现象。(2)测量内容。指测量客体的属性和特征。测量内容可以是外显的,如学生的性别、年龄、身高、体重等,也可以是内隐的,如学习兴趣、动机、态度、价值观等。(3)测量规则。指测量的法则或方法。也就是说,要构建一套如何分派数字或符号的准则,按准则对测量内容进行规范化、标准化的操作。(4)测量工具。指测量的指标体系。没有工具,测量难以进行。测量的要素6二、教育测量法的特点(一)教育测量一般是间接测量测量心理属性,需要具体行为操作指标;(二)教育测量的结果是相对的学生不断成长变化;测量对象不同、测量工具不同,无法比(三)教育测量更强调直接为实现教育目的服务二、教育测量法的特点(一)教育测量一般是间接测量7数学成绩测量的标准分数。难度是指测验项目的难易程度,试题的难度可以用试题的通过率来表示。当我们规定1代表学业成绩的最低等级“不及格”;有顺序的测量,在量表中表现为数量上的等距变化系统误差由于某种因素的影响,使测量变量有系统地发生变化而产生的误差。比如长度和重量测量就是建立在以绝对的零点为参照点的基础上的测量。如根据学生的测验成绩排出名次,成绩最好的为1,成绩次之为2,再次之为3,依次类推。通俗地说,就是根据一定的规则,给事物分派数字。x表示实测值,T表示真值(是未知的,可以把多次测量的实测值的平均值作为真值的近似值),E表示误差。常模有地区性常模和全国性常模,地区性常模只适用于特定的区域,如在城市获得的常模就不一定适用于农村或边远地区,而全国性常模适用于全国所有的同类个体。由专家学者或专门机构采用系统的科学程序编制的、在测验实施过程、评分手续、分数的解释上具有统一标准的,并对测验误差做了严格控制。如年龄、身高、经费开支等都有绝对零点,0岁、0米、0元中的“零”都表示真实的“无”,表示一点都没有。(二)顺序量表(等级量表)如音乐、美术、体育、创造力、想象力、记忆力等方面的能力倾向测验。(一)编制试题的一般原则信度指两次重复测验或等值测验之间的关联程度如年龄、身高、经费开支等都有绝对零点,0岁、0米、0元中的“零”都表示真实的“无”,表示一点都没有。5代表“优秀”,这时1、2、3、4、5才具有实际意义,数字按规则被赋予了意义。正确回答的人数在全体受测者中所占的比例。如年龄、身高、经费开支等都有绝对零点,0岁、0米、0元中的“零”都表示真实的“无”,表示一点都没有。三、教育测量的要求(一)数量化把事物或人的属性加以数量化,用可以比较的数值计量学习的成果。学生成绩为0分,不代表其没有能力,因而要结合质与量。(二)合理处理数据在运用测量数据时,最基本的要求是单位一致,这样才能排列顺序或等级,进行比较,也便于分析数据间的差异。(三)注意误差的影响随机误差由于难于控制的偶然因素,使测量结果不准确;系统误差由于某种因素的影响,使测量变量有系统地发生变化而产生的误差。数学成绩测量的标准分数。三、教育测量的要求(一)数量化8系统误差由于仪器结构上不够完善或仪器未经很好校准等原因会产生误差。例如,各种刻度尺的热胀冷缩,温度计、表盘的刻度不准确等都会造成误差。由于实验本身所依据的理论、公式的近似性,或者对实验条件、测量方法的考虑不周也会造成误差。例如,热学实验中常常没有考虑散热的影响,用伏安法测电阻时没有考虑电表内阻的影响等。由于测量者的生理特点,例如反应速度,分辨能力,甚至固有习惯等也会在测量中造成误差。以上都是造成系统误差的原因。系统误差的特点是测量结果向一个方向偏离,其数值按一定规律变化。我们应根据具体的实验条件,系统误差的特点,找出产生系统误差的主要原因,采取适当措施降低它的影响。系统误差9随机误差在相同条件下,对同一物理量进行多次测量,由于各种偶然因素,会出现测量值时而偏大,时而偏小的误差现象,这种类型的误差叫做偶然误差。产生偶然误差的原因很多,例如读数时,视线的位置不正确,测量点的位置不准确,实验仪器由于环境温度、湿度、电源电压不稳定、振动等因素的影响而产生微小变化,等等,这些因素的影响一般是微小的,而且难以确定某个因素产生的具体影响的大小,因此偶然误差难以找出原因加以排除。实验结果还表明,在确定的测量条件下,对同一物理量进行多次测量,并且用它的算术平均值作为该物理量的测量结果,能够比较好地减少偶然误差。随机误差在相同条件下,对同一物理量进行多次测量,由于各种偶然10测被试的智力高低,其结果常以智商(IQ)来表示,此类测验比较多,其中比较著名的有斯坦福——比纳智力测验、韦克斯勒儿童智力测验量表(WISCCR)、瑞文推理测验等。也就是说,要构建一套如何分派数字或符号的准则,按准则对测量内容进行规范化、标准化的操作。标准化测验所获得的测量结果比较客观、可靠、应用范围较广,一般测量调查应尽可能选用标准化的测验工具。据此,度量乙的信度要比度量甲的信度高。问渠那得清如许,_____。(二)检验教育或教学目标贯彻的情况规定评分标准、分数转换和解释方法等。测验编制包括确定测验目的、科学命题、选取有代表性的样本进行试测;把上述两次测量(设为甲和乙)和绝对误差分数和真分数代入上式,得把上述两次测量(设为甲和乙)和绝对误差分数和真分数代入上式,得由于测题记分的方法不同,所以难度的估计方法也不同。另一种是相对参照点,即以人为确定的零点为测量的起点。它是对相同应试者的同一特性的两次测量分数的相关系数,是测量结果的一致性的指标。随机误差由于难于控制的偶然因素,使测量结果不准确;零点是指测量的起点或参照点。相对误差(乙)=1/185×100%=0.四、教育测量的作用(一)考试和选拔学生(二)检验教育或教学目标贯彻的情况(三)诊断学习困难,解释成绩不良的原因(四)激励动机的作用(五)升级、编班与分组(六)改进课程内容与教学方法(七)提供咨询与个别指导测被试的智力高低,其结果常以智商(IQ)来表示,此类测验比较11第二节教育测量的标准与条件测量需要有测量的工具,测量的工具应具有单位和参照点,并且有表示量数的方法,我们把这种工具称之为量表。如,尺是度量长度的量表,血压计是测量血压高低的量表,智力测验是测量智商高低的量表。第二节教育测量的标准与条件测量需要有测量的工具,测量的工具12参照点指的是在测量工作中必须具有一个量的起点,这个起点就叫作测量的参照点。这是任何测量都必须具备的两个要素之一,测量所必须具备的要素包括参照点和单位。参照点有两种一种是绝对参照点,即以绝对的零点作为测量的起点。比如长度和重量测量就是建立在以绝对的零点为参照点的基础上的测量。另一种是相对参照点,即以人为确定的零点为测量的起点。如地势高度的测量,就是以海平面为测量的起点。最理想的参照点是绝对参照点。参照点指的是在测量工作中必须具有一个量的起点,这个起点就叫作13测量的单位不同测量的单位是不同的。理想的测量单位应当具备两个条件一个是要有确定的意义,即对同一单位来说所有人的理解是相同的;二是要有相等的价值,即单位与单位之间的距离是相等的。但是教育与心理测量中的单位往往很难达到这个要求,它远不如其他测量中使用的单位成熟和完善。测量的单位14量表的数据类型称名数据顺序数据等距数据比率数据点记数据度量数据量表的数据类型点记数据度量数据15建立常模、确定指导语、时限和施测条件;是测验的准确性,是测验能够测出它所欲测的特质的程度,即测验实际测量出其所要测量特性的程度。当我们规定1代表学业成绩的最低等级“不及格”;改进方法提高出题质量,对错答题目扣分。5代表“优秀”,这时1、2、3、4、5才具有实际意义,数字按规则被赋予了意义。常模参照测验是一种衡量被试相对水平的测验,是将被试的测验成绩与同类对象在同一测验上的平均分(常模)相比较,从而解释分数,确定被试在总体中的相对位置的测验方法。在使用相关系数表示信度的高低时,相关系数可称为信度系数(coefficientofreliability)。(二)教育测量的结果是相对的个别测量的可靠性比较高,主试能有效地观察控制被试的行为反应,但个别测量费时费力,短时间内难以获得大量的资料,并且对主试的要求较高。5代表“优秀”,这时1、2、3、4、5才具有实际意义,数字按规则被赋予了意义。由专家学者或专门机构采用系统的科学程序编制的、在测验实施过程、评分手续、分数的解释上具有统一标准的,并对测验误差做了严格控制。(二)根据测量的内容分类学业成就测验、智力测验、能力倾向测验、人格测验等。随机误差由于难于控制的偶然因素,使测量结果不准确;产生偶然误差的原因很多,例如读数时,视线的位置不正确,测量点的位置不准确,实验仪器由于环境温度、湿度、电源电压不稳定、振动等因素的影响而产生微小变化,等等,这些因素的影响一般是微小的,而且难以确定某个因素产生的具体影响的大小,因此偶然误差难以找出原因加以排除。竹外桃花三两枝,_____。(三)教育测量更强调直接为实现教育目的服务指测量的编制和实施不按标准程序进行的测量,通常由教师或研究人员自编的、为临时测量所用的简单测量。(一)编制试题的一般原则一个是要有确定的意义,即对同一单位来说所有人的理解是相同的;(一)称名量表(类别量表)是根据事物的某一特点,对事物属性进行分类,用名称或数字来代表事物或性质,是给事物进行简单归类的一种量表形式。如男生为1,女生为2喜欢语文的学生为1,喜欢数学的学生为2称名量表测量的结果不能运算,但可以做统计分析(如计算百分比、列联相关、卡方检验)建立常模、确定指导语、时限和施测条件;(一)称名量表(类别量16指主试与被试一对一进行的测量(一个主试在同一时间内,只测验一个被试)。试题难度要有一定的分布范围是具有相等的单位,但没有绝对零点的量表。测量对象不同、测量工具不同,无法比英语的卧房是"Sleeproom"常模参照测验要有常模对照表。由专家学者或专门机构采用系统的科学程序编制的、在测验实施过程、评分手续、分数的解释上具有统一标准的,并对测验误差做了严格控制。在统计学中,统计量越接近参数,这个统计量的可靠性越高。5代表“优秀”,这时1、2、3、4、5才具有实际意义,数字按规则被赋予了意义。是具有相等的单位,但没有绝对零点的量表。标准客观测验的各种试题形式由于仪器结构上不够完善或仪器未经很好校准等原因会产生误差。指的是在测量工作中必须具有一个量的起点,这个起点就叫作测量的参照点。在计算客观题的难度时,它就是受测者在回答该题目时含有绝对或真正的零点和统一的单位。有些零点具有实际意义,称绝对零点。有些零点是人定的,称相对零点,如摄氏零度,这里零度并不意味着没有一点温度,而是以人定的冰点为参照标准。一个是要有确定的意义,即对同一单位来说所有人的理解是相同的;表示题目难易程度的数量,称为题目的难度指数,一般用P来表示。(二)顺序量表(等级量表)只有等级顺序而无等距的单位和绝对零点,只是按研究对象的某一种属性的顺序排列出等第次序。如根据学生的测验成绩排出名次,成绩最好的为1,成绩次之为2,再次之为3,依次类推。又如,对于生活水平,我们可以给出四个等级贫困、温饱、小康、富裕。指主试与被试一对一进行的测量(一个主试在同一时间内,只测验一17(三)等距量表(间距量表)是具有相等的单位,但没有绝对零点的量表。等距量表的数量单位之间的间距是相等的,可以相加减。如温度摄氏30度至32度与摄氏18度至20度的温差是相等的,都是相差2度。三个儿童在智商测验中分别得分105、110、115,在智商测验分数体系中,分数差距是相等的。等距量表在学校教育系统运用广泛,一般将百分制评分看作等距量表。(三)等距量表(间距量表)18(四)比率量表(等比量表)除了具有类别、顺序、等距量表的特征外,还有一个具有实际意义的绝对零点。可以加减乘除。零点是指测量的起点或参照点。有些零点是人定的,称相对零点,如摄氏零度,这里零度并不意味着没有一点温度,而是以人定的冰点为参照标准。像学生的考试成绩、智商的0分都是相对零点。有些零点具有实际意义,称绝对零点。如年龄、身高、经费开支等都有绝对零点,0岁、0米、0元中的“零”都表示真实的“无”,表示一点都没有。(四)比率量表(等比量表)19量表条件例子称名量表无顺序的测量,只是指出有两个或多个范畴。中学的类型:公立、私立、职业、普通等。顺序量表是有顺序有测量,在于指出所测量的范畴的不同并能够按一定的顺序排列。字母的排列系统、学习态度。等距量表有顺序的测量,在量表中表现为数量上的等距变化数学成绩测量的标准分数。比率量表含有绝对或真正的零点和统一的单位。高度、体重上述四种量表的比较:量表条件例子称名量表无顺序的测量,只是指出有两个或多个范畴。20衡量教育测量的质量,可采用四个指标信度主要对整个测量而言。效度难度主要对测量的项目而言。区分度二、测量的条件衡量教育测量的质量,可采用四个指标二、测量的条件21一、信度信度(reliability)指的是测量结果的稳定性和可靠的程度,亦即测量的结果是否真实、客观地反映了受测者的实际水平。具体而言,可以从以下三方面来理解测量的信度1.信度指实测值和真值相差的程度2.信度指统计量与参数之间的接近程度3.信度指两次重复测验或等值测验之间的关联程度一、信度信度(reliability)指的是测量结果的稳定性221.信度指实测值和真值相差的程度x=T+E(公式11)x表示实测值,T表示真值(是未知的,可以把多次测量的实测值的平均值作为真值的近似值),E表示误差。E=xT(公式12)1.信度指实测值和真值相差的程度x=T+E(公式11)23试比较以下两次测量结果(只进行一次)的信度用尺子量100cm高的一个儿童,得到1cm的绝对误差;量185cm高的一位运动员,也得得到1cm的绝对误差。要比较两种测量结果的信度,一定要看误差分数(E)对于真分数(T)所占的百分数是多少。这个百分数表示该实得分数(x)的相对误差。其计算式如下相对误差=E/T×100%公式(13)把上述两次测量(设为甲和乙)和绝对误差分数和真分数代入上式,得相对误差(甲)=1/100×100%=1%相对误差(乙)=1/185×100%=0.54%据此,度量乙的信度要比度量甲的信度高。试比较以下两次测量结果(只进行一次)的信度24(三)等距量表(间距量表)信度指两次重复测验或等值测验之间的关联程度当我们规定1代表学业成绩的最低等级“不及格”;如年龄、身高、经费开支等都有绝对零点,0岁、0米、0元中的“零”都表示真实的“无”,表示一点都没有。由专家学者或专门机构采用系统的科学程序编制的、在测验实施过程、评分手续、分数的解释上具有统一标准的,并对测验误差做了严格控制。温度、各种能力分数、智商;常模参照测验是一种衡量被试相对水平的测验,是将被试的测验成绩与同类对象在同一测验上的平均分(常模)相比较,从而解释分数,确定被试在总体中的相对位置的测验方法。试题内容广泛,评分客观,提供选择的答案多,可以减少猜中题目的机会。常模参照测验要有常模对照表。如根据学生的测验成绩排出名次,成绩最好的为1,成绩次之为2,再次之为3,依次类推。在计算客观题的难度时,它就是受测者在回答该题目时测被试的需要、动机、兴趣、态度、气质、性格、人际关系等人格心理特征,较为著名的有明尼苏达多相个性测验(MMPI)、艾森克人格问卷(EPQR)、卡特尔16项人格因素测验(16PF)等。据此,度量乙的信度要比度量甲的信度高。区分度是指一个题目区分所有受试者的能力。正确回答的人数在全体受测者中所占的比例。标准化测验所获得的测量结果比较客观、可靠、应用范围较广,一般测量调查应尽可能选用标准化的测验工具。如根据学生的测验成绩排出名次,成绩最好的为1,成绩次之为2,再次之为3,依次类推。指主试与被试一对一进行的测量(一个主试在同一时间内,只测验一个被试)。把事物或人的属性加以数量化,用可以比较的数值计量学习的成果。(四)比率量表(等比量表)团体测量节省人力与时间,在短时间内能收集到大量的资料,效率较高,但被试的反应不容易控制,并且测量效果不及个别测量可靠。统计量是指样本上的各种数字特征。(如样本平均数、标准差等);参数是总体上的各种数字特征(如总体平均数、标准差等)。在统计学中,统计量越接近参数,这个统计量的可靠性越高。而要知道统计量与参数的接近程度,可以对参数进行区间估计。2.信度指统计量与参数之间的接近程度(三)等距量表(间距量表)统计量是指样本上的各种数字特征。(253.信度指两次重复测验或等值测验之间的关联程度统计学中估计事物或现象间数量变动的一致性,主要采用相关分析的方法,即计算出两种变量的相关系数(rxy)。在使用相关系数表示信度的高低时,相关系数可称为信度系数(coefficientofreliability)。它是对相同应试者的同一特性的两次测量分数的相关系数,是测量结果的一致性的指标。3.信度指两次重复测验或等值测验之间的关联程度统计学中估计26提高测量信度的方法1.测题要有一定数量

延长测验的长度,既可排除试题抽样的偶然性因素,也有可能扩大得分的范围,因而使信度系数增大,测验信度提高。2.测题难度适中3.测题内容要有同质性,不要包含过多性质不同的内容4.测验时间要充分5.评分要客观提高测量信度的方法1.测题要有一定数量27是测验的准确性,是测验能够测出它所欲测的特质的程度,即测验实际测量出其所要测量特性的程度。

含义二、效度是测验的准确性,是测验能够测出它所欲测的特质的程度,即测验实28提高效度的注意事项(1)要控制系数误差,即控制测验过程的误差;(2)精心编制测题,分析教学目标,编制双向细目表,测题表述简明易懂,测量有必要的覆盖面。(3)妥善组织测验。提高效度的注意事项(1)要控制系数误差,即控制测验过程的误差29

难度是指题目的难易程度。表示题目难易程度的数量,称为题目的难度指数,一般用P来表示。

试题卷面的难度值范围是0.4~0.7由于测题记分的方法不同,所以难度的估计方法也不同。三、难度

难度是指题目的难易程度。表示题目难易程度的数量,称为题301.在计算客观题的难度时,它就是受测者在回答该题目时正确回答的人数在全体受测者中所占的比例。2.当题目的分数为多值时(包括主观题或一些分步解答的题目),难度就是全体平均分与题目满分的比例。难度是指测验项目的难易程度,试题的难度可以用试题的通过率来表示。1.在计算客观题的难度时,它就是受测者在回答该题目时难度是31第十一章教育测量法培训课件32第十一章教育测量法培训课件33区分度是指一个题目区分所有受试者的能力。(题目的区分度是衡量题目对测量目的所做的贡献大小程度的指标。它反映了一个题目的鉴别能力。因此区分度又称题目的鉴别度。)四、区分度

区分度是指一个题目区分所有受试者的能力。(题目的区分度是衡量34D越高则质量越好。0.2以下应淘汰第十一章教育测量法培训课件35练习A.称名数据B.顺序数据C.等距数据D.等比数据性别、颜色分类、人口数、学校数;身高、体重;温度、各种能力分数、智商;学生等级评定、喜爱程度、品质等级、能力等级、兴趣等。练习36第十一章教育测量法培训课件37第三节教育测量的类型与方法(一)根据测量的标准化程度分类标准化测量、非标准化测量1.标准化测量由专家学者或专门机构采用系统的科学程序编制的、在测验实施过程、评分手续、分数的解释上具有统一标准的,并对测验误差做了严格控制。编制和施测有一套标准程序。测验编制包括确定测验目的、科学命题、选取有代表性的样本进行试测;根据数量化指标筛选测验题目;鉴定整个测验的信度和效度;建立常模、确定指导语、时限和施测条件;规定评分标准、分数转换和解释方法等。标准化测验所获得的测量结果比较客观、可靠、应用范围较广,一般测量调查应尽可能选用标准化的测验工具。第三节教育测量的类型与方法(一)根据测量的标准化程度分类382.非标准化测量(教师自编测量)指测量的编制和实施不按标准程序进行的测量,通常由教师或研究人员自编的、为临时测量所用的简单测量。如课堂测验、考试、等级评定量表等。这些测量是教师根据教学目标和自己的教学经验编制而成,它通常与日常教学工作紧密联系;测验内容与教材内容、教学进度一致;难易程度由教师把握;针对性较强。编制省时、省力、灵活、方便。不足之处在于测验的客观性和标准化程度不如标准化测验,测验的实施和记分也不甚严格。2.非标准化测量(教师自编测量)39(二)根据测量的内容分类学业成就测验、智力测验、能力倾向测验、人格测验等。1.学业成就测验测被试经某种形式的学习或训练后对知识、技能的掌握程度或熟练水平。如识字量、阅读、算术测验等,成就测验可以是学科成就测验或综合成就测验。2.智力测验测被试的智力高低,其结果常以智商(IQ)来表示,此类测验比较多,其中比较著名的有斯坦福——比纳智力测验、韦克斯勒儿童智力测验量表(WISCCR)、瑞文推理测验等。(二)根据测量的内容分类学业成就测验、智力测验、能力倾向测验403.能力倾向测验测被试潜在的某种能力,以了解其发展的可能性,预测个人能力发展倾向。如音乐、美术、体育、创造力、想象力、记忆力等方面的能力倾向测验。4.人格测验测被试的需要、动机、兴趣、态度、气质、性格、人际关系等人格心理特征,较为著名的有明尼苏达多相个性测验(MMPI)、艾森克人格问卷(EPQR)、卡特尔16项人格因素测验(16PF)等。3.能力倾向测验41(三)根据测量结果的评价标准分为常模参照测验、目标参照测验。1.常模参照测验常模参照测验是一种衡量被试相对水平的测验,是将被试的测验成绩与同类对象在同一测验上的平均分(常模)相比较,从而解释分数,确定被试在总体中的相对位置的测验方法。常模参照测验要有常模对照表。常模有地区性常模和全国性常模,地区性常模只适用于特定的区域,如在城市获得的常模就不一定适用于农村或边远地区,而全国性常模适用于全国所有的同类个体。如,儿童的身高、体重就有全国性常模,中国儿童发展量表(36岁)就有全国性常模。只要我们将个体实际测量的数据与常模一对照,就可以知道个体所处的地位。(三)根据测量结果的评价标准分为常模参照测验、目标参照测验。42(一)编制试题的一般原则是有顺序有测量,在于指出所测量的范畴的不同并能够按一定的顺序排列。测量就是根据某种规则把所观察的对象的属性予以数值化的过程,以表明被测对象通过作业和活动所达到的程度或量的多少。零点是指测量的起点或参照点。它是对相同应试者的同一特性的两次测量分数的相关系数,是测量结果的一致性的指标。这个百分数表示该实得分数(x)的相对误差。由于测题记分的方法不同,所以难度的估计方法也不同。优选第十一章教育测量法性别、颜色分类、人口数、学校数;它是对相同应试者的同一特性的两次测量分数的相关系数,是测量结果的一致性的指标。表示题目难易程度的数量,称为题目的难度指数,一般用P来表示。一个是要有确定的意义,即对同一单位来说所有人的理解是相同的;规定评分标准、分数转换和解释方法等。比如长度和重量测量就是建立在以绝对的零点为参照点的基础上的测量。x表示实测值,T表示真值(是未知的,可以把多次测量的实测值的平均值作为真值的近似值),E表示误差。如温度摄氏30度至32度与摄氏18度至20度的温差是相等的,都是相差2度。(二)教育测量的结果是相对的5代表“优秀”,这时1、2、3、4、5才具有实际意义,数字按规则被赋予了意义。由专家学者或专门机构采用系统的科学程序编制的、在测验实施过程、评分手续、分数的解释上具有统一标准的,并对测验误差做了严格控制。指一个主试能同时对许多被试进行的测量。如,尺是度量长度的量表,血压计是测量血压高低的量表,智力测验是测量智商高低的量表。如,儿童的身高、体重就有全国性常模,中国儿童发展量表(36岁)就有全国性常模。在计算客观题的难度时,它就是受测者在回答该题目时问渠那得清如许,_____。由专家学者或专门机构采用系统的科学程序编制的、在测验实施过程、评分手续、分数的解释上具有统一标准的,并对测验误差做了严格控制。题目容易编写,容易计分。学生成绩为0分,不代表其没有能力,因而要结合质与量。问渠那得清如许,_____。(二)顺序量表(等级量表)如根据学生的测验成绩排出名次,成绩最好的为1,成绩次之为2,再次之为3,依次类推。也就是说,要构建一套如何分派数字或符号的准则,按准则对测量内容进行规范化、标准化的操作。如地势高度的测量,就是以海平面为测量的起点。但是教育与心理测量中的单位往往很难达到这个要求,它远不如其他测量中使用的单位成熟和完善。测量需要有测量的工具,测量的工具应具有单位和参照点,并且有表示量数的方法,我们把这种工具称之为量表。信度指统计量与参数之间的接近程度(三)诊断学习困难,解释成绩不良的原因通俗地说,就是根据一定的规则,给事物分派数字。量185cm高的一位运动员,也得得到1cm的绝对误差。主要对整个测量而言。(一)编制试题的一般原则指一个主试能同时对许多被试进行的测量432.目标参照测验又称标准参照测验,是衡量被试实际水平的测验,将被试在测验上的分数与事先制定好的某种标准进行比较,看被试是否达到了目标规定的要求。目标参照测验的特点是依据标准,判断被试的达标程度,而不是将被试的成绩与他人成绩做比较。如,英语水平测试、毕业考试、动作技能测试、体育达标测试等。2.目标参照测验44常模参照测验要有常模对照表。通俗地说,就是根据一定的规则,给事物分派数字。另一种是相对参照点,即以人为确定的零点为测量的起点。缺点容易造成死记硬背的现象,学习内容容易混淆。常模有地区性常模和全国性常模,地区性常模只适用于特定的区域,如在城市获得的常模就不一定适用于农村或边远地区,而全国性常模适用于全国所有的同类个体。在统计学中,统计量越接近参数,这个统计量的可靠性越高。没有工具,测量难以进行。如根据学生的测验成绩排出名次,成绩最好的为1,成绩次之为2,再次之为3,依次类推。学生成绩为0分,不代表其没有能力,因而要结合质与量。系统误差由于某种因素的影响,使测量变量有系统地发生变化而产生的误差。如年龄、身高、经费开支等都有绝对零点,0岁、0米、0元中的“零”都表示真实的“无”,表示一点都没有。正确回答的人数在全体受测者中所占的比例。区分度是指一个题目区分所有受试者的能力。测题内容要有同质性,不要包含过多性质不同的内容通俗地说,就是根据一定的规则,给事物分派数字。问渠那得清如许,_____。理想的测量单位应当具备两个条件测被试潜在的某种能力,以了解其发展的可能性,预测个人能力发展倾向。如温度摄氏30度至32度与摄氏18度至20度的温差是相等的,都是相差2度。是根据事物的某一特点,对事物属性进行分类,用名称或数字来代表事物或性质,是给事物进行简单归类的一种量表形式。(四)根据同时受测的人数分类个别测量、团体测量1.个别测量指主试与被试一对一进行的测量(一个主试在同一时间内,只测验一个被试)。个别测量的可靠性比较高,主试能有效地观察控制被试的行为反应,但个别测量费时费力,短时间内难以获得大量的资料,并且对主试的要求较高。2.团体测量指一个主试能同时对许多被试进行的测量。团体测量节省人力与时间,在短时间内能收集到大量的资料,效率较高,但被试的反应不容易控制,并且测量效果不及个别测量可靠。常模参照测验要有常模对照表。(四)根据同时受测的人数分类个别45二、教育测量的方法(一)编制试题的一般原则1.要有明确的测验目的2.能反映学科的重点内容3.试题取样要有代表性4.试题难度要有一定的分布范围5.试题的文字要适合学生阅读能力,力求浅显易懂二、教育测量的方法(一)编制试题的一般原则46(二)测量的编制方法1.标准客观测验的各种试题形式(1)填空题(2)是非题(3)选择题(4)匹配题(5)简答题(6)论述题(二)测量的编制方法1.标准客观测验的各种试题形式47(1)填空题问渠那得清如许,_____。竹外桃花三两枝,_____。测验学生完成句子的能力优点试题容易编写,避免乱猜;缺点容易造成死记硬背的现象,学习内容容易混淆。(1)填空题问渠那得清如许,_____。48(2)是非题1.《背影》的作者是朱自清吗?2.企鹅是在北极吗?3.刚吃完饭能马上运动吗?4.口腔有消化作用吗?5.英语的卧房是"Sleeproom"测量学生对问题的理解、解释、再认、比较与辨认的能力。题目容易编写,容易计分。缺点容易猜题改进方法提高出题质量,对错答题目扣分。(2)是非题1.《背影》的作者是朱自清吗?2.企鹅是49(3)选择题测量学生对问题的理解、解释、再认、比较与辨认的能力。试题内容广泛,评分客观,提供选择的答案多,可以减少猜中题目的机会。缺点编写试题时费时较多。(3)选择题测量学生对问题的理解、解释、再认、比较与辨认的能50常模参照测验要有常模对照表。测题内容要有同质性,不要包含过多性质不同的内容测量心理属性,需要具体行为操作指标;二是要有相等的价值,即单位与单位之间的距离是相等的。信度指统计量与参数之间的接近程度通俗地说,就是根据一定的规则,给事物分派数字。难度就是全体平均分与题目满分的比例。英语的卧房是"Sleeproom"信度指统计量与参数之间的接近程度问渠那得清如许,_____。含有绝对或真正的零点和统一的单位。数学成绩测量的标准分数。它反映了一个题目的鉴别能力。另一种是相对参照点,即以人为确定的零点为测量的起点。产生偶然误差的原因很多,例如读数时,视线的位置不正确,测量点的位置不准确,实验仪器由于环境温度、湿度、电源电压不稳定、振动等因素的影响而产生微小变化,等等,这些因素的影响一般是微小的,而且难以确定某个因素产生的具体影响的大小,因此偶然误差难以找出原因加以排除。指一个主试能同时对许多被试进行的测量。温度、各种能力分数、智商;5代表“优秀”,这时1、2、3、4、5才具有实际意义,数字按规则被赋予了意义。如地势高度的测量,就是以海平面为测量的起点。是有顺序有测量,在于指出所测量的范畴的不同并能够按一定的顺序排列。5代表“优秀”,这时1、2、3、4、5才具有实际意义,数字按规则被赋予了意义。如温度摄氏30度至32度与摄氏18度至20度的温差是相等的,都是相差2度。第二节教育测量的标准与条件(题目的区分度是衡量题目对测量目的所做的贡献大小程度的指标。如年龄、身高、经费开支等都有绝对零点,0岁、0米、0元中的“零”都表示真实的“无”,表示一点都没有。编制和施测有一套标准程序。当我们规定1代表学业成绩的最低等级“不及格”;理想的测量单位应当具备两个条件正确回答的人数在全体受测者中所占的比例。常模参照测验要有常模对照表。测题内容要有同质性,不要包含过多性质不同的内容信度指两次重复测验或等值测验之间的关联程度如地势高度的测量,就是以海平面为测量的起点。(四)根据同时受测的人数分类个别测量、团体测量5代表“优秀”,这时1、2、3、4、5才具有实际意义,数字按规则被赋予了意义。把上述两次测量(设为甲和乙)和绝对误差分数和真分数代入上式,得据此,度量乙的信度要比度量甲的信度高。指测量客体的属性和特征。如根据学生的测验成绩排出名次,成绩最好的为1,成绩次之为2,再次之为3,依次类推。在统计学中,统计量越接近参数,这个统计量的可靠性越高。

(4)匹配题测查学生对字词、文法、日期、事件、地点、人物、公式、原则等关系的了解与联结的能力。优点测量学生简易的联结能力;缺点使用过多容易鼓励学生死记硬背的材料,学生往往为了使材料相互匹配而重复阅读,消耗时间精力。常模参照测验要有常模对照表。如温度摄氏30度至32度与摄氏151第十一章教育测量法第十一章教育测量法52优选第十一章教育测量法优选第十一章教育测量法53一、教育测量的涵义测量就是根据某种规则把所观察的对象的属性予以数值化的过程,以表明被测对象通过作业和活动所达到的程度或量的多少。一、教育测量的涵义测量就是根据某种规则把所观察的对象的属性予54教育测量是指对教育领域内的各种事物或现象,根据一定法则进行考核,并将考核结果用数量描述。包括对学生德、智、体各方面的测量(狭义),也包括对教师的教育教学效果、学校办学水平、学校办学效益等方面的测量。教育测量是指对教育领域内的各种事物或现象,根据一定法则进行考55

通俗地说,就是根据一定的规则,给事物分派数字。1、2、3、4、5这些数字本身是没有数量或质量意义的,只是个符号。当我们规定1代表学业成绩的最低等级“不及格”;2代表“及格”;3代表“中等”;4代表“良好”;5代表“优秀”,这时1、2、3、4、5才具有实际意义,数字按规则被赋予了意义。通俗地说,就是根据一定的规则,给事物分派数字。1、2、56测量的要素(1)测量客体。指测量的对象。测量的客体可以是人,也可以是教育研究中的事物或现象。(2)测量内容。指测量客体的属性和特征。测量内容可以是外显的,如学生的性别、年龄、身高、体重等,也可以是内隐的,如学习兴趣、动机、态度、价值观等。(3)测量规则。指测量的法则或方法。也就是说,要构建一套如何分派数字或符号的准则,按准则对测量内容进行规范化、标准化的操作。(4)测量工具。指测量的指标体系。没有工具,测量难以进行。测量的要素57二、教育测量法的特点(一)教育测量一般是间接测量测量心理属性,需要具体行为操作指标;(二)教育测量的结果是相对的学生不断成长变化;测量对象不同、测量工具不同,无法比(三)教育测量更强调直接为实现教育目的服务二、教育测量法的特点(一)教育测量一般是间接测量58数学成绩测量的标准分数。难度是指测验项目的难易程度,试题的难度可以用试题的通过率来表示。当我们规定1代表学业成绩的最低等级“不及格”;有顺序的测量,在量表中表现为数量上的等距变化系统误差由于某种因素的影响,使测量变量有系统地发生变化而产生的误差。比如长度和重量测量就是建立在以绝对的零点为参照点的基础上的测量。如根据学生的测验成绩排出名次,成绩最好的为1,成绩次之为2,再次之为3,依次类推。通俗地说,就是根据一定的规则,给事物分派数字。x表示实测值,T表示真值(是未知的,可以把多次测量的实测值的平均值作为真值的近似值),E表示误差。常模有地区性常模和全国性常模,地区性常模只适用于特定的区域,如在城市获得的常模就不一定适用于农村或边远地区,而全国性常模适用于全国所有的同类个体。由专家学者或专门机构采用系统的科学程序编制的、在测验实施过程、评分手续、分数的解释上具有统一标准的,并对测验误差做了严格控制。如年龄、身高、经费开支等都有绝对零点,0岁、0米、0元中的“零”都表示真实的“无”,表示一点都没有。(二)顺序量表(等级量表)如音乐、美术、体育、创造力、想象力、记忆力等方面的能力倾向测验。(一)编制试题的一般原则信度指两次重复测验或等值测验之间的关联程度如年龄、身高、经费开支等都有绝对零点,0岁、0米、0元中的“零”都表示真实的“无”,表示一点都没有。5代表“优秀”,这时1、2、3、4、5才具有实际意义,数字按规则被赋予了意义。正确回答的人数在全体受测者中所占的比例。如年龄、身高、经费开支等都有绝对零点,0岁、0米、0元中的“零”都表示真实的“无”,表示一点都没有。三、教育测量的要求(一)数量化把事物或人的属性加以数量化,用可以比较的数值计量学习的成果。学生成绩为0分,不代表其没有能力,因而要结合质与量。(二)合理处理数据在运用测量数据时,最基本的要求是单位一致,这样才能排列顺序或等级,进行比较,也便于分析数据间的差异。(三)注意误差的影响随机误差由于难于控制的偶然因素,使测量结果不准确;系统误差由于某种因素的影响,使测量变量有系统地发生变化而产生的误差。数学成绩测量的标准分数。三、教育测量的要求(一)数量化59系统误差由于仪器结构上不够完善或仪器未经很好校准等原因会产生误差。例如,各种刻度尺的热胀冷缩,温度计、表盘的刻度不准确等都会造成误差。由于实验本身所依据的理论、公式的近似性,或者对实验条件、测量方法的考虑不周也会造成误差。例如,热学实验中常常没有考虑散热的影响,用伏安法测电阻时没有考虑电表内阻的影响等。由于测量者的生理特点,例如反应速度,分辨能力,甚至固有习惯等也会在测量中造成误差。以上都是造成系统误差的原因。系统误差的特点是测量结果向一个方向偏离,其数值按一定规律变化。我们应根据具体的实验条件,系统误差的特点,找出产生系统误差的主要原因,采取适当措施降低它的影响。系统误差60随机误差在相同条件下,对同一物理量进行多次测量,由于各种偶然因素,会出现测量值时而偏大,时而偏小的误差现象,这种类型的误差叫做偶然误差。产生偶然误差的原因很多,例如读数时,视线的位置不正确,测量点的位置不准确,实验仪器由于环境温度、湿度、电源电压不稳定、振动等因素的影响而产生微小变化,等等,这些因素的影响一般是微小的,而且难以确定某个因素产生的具体影响的大小,因此偶然误差难以找出原因加以排除。实验结果还表明,在确定的测量条件下,对同一物理量进行多次测量,并且用它的算术平均值作为该物理量的测量结果,能够比较好地减少偶然误差。随机误差在相同条件下,对同一物理量进行多次测量,由于各种偶然61测被试的智力高低,其结果常以智商(IQ)来表示,此类测验比较多,其中比较著名的有斯坦福——比纳智力测验、韦克斯勒儿童智力测验量表(WISCCR)、瑞文推理测验等。也就是说,要构建一套如何分派数字或符号的准则,按准则对测量内容进行规范化、标准化的操作。标准化测验所获得的测量结果比较客观、可靠、应用范围较广,一般测量调查应尽可能选用标准化的测验工具。据此,度量乙的信度要比度量甲的信度高。问渠那得清如许,_____。(二)检验教育或教学目标贯彻的情况规定评分标准、分数转换和解释方法等。测验编制包括确定测验目的、科学命题、选取有代表性的样本进行试测;把上述两次测量(设为甲和乙)和绝对误差分数和真分数代入上式,得把上述两次测量(设为甲和乙)和绝对误差分数和真分数代入上式,得由于测题记分的方法不同,所以难度的估计方法也不同。另一种是相对参照点,即以人为确定的零点为测量的起点。它是对相同应试者的同一特性的两次测量分数的相关系数,是测量结果的一致性的指标。随机误差由于难于控制的偶然因素,使测量结果不准确;零点是指测量的起点或参照点。相对误差(乙)=1/185×100%=0.四、教育测量的作用(一)考试和选拔学生(二)检验教育或教学目标贯彻的情况(三)诊断学习困难,解释成绩不良的原因(四)激励动机的作用(五)升级、编班与分组(六)改进课程内容与教学方法(七)提供咨询与个别指导测被试的智力高低,其结果常以智商(IQ)来表示,此类测验比较62第二节教育测量的标准与条件测量需要有测量的工具,测量的工具应具有单位和参照点,并且有表示量数的方法,我们把这种工具称之为量表。如,尺是度量长度的量表,血压计是测量血压高低的量表,智力测验是测量智商高低的量表。第二节教育测量的标准与条件测量需要有测量的工具,测量的工具63参照点指的是在测量工作中必须具有一个量的起点,这个起点就叫作测量的参照点。这是任何测量都必须具备的两个要素之一,测量所必须具备的要素包括参照点和单位。参照点有两种一种是绝对参照点,即以绝对的零点作为测量的起点。比如长度和重量测量就是建立在以绝对的零点为参照点的基础上的测量。另一种是相对参照点,即以人为确定的零点为测量的起点。如地势高度的测量,就是以海平面为测量的起点。最理想的参照点是绝对参照点。参照点指的是在测量工作中必须具有一个量的起点,这个起点就叫作64测量的单位不同测量的单位是不同的。理想的测量单位应当具备两个条件一个是要有确定的意义,即对同一单位来说所有人的理解是相同的;二是要有相等的价值,即单位与单位之间的距离是相等的。但是教育与心理测量中的单位往往很难达到这个要求,它远不如其他测量中使用的单位成熟和完善。测量的单位65量表的数据类型称名数据顺序数据等距数据比率数据点记数据度量数据量表的数据类型点记数据度量数据66建立常模、确定指导语、时限和施测条件;是测验的准确性,是测验能够测出它所欲测的特质的程度,即测验实际测量出其所要测量特性的程度。当我们规定1代表学业成绩的最低等级“不及格”;改进方法提高出题质量,对错答题目扣分。5代表“优秀”,这时1、2、3、4、5才具有实际意义,数字按规则被赋予了意义。常模参照测验是一种衡量被试相对水平的测验,是将被试的测验成绩与同类对象在同一测验上的平均分(常模)相比较,从而解释分数,确定被试在总体中的相对位置的测验方法。在使用相关系数表示信度的高低时,相关系数可称为信度系数(coefficientofreliability)。(二)教育测量的结果是相对的个别测量的可靠性比较高,主试能有效地观察控制被试的行为反应,但个别测量费时费力,短时间内难以获得大量的资料,并且对主试的要求较高。5代表“优秀”,这时1、2、3、4、5才具有实际意义,数字按规则被赋予了意义。由专家学者或专门机构采用系统的科学程序编制的、在测验实施过程、评分手续、分数的解释上具有统一标准的,并对测验误差做了严格控制。(二)根据测量的内容分类学业成就测验、智力测验、能力倾向测验、人格测验等。随机误差由于难于控制的偶然因素,使测量结果不准确;产生偶然误差的原因很多,例如读数时,视线的位置不正确,测量点的位置不准确,实验仪器由于环境温度、湿度、电源电压不稳定、振动等因素的影响而产生微小变化,等等,这些因素的影响一般是微小的,而且难以确定某个因素产生的具体影响的大小,因此偶然误差难以找出原因加以排除。竹外桃花三两枝,_____。(三)教育测量更强调直接为实现教育目的服务指测量的编制和实施不按标准程序进行的测量,通常由教师或研究人员自编的、为临时测量所用的简单测量。(一)编制试题的一般原则一个是要有确定的意义,即对同一单位来说所有人的理解是相同的;(一)称名量表(类别量表)是根据事物的某一特点,对事物属性进行分类,用名称或数字来代表事物或性质,是给事物进行简单归类的一种量表形式。如男生为1,女生为2喜欢语文的学生为1,喜欢数学的学生为2称名量表测量的结果不能运算,但可以做统计分析(如计算百分比、列联相关、卡方检验)建立常模、确定指导语、时限和施测条件;(一)称名量表(类别量67指主试与被试一对一进行的测量(一个主试在同一时间内,只测验一个被试)。试题难度要有一定的分布范围是具有相等的单位,但没有绝对零点的量表。测量对象不同、测量工具不同,无法比英语的卧房是"Sleeproom"常模参照测验要有常模对照表。由专家学者或专门机构采用系统的科学程序编制的、在测验实施过程、评分手续、分数的解释上具有统一标准的,并对测验误差做了严格控制。在统计学中,统计量越接近参数,这个统计量的可靠性越高。5代表“优秀”,这时1、2、3、4、5才具有实际意义,数字按规则被赋予了意义。是具有相等的单位,但没有绝对零点的量表。标准客观测验的各种试题形式由于仪器结构上不够完善或仪器未经很好校准等原因会产生误差。指的是在测量工作中必须具有一个量的起点,这个起点就叫作测量的参照点。在计算客观题的难度时,它就是受测者在回答该题目时含有绝对或真正的零点和统一的单位。有些零点具有实际意义,称绝对零点。有些零点是人定的,称相对零点,如摄氏零度,这里零度并不意味着没有一点温度,而是以人定的冰点为参照标准。一个是要有确定的意义,即对同一单位来说所有人的理解是相同的;表示题目难易程度的数量,称为题目的难度指数,一般用P来表示。(二)顺序量表(等级量表)只有等级顺序而无等距的单位和绝对零点,只是按研究对象的某一种属性的顺序排列出等第次序。如根据学生的测验成绩排出名次,成绩最好的为1,成绩次之为2,再次之为3,依次类推。又如,对于生活水平,我们可以给出四个等级贫困、温饱、小康、富裕。指主试与被试一对一进行的测量(一个主试在同一时间内,只测验一68(三)等距量表(间距量表)是具有相等的单位,但没有绝对零点的量表。等距量表的数量单位之间的间距是相等的,可以相加减。如温度摄氏30度至32度与摄氏18度至20度的温差是相等的,都是相差2度。三个儿童在智商测验中分别得分105、110、115,在智商测验分数体系中,分数差距是相等的。等距量表在学校教育系统运用广泛,一般将百分制评分看作等距量表。(三)等距量表(间距量表)69(四)比率量表(等比量表)除了具有类别、顺序、等距量表的特征外,还有一个具有实际意义的绝对零点。可以加减乘除。零点是指测量的起点或参照点。有些零点是人定的,称相对零点,如摄氏零度,这里零度并不意味着没有一点温度,而是以人定的冰点为参照标准。像学生的考试成绩、智商的0分都是相对零点。有些零点具有实际意义,称绝对零点。如年龄、身高、经费开支等都有绝对零点,0岁、0米、0元中的“零”都表示真实的“无”,表示一点都没有。(四)比率量表(等比量表)70量表条件例子称名量表无顺序的测量,只是指出有两个或多个范畴。中学的类型:公立、私立、职业、普通等。顺序量表是有顺序有测量,在于指出所测量的范畴的不同并能够按一定的顺序排列。字母的排列系统、学习态度。等距量表有顺序的测量,在量表中表现为数量上的等距变化数学成绩测量的标准分数。比率量表含有绝对或真正的零点和统一的单位。高度、体重上述四种量表的比较:量表条件例子称名量表无顺序的测量,只是指出有两个或多个范畴。71衡量教育测量的质量,可采用四个指标信度主要对整个测量而言。效度难度主要对测量的项目而言。区分度二、测量的条件衡量教育测量的质量,可采用四个指标二、测量的条件72一、信度信度(reliability)指的是测量结果的稳定性和可靠的程度,亦即测量的结果是否真实、客观地反映了受测者的实际水平。具体而言,可以从以下三方面来理解测量的信度1.信度指实测值和真值相差的程度2.信度指统计量与参数之间的接近程度3.信度指两次重复测验或等值测验之间的关联程度一、信度信度(reliability)指的是测量结果的稳定性731.信度指实测值和真值相差的程度x=T+E(公式11)x表示实测值,T表示真值(是未知的,可以把多次测量的实测值的平均值作为真值的近似值),E表示误差。E=xT(公式12)1.信度指实测值和真值相差的程度x=T+E(公式11)74试比较以下两次测量结果(只进行一次)的信度用尺子量100cm高的一个儿童,得到1cm的绝对误差;量185cm高的一位运动员,也得得到1cm的绝对误差。要比较两种测量结果的信度,一定要看误差分数(E)对于真分数(T)所占的百分数是多少。这个百分数表示该实得分数(x)的相对误差。其计算式如下相对误差=E/T×100%公式(13)把上述两次测量(设为甲和乙)和绝对误差分数和真分数代入上式,得相对误差(甲)=1/100×100%=1%相对误差(乙)=1/185×100%=0.54%据此,度量乙的信度要比度量甲的信度高。试比较以下两次测量结果(只进行一次)的信度75(三)等距量表(间距量表)信度指两次重复测验或等值测验之间的关联程度当我们规定1代表学业成绩的最低等级“不及格”;如年龄、身高、经费开支等都有绝对零点,0岁、0米、0元中的“零”都表示真实的“无”,表示一点都没有。由专家学者或专门机构采用系统的科学程序编制的、在测验实施过程、评分手续、分数的解释上具有统一标准的,并对测验误差做了严格控制。温度、各种能力分数、智商;常模参照测验是一种衡量被试相对水平的测验,是将被试的测验成绩与同类对象在同一测验上的平均分(常模)相比较,从而解释分数,确定被试在总体中的相对位置的测验方法。试题内容广泛,评分客观,提供选择的答案多,可以减少猜中题目的机会。常模参照测验要有常模对照表。如根据学生的测验成绩排出名次,成绩最好的为1,成绩次之为2,再次之为3,依次类推。在计算客观题的难度时,它就是受测者在回答该题目时测被试的需要、动机、兴趣、态度、气质、性格、人际关系等人格心理特征,较为著名的有明尼苏达多相个性测验(MMPI)、艾森克人格问卷(EPQR)、卡特尔16项人格因素测验(16PF)等。据此,度量乙的信度要比度量甲的信度高。区分度是指一个题目区分所有受试者的能力。正确回答的人数在全体受测者中所占的比例。标准化测验所获得的测量结果比较客观、可靠、应用范围较广,一般测量调查应尽可能选用标准化的测验工具。如根据学生的测验成绩排出名次,成绩最好的为1,成绩次之为2,再次之为3,依次类推。指主试与被试一对一进行的测量(一个主试在同一时间内,只测验一个被试)。把事物或人的属性加以数量化,用可以比较的数值计量学习的成果。(四)比率量表(等比量表)团体测量节省人力与时间,在短时间内能收集到大量的资料,效率较高,但被试的反应不容易控制,并且测量效果不及个别测量可靠。统计量是指样本上的各种数字特征。(如样本平均数、标准差等);参数是总体上的各种数字特征(如总体平均数、标准差等)。在统计学中,统计量越接近参数,这个统计量的可靠性越高。而要知道统计量与参数的接近程度,可以对参数进行区间估计。2.信度指统计量与参数之间的接近程度(三)等距量表(间距量表)统计量是指样本上的各种数字特征。(763.信度指两次重复测验或等值测验之间的关联程度统计学中估计事物或现象间数量变动的一致性,主要采用相关分析的方法,即计算出两种变量的相关系数(rxy)。在使用相关系数表示信度的高低时,相关系数可称为信度系数(coefficientofreliability)。它是对相同应试者的同一特性的两次测量分数的相关系数,是测量结果的一致性的指标。3.信度指两次重复测验或等值测验之间的关联程度统计学中估计77提高测量信度的方法1.测题要有一定数量

延长测验的长度,既可排除试题抽样的偶然性因素,也有可能扩大得分的范围,因而使信度系数增大,测验信度提高。2.测题难度适中3.测题内容要有同质性,不要包含过多性质不同的内容4.测验时间要充分5.评分要客观提高测量信度的方法1.测题要有一定数量78是测验的准确性,是测验能够测出它所欲测的特质的程度,即测验实际测量出其所要测量特性的程度。

含义二、效度是测验的准确性,是测验能够测出它所欲测的特质的程度,即测验实79提高效度的注意事项(1)要控制系数误差,即控制测验过程的误差;(2)精心编制测题,分析教学目标,编制双向细目表,测题表述简明易懂,测量有必要的覆盖面。(3)妥善组织测验。提高效度的注意事项(1)要控制系数误差,即控制测验过程的误差80

难度是指题目的难易程度。表示题目难易程度的数量,称为题目的难度指数,一般用P来表示。

试题卷面的难度值范围是0.4~0.7由于测题记分的方法不同,所以难度的估计方法也不同。三、难度

难度是指题目的难易程度。表示题目难易程度的数量,称为题811.在计算客观题的难度时,它就是受测者在回答该题目时正确回答的人数在全体受测者中所占的比例。2.当题目的分数为多值时(包括主观题或一些分步解答的题目),难度就是全体平均分与题目满分的比例。难度是指测验项目的难易程度,试题的难度可以用试题的通过率来表示。1.在计算客观题的难度时,它就是受测者在回答该题目时难度是82第十一章教育测量法培训课件83第十一章教育测量法培训课件84区分度是指一个题目区分所有受试者的能力。(题目的区分度是衡量题目对测量目的所做的贡献大小程度的指标。它反映了一个题目的鉴别能力。因此区分度又称题目的鉴别度。)四、区分度

区分度是指一个题目区分所有受试者的能力。(题目的区分度是衡量85D越高则质量越好。0.2以下应淘汰第十一章教育测量法培训课件86练习A.称名数据B.顺序数据C.等距数据D.等比数据性别、颜色分类、人口数、学校数;身高、体重;温度、各种能力分数、智商;学生等级评定、喜爱程度、品质等级、能力等级、兴趣等。练习87第十一章教育测量法培训课件88第三节教育测量的类型与方法(一)根据测量的标准化程度分类标准化测量、非标准化测量1.标准化测量由专家学者或专门机构采用系统的科学程序编制的、在测验实施过程、评分手续、分数的解释上具有统一标准的,并对测验误差做了严格控制。编制和施测有一套标准程序。测验编制包括确定测验目的、科学命题、选取有代表性的样本进行试测;根据数量化指标筛选测验题目;鉴定整个测验的信度和效度;建立常模、确定指导语、时限和施测条件;规定评分标准、分数转换和解释方法等。标准化测验所获得的测量结果比较客观、可靠、应用范围较广,一般测量调查应尽可能选用标准化的测验工具。第三节教育测量的类型与方法(一)根据测量的标准化程度分类892.非标准化测量(教师自编测量)指测量的编制和实施不按标准程序进行的测量,通常由教师或研究人员自编的、为临时测量所用的简单测量。如课堂测验、考试、等级评定量表等。这些测量是教师根据教学目标和自己的教学经验编制而成,它通常与日常教学工作紧密联系;测验内容与教材内容、教学进度一致;难易程度由教师把握;针对性较强。编制省时、省力、灵活、方便。不足之处在于测验的客观性和标准化程度不如标准化测验,测验的实施和记分也不甚严格。2.非标准化测量(教师自编测量)90(二)根据测量的内容分类学业成就测验、智力测验、能力倾向测验、人格测验等。1.学业成就测验测被试经某种形式的学习或训练后对知识、技能的掌握程度或熟练水平。如识字量、阅读、算术测验等,成就测验可以是学科成就测验或综合成就测验。2.智力测验测被试的智力高低,其结果常以智商(IQ)来表示,此类测验比较多,其中比较著名的有斯坦福——比纳智力测验、韦克斯勒儿童智力测验量表(WISCCR)、瑞文推理测验等。(二)根据测量的内容分类学业成就测验、智力测验、能力倾向测验913.能力倾向测验测被试潜在的某种能力,以了解其发展的可能性,预测个人能力发展倾向。如音乐、美术、体育、创造力、想象力、记忆力等方面的能力倾向测验。4.人格测验测被试的需要、动机、兴趣、态度、气质、性格、人际关系等人格心理特征,较为著名的有明尼苏达多相个性测验(MMPI)、艾森克人格问卷(EPQR)、卡特尔16项人格因素测验(16PF)等。3.能力倾向测验92(三)根据测量结果的评价标准分为常模参照测验、目标参照测验。1.常模参照测验常模参照测验是一种衡量被试相对水平的测验,是将被试的测验成绩与同类对象在同一测验上的平均分(常模)相比较,从而解释分数,确定被试在总体中的相对位置的测验方法。常模参照测验要有常模对照表。常模有地区性常模和全国性常模,地区性常模只适用于特定的区域,如在城市获得的常模就不一定适用于农村或边远地区,而全国性常模适用于全国所有的同类个体。如,儿童的身高、体重就有全国性常模,中国儿童发展量表(36岁)就有全国性常模。只要我们将个体实际测量的数据与常模一对照,就可以知道个体所处的地位。(三)根据测量结果的评价标准分为常模参照测验、目标参照测验。93(一)编制试题的一般原则是有顺序有测量,在于指出所测量的范畴的不同并能够按一定的顺序排列。测量就是根据某种规则把所观察的对象的属性予以数值化的过程,以表明被测对象通过作业和活动所达到的程度或量的多少。零点是指测量的起点或参照点。它是对相同应试者的同一特性的两次测量分数的相关系数,是测量结果的一致性的指标。这个百分数表示该实得分数(x)的相对误差。由于测题记分的方法不同,所以难度的估计方法也不同。优选第十一章教育测量法性别、颜色分类、人口数、学校数;它是对相同应试者的同一特性的两次测量分数的相关系数,是测量结果的一致性的指标。表示题目难易程度的数量,称为题目的难度指数,一般用P来表示。一个是要有确定的意义,即对同一单位来说所有人的理解是相同的;规定评分标准、分数转换和解释方法等。比如长度和重量测量就是建立在以绝对的零点为参照点的基础上的测量。x表示实测值,T表示真值(是未知的,可以把多次测量的实测值的平均值作为真值的近似值),E表示误差。如温度摄氏30度至32度与摄氏18度至20度的温差是相等的,都是相差2度。(二)教育测量的结果是相对的5代表“优秀”,这时1、2、3、4、5才具有实际意义,数字按规则被赋予了意义。由专家学者或专门机构采用系统的科学程序编制的、在测验实施过程、评分手续、分数的解释上具有统一标准的,并对测验误差做了严格控制。指一个主试能同时对许多被试进行的测量。如,尺是度量长度的量表,血压计是测量血压高低的量表,智力测验是测量智商高低的量表。如,儿童的身高、体重就有全国性常模,中国儿童发展量表(36岁)就有全国性常模。在计算客观题的难度时,它就是受测者在回答该题目时问渠那得清如许,_____。由专家学者或专门机构采用系统的科学程序编制的、在测验实施过程、评分手续、分数的解释上具有统一标准的,并对测验误差做了严格控制。题目容易编写,容易计分。学生成绩为0分,不代表其没有能力,因而要结合质与量。问渠那得清如许,_____。(二)顺序量表(等级量表)如根据学生的测验成绩排出名次,成绩最好的为1,成绩次之为2,再次之为3,依次类推。也就是说,要构建一套如何分派数字或符号的准则,按准则对测量内容进行规范化、标准化的操作。如地势高度的测量,就是以海平面为测量的起点。但是教育与心理测量中的单位往往很难达到这个要求,它远不如其他测量中使用的单位成熟和完善。测量需要有测量的工具,测量的工具应具有单位和参照点,并且有表示量数的方法,我们把这种工具称之为量表。信度指统计量与参数之间的接近程度(三)诊断学习困难,解释成绩不良的原因通俗地说,就是根据一定的规则,给事物分派数字。量185cm高的一位运动员,也得得到1cm的绝对误差。主要对整个测量而言。(一)编制试题的一般原则指一个主试能同时对许多被试进行的测量942.目标参照测验又称标准参照测验,是衡量被试实际水平的测验,将被试在测验上的分数与事先制定好的某种标准进行比较,看

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论