版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三讲测验的质量分析§3.1测验的信度§3.2测验的效度§3.3测验的难度§3.4测验的区分度第三讲测验的质量分析§3.1测验的信度1§3.1测验的信度一、信度的定义二、信度系数的计算三、提高测验信度的途径§3.1测验的信度一、信度的定义2测验的信度是指测验结果的可靠性或可靠程度。可靠性是指对同一组对象进行两次相同测量所得结果的一致性和稳定性程度。一、信度的定义测量学中,信度可定义为真分数方差与实得分数方差的比率,即(3.1.1)这表明,真分数方差在实得分数方差中所占的比重越大,则信度就越高。由于是未知数,所以根据误差方程可将公式(3.1.1)改写为(3.1.2)而和都可以从一组实得分数中计算出来,所以(3.1.2)式更有实际意测验的信度是指测验结果的可靠性或可靠程度。可靠3从公式(3.1.1)或(3.1.2)看出,若真分数T与实得分X接近时,和也会接近,而误差及就会很小,此时信度就会增大。可见,信度是实测值与真值之间差距大小的量度。测验信度越高,误差就越小,测验的结果也越可靠。理想情况下,误差为零时,信度达到最大值;当信度很低,甚至降为零时,表明测验分数中充满误差,它比不测验还糟。信度的值在(0~1)之间,称为信度系数。当为0.95~0.99时,测验可靠性很高,但不常见;为0.9~0.94是通常能得到的最好结果;为0.8~0.9也比较好;为0.7~0.79尚可使用,在0.7以下,表明误差太大,该测验不能使用。
从公式(3.1.1)或(3.1.2)看出,若真4实际工作中,通过对测验结果的一致性程度来计算信度的,主要有三种:稳定性系数、等值性系数和内在一致性系数。1、稳定性系数(再测信度)用同一个测验,对同一组考生前后两次进行测验,两次测验分数的相关系数为再测信度.因为它能反映两次测验结果的一致性和稳定程度,也称稳定系数。其计算公式为:
(3.1.3)式中X1和X2为同一考生两次的测验分数,为两次测验的平均分数,S1和S2为两次测验的标准差,N为考生人数。二、信度系数的计算212121/SSXXNXXXXå-=g二、信度系数的计算212121/SSXXNXXXXå-=g5再测信度的计算在使用时,两次测验之间的时间间隔要适宜,相隔时间不要太短,也不宜太长。再测法适用于速度测验而不适用于难度测验,同时要提高考生的积极性,使他们认真负责的参加每次测验。2、等值性系数(复本信度)两个等值但具体内容不同的测验,在最短时距内,对相同考生分两次测验所得分数的相关系数即为复本信度,计算公式与(3.1.3)相同。所谓等值是指测验在题型、题数、难易、时限以及题目内容和形式等方面相同或相似。3、内部一致性系数内部一致性系数是同一个测验的两部分得分的相关系数,有两种计算方法:①分半信度分半法是按正常的程序实施测验,然后将全部试题分成相等的两半(通常采用奇偶分半法),根据各人在这两半测验的分数计算其相关系数。由于这样求得的只是半个测验的信度,因此要用斯皮尔曼-布朗(Spearman-Brown)公式较正,校正公式为:(3.1.4)式中为两半测验的相关系数,为整个测验的信度值。再测信度的计算在使用时,两次测验之间的时间间隔6例1若10名学生奇数题得分与偶数题分如下表所示,试求这份整体试卷的分半信度。学生124567891011x3835212742141428287y303281825152221179解:由上表可求得于是再由公式(3.1.4)得例1若10名学生奇数题得分与偶数题分如下表7②库-理信度系数公式库德(Kuder)、理查逊(Richardson)和克朗巴赫(Cronbach)因不满意半分法,从方差分析的角度提出了以试题统计量为转移的信度求法,可避免任意两半分的误差。他们提出的适用于客观题试卷的一系列公式,较为常用的是K—R20公式:
(3.1.7)式中n是测题数,Pi是第i题的答对率(难度指数),为第i题的答错率,显然,为所取样本中考生总分的方差。此外,因,从而使括号中的值不等于1,故乘以修正系数以使信度估计值不致偏小。②库-理信度系数公式8例2某省年度教育自学考试《英语泛读》试卷由100题组成,每题答对得1分,不答或答错得0分,现分层按比例抽取50份试卷,并规定奇号题得分为x,偶号题分得为y,列表如下(表3.1),试用库—理公式计算信度。
表3.1《英语泛读》50份试卷的奇偶题得分
学生编号12345678910x815819151520232019y10101520221916161716学生编号11121314151617181920x16232121242219272520y21182619222121221623学生编号21222324252627282930x23242124232828312828y21232018261826212823学生编号31323334353637383940x26332726273031243329y24262828292126293131学生编号41424344454647484950x37283133363539424641y26343033373737363740例2某省年度教育自学考试《英语泛读》试卷由9解:先计算样本中考生的总分方差,再逐题计算后求和,第1题有43人答对,答对率:则答错率,于是所有题的。然后由库-理公式得
库-理还提出另一公式,用来计算同质性信度时,不需要逐题计算通过率,该公式为公式:
(3.1.8)其中为测验总分的平均数。解:先计算样本中考生的总分方差10③克朗巴赫公式克朗巴赫提出了论文式测验的信度公式(α系数),其基本想法是以每题得分的方差来代替:(3.1.10)式中n为测题数,为所取样本的总分方差,为样本的第题得分方差。例3某校《写作》试卷由三题组成,样本容量为100,算得总分标准差,第一、二、三题的得分标准差为,求该测验的信度。
解:根据克朗巴赫公式可算得信度为α系数法能编成程序由电子计算机求得结果。③克朗巴赫公式114、评分者的信度当测验是论文式试题时,不同评分者对同一试卷的评分结果不相同,因为此时误差主要来自评分者的差异。主要计算公式为:
(3.1.11)式中K为评分者人数,N为评分的试卷数,是第题等级和。例4有6位教师各自评阅五篇作文,每位教师给每篇作文都评了等级,并列入下表,向6位评分者所评等级的一致性如何?4、评分者的信度例4有6位教师各自评阅五篇12评分者作文编号(N=5)12345A35241B35241C34152D35142E35241F35241Ri182910258解:代入公式(3.1.11),注意,则评分者作文编号(N=5)12345A35241B35241C13三、提高测验信度的途径1、适当增加题量:增加样本容量,减小抽样误差,使信度增高。加长测验后的信度计算公式为:(3.1.18)式中为原测验的信度,为加长的倍数,为加长倍后的信度。例6原来由6道题组成的测验,其信度,现在要求信度提高到,需要加长到多少试题?解:由(3.1.18)式得
加长后的题数=原长。三、提高测验信度的途径142、用标准化考试:尽量减少各环节的测验误差,特别是提高命题质量,试题难度中等,区分度要大(见§3.14)。3、消除考生焦虑情绪:充分作好考前指导,试卷编排应由易到难,以利稳定考生情绪使其智能得到正常发挥。4、测验内容具有同质性:不要在一个测验中按排许多性质不同的内容,这样会降低一致性,影响信度2、用标准化考试:尽量减少各环节的测验误差,特别是提高命题质15§3.2测验的效度一、效度的定义二、效度的估算
§3.2测验的效度一、效度的定义16效度是指测验结果的有效性或正确性,所谓有效性,是指一种测验能够正确地测量出它所要测量的特性或功能的程度。一、效度的定义测量学中,效度被定义为有效分数方差与实得分数方差之比,即:(3.2.1)由误差方程可知,当随机误差足够小而且不变时,系统误差方差越小,则有效分数方差就越大;亦即有效分数方差在实得分数方差中所占的比重越大,也就是说效度也就越高。效度要解决两个问题:本测验的测量目标是什么;本测验对于所要测量的目标能测到什么程度。公式(3.2.1)对效度的定义告诉我们,只有当有效分数方差在实得分数方差中所占的比重越大,那么,达到测验目标的程度也就越大,因而效度也就越高。效度的取值为。效度是指测验结果的有效性或正确性,所谓有效性,17二、效度的估算
1、内容效度内容效度是指测验内容对所要测验的全部内容的取样代表性程度。一个测验具备良好的内容效度应满足两个条件:①测验内容范围要明确,对学生成绩测验来说,就是试题要符合教材内容和教学大纲,试题不应该超出确定的范围。②试题应是已界定的内容范围的代表性样本,它应该覆盖所测验内容的主要方面,并使各部分题目所占比例适当。确定内容效度的常用的方法是由专家对试题及所涉及的范围进行符合性判断。内容效度适合于评价学业成绩测验和职业选拔测验,对目标参照测验更为重要,因为在目标参照测验中,我们主要关心的是考生在一定范围内的知识技能掌握得如何。二、效度的估算182、效标关联效度
效标关联效度是指测验分数与作为效标的另一独立测验结果之间的一致性程度,一般是用本测验分数与效标测验结果之间的相关系数表示。所谓效标,是用来检测效度的参照标准,效标关联效度可分为以下两种:
①同时效度:是一种测验的结果与另一大约同时获得的测验结果(即效标)之间的一致程度,并用两个测验结果的相关系数来估算,同时效度常用于标准化测验的建立。例如,用教师自编的测验施测之后,让考生短期内很快再参加一次被公认是标准化的测验,如果两次考试成绩的相关系数很高,则可以认为教师编制的测验也是标准化测验。例1取10名考生参加摸底考试与全区统一考试的成绩记录于表3.3中,求摸底考试的效标关联效度。2、效标关联效度19
12345678910摸底成绩x92818077716663544544区考成绩y87788075696362524638x·y8004631864005775488941583906280820701672673650
4759744516
表3.3解:我们把区考试成绩作为效标,求它与摸底考试分数的积差相关系数:若用等级相关系数公式计算,应先由表3.3中的数据按等级列表,然后计算:效标效度系数一般应在0.4以上。
12345678910摸底928180777166635420②预测效度:是指某一测验结果与另一将来获得的测验结果之间的相关程度。在这里,效标的建立远在测验之后,目的在于说明某一测验的结果是否具有预测未来另一测验结果的功能。例2假定高中英语考试和大学入学英语考试的平均分数分别为92.57和64.18,标准差分别为21.01和11.13,两次考试间的相关系数为0.68,如果某生在高中英语考试中得分为114,那么他在大学入学英语考试中可能得多少分?解:这种问题可以用回归方程来解决,设为预测的效标分数;和分别为效标分数与测验分数的标准差;分别为效标分数与测验分数的平均数;为测验所得分数,则回归方程如下:
(3.2.3)将本例中数据代入上式得:
所以,这位学生在大学入学英语考试中可能得74分。②预测效度:是指某一测验结果与另一将来获得的测21§3.3测验的难度难度及其计算难度是衡量试题与试卷难易程度的指标,通常可以用如下方法计算难度:1、客观性试题的难度计算①难度指数:对于采用二分法记分的题目,难度以通过率来表示:
(3.3.1)式中为题目的通过率,为答对或通过该题目的人数,为全体考生。此时值越大,难度越小;值越小,难度越大。②极端分组法:当被试人数很多时,用通过率计算难度很麻烦,可以将被试依照总分从高到低排列,然后将总分最高的27%和最低的27%的被试分别定为高分组和低分组,分别计算两组的通过率,然后用下式计算该题难度:(3.3.3)
式中和分别为高分组与低分组的通过率。§3.3测验的难度难度及其计算222、主观性试题的难度计算①难度指数:设为所有考生在某一试题上的平均分,为该题的满分,则(3.3.4)上式适用于论述题、问答题和计算题等非二分法记分的题目。②极端分组法:当被试人数很多时,主观性试题可采用下式计算难度:(3.3.5)式中为高分组所得的总分;为低分组所得总分,和分别为该题的最高和最低得分,为考生总人数的27%。2、主观性试题的难度计算233、难度的测前估算首先了解影响试题难度的因素:①熟悉程度:如果试题与课本中的例题、习题相近,学生熟悉试题内容,难度就高。②信息数量:如果试题中的信息量大,学生要不止一次地阅读才能把握内容,增大了困难。③题目结构:题目类型、知识综合程度、计算复杂程度等,影响难度。
④变化动态:迷惑干扰大的问题灵活易引起错误,增加困难。其次把上述四个因素分成三个等级:1表示小,2表示中等,3表示大。最后估算难度:先估计试题各因素的等级并作为各因素的点数,累加各因素的点数;然后,参照表3.5估计试题的难度:等级CB1B2B3A累加点数4~56~77~99~1011~12难度0.3~0.40.4~0.50.5~0.650.65~0.750.75~3、难度的测前估算等级CB1B2B3A累加点数4~56~77244、试卷的难度是指一份试卷的总体难易程度,用下式计算:
(3.3.6)式中是试卷的满分值,和分别为第道题的难度和满分值,是试卷题目的总数。试卷难度与平均分数之间满足如下关系:(3.3.7)也可以认为试卷难度等于试卷平均分与试卷满分之比,即:
(3.3.8)由上式可知,试卷的难度并不等于各试题难度的平均值。我们也可以把难度转换成正态量来处理,先查正态分布表,由各题的难度查出对应的正态量,则试卷的平均值为:
。再查正态分布表,由值求出试卷的难度。4、试卷的难度25§3.4测验的区分度一、区分度及其计算
区分度是测验试题对考生实际水平的区分程度,区分度的取值范围介于-1.00和+1.00之间。下面介绍几种主要的计算方法:1、极端分组法①客观性试题的区分度计算公式为:(3.4.1),其中分别为高、低分组的通过率。美国测量专家伊贝尔(L.Ebel)把称为鉴别指数,它对评价题目性能的标准如表3.7所示:鉴别指数D题目评价0.4以上0.3~0.390.20~0.290.19以下很好良好,修改会更佳尚可,仍需修改差,必须淘汰表3.7§3.4测验的区分度一、区分度及其计算鉴别指数D题目评价26
②主观性试题的区分度计算公式为:(3.4.2)式中为高分组总分,为低分组总分,为该题最高分,为该题最低分,为考生总人数的27%。
2、相关法
相关法是以某试题的得分与效标分数的相关系数作为该题的区分度指标。一般情况下,效标分数不易得到,则以测验总分代替,求试题得分与该测验总分的相关系数。相关越高,则试题区分度越高。由于总分是连续变量,而试题得分有连续变量和二分变量的不同情况,所以求相关系数可分以下几种情况:②主观性试题的区分度计算公式为:27①积差相关当试题得分与测验总分都属连续变量时,可以采用积差相关法计算区分度,其公式为:(3.4.3)式中为考生某题得分,为考生测验总分;为考生总数。
②二列相关二列相关适用于两个连续变量,但其中有一个被人为分为两个类别,其公式为:
(3.4.4)(3.4.5)①积差相关②二列相关28式中为考生答对某题的平均分,为考生答错某题的平均分;和分别为全体考生测验得分的平均数和标准差;为答对组人数与总人数之比,为答错人数与总人数之比;而且;为与交界处正态曲线的高度。计算二列相关时,要求二分变量的分布在连续测量时必须是正态分布。对连续变量的分布,虽不要求是正态,但必须是单峰而且要对称。
③点二列相关点二列相关适用于一个变量为连续变量,另一个为二分变量的情况,其公式为:
(3.4.7)
(3.4.8)式中符号意义与前面二列相关公式相同。式中为考生答对某题的平均分,为考生29
④φ相关如果测验的两组变量都是二分变量,则可用φ相关计算相关系数,并不要求变量呈正态分布。其公式为:(3.4.9)
合格不合格
通过aba+b不通过cdc+d
a+cb+d
表3.9四格表
3、试卷区分度的计算试卷区分度是指试卷总体对学生水平的区分程度,计算公式为:(3.4.11)其中为第道题的区分度,为试卷的区分度④φ相关(3.4.9)
合格不合格
通过ab30试卷区分度与标准差有如下关系:(3.4.12)其中为标准差,、为回归系数。二、区分度对测验的影响1、区分度与难度的关系我们从方差来看试题区分度和难度和关系。对于以1或0评分的是非性选择题来说,某题的难度即该题上所通过的人数比率:某题对个受试者施测时,答对分数的总和则为,答对分数的平方和应为将上述结果代入方差的计算公式,则有或。试卷区分度与标准差有如下关系:312、区分度与信度的关系一个良好的测验,信度必须要高。艾伯(R.L.Ebel)的研究表明,整个测验中各试题的区分度D值的平均数越高,测验的信度就越高。信度是随区分度的提高而增长的,且信度增长的速度比区分度增长还快,所以,要想使得测验信度达到理想的值,提高各试题区分度是一个好的途径。但是,也必须指出,区分度的大小应根据测验的性质和目的而定,对于以选拔和比较为目的的常模参照测验,区分度越大越好,它便于选拔和比较,而对于以考察被试对知识掌握情况为目的的目标参照测验,区分度已没有多大意义不必过多考虑。2、区分度与信度的关系32第三讲测量的质量分析课件33第三讲测验的质量分析§3.1测验的信度§3.2测验的效度§3.3测验的难度§3.4测验的区分度第三讲测验的质量分析§3.1测验的信度34§3.1测验的信度一、信度的定义二、信度系数的计算三、提高测验信度的途径§3.1测验的信度一、信度的定义35测验的信度是指测验结果的可靠性或可靠程度。可靠性是指对同一组对象进行两次相同测量所得结果的一致性和稳定性程度。一、信度的定义测量学中,信度可定义为真分数方差与实得分数方差的比率,即(3.1.1)这表明,真分数方差在实得分数方差中所占的比重越大,则信度就越高。由于是未知数,所以根据误差方程可将公式(3.1.1)改写为(3.1.2)而和都可以从一组实得分数中计算出来,所以(3.1.2)式更有实际意测验的信度是指测验结果的可靠性或可靠程度。可靠36从公式(3.1.1)或(3.1.2)看出,若真分数T与实得分X接近时,和也会接近,而误差及就会很小,此时信度就会增大。可见,信度是实测值与真值之间差距大小的量度。测验信度越高,误差就越小,测验的结果也越可靠。理想情况下,误差为零时,信度达到最大值;当信度很低,甚至降为零时,表明测验分数中充满误差,它比不测验还糟。信度的值在(0~1)之间,称为信度系数。当为0.95~0.99时,测验可靠性很高,但不常见;为0.9~0.94是通常能得到的最好结果;为0.8~0.9也比较好;为0.7~0.79尚可使用,在0.7以下,表明误差太大,该测验不能使用。
从公式(3.1.1)或(3.1.2)看出,若真37实际工作中,通过对测验结果的一致性程度来计算信度的,主要有三种:稳定性系数、等值性系数和内在一致性系数。1、稳定性系数(再测信度)用同一个测验,对同一组考生前后两次进行测验,两次测验分数的相关系数为再测信度.因为它能反映两次测验结果的一致性和稳定程度,也称稳定系数。其计算公式为:
(3.1.3)式中X1和X2为同一考生两次的测验分数,为两次测验的平均分数,S1和S2为两次测验的标准差,N为考生人数。二、信度系数的计算212121/SSXXNXXXXå-=g二、信度系数的计算212121/SSXXNXXXXå-=g38再测信度的计算在使用时,两次测验之间的时间间隔要适宜,相隔时间不要太短,也不宜太长。再测法适用于速度测验而不适用于难度测验,同时要提高考生的积极性,使他们认真负责的参加每次测验。2、等值性系数(复本信度)两个等值但具体内容不同的测验,在最短时距内,对相同考生分两次测验所得分数的相关系数即为复本信度,计算公式与(3.1.3)相同。所谓等值是指测验在题型、题数、难易、时限以及题目内容和形式等方面相同或相似。3、内部一致性系数内部一致性系数是同一个测验的两部分得分的相关系数,有两种计算方法:①分半信度分半法是按正常的程序实施测验,然后将全部试题分成相等的两半(通常采用奇偶分半法),根据各人在这两半测验的分数计算其相关系数。由于这样求得的只是半个测验的信度,因此要用斯皮尔曼-布朗(Spearman-Brown)公式较正,校正公式为:(3.1.4)式中为两半测验的相关系数,为整个测验的信度值。再测信度的计算在使用时,两次测验之间的时间间隔39例1若10名学生奇数题得分与偶数题分如下表所示,试求这份整体试卷的分半信度。学生124567891011x3835212742141428287y303281825152221179解:由上表可求得于是再由公式(3.1.4)得例1若10名学生奇数题得分与偶数题分如下表40②库-理信度系数公式库德(Kuder)、理查逊(Richardson)和克朗巴赫(Cronbach)因不满意半分法,从方差分析的角度提出了以试题统计量为转移的信度求法,可避免任意两半分的误差。他们提出的适用于客观题试卷的一系列公式,较为常用的是K—R20公式:
(3.1.7)式中n是测题数,Pi是第i题的答对率(难度指数),为第i题的答错率,显然,为所取样本中考生总分的方差。此外,因,从而使括号中的值不等于1,故乘以修正系数以使信度估计值不致偏小。②库-理信度系数公式41例2某省年度教育自学考试《英语泛读》试卷由100题组成,每题答对得1分,不答或答错得0分,现分层按比例抽取50份试卷,并规定奇号题得分为x,偶号题分得为y,列表如下(表3.1),试用库—理公式计算信度。
表3.1《英语泛读》50份试卷的奇偶题得分
学生编号12345678910x815819151520232019y10101520221916161716学生编号11121314151617181920x16232121242219272520y21182619222121221623学生编号21222324252627282930x23242124232828312828y21232018261826212823学生编号31323334353637383940x26332726273031243329y24262828292126293131学生编号41424344454647484950x37283133363539424641y26343033373737363740例2某省年度教育自学考试《英语泛读》试卷由42解:先计算样本中考生的总分方差,再逐题计算后求和,第1题有43人答对,答对率:则答错率,于是所有题的。然后由库-理公式得
库-理还提出另一公式,用来计算同质性信度时,不需要逐题计算通过率,该公式为公式:
(3.1.8)其中为测验总分的平均数。解:先计算样本中考生的总分方差43③克朗巴赫公式克朗巴赫提出了论文式测验的信度公式(α系数),其基本想法是以每题得分的方差来代替:(3.1.10)式中n为测题数,为所取样本的总分方差,为样本的第题得分方差。例3某校《写作》试卷由三题组成,样本容量为100,算得总分标准差,第一、二、三题的得分标准差为,求该测验的信度。
解:根据克朗巴赫公式可算得信度为α系数法能编成程序由电子计算机求得结果。③克朗巴赫公式444、评分者的信度当测验是论文式试题时,不同评分者对同一试卷的评分结果不相同,因为此时误差主要来自评分者的差异。主要计算公式为:
(3.1.11)式中K为评分者人数,N为评分的试卷数,是第题等级和。例4有6位教师各自评阅五篇作文,每位教师给每篇作文都评了等级,并列入下表,向6位评分者所评等级的一致性如何?4、评分者的信度例4有6位教师各自评阅五篇45评分者作文编号(N=5)12345A35241B35241C34152D35142E35241F35241Ri182910258解:代入公式(3.1.11),注意,则评分者作文编号(N=5)12345A35241B35241C46三、提高测验信度的途径1、适当增加题量:增加样本容量,减小抽样误差,使信度增高。加长测验后的信度计算公式为:(3.1.18)式中为原测验的信度,为加长的倍数,为加长倍后的信度。例6原来由6道题组成的测验,其信度,现在要求信度提高到,需要加长到多少试题?解:由(3.1.18)式得
加长后的题数=原长。三、提高测验信度的途径472、用标准化考试:尽量减少各环节的测验误差,特别是提高命题质量,试题难度中等,区分度要大(见§3.14)。3、消除考生焦虑情绪:充分作好考前指导,试卷编排应由易到难,以利稳定考生情绪使其智能得到正常发挥。4、测验内容具有同质性:不要在一个测验中按排许多性质不同的内容,这样会降低一致性,影响信度2、用标准化考试:尽量减少各环节的测验误差,特别是提高命题质48§3.2测验的效度一、效度的定义二、效度的估算
§3.2测验的效度一、效度的定义49效度是指测验结果的有效性或正确性,所谓有效性,是指一种测验能够正确地测量出它所要测量的特性或功能的程度。一、效度的定义测量学中,效度被定义为有效分数方差与实得分数方差之比,即:(3.2.1)由误差方程可知,当随机误差足够小而且不变时,系统误差方差越小,则有效分数方差就越大;亦即有效分数方差在实得分数方差中所占的比重越大,也就是说效度也就越高。效度要解决两个问题:本测验的测量目标是什么;本测验对于所要测量的目标能测到什么程度。公式(3.2.1)对效度的定义告诉我们,只有当有效分数方差在实得分数方差中所占的比重越大,那么,达到测验目标的程度也就越大,因而效度也就越高。效度的取值为。效度是指测验结果的有效性或正确性,所谓有效性,50二、效度的估算
1、内容效度内容效度是指测验内容对所要测验的全部内容的取样代表性程度。一个测验具备良好的内容效度应满足两个条件:①测验内容范围要明确,对学生成绩测验来说,就是试题要符合教材内容和教学大纲,试题不应该超出确定的范围。②试题应是已界定的内容范围的代表性样本,它应该覆盖所测验内容的主要方面,并使各部分题目所占比例适当。确定内容效度的常用的方法是由专家对试题及所涉及的范围进行符合性判断。内容效度适合于评价学业成绩测验和职业选拔测验,对目标参照测验更为重要,因为在目标参照测验中,我们主要关心的是考生在一定范围内的知识技能掌握得如何。二、效度的估算512、效标关联效度
效标关联效度是指测验分数与作为效标的另一独立测验结果之间的一致性程度,一般是用本测验分数与效标测验结果之间的相关系数表示。所谓效标,是用来检测效度的参照标准,效标关联效度可分为以下两种:
①同时效度:是一种测验的结果与另一大约同时获得的测验结果(即效标)之间的一致程度,并用两个测验结果的相关系数来估算,同时效度常用于标准化测验的建立。例如,用教师自编的测验施测之后,让考生短期内很快再参加一次被公认是标准化的测验,如果两次考试成绩的相关系数很高,则可以认为教师编制的测验也是标准化测验。例1取10名考生参加摸底考试与全区统一考试的成绩记录于表3.3中,求摸底考试的效标关联效度。2、效标关联效度52
12345678910摸底成绩x92818077716663544544区考成绩y87788075696362524638x·y8004631864005775488941583906280820701672673650
4759744516
表3.3解:我们把区考试成绩作为效标,求它与摸底考试分数的积差相关系数:若用等级相关系数公式计算,应先由表3.3中的数据按等级列表,然后计算:效标效度系数一般应在0.4以上。
12345678910摸底928180777166635453②预测效度:是指某一测验结果与另一将来获得的测验结果之间的相关程度。在这里,效标的建立远在测验之后,目的在于说明某一测验的结果是否具有预测未来另一测验结果的功能。例2假定高中英语考试和大学入学英语考试的平均分数分别为92.57和64.18,标准差分别为21.01和11.13,两次考试间的相关系数为0.68,如果某生在高中英语考试中得分为114,那么他在大学入学英语考试中可能得多少分?解:这种问题可以用回归方程来解决,设为预测的效标分数;和分别为效标分数与测验分数的标准差;分别为效标分数与测验分数的平均数;为测验所得分数,则回归方程如下:
(3.2.3)将本例中数据代入上式得:
所以,这位学生在大学入学英语考试中可能得74分。②预测效度:是指某一测验结果与另一将来获得的测54§3.3测验的难度难度及其计算难度是衡量试题与试卷难易程度的指标,通常可以用如下方法计算难度:1、客观性试题的难度计算①难度指数:对于采用二分法记分的题目,难度以通过率来表示:
(3.3.1)式中为题目的通过率,为答对或通过该题目的人数,为全体考生。此时值越大,难度越小;值越小,难度越大。②极端分组法:当被试人数很多时,用通过率计算难度很麻烦,可以将被试依照总分从高到低排列,然后将总分最高的27%和最低的27%的被试分别定为高分组和低分组,分别计算两组的通过率,然后用下式计算该题难度:(3.3.3)
式中和分别为高分组与低分组的通过率。§3.3测验的难度难度及其计算552、主观性试题的难度计算①难度指数:设为所有考生在某一试题上的平均分,为该题的满分,则(3.3.4)上式适用于论述题、问答题和计算题等非二分法记分的题目。②极端分组法:当被试人数很多时,主观性试题可采用下式计算难度:(3.3.5)式中为高分组所得的总分;为低分组所得总分,和分别为该题的最高和最低得分,为考生总人数的27%。2、主观性试题的难度计算563、难度的测前估算首先了解影响试题难度的因素:①熟悉程度:如果试题与课本中的例题、习题相近,学生熟悉试题内容,难度就高。②信息数量:如果试题中的信息量大,学生要不止一次地阅读才能把握内容,增大了困难。③题目结构:题目类型、知识综合程度、计算复杂程度等,影响难度。
④变化动态:迷惑干扰大的问题灵活易引起错误,增加困难。其次把上述四个因素分成三个等级:1表示小,2表示中等,3表示大。最后估算难度:先估计试题各因素的等级并作为各因素的点数,累加各因素的点数;然后,参照表3.5估计试题的难度:等级CB1B2B3A累加点数4~56~77~99~1011~12难度0.3~0.40.4~0.50.5~0.650.65~0.750.75~3、难度的测前估算等级CB1B2B3A累加点数4~56~77574、试卷的难度是指一份试卷的总体难易程度,用下式计算:
(3.3.6)式中是试卷的满分值,和分别为第道题的难度和满分值,是试卷题目的总数。试卷难度与平均分数之间满足如下关系:(3.3.7)也可以认为试卷难度等于试卷平均分与试卷满分之比,即:
(3.3.8)由上式可知,试卷的难度并不等于各试题难度的平均值。我们也可以把难度转换成正态量来处理,先查正态分布表,由各题的难度查出对应的正态量,则试卷的平均值为:
。再查正态分布表,由值求出试卷的难度。4、试卷的难度58§3.4测验的区分度一、区分度及其计算
区分度是测验试题对考生实际水平的区分程度,区分度的取值范围介于-1.00和+1.00之间。下面介绍几种主要的计算方法:1、极端分组法①客观性试题的区分度计算公式为:(3.4.1),其中分别为高、低分组的通过率。美国测量专家伊贝尔(L.Ebel)把称为鉴别指数,它对评价题目性能的标准如表3.7所示:鉴别指数D题目评价0.4以上0.3~0.390.20~0.290.19以下很好良好,修改会更佳尚可,仍需修改差,必须淘汰表3.7§3.4测验的区分度一、区分度及其
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 乔迁新居贺词(集锦15篇)
- 雪话题作文(15篇)
- 初一满分作文800字范文5篇
- 简历的自我评价汇编15篇
- 升学宴学生演讲稿合集15篇
- 特钢企业突发环境事件应急预案
- 公交站亭基础及铺装施工合同(2篇)
- 商场场地租赁协议书范本
- 货车租赁协议书样书
- 公租房协议范本
- 湖北省武汉市青山区2022-2023学年五年级上学期数学期末试卷(含答案)
- 《入侵检测与防御原理及实践(微课版)》全套教学课件
- IT企业安全生产管理制度范本
- 工业传感器行业市场调研分析报告
- 小学生心理健康讲座5
- 上海市市辖区(2024年-2025年小学五年级语文)部编版期末考试((上下)学期)试卷及答案
- 国家职业技术技能标准 X2-10-07-18 陶瓷工艺师(试行)劳社厅发200633号
- 人教版八年级上册生物全册教案(完整版)教学设计含教学反思
- 2024年银行考试-银行间本币市场交易员资格考试近5年真题附答案
- 人教版小学四年级数学上册期末复习解答题应用题大全50题及答案
- 冀教版五年级上册脱式计算题100道及答案
评论
0/150
提交评论