化学教学测量与评价_第1页
化学教学测量与评价_第2页
化学教学测量与评价_第3页
化学教学测量与评价_第4页
化学教学测量与评价_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、化学教学测量与评价化学教学测量与评价 1.化学试卷和命题质量分析化学试卷和命题质量分析 2.常用的统计概念和特征量常用的统计概念和特征量一、难度一、难度难度是反映试题难易程度的数据。难度记为难度是反映试题难易程度的数据。难度记为p。难。难度的计算公式如下:度的计算公式如下:每一道试题:每一道试题:对客观试题对客观试题 (1)(r:答对试题人数:答对试题人数 n:考试人数):考试人数)对一般主观性试题对一般主观性试题 (2)( :该试题每个考生的得分该试题每个考生的得分 :得分总和:得分总和 a:该试题的赋分)该试题的赋分)即难度又等于试题的平均分除以试题的赋分。即难度又等于试题的平均分除以试题

2、的赋分。nrp anxpi.axixix 主主观性试题和客观性试题难度公式本质上是一观性试题和客观性试题难度公式本质上是一样的,都是得分率。客观性试题得分情况只有两样的,都是得分率。客观性试题得分情况只有两种,要么答对得满分,要么打错得零分。因此公种,要么答对得满分,要么打错得零分。因此公式(式(1)是公式()是公式(2)的特例(分子分母都约去了)的特例(分子分母都约去了赋分值赋分值a)。)。 按此计算法按此计算法p值越大则题目越容易,这与我值越大则题目越容易,这与我们习惯认为难度大小正相反。为顺应习惯,也有们习惯认为难度大小正相反。为顺应习惯,也有不少书使用打错得比率不少书使用打错得比率p(

3、q)表示难度)表示难度p=1-q或或q=1-p。 由上述公式可看出,由上述公式可看出,0p1.当当p=0时,说明时,说明无一人答对,极难。当无一人答对,极难。当p=1时,说明全部得分,时,说明全部得分,极易。经验表明,对一般常规考试极易。经验表明,对一般常规考试p值在值在0.30.8的试题应占全卷试题总数的比较适宜。的试题应占全卷试题总数的比较适宜。 二、区分度二、区分度试题所具有的按考生实际程度把他们区分开来的能力,称为试试题所具有的按考生实际程度把他们区分开来的能力,称为试题的区分度,或称高低相差指数,鉴别能力指数,记为题的区分度,或称高低相差指数,鉴别能力指数,记为d。1.相关系数法相关

4、系数法考生总分的高低,是由每一道试题得分的高低来决定的,总分考生总分的高低,是由每一道试题得分的高低来决定的,总分高的考生,相应每一道题都得到较高的分数,反之亦然。这就是说,高的考生,相应每一道题都得到较高的分数,反之亦然。这就是说,当考生在每道试题上的得分与他的总分之间成正相关时,程度好的当考生在每道试题上的得分与他的总分之间成正相关时,程度好的考生(总分高),在此题得到高分数,这就满足了区分度的要求。考生(总分高),在此题得到高分数,这就满足了区分度的要求。如果正相关越强,区分能力越强。于是区分度计算公式为(求相关如果正相关越强,区分能力越强。于是区分度计算公式为(求相关系数的积差相关公式

5、)系数的积差相关公式)(n:考生总人数,不小于:考生总人数,不小于30,x:某一试题各个考生的得分,:某一试题各个考生的得分,y:对应于对应于x的考生的总分)的考生的总分)用相关系数法求用相关系数法求d值具有普遍意义,若得出值具有普遍意义,若得出d为负值或为负值或d0.2的试题,的试题,一般应剔除。一般应剔除。0.2d0.4时,一般认为时,一般认为有较好的区分度。有较好的区分度。2222)()(yynyxnyxxynd 2.得分率求差法得分率求差法 将占总考生人数的将占总考生人数的27%的总分高的考生作为的总分高的考生作为高分组,高分组,27%的总分低的考生作为低分组,某一的总分低的考生作为低

6、分组,某一试题在高分组的平均得分率与低分组的平均得分试题在高分组的平均得分率与低分组的平均得分率之差就是该题的区分度。率之差就是该题的区分度。( :高分组该题得分总和,:高分组该题得分总和, :低分组该题得分:低分组该题得分总和,总和,n:高分组或低分组人数,即为总人数的:高分组或低分组人数,即为总人数的27%, :回答本题所得的最低分,一般为零分):回答本题所得的最低分,一般为零分))(lhlhxxnssdhslshx 该法又称为约翰逊法,此法忽略了高分组、该法又称为约翰逊法,此法忽略了高分组、低分组各自内在的区分情况,只是注意了高低组低分组各自内在的区分情况,只是注意了高低组之间的差别。用

7、此法所得之间的差别。用此法所得d值偏低,弗拉南根对值偏低,弗拉南根对此作了修正,可查修正表将计算此作了修正,可查修正表将计算d值加以修正。值加以修正。 按此法算出区分度按此法算出区分度d后,则难度为:后,则难度为: 2低分组答对率高分组答对率p三、信度三、信度 表示一份试卷的稳定性和可靠性的数据,称为试卷的信度。它表示用表示一份试卷的稳定性和可靠性的数据,称为试卷的信度。它表示用同一种试题对学生在不同场合,不同时间进行几次考核所得结果的同一种试题对学生在不同场合,不同时间进行几次考核所得结果的一致程度。一致程度。第一种是第一种是“重复测试法重复测试法”。第二种是第二种是“平均测试法平均测试法”

8、。第三种是第三种是“分半相关法分半相关法”。考虑到这种做法已将全卷题目分成两份,每部分只取总体量的一半,无考虑到这种做法已将全卷题目分成两份,每部分只取总体量的一半,无形中缩短了试卷的长度,影响了全卷原来应有的信度,需要作补长形中缩短了试卷的长度,影响了全卷原来应有的信度,需要作补长矫正,公式为矫正,公式为( :全卷的信度系数,:全卷的信度系数, :奇偶两部分的相关系数):奇偶两部分的相关系数) 一般信度一般信度r的最高值为的最高值为1.0,若,若r为零,表示考试的成绩根本不可靠。为零,表示考试的成绩根本不可靠。一般认为一般认为r在在0.9左右既有较高的信度。左右既有较高的信度。hhhhttr

9、rr12ttrhhr 四、效度四、效度 效度是反映试卷的准确性和有效性的数据,效度是反映试卷的准确性和有效性的数据,它反映了我们希望测到的与实际测到的相符合的它反映了我们希望测到的与实际测到的相符合的程度,是一个程度上的概念,只有高低之分,不程度,是一个程度上的概念,只有高低之分,不宜断然说一份试卷完全有效或完全无效。宜断然说一份试卷完全有效或完全无效。 高效度必然有高信度,反之不然,高信度不一定是高效度。高效度必然有高信度,反之不然,高信度不一定是高效度。 提高效度的主要途径是:考试内容和范围要涉及教学的主提高效度的主要途径是:考试内容和范围要涉及教学的主要内容,考试中要尽量将与测验目的无关

10、的成分除去,试要内容,考试中要尽量将与测验目的无关的成分除去,试题的难度适当,评分、计分的标准要统一、客观等。题的难度适当,评分、计分的标准要统一、客观等。. . . . . . . . . . . . . . . . . . . . . . . . . . 2.常用的统计概念和特征量常用的统计概念和特征量 统计图统计图统计图由标题、图号标目、图注等项构成统计图由标题、图号标目、图注等项构成。1. 直条图直条图 2. 圆形图圆形图3. 线条图线条图4. 频数颁布直方图频数颁布直方图图图.4中考化学统计成绩直方图中考化学统计成绩直方图5. 累积频数图累积频数图图图.5 2004年中考化学抽样得分

11、情况累积频数图年中考化学抽样得分情况累积频数图 10 20 30 40 50 60 70 80 90 100图2.6:高一语文 频数分布图频数分布图 1)直方图)直方图 a、建立直角坐标系,、建立直角坐标系,把频数分布表的上、把频数分布表的上、下限,组中值列在横下限,组中值列在横轴上,以频数作纵轴。轴上,以频数作纵轴。 b、依频数分布表,定、依频数分布表,定出各组频数高度,并出各组频数高度,并在各组频数高度处划在各组频数高度处划一横线,与各组上、一横线,与各组上、下限上的两条纵线相下限上的两条纵线相交,形成一个矩形,交,形成一个矩形,各矩形间不能留空隙。各矩形间不能留空隙。 2)多边图)多边图

12、 a建立直角坐标系,把建立直角坐标系,把频数分布表的上、下频数分布表的上、下限,组中值列在横轴限,组中值列在横轴上,以频数作纵轴。上,以频数作纵轴。 b 依频数分布表,以依频数分布表,以各组的中点为横坐标,各组的中点为横坐标,以各组的频数为纵坐以各组的频数为纵坐标描点,然后把每相标描点,然后把每相邻两点用直线连接,邻两点用直线连接,即成多边图。即成多边图。 3、频数分布曲线、频数分布曲线 如如分数的数目逐渐增分数的数目逐渐增多,组数渐增,组距多,组数渐增,组距渐小,则曲线将变光渐小,则曲线将变光滑,此光滑曲线称为滑,此光滑曲线称为频数分布曲线。频数分布曲线。 依学生的测验分布绘依学生的测验分布

13、绘成的频数分布曲线,成的频数分布曲线,一般有以下几种一般有以下几种正偏态负偏态双峰型 单狭峰正态分布图正态分布图n偏正态分布偏正态分布 一、算术平均数一、算术平均数 二、众数二、众数众数是指次数分布出现次数最多的数据。用众数是指次数分布出现次数最多的数据。用mo表示表示众数的计算一般可用统计观察法。例如某班化学众数的计算一般可用统计观察法。例如某班化学试卷中选择题的错误情况统计如下:试卷中选择题的错误情况统计如下:nxx选择题错误选择题错误个数个数0 01 12 23 34 45 56 67 7计总计总试卷份数试卷份数565687871141141371375656282811118 8500

14、500那么选择题错误个数那么选择题错误个数3是近似众数,因为选错是近似众数,因为选错3个的试卷有个的试卷有137份之多,是首位的。份之多,是首位的。例:甲、乙两位学生成绩如下所示例:甲、乙两位学生成绩如下所示语文语文数学数学物理物理化学化学政治政治英语英语平均平均甲甲9595909065657070757585858080乙乙110110707095955050808075758080如何来评价两个学生的成绩呢?如何来评价两个学生的成绩呢?先用下面的图作直观的分析先用下面的图作直观的分析由图可见乙的成绩离开平由图可见乙的成绩离开平均(离中)趋势越大,即各科成均(离中)趋势越大,即各科成绩离散的

15、程度大;甲的成绩离散绩离散的程度大;甲的成绩离散程度小,成绩总的来看比较平稳。程度小,成绩总的来看比较平稳。平均分数在这里没有起作平均分数在这里没有起作用,它反映不了各科成绩的差异用,它反映不了各科成绩的差异情况。情况。表示一组数据离散程度表示一组数据离散程度(集中趋势)的数量,称为差异(集中趋势)的数量,称为差异量数。差异量数有多种,这里主量数。差异量数有多种,这里主要介绍应用最广的方差和标准差。要介绍应用最广的方差和标准差。三、方差三、方差一组数据每一数与平均数的差的平方的平均称为方差,一组数据每一数与平均数的差的平方的平均称为方差,记为记为 。已知一组数据已知一组数据x:x1、x2、x3

16、xn,其算术平均,其算术平均数为,则方差为:数为,则方差为:2nxxxxxxxxn22322212.nxxi22四、标准差四、标准差 方差的算术平方根即为标准差,记为方差的算术平方根即为标准差,记为nxxi2222nxnxiinx22nx(2)式与(式与(1)等价,它表示一组数据的方差,等于这)等价,它表示一组数据的方差,等于这组数据平方的平均(组数据平方的平均( )与平均的平方)与平均的平方 之差。之差。它有利于记忆,在实际计算中也比较方便。它有利于记忆,在实际计算中也比较方便。前例中甲、乙两位学生各科学习成绩的标准差:前例中甲、乙两位学生各科学习成绩的标准差:甲:甲: (利用公式(利用公式

17、(1)乙:乙: (利用公式(利用公式(2)可知乙的标准差大于甲的标准差,可见标准差的大小确可知乙的标准差大于甲的标准差,可见标准差的大小确定能够反映甲乙二人各科成绩的另外一些特征。定能够反映甲乙二人各科成绩的另外一些特征。 一般说来标准差越小,表明数据的离中趋势越小,即对平一般说来标准差越小,表明数据的离中趋势越小,即对平均数的离散程度越小,数据分布范围集中在平均数附近,均数的离散程度越小,数据分布范围集中在平均数附近,总体显得比较整齐;标准差越大,表明数据的离中趋势越总体显得比较整齐;标准差越大,表明数据的离中趋势越大,即对平均数的离散程度越大,数据分布范围越大,总大,即对平均数的离散程度越

18、大,数据分布范围越大,总体显得参差不齐体显得参差不齐。80.10680-85.80-9080-95222甲93.1880-675.701102222乙五、无偏标准差五、无偏标准差 在一般情况下,成绩的分布总是呈现高分,低分的在一般情况下,成绩的分布总是呈现高分,低分的人数较少,而在平均分附近的人数较多,即人数较少,而在平均分附近的人数较多,即“两头小,中两头小,中间大,左右对称间大,左右对称”,这种情况即所谓正态分布。因此,抽,这种情况即所谓正态分布。因此,抽出的样本中抽到极端的情况就更少,抽不到差距大的书,出的样本中抽到极端的情况就更少,抽不到差距大的书,必然会使样本的标准差较小于总体的标准

19、差。在数学上可必然会使样本的标准差较小于总体的标准差。在数学上可以证明,随机样本的标准差小于相应总体的标准差,利用以证明,随机样本的标准差小于相应总体的标准差,利用误差分析方法来进行修正,涉及到下面公式误差分析方法来进行修正,涉及到下面公式:12nxxsis称为无偏标准差,它与标准差公式的差别为分母一个是称为无偏标准差,它与标准差公式的差别为分母一个是n,一个是一个是n-1,由于,由于nn-1,则可见,则可见s。如果用样本的标准差来代。如果用样本的标准差来代替总体的标准差,请记住一定用替总体的标准差,请记住一定用s,不用,不用,这样才符合总体的情况。这样才符合总体的情况。六、变差系数六、变差系

20、数一组数据标准差与平均值得百分比称为这组数据的一组数据标准差与平均值得百分比称为这组数据的变差系数,记为变差系数,记为式中式中s为标准差,为平均值,其单位一样,因而为标准差,为平均值,其单位一样,因而 无单位。这样,对于不同单位的量就好比较了。无单位。这样,对于不同单位的量就好比较了。如:某市如:某市1979年年10岁儿童身高、体重数据岁儿童身高、体重数据vc%100 xscvxvc项目项目平均平均标准差标准差s身高身高cm135.01135.015.545.54体重体重kg28.0328.033.403.40则:身高则:身高%10.4%10001.13554.5vc体重体重%13.12%10

21、003.2840.3vc由以上计算可知:由以上计算可知: ,即体重的离散程度比身高的离散程度大。,即体重的离散程度比身高的离散程度大。体vc身vc利用上面几个概念可以对两个班学生化学学利用上面几个概念可以对两个班学生化学学习成绩作一些分析比较。习成绩作一些分析比较。1x2x1vc时间时间中期考试中期考试期末考试期末考试项目项目s1s2试验班试验班7272151520.6%20.6%8080121215%15%0.720.72对照班对照班686814148181131316%16%0.780.7812vvcc2vc由上表可知两班由上表可知两班 均小于均小于1,即从期中到期末,成绩的,即从期中到期

22、末,成绩的分化都缩小,且试验班分化的缩小更快一些。分化都缩小,且试验班分化的缩小更快一些。为了更确切地反映出学生的学习成绩,表明一个原始分数为了更确切地反映出学生的学习成绩,表明一个原始分数在总体中的地位,即考虑平均分数,又考虑离散程度,引在总体中的地位,即考虑平均分数,又考虑离散程度,引入一个反映题目难度(总体水平)和学生实际水平的分数入一个反映题目难度(总体水平)和学生实际水平的分数叫做标准分数。叫做标准分数。12vvcc七、标准分数七、标准分数原始分数与平均分数的差所包含标准差的个数称为原始分数与平均分数的差所包含标准差的个数称为标准分数。标准分数。xxz其中其中z:标准分数;:标准分数

23、;x:原始分数;:原始分数; :平均分数;:平均分数; :标准差:标准差x利用标准分数,可以开展多种教学质量的评价。利用标准分数,可以开展多种教学质量的评价。例,某学生一次考试三科成绩如下:例,某学生一次考试三科成绩如下:项目项目原始分数原始分数班平均分班平均分班标准差班标准差标准分数标准分数语文语文858582827 70.40.4数学数学858590901919-0.3-0.3外语外语858590904 4-1.3-1.3原始分数都一样,不便于分析该生在各科学习上潜在的问题。转化为标准原始分数都一样,不便于分析该生在各科学习上潜在的问题。转化为标准分数后,可以看出,语文、数学均在平均分附近

24、,外语则差些,即外语需分数后,可以看出,语文、数学均在平均分附近,外语则差些,即外语需要更多下工夫。要更多下工夫。八、相关系数八、相关系数在教育领域内,更多的会遇到下面的现象:一组变量的变化,会引起另一在教育领域内,更多的会遇到下面的现象:一组变量的变化,会引起另一组变量的变化。从数量关系的特点来考查,大体可分为两种:组变量的变化。从数量关系的特点来考查,大体可分为两种:第一种类型:变量间存在着严格的依存关系,即我们熟知的函数关系。第一种类型:变量间存在着严格的依存关系,即我们熟知的函数关系。第二种类型:两组变量间虽不十分严格但却存在着依存关系。这时一组变第二种类型:两组变量间虽不十分严格但却

25、存在着依存关系。这时一组变量的变化,必然会引起另一组变量的变化,数值间不能如函数关系那量的变化,必然会引起另一组变量的变化,数值间不能如函数关系那样唯一确定,有波动性,但却遵循一定的规律而变动。我们称这样的样唯一确定,有波动性,但却遵循一定的规律而变动。我们称这样的两组变量之间的关系就是相关关系。两组变量之间的关系就是相关关系。相关关系又分为以下三种情况相关关系又分为以下三种情况正相关正相关两组变量变化方向一致,如化学成绩与其它理科成绩之间为正两组变量变化方向一致,如化学成绩与其它理科成绩之间为正 相关。相关。负相关负相关两组变量变化方向相反,如复习次数与遗忘量之间的负相关。两组变量变化方向相反,如复习次数与遗忘量之间的负相关。零相关零相关两变量间无任何关系,如身高与学习成绩间为零相关。两变量间无任何关系,如身高与学习成绩间为零相关。表示相关程度大小的数据称为相关系数,记为表示相关程度大小的数据称为相关系数,记为 。xy积差相关公式积差相关公式2222yynxxnyxxynxy例:抽出例:抽出10名学生高考的数学、化学成

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论