




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
整理为word格式整理为word格式整理为word格式教育统计和教育测量镇江市教育局教研室周凯在教育、教学研究中,我们常常要进行评价。在评价过程中,定性是重要的,然而定量同样是必要的。为了使教育、教学研究深化和精确化,需要在占有科学数据的基础上,运用科学的手段和方法对数据进行处理,从而得出科学的结论。教育、教学研究中的数据是由测量法产生的,对数据的搜集、整理和分析,对研究结果的解释,则需要通过统计法来实现。一、教育统计1、教育统计的意义教育统计是运用数理统计的原理和方法研究教育问题。它的主要任务是研究如何整理和分析由教育调查、教育测量所获得的数字资料,并以此为依据,进行科学推断,揭示教育现象所蕴含的客观规律。从应用角度来分,教育统计主要有三方面的内容:描述统计、推断统计和实验统计。下面简介描述和推断统计的一些内容。2、描述统计的意义及内容我们去看学生的成绩计分册,只看到一个个学生的分数(称原始数据),这些分数在未经整理之前是零乱的、不系统的,而且数据愈多,愈觉纷乱。因此,需要对统计资料进行绘图、制表、计算等初步的整理工作,以描述研究对象的统计特性。描述统计就是对已获得的数据进行整理、概括,显现其分布特征的统计方法。它的主要内容有:统计表和统计图、集中量、差异量、相关系数等。2.1统计表和统计图统计表是用来表达统计指标与被说明事物之间数量关系的表格。举例如下:表1:某年级某学科某班学生考试成绩统计(本卷满分100分)分数段100~9090~7575~6060~3030以下人数9161484百分率(%)17.631.427.515.77.8本表在统计学中称为频数分布表(落在各个小组内的数据的个数叫做频数,表中各分数段内的人数就是频数),每一分数段(即分数区间)都有上限和下限,比如区间90~75中,90称为上限,75称为下限,而75又是区间75~60的上限。统计时一般包含下限,而不包含上限,但满分100分这个上限例外。从表1中可以得到如下信息:75~90这一分数段人数最多,有16人;60分(及格)以上有39人;60分以下有12人,其中30分以下4人,需要尽快补差等。上表是将研究的对象按一个标志分类的,称为单向表。将研究的对象按两个或两个以上标志分类的统计表,称为双向或多统计表。如,下表就是将学生成绩按等第、班级、性别三个标志分类的。整理为word格式整理为word格式整理为word格式表2:某年级学生操行评定表等第一班二班三班合计男女男女男女男女优良中差686258415931510317940683118261331626103合计2218181920186055编制统计表的要求是:(1)表的结构要简单明了,层次清楚。(2)表的标题要简明扼要地、确切地反映表的内容,写在表的上端的中央位置。(3)表的标目有横、纵标目之分。一般将统计表所要叙述的主要对象放在横标目上,而将用以叙述的统计指标在纵标目上。(4)表内数据排列要整齐,小数点位置要对齐,缺数据格或无数据格要划斜线。(5)表的标题、标目或数字有未尽之意的地方,应加脚注说明,表中资料的来源应在底线下加以注明。统计图是以几何图形的形式表达统计资料数量关系的重要工具,它形象直观,使人看了一目了然,印象深刻,容易记忆。频率分布表与频率分布直方图是统计表和统计图的一种,由于它在统计工作中的地位相对重要,故着重加以介绍。将一群数据中的每一个数据(或每一组数据)所出现的频率分布情况列成统计表的形式,就是频率分布表;对其中的连续性数据还可以绘成统计图的形式,这就是频率分布直方图。以下结合表3的数据来说明编制频率分布表和频率分布直方图的步骤。表3:某年级80名学生数学成绩7873687163655853554851545966637168737985877974687463667159555660666372697480605766646472696975758080817570646667676061616267676765656570768283909776777770707165(1)求极差:最大值-最小伙值=97-48=49(2)决定组数与组距:在决定组数时,必须考虑到数据整理的目的,一方面在于简化资料,以利于显示其规律性;另一方面又必须适当保持资料的细节,以免失之过粗。若分组时组数过多,不仅计算麻烦,而且由于每组数据甚少,不易反映整个分布的规律;反之,组数过少,由于失之过粗,误差较大,也不能反映资料的特征。一般分组的数目视数据的多少而定,大体上,50个左右的数据分5~8组,100个左右的数据分8~12组,100个以上的数据分12~16组。本例有80个数据,分10组为宜。整理为word格式整理为word格式整理为word格式组数确定之后,可由下列式子计算组距:组距=极差/组数=49/10=4.9≈5(3)决定分点:将数据按照5分的距离分组,分成:48~5353~5858~6363~6868~7373~7878~8383~8888~9393~98这时我们看到,有些数据(如48、53、58)本身就是分点,不好决定它们究竟应该属于哪一组。为了避免出现这种情况,可以使分点比数据多取一位小数,并且把第1小组的起点稍微减小一点。例如,可将第1小组的起点定为47.5,这样分成的10个小组是:47.5~52.552.5~57.557.5~62.562.5~67.567.5~72.572.5~77.577.5~82.582.5~87.587.5~92.597.5~97.5(4)列频率分布表:分组频数频率47.5~52.520.025052.5~57.560.075057.5~62.590.112562.5~67.5220.275067.5~72.5160.200072.5~77.5120.150077.5~82.580.100082.5~87.530.037587.5~92.510.012592.5~97.510.0125合计801.0000(5)画频率分布直方图:为了将频率分布表中的结果直观形象地显示出来,需画出频率分面直方图:↑频率│组距│┌──┐││││││││├──┐│││││││├──┐││││││┌──┤││├──┐││││││││┌──┤│││││整理为word格式整理为word格式整理为word格式│││││││├──┐│┌──┤││││││├─┬─┐└─┴──┴──┴──┴──┴──┴──┴──┴──┴─┴─┴──→47.552.557.562.567.572.577.582.587.592.597.5成绩80名学生数学成绩分布直方图通过对一组数据的统计分析,绘制其频率分布直方图,就可以看出其是否遵循正态分布或偏正态分布。2.2集中量集中量是描述数据集中趋势的量,它主要有三种:算术平均数,中位数,众数。(1)算术平均数学科考试后所计算的平均分,就属于算术平均数。若频数较小,如计算班级平均分,则方法一般是:所有被试分数的和除以被试人数。即=由于大家都很熟悉,举例从略。当观察数据中出现相同值的时候,比如,有f个χi,i=1,2,……,k,则可用下列公式计算平均数:=f,其中f+f+…+f=n。这个平均数称加权平均数,f,f,…,f叫做权。例1某校在教改实验中采用五级计分考核,实验班与对照班的数学成绩如下:实验班:等第优秀良好中等及格不及格人数277240对照班:等第优秀良好中等及格不及格人数12161121现规定优秀为90分,良好为80分,中等为70分,及格为60分,不及格为50分,问哪个班的成绩较好?解:实验班=(90×27+80×7+70×2+60×4)≈84(分)对照班=(90×12+80×16+70×11+60×2+50×1)≈79(分)经比较,实验班的成绩好。又=f=+x+…+x整理为word格式整理为word格式整理为word格式设p=(i=1,2,…,k),则=x这是加权平均数计算公式的另一种形式,其中p(i=1,2,…,k)叫做权重,p+p+…+p=1。例2某校规定学生的体育学期成绩由三部分组成:早锻炼及体育课外活动表现占学期成绩的10%,体育理论测试占30%,体育技能测试占60%。一学生上述三项成绩依次为90分、85分、82分,求该生这学期的体育成绩。解该生这学期体育成绩=90×10%+85×30%+82×60%≈84(分)。(2)中位数在一次家庭年收入调查中,抽查了15个家庭的年收入(单位:万元),将其从低到高排列,依次是:0.91.01.01.11.11.21.21.31.41.41.51.51.61.718.1上述数据的平均数为2.4(万元),比被抽查的前14个家庭的年收入高出许多,显然不能反映这组数据的集中趋势(前14个数据的大小比较接近,最后1个数据与它们的差异较大),这时,如果用最中间的数据1.3(万元)来描述这组数据,则可不受个别变动较大数据的影响。将一组数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,如,写出3,5,1,9,8的中位数:这里共5个数,从大到小排列为9,8,5,3,1,排列后处在最中间的数是5,5就是这组数据的中位数;写出3,5,1,9,8,6的中位数:这里共6个数,从大到小排列为9,8,6,5,3,1,排列后处在最中间的两个数的平均数为5.5,5.5就是这组数据的中位数。中位数的性质是:数组中大于中位数和小于中位数的数据的个数相等。表4为某年级某学科某班学生考试成绩统计:分数段90~10080~9070~8060~7050~6040~5030~4020~3010~20人数51712842211累计数52234424648525354组中值958575655545352515求表4所示考试成绩的平均分和中位数。说明:区间上限和下限的平均数称为这个区间的组中值,它是这一区间所有分数的代表,即这个区间内的所有分数都用组中值代替。用“加权法”求平均分:先求出每一组的组中值与本组人数的积,再求这些积的和,最后用这个和除以各组人数的和,所得商就是平均分。解所求平均分=(95×5+85×17+75×12+…+15×1)÷54≈69.6(分)用“插值法”求中位数:由累计数知,按从高到低的顺序,数到80分有22人,与总人数之半差5人。中位数在70─80之间,本区间有12人,假设等距排列,相邻两人分数差是10÷12=0.833分。由此中位数=80-0.833×5=75.8。列综合式:中位数=80-×(54÷2-22)=75.8(分)。整理为word格式整理为word格式整理为word格式根据中位数和平均分的大小可以粗略估计分数的分布。注意到只有一半学生的分数低于中位数,当平均分69.6低于中位数75.8时,说明低分很“低”。(3)众数一组数据中,出现次数最多的那个数值就是众数。如:数组3,4,5,3,6,5,4,5中,出现次数最多的数值是5,称这组数据的众数是5。在象表4这样的频数分布表中,粗略估计众数的方法是:频数(人数)最多一组的组中值。表4中的众数是85。众数也可以计算,但比较繁琐且用处不大(当数据接近正态分布时,常用皮尔逊的经验正式来估计众数),就不介绍了。计算平均数时,所有的数据都参加运算,所以它能较为充分地利用数据所提供的信息,且有良好的统计性质,如,用样本平均数估计总体平均数,但它容易受异常值的影响。中位数的优点是计算简单,受异常值影响较小,但它不能充分利用数据的信息。当一组数据中,某些数据多次重复出现时,众数往往是我们尤为关心的一种统计量,但抽样方法不同对其影响较大。2.3差异量有两个搬运队,职工的年龄分别如下(单位:岁):甲队:22,26,28,31,34,37,39乙队:15,18,27,29,37,43,48两队人数相等,且平均年龄都是31岁,但显然乙队年龄差距大。为了定量地描述这一特征,引入差异量。表示一组数据离散程度的量称为差异量。它是描述数据分布状况的另一重要特征量。差异量越大,表示数据分布的范围越广,越不整齐。介绍两种差异量:标准差和差异系数。(1)标准差数据与平均数的差称为离差,离差平方的平均数称为方差,方差的算术平方根称为标准差,记着σ。如,甲队职工年龄离差分别是-9,-5,-3,0,3,6,8,(依次将年龄减31),则方差是[(-9)+(-5)+(-3)+0+3+6+8]÷7=32,标准差σ==5.66(岁)。标准差和平均数一样,都有单位。根据标准差的定义,其计算公式是σ=,其中表示平均数。根据标准差的计算公式,可求得乙队年龄的标准差是11.4岁。由于σ甲<σ乙,则乙队职工年龄的离散程度较大。计算一组数据的平均数和标准差可以借助于科学计算器完成。(2)差异系数标准差可以用来比较两组数据之间离散程度的大小,但有两种情况这种比较毫无意义:一是两组数据的测量单位不同;二是两组数据的测量单位虽然相同,但它们的平均数相差较大。对于这两种情况可利用相对差异量整理为word格式整理为word格式整理为word格式(称为差异系数)进行比较。差异系数是标准差与平均数的百分比,用符号CV表示。差异系数的意义在于它是以平均数为单位来衡量差异程度,差异系数大,表明离散程度大。常用于:①比较同一团体中不同单位资料的差异程度。例4某班学生平均身高162.5cm,标准差为5.8cm;平均体重50.1kg,标准差为3.64kg。试问身高与体重哪个离散程度大?解由于单位不同,不可以直接比较两个标准差,现比较它们的差异系数:CV高=×100%≈3.57%,CV重=×100%≈7.27%。由此可知:虽然体重的标准差小,但实际离散程度较大。②比较单位相同而平均数相差较大的不同团体资料的差异程度。例5某一测验,初三年级的平均分是50分,标准差是4.12;高一年级的平均分是80分,标准差是6.04。问这两个年级的测验分数中哪一个离散程度大?解:由于平均数相差较大,不可以直接比较两个标准差,现比较它们的差异系数:CV初三=×100%≈8.24%,CV高一=×100%≈7.55%。显然初三年级的测验分数离散程度大。2.4相关系数数学成绩好的学生,物理成绩也好,但数学成绩好的学生,体育成绩不一定好,依据这种说法,我们就说数学成绩与物理成绩相关程度高,数学成绩与体育成绩相关程度低,甚至不相关。用来描述两个变量相互之间变化方向及密切程度的数字特征量称为相关系数,一般用r表示。积差相关系数一般用下面的公式进行计算:r=/σσ表5:10名学生数学与物理成绩如下表,计算数学与物理成绩的相关系数序号12345678910平均值标准差数学(X)7471726876736770657571.13.42物理(Y)7675717073796571627671.84.96乘积XY56245325511247605548576743554970403057005119.1r==0.83,这说明数学成绩与物理成绩的相关程度高。从理论上说,相关系数r的值在-1到+1之间,若r为正,则称这两个量成正相关;若r为负,则称这两个量成负相关;若r接近于零,则称这两个量成零相关或不相关。整理为word格式整理为word格式整理为word格式二、教育测量1、教育测量的意义要理解教育测量的意义,首先要了解一般测量的意义。测量的最基本特征是将事物进行区分。区分的过程要按照一定的法则进行,区分的结果要能用数学的方式进行描述。因此,测量是按照一定的法则,用数学方法对事物的属性进行描述的过程。按此定义,教育测量是按照一定的法则,用数学方法对教育对象的若干属性进行描述、区分的过程。根据测量的定义,可知测量(包括教育测量)应包含三个要素:①测量的对象---事物的属性;②测量的工具---某种法则;③测量的结果---某种数学表达形式(很多情况下是用实数表示的)。举例说明测量的三个要素:测量学生的身高①测量的对象(事物的属性):学生的身高;②测量的工具(某种法则):赤足免冠、抬头挺胸等一系列的规定;③测量的结果(数字):××cm(公分)。测量学生的英语听说水平①测量的对象(事物的属性):学生的英语听说水平;②测量的工具(某种法则):用预先编制好的试卷,限定时间准备,朗读一段文章并回答老师提出的问题等测试规定;③测量的结果(数字):××分。2、教育测量的特点教育测量与一般测量相比,有如下的特点:(1)教育测量一般是间接测量。教育测量检测的是人的知识、技能、动机、态度、品德等心理属性,这些都是人的大脑活动的反映,我们无法象测量身高、体重一样直接测量,而只能根据人的外显行为间接测量人的心理活动的水平与特点。与此同时,我们只能由样本成绩推断总体水平,比如测量学生的英语听说水平,所用的测试试卷中所涉及的词汇语言只是学生应该掌握的词汇语言的一部分,根据这一部分的得分去估计和推测学生的总体水平。因此间接测量是教育测量的特点之一。(2)教育测量的度量单位是相对的。教育测量没有统一的标准,若试卷容易,得分就高,则一分的份量就轻;若试卷较难,得分就低,则一分的份量就重。实际上,就在同一次试验中,不同题目中的一分份量也不一定一样。因此教育测量中的度量单位是相对的。(3)教育测量的相对准确性。教育测量的内容往往涉及到人的心理,易受内外条件,比如动机、态度、情绪、健康、睡眠、光线、气候等的影响,因而教育测量的正确性是整理为word格式整理为word格式整理为word格式相对的。3、教育测量的质量要求教育测量的质量要求一般包括以下几个方面:(1)效度,即有效程度。可以用数学式子定义效度,但太抽象。现将效度的意义描述如下:测量(包括测验)都是有一定的目标的,效度刻划了测量达标程度的高低,是反映测量有效性与准确性的一项指标。举一反例,用磅秤来测量学生的身高是无效的,这样的测量效度为零。再举一例,出这样一道数学题给小学生解答:3童分9卵,童均几何?如果要考查学生“等分除法”的掌握情况可能效度极低,因为学生不能正确解答,并不是因为数量关系不清,而是读不懂题。为了提高测量的效度,在确定测量的工具(如编制试卷)前,要认真拟定测量的目标。关于效度,量化是比较困难的,但一般可以由专家作出定性的判断。(2)信度,即可信性,指的是测量一致性的程度。一个好的测量工具必须稳定可靠,多次测量结果要保持一致,否则就不可信,比如说用橡皮筋制作的皮尺测量身高,测量结果不可能一致,因而这样的测量就无信度。理论上,信度可定义为:由学生间确实存在的差异而造成的真实分数的方差σ与实测分数方差σ的比。但实际上,学生的真实分数是不知道的,因此必须寻求估计考试信度的方法。估计信度的主要方法有:①再测法:在条件完全相同的情况下,用同一份试卷对同一批学生考两次,计算这两次结果的相关系数,如果相关程度较高,则说明信度较高,反之则信度较低。②等值法:设计两份内容、题量、格式、难度、区分度、平均分、标准差都相同或相近的测试题,在短的时间内进行两次测试,计算这两次结果的相关系数。如果相关程度较高则说明信度较高,反之则信度较低。③折半法:将同一份测试题按奇数题、偶数题分成两部分,分别计算奇数题、偶数题的总分,再计算它们的相关系数。信度与效度的关系是:无信度的测量一定是无效的测量,比如用橡皮筋制作的皮尺来测量身高,肯定无效;有信度的测量不一定就是有效的测量,比如用磅秤来测量学生的身高,无论测量多少次,结果都一样,从测量结果的“一致性”考虑,测量是可信的,然而无效。因此,信度是效度的必要条件,而不是充分条件。(3)难度。难度是指测试试题的难易程度。难度一般用大写字母P表示。在学科测验中,某题的难度一般用所有被试在该题的平均得分率来表示,即所有被试在该题的平均得分难度=─────────────该题的满分数表6:计算某次考试试卷中各试题的难度整理为word格式整理为word格式整理为word格式题号1234…本题满分值20102015…本题平均值197.27.23.6…本题难度P0.950.720.360.24…注意:难度(得分率)总在0到1之间,且数值越大试题越易。(4)区分度。区分度表示测试题目对学生学业水平鉴别的程度,用符号D表示。这个量标志着该测试题鉴别能力的大小。从理论上说,具有良好区分度的题,水平高的学生应得高分,水平低的学生应得低分;如果反过来了,则说明该题区分度低。测试专家将试题的区分度称为测试是否有效的指示器,它是评价试题质量和筛选试题的主要指标和依据。估计区分度的方法大致有两种:分组法和相关法。第一种方法:分组法。操作过程如下:第一步,分组:将所有被试按总分顺序排列(从高到低,从低到高都可以),然后将这些被试分为三组:①从最高分开始的总人数的27%分为一组,称为高分组;②从最低分开始的总人数的27%分为一组,称为低分组;③余下的46%也算一组,不过在下面的计算过程中就不用他们的数据了。第二步,统计:比如说要计算A题的区分度,①计算高分组中A题的得分率,用符号PH表示;②计算低分组中A题的得分率,用符号PL表示。第三步,计算:A题的区分度D=PH-PL有时也用PH和PL的值来估计试题的难度,公式是P=(PH+PL)/2。表7:计算某次考试试卷中各试题的区分度题号1234…高分组Ph0.850.150.850.45…低分组Pl0.780.070.240.55…区分度D0.070.080.61-0.1…估计难度P0.8150.110.5450.5…第1题区分度低,也容易;第2题区分度低,题难;第3题区分性能好,难度适中;第4题得分率虽高,但高分组得分率反而低,因而区分性能极差,属怪题。由计算公式可知:从理论上说区分度是从-1到+1之间的一个数。难度接近于1(很容易的题)和难度接近于0(很难的题)区分度都低。有资料说,在常模参照性(选拔性)考试中,应该要使D≥0.3,且0.4<D≤0.7为佳,D<0.3的题要淘汰(有意设计的比较容易的保分题除外,但D<0的题要坚决淘汰)。第二种方法:相关法。要计算某题的区分度,只要计算该题实得分与该题分值的相关系数,用此相关系数估计该题的区分度。过去由于计算工具落后,所以计算相关系数很繁,现在借助于电子计算机,无论用分组法还是用相关法计算区分度,都比较方便。三、标准分我省2003年高考将实行“3+大综合+1”的模式。实行该模式的省份(如广东省)规定:“整理为word格式整理为word格式整理为word格式(标准分)合成。”在“3+大综合+1”的高考中使用“标准分”合成考试成绩,主要是为了平衡选项“1对于“标准分”这一内容,有如下问题:1.什么是标准分?2.标准分Z分数的计算公式。3.标准分名称的由来。4.标准分Z分数的应用。5.为什么要将标准分Z分数转换成T分数,如何转换?1、标准分是以标准差为单位来表示一个原始分数在正态分布的团体中所处相对位置(偏离平均数的位置)的一种量数。2、标准分Z分数的计算公式:Zi=(x)/σ,i=1,2,…,n,其中为平均分,σ为标准差。由计算公式可知,标准分可正、可负,也可以为零。高于平均分的,其标准分为正;低于平均分的,其标准分为负;等于平均分的,其标准分为零。因此,标准分Z分数可以表明原始分数在团体中所处的位置:Z为正值,则其成绩高于一般;Z为负值,则其成绩低于一般。3、由标准分Z分数的计算公式可得:=0,σ=1,这样“标准分Z分数”实际上是将原始分数标准化。这就是“标准分”名词的由来。注:“标准分Z分数”是差异量,是无名数。4、标准分Z分数的应用:例7某一学生8次数学考试的成绩如下表:12345678原始分│88
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025至2030年中国内销型苦丁茶数据监测研究报告
- 广东省汕尾市陆丰市碣石镇2024-2025学年三年级上学期期中测试语文试卷(含答案)
- 幼教面试试题试题及答案
- 英美概况考试试题及答案
- 2025年军队文职人员招聘之军队文职教育学题库检测试卷B卷附答案
- 采购与供应商分包合同(2篇)
- 词牌名的文化内涵与写作技巧:小学高年级语文古诗教学教案
- 化学反应与能量化学科学教案
- 学前教育中的寓言故事启示读后感
- 房地产行业智慧社区与智能家居开发方案
- 2025年黑龙江农业工程职业学院单招职业适应性测试题库完整版
- 2025年湖南环境生物职业技术学院单招职业技能测试题库汇编
- 2025年广西南宁市公安局警务辅助岗位招聘2364人历年高频重点模拟试卷提升(共500题附带答案详解)
- 2024年中国农业大学招聘笔试真题
- 课件:以《哪吒2》为镜借哪吒精神燃开学斗志
- 2025年贵安发展集团有限公司招聘笔试参考题库含答案解析
- berg平衡评定量表
- 中央空调维保方案
- 我是家里的小主人
- 中国高血糖危象诊断与治疗指南-
- 《医疗机构基本标准(试行)》2017版
评论
0/150
提交评论