




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第8讲体育教学的测量与评价术科教师的教学能力测评学科教师的教学能力测评体育教学效果的测评教学大纲和课程设置的测评项目分析项目反应理论概化理论一、术科教师的教学能力专业知识备课水平教学方法教学组织能力教学任务的完成个性心理品质示例:体育教师教学能力评价目的:评价教师的教学能力。对象:体育专业的男女实习教师(中学体育课的教学)。测评有效性:研究者用21项因素来观测教师的教学能力,通过回归分析,确立了一套含8个测评项目的评价方程,这8项因素与21项因素的复相关系数是0.842。评分内容与评分方法:评分内容见表4-1;以优、良、合格、不合格四个等级进行评分。类别测评项目
课前准备1场地器材准备2熟悉教学对象3教案质量4服装检查教学方法5讲解6示范7教法运用8个别对待9教态课的组织10教学环节组织11一般密度12运动密度13运动量14时间掌握15应变能力教学任务16双基教学任务17思想教育18队列指挥19纪律要求20出勤检查21课的自我分析引自杨逎军,《体育测量学》,1990,98页页研究结果:教学能力=28.27+0.77(教案质量)+0.99(讲解)+0.76(示范)+1.22(教法运用)+0.98(教学环节组织)+0.97(运动量)+1.04(教学任务)+1.51(队列指挥)评价:将上述8个测评项目的评分结果代入方程求总分,以总分的多少进行评价。二、学科教师的教学能力专业知识教案质量教学方法教学组织能力教学任务的完成个性心理品质类别测评项目
思想道德1政治思想2职业道德3现代观念文化科学4专业理论5文化基础6教育科学身体心理7身体8心理能力9掌握和运用教材教法10表达能力11组织管理12实际操作13交往公关14教育科研15心理教育16把握三种课堂17机智和创新审美18审美基础知识19审美教育能力20教师风度改自姜凤华,2001,192页三、体育教学效果的测量与评价
(一)体育教学效果评价的依据1、基于教学效果的评价。主要内容包括教师的个性和教学能力评价;2、基于教学结果的评价。主要评价内容倾向于学生的学习成绩与进步幅度。(二)不同类型评价者对体育教师的教学效果评价
1、学生对教师的教学效果评价2、同事对教师的教学效果评价3、教师自我评价4、教育行政管理部门的评价1、学生对教师的教学效果评价(1)学生评价的有效性学生对教师教学效果评价的有效性,首先取决于评价内容是否反映教师的教学能力,其次是这些内容是否为学生所熟悉。匿名填写。(2)学生评价的可靠性(客观性)学生评价的态度,是决定其评价可靠性的重要因素。因为学生在评价中通常会带有主观随意性,而且他们缺乏对教师教学能力的全面认识,应答时,将会过多地考虑自己的需要和愿望。另外,课程本身的难易程度、学生学习的兴趣和动机等因素也直接影响评价的可靠性。对于学生评价教师教学效果的可靠性问题,美国学者曾作过大量的研究。有充分的证据表明,学生对教学效果的评价是可靠的。在短期内,其测验—再测验的可靠性系数在0.87-0.89之间。若两个测验相隔半个学期,可靠性系数将会稍低一些,但他们仍在可接受的范围之内。有人对学生评价的咨询量表可靠性作过研究,其可靠性系数在0.64-0.69之间。若将可靠性的重点放在学生成绩方面,其可靠性就不大理想(可靠性系数在0.35左右)。这说明,教师的教学能力是稳定的,而他们的教学效果就不一定是稳定的了。类目优良中下差
1.教师对教材是否熟悉?2.教师讲解的清晰度.3.教师示范的正确性.4.教师的教学热情与责任心.5.教学方法是否合理?6.课的组织是否紧凑而合理.7.课前准备是否充分?8.你觉得练习时间够吗?9.教师要求是否严格?10.你是否完成了学习任务?11.教师的专业知识水平类目优良中下差
12.你愿意该教师上你的课吗?13.考试是否反映了你的实际水平?14.教师上课是否有新内容和新知识?15.教师经常采用启发式教学吗?16.教师的教学经验丰富吗?17.课的运动量是否合理?18.你觉得自己进步快吗?19.教师对你了解吗?20.你对教师信任吗?21.教师教学技巧和教学艺术水平?22.你觉得教师对你有偏见吗?23.你觉得教师的教学效果如何?续上表下表展示的是一份学生对学科老师教学质量评价表(示例)
引自姜凤华,2001年,278页一级指标二级指标等级等级内涵课程1课程2课程3课堂讲授0.75教学态度0.30教学内容0.25教学方法0.30表达能力0.15课外辅导0.25ABCD综合评价对各门课程的综合评价ABCD二级指标等级等级内涵课程1课程2教学态度A治学严谨、认真、负责,要求严格,重视教书育人。B教学认真,对学生要求比较严格,注意教书育人。C教学尚认真,但对学生要求不够严格,较少注意教书育人D教学不够认真,不注意教书育人。二级指标“教学态度0.30”分解2、同事对教师的教学效果评价(1)同事评价的有效性在教学效果的评价过程中,同事的评价应该是有效的。因为他们经常在一起参加教研活动,互相观摩,相互之间对专业知识、研究能力、学术水平、知识面、教学态度、与学生的关系及教学的各种能力因素都比较了解。如果同行或同事实事求是地进行评价,这种评价是具有说服力的。(2)同事评价的可靠性(客观性)评价可以随堂进行,也可以通过咨询量表、问卷或调查访问的形式进行。但是,有研究发现,同事之间的评价极不一致(一致性系数为0.26左右)。不能否认,其评价的客观性比学生评价的要低。在森太雷(centra)研究中,他所用的咨询量表中仅有1/3的题目,学生与同事评价结果大致是相同的。要强调的是,这并非意味着不能用同事来评价教师的教学效果,而正好说明学生与同事的评价应相互补充使用。指标(内涵)
优良中差1课程教学组织(总体情况,从内容到各环节的安排等)2课程内容表达(讲述准确、概念清楚、突出重、难点等)3课程内容熟练程度,讲课和板书的清晰程度4提高教学效果针对实际情况采取多种教学方法(运用启发式、因材施教、必要的教具等)5培养学生能力(指导学习方法,训练实践能力、开阔视野,拓宽思路,提供参考书目等)6教学态度(治学严谨,热情耐心,要求严,抓纪律等)7教师的模范作用(政治、思想、作风、守纪、仪表等)其他贡献
意见建议
同行、领导对教师教学质量评价表(示例)(引自姜凤华,01年,281页3、教师的自我评价教师对自己的教学效果评价是有一定的局限性的。梅涅尔(Mcneil)研究指出:教师不可能在自我评价的基础上改进自己的教学技能。他举例说,教师在观看自己的教学录像片时,他们很难发现自己的教学弱点和缺点。不仅如此,他们对自己的评价缺乏客观性,常常会高估自己的教学能力。然而,对他人的教学效果评价,通常是低估的。指标(内涵)优良中差1教学总体情况和执行教学大纲情况2教学文件(教学日历、教案等,凡应有文件缺一种降一级)3熟练程度和表达能力4教学方法5答疑、批改作业6培养学生能力7教学态度(治学严谨,热情耐心,要求严,抓纪律等)8教师的模范作用(包括政治态度、思想作风、遵守纪律、仪表等)9关心学生思想,深入班级10主讲教师与辅导教师、有关教师之间的配合情况其他贡献
意见建议教师教学质量自我评估表(示例)
(引自姜凤华,01年,280页评价结果与教师的提职和提薪有直接的关系。因此,其重要性决定了这种评价应该全面地、客观地、多种形式地进行。但是,目前来说,这方面的评价制度尚未完善。其主要原因是评价的工作量太大,不可能对教师进行逐个的、长期的、全面的跟踪测评。4、教育行政部门的评价就目前常常采用的抽样检查,或在公开课上进行评价,若操作不严密,就很难就一、两次课的情况对教师的实际教学能力与水平作出准确的鉴定。除此之外,教育行政部门选择的评价内容与教师的教学能力因素可能会有所区别,而且不同的课程的评价标准也难以均衡掌握。总的来说,教育行政部门的评价一般趋于宽松。四、体育教学大纲和课程设置(一)体育教学大纲的评价(二)体育课程设置的评价(一)体育教学大纲的评价体育教学大纲是根据体育教育计划以纲要的形式规定有关课程内容的指导性文件,它明确规定课程的目的、任务、内容范围、体系及教学进度。对教学大纲的评价有多种形式。最传统的形式是以预定的教学任务与实际完成的教学任务作比较。若以终末评价来检查教学大纲,则可以对教学大纲的合理性作一个总体评价;若结合形成期评价来检查教学大纲,则还可以动态地评价教学大纲。可见,对教学大纲的评价有两个方面的意义:(1)改善大纲,(2)改进教学如果教师的教学与教学大纲任务发生偏离,可能有两种原因:(1)教师的教学有问题;(2)大纲的内容、任务与学生实际情况不相符合。对教学大纲的合理性判定,即评价教学大纲应考虑下列问题:
1、教学大纲规定的目的、任务、内容是否与教育目的、培养目标以及学校的培养任务相适应。2、教学大纲的内容、体系、学时等与教育目的、任务及课程特点是否相一致。3、教学进度的内容排列是否符合教学原则和课程内容特点。4、教学大纲的任务与实际完成的教学任务是否相符合。(二)体育课程设置的评价在教育史上,在课程理论的发展中,第一次明确把教育目标确定为课程编排依据的当推泰勒。根据泰勒的观点,课程的设置必须以教育目标为依据,围绕教育目标以保证教育目标的实现。因此,对课程设置的评价,即是估价课程设置的有效性,也就是衡量所开的课程是否全面反映教育目标和学校的培养任务。方法一通过考察毕业生的实际工作情况,来间接反映学生在校期间所学课程的效果(即课程设置的有效性)。这种评价对课程设置的改善具有较大的反馈意义。因为,毕业生能根据自身的工作需要和体会,去认识和估计自己应具备什么样的知识结构,才能较好地完成当前或将来的教学和科研工作。这种评价法能较客观地为改善课程设置提供依据。方法二评价课程设置,即是检查“教育目标”这一概念的操作化结果的合理性。即:教育目标具体包括那些子目标,每个子目标该由什么具体的课程去实现,各门课程之间的关系如何,各门课程开课的次序,整个课程设置是否保证了教育过程的系统性、逻辑性和各门课程之间的密切关系,是否体现了主次课程的合理搭配,先开的课程是否为后开的课程奠定基础等等。研究示例杨逎军,隗金水等“对体育院系(体育教育专业本科)课程设置的优化研究”,载《体育科学》,1996年6月。概括为如下几步:第一步,确定三个层次的目标:——总目标是:德智体全面发展的以体育师资为主的体育专业人才。——总目标下含有4个目标,——每个目标下又含有若干子目标。目标子目标政治素质
O1思想品德O2理想O3事业心
O4职业道德O5人生观与价值观O6法制观念基本理论
O7教育理论O8人体生物科学O9教学管理O10体育社会科学O11应用科学理论基本技术
O12一般技术O13专项技术基本能力
O14科研能力O15竞赛组织能力O16裁判能力O17实验操作能力O18语言表达能力O19写作能力O20组织管理能力
O21教学与训练能力O22示范能力O23分析与综合能力O24社交能力第二步,确定各个目标的权重系数。第三步,选取35门常规课程,以专家调查法确定各门课程与24个子目标的“课程—目标”交互作用矩阵,并推算出“课程—课程”交互作用矩阵。第四步,统计计算直接关联指数di,总关联指数ti“课程—目标”交互作用矩阵O1O2O3…O24dC1C2…C35a11a12a13…
a124a21a22a23…
a224……………a351a352a353…
a3524d1d2…d35“课程—课程”交互作用矩阵C1C2C3…C35
tC1C2…C35b11b12b13…
b135b21b22b23…
b235……………b351b352b353…
b3535
t1t2…t35第五步,课程体系的优化分析(1)d值和t值均较大,保留该课程(2)d值和t值均较小,删除该课程(3)t值大而d值小(保护该课程)(4)t值均较小而d值较大(慎重,取决于P值)第六步,删除不必要的课程(本研究无此类课程),重新构造“课程—目标”矩阵和“课程—课程”矩阵,并计算可实现指数pj,依赖指数rj第七步,并依据依赖指数rj的大小给各门课程排序,结果见下表。“课程—目标”交互作用矩阵O1O2O3…O24C1C2…C35a11a12a13…
a124a21a22a23…
a224……………a351a352a353…
a3524PP1P2P3…P24“课程—课程”交互作用矩阵C1C2C3…C35
C1C2…C35b11b12b13…
b135b21b22b23…
b235……………b351b352b353…
b3535
rr1r2r3…r35课程名称学科课程1计算机2外语3外语提高课4统计学5体育史6奥林匹克7革命史8法律9遗传学10中文写作11运动生化12体育概论13解剖学14中社建15学校体育学16社会学17管理学18力学19德育20教育学21选材学22生理学23测量学24科研25马克思原理26心理27营养学28训练学29保健学30美学31劳动教育32军训33社会实践34毕业论文35教学实习术科1音乐2举重3棒垒球4游泳5羽毛球6网球7体操8田径9乒乓球10艺术体操11体育舞蹈12武术13健美操14足球15篮球16排球各门课程的开课顺序表(即依赖指数rj顺序表)五、项目分析项目分析主要是指对项目的难度和区分度进行定量的分析。这里的“项目”泛指体育社会、教育、心理测验中的“题目”或体育运动成套测验中的“单项测验项目”。(一)测验的难度1、难度的概述难度(difficulty),顾名思义,是表示项目的难易程度。通常以难度指数表示。如果大部分考生对某一试题都不能通过,则该题目的难度过大;若大部分考生在某一单项运动测验中得到高分,说明该单项测验的难度过小。难度过大的测验,能区分受试者吗?难度过小,能区分受试者吗?有价值吗?一般而言,一次考试中,全体考生的平均分很低,就说明这次测验的总体难度(或平均难度)?测验有价值吗?2、估计难度指数的方法1)二分法记分项目的难度指数(1)通过率适用于:论测验中的选择题、是非题、填空题,或是体育运动测验中只以通过或不通过(合格或不合格)判定的测验,测验结果只有两种可能,对或错,合格或不合格等。如果不考虑受试者作答的猜测概率,这类测验项目的难度指数通常以“通过率”来表示。即以答对或通过该项目的人数百分比来表示:P=R/N(Pass=Right/Number)P代表项目难度指数,
N代表全体受试者,
R代表答对或通过该项目的人数。例如,在200个受试者中,答对某题目的人数为130人,则该题目的难度指数为?
以通过率表示项目难度指数时,——通过人数越多,P值?其难度?——通过人数越少,P值?其难度?——难度指数P值的取值范围?(2)极端分组法当受试者人数较多时,则可以先将受试者的测验总分从高到低排列,把总分最高的27%的受试者定义为高分组,总分最低的27%定义为低分组,分别先计算高分组和低分组的通过率,然后按照下列公式计算项目的难度指数。P=(PH+PL)/2PH表示高分组的通过率,PL表示低分组的通过率。例如,在370名受试者中,选为高分组和低分组的各100人,其中高分组有70人答对第一题,低分组中有40人答对第一题,则第一题的难度指数为?2)非二分法记分项目的难度适用于:理论测验中的问答题、简答题、计算题、综合题等,体育运动测验中技术评定、达标测验等,每个项目从零分到满分之间有多种可能的得分结果。P=X/XMAX
X代表受试者在某一项目上的平均得分,XMAX代表受试者在该项目上的满分。例如,在技术评定中,某单项测验的满分为15分,该项目考生的平均成绩为9.6分,则该项目的难度指数为?3)测验难度水平的确定进行难度的分析的主要目的是为了筛选项目,但是,项目难度水平的合理确定,取决于测验的目的及测验的性质。在教育工作和实际工作中,若测验的目的是为了了解受试者在某方面的理论知识或某方面的技术技能水平的掌握情况,如学绩测验、教师自编课堂测验、摸底测验等等,可以不必过多地考虑难度。只要教育者认为是必要的内容、重要的内容就可以选用,在掌握大多数项目难度适中的情况下,对那些100%通过(即P=1)或通过率为0(即P=0)的项目都可以适量使用。如果测验的目的是为了选拔人才,就应该将项目的难度指数控制在接近录取率左右,即较多地采用那些难度值接近录取率的项目。例如,要从某年级学生中选拔10%的人参加全市的竞赛,就应提高项目的难度,使难度指数P值接近0.10。(二)测验的区分度1、区分度概述区分度(discrimination)也称鉴别力,是指测验项目对受试者不同能力水平的区分能力。即具有良好区分度的项目,能将不同水平的受试者区分开来。也就是说,在该项目上水平高的受试者应该得高分,水平低的受试者应该得低分。测量专家们把项目的区分度称为测验是否具有效度的“指示器”,并作为项目评价质量、筛选项目指标的主要依据。2、区分度的计算最常见的是鉴别指数法。这种方法是在极端分组的情况下使用,即选择分数分布的两端各27%的受试者,分别计算某项目上各自的通过率,二者之差就是鉴别指数(D)。即公式为:D=PH-PLD为鉴别指数(
Discrimination)
,
PH为高分组在某项目上的通过率,
PL为低分组在某项目上的通过率。D=PH-PLD=1代表什么含义?D=-1代表什么含义?D=0代表什么含义?区分度(D)的取值范围?D为正值的含义?D为负值的含义?D值越大说明什么?通常:D为正值,称作积极区分;D为负值称消极区分;D为0称无区分作用。具有积极区分作用的项目,其D值越大,区分效果越好。美国测量专家R.L.Ebel根据长期研究提出了用鉴别指数评价项目的标准鉴别指数(D)项目评价0.40以上0.30-0.390.20-0.290.19以下很好良好,修改会更好尚可,仍需要修改差,必须淘汰由于测验编制的复杂性,一般情况下人们宁愿修改项目,也不会轻易舍弃项目。当然,上述标准也不是绝对的,还必须根据测验的目的、性质、要求来决定项目的取舍与修改。当受试者数量小于100时,就无法用极端分组法选取27%的受试者,甚至可以用50%作为分界点,即把上、下两半受试者作为高分组、低分组。1、P=1,D=?2、P=0,D=?3、PH=PL,D=?4、PH=1,PL=0,P=?D=?5、P=
0.7,PH=1
,则PL=?D=?6、P=
0.8,则D可能达到的最大值是多少?7、P=
0.4,则D可能达到的最大值是多少?(三)难度与区分度的关系项目难度P与D的最大值的关系
项目通过率(P)
D可能的最大值1.00(或0.00)0.90(或0.10)0.80(或0.20)0.70(或0.30)0.60(或0.40)0.500.000.200.400.600.801.00从表中可以看出,难度指数接近0.5时,项目潜在的区分度越大(当然也可能是最小的);而难度接近1或0时,项目的潜在区分度很小。这也就是人们在测验中要求项目难度保持在中等水平(即难度适中)的道理了。(四)测验的猜测概率在测验中还存在一个重要的问题:测验分数确实反映了受试者的真实状况,还是因为猜测而获得成功?因为在体育教育测验的客观性试题中,猜测会提高受试者的分数,如在是非题、配对题、选择题中,这种影响格外明显。当受试者确实不知道正确答案,而每个被选答案又具有同等吸引力,受试者猜测而选择正确答案的机会是1/K(K是每题中备选答案的数目)。这样,对是非题(K=2)而言,猜测就能获得50%的成功机会;而四重选择题,其正确答案的猜测概率就是25%。显然,大量的猜测就会对是非题和选择题的分数产生很大的影响,从而对测验带来误差,即猜测误差。因为有猜测误差的存在,难度指数和所得的测验分数就会受猜测的影响,理论上讲,需要对它们进行猜测校正。S=R-W/(K-1)S:校正后的得分,R、W:答对、错的项目数
K:项目的选项数目猜测校正有优点,也有缺点,对是否有必要进行猜测校正,有人赞成,有人反对,目前并无定论。在实际测验当中,赞成猜测校正的测验实施者,常采用“答错题目倒扣分”的测验形式来解决测验中的猜测概率问题。(五)多重选择题的项目分析多重选择题能测量较复杂的认知目标,能为改进教学提供更多的反馈信息,且具有易于评分、适用于计算机阅读等优点。多重选择题的项目分析内容:(一)项目的难度是否得当?(二)项目是否具有预期的功能,即是否具有足够的区分度?是否能充分测量到教学效果?(三)项目是否有缺陷?(四)干扰答案的干扰作用是否得当?具体分析的步骤:(一)按照受试者测验的总分,从高到低依次排列试卷。(二)从最高分依次向下取全部试卷的27%作为高分组。(三)从最低分依次向上取全部试卷的27%作为低分组。(四)登记高、低分组选中各个备选答案的人数(五)根据登记结果进行选项的质量分析。一般从以下几个方面进行分析:(一)如果所有的受试者选择了正确答案,说明该项目太容易或者可能是项目中提供了某种暗示,使正确答案过于明显。(二)如果所有的受试者选择了同一个干扰答案,可能是正确答案有误,也可能是在教学中发生了错误。(三)如果某个干扰答案没有任何受试者选择,则说明该选项不具干扰作用,错得过于明显。一般来说,除非有2%以上的受试者的选择,否则该干扰答案应该修改或删除。(四)如果高分组受试者对正确答案的选择率与低分组相等或低于后者,说明该题所考察的东西与受试者的水平无关,即不具备鉴别力,此题应删除或作大的修改。(五)如果很多受试者对某个题目没有作答,或者受试者几乎平均地分布在每个被选答案上,说明该项目可能过难或题意不清,受试者无法作答或凭猜测作答。题号组别人数选答人数正确答案PDABCD未答1高100592120B0.710.42低100225012160分析:难度较低,区分度很好,正确答案和干扰答案的配比较好,即没有被选概率小于2%的干扰答案。题号组别人数选答人数正确答案PDABCD未答2高100581015161A0.420.32低100262115362分析:难度适中,区分度良好,除C答案不具鉴别力外,其余答案均不错题号组别人数选答人数正确答案PDABCD未答3高1001725282812D0.31-0.06低1002511193411分析:难度偏高,且具消极区分作用,未选答的人数过多,选项B、C属于负向的(即高分组在干扰答案B、C上的选择概率大于低分组的选择概率),因此,被选答案需要作大修改甚至是删除该题。题号组别人数选答人数正确答案PDABCD未答4高10014414365C0.120.04低10015610285分析:难度过高,几乎无区分作用,A答案不具干扰能力(被选概率过低),D选项属于负向的。该题属不良试题,需要找出原因加以修改,经过测试后再行分析。六、项目反应理论近20年来,一种新的测量理论指导下的测量概念和方法得到了广泛的应用,这一理论不仅适用于项目分析,而且也适合于某些测量量表的编制。这一理论称为项目反映理论(Itemresponsetheory,简称IRT)。由于IRT是建立在复杂的数学原理和计算机技术基础之上,故此粗略的介绍。在介绍项目反应理论之前,有必要对经典测量理论(Classicaltesttheory,简称CTT)的不足进行粗略阐述。(一)经典测量理论(CTT)的局限1、CTT的信度估计精度不高X=T+E
(X可线性地分解T和E)S2X=S2T+S2E在实际应用中只能求助于平行测验等形式近似估价而得。但是,严格的平行测验是不存在的。2、CTT中的误差指标笼统单一、不精细经典测量理论中,只是用一个平均误差指标来描写所有受试者的测量精度,而不能找到针对每个受试者的精细的测验误差指标。显然,在追求高效率的“千人一卷”的测验中,适合于高水平受试者的题目,低水平受试者作答基本上是无效劳动;同样,适合于低水平受试者的题目,高水平受试者解答无助于对他们的水平鉴别。3、CTT各种参数对样本的依赖性太大如测验的信度、效度、难度和区分度,它们对样本的依赖性很大。最明显的就是项目难度,对同一项目,若样本群体水平较低,就有较高的难度估计;若样本群体水平较高,就有较低的难度估计。4、CTT参数指标之间配套性差最明显的表现是,现有的参数指标,找不到验证某项目难度是否恰好与某受试者的能力水平相匹配的计量方法。即题目难度与受试者水平这两个参数指标未能定义在同一个参照系上。项目难度受试者个体能力水平(二)IRT中参数设计的科学性1、题目难度参数与受试者水平(或称潜在特质参数θ)定义在同一量度系统上。这一性质为选择与每个受试者水平相匹配的项目创造了条件。2、区分度和难度参数相互独立。即难度与区分度没有关系。这一性质为在任何难度水平上选择高区分度项目提供了保证。3、其猜测概率由实测数据计算而得,并能实际反映个项目的猜测情况。猜测概率CP(θ):答对概率θ(潜在能力)Ab项目特征曲线区分度:a=(2π)0.5.tgA,b
:项目难度(三)项目反应理论的应用1、项目反应理论对题库建设的特殊贡献项目反应理论主要的三个题目参数虽然沿用了经典测量理论的一套名称:难度、区分度和猜测度,但是从根本上说,其定义的角度与方式都有了质的变化。除此之外,项目反应理论还可以增加一个技术参数——题目信息函数。这样题库参数的完备性提高了,也就提高了题库管理的可控性,为拓宽题库功能提供了有利条件。2、指导测验的编制不管用于选拔的常模参照测验的编制,还是用于判别知识和技能掌握情况的目标参照测验(如学绩测验、教师自编课堂测验等)的编制,项目反应理论都能起到科学的指导作用。3、实现计算机化自适应测验计算机化自适应测验(Computerizedadaptivetesting)是当今测验技术的最高水平,也是项目反应理论最有特色的应用。三个条件:在测试过程中能快速估计受试者水平参数(θ)和参数估计精度。能针对精度目标,选出与受试者水平(θ)相匹配的试题进行测试。对同时使用不同项目(试题)的受试者,估计出的受试者真实水平值(θ)是可比的。具体表现在:(1)在测试中,计算机可以不断地估计受试者的受试者水平(θ);(2)初估受试者θ值后,可以在题库中挑选那些难度与受试者水平θ接近,在θ附近有最大测验信息量的试题进行新一轮测试。(3)重复以上步骤,直至测验精度满足预定要求,同时即可报告受试者的真实水平。由于测验题目来自同一题库,虽然测试题目数量不一样,具体的题目也不一样,但所估计的θ值还
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 建筑地面设计规范
- 云南省盈江县第一高级中学2025届高考冲刺化学模拟试题含解析
- 2025年亚硝酸盐中毒解毒药项目建议书
- 河北省衡水市景县梁集中学2025届高三下学期联合考试化学试题含解析
- 贵州省黔东南苗族侗族自治州2024-2025学年高二下学期3月联考地理试题(含答案)
- 天目山民宿创业计划书
- 2025年走芯车床项目发展计划
- 德国知识产权
- 2025年建筑模型制作合作协议书
- 2025届上海市南汇第一中学高考化学五模试卷含解析
- 2024年苏州市市属事业单位招聘工作人员笔试真题
- 浙教版九年级数学同步训练:二次函数与几何结合压轴题(Ⅱ)(原卷版)
- 筒仓防雷施工方案
- 【地理】2024-2025学年人教版七年级下册地理背诵知识点
- 2025年上海工艺美术职业学院高职单招职业技能测试近5年常考版参考题库含答案解析
- 23G409先张法预应力混凝土管桩
- 2024年宁波职业技术学院高职单招职业技能测验历年参考题库(频考版)含答案解析
- 《企业绩效考核工作探究的国内外文献综述》3200字
- 2024年09月全国2024年中国银行信息科技运营中心校园招考笔试历年参考题库附带答案详解
- 2025年临床医师定期考核必考复习题库及答案(620题)
- DB32∕T 3724-2020 高标准农田建设项目初步设计报告编制规程
评论
0/150
提交评论