版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、从试题分析谈有效教学策略左太政 / 国立高雄师范大学数学系一、九年一贯课程数学学习领域之教学评量的要求 :1、评量是检验教学效果的过程 , 教师应透过各种评量方式 , 来改善自己的教学。2、教学评量宜同时关照到学习成就与学习历程 , 分析学生是否能达到能力指标的 要求。3、根据学生个人的评量结果 , 教师可以理解学生既有的知识与经验 ,也可以从学 生发生的错误 , 回溯其学习上的问题并加以辅导修正。4、评量时 , 应注意评量时机的选择 , 避免对评量结果作错误或不当解读。5、评量时 , 应配合评量的目的 , 让问题能恰当反应学生的学习状态 , 并让所有的评 量题型, 发挥该题型的特长。二、测验
2、理论测验理论是一种解释测验资料间实证关系的有系统的理论学说,通常划分成 二大学派:一为古典测验理论一主要使以真实分模式数为骨干;另一为当代测验 理论主要是以试题反应理论为架构。(一)古典测验理论古典测验理论(classicaltesttheory,简称CTT称为古典真分数理论,其内涵主要是以真实分数模式 X T E为其理论架构,其中X为观察分数,是受试 者在测验中所得到的分数; T 为真实分数,是受试者接受测验无数次之得分的平均 数或期望值,并无法正确的被测量到; E 为误差分数,指的是测量的误差,也就是 受试者观察分数和真实分数的差。由於 CTT是依据弱势假设而来,故又称为弱真 分数理论。古
3、典测验理论衍生出试题分析时的重要指标,如难易度( difficulty )、监别 度( discrimination )和信度( reliability )等。(二)试题反应理论 古典测验理论在作试题分析时既有上述诸多缺点,遂有试题反应理论(itemresponsetheory ,简称IRT)诞生。IRT模式其主要是以个别试题的观点,来 解释测验分数的涵意。它认为学生在某一试题上的表现情形,与其背後的某种潜在 特质(即能力)之间具有某种关系存在,该关系可以透过一条连续性递增的数学函 数 来 加 以 表 示 和 诠 释 , 这 个 数 学 函 数 便 称 作 试 题 特 徵 曲 线 ( item
4、characteristiccurve,简称 ICC)。Tucker 是第一位使用试题特徵曲线一词的学者,其表示此曲线是将受试者 的潜在能力和实际得分情形联结在一起,受试者的测验成绩是由一些看不见的潜在 特质来决定,经由测验试题表现出这些特质,每个受试者在接受测验後,会有不同 的潜力表现出来,通常用数值来表达不同受试者潜在特质上的相对程度,亦即IRT中受试者的能力参数。ICC能清楚扼要地表示试题参数与能力间的关系变化,藉由 模式求出受试者在试题上的表现与对其能力之估计量的关系。不同的ICC就代表不同的试题参数与能力间的变化关系,每一种关系就有其相对应的一条ICC,亦即每一种试题反应模式都是用来
5、描述受试者能力与答对机率间的关系。常用的三种IRT模式,每一种模式都依其采用的试题参数的数目多寡来命名, 都仅适用於二元化的反应资料 (亦即,正确反应者登录为 1,错误反应者为 0的资料) (余民宁, 1992):1. 单参数洛吉数模式( one-parameterlogisticmodel )又称 RaschModel其中s:第s位受试者的能力参数P( s):表示能力参数为s的受试者S,答对试题i或在试题i上正确反应的机 率。D :表示常数为 1bi :试题难易度的参数根据公式的定义,试题难易度参数bi 的位置正好座落在正确反应机率为时的能力量尺(abilityscale )上的点;换言之,
6、当第i题的难易度参数bi落在试题特徵曲线上答对机率Pi()为的点时,试题的难易度参数会等於受试者能力值s。愈困难的试题,其试题特徵曲线愈是座落在能力量尺的右方;反之愈简单的试题,其试题特 徵曲线愈是座落在能力量尺的左方。 试题难易度参数有时又叫做位置参数 ( lccationparameter )。单参数的试题特徵曲线如图 2-1-1 所示,一个参数模式认 为影响受试者正确反应的机率大小的试题特徵,只有试题难易度,不把试题的监别 度和猜测度考虑在内。也就是说,一个参数的模式是假设所有试题的监别度是相等 的,而且试题的猜测度为零 。如此多的假设 ,使得单参数假设的适用性相对的降低。 理论上,难易
7、度bi值介於 之间,但实际应用上,通常只取2之间的范围。相对於古典测验理论的难易度指数,其所指的是试题真正的难度,不是古典测验理 论所指的易度, 而且古典测验理论的难易度指数是一种样本依赖 ( sampledependent )的指标,其值受到受试者样本的影响很大。图1 四条典型的单参数试题特徵曲线2. 洛吉数双参模式( two-parameterlogisticmodel )其中s :第S位受试者的能力参数R( S):表示能力参数为s的受试者S,答对试题i或在试题i上正确反应的机 率。D :表示常数为 1ai :试题监别度的参数bi :试题难易度的参数 与单参数模式相比,双参数模式多了一个参
8、数:试题监别度通常以ai 表示,是指试题对不同能力的受试者是否能反应出其答题的差异,也就是说监别度大的试 题,对於能力高的受试者而言,其答对率高;对能力低的受试者而言,其答对率低。 而试题监别度参数ai的值,刚好与在b点的试题特徵曲线的斜率(Slope )成某种比 例。试题特徵曲线愈陡( steeper )的试题比稍平滑的试题,具有较大的监别度参 数值;换句话说,监别度愈大的试题,其区别出不同能力水准考生的功能愈好,亦 即分辨的效果愈好。理论上,ai值的范围在之间,我们通常舍弃负的ai值不用, 因为带有负值ai的试题特徵曲线代表着:能力愈高的考生答对试题的机率愈低,这 似乎与学理相违背,所以负
9、的 ai值不用。因此,在实际应用上 ai也不能太大,其范 围常介於0到2之间。ai值愈大,试题特徵曲线愈陡,试题愈具有良好的分辨能力; 反之, ai 值愈小,代表试题特徵曲线愈平坦,试题则愈无法明显的分辨出考生能力 的水准(余民宁, 1992)。图2 四条典型的双参数试题特徵曲线由图2可知:试题 2的曲线,其斜率较小,亦即监别度较低,故无法有效分辨考 生能力。另外,这些曲线的下限值都是零,亦即两个参数模式未把考生的猜测度因 素考虑在内,所以本模式适用於自由反应( freeresponse )的试题分析或试题不太 困难的单选题测验分析,对於有良好施测指导语的能力测验资料亦可适用。3. 洛吉数三参
10、模式( three-parameterlogisticmodel )其中s:第s位受试者的能力参数P( s):表示能力参数为s的受试者S,答对试题i或在试题i上正确反应的机 率。D :表示常数为 1ai :试题监别度的参数bi :试题难易度的参数ci :试题猜测度的参数洛吉数三参数模式是由洛吉数双参数模式延伸演变而来,它多增加一个猜测度参数,通常用 ci 来表示,是指将能力极低或能力参数值为零的受试者考虑到模式里, 计算出此类受试者答对试题的机率,亦即把低能力受试者的表现好坏因素也考虑在 模式里,当然,猜题可能是这些受试者在某些测验试题(如选择题)上唯一的表现 行为。从ICC来看,它是位於该曲
11、线的左下渐近线。通常猜测度参数值比受试者在完 全随机猜测下猜答的机率稍小,亦即 c值小於试题选项数目的倒数,也就是说如果 一个试题有四个选项,则 g应小於。猜测度参数只出现在三参数以上的模式中,在 单参数及双参数模式中均将其假定为 0或接近0而忽略不计。c值愈小,表示猜测的 因素愈小,试题愈有效,最理想的 ci 值是 ci 等於0,表示试题完全不受猜测影响,但是只要测验的型式是选择题型,通常很难避免受试者的猜测行为。图3六条典型的三个参数试题特徵曲线由图2-1-3得知,曲线第3、5、6条与第1、2、4条曲线的比较,可以看出试题 猜测度参数,前者大於零,後者等於零,也就是能力低的受试者在於前者试
12、题上具 有较高的猜测行为。以下就古典测验理论的缺失与当代测验理论的特点整理如下表1做相互比较:表1古典测验理论的缺失与当代测验理论的特点的比较古典测验理论的缺失当代测验理论的特点一、 古典测验理论所采用的指 标,诸如:难度、监别度,和 信度等,都是一种样本依赖(sampledependent ) 的 指 标;也就是说,这些指标的获 得会因接受测验的受试者样 本的不同而不同。因此,同一 份试卷很难得获得一的难 度、监别度,或信度。一、当代测验理论所采用的试题二、参数(itemparameters )(如: 难度、监别度、猜测度等), 是一种不受样本影响(Sample-free )的指标;也 就是
13、说,这些参数的获得,不 会因为所选出接受测验的受 试者样本的不同而不同。当代测验理论能够针对每位 受试者,提供个别差异的测量误差表 2-1-1 (续)古典测验理论的缺失当代测验理论的特点二、古典测验理论以一个相同的三、测验标准误四、(standarderrorofmeasurem五、ent ),作为每位受试者的测量 误差指标,这种作法并没有考 虑受试者能力的个别差异,对 高、低能力两极端组的受试者 而言,这种指标极为不合理且 不准确,致使理论假设的适当 性受到怀疑。测验理论对於非复本(non parallel )但功能相同 的测验所测得的分数间,无法 提供有意义的比较,有意义的 比较仅局限於相
14、同测验的前三、指数,而非单一相同测量标准四、误,因此能精确推估受试者的五、能力估计值。六、当代测验理论可经由适用的 同质性试题组成得分试验,测 量估计出受试者个人的能 力,不受测验的影响(test-free ),并且对於不同受试者的分数,亦可进行有意 义的比较。当代测验理论提出以试题讯息量(iteminformation )及 试卷讯息量(testinformation) 的 概念,来作为评定某个试题或整後测分数或复本测验分数之 间。古典测验理论对信度的假 设,是建立在复本(parallelforms)测验的概念假设上,但是这种假设往往 不存在於实际测验情境里。道 理很简单,因为不可能要求每
15、位受试者接受同一份测验无 数次,而仍然假设每次测量间 都彼此独立不相关。况且,每 种测验并不定同时都有 制作复本,因此复本测验的理 论假设是行不通的,从方法学 逻辑观点而言,它的假设也是 不合理的、矛盾的。 古典测验理论忽视受试者的 试 题反应 组型(itemresponsepattern ),认 为原始得分相同的受试者,期 能力必定 样:其实不然,即 使原始得分相同的受试者,其 反应组型亦不见得会完全一 致。因此,其能力估计值应该 会有所不同。份试卷的测量准确性,倒有取 代古典测验理论的信度, 作为评疋试卷内部 致性指 标之势。当代测验理论同时考虑受试 者的反应组型与试题参数等 特性,因此在
16、估计个人能力 时,除了能够提供一个较精确 的估计值外,对於原始得分相 同的受试者,也往往给予不同 的能力估计值。当代测验理论所采用的适合 度考验值(statisticofgoodness-of-fit ),可以提供考验模式与资 料间之适合度、受试者的反应 是否为非寻常(unusual )等 参考指标。三、国中数学科测验命题原则(一)、一般注意事项1. 试题的表达方式要能切合该题的评量目标。2. 试题要能清楚的表达题意。3. 每个试题只问一个问题,避免同时包含太多概念。4. 试题的文字叙述应简洁、明白,避免出现跟答案无关的内容5. 标点符号的使用要准确。6. 试题的文字叙述应加以变化,避免直接抄
17、袭课文7. 试题宜与学生的生活经验相结合。(二)、题干与选项的设计原则1. 题干与选项的文法要一致,逻辑上要能连贯。2. 题干或选项中,应避免出现可能暗示正确答案的线索。3. 题干应尽量用正面的叙述,避免使用否定句。若用否定句时,请在否定 字眼下加注双底线。4. 题干的叙述应保持完整,避免被选项分割成两个部份或段落。5. 各选项中重复出现的文字请放在题干内。6. 每个选项应使用相似的表达方式。7. 选项中只有一个最佳或正确答案。8. 错误选项应具有诱答力。9. 错误选项要能有充分的理由,足以说明其不正确。10. 应尽量避免以上皆是或以上皆非的选项。11. 选项应相互独立,彼此之间没有逻辑上的关
18、联(相互依赖、相反)。12. 选项中应避免出现绝对性的字眼。(三)、题组1. 选用的短文、图表、地图或实验等资料,必须符合该题的评量目标。2. 选用的资料需简短而且有意义。3. 试题的数目应与所选用资料之长度成恰当的比例。(四)、公平性1. 试题中应避免歧视性别或种族的字眼。2. 试题中的讯息不宜是某些群体(种族、性别、居住地区)所特别熟悉。3. 考生答对试题的机会,不应受到该题学力指标以外的因素所影响。(五)、原创性1. 试题不应在课本、参考书或补习班讲义中出现过。2. 试题不应在任何考试中出现过 ( 包括历届联考、推荐甄试、学校考试或 其他大型考试 ) 。四、试题分析( itemanaly
19、sis )试题分析的目的即在透过客观的量化分析,找出每个试题所具有的统计特徵为 何,以帮助教师明了自编或成就测验试题的特性,方便作为建立题库的基础,供作 他日之用。一份好的测验,是由良好品质的试题所组成的,如何知道各个题目的品 质?这必须藉由试题分析以提供讯息,而试题分析的功能,即是在於了解试题的品 质,删去或改写品质不佳的试题,进而改善试题的品质,以达成提升测验品质的目 的。试题分析具有下列几项功能,兹分述如下:(一)作为改进学生学习的参考在施测之後,每位学生有权力知道他的得分以及他在每道试题上作答结果的正 误。教师可以利用试题分析後对试题特徵的了解,来和学生做逐题的讨论和解释原 因,以期能
20、够澄清学生的错误概念和迷思想法,更正因不良学习习惯与应试技巧不 当所造成的疏忽,激发改进下次测验表现的动机,及矫正不当的学习方法和习惯。 (二)作为实施补救教学的依据根据试题分析的结果,教师可以明了学生答题的分布情形,并且从中看出学生 共同感觉学习困难的地方,然後针对这些困难所在设计有效的校正策略,对症下 药,实施补救教学或其他矫正措施。(三)作为修改课程建议的凭据试题分析可以帮助教师评监学习成果与课程内容是否适合所教导的学生。例 如,在测量某些教学单元的试题上,如果学生时常重复发生错误,或发生的错误遍 及所有的学校及学生时,那就表示这些试题已反应出某些教材可能不适合学生的学 习,此时便需要建
21、议修改课程,或调整教材内容的顺序,或改采其他版本的复本教 材,或采去其他更有效的教学策略和教学方法。(四)增进教师编制测验的经验试题分析可以帮助教师明了哪些试题的难度是否过度困难或过度容易、监别度 是否过高或过低,有无提供答案线索,诱答选项是否有效,或题意的表达是否清楚 等讯息。这些讯息可以做为教师修订或删改试题的参考依据,提供教师宝贵的命题 经验,增进日後编制新测验的命题技巧。(五)增进测验题库运用的效能题库并不只是一堆试题的集合体,它必须是经过试题分析後,保留下来具有优 良试题特徵(如:内容效度、内部一致性信度、难度、监别度、和诱答力)的试题 所组合而成。因此,试题分析可以协助教师筛选出优
22、良试题,以作为题库的基本试 题;行之有年後,教师便拥有自己任教科目的题库。日後,当需要编制新测验向学 生施测时,教师只要依据教学评量目标及双向细目表,从题库中随机抽取符合要求 的试题,便可以轻易、随时及有系统地组成新测验卷,这不仅可以省下重编一份新 测验的时间、人力和物力的花费,更可以增进测验运用的效能,达成随心所欲的测 量目的。在测验编制过程中,试题分析是一件非常重要的工作。试题分析可分为质的分 析与量的分析两部分。(一)试题质的分析在试题编制时,应特别注意命题的基本原则,才能编出适切的试题,例如:学 科成就测验的主要目的为评量受试者接受某一学科正式教学後的学习结果 ,因 此试题必须要能符合
23、课程的内容,并依据所要达成的教学目标,就受试者行为变化 的不同层面加以评量,也就是说试题在质方面的分析,可由试题的内容审查、有效 命题原则及教学目标等评监工作来进行。试题本身的编制内容与方式也需符合测验编制的原理与要求。试题编制完成之 後,可邀请学科专家 3至 5人,针对测验计划、测验题目与测验形式三个向度,评 估试题的适切性,使对整份测验品质有所建议与改善,以达到对试题品质的要求。 试题的检视与编辑应注意下列事项:1. 每道试题是否均能测量到双向细目表中的每一项重要学习结果?2. 试题的类型是否适合於所要测量的学习结果?3. 试题的叙述是否明确,是否遗漏了重要的条件?4. 应使用简单且清晰的
24、用语来陈述。5. 试题应避免提供额外之线索。6. 试题是否难易适中?7. 每道试题是否彼此独立、未采用连锁题?8. 测验所包括的试题,是否能够涵盖整个双向细目表的内容?(二)试题量的分析1. 难易度分析试题的难易度与测验的效率有关,难易度适当的试题是构成优良测验的必要条件。通常以P代表试题难易度,N代表全体受试者人数,R为答对该题的人数,Ph 表示高分组(全体受试者当中,分数最高的27%答对该题的百分比,Pl表示低分组(全体受试者当中,分数最低的27%答对该题的百分比。难易度的计算方式有二种方式:R(1) P R 100%N例如:有一个测验共有100名受试者,其中某一题答对的人数为25人,则此
25、题的难易度为P互100% 0.25。100(2)p巳巴N例如:有一个测验总共有100名受试者,其中某一题高分组答对的百分比为75%低分组答对的百分比为 25%因此可算得难易度为P 0.75 0.250.5。p质介2於0与1之间的一个值,P值愈大表示试题愈容易,相反的 P值愈靠近0表示试题 愈难,例如:三个试题其难易度分别为 P1 0.25、p2 0.5和P3 0.75,表示第一题 比第二题难,第二题又比第三题难,但难易度为一次序量尺(ord in alscale ),差 距单位并不相等,其值仅代表试题难易程度的相对位置,两个难易度的差不具任何意义,由上面的例子说明,不能说第一题关於如何利用难度
26、值来挑战试题,一般都将试题的难度分为五个等级,如下表2-2-1所示:表2-1试题难易度等级表难易度难易度等级极容易容易难易适中困难极困难一般测验专家均建议挑选难易度约为的试题,也就是难易适中的试题,因为这 样的试题评监度可以达到最大,不过在实际的选题上,要使每一题的难易度都接近 是有些困难的。因此有学者便主张以到之间的难易度范围作为选择题的挑选标准。 平均而言,整份测验的平均难度值还是以接近为佳。2. 监别度分析构成测验的试题,必须具有监别某种心理特质的作用,才能使测验成为可靠又 正确的测量工具。也就是说,试题的监别度高低与测验的信度和效度有着密切的关 系,欲增进测验的预测与诊断的功能,必须要
27、很仔细的分析试题的监别度,分析监 别度的方式主要有两方面:(1)内部一致性分析内部一致性分析旨在了解各个试题的功能是否和整体测验的功能相符合一 致。此种分析的一个基本假设是:整个测验的分数具有某种程度的效度。如果此架 设成立。则个别试题的反应若和总分间具有一致性,就表示题目有某种程度的效 度。换言之,高分组答对的比例显着大於低分组的比例,故该题的作用和总分的作 用一致。基於此,监别力的分析方法,采用下列公式:27%)。D :监别力指数。Ph :高分组答对百分比(全体受试者当中分数最高的Pl :低分组答对百分比(全体受试者当中分数最低的27%)。当测验分数是常态分配时,以 27%分组可以获得试题
28、监别度的最大可靠性;百 分比低於27%时,结果的可靠性较低,而百分比较大时会影响试题的监别作用。对 教师而言,合理的分组百分比可在25 %到33 %之间。监别力指数(itemdiscriminationindex)通常以小数表示,其值介於1之间。指数愈高,表示监别力愈大。指数愈低,表示监别力愈小。如果指数为0,表示题目没有监别作均有用,此种现象可以是:(1)因为题目太容易或太艰难,所有人均答对或所有人均答 错;(2)因为题目不清楚。如果低分组答对百分比高於高分组,则监别力将是负的, 此种题目具有反向作用,应淘汰之。人数太少,题目不清楚或正确答案错误, 可能导致此种情形。(2)外在夕卜在 的目的
29、在 目是否具 某种监别 析的过程 部一致性监别指数试题评监以上非常优良优良,但须小幅度修改尚可,但须部分修改以下劣,须要大幅度修改或删除表2-2监别度评监标准表效度分析效度分析 於检验题 有预定的 作用。其分 与上述内 分析方法,大致相同,唯一不同之处,为外在效度分析系统依据外在效标的分数分为高、 低两组。例如,数学成就测验的编制,可用学校数学科成绩为外在效标,分成高、 低两组,将两组分数相减,其差数可显示各个试题在预定功能上的监别力。内部一 致性分析则依预试测验总分分为高、低两组。前者在於使测验的外在效度变得很 大,而後者在於使测验的内部一致性变得很大。这两者均为测验编制所希望的相 标,应以
30、何者为分析依据,需视测验的目的而定。一、选项分析选择题的选项包括正确选项与诱答选项,正确选项必须明确且不会引起任何争 议,而诱答选项则必须具有诱答的功能,要知道这些特质是否成立,则需透过选项 分析。选项分析可以让施测者清楚知道每一试题的所有选项是否符合命题的原则,选 项分析是透过比较高分组与低分组对正确与诱答选项的选答率,如果分析的结果符 合下面两项要求,则表示该试题的所有选项是合理有效的(郭生玉,1989):(一)正确选项的选答率,高分组必须高於低分组。(二)每一个诱答选项均有低分组的受试者选答,且低分组的选答率高於高分组。如果不符和第一个要求,表示此试题具有负向的监别度,不能清楚区分高分组
31、 与低分组;至於第二个要求,又有两个方面需要讨论,首先是如果一个选项没有任 何低分组或高分组受试者选答,表示该选项不具任何诱答率,应该在修改题目将此 选项更换;而如果是该诱答选项高分组的选答率高於低分组,则表示该诱答选项的 叙述可能有不清楚或错误诱导的地方,使得高分组的受试者有较多误选的情形,因 此在修改试题时,应该特别注意这些选项。四、试题特徵曲线试题特徵曲线是用来描述所测量的潜在特质与其在试题上正确反应机率间的 关系,亦即受试者潜在能力 0(在标准化的座标中,以横轴表示)相对於此能力在 这试题中的答对机率 P (0)(在标准化的座标中,以纵轴表示)的关系曲线,藉试题特徵曲线的应用原则,有下
32、列几点:1. 在任一特定的可当作试题在该能力范围内的监别度。2. 透过试题特徵曲线可以求得的是试题的总体难易度和总监别度。即当通过比率 等於时的对应总分或能力值,这个数值可当作试题的总体难易度。此外,在总 体难易度这点上的斜率亦可以当试题的总监别度。3. 好的试题其试题特徵曲线应该呈现出正的斜率与适中的难度五、信度及效度一份测验,除了透过个别试题的分析之外,若能针对整份测验做测验整体的分 析(即测验分析) ,必能提高测验的品质。测验分析在此主要以信度、效度及双向 细目表为主。(一)信度 信度可以说是可靠度,从字面上的意义来解释,就是一份测验的结果是否可 靠。一般而言,一份优良的教育测验至少应该
33、具有以上的信度值,才具有使用的 价值。1. 信度的种类与求法常用估计信度的方法有四种:重测法、复本法、内部一致性方法、评分者方法, 兹介绍如下:( 1)重测法( test-retestmethod ) 估计测验分数是否稳定,最直接的方法是重测方法。此种方法是采用同一个测 验在不同的时间,重复测量相同的一群受试者两次,根据这两次分数求得的相关, 称为重测信度系数( test-retestreliabilitycoefficient ),或称再测信度。( 2)复本法( equivalent-formsmethod )此种信度主要在确定我们有多少信心能够从个人在测验上的得分,推论到其他 相等复本测验
34、上的得分。估计复本信度,必须有真正的复本测验,否则无法估计。 两个复本测验实施於一群相同的受试者,依据所测量到的分数求相关,即为复本信 度。此信度系数可以说明两个复本测验测量相同行为或内容的程度。因此,信度愈 高,表示所测量的试题样本愈可靠,愈能以之代表所欲测量内容的范围。( 3)内部一致性方法( internal-consistencymethod )上述两种信度的估计方法,均需实施两次的测验,受试者的合作、动机、疲劳 和厌烦等可能影响测验的实施。因此,只根据一次测验结果就可以估计信度的分 法,较受欢迎,内部一致性方法就是属於这种的估计方法。此种方法包括有:折半 方法 (split-half
35、method )、库李方法 (Kuder-Richards onm ethod )、Cron bach s a和霍意特变异数分析法( Hoyt sanalysisofvarianceprocedure ) 。以下将只介绍 本论文所采用Cr on bach s a的信度系数之计算方法。Cron bach s a系数:因为库李信度适用於非对即错的计分方式,也只能处理计分测验的缺失,但很多测验的计分是采多重计分的方式,这时,就必须采用Cron bach s a系数,此方法为统计学者 Cron bach於1951年提出的,若设a为估 计的信度,则其公式为:k2ik表题数丄厂 系数公式的一个特例,其中:xi2表第i题的变异数2表总分
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中考物理复习主题单元7第18课时机械效率课件
- S版六年级上册语文表格式教案
- 《两只小象》教学反思
- 城市建设挖掘机月租赁合同范本
- 医疗器械代发工资承诺书
- 六年级语文上册部分教案
- 水文观测防尘网施工合同
- 石油化工产品进口许可合同模板
- 乐器制造厂聘用合同模板
- 房地产销售投诉处理规范
- 2024年企业业绩对赌协议模板指南
- “全民消防生命至上”主题班会教案(3篇)
- 上海市普陀区2024-2025学年六年级(五四学制)上学期期中语文试题
- 2024黔东南州事业单位第二批遴选人员调减遴选历年高频难、易错点500题模拟试题附带答案详解
- 采伐树木合同模板
- 培训师破冰游戏大全课件
- 2024版成人术中非计划低体温预防与护理培训课件
- 期中测试卷-2024-2025学年统编版语文三年级上册
- 综合素质评价平台建设方案-2024
- 广东省珠海市紫荆中学2025届高二数学第一学期期末达标检测试题含解析
- 2024屋顶分布式光伏场站设备运维规程
评论
0/150
提交评论