版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
教育科学研究方法扬州大学教育科学学院郭兆明guozhaom@教育科学研究方法1教育科学研究方法教育研究的过程(第三编)教育研究方法的类型(第二编)教育科学研究方法教育研究的过程(第三编)2教育研究的过程(第三编)课题的选择(第八章)研究方案的设计(第九章)资料的整理与成果的表述(第十章)教育研究的过程(第三编)课题的选择(第八章)3第八章研究课题的选择发现研究问题检索相关文献确立研究课题第八章研究课题的选择发现研究问题4发现研究问题实际需要前人的研究发现研究问题实际需要5实际需要(讨论)数学(阅读)学习不良学生的认知特点及其干预研究卢仲衡的自学辅导实验法顾冷沅青浦数学教学改革布卢姆的教学评价的新突破80年代以来师范生素质的发展趋势研究高职院校学生职业性向测试分析研究实际需要(讨论)数学(阅读)学习不良学生的认知特点及其干预研6前人的研究“一步评价”技术研究样例学习的研究(1)单个样例的研究(子目标,无具体目标)(2)多个样例的研究(样例个数、样例呈现方式)(3)样例学习与问题解决的比较前人的研究“一步评价”技术研究7检索相关文献文献检索在教育科研中的作用教育文献的种类及主要分布文献检索的过程和主要方法检索相关文献文献检索在教育科研中的作用8文献检索在教育科研中的作用避免重复劳动,提高科学研究的效益做好文献综述文献检索在教育科研中的作用避免重复劳动,提高科学研究的效益9教育文献的种类及主要分布书籍报刊网络媒体(中国知网,CNKI)教育文献的种类及主要分布书籍10文献检索的过程和方法过程(主题、关键词、作者、来源)方法(按时间查、按照引文查)文献检索的过程和方法过程(主题、关键词、作者、来源)11确立研究课题确立研究课题的思维策略论证研究课题的主要问题确立研究课题确立研究课题的思维策略12确立研究课题的思维策略分析课题的研究价值(结合项目申报)(1)理论价值(2)实践价值考察研究人员的主观条件考虑研究的客观条件
确立研究课题的思维策略分析课题的研究价值(结合项目申报)13在选择课题时,要尽量避免:(1)范围太大,无从下手;(2)在现有条件下,难度较大,资料缺乏;(3)属于经验感想之谈,而不是科研题目。在选择课题时,要尽量避免:(1)范围太大,无从下手;14论证研究课题的主要问题研究问题的性质(理论研究、应用研究)研究的目的和意义(研究价值)国内外相关研究现状、可能有所突破之处。研究的可能性、基本条件研究的步骤及成果形式论证研究课题的主要问题研究问题的性质(理论研究、应用研究)15第九章教育研究方案的设计制定研究方案的主要注意事项:(1)陈述研究课题(2)论述研究的目的和意义(3)阐述研究假设和依据(4)阐述研究内容(5)确定研究对象(6)选择抽样方法(7)选择研究方法和工具(8)制定行动计划第九章教育研究方案的设计制定研究方案的主要注意事项:16第十章教育研究的资料整理与成果表述研究成果的的基本格式(1)题目(20字以内)(2)摘要和关键词(3)主体【引言、方法、结果、讨论(定量研究)】(4)参考文献第十章教育研究的资料整理与成果表述研究成果的的基本格式17第二编教育研究方法的类型教育研究的实证方法(第四章)1、问卷调查法2、教育测量法3、教育实验法4、内容分析法教育研究的质性方法(第五章)1、访谈调查法2、叙事研究法第二编教育研究方法的类型教育研究的实证方法(第四章)18第四章教育研究的实证方法问卷调查法教育测量法教育实验法内容分析法第四章教育研究的实证方法问卷调查法19问卷调查法界定特点步骤案例研究【问卷举例(SCL90,职业兴趣、16PF,开发者问卷)】问卷调查法界定20界定是研究者用严格设计的问卷,通过书面语言与被调查者进行交流,来收集研究对象关于教育问题或教育现象的信息和资料的方法。界定是研究者用严格设计的问卷,通过书面语言与被调查者进行交流21特点调查工具标准化调查过程标准化调查结果标准化研究效率高特点调查工具标准化22步骤设计前的探索设计问卷的结构设计问卷初稿试用和修改问卷发放和回收问卷(回收率应不低于70%)分析调查结果步骤设计前的探索23设计问卷初稿选择调查类型选择问题形式斟酌问题表述设计规范答案关注问题数量(时间控制)合理排列问题设计问卷初稿选择调查类型24选择调查类型就调查内容而言,选择综合调查或专题调查。就调查目的而言,选择常模调查或比较调查就调查范围而言,选择普遍调查或抽样调查选择调查类型就调查内容而言,选择综合调查或专题调查。25选择问题形式填空式是否式多项单选式多项限选式表格式(答题纸)或量表式(P83)排序式(P83)选择问题形式填空式26案例研究中小学生家庭作业心理现状的调查分析上海市中小学生家庭教育现状的调查分析五年制师范生心理健康状况SCL-90的调查分析小学数学作业批改的现状的调查分析中小学生闲暇生活状况的调查分析物理教师课堂教学行为的调查分析案例研究中小学生家庭作业心理现状的调查分析27教育测量法界定特点步骤个案研究教育测量法界定28界定教育测量法:根据某种规则,以数量化的形式描述教育现象的某种属性。界定教育测量法:根据某种规则,以数量化的形式描述教育现象的某29特点以测验为工具对研究对象进行测试,从而获得数量化的结果,并通过进一步分析获得相关结论。例如,了解学生的知识和能力发展情况。特点以测验为工具对研究对象进行测试,从而获得数量化的结果,并30编制测验的步骤确定测验目的确定测验内容确定测验形式筛选题目(难度、区分度)标准化过程鉴定测验(信度、效度)编写测验指导书编制测验的步骤确定测验目的31项目分析
第一单元项目难度第二单元项目区分度项目分析第一单元项目难度32第一单元项目难度
项目难度的定义
项目难度的计算方法难度水平的确定
第一单元项目难度项目难度的定义33项目难度的定义
项目难度(difficulty)是指题目的难度。【注】(1)在非能力测验(如人格测验)中,类似的指标是“通俗性”,即取自相同总体的样本中,能在答案方向上回答该题的人数,其计算方法与难度相同。(2)难度的指标通常以通过率表示,以答对(通过)该题的人数百分比来表示:
P=(R/N)×100%,P表示项目难度,N表示全体被试数,R为答对(通过)该项目的人数。从公式可以发现:难度越大,P值越小。
项目难度的定义项目难度(difficulty)是指题目的难34计算方法
二分法计分项目非二分记分的项目计算方法二分法计分项目35二分法计分项目
心理测验的项目大多为选择题,通过计1分,错误计0分。1、当被试较少时,对这类题目可以直接使用公式P=(R/N)×100%计算难度。2、当被试较多时,则可根据测验总成绩将被试分成三组:分数最高的27%被试分为高分组,分数最低27%被试为低分组,中间46%的被试为中间组。分别计算高分组和低分组的通过率,以两组通过率的平均值作为每一题的难度。其公式为:
P=(PH+PL)/2式中P表示难度,PH和PL分别代表高分组和低分组通过率。二分法计分项目心理测验的项目大多为选择题,通过计1分,错误36非二分记分的项目
当测验项目为问答题或不能用二分法记分的形式时,一般用下面的公式计算难度。非二分记分的项目当测验项目为问答题或不能用二分法记分的形式37难度水平的确定
项目难度测验的难度
难度水平的确定项目难度38项目难度
进行难度分析的主要目的是为了筛选项目,项目的难度多高合适,取决于测验的目的、性质以及项目的形式。项目难度进行难度分析的主要目的是为了筛选项目,项目的难度多39测验目的
准确测量个体的差异。在选择题目时,最好使试题的平均难度接近0.50,而各题难度在0.50±0.20之间。注:(1)若P=0或1时;(2)P=0.5时,举一个极端的例子,假如某测验各试题间的相关系数均为1,难度均为0.50,那么就有可能使50%的被试答对所有的题目得满分;另外50%的被试无法通过任何试题得0分)测验目的准确测量个体的差异。在选择题目时,最好使试题的平40测验的性质
当测验用于选拔或诊断时,应该比较多地选择难度值接近录取率的项目。(1)若测验是要选拔少数最优秀的被试,测验就应该有相当高的难度,P值就应该小。例如,如果录取率为20%,那么题目难度最好确定为20%,使得恰好20%的优秀被试通过;(2)假如测验是要诊断出少数较差的被试,则测验难度应该小,P值应该高,使得只有少数被试不能通过。测验的性质当测验用于选拔或诊断时,应该比较多地选择难度值接41测验的形式
对于选择题来说,P值一般应该大于概率水平。例如,对于是非题,其难度值应该为0.75最为合适;而对于四选一的题目,其难度值约为0.63时最为适宜。
测验的形式对于选择题来说,P值一般应该大于概率水平。例如,42测验的难度
通过考察测验分数的频数分布,可以对测验的难度作出直观检验(常态分布,偏态分布:正偏态分布、负偏态分布)。(1)如果被试的取样具有代表性,对于中等难度的测验,其测验总分应该接近常态分布。如果得分多数偏高或偏低,则分别为“负偏态分布”和“正偏态分布”。(2)正偏态分布,即大多数得分集中在低端,说明编制的测验对于所要研究的样本团体来说偏难,因此,必须增加足够数量的较容易的项目;(3)负偏态分布,即大多数得分集中在高分端,说明测验过容易,必须增加足够数量的有高难度的项目。测验的难度通过考察测验分数的频数分布,可以对测验的难度作出43第二单元项目区分度
项目区分度的定义项目区分度的计算方法区分度与难度的关系
第二单元项目区分度项目区分度的定义44项目区分度的定义
项目区分度(itemdiscrimination),也叫鉴别力,是指测验项目对被试的心理特性的区分能力。
项目区分度的定义项目区分度(itemdiscrimina45项目区分度的计算方法
鉴别指数相关法
项目区分度的计算方法鉴别指数46鉴别指数1.按测验总分高低排列答卷;2.确定高分组与低分组,每一组取答卷总数的27%;3.分别计算高分组与低分组在该项目上的通过率或得分率。4.按下列公式估计出项目的鉴别指数:D=PH-PL,式中D为鉴别指数,PH为高分组在该项目上的通过率或得分率,PL为低分组在该项目上的通过率或得分率。【注】高分组若在该测验上的得分率高于低分组,则D>0,D越大,说明该项目区分两种不同水平的程度越高。若D<0,则反映高水平组在该项目上的得分率反而低于低水平组,说明有问题。鉴别指数1.按测验总分高低排列答卷;471965年,美国测验专家(L.Ebel)根据长期的经验提出用鉴别指数评价项目性能的标准,鉴别指数D项目评价0.40以上0.30-0.390.20-0.290.19以下很好良好,修改会更佳尚可,但需修改差,必须淘汰1965年,美国测验专家(L.Ebel)根据长期的经验提出用48相关法
计算区分度最常用的方法是相关法,即以某一项目分数与效标成绩或测验总分的相关作为该项目区分度的指标。相关越高,表明项目越具有区分的功能。相关法计算区分度最常用的方法是相关法,即以某一项目分数与效49区分度与难度的关系
难度和区分度是相对的,是针对一定团体而言的,绝对的难度和区分度是不存在的。一般来说,较难的项目对高水平的被试区分度高,较易的项目对水平低的被试区分度高,中等难度的项目对中等水平的被试区分度高。由于人的大多数心理特性呈常态分布,所以项目难度的分布也以常态分布好,即特别难与特别易的项目少一些,接近中等的项目多一些,而所有项目的平均难度为0.50,这样不仅能够保证多数项目具有较高的区分度,而且可以保证整个测验对被试具有较高的区分能力。
区分度与难度的关系难度和区分度是相对的,是针对一定团体而言50测验的信度
信度的概念信度评估的方法测验的信度信度的概念51信度的概念
信度的定义信度(reliability)指的是测量结果的稳定性程度。注:(1)若能用统一测量工具反复测量某人的同一心理特质,则其多次测量的结果间的一致性程度就叫信度。有时也叫测量的可靠性。(2)例如:比较钢尺与具有弹性的皮尺测量长度的信度。信度的概念信度的定义52第二单元信度评估的方法
(1)重测信度(2)复本信度(3)内部一致性系数(4)评分者信度
第二单元信度评估的方法(1)重测信度53重测信度
含义和计算使用的前提条件优点、缺点注意点使用重测信度的量表举例
重测信度含义和计算54定义和计算
重测信度(1)含义:是指同一量表对同一组被试两次所得结果的一致性程度。(2)计算:大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数。注:(1)此测验主要测量测验跨时间的稳定性,所以,又称稳定性系数。(2)当信度较大时,说明前后两次测量的结果比较一致,测量工具比较稳定,被试的心理特质受被试状态和环境变化的影响较小。
定义和计算重测信度55使用的前提条件(1)所测量的心理特性必须是稳定的。例如,成人的人格测验就可以;但儿童的成就测验就不行(例如,刚入学儿童的识字量)。(2)遗忘和练习的效果基本上互相抵消。智力测验的间隔时间一般在6个月左右。(3)在两次施测的间隔时期内,被试的心理特质方面没有获得更多的学习和训练。使用的前提条件(1)所测量的心理特性必须是稳定的。例如,成56优、缺点优点:能够提供测验是否随时间而变异的资料,可作为被试将来行为表现的依据。缺点:易受练习和记忆的影响。(1)如果两次施测间隔的时间太短,则记忆犹新,练习的影响较大;(2)如果间隔的时间太长,则身心发展与学习经验的积累等足以改变分数的意义,而使得相关减低。最适宜的时距随测验的目的、性质和被试特点而异,一般是两周到四周为宜,时间间隔最好不超过六个月。优、缺点优点:能够提供测验是否随时间而变异的资料,可作为被57注意点:同一量表,随着第二次测量的时间不同,它可以有不同的重测信度。因此,在报告重测信度时,应说明两次施测的间隔,以及在此期间被试的有关经历。例如,《韦氏儿童智力量表手册》中国修订版(C-WISC)中,就报告了两次测验的时间间隔(2-7周)以及两次的相关系数(城市:0.59-0.86,农村:0.59-0.81)。注意点:同一量表,随着第二次测量的时间不同,它可以有不同的58使用重测信度的量表举例
MMPI:临床量表在相隔两周重测,其值在0.58-0.92之间。CPI:加州心理调查表的重测信度各量表分别为0.38-0.77,平均0.66.SB4(斯坦福-比奈量表第四版)瑞文:三个版本的一些重测信度研究结果不一,正常成人为0.80-0.93。
使用重测信度的量表举例MMPI:临床量表在相隔两周重测,其59复本信度
含义与计算使用的前提条件优、缺点注意点使用复本信度的量表举例
复本信度含义与计算60含义与计算
复本信度(1)含义:指两个平行的测验测量同一组被试所得结果的一致性程度。(2)计算:大小等于同一组被试在两个复本测验上所得分数的皮尔逊积差相关系数。它是研究测验跨形式的一致性(等值性)。复本信度的分类:(1)等值性系数(同时);(2)稳定性与等值性系数(不同时)。含义与计算复本信度61等值性系数定义:如果两个复本测验是同时连续施测的,则这种复本信度称为等值性系数。大小:反映两个复本测验的题目差别所带来的变异情况。等值性系数定义:如果两个复本测验是同时连续施测的,则这种复本62稳定性与等值性系数定义:如果两个复本测验是相距一段时间分两次施测的,则这种复本信度称为稳定性与等值性系数。它既考虑了测验在时间上的稳定性,也考虑了不同题目样本反应的一致性。大小:与其它信度系数相比,此种复本信度最小,也就是说,稳定性与等值性系数是对信度的最严格的检验,其值最低。稳定性与等值性系数定义:如果两个复本测验是相距一段时间分两次63使用的前提条件
条件1:构造出两份或两份以上真正平行的测验。注:复本测验必须在题目内容、数量、形式、难度、区分度、指导语、时限以及所用的例题、公式和测验等其它方面都相同或相似。条件2:被试有条件接受两个测验。例如,时间、经费等。使用的前提条件条件1:构造出两份或两份以上真正平行的测验。64优、缺点优点:能够避免重测信度的一些问题,如记忆、学习等。缺点:(1)如果测量的行为易受练习的影响,则复本信度只能减少而不能完全消除这种影响;由于第二个测验只改变了题目的内容,已经掌握的解题原则,可以很容易地迁移到同类问题。(2)对许多测验来说,建立复本是非常困难的。优、缺点优点:能够避免重测信度的一些问题,如记忆、学习等。65注意点:第二次测验仍会受到练习和记忆等因素的影响、一些解题的策略等技能也会产生也会产生迁移。对于稳定性与等值性系数,在报告结果时,也需要报告两次施测的间隔,以及在此间隔内被试的有关经历。
注意点:第二次测验仍会受到练习和记忆等因素的影响、一些解题66使用复本信度的量表举例
成就测验的A、B卷。
使用复本信度的量表举例成就测验的A、B卷。67内部一致性系数内部一致性系数主要反映的是题目之间的关系,表示测验能够测量相同内容或特质的程度。(1)分半信度(2)同质性信度内部一致性系数内部一致性系数主要反映的是题目之间的关系,表示68分半信度
含义计算使用的前提条件及范围使用分半信度的量表举例
分半信度含义69含义
分半信度是指将两个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。这种方法估计信度系数只需一种测验形式,实施一次测验。通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试在两半测验上的得分,求出这两半分数的相关系数。这个相关系数就代表了两个半测验内容取样的一致性程度,因而属于内部一致性系数。
含义分半信度是指将两个测验分成对等的两半后,所有被试在这两70计算
先求半测验的信度(皮尔逊积差相关系数)
(1)如果两半测验的变异数相等,则使用斯皮尔曼-布朗公式:式中rhh表示一半分数的相关系数,rxx为测验原长度的信度估计值。
(2)如果两半测验的变异数不相等,则使用弗朗拉根(Flanagan)公式或卢仑公式计算先求半测验的信度(皮尔逊积差相关系数)71使用的前提条件及范围:
(1)分半信度通常在只能施测一次或没有复本的情况下使用。(2)将一个测验分成两半的方法很多,所以,同一测验通常会有多个分半信度。分半的方法有:按题号的奇偶性分半、按题目的难度分半、按题目的内容分半等。
使用的前提条件及范围:(1)分半信度通常在只能施测一次或没72使用分半信度的量表举例
(1)CPI的分半相关系数为0.63-0.86,平均为0.78.(2)瑞文彩色本的分半信度在0.65-0.94,年轻受试者较低。标准本的分半相关信度为0.86,也是年轻者较低。(3)韦克斯勒三套智力量表(WAPPSI-R,WISC-3,WAIS-R)言语量表:分半信度在0.86-0.97操作量表:分半信度在0.85-0.94全量表:分半信度在0.90-0.98(4)SB4:内在一致性系数均在0.9-0.99之间。使用分半信度的量表举例(1)CPI的分半相关系数为0.6373同质性信度
含义计算使用同质性信度的量表举例同质性信度含义74含义同质性信度是指测验内部所有题目间的一致性程度。题目间的一致性:(1)所有题目都测的是同一种心理特质;(2)所有题目得分之间具有较高的正相关。含义同质性信度是指测验内部所有题目间的一致性程度。75当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。如果一个测验的同质性信度不高,则说明测验结果可能是几种心理特质的综合反映(应采用分测验)。
当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一76计算同质性信度K-R20K-R21克伦巴赫α系数计算同质性信度K-R2077(1)K-R20公式库德和理查德逊于1937年提出,仅适用于0、1记分测验。(1)K-R20公式库德和理查德逊于1937年提出,仅适78(2)K-R21库德和理查德逊于1937年提出,仅适用于0、1记分测验。此公式只有当所有题目的难度接近时才可使用。不需逐题计算通过率。
(2)K-R21库德和理查德逊于1937年提出,仅适用79(3)克龙巴赫α系数此公式是由克龙巴赫(Cronbach)提出的,它不要求测验题目仅是0、1记分,可以处理任何测验的内部一致性系数的计算问题。
(3)克龙巴赫α系数此公式是由克龙巴赫(Cronbach80例题某态度量表共7题,100个被试在各题上得分的方差分别是0.81,0.82,0.79,0.83,0.85,0.76,0.77,测验总分的方差是14.00,此时测量的α值为?例题某态度量表共7题,100个被试在各题上得分的方差分81使用同质性信度的量表举例
(1)诺森伯格(Rosenberg,1985)自尊量表:克龙巴赫α系数为0.77-0.88。(2)SB4的KR-20,各测验各年龄中数平均值为0.73-0.98使用同质性信度的量表举例(1)诺森伯格(Rosenberg82评分者信度
含义计算
评分者信度含义83含义
评分者信度是指多个评分者给同一组人的答卷进行评分的一致性程度。用于测量不同评分者产生的误差。一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才认为评分是客观的。含义评分者信度是指多个评分者给同一组人的答卷进行评分的一致84计算
当评分者为两人时,评分者信度等于两个评分者的积差相关或等级相关系数。当多个评分者评定多个对象,评分者信度等于两个评分者的肯德尔和谐系数进行估计。计算当评分者为两人时,评分者信度等于两个评分者的积差相关或85效度
第一单元:效度的概念第二单元:效度评估的方法效度第一单元:效度的概念86第一单元效度的概念效度的定义效度的性质
第一单元效度的概念效度的定义87效度的定义
效度是指所测量的与所要测量的心理特点之间符合的程度。效度是科学测量工具最重要的必备条件,一个测验若无效度,则无论具有其它任何优点,一律无法发挥其真正的功能。因此,选用测量工具时首先要看效度。
效度的定义效度是指所测量的与所要测量的心理特点之间符合的程88效度的性质
效度具有相对性效度具有连续性
效度的性质效度具有相对性89效度的相对性
任何测验的效度是对一定的目标来说的,或者说测验只有用于与测验目标一致的目的和场合才会有效。因此,不能笼统地说某测验有效,而应该说它对测量什么有没有效。
效度的相对性任何测验的效度是对一定的目标来说的,或者说测验90效度的连续性
测验效度通常用相关系数表示,它只有程度上的不同,而没有“全有”或“全无”的区别。因此,评价一个测验时,不应该说“有效”或“无效,而应该说效度较高或效度较低。当然,效度是指“测量结果”的有效程度。
效度的连续性测验效度通常用相关系数表示,它只有程度上的不同91第二单元效度评估的方法
(1)内容效度(2)构想效度(结构效度)(3)效标效度第二单元效度评估的方法(1)内容效度92内容效度
内容效度的定义内容效度的评估方法内容效度与表面效度
内容效度内容效度的定义93内容效度的定义
内容效度是指项目对欲测的内容取样的适当程度。由于这种测验的效度主要与测验内容有关,所以称内容效度。注:人们要测定“忧虑性”,就要对这个概念有个明确的内容范围,然后从临床观察、病人自述、医生笔记以及文献报道中了解具有忧虑性的人具有哪些行为特点,从而编制“忧虑性”测验。
内容效度的定义内容效度是指项目对欲测的内容取样的适当程度。94内容效度的评估方法
专家判断法(P65,双向细目表)内容效度的评估方法专家判断法(P65,双向细目表)95构想效度(结构效度)
构想效度的概念构想效度的估计方法
构想效度(结构效度)构想效度的概念96构想效度的概念指测验对理论上结构的测量程度。
构想效度的概念指测验对理论上结构的测量程度。97构想效度的估计方法
测验内法
测验间的相互比较
构想效度的估计方法测验内法98测验内法这类方法主要是通过研究测验的内部结构(如测验的内容以及题目间的关系等)来分析测验的结构效度。(1)确定测验的内容效度
(2)考察测验的同质性(同质性信度)
测验内法这类方法主要是通过研究测验的内部结构(如测验的内容以99确定测验的内容效度
通过确定测验取样的内容范围,我们就可以利用这些资料来定义测验所测的结构的性质。通过确定测量的内容效度便为结构效度提供了有关证据。例如:在编制语文能力测验时,我们将内容总体描述为对词汇下定义、对语言进行类比推理以及在文章篇句中正确运用文字的能力,这在实际上给“语文能力”的结构下了定义。确定测验的内容效度通过确定测验取样的内容范围,我们就可以利100考察测验的同质性通过对被试在项目上的反应与总分的相关计算,以及分半系数、α系数、K-R20、K-R21等指标的计算,可以推算出测验所测的是单一特质还是多种特质,从而确定测验是否具有结构效度。考察测验的同质性通过对被试在项目上的反应与总分的相关计算,以101测验间的相互比较
相容效度
区分效度
因素效度
测验间的相互比较相容效度102相容效度
计算被试在新旧(已有效度证据的成熟测验)两个同类测验上的分数之间的相关。
相容效度计算被试在新旧(已有效度证据的成熟测验)两个同类测103区分效度
看它是否与测量不同结构的测验是否具有较低的相关,用此方法确定的效度叫区分效度。例如,数学推理能力测验与阅读能力测验。区分效度看它是否与测量不同结构的测验是否具有较低的相关,用104因素效度
建立结构效度最常用的方法是:通过对一组测验进行因素分析,找到影响测验分数的共同因素,这种因素可能就是我们要测量的心理特质(构思)。
因素效度建立结构效度最常用的方法是:通过对一组测验进行因素105效标效度
效标效度的定义
效标效度的评估方法
效标效度效标效度的定义106效标效度的定义
衡量测验有效性的一个重要方法是根据测验所作出的预测是否能证实,如果一个测验的预测与将来实际发生的事情非常接近,那么这就是一个好测验。例如,用大学入学考试来预测被试入学后的学习,如果预测准确性高,便说明这是一个好测验。效标效度的定义衡量测验有效性的一个重要方法是根据测验所作出107效标效度的定义效标:被预测的行为是衡量测验是否有效的标准。效标效度:就是考查测验分数与效标的关系,看测验对我们感兴趣的行为预测得如何。因为效标效度需要在实践中检验,所以,又称实证效度。
效标效度的定义效标:被预测的行为是衡量测验是否有效的标准。108效标效度的分类1、同时效度:与用来诊断现状的测验有关。例如,智力测验以学生当时的学业成绩为效标,由于学业成绩是现成的,所以这种效度称为同时效度。2、预测效度:与预测将来结果的测验有关。例如,大学入学考试可用学生入学后的学习成绩作效标,因为效标资料是在考试以后间隔一段时间后才能获得,所以高考的效度则是一种预测效度。注:此种效度对人员的选拔和安置工作非常重要。常用的效标是专业训练的成绩、实际工作的表现等。效标效度的分类1、同时效度:与用来诊断现状的测验有关。例如,109效标效度的评估方法
相关法
区分法(分组法)
命中率法
效标效度的评估方法相关法110相关法
确定效标效度最常用的方法是计算测验分数与效标测量的相关。根据变量的性质不同,可分别采用积差相关法、等级相关法、二列相关法等。当测验分数为连续性变量,效标资料为等级评定时,可用贾斯朋(Juspen)多系列相关公式计算。
相关法确定效标效度最常用的方法是计算测验分数与效标测量的相111区分法(分组法)
区分法:是检验测验分数能否有效地区分由效标所定义的团体的一种方法。例如,在大学里,我们根据教师评定,把学生分为合格与不合格两组,然后回过头去查他们的高考分数,若两组在高考分数上有显著差异,那就可以认为高考是有效的,否则就认为是无效的。
区分法(分组法)区分法:是检验测验分数能否有效地区分由效标112命中率法使用命中率法,可将测验分数和效标资料分成两类。在测验分数方面是确定一个临界分数(即分数线),高于临界分数者预测其成功,低于临界分数者预测其失败;在效标资料方面是根据实际工作或学习成绩,确定一个合格标准,在标准之上者为成功,在标准之下者为失败。命中率法使用命中率法,可将测验分数和效标资料分成两类。在测验113这样便会有四种情况:(1)预测成功而实际也成功(B);(2)预测成功而实际上失败(A);(3)预测失败而实际上成功(D);(4)预测失败事实上也失败(C)。我们称正确预测的为命中;不正确预测的为失误。表5-5测验命中与失误的四种情况测验预测失败成功成功(A)失误(B)命中失败(C)命中(D)失误这样便会有四种情况:(1)预测成功而实际也成功(B);(2)114两个指标
总命中率
正命中率
两个指标总命中率115教育实验法界定特点步骤案例研究教育实验法界定116界定根据一定的理论假设,有计划地控制教育活动的某些因素,以引起其它因素朝着有利于提高教育效果的方向转变,然后检验假设,并由此揭示教育活动规律的综合性研究活动。界定根据一定的理论假设,有计划地控制教育活动的某些因素,以引117教育实验法的步骤形成实验假说界定实验变量选择实验模式确定实验对象制定实验方案实施实验评价实验结果教育实验法的步骤形成实验假说118界定实验变量确定和分解应变量选择和设计自变量确定需要控制的干扰变量界定实验变量确定和分解应变量119选择实验模式单因素设计(1)单组单因素前后测实验(2)单因素随机实验(3)单因素随机匹配实验(4)协方差设计两因素设计选择实验模式单因素设计120案例研究卢仲衡的自学辅导法实验样例学习(个数,变异性、呈现方式)数学学习不良的个案研究案例研究卢仲衡的自学辅导法实验121个案研究问题提出方法(1)被试选择(2)实验材料(3)实验程序:基线、处理、概括、维持结果分析与讨论举例:认知策略训练对学习不良学生应用题解决成绩的影响个案研究问题提出122被试6个学生15-19岁被选择于LD群体中。总IQ在85-115(WISC-R,1975,Wais,1955)。所有6个学生还满足另外几个条件。WISC-R或WAIS的算术子测试低于平均数的1个标准差。阅读水平至少4年级水平。此外,每个被试完成10个随机的2步数学应用题40分,或低于40分。被试6个学生15-19岁被选择于LD群体中。总IQ在85-1123材料材料包括策略的挂图(图2)和19个测试(2步应用题)、1个测试(三步应用题)、练习题(每个类型),记录测试分数和时间的图形。测试问题从220题的2步应用题和50题的3步应用题随机选出。10个2步问题组成被试选择测试和每个因变量测试(在基线、处理、维持和重新训练阶段)。概括测验包括10个3步问题。项目不返回试题库。每个测量中,问题的次序是随机的。在策略获得和策略运用练习阶段,应用题的次序也是随机的。材料材料包括策略的挂图(图2)和19个测试(2步应用题)、1124程序在课堂教学中接受策略训练。策略训练者是研究者之一。教学和测试都在课堂上。多基线设计的实验条件包括基线、处理、概括和保持、重新训练。程序在课堂教学中接受策略训练。策略训练者是研究者之一。教学和125基线在基线期间,记录测试的时间和分数。基线数据继续收集,直到稳定的基线是明显的(对每一组的第一个学生)。当继续收集剩下来的两个学生的基线数据时,给第一个学生干预。当上升趋势明显,至少10个项目中至少7个正确反应的成绩稳定时,策略训练给第二个被试。在这个阶段,继续收集每组第三个被试的基线数据。对第三个被试来说,相似的程序。基线在基线期间,记录测试的时间和分数。基线数据继续收集,直到126处理
处理包括策略获得阶段、策略运用练习阶段和测试阶段,在测试阶段期间收集因变量测量数据。
处理处理包括策略获得阶段、策略运用练习阶段和测试阶段,在测127策略获得阶段策略获得训练进行了3课时(每课时50分钟)。训练中使用的步骤包括训练策略模型(Deschler,1981)中的6步获得步骤。获得步骤包括:(1)分析现在的学习习惯;(2)描述新策略;(3)模仿新策略;(4)复述新策略(5)学生练习;(6)在获得阶段的正确反馈。图2呈现了训练程序总结。策略获得阶段策略获得训练进行了3课时(每课时50分钟)。训练1288步数学应用题的问题解决策略:
大声阅读问题:教师大声读题,解释学生不懂的词语。大声复述陈述重要信息(特别是数字);(2)大声重复问题部分;利用自我提问技术:题目问什么?我正在寻找什么?转化:画一个图形陈述问题:大声说“我知道了…,我想求…”。强调题目中的重要信息。8步数学应用题的问题解决策略:大声阅读问题:教师大声读题,129假设:大声说“如果我…,那么…”,“需要多少步骤”写下运算符号估计:写下估计的答案计算自我检查:(1)参照问题,检查每一步,决定运算符号的正确性;(2)检查计算的正确性;(3)运用自我提问技术问自己是否理解答案的意思。假设:大声说“如果我…,那么…”,“需要多少步骤”写下运算符130策略获得训练概要(图2)第一阶段(1)讨论基线分数、被试解决问题的方法、界定提高多少作为教学的目标(2)描述训练的形式(3)向被试阅读策略,回答被试提出的问题(4)使用样例模仿策略的使用(5)使用随机选择的问题模仿策略的使用(6)当被试解决问题时,提供正确的反馈(7)当被试复述策略时,提供正确的反馈策略获得训练概要(图2)第一阶段131第二阶段(1)复习策略步骤(2)被试一边说步骤,一边解决问题(3)监控被试策略的复述(4)重复(2)(5)重复(3)第二阶段132第三阶段(1)监控被试的策略复述(2)当被试一边说步骤,一边解决问题时,提供正确的反馈。(3)重复(1)(4)重复(2)(5)策略步骤言语表达的测试。第三阶段133图3数学应用题解决的步骤1、大声阅读问题2、复述(1)重要信息;(2)大声重复问题部分;(3)题目问什么?我正在寻找什么?3、转化:画一个图形4、陈述问题:我知道了…,我想求…。图3数学应用题解决的步骤1、大声阅读问题1345、假设:(1)如果我…,那么…,(2)需要多少步骤?6、估计:写下估计答案7、计算8、自我检查:(1)检查每一步运算符号;(2)检查计算;(3)理解答案的意思。5、假设:135策略练习阶段要求被试在策略步骤的言语表达达到100%的正确标准(图3列举了要求记忆的信息)。达到这个目标后,策略运用阶段开始,在测试前一天,练习阶段开始。包括策略步骤的言语表达和使用策略练习解决数学应用题。在练习期间,列出步骤的图形可以得到。及时的正确反馈被提供。如果学生在2个或者3个测试中,保持7分或者更好成绩,练习阶段结束。如果学生分数低于7,练习阶段恢复。策略练习阶段要求被试在策略步骤的言语表达达到100%的正确标136测试阶段测试阶段收集因变量。每个测试包含10个2步数学应用题,使用与基线条件下相同的程序。此外,提示学生使用策略。不能得到图3。测试时间被记录。没有完成的测试第二天完成。测试分数测试完成后告诉被试。数据包括每个测试正确的数目,完成每个测试的时间,收集这些数据作图。成绩提高的标准是在连续4次测试中至少都正确7题。通常,70%只是一个平均水平。在连续四个测试中都高于7个的维持成绩表明成绩的可接受性。
测试阶段测试阶段收集因变量。每个测试包含10个2步数学应用题137概括在最后一个处理测试的第二天,一个包含10个题目的3步数学应用题决定策略是否概括到更复杂的数学应用题中去了。5条正确作为作为可接受的标准。
概括在最后一个处理测试的第二天,一个包含10个题目的3步数学138维持概括测试2周后,一个包含10个2步数学应用题的测试,决定维持的水平。如果学生不能完成至少7个正确回答,被试被重新训练到策略记忆达到100%的水平,提供练习阶段,重新测试。当在一个测试中达到至少7个的正确率,实验结束。为了考察更大的维持水平,3个月以后重新测试2步数学应用题。维持概括测试2周后,一个包含10个2步数学应用题的测试,决定139结果结果140教育科学研究方法课件141内容分析法界定主要途径案例研究内容分析法界定142界定是对教育文献的内容作客观而系统的量化分析,并加以描述,从而对相关的教育现象作出事实判断的研究方法界定是对教育文献的内容作客观而系统的量化分析,并加以描述,从143主要途径(P96)现状分析趋势分析比较分析意向分析主要途径(P96)现状分析144案例研究口语报告分析法案例研究口语报告分析法145质的研究--口语报告分析法质的研究--口语报告分析法146教育科学研究方法课件147问题设计问题设计148大声思维与口语报告记录大声思维与口语报告记录149教育科学研究方法课件150教育科学研究方法课件151教育科学研究方法课件152教育科学研究方法课件153转译转译154教育科学研究方法课件155教育科学研究方法课件156教育科学研究方法课件157教育科学研究方法课件158教育科学研究方法课件159教育科学研究方法课件160教育科学研究方法课件161数据分析数据分析162教育科学研究方法课件163教育科学研究方法课件164一、口语报告练习题1、如图,已知在四边形ABCD中,AB=CD,AD=BC,点E在BC上,点F在AD上,AF=CE,EF与对角线BD相交于点O,试说明EF、BD互相平分。一、口语报告练习题1、如图,已知在四边形ABCD中,AB=C1652、已知ab≠0,求的值。2、已知ab≠0,求的值。166二、录音题在△ABC中,∠B=∠C,AD⊥BC,垂足为D,E,F分别是AB,AC边的中点,连结DE,FD,求证:四边形AEDF是菱形二、录音题在△ABC中,∠B=∠C,AD⊥BC,垂足为D,E167录音题
在△ABC中,∠B=∠C,AD⊥BC,垂足为D,E,F分别是AB,AC边的中点,连结DE,FD,求证:四边形AEDF是菱形解:∵AD⊥BC∴ABD和ADC是直角三角形∵E、F分别是AB、AC的中点∴DE=AE,DF=AF∵∠B=∠C∴AB=AC∴AE=AF∴DE=DF=AF=AE∴四边形AEDF是菱形
录音题在△ABC中,∠B=∠C,AD⊥BC,垂足为168优差生解决几何问题的策略比较研究优差生解决几何问题的策略比较研究169序号解题步骤编码注解1E、F是AB、AC的中点2AE=BEB3AF=CFB4从∠B,∠D证明等腰△,两边相等B∠D应改为∠C(口误)5AD⊥BC,垂足为D6∠ADC=90°B7要求AEDF是菱形,A8先证明是平行四边形,A9再证明是菱形A10AD⊥BC序号解题步骤编码注解1E、F是AB、AC的中点2AE=BEB17011△ABD和△ADC是直角三角形B12E、F分别是AB、AC的中点13所以,它们相等D指代模糊14整个△ABC是等腰△15那么等边△D16它又是中点D17所以DF=CEDCE应改为AE(口误)18同理BE=DFD19那么四边形AEDF四边相等D20那么直接可以证明是菱形B11△ABD和△ADC是直角三角形B12E、F分别是AB、A1711先证明AEDF是平行四边形A2∵∠B=∠C3∴△ABC是等腰△B4E、F分别是AC、AC的中点5∴AE=AFB6AE=AF7AE=AF8作辅助线,E连接FB9△AEF是等腰△B10∴∠AEF=∠AFEB11∴∠DEF=∠DFED12那么,△DEF也是等腰△B13AF=EF=DE=AED14∴四边形AEDF是菱形B1先证明AEDF是平行四边形A2∵∠B=∠C3∴△ABC是等172第五章教育研究的质性方法访谈调查法叙事研究法第五章教育研究的质性方法访谈调查法173访谈调查法界定特点步骤案例研究访谈调查法界定174界定研究者通过与被调查者面对面进行交谈,以口头问答的形式来了解某人、某事、某种行为态度和教育现象的一种调查方法。界定研究者通过与被调查者面对面进行交谈,以口头问答的形式来了175特点调查过程灵活深入获取信息完整真实适用范围更为广泛特点调查过程灵活深入176步骤确定调查方式(结构式?)做好访谈准备调控访谈过程整理访谈资料步骤确定调查方式(结构式?)177案例学习陈向明:《王小刚为什么不上学了--一位辍学生的个案调查》,《教育研究与实验》,1996,1.案例学习陈向明:《王小刚为什么不上学了--一位辍学生的个案调178叙事研究方法界定特点步骤案例研究叙事研究方法界定179界定就是以叙述故事的方式来描述人们的经验、行为和生活方式,通过所叙述的故事来探究经验、行为的意义,及其蕴涵的思想和哲理。界定就是以叙述故事的方式来描述人们的经验、行为和生活方式,通180特点以质性研究方法为工具以教育中的故事为对象教育实践者成为研究主体形成认识时采用归纳的方式特点以质性研究方法为工具181步骤确定研究问题选择研究对象进入研究现场进行观察访谈整理分析资料撰写研究报告步骤确定研究问题182案例研究一叶少燕,《我的教育故事:情感还是方法》,中国教育报,2003,1,21案例研究一叶少燕,《我的教育故事:情感还是方法》,中国教育报183案例研究二肖正德、李长吉:《山村小学青年教师需要的叙述研究》,教育理论与实践,2003,10案例研究二肖正德、李长吉:《山村小学青年教师需要的叙述研究》184教育科学研究方法扬州大学教育科学学院郭兆明guozhaom@教育科学研究方法185教育科学研究方法教育研究的过程(第三编)教育研究方法的类型(第二编)教育科学研究方法教育研究的过程(第三编)186教育研究的过程(第三编)课题的选择(第八章)研究方案的设计(第九章)资料的整理与成果的表述(第十章)教育研究的过程(第三编)课题的选择(第八章)187第八章研究课题的选择发现研究问题检索相关文献确立研究课题第八章研究课题的选择发现研究问题188发现研究问题实际需要前人的研究发现研究问题实际需要189实际需要(讨论)数学(阅读)学习不良学生的认知特点及其干预研究卢仲衡的自学辅导实验法顾冷沅青浦数学教学改革布卢姆的教学评价的新突破80年代以来师范生素质的发展趋势研究高职院校学生职业性向测试分析研究实际需要(讨论)数学(阅读)学习不良学生的认知特点及其干预研190前人的研究“一步评价”技术研究样例学习的研究(1)单个样例的研究(子目标,无具体目标)(2)多个样例的研究(样例个数、样例呈现方式)(3)样例学习与问题解决的比较前人的研究“一步评价”技术研究191检索相关文献文献检索在教育科研中的作用教育文献的种类及主要分布文献检索的过程和主要方法检索相关文献文献检索在教育科研中的作用192文献检索在教育科研中的作用避免重复劳动,提高科学研究的效益做好文献综述文献检索在教育科研中的作用避免重复劳动,提高科学研究的效益193教育文献的种类及主要分布书籍报刊网络媒体(中国知网,CNKI)教育文献的种类及主要分布书籍194文献检索的过程和方法过程(主题、关键词、作者、来源)方法(按时间查、按照引文查)文献检索的过程和方法过程(主题、关键词、作者、来源)195确立研究课题确立研究课题的思维策略论证研究课题的主要问题确立研究课题确立研究课题的思维策略196确立研究课题的思维策略分析课题的研究价值(结合项目申报)(1)理论价值(2)实践价值考察研究人员的主观条件考虑研究的客观条件
确立研究课题的思维策略分析课题的研究价值(结合项目申报)197在选择课题时,要尽量避免:(1)范围太大,无从下手;(2)在现有条件下,难度较大,资料缺乏;(3)属于经验感想之谈,而不是科研题目。在选择课题时,要尽量避免:(1)范围太大,无从下手;198论证研究课题的主要问题研究问题的性质(理论研究、应用研究)研究的目的和意义(研究价值)国内外相关研究现状、可能有所突破之处。研究的可能性、基本条件研究的步骤及成果形式论证研究课题的主要问题研究问题的性质(理论研究、应用研究)199第九章教育研究方案的设计制定研究方案的主要注意事项:(1)陈述研究课题(2)论述研究的目的和意义(3)阐述研究假设和依据(4)阐述研究内容(5)确定研究对象(6)选择抽样方法(7)选择研究方法和工具(8)制定行动计划第九章教育研究方案的设计制定研究方案的主要注意事项:200第十章教育研究的资料整理与成果表述研究成果的的基本格式(1)题目(20字以内)(2)摘要和关键词(3)主体【引言、方法、结果、讨论(定量研究)】(4)参考文献第十章教育研究的资料整理与成果表述研究成果的的基本格式201第二编教育研究方法的类型教育研究的实证方法(第四章)1、问卷调查法2、教育测量法3、教育实验法4、内容分析法教育研究的质性方法(第五章)1、访谈调查法2、叙事研究法第二编教育研究方法的类型教育研究的实证方法(第四章)202第四章教育研究的实证方法问卷调查法教育测量法教育实验法内容分析法第四章教育研究的实证方法问卷调查法203问卷调查法界定特点步骤案例研究【问卷举例(SCL90,职业兴趣、16PF,开发者问卷)】问卷调查法界定204界定是研究者用严格设计的问卷,通过书面语言与被调查者进行交流,来收集研究对象关于教育问题或教育现象的信息和资料的方法。界定是研究者用严格设计的问卷,通过书面语言与被调查者进行交流205特点调查工具标准化调查过程标准化调查结果标准化研究效率高特点调查工具标准化206步骤设计前的探索设计问卷的结构设计问卷初稿试用和修改问卷发放和回收问卷(回收率应不低于70%)分析调查结果步骤设计前的探索207设计问卷初稿选择调查类型选择问题形式斟酌问题表述设计规范答案关注问题数量(时间控制)合理排列问题设计问卷初稿选择调查类型208选择调查类型就调查内容而言,选择综合调查或专题调查。就调查目的而言,选择常模调查或比较调查就调查范围而言,选择普遍调查或抽样调查选择调查类型就调查内容而言,选择综合调查或专题调查。209选择问题形式填空式是否式多项单选式多项限选式表格式(答题纸)或量表式(P83)排序式(P83)选择问题形式填空式210案例研究中小学生家庭作业心理现状的调查分析上海市中小学生家庭教育现状的调查分析五年制师范生心理健康状况SCL-90的调查分析小学数学作业批改的现状的调查分析中小学生闲暇生活状况的调查分析物理教师课堂教学行为的调查分析案例研究中小学生家庭作业心理现状的调查分析211教育测量法界定特点步骤个案研究教育测量法界定212界定教育测量法:根据某种规则,以数量化的形式描述教育现象的某种属性。界定教育测量法:根据某种规则,以数量化的形式描述教育现象的某213特点以测验为工具对研究对象进行测试,从而获得数量化的结果,并通过进一步分析获得相关结论。例如,了解学生的知识和能力发展情况。特点以测验为工具对研究对象进行测试,从而获得数量化的结果,并214编制测验的步骤确定测验目的确定测验内容确定测验形式筛选题目(难度、区分度)标准化过程鉴定测验(信度、效度)编写测验指导书编制测验的步骤确定测验目的215项目分析
第一单元项目难度第二单元项目区分度项目分析第一单元项目难度216第一单元项目难度
项目难度的定义
项目难度的计算方法难度水平的确定
第一单元项目难度项目难度的定义217项目难度的定义
项目难度(difficulty)是指题目的难度。【注】(1)在非能力测验(如人格测验)中,类似的指标是“通俗性”,即取自相同总体的样本中,能在答案方向上回答该题的人数,其计算方法与难度相同。(2)难度的指标通常以通过率表示,以答对(通过)该题的人数百分比来表示:
P=(R/N)×100%,P表示项目难度,N表示全体被试数,R为答对(通过)该项目的人数。从公式可以发现:难度越大,P值越小。
项目难度的定义项目难度(difficulty)是指题目的难218计算方法
二分法计分项目非二分记分的项目计算方法二分法计分项目219二分法计分项目
心理测验的项目大多为选择题,通过计1分,错误计0分。1、当被试较少时,对这类题目可以直接使用公式P=(R/N)×100%计算难度。2、当被试较多时,则可根据测验总成绩将被试分成三组:分数最高的27%被试分为高分组,分数最低27%被试为低分组,中间46%的被试为中间组。分别计算高分组和低分组的通过率,以两组通过率的平均值作为每一题的难度。其公式为:
P=(PH+PL)/2式中P表示难度,PH和PL分别代表高分组和低分组通过率。二分法计分项目心理测验的项目大多为选择题,通过计1分,错误220非二分记分的项目
当测验项目为问答题或不能用二分法记分的形式时,一般用下面的公式计算难度。非二分记分的项目当测验项目为问答题或不能用二分法记分的形式221难度水平的确定
项目难度测验的难度
难度水平的确定项目难度222项目难度
进行难度分析的主要目的是为了筛选项目,项目的难度多高合适,取决于测验的目的、性质以及项目的形式。项目难度进行难度分析的主要目的是为了筛选项目,项目的难度多223测验目的
准确测量个体的差异。在选择题目时,最好使试题的平均难度接近0.50,而各题难度在0.50±0.20之间。注:(1)若P=0或1时;(2)P=0.5时,举一个极端的例子,假如某测验各试题间的相关系数均为1,难度均为0.50,那么就有可能使50%的被试答对所有的题目得满分;另外50%的被试无法通过任何试题得0分)测验目的准确测量个体的差异。在选择题目时,最好使试题的平224测验的性质
当测验用于选拔或诊断时,应该比较多地选择难度值接近录取率的项目。(1)若测验是要选拔少数最优秀的被试,测验就应该有相当高的难度,P值就应该小。例如,如果录取率为20%,那么题目难度最好确定为20%,使得恰好20%的优秀被试通过;(2)假如测验是要诊断出少数较差的被试,则测验难度应该小,P值应该高,使得只有少数被试不能通过。测验的性质当测验用于选拔或诊断时,应该比较多地选择难度值接225测验的形式
对于选择题来说,P值一般应该大于概率水平。例如,对于是非题,其难度值应该为0.75最为合适;而对于四选一的题目,其难度值约为0.63时最为适宜。
测验的形式对于选择题来说,P值一般应该大于概率水平。例如,226测验的难度
通过考察测验分数的频数分布,可以对测验的难度作出直观检验(常态分布,偏态分布:正偏态分布、负偏态分布)。(1)如果被试的取样具有代表性,对于中等难度的测验,其测验总分应该接近常态分布。如果得分多数偏高或偏低,则分别为“负偏态分布”和“正偏态分布”。(2)正偏态分布,即大多数得分集中在低端,说明编制的测验对于所要研究的样本团体来说偏难,因此,必须增加足够数量的较容易的项目;(3)负偏态分布,即大多数得分集中在高分端,说明测验过容易,必须增加足够数量的有高难度的项目。测验的难度通过考察测验分数的频数分布,可以对测验的难度作出227第二单元项目区分度
项目区分度的定义项目区分度的计算方法区分度与难度的关系
第二单元项目区分度项目区分度的定义228项目区分度的定义
项目区分度(itemdiscrimination),也叫鉴别力,是指测验项目对被试的心理特性的区分能力。
项目区分度的定义项目区分度(itemdiscrimina229项目区分度的计算方法
鉴别指数相关法
项目区分度的计算方法鉴别指数230鉴别指数1.按测验总分高低排列答卷;2.确定高分组与低分组,每一组取答卷总数的27%;3.分别计算高分组与低分组在该项目上的通过率或得分率。4.按下列公式估计出项目的鉴别指数:D=PH-PL,式中D为鉴别指数,PH为高分组在该项目上的通过率或得分率,PL为低分组在该项目上的通过率或得分率。【注】高分组若在该测验上的得分率高于低分组,则D>0,D越大,说明该项目区分两种不同水平的程度越高。若D<0,则反映高水平组在该项目上的得分率反而低于低水平组,说明有问题。鉴别指数1.按测验总分高低排列答卷;2311965年,美国测验专家(L.Ebel)根据长期的经验提出用鉴别指数评价项目性能的标准,鉴别指数D项目评价0.40以上0.30-0.390.20-0.290.19以下很好良好,修改会更佳尚可,但需修改差,必须淘汰1965年,美国测验专家(L.Ebel)根据长期的经验提出用232相关法
计算区分度最常用的方法是相关法,即以某一项目分数与效标成绩或测验总分的相关作为该项目区分度的指标。相关越高,表明项目越具有区分的功能。相关法计算区分度最常用的方法是相关法,即以某一项目分数与效233区分度与难度的关系
难度和区分度是相对的,是针对一定团体而言的,绝对的难度和区分度是不存在的。一般来说,较难的项目对高水平的被试区分度高,较易的项目对水平低的被试区分度高,中等难度的项目对中等水平的被试区分度高。由于人的大多数心理特性呈常态分布,所以项目难度的分布也以常态分布好,即特别难与特别易的项目少一些,接近中等的项目多一些,而所有项目的平均难度为0.50,这样不仅能够保证多数项目具有较高的区分度,而且可以保证整个测验对被试具有较高的区分能力。
区分度与难度的关系难度和区分度是相对的,是针对一定团体而言234测验的信度
信度的概念信度评估的方法测验的信度信度的概念235信度的概念
信度的定义信度(reliability)指的是测量结果的稳定性程度。注:(1)若能用统一测量工具反复测量某人的同一心理特质,则其多次测量的结果间的一致性程度就叫信度。有时也叫测量的可靠性。(2)例如:比较钢尺与具有弹性的皮尺测量长度的信度。信度的概念信度的定义236第二单元信度评估的方法
(1)重测信度(2)复本信度(3)内部一致性系数(4)评分者信度
第二单元信度评估的方法(1)重测信度237重测信度
含义和计算使用的前提条件优点、缺点注意点使用重测信度的量表举例
重测信度含义和计算238定义和计算
重测信度(1)含义:是指同一量表对同一组被试两次所得结果的一致性程度。(2)计算:大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数。注:(1)此测验主要测量测验跨时间的稳定性,所以,又称稳定性系数。(2)当信度较大时,说明前后两次测量的结果比较一致,测量工具比较稳定,被试的心理特质受被试状态和环境变化的影响较小。
定义和计算重测信度239使用的前提条件(1)所测量的心理特性必须是稳定的。例如,成人的人格测验就可以;但儿童的成就测验就不行(例如,刚入学儿童的识字量)。(2)遗忘和练习的效果基本上互相抵消。智力测验的间隔时间一般在6个月左右。(3)在两次施测的间隔时期内,被试的心理特质方面没有获得更多的学习和训练。使用的前提条件(1)所测量的心理特性必须是稳定的。例如,成240优、缺点优点:能够提供测验是否随时间而变异的资料,可作为被试将来行为表现的依据。缺点:易受练习和记忆的影响。(1)如果两次施测间隔的时间太短,则记忆犹新,练习的影响较大;(2)如果间隔的时间太长,则身心发展与学习经验的积累等足以改变分数的意义,而使得相关减低。最适宜的时距随测验的目的、性质和被试特点而异,一般是两周到四周为宜,时间间隔最好不超过六个月。优、缺点优点:能够提供测验是否随时间而变异的资料,可作为被241注意点:同一量表,随着第二次测量的时间不同,它可以有不同的重测信度。因此,在报告重测信度时,应说明两次施测的间隔,以及在此期间被试的有关经历。例如,《韦氏儿童智力量表手册》中国修订版(C-WISC)中,就报告了两次测验的时间间隔(2-7周)以及两次的相关系数(城市:0.59-0.86,农村:0.59-0.81)。注意点:同一量表,随着第二次测量的时间不同,它可以有不同的242使用重测信度的量表举例
MMPI:临床量表在相隔两周重测,其值在0.58-0.92之间。CPI:加州心理调查表的重测信度各量表分别为0.38-0.77,平均0.66.SB4(斯坦福-比奈量表第四版)瑞文:三个版本的一些重测信度研究结果不一,正常成人为0.80-0.93。
使用重测信度的量表举例MMPI:临床量表在相隔两周重测,其243复本信度
含义与计算使用的前提条件优、缺点注意点使用复本信度的量表举例
复本信度含义与计算244含义与计算
复本信度(1)含义:指两个平行的测验测量同一组被试所得结果的一致性程度。(2)计算:大小等于同一组被试在两个复本测验上所得分数的皮尔逊积差相关系数。它是研究测验跨形式的一致性(等值性)。复本信度的分类:(1)等值性系数(同时);(2)稳定性与等值性系数(不同时)。含义与计算复本信度245等值性系数定义:如果两个复本测验是同时连续施测的,则这种复本信度称为等值性系数。大小:反映两个复本测验的题目差别所带来的变异情况。等值性系数定义:如果两个复本测验是同时连续施测的,则这种复本246稳定性与等值性系数定义:如果两个复本测验是相距一段时间分两次施测的,则这种复本信度称为稳定性与等值性系数。它既考虑了测验在时间上的稳定性,也考虑了不同题目样本反应的一致性。大小:与其它信度系数相比,此种复本信度最小,也就是说,稳定性与等值性系数是对信度的最严格的检验,其值最低。稳定性与等值性系数定义:如果两个复本测验是相距一段时间分两次247使用的前提条件
条件1:构造出两份或两份以上真正平行的测验。注:复本测验必须在题目内容、数量、形式、难度、区分度、指导语、时限以及所用的例题、公式和测验等其它方面都相同或相似
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度甲方租赁乙方数据中心服务合同2篇
- 2024简单保姆劳务合同样本
- 2024中介租房合同范本
- 2024年度茶叶销售与分销合作协议
- 2024年度智能交通系统施工合同3篇
- 跨区域包装材料购销合同
- 医院药材供货合同样本
- 网络路由设备采购协议
- 荒山租赁合同格式指南
- 房地产居间协议书样本
- 信息化系统安全运维服务方案三篇
- 会议体系管理制度
- 2024年新人教PEP版三年级上册英语教学课件 Unit 4 Part A 第1课时
- 2024年中央企业全面质量管理知识竞赛考试真题库(含答案)
- 肾内科病例讨论2
- 2024-2030年中国医用金属材料行业市场发展趋势与前景展望战略分析报告
- 2024年开学第一课-奥运精神中国健儿主题班会课件
- 幼教培训课件:《幼儿园如何有效组织幼儿户外自主游戏》
- 新教科版五年级上册科学全册课时练课件
- 太空舱产品买卖合同
- “非遗”之首-昆曲经典艺术欣赏智慧树知到期末考试答案章节答案2024年北京大学
评论
0/150
提交评论