




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
千里之行,始于足下。第2页/共2页精品文档推荐心理与教育测量知识点汇总e心理与教育测量知识点汇总
第一章心理与教育测量概论
一、名词解释
1.测量:依据一定的法则使用量具对事物的特征举行定量描述的过程。
2.测量的参照点:测量工作中必须有一具量的起点,那个起点就叫做测量的参照点。
3.量表:可以使事物的特征数量化的数字的延续体算是量表。
4.心理与教育测量:依据一定的心理学和教育学的理论,使用测验对人的心理特质和教育成就举行定量描述的过程。
5.测验的标准化:是编制测验的一具重要步骤,是指测验的编制、实施、记分以及测量分数解释的程度的一致性。
二、简答与论述
1.简述理性测量单位应具备的条件?P4
一是要有确定的意义,即对同一单位,所有的人的明白基本上相同的,别允许作出别同的解释;二是要有相等的价值,即第一具单位与第二个单位之间的距离等于第二个单位与第三个单位之间的距离。然而在某些事情下,要具备这两个条件是相当困难的。
2.简述四种测量量表及其特点?P5-6
①命名量表,是最低水平的测量量表,它不过用数字代表事物或用数字对事物举行分类。数字不过事物的符号,没有任何数量的意义,别能举行代数运算。可举行的统计办法有百分比、次数、众数和X2检验。
②顺序量表,是次低水平的测量量表,别仅可以指代事物的类不,而且可以表明别同类不的大小、等级或事物具有某种特征的程度。在顺序量表中,数字只表示等级、大小和程度的顺序,它既没有相等的单位,也没有绝对的零点,所以别能举行代数运算。可举行的统计办法有中位数、百分位数、等级相关系数和肯德尔和谐系数等。
③等距量表,是较高水平的测量量表,别仅可以指代事物的类不、等级,而且具有相等的单位,能够举行加减运算。但它没有绝对零点,别能举行乘除运算。可举行的统计办法有平均数、标准差、积差相关系数以及t检验和f检验。
④比率量表,也叫等比量表,是最高水平的测量量表,除了具有类不、等级、等距的特征外,还具有绝对的零点,可举行加减乘除运算。可举行的统计办法除了与等距量表相同外,还与几何平均数、变异系数相同。
3.论述心理与教育测量独特的性质?(或心理与教育测验的特点)P7
心理与教育测量是依据一定的心理学和教育学的理论,使用测验对人的心理特质和教育成就举行定量描述的过程,其独特性表如今以下几方面:
①心理与教育测量依据的法则在非常大程度上不过一种理论,非常难达到如同物理测量依据的法则那样普遍被人们同意的水平。
②心理与教育测量的对象是人的心理特质和教育成就。教育成就的含义比较明显,是指一具人经过同意教育而获得的知识水平。心理特质的含义比较含混,别大可以赋予清晰的界定。这就决定了心理与教育测量只能是一种间接测量。
③心理与教育测量的量具是由有关领域的专家编制,通过长期的试用、修订、完善而逐渐形成的标准化测验。
④心理与教育测量的目标尽管是对人的心理特质和教育成就举行定量分析,但这种定量分析的精确度远别及物理测量的精确度高。
4.论述心理与教育测量究竟是否必要和是否也许?P8
(1)我国古代学者孟子早在两千多年前就赋予了明确的同时是确信的回答。
(2)1918年,桑代克提出“凡客观存在的事物都有其数量”,1939年,麦柯尔指出“凡有其数量的事物都能够测量”,这两个命题被公以为是心理与教育测量的理论基础。
(3)从辩证唯物主义的观点看,任何事物基本上质和量的统一,事物的质的差异是分类的前提,而事物的量的差异则是测量的前提。依照这一前提,我们以为:
①人的心理现象和知识水平如同其他一切物理现象一样是有差异的,这种差异别仅包括质的方面,也包括量的方面。因为有差异,因此有必要测定差异的数量,描述差异的程度。
②心理特质和知识水平尽管别是物理实体,别能直截了当测量,却必定要表现于人的外部行为之中,并调节着人的外部行为。所以,经过观看人的外部行为的差异就有也许测量出人的心理特质和知识水平的差异。
③心理与教育测量的准确性、可靠性和精确度如同其他一切测量技术一样是相对的,也同其他一切测量技术一样必定随着科学技术的进步和进展而逐步提高。
5.为啥从本质上说,心理与教育测量的量表属于顺序量表?P8-9
(1)从所使用的参照点来讲,教育测量与心理测量的领域的参照点均为相对参照点。
(2)从所使用的单位来讲,,教育和心理测量的单位远没有其他测量的单位成熟和完善。
①教育与心理测量所使用的单位的意义别太明确。
②在教育与心理测量中的单位常常别等值。这就决定了心理与教育测量的量表别是直截了当的等距量表。
6.测验标准化应具备的条件(或测验标准化的内容是啥)P10-11
(1)测验内容的标准化。标准化的首要前提,是所有同意测量的个人实施相同的或等值的测验内容。测验内容别同,所测得的结果便没有可比较的基础。
(2)施测条件的标准化。标准化的第二个条件,是所有同意测量的个人必须在相同的施测条件下同意测验。包括:相同的施测条件、相同的指导语、相同的测验时限。
(3)评分规则的标准化。评分规则的标准化要求评分结果具有客观性,惟独当评分的结果具备了客观性,才干将测量分数的差异归之于个人心理特质和知识水平的差异。
(4)测验常模的标准化。编制测验的一具重要步骤是编制测验的常模。
7.简答个不测验的优缺点?P13
优点:①主试对被试的做题行为有认真的观看,有机遇获得测量分数之外的信息。
②主试与被试面对面交流的机遇更多,容易与被试建立起融洽的合作关系。
③关于一些特别被试(如幼儿、文盲),只能采纳个不测量,以便主试代替被试记录其行为反应。
缺点:①费时刻,难以在短时刻内收集大量的测量资料。
②测量手续比较复杂,需通过较高水平训练的人担任主试。
8.论述心理与教育测验的功能?P15-17
(1)理论研究功能
①收集研究资料
②建立和检验理论假设
③实验分组
(2)实际应用功能
①选拔人才
②人员安置
③心理诊断
④描述评价
⑤心理问
第二章心理与教育测量的产生与进展
简答与论述
1.中国古代心理与教育测量思想的特点?P26
①中国古代社会的心理与教育测量思想基本上描述性的,是非定量的。这固然和当时的整个科学技术水平是相习惯的。
②中国古代社会的心理与教育测量是分类式的。就能力测量和成就测量(即科举考试)而言,分成高、中、低几个层次;就性格测量而言,分成若干种类型。
③在中国古代社会的心理与教育测量思想中注重对人作整体的鉴定和评价,并倾向于和人的道德品质联系起来。
④中国古代社会的心理与教育测量思想与教育中的因材施教及人才使用有着紧密的联系,它一开始就具有强烈的应用性质。
2.简述心理与教育测量的当代趋势?p33
①由于信息加工心理学的兴起,测量学界倾向于将实验法和测验法相结合,产生了信息加工测验。
②由于计算机技术的迅速进展,传统的纸笔测验逐渐被电脑程序测验所取代,从而大大提高了测验的效率。
③针对经典测验理论(即真分数理论)的某些缺陷,提出了一些新的测量理论,尤其是项目反应理论和概化理论,别仅在理论上取得了巨大成就,而且在应用上显示出强大的生命力。
第三章经典测验理论的基本假设
一、名词解释
1.测量误差:是在测量过程中由那些与测量目的无关的变化因素所产生的一种别准确或别一致的测量效应。
2.随机误差:是那种由与测量目的无关的、偶然因素引起的而又别易操纵的误差。
3.系统误差:是那种由与测量目的无关的变因引起的一种恒定而有规律的效应。
4.真分数:反映被试某种心理特质真正水平的这个数值叫做该特质的真分数。
二、简答与论述
1.简述心理特质的含义?P38-39
表如今一具人身上所特有的相对稳定的行为方式为人的心理特质,可从以下几方面明白:
①特质是一组具有内部相关的行为的概括,具有一定的抽象性。
②特质是“一种普通的神经心理系统……它能够综合别同的刺激,使人对这些刺激作出相同的反应”。
③特质是一具人身上比较稳定的特点。
④一具人的精神面貌(人格)是由多种特质分多个层次有机组合而成的。
⑤特质能够决定一具人对特定刺激的反应倾向,能够对人的行为举行某种预测。
2.简述测量误差的来源?P41
心理测量的误差来自3个方面,即测量工具、被测对象和施测过程。
①在测量工具方面,心理测量与物理测量有所别同。心理测量工具通常是一套以测验(咨询卷)为核心的刺激反应系统(通常称作量表)。当量表在测查人的某种心理特质时,若项目所测
的东西与我们预测的目的之间浮现偏差(如项目取样太少或太偏),则测量会浮现误差。
②在被测对象方面,造成测量误差的要紧缘故是受测者真正水平是否得到正常发挥。普通地,受测者的某种心理特质水平是相对稳定,然而他在同意测量时的心理和生理状态会妨碍其水平的正常发挥。
③在施测过程方面,产生测量误差的缘故要紧是一些偶然因素(恒定因素较易操纵)。比如,在物理环境方面:实测现场的温度、光线、声音、桌面好坏、空间阔窄等会造成误差。在主试者方面:主试者的年龄、性不、外表及其施测时的言谈举止、表情动作、是否按规定实施测验等也会造成误差。此外,评分计分环节也是容易浮现差错的地点。还有,若是浮现意外干扰(如考场忽然停电、有人作弊、计时表停了、试卷印刷或装订出错等),则同样会让考生分心或造成考场混乱,导致测量误差。
3.简述真分数(或CTT)的数学模型及其假设?P42
既然观看分数非常难等于真分数,那两者之间是个啥关系呢?经典测验理论假定,观看分数(记为X)与真分数(T)之间是一种线性关系,并只相差一具随机误差(记之为E)。即:X=T+E这算是CTT的数学模型。
依照这一模型,引申出三个相关联的假设公理:
(1)若一具人的某种心理特质能够用平行的测验反复测量脚够多次,则其观看分数的平均值会接近于真分数。即ε(X)=T或ε(E)=0
(2)真分数和误差分数之间的相关为零。即ρ(T,E)=0
(3)各平行测验上的误差之间相关为零。即ρ(E1,E2)=0
第四章测量信度
一、名词解释
1.信度定义:多次测量的结果间的一致性程度就叫信度,有时也叫测量的可靠性。
2.重测信度:指的是用同一具量表对同一组被试施测两次所得结果的一致性程度,其大小等同于同一组被试在两次测验上所得分数的皮尔逊积差相关系数。公式为:rxx=[∑(x-?x)(y-?y)]/√∑(x-?x)2×∑(y-?y)2
3.复本信度:指的是两个平行的测验测量同一批被试所得结果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的皮尔逊积差相关系数。
4.分半信度:指的是将一具测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。
5.同质性信度:也叫内部一致性信度,是指测验内部所有题目间的一致性程度。
6.评分者信度:指的是多个评分者给同一批人的答案举行评分的一致性程度。
二、简答与论述
1.简述信度的作用?P46-47
(1)信度是测量过程中所存在的随机误差大小的反应。
(2)信度能够用来解释个人测验分数的意义。
(3)信度能够帮助举行别同测验分数的比较。
2.简述信度的五种恐怕办法及其使用的前提条件?P48-53
(1)重测信度。它必须满脚三个条件:①所测量的心理特性必须是稳定的。②遗忘和练习的效果都是相互抵消。③在两次施测的间隔期内,被试在所要测查的心理特质方面没有获得更多的学习和训练。这一点,实际上也是要保证被试具有稳定的心理特质。
(2)复本信度。条件之一是首先要构造出两份或两份以上真正平行的测验(即A、B卷)。条件之二是被试要有条件同意两个测验。这种条件要紧取决于时刻、经费等几个方面。另外,
在报告结果时,应报告两次施测的间隔,以及在此间隔内被试的有关记忆。
(3)分半信度。通常是在只能施测一次或没有复本的事情下使用。而且,在使用斯皮尔曼—布朗公式时要求全体被试在两半测验上得分的变异数要相等。当一具测验无法分成对等的两半时,分半信度别宜使用。
(4)同质性信度。
(5)评分者信度。
3.论述妨碍测量信度的要紧因素?P55-56
①被试方面。就单个被试而言,被试的身心健康状况、应试动机、注意力、耐心、求胜心、作答态度等会妨碍测量误差。就被试团体而言,整个团体内部水平的离散程度以及团体的平均水平都会妨碍测量信度。
②主试者方面。就施测者而言,若他别按指导手册中的规定施测,或有意创造紧张气氛,或给考生一定的暗示、协助等,则测量信度会大大落低。就阅读评分者而言,若评分标准掌握别一,或前紧后松,甚至是为所欲为,则也会落低测量信度。
③施测情境方面。在实施测验时,考场是否肃静、光线和通风事情是否良好、所需设备是否齐备、桌面是否合乎要求、空间阔窄是否恰当等都也许妨碍到测量的信度。
④测量工具方面。以测量为代表的心理与教育测量工具是否性能稳定是测量工作成败的关键。普通地,试题的取样、试题之间的同质性程度、试题的难度等是妨碍测验稳定性的要紧因素。
⑤两次施测的间隔时刻。在计算重测信度和稳定性与等值性系数(复本信度之一)时,两次测验相隔时刻越短,其信度值越大;间隔时刻越长,其他因素带来妨碍的机遇就多,因而其信度值就也许越小。
4.简述提高测量信度的常用办法?P56-57
(1)适当增加测验的长度。
(2)使测验中所有试题的难度接近正态分布,并操纵在中等水平。
(3)努力提高测验试题的区分度。
(4)选取恰当的被试团体,提高测验在各同质性较强的亚团体上的信度。
(5)主试者严格执行实测规程,评分者严格按标准给分,实测场地按测验手册的要求举行布置,减少无关因素的干扰。
第五章测量信度
一、名词解释
1.效度:指一具测验或量表实际能测出其所要测的心理特质的程度。
2.内容效度:指一具测验实际测到的内容与所要测量的内容之间的吻合程度。
3.结构效度:指一具测验实际测到所要测量的理论结构和特质的程度,或者讲它是指测验分数可以讲明心理学理论的某种结构或特质的程度。
4.实证效度:指一具测验对处于特定情境中的个体的行为举行恐怕的有效性。
5.效标:是衡量一具测验是否有效的外在标准,它是独立于测验并能够从实践中直截了当获得我们所感兴趣的行为。
6.效标测量:我们所感兴趣的行为往往是一具观念上的东西(观念效标),它必须用一具数字或等级来举行表达,即效标测量,它具有多样性、复杂性、特别性和时刻性。
二、简答与论述
1.简述对效度概念的认识与明白?P59-60
(1)效度是一具相对的概念。表如今两个方面:①效度是相关于一定的测量目的而言的。
②心理特质是较隐蔽的特性,只能经过他的行为表现来举行猜测,所以,心理测量不会达到百分之百的准确,而只能达到某种程度上的准确。
(2)效度是测量的随机误差和系统误差的综合反映。
(3)推断一具测量是否有效要从多方面搜集证据。
2.简述效度与信度的关系?P61
依照公式SX2=SV2+SI2+SE2,能够得到信度与效度的关系如下:
(1)信度高是效度高的必要而非充分的条件。当随机误差的变异数SE2减小时,真实分数的变异数ST2增加,测验信度ST2/SX2随之提高。信度的提高只给有效变异数SV2的增加提供了也许,至于是否能提高效度,还要看系统误差变异数SI2的大小。可见,信度高别一定效度高。但一具测验要想效度高,真分数的变异数必须占较大的比重,即测验的信度必须高。(2)测验的效度受它的信度制约。依照效度和信度的定义(rxy2=SV2/SX2,rxx=ST2/SX2)以及公式(ST2=SV2+SI2)可得。
3.简述内容效度及其应用范围?P62
指一具测验实际测到的内容与所要测量的内容之间的吻合程度。恐怕一具测验的内容效度算是去确定该测验在多大程度上代表了所要测量的行为领域。这个地方,所要测量的内容或行为领域是依据测量目的而定的,它通常包括欲测的知识范围,以及该范围内各知识点所要求掌握的程度两个方面。
内容效度要紧应用于成就测验,因为成就测验要紧是测量被试掌握某种技能或学XXX门课程所达到的程度。内容效度也适合于某些用于选拔和分类的职业测验。这种测验所要测的内容算是实际工作所需的知识和技能,编制这种测验应首先对实际工作作较细的分析,否则,题目取样的代表性就难以令人中意。需要注意的是,内容效度别适合用于能力倾向测验和人格测验。此外,要幸免与表面效度相混淆。
4.简述内容效度的确定办法?P62-63
(1)要紧是逻辑分析法,其工作思路是请有关专家对测验题目与原定内容范围的吻合程度做出推断。其具体步骤是:①明确欲测内容的范围,包括知识范围和能力要求两个方面。这种范围的确定必须具体、详细,并要依照一定目的的规定好各纲目的比例。②确定每个题目所测的内容,并与测验编制者所列的双向细目表(考试蓝图)对比,逐题比较自个儿的分类与制卷者的分类,并做记录。③制作评定量表,考察题目对所定义的内容范围的覆盖率、推断题目难度与能力要求之间的差异,还要考察各种题目数量和分数的比例以及题目形式对内容的适当性等,对整个测验的有效性做出总的评价。
(2)统计分析办法。具体办法是:从同一具教学内容总体中抽取两套独立的平行测验,用这两个测验来测同一批被试,求其相关。若相关低,则两个测验中至少有一具缺乏内容效度;若相关高,则测验也许有较高的内容效度(除非两个测验取样偏向同一具方面)。
(3)再测法。操作过程是:在被试学XXX种知识之前作一次测验(如学习电学之前考电学知识),在学过该知识后再作同样的测验。这时,若后侧成绩显著地优于前测成绩,则讲明所测内容正是被试新近所学内容,进而证明该测验对这部分内容而言具有较高的内容效度。
5.简述结构效度的含义、特点及应用范围?P63
(1)含义:结构效度是指一具测验实际测到所要测量的理论结构和特质的程度,或者讲它是指测验分数可以讲明心理学理论的某种结构或特质的程度。
(2)特点:①结构效度的大小首先取决于事先假定的心理特质理论。②当实际测量的资料无法证实我们的理论假设时,并别一定就表明该测验结构效度别高,因为还有也许浮现理论假设别成立,或者该实验设计别能对该假设作适当的检验等事情。这就使得结构效度的猎取更为困难。③结构效度是经过测量啥、别测量啥的证据累积起来给以确定的,因而别可
能有单一的数量指标来描述结构效度。
(3)应用范围:结构效度要紧用于智力测验、人格测验等一些心理测验方面。
6.论述结构效度的确定办法?P64
总的来讲,结构效度的确定普通包括3个步骤:①提出理论假设,并把这一假设分解成一些细小的纲目,以解释被试在测验上的表现。②依据理论框架,推演出有关测验成绩的假设。
③用逻辑的和实证的办法来验证假设。
具体地讲,结构效度的恐怕能够有以下一些办法:
(1)测验内部寻觅证据法。首先,我们能够考察该测验的内容效度,因为有点测验对所测内容或行为范围的定义或解释类似于理论构想的解释,因此,内容效度高实质上也讲明结构效度高。其次,我们能够分析被试的答题过程。若有证据表明某一题目的作答除了反映所要测的特质以外,还反映其他因素的妨碍,则讲明该题没有较好地体现理论构想,该题的存在会落低结构效度。再次,我们脚能够经过计算测验的同质性信度的办法来检测结构效度。若有证据表明该测验别同质,则能够断定该测验结构效度别高。固然,测验同质不过结构效度高的必要条件。
(2)测验之间寻觅证据法。首先,我们能够去考察新编测验与某个已知的能有效测量相同特质的旧测验之间的相关。这种办法叫相容效度法。其次,我们也能够去考察新编测验与某个已知的能有效测量别同特质的旧测验间的相关。这种办法也叫区分效度法。再次,我们还能够经过因素分析的办法来了解测验的结构效度。
(3)考察测验的实证效度法。有两种做法:其一是依照效标把人分成两类,考察其得分的差异。其二是依照测验得分把人分成高分组和低分组,考察这两组人在所测特质方面是否确有差异。
(4)多种特质——多种办法矩阵法。该办法实质是相容效度和区分效度法的综合运用。7.实证效度的含义、种类、作用及确定办法?P66-68
(1)含义:实证效度是指一具测验对处于特定情景中的个体的行为举行恐怕的有效性。也算是讲,一具测验是否有效,应该以实践的效果来作为检验标准。实证效度又称效标关联效度。
(2)种类:依照效标资料搜集的时刻差异,实证效度能够分成并且效度和预测效度两种。
(3)作用:并且效度要紧用于诊断现状,在于用更简单、更省时、更便宜和更有效的测验分数来取代别易搜集的效标资料。预测效度的作用在于预测某个个体未来的行为。不管是并且效度依然预测效度,其目的基本上想经过对测验在一具有代表性的样本上,用实证的办法来证明测验有效,于是在今后就能够用简便的测验去预测类似于样本的其他团体或个体的行为。
(4)确定办法:大体上能够分为一下几个步骤:①明确观念效标。②确定效标测量。③考察测验分数与效标测量的关系。从效度恐怕的办法上看,实证效度能够用一下办法举行恐怕:①相关法。计算测验分数与效标测量的相关系数(积差相关系法、等级相关法、二列相关法、四分相关法等)。②区分法。被试同意测验后,让他们工作一段时刻后,再依照工作成绩(效标测量)的好坏分成两组,这时再回过头来分析这两组被试原先同意测验的分数差异,若这两组人的测验分数差异显著,则讲明该测验有较高的效度。③命中率。当用测验作取舍决策时,决策的正命中率和总命中率是测验有效性的较好指标。
8.论述妨碍测量效度的因素?P69-70
①测验的构成。当组成测验的试题样本没有较好地代表欲测内容或结构时,测量的内容效度或结构效度必定会别高。并且,若题目语义别清、指导语别明、题目太难或太易、题目太少或安排安排别当等,都会落低测量效度。普通而言,增加测验的长度能够提高测量信度,进而为提高测量效度提供了也许。
②测验的实施过程。一具测验在实施过程中,如别遵从指导语的要求,或浮现意外干扰,或评分、计分浮现差错等,都会落低测量效度。
③同意测验的被试。普通事情下,被试的应试动机、情绪、态度、躯体状态等,都会妨碍测量信度,造成较大的随机误差,进而妨碍测量的效度。就整个团体而言,假如缺乏必要的同质性,则非常也许会得到别恰当的效度资料。
④所选效标的性质。由于同一具测验能够有别同的效标,同一具观念效标也能够有别同的效标测量,所以在评价测量效度时,所选效标的性质是非常重要的思考因素。
⑤测量的信度。测量信度是测量随机误差的反映,而任何误差的增加,都会落低测量的信度,因此在考察测量效度时,一定要注意测量信度。
9.论述提高测量效度的办法?P70
要想提高测量效度,就必须设法操纵随机误差、减小系统误差,并且,还要挑选好特殊恰当的效标,把效度系数准确地计算出来。具体来讲,下述办法能提高测量效度:
①精心编制测验量表,幸免浮现较大的系统误差。这就要求题目样本能较好地代表欲测内容或结构,要幸免浮现题目偏倚。并且,题目的难易程度、区分度、也要恰当,题目的数量也要适中。此外,测验试卷的印刷、题目作答的要求、评分计分的标准、题目意思的表述等,都必须严格检查,幸免一切可幸免的误差的浮现。
②妥善组织测验,操纵随机误差。测验实施者一定要严格按手册指导语举行操作,要尽可能减少无关因素的干扰。
③创设标准的应试情境,让每个被试都能发挥正常的水平。应让被试调整好应试心态,让他们从生理上、心理上、学识上等做好应有的预备。否则,焦虑因素和其他无关因素妨碍过大,必定会落低测量效度,测别到欲测的内容或结构。
④选好正确的效标,定好恰当的效标测量,正确地使用有关公式。在评价一具测验是否有效时,效标的挑选是一具重要方面。假若所选效标,或所选效标无法量化,则非常难正确地评估出测量的实证效度。假如效标及效标测量都合乎要求,则公式的挑选是妨碍恐怕的另一具重要方面。
第六章测验的项目分析
一、名词解释
1.难度:指测验项目的难易程度。
2.区分度:是指测验项目对被试心理品质水平差异的区分能力。
3.鉴不度指数:当效标成绩是延续变量时,能够从分数分布的两端个挑选27%的被试,分不计算出每道题目上各自的经过率,两者只差算是鉴不度指数(D)即:D=PH-PL,式中PH和PL分不是高分组和低分组在该项目上的经过率。
二、简答与论述
1.难度的计算办法p72
(1)二分法记分项目的难度。①经过率。假如别思考被试作答是推测成功的机会,二分法记分测验项目的难度通常以经过率来表示,即以答对或经过该项目的人数的百分比来表示。P=R/N,式中,P代表项目难度,N为全体被试数,R为答对经过该项目的人。②极端分组法。当被试人数较多时,则能够先将被试根据测验总分从高到低罗列,分成三组,总分最高的27%被试称为高分组(NH),总分最低的27%被试称为低分组(NL),分不计算高分组和低分组的经过率,然后求项目的难度。P=(PH+PL)/2或P=(RH/NH+RL/NL)/2,式中,PH、PL分不表示高分组和低分组的经过率;RH、RL分不表示高分组和低分组经过该项目的人数;NH、NL分不代表高分组和低分组的人数。
(2)非二分法几分项目的难度。关于论述题,每个项目别止有答对和答错两种也许结果,而是从满分至零分之间有多种也许结果。关于这类项目,常常用下面的公式来计算其难度。P=?x/xmax式中?x为被试在某一项目上的平均得分,xmax为该项目的满分。
2.怎么确定测验的难度水平?P74
举行难度分析的要紧目的是为了筛选项目,项目的难度水平多高合适,取决于测验的目的、项目形式以及测验的性质。
教育工作或实际工作中,若测验的目的是为了了解被试在某方面知识技能的掌握事情,能够别必过多地思考难度,只要教育者以为重要的内容就能够选用,甚至那些100%经过或经过率为零的项目都能够采纳。假如测验的目的是用于选拔、录取人员,就应该将项目的难度操纵在接近录用率左右,即较多地采纳那些难度值接近录用率的项目。
3.简述难度对测验的妨碍?P76
(1)测验难度妨碍测验分数的分布形态。测验的难度直截了当依靠于组成测验项目的难度。经过考察测验分数的分布,能够对测验的难度作出直观分析。若测验项目的难度普遍较大,被试的得分普遍较低,使得测验分数集中在低分端,其分数分布呈现正偏态;当测验题目的难度普遍较小,被试的得分普遍较高,测验分数集中在高分端,分数分布呈现出负偏态。测验难度过大或过小,都会造成测验分数偏离正态分布。
(2)测验难度妨碍测验分数的离散程度。过难或过易的测验,会使测验分数相对地集中在低分端或高分端,从而使得分数的全局缩小。项目的难度以集中在0.50左右最佳,以集中两极端最差。
4.简述区分度与难度的关系?P83
难度与区分度有着紧密的联系。以鉴不度指数D为例,难度越接近0.50,项目潜在的区分度越大,而难度D越接近1.00或0时,项目的潜在区分度越小。这也是人们的在常模参照测验中,要求项目保持中等难度的道理之一。实际测验中,普通各种项目之间都具有某种程度的相关,思考到这一点,我们在利用项目分析挑选试题时,应使项目的难度分布广一些,梯度大一些,使整个测验的难度分布呈正态分布,且平均水平保持在0.50左右。如此才干把各种水平的人都区分开来,同时区分得比较细。
5.区分度的相对性与啥有关?P85
(1)别同的计算办法,所得区分值别同。
(2)样本容量大小妨碍相关法区分度值的大小。普通来讲,样本容量越小,其统计值越别可靠。因此在计算出r值后,别能仅从数值大小推断试题的优劣。而应运用统计显著性检验法,检验区分度值是否显著。
(3)分组标准妨碍鉴不指数值(D)。极端组划分标准的别同,求得的区分长值也别同。分组越极端,其D值越大。通常取27%作为极端分组划分的标准。
(4)被试样本的同质性程度妨碍区分度值的大小。被试团体越具有同质性,即个体之间水平越接近,其测题的区分度就越小。反之,若是施测于具有较大异质性的被试团体,即使是对另外一同质团体来讲区分度非常小的项目,也也许具有非常高的区分度。因此,项目的区分度大小是针对特定团体而言的。
6.论述推测校正的优缺点?P88
优点:①可幸免落低测验的信度。
②校正后的得分能够范瑛被试的真正水平和能力。
③在教育测验中,能够培养被试老实的美德。
④比较公平。
缺点:①公式的基本假设别成立。
②只要被试能答彻底部试题,则推测校正无实质作用。
③别采纳推测校正对信度并无重大妨碍。
④有时会浮现无法解释的现象。
⑤实际日子中,京城缺乏充分的证据和资料,必须凭借部分知识来推断,且举行合理推测是值得培养的适应。
总之,关于是否需要采纳推测校正,并无定论。然而在答题时刻充裕,备选答案数目(k)在四个或以上的挑选题,则没有必要举行校正记分。
7.对多重挑选题作项目分析可解决啥咨询题?P89
(1)项目是否具有所预期的功能?关于常模参照测验,测题是否有脚够的区分度?对目标参照测验来讲,测题是否能充分地测量到教学的结果?
(2)项目的难度是否得当?
(3)项目是否有缺陷?
(4)诱答选项是否都有效?
8.对多重挑选题作项目分析的具体步骤是啥?P90
(1)按被试测验的总分,从高到低依次罗列试卷。
(2)从最高分依次向下取全部试卷的27%作为高分组。
(3)从低分组依次向上取全部试卷的27%作为低分组。
(4)分不登记高分组与低分组选中各挑选项的人数(亦可将人数换为人数比例),然后登记。(5)依照登记结果举行挑选项的质量分析。
第七章测验常模
一、名词解释
1.原始分数:被试在同意测验后,依照测验的记分标准,对比被试的反应所计算出的测验分数。
2.导出分数:是在原始分数转换的基础上,按照一定的规则,通过统计处理后获得的具有一定参考点和单位,且能够相互比较的分数。常用的导出分数有百分等级、标准分数、T分数等。
3.标准分数或Z分数:是一种具有相等单位的量数,又称作Z分数,以Z表示。它是将原始分数与团体的平均数之差除以标准差所得的商数,是以标准差为单位度量原始分数离开其平均数的分数之上多少个标准差,或是在平均数之下多少个标准差。
4.正态化的标准分数:为了是来源于别同分布的分数举行比较,可使用非线性变换,将非正态分布的分数强制性地扭转成正态分布,具体做法为:将每个原始分数转换为百分等级,然后使用正态分布表,将对应的百分等级直截了当看成是正态分布曲线下的面积值,找出所对应的Z值(偏差值),这种方式所得到的分数即正态化的标准分数。
5.常模:是依照标准化样本的测验分数通过统计处理而建立起来的具有参照点和单位的测验量表。
6.常模团体:是由具有某种共同特征的人所组成的一具群体,或是该团体的一具样本。
7.进展量表:人的许多心理特质,如智力、技能等,是随时刻而进展的,因此能够将个人的成绩与各种进展水平的人的平均成绩相比较,制定动身展量表。在这种量表中,明确指出个人的按正
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- Unit 3 What would you like Part A Lets learn(教学设计)-2023-2024学年人教PEP版英语五年级上册
- 小学信息技术一年级上册第第7课 《播放动画与幻灯片》教学设计
- 《百变飞机 》(教学设计)浙教版二年级上册综合实践活动
- Unit2 An Accident(教学设计)-2024-2025学年北师大版(三起)英语六年级上册
- 幼儿园中班秋季保教工作计划(含进度表)
- ni仿真电容两端电压信号与实际电路不符
- mos功率管栅极扰动
- 电缆熔接的焊粉
- 提升创新能力的激励机制计划
- Unit 1 Let's be friends Lesson 4 Fuel up(教学设计)-2024-2025学年外研版(三起)(2024)三年级上册
- 《油气储存企业安全风险评估细则(2025年修订版)》解读与培训
- 2025年安徽职业技术学院单招职业适应性测试题库汇编
- 2025年内蒙古北方职业技术学院单招职业倾向性测试题库完美版
- Deepseek 学习手册分享
- 护理新知识小讲课
- 2024年全国职业院校技能大赛(新材料智能生产与检测赛项)考试题库(含答案)
- 2025云南红河州个旧市大红屯粮食购销限公司招聘及人员高频重点提升(共500题)附带答案详解
- 二级营销员模拟考试题(含答案)
- DB42T2305-2024高品质住宅技术标准
- 2024-2030年北京古玩行业竞争格局及投资经营状况分析报告
- 《高速公路服务区低碳建设及运营评价指南》
评论
0/150
提交评论