心理与教育测量复习资料覃瑞_第1页
心理与教育测量复习资料覃瑞_第2页
心理与教育测量复习资料覃瑞_第3页
心理与教育测量复习资料覃瑞_第4页
心理与教育测量复习资料覃瑞_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

心理与教育测量复习资料戴海崎张峰陈雪枫主编第三版覃瑞(21267529)心理与教育测量概论测量是依据一定法则使用量尺对事物属性定量描述的过程。测量关键词:1一定法则(科学原理和方法)2事物属性(客体特征)3量尺(度量工具)4定量描述(对属性量的确定)数量的四个特性:1区分性2序列性3等距性4可加性测量的精度影响因素:一对象的性质(1确定型是一定条件下,恒定不变2随机型是量随机改变。短时记忆容量3模糊型是事物量本身模糊、难以确定。人格)二测量工具的精度测量的基本类型:1物理测量(长、宽)2生理测量(生物)3社会测量(人口普查)4心理测量(智力、人格)测量的基本要素:一测量参照点(1绝对参照点以绝对零作为测量的起点,是最理想的参照点,意义最为明确,如长度2相对参照点以人为确认的零点为起点,如海拔高度)二测量单位(前提条件:1确定的意义,没有歧义2相等的价值,如1+1=2)量表是使事物特征数量化的连续体度量是建立系统的法则,选择有意义的参照点及单位来量化事物属性测量的量表种类:1名称量表(用数字对事物分类,没有数学意义)2顺序量表(用数字指代类别,有大小、等级,程度)3等距量表(指代事物的类别和等级,具有相等距离的测量单位,可以加减,是相对零点)4比率量表(任何一个非零点数值均可以表示为其他数值的比值,具有类别、等级、等距的特征,是最完善的测量量表)心理与教育测量是根据心理学和教育法则对心理特征和教育成就指派数字描述的过程心理与教育测量的特性:1心理与教育测量依据的法则相当程度上是理论,达不到物理测量的严密水平2测量对象是心理特质和教育成就,是一种根据外显行为推测,间接的测量3尺度是又专家长期编制、试用、完善逐渐标准化4测量目标是进行定量分析心理特质是相对稳定,对行为调节的心理特征心理特质特点:复杂性、流动性、内隐性(间接测量)心理与教育测量的理论基础:1桑代克提出“客观存在的事物都有其数量”2麦柯尔提出“有其数量的事物都可以测量”3哲学观点--事物都是质和量的统一,质的差异是分类的前提,量的差异是测量的前提4一百多年积累的经验,初步形成比较科学的测量原理与技术心理与教育测量的量表特点:1本质上属于顺序量表2参照点都是相对零点,不是绝对零点3使用的单位意义不明确,单位常常不等值4其值具有顺序性心理测验是对行为样本的客观的和标准化的测量测验应当具备的四个基本条件:1行为样本(测量的项目行为与欲测量的行为域高度相关)2标准化(测验的编制、实施、记分以及测量分数解释的程序的一致性)3难度或应答率(难度是计算被试答对某一项目的人数比例来确定,太高或太低都不能有效区分个体水平应答率用在态度、兴趣、性格测验不存在难度的问题上,回答“是”“否”人太多或太少,都不能有效区分人的心理特征)4信度和效度(信度是测验的可靠性,多次测验的一致性程度。效度是测验的有效性,多大程度上测验的结果反映了测量的心理特质)能被实现行为抽样的所有行为的总体是行为域从行为域中被抽取出来的、作为直接测量对象的行为样例就是行为样本测量数学运算能力的高低,数学知识范围是知识域,一组解答数学问题得行为就是行为样本测验标准化要点:1实施相同或等值的测验内容2测验条件的标准化(情景、指导语、时限)3评分规则的标准化(评分规则足以使不同评分人的评分结果保持最大限度的一致)4测验常模的标准化(常模是一组有代表性的普通人为被试的一般情况平均测验分数,一个相对参照点,关键是抽取有代表性的被试样本)以常模为参照编制的测验叫常模参照测验以标准为参照编制的测验叫目标参照测验根据测量对象分类:1智力测量2能力倾向测验(一般能力、特殊能力)3成就测验(科学成就、综合成就)4人格测验(自陈人格问卷、投射测验)根据测量方式分类:一个别测验(同一时间段,只能测试一个。优点:1行为的仔细观察,获得测验意外的信息2与被试交流,建立合作关系3特殊被试只能单独测验缺点:1费时间2测验复杂,需较高技能个别测验不能用于团体测验)二团体测验(同一时间,测试多个。优点:1节省时间2不宜有效控制被试行为3容易有误差团体测验可以用于个别测验)根据测验内容表达和反应形式的分类:1文字纸笔测验(容易受被试文化背景影响,降低测验效度)2非文字操作测验(局限于个别测验,时间上不经济)根据测试功能的分类:1成就测试与预测测验(成就是测验某领域已达到的成就预测是测验未来某领域成功的可能性)2难度测试与速度测验(难度是测验个人达到的最高水平速度是测验个人做题的速度)3描述测试与诊断测验(描述是通过测验来描述心理特质诊断是通过测验对问题行为及其原因的诊断)心理与教育测验的作用:1理论研究功能(收集研究资料、建立和检验理论假设、实验分组)2实际应用功能(人才选拔、人员安置、心理诊断、描述评价、心理咨询)心理与教育测量工作者的素质要求:1知识结构(基础知识:普通心理学、发展心理学、教育心理学、心理统计、教育学等专业知识:人格心理、智力心理、测量心理等)2科学的态度(测量是研究的重要工具、也是解决实际问题的重要工具)心理与教育测量工作者的道德要求:1测验的保密和控制使用2测验中个人隐私的保护(必要情况下才问隐私、征得被试同意、为被试保密、)心理与教育测量简史中国古代的心理与教育测量:一能力测量(孔子将智力分为三等:中上之人和中人之人可以语、中下之人;董仲舒的测验:一手画方,一手画圆,莫能成;三国刘邵的《人物志》;清代的七巧板、九连环是创造力测验)二人格测量(孔子将人分三种:狂者、中行、狷juan者)三教育测量(西周的“国学”已建立比较系统的教育测量制度;西汉考试三种形式:口试、策试、射策;隋朝开始的科举制度)四对测验理论的最初探索(孟子:权,然后知轻重,度,然后知长短,物皆然,心为甚)中国古代心理与教育测量思想特点:1都是描述性的,非定量2分类式的3对人作整体的评价,并倾向和道德品质联系4因材施教、强烈的应用性心理与教育测量的三位奠基者:一高尔顿是运用统计的方法,优生学的创始人二卡特尔首次提出“心理测量”,一套能力测验三比内与西蒙的世界第一个智力量表“比内--西蒙量表”心理与教育测量的发展阶段:20世纪20年代的狂热期,40年代达到顶峰,50年代以后是经典测量理论趋于成熟,60年代后测量理论出现新动向1916年推孟修订的斯坦福--比内量表军队中出现了团体施测方法能力倾向测验的结构测验桑代克的第一个标准化教育成就测验克雷培林用联想法做了最早的人格测量1917年出现了自陈人格问卷人格测量的另一种重要技术是投射测验,1910年,罗夏克的墨迹测验心理与教育测量的当代趋势:1将实验法与测验法结合,产生了信息加工测验2计算机软件测验提高了效率3对经典测量理论的缺陷,提出了概化理论和项目反应理论1931年,成立中国测验学会1924年,陆志韦的《订正比内西蒙智力测验说明书》肖孝嵘rong编制的9--15岁的常模中国人自己人格量表,王登峰的7种人格特质经典测验理论的基本假设心理特质是表现在人身上所特有的相对稳定的行为方式。心理特质的要点:1内部相关行为的一组概括,有抽象性2神经心理系统综合不同的刺激,做出相同的反应3比较稳定4精神面貌由多种特质分多层次的有机组合而成5决定对特定刺激的反应倾向6可预测性测量误差是测量过程中与测量目的无关的变化因素产生的不准确或不一致的测量效应测量误差的要点:1由无关变量所致2表现为不准确或不一致测量误差的种类:随机误差(由与测量目的无关的偶然因素引起的而又不易控制的误差。方向和大小都是随机的,影响稳定性和准确性)和系统误差(与测量目的无关的变因引起的一种恒定而有规律的效应。存在每次测量中,只影响准确性,不影响稳定性)测量误差的来源:1测量工具(量表的稳定性、量表测量到的内容)2测量对象(受测试者的发挥、状态)3实施过程(情景、主试、意外干扰)一套以测验(问卷)为核心的刺激反应系统称为量表真分数T是反映被试心理特质真正水平的数值,是个理论上构想出来的抽象概念,因为误差总会存在观察分数是实测的分数CTT数学模型是线性关系:X观察分数T真分数E随机误差X=T+E三个关联的假设公理:一心理特质可以通过平行测验反复测量多次,观察分数的平均值会接近真分数二真分数和误差分数之间的相关为零三各平行测验上的误差分数之间相关为零四测量误差是完全随机的,均值为零的正态分布五真分数假定不会变,测量就是估计这一真分数大小对于测验总体中的任意一个被试而言,被试在两个测验上的观测分数(X)同时满足CTT的数学模型和三大假设,并且具有相等的真分数(T)和相等的误差标准差(σ2),则这两个测验被称为严格平行的测验,通俗的说:两个题目不同的测验测得的是同一特质,并且题目形式、数量、难度、区分度、测得分数的分布都一致的两个测验对于测验总体中的任意被试,被试在两个测验上的观测分数(X1、X2)同时满足CTT的数学模型和三大假设,并且其真分数(T1=T2+C12)之间仅相差一个常数(C12),则这两个测验被称为基本等价的测验S2X=S2T+S2E观测分数方差=真分数方差+误差方差S2T=S2V+S2I真分数方差=测量目的有关变异+测量目的无关变异S2X=S2V+S2I+S2E观测=有关变异(有效分数)+稳定的无关变异(系统误差)+测量误差变异(随机)测量信度信度指同一测量工具多次测量同一被试的同一心理特质,多次测量结果的一致性程度。一个好的测量必须有较高的信度信度另外三种等价定义:一是一个被测团体的真分数的变异数与实得分数的变异数之比rxx=S2T/S2x二是一个被试团体的真分数与实得分数的相关系数的平方rxx=ρ2xT三是一个测验x与它的一个平行测验x`的相关系数rxx=ρxx`描述测量一致性程度的指标还可以用信度指数ρxT,它实际上是信度系数的平方根信度的作用:一信度反映测量过程中的随机误差的大小二信度可以解释个人测验分数的意义,信度越大越精确三信度可以帮助不同测验分数的比较,转化为标准分数Z标准误公式:SE=SxSE标准误Sx实得分标准差rxx`信度置信区间X--ZCSE≤T≤X+ZCSEX观测分数SE标准误ZC统计检验显著性水平的标准正态分布下的临界值(1.96=95%2.58=99%)两种不同测验的“差异的标准误”公式:SE=SS相同尺度的标准分数的标准差rxx和ryy分别是两个测验的信度系数重测信度是同一个量表、同一组被试施测两次结果的一致性程度,使用条件:1所测量的心理特性必须是稳定的2遗忘和练习效果基本上相互抵消(间隔时间适度)3在间隔期间内,被试要测量的心理特质没有得到训练重测信度计算用皮尔逊积差相关系数:使用条件是:1成对数据2都是测量数据3正态分布4两变量有线性关系复本信度是两个平行的测验测量同一批被试所得结果的一致性程度。计算用皮尔逊积差相关系数,分为两种:等值性系数(同时连续施测)和稳定性与等值性系数(相距一段时间分两次施测),为抵消施测的顺序效应,可采用平衡设计,随机选出一半被试先做A卷再做B卷,另一半被试先做B卷再做A卷,使用条件:1构造出两份或以上的平行测验(不同题目测量相同内容)2被试要能接受两次测验半分信度是一个测验分成对等的两半后,被试在这两半上所得分数的一致性程度。使用条件:1只能施测一次或没有复本的情况下2分半方法(奇偶性分半、题目难度分半、题目内容分半)分半法题目数K减小,所以信度减小当两半测验分数的变异数相等时,两半测验得分的相关系数只是半个测验的信度,必须用斯皮尔曼--布朗公式校jiao正:rhh分半分数间的相关系数rxx整个测验的信度值当两半测验分数的变异数不相等时,用弗fu朗那根公式:S2a和S2b分别是被试在两半测验上得分的变异数(方差)S2x全体被试在整个测验上总得分的变异数(方差)同质信度,内部一致性系数,是测验内部所有题目间的一致性程度。题目一致性有两层意思:1所有题目测的都是同一种心理特质2所有题目得分之间都具有较高的正相关测量单一特性是同质性高的必要条件,不是充分条件。同质性高是测验测得单一特质的充分条件当测验是(0、1)记分时,可以用库德--理查德逊公式:K题目数pi答对第i题的人数比例qi答错第i题的人数比例S2x测验总分的变异(方差)当测验不是(0、1)记分时,用克龙巴赫α系数:S2i所有被试在第i题上的分数变异(方差)K题目数S2x测验总分的变异(方差)评分者信度是多个评分者给同一批人的答卷进行评分的一致性程度。当评分者为2个时,就是两个所得分数的相关系数,可以用积差相关或等级相关当评分者多于2时,用肯德尔和谐系数,公式:K评分人数N被评的对象(通常是被试人数)Ri第i个被评对象(考卷)被评的水平等级之和成套测验综合分数的信度,要注意分数合成的权重(加权计算)影响测量信度的主要因素:1被试(应试动机、注意力、耐心、团体内部水平的离散度、团体的整体水平、团体的异质大时,分布广,信度就打)2主试(严格按照规则施测、评分标准一致)3施测情境(安静、光线、空气、空间狭窄)4测量工具(题目的数量、同质性、抽样、区分度)5两次施测的间隔时间(间隔越小,受外界影响越小,信度越大)提高测量信度的方法:1适当增加测验的难度(题目数)2题目难度成正态分布,并在中等难度3提高题目的区分度4选取恰当的被试团体,提高测验在各同质性较强的亚团体上的信度(很好的代表性)5主试严格执行实测规程,客观评分,好的实测环境,减小干扰因素测量效度效度是测验或量表实际能测出其所要测(目标)的心理特质的程度效度的三个特点:1效度是一个相对概念(不能百分之百的准确,一个量表的效度也不会为零)2效度是测量的随机误差和系统误差的综合反映(有两种误差)3判断一个测量是否有效要从多方面收集证据(因为不能直接测量)效度用rxy表示,有多大比例的变异是由测验所要测量的变因引起的,数学定义的公式:S2v有效变异S2x总变异S2X=S2V+S2I+S2E效度与信度的关系:一信度高是效度高的必要非充分条件二测验的效度受它的信度制约rxy2<rxx内容效度是测验实际测到的内同与所要测量的内同之间的吻合程度内容效度的应用面:1成就测验2选拔职业测验内容效度的确定方法:一主要是逻辑分析法(专家判断1明确测量内容的范围2确定每个题目测量的内容3制定评定量表)二克龙巴赫的统计分析法三再测法表面效度是外行人对测验从表面看好像是测了某种心理特质的一种现象,不算一种效度结构效度是测验实际测到所要测量的理论结构和特质的程度,主要应用于内隐的心理理论,测验同质只是结构效度的高的必要条件结构效度的确定的步骤:1提出理论假设,并分解成细小的纲目,以解释被试测验上的表现2依据理论框架,推演出有关测验成绩的假设3用逻辑的和实证的方法来验证假设结构效度确定的方法:1测验内部寻找证据法(测验的内同效度、被试答题过程、计算测验的同质信度)2测验之间寻找证据法(新的测验与旧的已知测验的对比,相关度高,就相同)3考查测验的实证效度法(根据效标或测验得分,把被试分为高低两组,比较差异)4多种特质--多种方法矩阵(相容效度和区分效度的综合运用,用相关系数判定)5因素分析法(探索性因素分析、验证性因素分析)实证效度是测验对处于特定情境中的个体的行为进行估计的有效性实证效度根据时间分类:同时效度(效标与测验分数同时搜集)和预测效度(效标在测验分数之后搜集)效标是衡量一个测验是否有效的外在标准,独立于测验并可从实践中直接获得的行为,常用的效标主要有:学业成就、等级评定、临床诊断、专门的训练成绩、实际的工作表现、对团体的区分能力同一个观念效标(观念)可以有多个效标测量(数字表达)实证效度的确定步骤:1明确观念效标2确定效标测量3考查测验分数与效标测量的关系实证效度的确定方法:1相关法(测验分数与效标的相关系数)2区分法(效标为依据分为高低两组,与原来测验分数进行差异分析)3命中率(正命中率、负命中率、总命中)4基础率、灵敏度、确认度正命中率是被测验选出来的人中真正被选对了的人数的比率负命中率是被测验所淘汰的人中真正应该被淘汰的人数比率总命中率是被测验选对了的人数和被淘汰对了的人数之和与总人数的比率,总命中率高,测量的效度就高基础率是符合筛选要求的群体在整个人群总体中所占的比率灵敏度是所有真正符合要求的人能被测验鉴别出来的人数的比率确认度是所有不符合要求的人能被测验正确淘汰的人数的比率基础率低时,灵敏度高的工具才有效,“优中选优”“绝不放过一个坏人”基础率高时,确认度高的工具才有效,“尽量不冤枉一个好人”“淘汰无药可救的员工”测量效度的影响因素:一测验的构成(试题、增加测验的长度提高信度,为提高效度提供可能性)二测验的实施过程(严格施测,意外干扰、评分)三接受测验的被试(应试动机、状态)四所选效标的性质(一个观念效标有多个效标测量、不同测验效标系数要求不同)五测量的信度(信度不高,效度一定不高)提高测量效度的方法:1精心编制测验量表,避免出现较大的系统误差2妥善组织测验,控制随机误差3创设标准的应试情境,让每个被试都能发挥正常的水平4选好正确的效标,定好恰当的效标测量,正确的使用相关公式5适当增加题目测验的项目分析测验项目的难度是被试完成测验项目任务时所遇到的困难程度项目难度的计算:一二分法记分项目的难度(1通过率用P表示,0<P<1,N全体被试、R答对的人数,公式:2极端分组法,最高的27%为高分组NH人数、RH高分组通过的人数、最低的27%为低分组NL、RL低分组通过的人数,公式:)二非二分法记分项目的难度(该项目平均分、该项目满分,公式:)对知识的掌握情况的测验,可以不考虑难度选拔的测验,难度就是录取率速度测验的难度不宜太高通过率表示难度,是顺序变量,没有相等的单位,所以需要等距变换,P是面积,转换为具有相等单位的等距量数,Z分数,Z分数的另一种形式是难度指标,公式:难度指标Z是P值转换的标准分数值越大,难度越高难度对测验的影响:一难度影响测验分数的分布(难度大侧正偏态左,难度小侧负偏态右)二难度影响测验分数的离散程度(难度在0.5左右时,分数的分布较广,信度值较高)区分度是测验对被试心理品质水平差异的区分能力,用D表示,取值-1<D<1,为正值是积极区分,负值是消极区分,为“0”是无区分作用,D值越大,区分越好区分度的计算:一项目鉴别指数法(适用于二分法记分1鉴别指数按27%分组,公式:D=PH-PLPH与PL分别是高、低分组的通过率当D=1时,高分组全过,低分组全失败D>0.4很好0.3<D<0.39良好改进0.2<D<0.29尚可修改D<0.2差淘汰2极端分组的划分,当团体样本人数<100时,分数标准用50%,分为两半)二相关法(相关越高,区分度越高1点二列相关系数,适用二分变量,公式:rpb相关系数通过该项目被试的平均分未通过该项目被试的平均分p通过该项目被试人数的百分比q未通过该项目被试人数的百分比St全体被试效标分数的标准差全体被试的平均效标分数2二列相关,适用连续变量被人为分为两类3φ相关fai,适用两个变量是二点分配的资料,二分名义变量4积差相关,适用连续数据)区分度的相对性:1不同的计算方法,值不同,采用同一方法,便于分析比较2样本容量大小影响相关法区分度值的大小,用显著性检验法难度与区分度的关系难P区D100.90.20.70.60.60.80.510.40.80.30.60.10.20.00检验显著3分组标准影响鉴别指数值,分组越极端,D值越大4被试样本的同质性程度影响区分值大小,被试越同质,个体水平越接近,项目区分度越小猜测误差是猜测是非题和选择题给测量带来的误差猜测误差的来源:1猜和不猜引起的误差2猜的正确和错误引起的误差猜测误差的校正:1被试是团体(CP校正后的通过率P实际通过率K答案的选择项数Q=1-P公式:)2被试是个体(S校正后的得分R被试答对的项目数W被试答错的项目数K答案的选择项数公式:)多重选择题的项目分析:1每题都分为高低两组2列出每个选项的选择人数3列出每题的正确答案4计算难度、区分度的鉴别指数D和相关系数rpb5分析诱答选项、答案本身是否正确、题意是否有多种歧义、测验常模根据测验和计分标准,计算的出来的测验分数是原始分数导出分数是在原始分数的基础上,按照规则,统计处理后获得具有一定参照点和单位,且可以比较的分数量表系统分数的转换是将原始分数转化为导出分数的过程常用的导出分数:百分等级分数、标准分数、T分数、IQ分数百分等级是在一个团体的测验中,得分低于这个分数的人的百分比百分等级的计算:1未分组的分数资料(公式:PR百分等级R从高到底的排名N被试总人数)2分组分数资料(首先排序,然后按组距从高到底分组,统计每组的人次,从低到高累每组的人次公式:PR百分等级X被试原始分数L被试所在组的下限f被试所在组的人次Fb被试所在组以下各组人次之和i组距N被试总人数)百分等级按四舍五入的原则取整数百分等级优缺点:1易于计算、解释方便2适用不同对象和性质不同的测验3被试在所属团体中的相对位置,既是分数不是正态分布,也不会改变百分等级的常模解释能力4单位不等,尤其是在两个极端,只具有顺序性,不能说明不同被试的差异5同一被试无法在多项测验上的百分等级进行合成汇总6百分等级是相对于被试的团体,解释不能离开特定的参照团体标准分数具有相等单位的数量,Z分数标准分数的特点:1以标准差为单位的等距量表,平均数为参照点,不受原始测量单位的影响2可以进行统计处理3正号在平均数以上,负号在平均数一下,绝对值是离平均数的距离4分布与原始分数一样,-3--+3占全体的99.73%,X原始分数、X团体平均分数、S团体标准差、公式:T分数是标准分数的变式,平均数为50,标准差为10,公式:T=10*Z+50韦氏智力测验采用的离差智商:IQ=15*Z+100100是平均数,15是标准差T分数的优缺点:1避免了小数和负号2等单位,可以进一步统计分析3正态分布时,导出分数可与百分等级分数作换算4正态分布时,不同测验的分数直接作比较5分数过于抽象,不易理解6非正态分布时,不可相互比较和相加求和分数合成的意义:常常要将多个测验的分数组合起来,以获得一个合成总分数作比较,高考分数合成的种类:1项目的组合2分测验或量表的组合3测验或预测源的组合分数合成的问题:1采用什么方法合成?取决测验目的2什么形式是最适当的分数组合?取决效度3需要多少及何种测验分数作最适当的组合分数?当增加测验,而效度不增加,为最合适的分数合成的方法:一临床诊断--直觉合成(根据直觉经验主观地将各种因素加权而获得结论或预测的方法优缺点:1高度综合性2灵活的针对性,根据个体作具体的结论3主观加权,偏见、不客观4缺乏精确数量分析和指标5对主试专业要求高、经验丰富)二加权求和合成(适用于:1各测验特质间有相互代偿作用2分数为连续性资料3能同时获得常用加权系数的确定方法:1抽象推理,从理论推理2使用统计学方法)三多重回归四多重划分(用多元回归分析组合分数,适用于特质具有互偿性)常模是根据标准化样本的测验分数经过统计处理而建立的具有参照点和单位的测验量表常模团体是具有某种共同特征的人所组成的一个群体,或是该群体的一个样本确定常模团体的注意事项:1群体构成的界限必须明确(测量目的的性质和特征)2常模团体必须是所测群体的一个代表性样本(随机抽样)3取样过程必须明确且有详尽的描述4样本大小要适当(总体、性质、精确度)5常模团体必须是近时的6注意一般与特色常模的结合定制常模的过程:1确定测验将用于哪一个群体(统计量、抽样误差、抽样方法)2对常模团体施测,得到分数和分布3确定常模分数类型,制作常模分数转换表,即常模量表,说明书和解释指南主要的常模参照分数:一发展量表(随时间发展,1年龄常模最大的优点是易于理解与解释2年级常模有代表性问题)二商数(是两个分数的比率,例如:智商教育商数EQ、教育年龄EA、实际年龄CA、公式:成就智商AQ、智力年龄MA、公式:)三百分等级常模(1简单转化表--原始总分数转换成百分等级分数2复杂转化表--各个分项百分等级)四标准分数常模(原始分数转换成标准分数Z或导出分数T量表)五剖pou析图(把一套测验中几个分测验分数同时用图表和图形表示出来)心理与教育测验的编制与实施编制测验的基本程序:一确定测验目的(对象、目标、用途)二制定编题计划(框架)三编辑测验项目(就是题目,1收集测验资料原则:资料丰富、普遍性、趣味性2选择项目形式原则:容易理解、过程简单、计分简单、不会有歧义3编写测验项目,需反复修改,要点:反应测量目的特征、在计划列项内、难度有区分度、语言简单明了、初编题目多以便筛选、测验项目说明简明)四预测与项目分析(小范围施测,预测检查被试对项目反应,分析确定难度和区分度)五合成测验(形成问卷,避免练习效应,保持兴趣等,1测验项目的选择,依据测验的性质、难度、区分度2测验项目的编排,常见的两种方式:并列直径式,先性质分类、后难度从易到难;混合螺旋式,先难度分层次,后性质交叉)六测验标准化(程序结果的一致性,具体内容:1测验内容是前提,要求是相同或等值2施测过程,环境条件相同,包括:情境、指导语、时限3评分要求是客观,包括:被试反应及时记录、标准答案或适当反应的表格即记分键、得分的记分标准化4测验分数的解释,建立好的常模)七鉴定测验(鉴定:信度、效度、常模表)八编写测验说明书(目的、用途、理论依据、施测方法、标准答案和评分、信度、效度、常模表)测验实施的过程:一施测前的准备工作,最重要(准备测验材料、熟悉施测过程)二指导语(使被试正确对题目做出反应,要求是:态度中立、执行标准时间限制)三测验情境(通风、安静、光线、桌椅高度、同一种纸张、排版)四测验焦虑(注意:抱负水平、过度焦虑、低焦虑)五与被试建立良好的协调关系六评分技术测验解释的类型:1叙述的解释(描述状态)2溯su因的解释(追溯过去找原因)3预测解释4评价的解释(作价值判断,高考录取)解释测验分数的原则:1主试充分了解测验的性质和功能2解释因慎重、防片面极端,对被试作积极影响3充分估计测验的常模和效度的局限性4解释分时应参考其他相关资料,测验分数不是唯一,情境影响5应以“一段分数”来解释,误差的存在6不同测验的分数不能直接比较如何向受试者报告分数:1使用当事人能理解的语言,非专业语言2保证当事人知道测验的目的和内容3告知当事人分数解释的参照体4告知当事人分数不是一个精确的值5分数只是决策的依据,不是决策本身6充分估计分数可能给当事人造成的影响7测验结果对无关人员保密8对低分者解释因慎重9鼓励当人事表达对测验结果的感受,予以引导和咨询第九章测验等值测验等值是通过考核同一心理品质的多个测验形式做出的测量分数系统的转换,使不同测验形式的测验分数之间具有可比性测验等值的条件:1同质性2等信度3公平性(同一被试,结果一样)4可递推性5对称性(可逆)6样本一样经典理论等值CTT与项目反应理论等值IRT测验分数等值(总分)与项目参数等值(每题分数)水平等值(难度、被试能力相同)与垂直等值(不同)测验等值设计是寻找不同测验形式之间的等值关系而预先对数据的采集方法、等值实现途径、等值的计算方法进行周密的设计锚测验是在测验等值设计中,用同一组测验试题关联两个待等值的测验形式,找到两形式的等值关系的那些测验试题数据平滑法是通过处理使分布曲线趋于光滑的方法,两种常用方法:对数线性平滑模式、β二项平滑模式等值标准误差是评价由抽样引起的等值误差大小的指标,是随机误差等值偏差是在测验等值中除了抽样引起的等值随机误差之外,等值方法不当引起的误差,也称等值的系统误差等值结果的表示方法:列表法、公式法、图示法测验等值的步骤:1确定等值目标2进行等值设计3施测并采集测验数据4选择一个等值的操作性定义5选择一种等值关系计算方法进行等值计算6评价等值结果测验等值计算的基本方法:一等百分位等值(百分等级相等认为等值,公式:)二线性等值法(标准分数相等认为等值,公式:)常用测验等值设计:一随机分组--每组实施一个测验二随机分组--各个测验对每组都实施三随机分组--每组各实施一个测验,锚测验向每组实施四非随机分组--每组各实施一个测验、锚测验向每组实施(链等值法是加个中介锚测验)目标参照测验目标参照测验是根据明确的内容范围而编制的测验,被试的测验结果,根据明确界定的行为标准直接解释(测验知识的掌握与否)目标参照测验与常模参照测验的区别:一前者关心是否达到预定学习目标,后者关心学生之间的比较二前者用于诊断和发现不足后改进,后者选拨性考试和总结性评定目标参照测验的项目分析:一内容范围的确定二测验项目的内容效度分析(专家法)三测验项目难度和区分度分析(1测验的预测,三种方法:前测--后测方法、已接受教学组--为接受教育组、对照组方法2测验项目的难度分析3测验项目的区分度分析,不是高低分组,而是掌握与非掌握分组,两类指标:难度差值--鉴别指--个人获得指数DIG数、相关系数)目标参照测验信度估计方法:一分类一致性信度二方差分析方法--荷伊特信度目标参照测验效度估计方法:一内容效度二效标关联效度目标参照测验分数的解释:一专家判定法(Nedelsky法、Angoff法、Bookmark法)二效标组预测法(临界组法、对照组法)学绩测验学绩测验是对一个阶段的学习或训练掌握知识和技能的水平鉴定学绩测验与能力测验都是最佳行为测验一般性向测验预测学习的成就学绩测验的作用:鉴定学业成绩、提高的量、反馈给学生和老师改进提高、升学、留级、毕业、划分班级、教学管理学绩测验的分类:教师自编课堂测验、标准化学绩测验单科测验、多科测验考查性测验、诊断性测验常模参照测验、目标参照测验定向反应型(客观题)、自由反应型(主观题)标准化学绩测验是在心理与教育测量学原理指导下,按一定的程序编制的各方面的质量都达到规定标准的学绩测验标准化学绩测验的基本要求:1命题组卷标准化(目标明确、语义清晰、难度、区分度)2施测标准化(指导语、外环境、时间、顺序)3评分标准化(答案、规则)4测验分数解释标准化(参照常模)标准化学绩测验的编制步骤国外常用的标准化学绩测验:1斯坦福成就测验(常模参照测验,适用1--9年级,美国中小学)2关键数学算术诊断测验(适用儿童--六年级)教师自编课堂测验特点:1形式灵活多变,与测验目的完全一致2测验内容与教材内容高度一致3测验难度切合学生的实际水平4测验编制简易快速教师自编课堂测验的步骤:1审查测验目的2制订测验编制计划3命题与组卷教师自编课堂测验应该注意的问题:1深入研究教材,深入调查学生2维护准确稳定的合格标准(合格能基本掌握知识内容、学生测验结果不能忽高忽低)3客观评价自己的命题技术,合理使用各种题型4总结命题经验,提高命题技术5控制评分误差、防治简单粗糙6一定的定量的分析研究能力测验上斯皮尔曼提出智力二因素论,G因素是共同因素、S因素是特殊因素瑟se斯顿提出智力多因素论,七种(语文理解、语言流畅性、推理、空间表象、数字、记忆、知觉速度等)吉尔福特提出智力三个维度:内容因素、操作因素、结果因素弗农提出智力三层次模型:最高层是G因素、第二层是语言和操作能力、第三层是心理能力(数学、空间知觉等)智力PASS模型分三层:注意系统是基础、同时性加工--继时性加工系统是中间层、计划系统是最高层传统智力测验的问题:一传统智力测验的结构效度问题(理论假设是G因素)二传统智力测验的功能问题(基本功能是测量个体差异、预测源测验行使预测功能、诊断补救措施)三传统智力测验的公平性问题(性别差异、职业差异、文化和教育差异)四传统智力测验的预测效度(智力的可变性:1随年龄变化2随环境变化,城和乡3随个性特质变化,退缩降低、积极面对提高)智力测验广泛应用的原因:1个体有可变性、也具有稳定性2应用于选拔和安置人员,提高决策正确率,实践证明效标效度较好3不同团体可能存在不公平性,正在试图改善4没有成熟、没有出现超越传统智力测验工具比内--西蒙量表,诊断异常儿童智力,第一个年龄量表斯坦福--比内量表,1961年首次引入比率智商,1960年引入离差智商,平均分100,标准差16中国比内测验,20世纪20年代,离差智商韦克斯勒智力量表中国版WAIS--RC,语言量表(常识、算术、理解、同类、背数、词汇),操作量表(数字符号、填图、积木图案、图片排序、拼图),平均分100,标准差15戴斯--纳格利尔里认知评估系统CAS,每个分测验有三种任务:计划、注意、同时性和继时性加工认知能力测验,桑代克编制,四个不同部分:初级型、文字测验、数量测验、非文字测验陆军乙种测验,非文字测验瑞文推理测验,非文字测验,题目形式(挖掉一块图片、缺少一块图片),5--老年,可团体和个别测验,百分等级常模解释,不受文化等影响,分三个水平:1标准推理测验,中等水平2采图推理测验,最低水平3高级推理测验,最高水平第十三章能力测验下能力倾向测验的特点:1测验目的,预测未来、目的性更强2测验的编制,每个分测验针对一种能力3测验结果的解释,不同的工作,不同能力因素权重不同学术能力倾向测验SAT,美国高考分辨能力倾向测验DAT,适用美国初中和高中的教育咨询和就业指导,八个分测验:1语言推理2数的能力3抽象推理4文书速度与准确5机械推理6空间关系7语言运用拼写8语言运用文法一般能力倾向成套测验GATB,美国的综合式职业性向测验,九种能力:1一般智力G2语言能力3数的能力4空间关系5形状知觉6文书知觉7动作协调8手指灵巧9手部灵巧行政职业能力倾向测验,中国公务员考试,考查职业一般素质和能力,题目简

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论