版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、PAGE PAGE 32心理测量学课程教学大纲课程编号:APSY3008课程类别:大类基础课授课对象:应用心理学本科专业开课学期:第3学期学 分: 3学分指定教材:郑日昌,心理测量学,人民教育出版社,2002年教学目的:本课程是心理学课程中的一门重要基础课程。要求学生基本了解心理测量的发展与最新进展,掌握经典测量的基本理论与方法,如信度、效度、常模和项目分析的理论与计算方法;学习熟练操作一些重要的智力、人格、临床的测验工具。第1章 心理测量的理论假设 课时:第1周 共4课时教学内容一、 为什么会有心理测量与为什么要心理测量? 1. 测量(尤其是心理测量)基于人类一种内在的认知需要 2. 测量(
2、包括心理测量)是人类重要决策必需的手段与途径 3. 科学心理学不可能没有心理测量 (1) 心理测量是使心理学研究成为可能的一种“桥梁”。这是美国心理学家安德逊(Anderson)的观点,他认为心理测量连接与沟通了外在事物与内在心理二者的联系,使心理研究成为可能(Anderson, 2001)。心理测量起了一种“桥梁”的作用。心理测量通过赋值,将外在事物和内在心理转换为一种符号系统,成为科学语言,架起了心理学研究的“桥梁”。如果没有这种赋值,没有这种符号系统,没有这种科学语言,心理与行为“看不见,摸不着”,便无从着手研究。(2)心理测量是心理的“尺度”和“标准”、“量具”与“单位”。 (3)心理
3、测量是科学心理学的“基石”。 4. 心理测量对其它学科的贡献与占据的地位二、 心理测量的概念与理论1. 物理测量与心理测量建构概念 建构行为样本 2. 心理测量的定义有关心理测量的概念中,有很多同义词。例如:心理测验(psychological test;psychological testing)、心理测量(psychological measurement)、心理测量学(Psychometrics)。psychological test偏重于指称那些物化的心理测验工具、量表等;psychological testing则偏重于指称正在进行的心理测量过程。psychological meas
4、urement则可以概括地指称psychological test与psychological testing二者。Psychometrics则是对这门学科的总称。 测量家克伦巴赫(L.J.Cronbach)曾经下过一个定义,他认为测验是借助数量等级或固定类别来观察和描述行为的一个系统化程序。斯帝汶森(S. Stevens)则认为:“广义地说,测量即根据法则而分派数字于物体或事件之上”(Stevens,1951)。安娜斯塔西(A.Anastasi):“心理测验本质上是对行为样本的客观和标准化的测量”(安娜斯塔西,2001)。心理测量是通过对行为样本的标准化的度量,从而对人的心理作出客观科学的评
5、估的方法、技术或工具。3. 测量的量化水平4. 测量误差与来源凡是测量皆有误差。间接测量比直接测量误差大,心理测量比物理测量误差大。可以这样说,心理测量所做的很多努力都是在了解测量误差,分析测量误差,控制测量误差。什么是测量误差?测量误差指在测量过程中由那些与测量目的无关的因素导致的不准确、不一致的测量效应。例如,我们测量的目的是认知能力,但是,由于被试在测验过程中情绪状态不佳,测验发挥很不理想,这样一来,被试在认知能力上的低分可能是由于情绪导致的,情绪不佳导致的测量误差干扰了认知能力的测量。又如,由于测验题目编制得不好,有不少题目更多与知识水平有关,这样测量到的认知能力中还有知识水平的效应,
6、不是单纯的认知能力。知识水平造成的效应就是测量误差。测量误差有随机误差和系统误差两种。随机误差是与测量目的无关的偶然因素引起的误差。它使多次测量产生不一致的结果,并且它的大小、方向都是随机的。例如,在做一项速度测验时被试因为身体不舒服(发烧)导致发挥不佳;或者在做测验时受到突然出现的外人的干扰,导致测验没做好。身体不适、出现的干扰,这些因素是偶然出现的,它们对测验的影响是随机的,我们不能预测它们影响测验的方向、以及大小程度。系统误差则是与测量目的无关的因素引起的一种有规律、稳定的误差。它稳定地存在于多次测量中。与随机出现的误差不一样,系统误差是有规律出现的、并且是稳定出现的误差。如果一项测验要
7、测量的是成就动机,但是其中某些测题没有编制好,它们真正测量的却是自尊。那么,这些测题所导致的测量误差将稳定地、有规律地、始终出现在这个测验中,这就是系统误差。还有一种情况,假设一项测验有几个分量表,但是,测验编制者在计算这些分量表的总分时将第一个分量表的题目错误地加到了第三个分量表中,那么,这种计分的误差也将有规律、稳定地出现在整个测验中,因计分导致的误差也将是一种系统误差。两种测量误差还有一些不同的特点。系统误差只影响测量的准确性,即效度;而随机误差则既影响测量的稳定性(信度),又影响其准确性(效度)。这些测量误差是怎样出现的呢?一般来说,测量误差的来源主要有三个方面:(1)测量误差来自测验
8、本身。(2)测量误差来自施测过程。a. 主试效应导致的误差。b. 测验情境控制不力导致的误差。c. 测验时间导致的误差。d. 测验安排不当导致的误差。(3)测量误差来自测验对象。a. 测验动机。b. 测验焦虑。c. 练习效应。d. 反应倾向。5. 真分数数学模型真分数数学模型认为:观测分数(X)等于真分数(T)与测量误差(E)之和:X = T + E这个数学模型可以引伸出三个定理:(1)反复多次的平行测验,可以使观测分数的平均数接近于真分数,误差接近于0,即:E(X) = T E(X) = 0(2)真分数与误差的相关为0: (T, E)= 0(3)各平行测验的误差之间的相关为0: (E, E)
9、= 06. 心理测量的理论体系心理测量学的理论体系主要包括两大结构,一是经典(或称古典)测量理论;二是现代测量理论。三、凡是存在的,都是可以测量的美国心理学家桑代克(Thorndike, 1918)有一个著名的命题,即就是:“凡存在的东西,都有其数量(whatever exists at all, exists in some amount)。”麦柯尔(W. A. McCall, 1939)提出了另一个著名的命题:“凡有数量的东西,都可以被测量(anything that in amount can be measured)。”凡是存在的,都是可以测量的。今天的心理测量实际上已经渗透到了心理学
10、的一切领域,临床心理学、人格心理学、社会心理学、管理心理学、发展心理学在心理学的所有领域,都离不开心理测量。今天的心理测量实际上也已经渗透到了人类生活的一切领域,只要有人存在的地方与领域,都有心理测量:人格、态度、兴趣、动机、智力、情绪、心理弹性、乐观、心理障碍与症状所以说,怀疑心理测量是否能够测量人类心理的某些方面与领域是没有必要的。四、可重复性与普遍性的推论科学哲学家赖欣巴哈(Hans Reichenbach, 1891-1953) 曾提出三个理论:一、概率的意义理论,认为人类的知识有两种形态,一是已证实的,二是尚未证实的。前者可以确定其值,而后者只是一种概率。故只有两种意义理论存在:一是
11、真值意义理论,二是概率意义理论。二、概率的归纳理论:过去出现的次数愈多,今后出现的可能性愈大。三、一切科学理论都是假说,都是一种概率知识。其一是根据赖欣巴哈的概率的归纳理论进行推论:“过去出现的次数愈多,今后出现的可能性愈大。”这是一种可重复性的经验推论的逻辑证实。其二就是普遍性假设。图1.13 正态分布可以这样说,在后面我们的学习历程中,我们所有的心理测量的结论与决策都将从这个正态分布中做出;我们所有的心理测量的结论与决策都将具有可重复性与普遍性的特征。 复习与思考1. 什么是测量?物理测量与心理测量有何不同? 2. 人类为什么要心理测量?3. 什么是行为样本? 4. 心理测量中的标准化是什
12、么意思?5. 心理测量中最多见的是什么量化水平?6. 你怎样理解心理测量中测量误差?7. 心理测量的理论假设有哪些? 推荐阅读王书林心理与教育测量商务印书馆1935郑日昌心理测量湖南教育出版社1987查尔斯杰克逊了解心理测验过程姚萍译北京大学出版社2000桑代克;哈根心理与教育的测量与评价叶佩华等译人民教育出版社1987安娜斯塔西等心理测验浙江教育出版社2001.DoBois, P. H.(1970) A History of Psychological Testing. Boston: Allyn and BaconStevens, S. (1951) Mathematics, measur
13、ement and psychophysics. In S. Stevens (ed.), Handbook of Experimental Psychology. New York: Wiley. 第二章 关于心理测量的争议 课时:第2周,共3课时教学内容 一、有关范式的争议二、涉及心理测量基本理论的争议1. 标定效应(Labeling effect)所谓“标定效应”,又称“标签效应”,指心理测量的结论可能像贴标签一样,给被试一个标定,由此可能使被试或与被试相关的人产生相应的后继行为。这些后继行为即“标定效应”。后继行为有可能是正面的、积极的、对被试有益的;也有可能是负面的、消极的、对被试有
14、害的。(3)文化公平性问题智力测验的偏差与文化不公平 对移植国外量表的反省与批评 三、关于具体的心理测验的争议关于智力测验的争议(1) 智力测验有用吗? (2) 智商重要还是情商重要?(3)智力的发展高峰的拐点在哪?(4)什么是对智力的更客观更科学的测量?关于投射测验关于问卷测验四、怀疑和否定心理测量的观点与思潮前苏联1930年代的心理学大批判运动文化大革命十年的“取消”南方周末的批判 心理学界或相关学界的“内讧”与否定结论讲到这里,我们发现关于心理测量竟然有这么多的纠结。但是不管怎样,没有心理测量,心理学就难以健康前进。我们引用两位著名的心理测量家的话来对上面关于心理测量的争议做出结论。克隆
15、巴赫(Cronbach,1975)认为:“合理的策略不是赞成测验或反对测验,重要的是如何使用测验”(查尔斯杰克逊,2000,p1)安娜斯塔西:“心理测验是工具。为了获得测验能够提供的益处,我们必须记住这个重要事实:任何工具都是有益也可能是有害的,这取决于怎样使用这种工具。”“即使测验被取消,但个体或组织决策的需要仍然存在。决策将不得不依靠于我们熟知已久的期货替代方法如推荐信、面试和成绩平均数”(安娜斯塔西,2001,p3;p726)。 复习与思考1. 你认为心理测量客观吗?心理测量是怎样达到客观的? 2. 你怎样看待标定效应?3. 心理测量中存在文化不公平性吗? 4. 智力测验有用吗?5. 你
16、怎样看待智商与情商?6. 你怎样看待投射测验? 推荐阅读高曼,D. EQ:划时代的心智革命.张美惠译.台湾:时报出版公司.1996杨国枢等社会及行为科学研究法东华书局1994罗伯特G迈耶等. 变态心理学. 丁煌等译. 辽宁人民出版社. 1988. Rosehan, D. L. On being sane in insane places. Science, 1973,179,250-258. Kevin R. Murphy & Charles O. Davidshofer. 心理测验:原理与应用(第6版). 张娜等译. 上海社会科学院出版社. 2006. P288-301童辉杰.中国传统文化中
17、的自我意识.心理科学,2000,23(4)童辉杰.追求与变迁:天人合一境界与中国人的国民性格.台湾本土心理学研究,2002,17(6)杨国枢心理学研究的中国化:层次与方向杨国枢、文崇一主编社会及行为科学研究的中国化台北:中央研究院民族学研究所 1982. 176180.杨中芳如何研究中国人台湾:桂冠图书公司 1996. 212214.MMPI全国协作组中国人使用明尼苏达多相个性测验表的结果分析1985.Bond, M. H. How language variation affects inter-cultural differentiation of values by Hong Kong
18、bilinguals. Journal of Language and Social Psychology, 1983.2, 57-66.Kevin R. Murphy & Charles O. Davidshofer. 心理测验:原理与应用(第6版). 张娜等译. 上海社会科学院出版社. 2006.艾森克,M. 心理学-一条整合的途径. 阎巩固译.华东师大出版社. 2001杨鑫辉,心理学通史. 山东教育出版社. 2000.第三章 心理测量的历史与应用领域 课时:第3周,共3课时教学内容一、心理测量的发展1. 心理测量的发展阶段 心理测量经历了从萌芽、发端、高速发展到今日平缓发展这样几个发展阶
19、段。心理测量的萌芽时期 心理测量的发端期 心理测量的高速发展期 心理测量的平缓发展期 2. 心理测量史上的重要人物 弗兰西斯高尔顿(Francis Galton,1822-1911) JM卡特尔(J.M.Cattell,1860-1944) 比奈(Alfred Binet,1857-1911)罗夏(Herman Rorschach,1884-1922) 爱克斯纳(John EExner,1928-2006) 大卫 韦克斯勒(D. Wechsler,1896-1981) 二、 心理测验的应用鉴别与判断 诊断与循证 预测与决策 1. 人员选拔 人员选拔的发展历史 人员选拔的复杂性 人员选拔中的心理
20、测量技术 (1)传记与履历表分析 (2)面谈技术 (3)心理测验量表 (4)笔迹分析 (5)评价中心技术 2. 心理诊断 心理测量作为各个咨询治疗派别的基本手段 评估的重要性与必要性 疗效评估 3. 教育评估 复习与思考1. 心理测量的发展历史给你什么启示? 2. 如何理解比奈-西蒙儿童智力测验的历史意义? 3. 你如何评价心理测量史上做出重要贡献的人物?4. 你如何心理测量在人员选拔领域的作用?5. 心理测量在临床心理学中的作用是怎样的?6. 教育评估能够离开心理测量吗? 推荐阅读安娜斯塔西等心理测验缪小春等译. 浙江教育出版社2001.王书林心理与教育测量商务印书馆1935刘劭人物志八观诸
21、葛亮诸葛亮文集卷四知人性陈康书法概论上海书店1946杜舒尔茨现代心理学史杨立能等译人民教育出版社1983132页罗夏心理诊断法袁军译浙江教育出版社1997鲁龚等编译;评价中心人才测评的组织与方法,百家出版社,1991.陈龙、王登编译,经济管理心理学,团结出版社,1991.方俐洛、凌文辁:劳动心理学,团结出版社,1988.DoBois, P. H.(1970) A History of Psychological Testing. Boston: Allyn and BaconMegargee, E I; Spielberger,C.D. Personality Assessment in Am
22、erica. New Jersey: Lawrence Erlbaum. 1992.第四章 测验的信度 课时:第4周,共4课时教学内容 一、 信度的原理1. 信度的概念与定义信度(reliability)指测验结果的一致性、稳定性和可靠性程度。这种一致性、稳定性和可靠性程度反映被试实际水平的稳定程度,表明测量不受测量误差影响的程度;因此可以通过这种一致性、稳定性和可靠性来估计测量的误差是多少。2. 信度的检验信度的检验一般有两种方法:其一、从被试间的变异进行分析,常用相关系数表示信度的高低;其二、从被试内在的变异进行分析,用测量的标准误表明信度的高低。(1) 根据测量的数学模型,观测分数(X)
23、等于真分数(T)与测量误差(E)之和:X = T + E观测分数与真分数的差即是测量误差:E = X T三者之间变异数的关系为:Sx2 = St2 + Se2上式可以转化为:(St2Sx2) (Se2St2 ) = 1真分数与测量误差的变异在观测分数总变异中所占的比率之和为1。信度又可看作是真分数的变异在观测分数总变异中所占的比率:rxx = St2 / Sx2信度还可看作观测分数总变异中不是由测量误差引起的变异所占的比率:rxx =( Sx2 - Se2) / Sx2 = 1 ( Se2 / Sx2)(2) 观测分数与真分数的相关即信度指数,等于真分数的标准差与观测分数的标准差之比:rxt
24、= SDt / SDx其平方就是信度系数:rxt2 = SDt2 / SDx2 rxx信度指数即是信度系数的平方根,信度就是真分数与观测分数之间的决定系数(coefficient of determination)。在经典测量理论中,心理测量家们从5个不同的侧面估计信度。这5 个不同侧面即重测信度、复本信度、分半信度、内部一致性信度和评分者信度。表4.3对5种信度的含义作了一个简要的解析。在后面,我们将继续学习这5种信度的算法。另外,我们还必须清楚,现代测量理论发展了信度的算法。例如,概化理论就是一种更新的信度估计算法。】3. 信度估计的意义二、 信度的计算1. 重测信度 (test-rete
25、st reliability)对同一群被试,实施同一测验,前后两次,计算两次的相关系数,由此即得重测信度。2. 复本信度 (alternate-form reliability)所谓复本指的是一个测验同时有一个在题目内容、数量、形式、难度、区分度等方面均能与之一致的副本。同一群被试接受这样两个复本测验,计算其相关系数,即得复本信度。3. 分半信度 (split-half reliability)由于这是半个测验的信度,所以还必须加以校正,使之成为可以衡量一个完整的测验信度。一般是使用斯皮尔曼布朗(Spearman-Browm)公式加以校正,这样来估计整个测验的信度:rxx = 2rhh / (
26、1 + rhh)值得注意的是,本公式的前提是两半测验分数必须变异数相等,但是实际情况中常常难以达到这种要求。所以,往往要通过后面两个公式之一直接求得信度。当两半测验的分数变异数不相等时,须用以下公式计算分半信度:其一为弗氏公式(Flannagan formula):rxx = 2 1 - (Sa2 +Sb2) / S2Sa2和Sb2分别表示两半个测验分数的变异量, S2表示整个测验总分的变异量。其二为卢氏公式(Rulon formula):rxx = 1 - (Sd2 / S2)式中Sd2 表示两半个测验原始分数之差的变异量,S2表示整个测验总分的变异量。4. 内部一致性信度(homogene
27、ity reliability)内部一致性信度又称同质性信度,指测验内部所有项目间的一致性程度。一个测验必须首先保证其内部项目是高度一致的,所以内部一致性信度应该比其它稳定性系数与等值性系数要高,它成为这两种信度的理论下限,即如果内部一致性信度低,则其它信度会更低。尤其如克伦巴赫系数,乃指所有项目能用一些潜在因素来解释的方差比例,并不是指多大程度上能测同一种心理特质或因素,所以它不是一种稳定性程度与等值水平。 计算内部一致性信度的公式有四种:(1)KR20库德与理查德逊(G .F. Kuder & M. W. Richardson, 1937)提出KR20号公式:rkr20 = k/ ( k
28、1 ) 1 (pq / S2)式中,k表示整个测验的题数;pq表示整个测验中每题答对答错的比率;S2为测验总分的变异数。(2)KR21KR21适于各测题难度相近的情况,计算简便,但有低估的倾向:rkr21 = k / ( k 1 ) 1 (pq / S2) = kS2 M (k - M) / (k - 1)S2式中,M为测验总分的平均数。以上公式仅适于0、1记分的测验,不适于多重记分的测验。克伦巴赫(L. J. Cronbach)为此提出一种通用的计算公式。在今天,报告信度时一般都会报告克伦巴赫系数。SPSS软件中,计算信度时也会同时计算克伦巴赫系数、Cattman分半信度以及Spearman
29、-Brown校正后信度。(3)克伦巴赫系数克伦巴赫系数的计算公式为:式中,k为测验项目数;Si2为每一项目分数的变异数;S2为测验总分的变异数。(4)霍依特系数霍依特(C. Hoyt,1941)提出一种用方差计算内部一致性信度的方法:rh = 1 (MSerrors / MSindividuals) = 1 (MS人与题 / MS人)霍依特认为,测验分数的总变异可以分解为被试间变异SS人,项目间变异SS题,人与测题交互作用SS人与题三部分,可用被试间变异SS人作为被试方差估计值,用人与测题交互作用的MS人与题 作为误差方差估计值。5. 评分者信度(scorer reliability)评分者信
30、度有以下一些计算方法:(1)相关系数。当只有两个评分者进行评分时,评分者信度的计算可用相关系数的算法。 但是,两个以上评分者评价多个项目的数据,相关分析就不适用了。(2)肯德尔和谐系数。当有两个以上评分者评价多个项目时,常用肯德尔和谐系数估计。其中:式中:Ri是被评项目等级之和;k是评分者人数或评分依据的标准数;N是被评的对象或项目数。(3)一致性系数 还有一些计算一致性的算法也可用来计算信度。例如,有以下三种:一致性系数、同意度、Kappa系数。A. 一致性系数。最简单的一致性系数为:一致性系数= 意见一致的总次数/观察总次数 * 100B. 同意度。同意度r为: 其中:式中,r为信度,N是
31、分析人员人数,X表示相互同意度;M是完全同意数目;n1与n2:第一个与第二个评分员应有的同意数目C. Kappa系数。Kappa系数的计算公式为:观察一致率( P) =(a + d)/ n机遇一致率( Pc) =(a + b) (a + c) / n + (c + d) (b + d) / n / n实际一致率= P - Pc 非机遇一致率= 1 - Pc K = 实际一致率 / 非机遇一致率 (4)概化系数。概化理论可以说是目前最好的信度算法。只是它的计算过程相当复杂。前面介绍的基于经典测量理论的信度的算法难以解决的问题,概化理论都能解决。它可以计算N个评分者在H个阶段评价J个测验项目的信度
32、;能够更加全面地评价信度,并能够进行各种推论,有利于做出修改测验的正确决策。概化理论分为两部分,首先进行概化研究(generalizability study,,G研究),然后再进行决策研究(decision study,D研究)。G研究通过方差分析,将测量目标、测量的各个侧面(facet)的变异及其交互效应全部估计出来。D研究根据G研究估计在所有测量条件下进行测量的总体,即测量的概化全域(universe of generalization),计算出概化系数以及各种可能情况下的概化系数。6. 速度测验的信度7. 差异分数的信度下面是计算差异分数信度的公式:rDD = X的Y分数之间差异的信度
33、rxx = X的信度ryy = Y的信度rxy = X与Y的相关8. 合成分数的信度 以下是合成分数的信度的公式:rss = 合成信度K = 测验数量 = 平均测验信度= 测验之间的平均相关9. 内部一致性信度与内容效度三、 影响信度的因素1. 被试2. 主试3. 测验内容测题的长度与信度的关系表现在以下公式中: K = rkk (1 - rxx) / rxx (1 - rkk) K为测题长度;rkk 为新的预期信度;rxx 为原测验信度。4. 测验情境5. 时间6. 取样四、 信度的应用1. 解释测量误差从理论上说,信度是测验分数总变异减去测量误差变异的变异。根据因素分析的原理,一项测验的总
34、变异S2是由共同变异S2co、特殊变异S2sp和误差变异S2e构成,公式如下:两端除以S2:右边第一项即是效度,即共同变异在总变异中所占的比率,第一项与第二项之和为信度,即共同变异与特殊变异之和在总变异中所占的比率。于是可以写成:所以,信度可以用来估计测量误差。2. 运用区间估计的方式解释测验分数(1) 首先要利用信度来计算测量的标准误,公式如下: 式中,SE为测量标准误;SD为测验分数的标准差;rxx为测验的信度。(2) 进行区间估计: XSE*Z式中,X为测验分数,SE为测量标准误,Z为某个显著水平的标准分数(一般采用95%或99%的显著水平的标准分数)。3. 比较两项测验分数的差异(1)
35、首先计算两个测验差异的标准误。公式如下:式中,SEd为差异的标准误;S为相同尺度的标准分数的标准差;rxx为第一测验的信度;ryy为第二测验的信度。(2)计算临界值。即测量差异的标准误乘以相应的显著水平的标准分数。 复习与思考1. 为什么要检验测验的信度? 2. 试比较5种信度的不同意义? 3. 概化理论在哪些方面超越了经典测验理论的信度理论?4. 为什么要用信度来进行区间估计?5. 在所有影响信度的因素中,你认为哪种因素是最重要的? 推荐阅读Kaplan,R.M. Saccuzzo,D.P. 心理测验. 赵国祥等译. 陕西师大出版社.2005.Kevin R. Murphy & Charle
36、s O. Davidshofer. 心理测验:原理与应用(第6版). 张娜等译. 上海社会科学院出版社. 2006. P288-301安娜斯塔西等心理测验缪小春等译. 浙江教育出版社2001.查尔斯杰克逊了解心理测验过程姚萍译北京大学出版社2000龚耀先修订韦氏成人智力量表手册(内部资料)湖南医科大学1982克罗克,L.,阿尔吉纳,J经典和现代测验理论导论金瑜等译华东师大出版社2004李丹等瑞文联合型(CRT)中国修订版手册华东师大心理系1989.凌文铨,方俐洛. 心理与行为测量. 机械工业出版社. 2004.邱晧政,林碧芳. 结构方程的原理与应用. 中国轻工业出版社. 2009.桑代克;哈根
37、心理与教育的测量与评价叶佩华等译人民教育出版社1987吴明隆. 结构方程模式.-AMOS的操作与应用. 五南图书出版公司. 2008.杨国枢等社会及行为科学研究法东华书局1994杨志明,张雷. 测评的概化理论及其应用. 教育科学出版社. 2003郑日昌心理测量湖南教育出版社1987郑日昌;董奇心理测量人民教育出版社2000第五章 测验的效度 课时:第5周,共4课时教学内容一、效度的意义1. 效度的概念所谓效度,顾名思义就是“有效的程度”。在心理测量学中,效度(validity)是衡量一个测验有效程度的指标,是指一个测验多大程度上能够测量到它所想测量的内容的指标。如果说信度反映的是随机误差,那么
38、,效度则是随机误差与系统误差的综合反映。被试在一个测验上得分的总变异Sx2包括三部分:被试与测验目标有关的变异Sco2,与测验目标无关的变异Ssp2,以及误差变异Se2:Sx2 = Sco2 + Ssp2 + Se2因此,效度即测验分数总变异中的由测验所想测量的内容所造成的变异占的比率:效度 = Sco2 / Sx22. 效度的意义3. 效度的类别二、内容效度(content-related validity)通俗地说,或者从字词的意义上说,内容效度就是从测验的内容方面去检验测验的效度。更为严谨地给内容效度下一个定义,则可以这样表述:内容效度是一个测验实际测到的内容或行为范围与所要测量的内容或
39、行为范围的适当程度的指标。内容效度主要去考察被试过去学得怎么样和做得怎么样。请注意,内容效度对初学者来说是比较费解的。1. 专家评判法与经验法。2. 同质性检。3. 复本相关法。4. 前测后测法。三、建构效度(construct-related validity)建构效度又称结构效度或构念效度,指一个测验能够测量所建构的概念与理论的程度。1. 聚合效度(convergent validity),又称相容效度。将测验与同类的测验进行比较,如果与同类测验显著相关,那就是能够聚合、相容,就可以说该测验与同类测验一样有效(前提是拿来比较的测验是有效的)。这种效度就是聚合效度。2. 区分效度(diver
40、gent validity),将测验与其它的不同的测验进行比较,如果不相关,则表明该测验与其它不同类的测验真的是不同的,二者是可以区分开来的。这就是区分效度。3. 因素效度。4. 多特质多方法矩阵(multitrait - multimethod matrix)。四、效标效度(criterion-related validity)同时效度(concurrent validity) 预测效度(predictive validity) 在实际应用中,研究者又提出另外两种效标效度:合成效度与区分效度。合成效度(synthetic validity)区分效度(differential validity
41、)。效标效度的求法 怎样计算效标效度呢?可以总结出以下4种效标效度的求法: 1. 相关法。最多见的是相关分析的算法。一般是求取测验分数与效标的相关系数。 2. 区分法。根据效标测量将被试分为不同的组别,如根据工作成绩将被试分为优秀组与落后组,然后比较两组的差异,看能否以测验成绩将两组区分开来。 3. 命中率。在用测验作选拔决策时,可用正命中率与总命中率作效度指标。正命中率主要关心被选者中合格的有多少,不关心被淘汰的有多少,其计算公式为:Pcp = 合格人数 选择人数总命中率则考虑合格人数与淘汰人数与总人数之比。其计算公式为:Pcp = 命中人数 命中人数 + 失误人数4. 合成法。分别求出测验
42、分数与各效标项目之间的相关系数,再按权重计算,得出合成效度。五、效度的新框架麦斯克(Messick,1989;1995)和卡尼(Kane,1992)等人认为三种效度实际上是一个概念,即验证测验的有效性。这一新的“结构效度”概念包括以下成份:内容 结构效度当然有其内容。内容包括三点:其一,项目是否恰当地代表了这个范畴,是否很好地测量评估了这个范畴;其二,总的看来,测验多大程度上评估了特定的范畴;其三,范畴多大程度是有代表性、有意义的。实质 结构效度的实质指从不同方面获得测验项目是否切题的信息。通过被试答题过程的观察分析以及项目分析等方法获得实证证据。结构 结构效度的结构包括被试的任务、范畴以及评
43、分标准之间的逻辑关联。概化 测验解释能够推广到什么范围与程度,因为测验解释不可能适用于所有团体、情境与任务。外化 一个测验与外在资料的关系的证据。如与其它相同或不同的测验,与外在的效标的关系。推论 测验分数所作的推论,涉及公平、文化背景、社会意义等。六、交叉效度(cross-validity)七、效度的情景性与概化八、效度的校正假设效标没有误差,则如下式:九、影响效度的因素1. 测验。题目的长度如前所述会影响测验的信度,通过影响信度,再影响效度。测验的长度与效度的关系表现为:N = 1 - rxx / (rxy2 / r(nx)y) - rxx式中,N为测验的长度;rxx为原测验的信度;rxy
44、为原测验的效度;r(nx)y为新测验的效度。2. 测验实施过程。3. 效标。4. 样本。十、效度的应用 1. 估计测量误差 2.预测效标分数预测效标分数的公式如下:Y=a+byxX其中,Y为预测的效标分数;a为截距; byx为斜率;X为测验分数。a=Y-byxXbyx=rxySy/Sx 其中,Y和X分别为效标分数和测验分数的平均数,Sy和Sx分别为效标分数和测验分数的标准差,rxy为效标分数与测验分数的相关(即效标效度)。3.临界分数 4.预测表 5. 测验效用的计算 (1)选拔成功率 (2)效度与生产率 (3)人员选拔的效用公式 十一、信度与效度的关系 1. 信度是效度的必要但非充分条件2.
45、 效度受信度的制约测验效标效度的高低,与测验及其效标的信度有关,如果测验与效标的信度都低。则会低估了真正的效度,使效度系数偏低。所以要用以下公式校正:式中:rc为校正的效度系数,rxy为测验的效度系数,rxx为测验的信度,ryy为效标的信度。rc的最大值为1,上式化为: 又由于效标的信度未知,其最大值为1,则: 复习与思考1. 心理测验为什么要报告效度? 2. 内容效度与表面效度有什么不同? 3. 试比较建构效度与效标效度?4. 为什么说交叉效度很重要?5. 效度估计测量误差与信度有什么不同?6. 校正效度有什么意义? 推荐阅读Kaplan,R.M. Saccuzzo,D.P. 心理测验. 赵
46、国祥等译. 西安:陕西师大出版社,2005.Kevin R. Murphy & Charles O. Davidshofer. 心理测验:原理与应用(第6版). 张娜等译. 上海:上海社会科学院出版社,2006.安娜斯塔西等心理测验缪小春等译. 杭州:浙江教育出版社,2001.查尔斯.杰克逊了解心理测验过程姚萍译北京:北京大学出版社,2000查尔斯杰克逊了解心理测验过程姚萍译北京:北京大学出版社,2000龚耀先修订韦氏成人智力量表手册(内部资料)湖南医科大学,1982库珀,多米尼克;罗伯逊,伊凡. 组织人员选聘心理. 蓝天星翻译公司译. 北京:清华大学出版社,2002.罗伯特G迈耶等. 变态心
47、理学.丁煌等译.沈阳:辽宁人民出版社,1988. 桑代克;哈根心理与教育的测量与评价叶佩华等译北京:人民教育出版社,1987第六章 常模参照测验与领域参照测验 课时:第8周,共3课时教学内容一、常模的概念与意义1. 常模的概念常模的概念 常模(Norm)即“常态模型”,指用来确定原始分数意义的,能够反映总体一般、常态、正常水平的参照标准。领域的概念 与常模对应的同样重要的概念是“领域”(或“内容”)。2. 常模的代表性与时限(1)一般性常模与特殊性常模 (2)常模的时限 (3)常模的意义 二、发展性常模1.智力年龄(mental age) 比率智商的公式是:比率智商(IQ)=智力年龄实足年龄1
48、002.年级当量(grade equivalents) 3.顺序量表(ordinal scales) 三、团体性常模1. 百分位(percentiles)百分位的计算有两种,一种是未分组的数据的计算方法,另一种是分组的数据的计算方法:(1)未分组的数据的计算对未分组的数据,先将群体的全部原始分数从小到大排序,然后以下式计算:PR = 100 (100R - 50) / N 式中:PR为百分位;R为排名顺序的序号;N为被试总人数。 (2)分组的数据的计算:有的时候,需要将被试的测验分数分成不同的组别来进行计算。于是,分组数据的百分位的计算公式为:PR = 100N(X - L) fi+Fb 式中
49、:PR为百分位;X为被试原始分数;L为X所在组的下限;f为X所在组的次数;i为组距;Fb 为X所在组以下各组次数之和;N为被试总人数。2. 标准分数(standard score)Z =X MS式中:Z为标准分数;X为原始分数;M为团体平均数;S为团体标准差。T分数T = 50 + 10Z 离差智商计算公式为:IQ = 100 + 15Z标准九标准九的计算公式如下:N9 = 5 + 2Z(4) 标准十 标准十就是将分数系统转换为10的分数系统。标准九的计算公式如下:N10 = 5 + 1.5Z(5) 标准二十 N20 = 10 + 3Z四、领域参照测验1. 领域参照测验的特征2. 领域参照测验
50、与常模参照测验的关系 复习与思考1. 怎样区别常模参照与领域参照? 2. 你怎样理解常模的意义? 3. 发展性常模与团体性常模有什么不同?4. 为什么要使用常模转换分数?5. 比较比率智商与离差智商的优点与局限?6. 百分位的局限是什么?7. T分适合于什么样的测验?8. 韦克斯勒智力测验为什么要两次使用常模转换分数,一次是使用标准20,另一次是使用离差智商? 推荐阅读郑日昌心理测量长沙:湖南教育出版社,1987郑日昌;董奇心理测量北京:人民教育出版社,2000桑代克;哈根心理与教育的测量与评价叶佩华等译北京:人民教育出版社,1987安娜斯塔西等心理测验缪小春等译. 杭州:浙江教育出版社,20
51、01.Kaplan,R.M. Saccuzzo,D.P. 心理测验. 赵国祥等译. 西安:陕西师大出版社,2005.查尔斯.杰克逊了解心理测验过程姚萍译北京:北京大学出版社,2000Kevin R. Murphy & Charles O. Davidshofer. 心理测验:原理与应用(第6版). 张娜等译. 上海:上海社会科学院出版社,2006.克罗克,L.,阿尔吉纳,J. 经典和现代测量理论导论.金瑜等译.华东师大出版社.2004.第7章 项目分析 课时:第9周,共3课时教学内容 一、难度1. 通过率 难度的计算分为二分记分与非二分项目两大类。(1)二分记分项目的难度的计算A. 通过率最基
52、本的公式。所谓二分记分的项目就是只有答对与答错两种答案的项目。通过率的计算公式如下:P = R / N式中P为项目难度;R为答对的人数;N为全部被试人数。B. 通过度的分组计算公式。被试人数较多时,可以将被试按照测验总分从高到低排列,总分最高的27的被试分为高分组(NH),总分最低的27的被试分为低分组(NL),计算二组的通过率,按下式求得其难度:P = (PH + PL) / 2C. 防猜测的通过率公式。CP = (KP 1) /( K 1)式中,CP为校正后的难度;K为备选答案的数目。D. 最佳难度公式。另有一种计算最佳难度的公式:P = cs + (1 - cs) / 2式中,cs为机遇
53、分数。(2)非二分记分项目的难度的计算 如果测验题目不是对与错(0,1记分)的答案,而是从1分到4分、5分、7分的答案,就不能用上面的公式计算通过率了。下面是适合非二分记分项目的难度的计算公式:P = M /Xmax上式中M为被试在项目上的平均分;Xmax为该项目的满分。(3)不同项目难度的比较有的时候需要比较不同项目的难度。不同项目之间难度的比较应当将难度转换为标准分数,这样才能进行比较。但是,由于标准分数有时会出现小数点和负值,所以美国教育测验服务中心建议用下面的公式消除小数点和负值:难度 = 13 + 4Z2. 间距量表 通过率是一种顺序量表的表达法,可以告诉我们不同的项目的相对难度。但
54、不能推论项目间真正的差异。例如,项目1、2、3的通过率分别为80、50和20,我们只能说项目3最难,项目1最易,但不能说项目1与项目2的差异等于项目2与项目3的差异。如果项目所测量的因素呈现正态分布,则可以将通过率转换为标准分数,将难度转换成按单位相等的间距量表。如此可对不同项目的难度进行比较。二、区分度(或鉴别力) 区分度的计算有以下几种:1. 适合于二分记分的鉴别力指数D = PH PL2. 其它算法对非二分记分的测验项目,必须使用其它的算法。一般多采用相关分析的方法,以项目分数与测验总分或效标分数的相关作为鉴别力的指标。除了用皮尔逊积差相关分析的算法,还可以根据数据的特点,使用其它类型的
55、相关分析算法,例如,用点二列相关计算测验项目0、1记分,效标或测验总分是连续变量的数据:rpb = (Mp Mq) / SDpq式中,rpb为点二列相关系数;MP、Mq分别为通过与未通过该项目的被试的平均效标分数或总分平均分数;SD为全体被试效标或总分的标准差;p、q分别为通过和未通过该项目的被试人数比率。如果测验项目分数是连续变量,效标或总分是二分变量,可用二列相关计算。如果测验项目分数与效标或总分都是二分变量,可用相关计算。3. 难度与区分度的关系三、其它指数社会期望水平项目特征曲线复习与思考1. 为什么要进行项目分析? 2. 在怎样的测验中要检验难度? 3. 为什么要检验区分度?怎样根据
56、区分度来筛选项目?4. 难度与区分度的关系是怎样的?5. 除了难度与区分度,还考虑那些指标来进行项目分析? 推荐阅读郑日昌心理测量长沙:湖南教育出版社,1987郑日昌;董奇心理测量北京:人民教育出版社,2000查尔斯杰克逊了解心理测验过程姚萍译北京:北京大学出版社,2000安娜斯塔西等心理测验缪小春等译. 杭州:浙江教育出版社,2001.Kaplan,R.M. Saccuzzo,D.P. 心理测验. 赵国祥等译. 西安:陕西师大出版社,2005.第八章 测验的编制、使用与解释 课时:第10周,共3课时教学内容一、测验的编制 第一阶段:编制测验1. 明确测验的目的,论证测验的意义2. 建构测量的
57、概念与理论,以及行为样本(1)理论的(自上而下的)策略与路线。(2)经验的(自下而上的)策略与路线。(3)混合的策略与路线。3. 规划双向细目表4. 编题:原则与技术5. 预试和项目分析第二阶段:测验的标准化6. 建立常模7. 编写测验说明书8. 测验的发行与销售第三阶段:测验的修订9. 修订二、测验的使用与解释1. 测验的控制使用(1)保密的原则 (2)主试的资格 (3)伦理与法律 2. 施测与解释(1)测验前的准备。 (2)指导语的标准化。(3)测验情境的控制。 (4)处理与被试的关系。(5)解释和报告测验结果。 A. 深入理解测验。B. 将分数以区间估计形式解释。C. 让被试理解报告,并
58、且知道如何运用测验的结果。D. 保护隐私。E. 防止“标定效应”。 复习与思考1. 一般的心理测验是怎样编制的?标准化的心理测验又是怎样编制的? 2. 标准化的心理测验要求怎样的标准化? 3. 怎样才是合格的主试?4. 怎样控制使用心理测验?5. 在测验的施测过程中应该注意哪些要点?6. 应该怎样解释测验的结果? 推荐阅读查尔斯杰克逊了解心理测验过程姚萍译北京:北京大学出版社,2000安娜斯塔西等心理测验缪小春等译. 杭州:浙江教育出版社,2001.Kaplan,R.M.& Saccuzzo,D.P. 心理测验. 赵国祥等译. 西安:陕西师大出版社,2005.杨国枢等社会及行为科学研究法台湾:
59、东华书局,1994Kevin R. Murphy & Charles O. Davidshofer. 心理测验:原理与应用(第6版). 张娜等译. 上海:上海社会科学院出版社,2006.第九章 问卷测验 课时:第10周,共5课时教学内容 1. 问卷测验技术的内核 2. 系统歪曲假设诸说:对问卷测验的批评 3. 人格问卷测验技术艾森克人格问卷(EPQ)明尼苏达多相人格问卷(MMPI)16人格因素问卷(16PF)加利福尼亚心理调查表 (California Psychological Inventory,CPI)大五人格测验(NEO-PI, Costa & McCrae, 1992)自我监控测验I
60、E量表(Internal-External locus of control scale )(Rotter 1966) 4. 临床问卷测验BDISTAIUCLASCL90(Symptom Checklist 90) 5. 兴趣、态度问卷测验爱德华个人偏好测验(Ewards Personal Prefrenve Schedwe,EPPS)霍兰德职业兴趣测验思考题: 问卷测验的优点与局限是什么?你对做过的几个问卷测验的体验是什么? 第10章 投射测验 课时:第13周,共4课时教学内容1. 投射技术的“罗曼史”2. 罗夏墨迹测验罗夏墨迹测验的发展 在罗夏以后,罗夏墨迹测验评分与解释系统经历了从Bec
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度新能源汽车制造与合作合同
- 2024年度公共交通车辆电梯设备采购合同
- 2024年度品牌加盟品牌使用权合同
- 2024年度中秋月饼采购合同格式
- 运货车市场需求与消费特点分析
- 竹笛市场环境与对策分析
- 2024年度环保监测系统建设与维护合同
- 2024年度版权许可合同授权范围界定
- 2024年度某机场航站楼改扩建工程施工合同
- 2024年度智能语音助手定制开发与授权合同
- 高职劳动教育方案(2篇)
- 2024石灰石粉混凝土
- 《无机化学》课件-分子间作用力
- 北京科技大学第二批非教学科研岗位招考聘用公开引进高层次人才和急需紧缺人才笔试参考题库(共500题)答案详解版
- 非连续性文本阅读之客观题3大陷阱-备战2024年中考语文考试易错题原卷版及解析版(原卷版+解析版)
- MOOC 心理学与生活-华东师范大学 中国大学慕课答案
- SYT 6769.1-2010 非金属管道设计、施工及验收规范 第1部分:高压玻璃纤维管线管
- 安全教育年度计划养老院
- 中国文化概论(中英文字幕)智慧树知到期末考试答案章节答案2024年华侨大学
- 2024年职业病宣传周知识竞赛考试题库350题(含答案)
- 房地产经纪指南:业务流程介绍
评论
0/150
提交评论