心理测量学知识-新教材-2014年秋_第1页
心理测量学知识-新教材-2014年秋_第2页
心理测量学知识-新教材-2014年秋_第3页
心理测量学知识-新教材-2014年秋_第4页
心理测量学知识-新教材-2014年秋_第5页
已阅读5页,还剩91页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、心理测量学知识心理测量学知识常态(正态)分布常态(正态)分布方差、标准差、标准误、抽样误差、随机误差方差、标准差、标准误、抽样误差、随机误差 语文语文 数学数学N1 78 75N1 78 75N2 N2 80 8980 89N3 60 65N3 60 65N4 98 90N4 98 90N5 88 95N5 88 95N6 46 55N6 46 55N7 100 90N7 100 90N8 70 65N8 70 65N9 96 88N9 96 88N10 68 70N10 68 70平均平均 85 80 85 80 附:方差的定义 方差等于差方的平均数 附:标准差的定义 标准差标准差( (亦称

2、单数标准差亦称单数标准差) 一般用一般用ss 表示表示, ,是表示个体间变异大小的是表示个体间变异大小的指标指标, ,反映了整个样本对样本平均数的反映了整个样本对样本平均数的离散程度离散程度, ,是数据精密度的衡量指标是数据精密度的衡量指标; ;而而标准误标准误一般用一般用sxsx 表示表示, ,反映样本平均数对总体平均数的变异程度反映样本平均数对总体平均数的变异程度, ,从从而反映而反映抽样误差抽样误差的大小的大小, ,是量度结果精密度的指标。是量度结果精密度的指标。 随着样本数随着样本数( (或测量次数或测量次数) n) n 的增大的增大, 标准差标准差趋向某个稳定值趋向某个稳定值, ,即

3、样本即样本标准差标准差ss 越接近总体标准差越接近总体标准差,而而标准误标准误则随着样本数则随着样本数( (或测量次数或测量次数) n) n 的的增大逐渐减小增大逐渐减小, ,即样本平均数越接近总体平均数即样本平均数越接近总体平均数;故在实验中也经常采用故在实验中也经常采用适当增加样本数适当增加样本数( (或测量次数或测量次数) n) n 减小减小sxsx 的方法来减小实验误差的方法来减小实验误差, ,但样但样本数太大意义也不大。本数太大意义也不大。 标准差是最常用的统计量标准差是最常用的统计量, 一般用于表示一组样本变量的分散程度一般用于表示一组样本变量的分散程度; ;标准误一般用于统计推断

4、中标准误一般用于统计推断中, ,主要包括假设检验和参数估计主要包括假设检验和参数估计, ,如样本平均数如样本平均数的假设检验、参数的区间估计与点估计等。的假设检验、参数的区间估计与点估计等。第一节第一节 概概 述述第一单元:第一单元: 测量与测量量表测量与测量量表一、一、 什么是测量什么是测量 以以一定的一定的法则法则用用数字数字对对事物事物加以确定。加以确定。二、二、 测量要素测量要素1.1.参照点:参照点:要确定事物的量,必须有的一个计算的起点。要确定事物的量,必须有的一个计算的起点。 绝对零点(轻重、长度)绝对零点(轻重、长度) 相对零点(摄氏温度、智力)相对零点(摄氏温度、智力)2.2

5、.单位单位 好的单位有两个条件:好的单位有两个条件: 确定的意义确定的意义(所有人有相同理解)(所有人有相同理解) 相同的价值相同的价值(相邻两个单位之间的差值相等)(相邻两个单位之间的差值相等)三、三、 测量量表测量量表 根据某一法则在一个定有单位和参照点的连续体上把事物的属性表现出来,根据某一法则在一个定有单位和参照点的连续体上把事物的属性表现出来,这个连续体称为量表这个连续体称为量表1.1.命名量表命名量表 用数字来标记用数字来标记- -代号和分类(代号和分类(1 1代表男、代表男、2 2代表女)(不能做数量化分析)代表女)(不能做数量化分析)2.2.顺序量表顺序量表 用数字排顺序(名次

6、、等级)(无相等单位、绝对零点;只反映大小程度,用数字排顺序(名次、等级)(无相等单位、绝对零点;只反映大小程度,不表示真正量和绝对值不表示真正量和绝对值如测验条目如测验条目) )心理测验一般是顺序量表心理测验一般是顺序量表, ,但可换但可换算为等距量表。算为等距量表。3.3.等距量表等距量表 用数字表示大小(用数字表示大小(c c温度)(有相等单位,可相互加减;无绝对零点,不温度)(有相等单位,可相互加减;无绝对零点,不能互相乘除;但可用常数与之加减乘除)能互相乘除;但可用常数与之加减乘除)4.4.等比量表等比量表 (长度、重量、时间)(有相等单位、绝对零点;可相互加减乘除)(长度、重量、时

7、间)(有相等单位、绝对零点;可相互加减乘除)第二单元:第二单元: 心理测量的基本概念心理测量的基本概念一、一、 心理测量的定义心理测量的定义 心理学理论心理学理论一定操作程序一定操作程序观察少数有代表性的行观察少数有代表性的行为为对某心理特点做出推论和数量化分析对某心理特点做出推论和数量化分析该定义的含义:该定义的含义:1.1.心理测量的对象是人的行为,只是测量了对测验题目的反应心理测量的对象是人的行为,只是测量了对测验题目的反应2.2.通过少数行为样本来推测某心理特征通过少数行为样本来推测某心理特征3.3.测量条件对所有被试都相同测量条件对所有被试都相同4.4.测验中得到的原始分数没有任何意

8、义,需要与常模进行比较测验中得到的原始分数没有任何意义,需要与常模进行比较二、二、 心理测量的性质心理测量的性质1.1.间接性间接性 只是通过对测验项目的反应来推论此人的心理特质只是通过对测验项目的反应来推论此人的心理特质 特质:个人对刺激作反应的一种内在倾向(如乐群特质:个人对刺激作反应的一种内在倾向(如乐群性)性)2.2.相对性相对性有一个连续的行为序列,看被测者处在这有一个连续的行为序列,看被测者处在这个序列的什么位置上个序列的什么位置上3.3.客观性客观性标准化(标准化(3 3个方面:施测、评分、分数的转个方面:施测、评分、分数的转换和解释以及结果的推论)换和解释以及结果的推论)第三单

9、元:第三单元: 心理测验的分类心理测验的分类一、按测验目的和功能分类一、按测验目的和功能分类1.1.智力测验:(包括发展量表)智力测验:(包括发展量表)2.2.特殊能力测验:音乐、绘画、体育、机械特殊能力测验:音乐、绘画、体育、机械3.3.人格测验:如明尼苏达多相人格测验(人格测验:如明尼苏达多相人格测验(MMPI)MMPI),艾森克人格测验和卡特尔十六种个性因素测验艾森克人格测验和卡特尔十六种个性因素测验(16PF)(16PF)等。等。二、按测验材料的性质分类二、按测验材料的性质分类 1.1.文字测验:文字材料文字测验:文字材料 2.2.操作测验(非文字测验):操作测验(非文字测验):三、按

10、测验材料的严谨程度分类三、按测验材料的严谨程度分类 1.1.客观测验:刺激意义明确,只需直接理解,客观测验:刺激意义明确,只需直接理解,不需想象不需想象 2.2.投射测验投射测验:刺激没有明确意义,需要想象:刺激没有明确意义,需要想象第四单元:第四单元: 纠正错误的测验观纠正错误的测验观一、一、 错误的测验观错误的测验观 测验万能论测验万能论 测验无用论(有其理由测验无用论(有其理由侵犯个人隐私、宿命论侵犯个人隐私、宿命论/ /种族歧视)种族歧视) 心理测验就是智力测验心理测验就是智力测验二、二、 正确的测验观正确的测验观1.1.重要的心理学研究方法之一和决策辅助工具重要的心理学研究方法之一和

11、决策辅助工具 2.2.作为研究方法和决策工具尚不完善:理论基础不够坚实作为研究方法和决策工具尚不完善:理论基础不够坚实 第五单元第五单元 心理测验在心理咨询中的应用心理测验在心理咨询中的应用一、一、 智力测验智力测验 比内量表;韦氏成人、儿童、幼儿量表;瑞文测验比内量表;韦氏成人、儿童、幼儿量表;瑞文测验二、二、 人格测验人格测验 EPQEPQ;16pf16pf;MMPIMMPI三、三、 心理评定量表心理评定量表 包括评定精神疾病症状如精神病评定量表、躁狂状态量表。包括评定精神疾病症状如精神病评定量表、躁狂状态量表。 评定有关心身症状,如评定有关心身症状,如9090项症状量表项症状量表(SCL

12、-90)(SCL-90)、焦虑自评、焦虑自评量表量表(SAS)(SAS)、抑郁自评量表(、抑郁自评量表(SDSSDS) 以及应激测量如近年来发展起来的应激有关量表如生活事以及应激测量如近年来发展起来的应激有关量表如生活事件量表、社会支持量表、应对量表等件量表、社会支持量表、应对量表等第六单元第六单元 心理测量的发展史心理测量的发展史一、一、 科学心理测验的产生与发展科学心理测验的产生与发展 高尔顿高尔顿(Golton)(Golton)1919世纪世纪8080提出测量心理差异的方法提出测量心理差异的方法 卡特尔卡特尔(Cattel(Cattel) )1919世纪世纪9090提出测验统一方法并和常

13、模比较提出测验统一方法并和常模比较 比内比内- -西蒙西蒙19051905发表第一个正式心理测验(智力)发表第一个正式心理测验(智力)(一)操作测验发展(一)操作测验发展(二)团体智力测验发展:一战时美国陆军甲种和乙种智力测验(二)团体智力测验发展:一战时美国陆军甲种和乙种智力测验(三)能力倾向测验发展:(三)能力倾向测验发展: 韦克斯勒韦克斯勒二十世纪二十世纪3030年代,智力测验年代,智力测验(四)人格测验发展:(四)人格测验发展: 19201920罗夏测验罗夏测验 19401940以后以后几种重要的人格测验(几种重要的人格测验(MMPIMMPI、16pf16pf、EPQEPQ)第二节 测

14、验的常模 第一单元第一单元 常模团体常模团体一一、 常模团体的性质常模团体的性质 由共同特征的人(或者其代表)所组成的群体,由共同特征的人(或者其代表)所组成的群体,用一个标准的分数表示,作为比较的基础。(如用一个标准的分数表示,作为比较的基础。(如SCL90SCL90常模中的男性大学生)常模中的男性大学生)在制定在制定常模时,首先要确定常模团体;在对常模参常模时,首先要确定常模团体;在对常模参考分数作解释时,也必须考虑常模团体的组成。考分数作解释时,也必须考虑常模团体的组成。常模团体的选择一般包括:确定一般总体、确定目常模团体的选择一般包括:确定一般总体、确定目标总体、确定样本标总体、确定样

15、本三、三、 取样的方法取样的方法 取样就是从目标人群中选择有代表性的样本。取样就是从目标人群中选择有代表性的样本。1.1.简单随机取样简单随机取样 (按随机顺序表)(按随机顺序表)2.2.系统抽样:目标总体无序可排,无等级结构系统抽样:目标总体无序可排,无等级结构 (总体数目(总体数目N N,取样,取样n n人,则分人,则分n n段,每段取段,每段取1 1,组距,组距K=N/nK=N/n)3.3.分组分组抽样抽样 (先将群体分组如华东区,再在组内随机)(先将群体分组如华东区,再在组内随机)4.4.分层分层抽样:最常用,增加了样本的代表性,在解释测验分数时更抽样:最常用,增加了样本的代表性,在解

16、释测验分数时更为有效。为有效。分层比例抽样和分层比例抽样和分层非比例抽样分层非比例抽样 (目标总体先按某变量分层如各年龄段,再在各层随机抽取)(目标总体先按某变量分层如各年龄段,再在各层随机抽取)四、常模与常模分数四、常模与常模分数1.1.常模:供比较的标准量数,根据标准化样本测试结果得出,常模:供比较的标准量数,根据标准化样本测试结果得出,用于比较和解释测验结果的参照分数标准。用于比较和解释测验结果的参照分数标准。 常模常模常模分数构成的分布常模分数构成的分布 按照样本的大小和来源:全国常模、区域常模和特殊常模按照样本的大小和来源:全国常模、区域常模和特殊常模(更小的非典型团体,使被试的结果

17、与最接近的人进行比(更小的非典型团体,使被试的结果与最接近的人进行比较)较) 按照应用标准和分数特征:标准分常模、百分位常模按照应用标准和分数特征:标准分常模、百分位常模2.2.常模分数:导出分数常模分数:导出分数 原始分原始分转换转换导出分数(如导出分数(如SCL90SCL90的的T T分,有了参照点)分,有了参照点) 导出分数的特点:有意义的测验量表、与原始分等值、具有导出分数的特点:有意义的测验量表、与原始分等值、具有相等单位、具有参照点相等单位、具有参照点 第二单元:第二单元:常模的类型常模的类型 一、一、 发展常模(发展常模(亦称年龄量表)亦称年龄量表)根据人群的平均表现所编制的量表

18、就是发展常模。根据人群的平均表现所编制的量表就是发展常模。 年龄量表的基本要素:年龄量表的基本要素:(1 1)一套能区分不同年龄组的题目)一套能区分不同年龄组的题目(2 2)一个由各个年龄的被试组成的代表性常模团体)一个由各个年龄的被试组成的代表性常模团体(3 3)一个表明答对哪些题或得多少分该归入哪个年龄的对)一个表明答对哪些题或得多少分该归入哪个年龄的对照表(常模表)照表(常模表)二、二、 百分位常模百分位常模1. 1. 百分等级百分等级 一个测验分数在常模样本中低于这个分数的人数百分比一个测验分数在常模样本中低于这个分数的人数百分比2. 2. 百分点百分点 ( (百分位数百分位数) )

19、与上述相反,计算处于某百分比的点,对应的测验分数与上述相反,计算处于某百分比的点,对应的测验分数是多少是多少3. 3. 四分位数、十分位数四分位数、十分位数 百分位数的变式(百分位是将量表分成百分位数的变式(百分位是将量表分成100100份)份) 四分位是分为四分位是分为4 4份,中间分别为份,中间分别为25%25%、50%50%、75%75% 十分位是分为十分位是分为1010份,第一段是份,第一段是1%-10%1%-10%,最后一段是,最后一段是91%-91%-100%100%。三、三、 标准分常模标准分常模线性转换:当原始分数是常态分布时线性转换:当原始分数是常态分布时是将原始分与平均数的

20、距离,以标准差为单位表示出来的量表是将原始分与平均数的距离,以标准差为单位表示出来的量表 (见见373373页正态分布图页正态分布图) Z Z分是最基本的标准分分是最基本的标准分 分分50+1050+10(Z Z)()(T T分广泛使用,人格测验中常用)分广泛使用,人格测验中常用) 标准标准20=10+320=10+3(Z Z) (如韦氏量表中各分测验成绩)(如韦氏量表中各分测验成绩) 标准标准10=5.5+1.510=5.5+1.5(Z Z) 标准标准9=5+29=5+2(Z Z) 非线性转换:当原始分数不是常态分布时,通过非线性的常态化过程,往非线性转换:当原始分数不是常态分布时,通过非线

21、性的常态化过程,往往通过转化成百分等级,获得平均数、标准差,再计算标准分。往通过转化成百分等级,获得平均数、标准差,再计算标准分。四、四、 智商及其意义智商及其意义 比率智商比率智商IQ=100IQ=100* *MAMA(心理年龄)(心理年龄)/CA/CA(实际年龄)(实际年龄) 离差智商离差智商IQIQ100+15100+15(Z Z) (韦氏智力量表)(韦氏智力量表) 离差智商的优点:统计学基础、反映年龄组中的位置、离差智商的优点:统计学基础、反映年龄组中的位置、 理想指标理想指标 不同测验获得的离差智商,只有当标准差相同才可比较不同测验获得的离差智商,只有当标准差相同才可比较 (p p3

22、72372:表:表5-15-1) 专栏专栏5-25-2: 几种导出分数的关系几种导出分数的关系n (p367-368:图示)图示)第三单元第三单元 常模分数的表示方法常模分数的表示方法一、一、 转换表法转换表法 (常模表)(常模表) 原始分通过转换表获得导出分数原始分通过转换表获得导出分数 p369 p369 表表5-25-2二、二、 剖面图法剖面图法 可以直观地看出被试在各个分测验上的表现可以直观地看出被试在各个分测验上的表现 p369 p369 图图5-15-1 第三节 测验的信度 第一单元第一单元 信度的概念信度的概念一、一、 信度的定义信度的定义 信度(信度(reliabilityre

23、liability)又称可靠性,是指重复测验的一致性,也)又称可靠性,是指重复测验的一致性,也就是指测验的稳定度。就是指测验的稳定度。信度只受随机误差的影响信度只受随机误差的影响, ,随机误差越大随机误差越大, ,信度越低。信度越低。二、二、 信度的指标信度的指标1.1.信度系数与信度指数信度系数与信度指数 信度以信度系数为指标,常常是两组资料的相关系数信度以信度系数为指标,常常是两组资料的相关系数 理论上:信度系数理论上:信度系数 = = 信度指数的平方信度指数的平方 2.2.测量标准误测量标准误 评估个人测验分数时的变异量,信度越高,标准误越低评估个人测验分数时的变异量,信度越高,标准误越

24、低 公式公式5-5 5-5 p371p371 某测量的标准误某测量的标准误SE = SE = 某测验的标准差某测验的标准差S S * * 1-1-信度系数信度系数r r 信度越高,标准误越小;信度越低,标准误越大。信度越高,标准误越小;信度越低,标准误越大。第二单元:二单元: 信度评估的方法信度评估的方法每一种信度系数只能说明信度的不同方面,因而具有不同每一种信度系数只能说明信度的不同方面,因而具有不同的意义。的意义。一、一、 重测信度重测信度测验跨时间的稳定性测验跨时间的稳定性 稳定性系数。两次测验间(稳定性系数。两次测验间(2-42-4周,不超过周,不超过6 6个月)的个月)的相关系数相关

25、系数二、二、 复本信度复本信度测验在内容上的等值性测验在内容上的等值性 等值性系数。等值但题目不同的两个测验在同一群体等值性系数。等值但题目不同的两个测验在同一群体测验后的相关系数(同时做)测验后的相关系数(同时做)特例:特例:重测复本信度(稳定重测复本信度(稳定与等值系数)(间隔一段时间后做)与等值系数)(间隔一段时间后做)第三单元:第三单元: 信度与测验分数的解释信度与测验分数的解释一、一、 解释真实分数与实得分数的相关解释真实分数与实得分数的相关 信度能解释总的方差中有多少比例是由真实分数的方信度能解释总的方差中有多少比例是由真实分数的方差决定的差决定的 即有多少(即有多少(1-1-r

26、r)是来自测验的误差)是来自测验的误差二、二、 确定信度可以接受的水平确定信度可以接受的水平 能力测验能力测验0.900.90以上以上 人格测验人格测验0.80-0.850.80-0.85以上以上 一般原则:一般原则:r0.70,r0.70,测验不可靠不能用测验不可靠不能用; 0.70; 0.70r0.85,r0.85,可用于团体比较可用于团体比较;r0.85,;r0.85,用于个人鉴别或预测用于个人鉴别或预测 表表5-35-3 p374p374三、三、 解释个人分数的意义解释个人分数的意义 某测量的标准误某测量的标准误SE = SE = 某测验的标准差某测验的标准差S S * * 1- 1-

27、信度系数信度系数r r 一个被试得分的可能范围(一个被试得分的可能范围(95%95%的置信区间)的置信区间) = = 实得分实得分1.961.96* *某某组测验的标准误组测验的标准误SESE P375 P375 例题例题四、比较不同测验分数的差异四、比较不同测验分数的差异 两个分数的标准误两个分数的标准误SEdSEd = = 两个测验的标准差两个测验的标准差S S * * 2- r1- r2 2- r1- r2 例子例子 p375p375第四单元:第四单元: 影响信度的因素影响信度的因素一、一、 样本特征样本特征样本团体的异质性:如全部由高智力者构成,则信度系数低。样本团体的异质性:如全部由

28、高智力者构成,则信度系数低。样本团体的平均能力水平:例如全由年幼者构成,则样本团体的平均能力水平:例如全由年幼者构成,则 r r 低,猜测成分低,猜测成分二、二、 测验长度测验长度 同质题目越多,同质题目越多, (代表性越好(代表性越好/ /猜测因素影响减少)信度越高。猜测因素影响减少)信度越高。三、三、 测验难度测验难度 测验对某个团体太难或太易,分数范围缩小,均降低信度测验对某个团体太难或太易,分数范围缩小,均降低信度四、时间间隔四、时间间隔 重测信度和重测复本信度会受时间间隔影响,时间间隔越短,重测信度和重测复本信度会受时间间隔影响,时间间隔越短,信度越高信度越高第四节 测验的效度 第一

29、单元:第一单元: 效度的概念效度的概念一、一、 效度的定义效度的定义效度(效度(validityvalidity)即准确性,这是指测验实际上测量些什么,是否符)即准确性,这是指测验实际上测量些什么,是否符合测验的目的。合测验的目的。所测量的与所要测量的心理特点之间的符合程度。所测量的与所要测量的心理特点之间的符合程度。信度是效度的必要条件:信度是效度的必要条件:效度高,信度一定高,而信度高,效度却不效度高,信度一定高,而信度高,效度却不一定高。一定高。二、二、 效度的性质效度的性质1.1.相对性相对性 不可能全部包容了被测目标。不可能全部包容了被测目标。 在评价测验的效度时,必须考虑其目的和功

30、能。在评价测验的效度时,必须考虑其目的和功能。2.2.连续性连续性 使用相关系数,只有程度上的不同,而非使用相关系数,只有程度上的不同,而非“有效有效”或或“无效无效” 专栏专栏5-45-4一、一、 信度是效度必要而非充分条件信度是效度必要而非充分条件 效度高,信度必然高效度高,信度必然高 信度高,未必效度高信度高,未必效度高二、二、 效度受信度制约效度受信度制约 一个测验的效度不会超过其信度的平方根。一个测验的效度不会超过其信度的平方根。理理论公式论公式p379p379第二单元:第二单元: 效度评估的方法效度评估的方法一、一、 内容效度内容效度(一)定义:(一)定义:指测验项目对有关内容或行

31、为取样指测验项目对有关内容或行为取样的适用性,测验题目的取样的代表性。的适用性,测验题目的取样的代表性。 内容效度并不一定要求测验是同质的,如智力内容效度并不一定要求测验是同质的,如智力测验。测验。二、二、 构想效度(结构效度、构思效度)构想效度(结构效度、构思效度)(一)定义(一)定义 反映编制此测验所依据理论的程度。测验能够测量到理论上的构反映编制此测验所依据理论的程度。测验能够测量到理论上的构想或特质的程度。想或特质的程度。 (二)估计方法(二)估计方法1.1.对测验本身的分析:通过研究测验内部结构对测验本身的分析:通过研究测验内部结构 (1 1)通过内容效度)通过内容效度 (2 2)通

32、过内部一致性指标:分半信度;)通过内部一致性指标:分半信度;系数;系数;条目条目- -因子相关;分测验因子相关;分测验与总测验的相关与总测验的相关 (3 3)通过被试反应来分析:例如有道德评判内涵的人格测题,不能过多)通过被试反应来分析:例如有道德评判内涵的人格测题,不能过多2.2.测验间相互比较:通过分析几个测验间的相互关系,共同处测验间相互比较:通过分析几个测验间的相互关系,共同处 相容效度证据:与一个测验同一特质的成熟测验之间的相关系数,即为相容效度证据:与一个测验同一特质的成熟测验之间的相关系数,即为相容效度,可解释两组分数共同解释的变异大小相容效度,可解释两组分数共同解释的变异大小

33、区分效度证据:与上述相反,与一个测验不同构思的测验无相关性区分效度证据:与上述相反,与一个测验不同构思的测验无相关性 因素分析法:常用的方法。找到影响一组测验分数的共同因素因素分析法:常用的方法。找到影响一组测验分数的共同因素构想构想 也可用于一个测验内部(目前经常用)。也可用于一个测验内部(目前经常用)。3.3.效标效度的研究证明效标效度的研究证明 * * 根据效标选取相对照的两组(如内、外向性格),测验根据效标选取相对照的两组(如内、外向性格),测验结果两组能分开,说明测验的构思效度好者,结果两组能分开,说明测验的构思效度好者, * * 根据测验分数将被试分成高分、低分两组,观察被试行根据

34、测验分数将被试分成高分、低分两组,观察被试行为特点是否与理论构思相吻合为特点是否与理论构思相吻合 * * 不同年龄组的递进效果来分析:如智力随年龄发展,测不同年龄组的递进效果来分析:如智力随年龄发展,测验结果也应随年龄而提高验结果也应随年龄而提高4.4.实验法和观察法证实实验法和观察法证实 如通过某项训练被试,使之与提高的测验成绩一致如通过某项训练被试,使之与提高的测验成绩一致三、三、 效标效度效标效度(一)概念(一)概念* * 又称实证效度。又称实证效度。测验预测个体在某种情景下行为表现的有效性程测验预测个体在某种情景下行为表现的有效性程度。(被预测的行为是检验效度的标准,简称效标)度。(被

35、预测的行为是检验效度的标准,简称效标)* * 分为:分为: 同时效度同时效度 预测效度预测效度* * 效标的选择:效标的选择: 能最有效反映测验目标能最有效反映测验目标 信度高信度高 客观测量客观测量 经济经济(二)估计方法(二)估计方法1.1.相关法:测验分数与效标资料间的相关。相关法:测验分数与效标资料间的相关。当当两者都是连续变量,两者都是连续变量,采用积差相关法;采用积差相关法;当测验分数是连续变量,效标资料是二分变量,用点二列当测验分数是连续变量,效标资料是二分变量,用点二列相关或二列相关;当测验分数是连续变量,效标资料是等级评定,用贾斯朋相关或二列相关;当测验分数是连续变量,效标资

36、料是等级评定,用贾斯朋(JuspenJuspen)多系列相关公式。)多系列相关公式。2.2.区分法:区分法: 能否有效区分由效标所定义的团体(如抑郁症和正常人的高分组与低分能否有效区分由效标所定义的团体(如抑郁症和正常人的高分组与低分组的重叠量)组的重叠量) 图图5-2 p384 5-2 p384 重叠量越大,测验效度越差。重叠量越大,测验效度越差。3.3.命中率法:以正确决定的比例作为效度指标。命中率法:以正确决定的比例作为效度指标。P385P385 正确的预测为命中(如医生的划线与测验的划线)正确的预测为命中(如医生的划线与测验的划线) 总命中率总命中率 = = 命中命中/ /命中命中+

37、+失误失误 正命中率正命中率 = = 测验与效标都成功的人数测验与效标都成功的人数/ /测验成功人数测验成功人数第三单元:第三单元: 效度的功能效度的功能一、预测误差一、预测误差 * * 决定性系数决定性系数 r r2 2,表示测验正确预测的效标的方差占总方差的比例,表示测验正确预测的效标的方差占总方差的比例 (效度如果是(效度如果是0.80.8,则测验正确预测的占,则测验正确预测的占64%64%) * * 估计的标准误估计的标准误Sest = Sest = 效标成绩的标准差效标成绩的标准差S S * * 1- 1-效度系数平方效度系数平方 (当效度系数为(当效度系数为1 1,SestSest

38、就是零,测验分数可完全代替效标)就是零,测验分数可完全代替效标)p390p390二、预测效标分数二、预测效标分数 从测验分数预测效标成绩从测验分数预测效标成绩 计算式:预测的效标分数计算式:预测的效标分数 = a + b= a + b* *测验分数测验分数 (a a、b b计算式计算式p386p386)三、预测效率指数三、预测效率指数 无关系数无关系数 K = 1-K = 1-效度系数平方效度系数平方 反映使用测验比盲目猜测能减少多少误差反映使用测验比盲目猜测能减少多少误差 预测效率指数预测效率指数 E = 100(1-E = 100(1-无关系数无关系数K)K) 第四单元:第四单元: 影响效

39、度的因素影响效度的因素一、一、 测验本身的因素测验本身的因素A.A.材料具有代表性材料具有代表性B.B.避免容易引起误差的题目(如是否题型)避免容易引起误差的题目(如是否题型)C.C.难度适中,区分度好难度适中,区分度好D.D.测验长度适当,需要一定的题量测验长度适当,需要一定的题量E.E.应先易后难排序应先易后难排序二、二、 测验实施中的干扰因素测验实施中的干扰因素( (一一) )主测者的影响因素(需标准化)主测者的影响因素(需标准化)如果是效标效度如果是效标效度, ,那么测验与效标的间隔时间越长,相关系数那么测验与效标的间隔时间越长,相关系数越低。越低。(二)受测者的影响因素(兴趣、动机、

40、情绪、心身状态)(二)受测者的影响因素(兴趣、动机、情绪、心身状态)三、三、 样本团体的性质样本团体的性质* * 样本团体的异质性(经过选拔的被试不代表整体):越异质,效度样本团体的异质性(经过选拔的被试不代表整体):越异质,效度越高越高* * 干涉变量(性别、年龄、文化、智力、动机、职业)干涉变量(性别、年龄、文化、智力、动机、职业)* * 寻找干涉变量的方法:寻找干涉变量的方法: A.A.通过回归方程求得的预测效标分与实际效标分比较,差异大说通过回归方程求得的预测效标分与实际效标分比较,差异大说 明可能存在干涉变量明可能存在干涉变量 B.B.找出对照组,分别计算效度,分析之找出对照组,分别

41、计算效度,分析之 C.C.区分预测性高的亚团体,效度会有所提高区分预测性高的亚团体,效度会有所提高四、效标的性质四、效标的性质 效标本身的信度效标本身的信度第五节 项目分析 第一单元:第一单元: 项目的难度项目的难度一、一、 项目难度的定义:项目的难易程度项目难度的定义:项目的难易程度 通过率通过率 P = RP = R(答对人数)(答对人数)/ N/ N(全部人数)(全部人数) * * 100% 100% P P值越大,难度越低。值越大,难度越低。二、二、 项目难度的计算方法项目难度的计算方法1.1.二分法计分的项目二分法计分的项目 难度难度P = PhP = Ph( 27%27%高分组通过

42、率)高分组通过率)+ Pl+ Pl( 27%27%低分组通过率)低分组通过率) / 2 / 2 2. 2. 非二分法计分的项目非二分法计分的项目 难度难度P =P =全体被试在该题上的平均分全体被试在该题上的平均分 / / 该题的满分该题的满分 * *100%100%三、三、 难度水平的确定难度水平的确定1.1.项目的难度项目的难度 P P值越接近于值越接近于0.500.50,区别力越高,区别力越高 当测验用于选拔或诊断时,应多选择难度值接近录取率的项目。当测验用于选拔或诊断时,应多选择难度值接近录取率的项目。 如果录取率为如果录取率为20%20%,测验难度最好为,测验难度最好为20%20%。

43、 选择试题例外。有猜测成分。(是非题:选择试题例外。有猜测成分。(是非题:0.75/0.75/四选一题四选一题:0.63):0.63)2. 2. 测验的难度测验的难度 如果样本具有代表性,测验总分是常态分布的,说明难度适中如果样本具有代表性,测验总分是常态分布的,说明难度适中 如果测验总分是如果测验总分是“正偏态分布正偏态分布”,说明难度高;,说明难度高;如果测验总分是如果测验总分是“负偏态分布负偏态分布”,说明难度低。,说明难度低。 p391p391图图 测验中所包含的题目的试题难度最好在测验中所包含的题目的试题难度最好在0.500.500.200.20之间,平均难之间,平均难度接近度接近0

44、.500.50。第二单元:第二单元: 项目的区分度项目的区分度一、一、 定义定义 项目区分度又称鉴别力,测验项目对受测者心理特性项目区分度又称鉴别力,测验项目对受测者心理特性的区分能力。是项目质量的主要指标。影响效度。的区分能力。是项目质量的主要指标。影响效度。二、二、 项目区分度计算方法项目区分度计算方法 项目得分与实际能力(用测验总分代替)水平的相关程度项目得分与实际能力(用测验总分代替)水平的相关程度1.1.鉴别指数鉴别指数 步骤:按测验总分高低排列答卷步骤:按测验总分高低排列答卷 确定高分组与低分组(确定高分组与低分组(27%27%) 分别计算通过率或得分率(分别计算通过率或得分率(A

45、 A和和B B) 鉴别指数鉴别指数 D = A - BD = A - B 辨别指数辨别指数0.40.4以上,区分度好;以上,区分度好;0.190.19以下,淘汰以下,淘汰 (p392,(p392,表表5-5)5-5)2. 2. 相关法相关法 最常用(项目分与总分的相关)。计算方法:点二列相关、二列最常用(项目分与总分的相关)。计算方法:点二列相关、二列相关和相关和相关法。区分度取值范围:相关法。区分度取值范围:-1-1至至+1+1之间。相关越高,项目越之间。相关越高,项目越具有区分功能。具有区分功能。三、三、 区分度与难度的关系区分度与难度的关系 关系密切关系密切 ( (见表见表5-6 p39

46、2)5-6 p392)第六节 项目编制的一般程序 第一单元:第一单元: 测验的目标分析测验的目标分析一、测验的对象一、测验的对象二、测验的用途二、测验的用途 1.1.显示性测验(测验题目和所要测量的心理特征相似显示性测验(测验题目和所要测量的心理特征相似, ,如成就测验)如成就测验) 分为样本测验(四则运算)和标记测验(智力测验)分为样本测验(四则运算)和标记测验(智力测验) 2.2.预测性测验(预测没被测量的行为预测性测验(预测没被测量的行为, ,如用词汇测验预测学业表现)如用词汇测验预测学业表现)三、三、 测验的目标测验的目标 1.1.工作分析工作分析 对所要预测的行为做具体分析(如测打字

47、能力,需反映手指等灵对所要预测的行为做具体分析(如测打字能力,需反映手指等灵活性等)活性等) 2 2个步骤:哪些心理特征有助于成功;建立成功的标准个步骤:哪些心理特征有助于成功;建立成功的标准效标效标 2.2.对特定概念下定义对特定概念下定义 心理行为特质的内涵(如创造力应反映灵活性、独创性、流畅性、心理行为特质的内涵(如创造力应反映灵活性、独创性、流畅性、详尽性四个方面)详尽性四个方面) 3.3.确定测验的具体内容确定测验的具体内容 应选择哪些方面的题目,以及各题目所占据的比重应选择哪些方面的题目,以及各题目所占据的比重 表表5-7 P3965-7 P396 第二单元:第二单元: 测验的编写

48、测验的编写一、一、 搜集资料搜集资料 已经出版的测验、理论与专家的经验、临床观察与记录已经出版的测验、理论与专家的经验、临床观察与记录二、二、 命题原则命题原则 内容:内容:题目符合测验目的、取样代表性、题目内容独立题目符合测验目的、取样代表性、题目内容独立 文字:文字:避免生僻字词;语句简明扼要;一句话说明一个避免生僻字词;语句简明扼要;一句话说明一个概念,意义明确,尽量不用双重否定句。概念,意义明确,尽量不用双重否定句。 理解:理解:不要超出知识水平和理解能力;无歧义不要超出知识水平和理解能力;无歧义 社会敏感方面:社会敏感方面:尽量避开社会敏感性问题,不应使用涉尽量避开社会敏感性问题,不

49、应使用涉及社会禁忌或个人隐私的题目(特地测验的例外)及社会禁忌或个人隐私的题目(特地测验的例外)P397P397三、三、 编制要领:编制要领:题目有题目有2 2类:提供型(要求给出正确答案);选择型类:提供型(要求给出正确答案);选择型1.1.选择题选择题 题干(直接问句或不完全的陈述句)题干(直接问句或不完全的陈述句) 选项(只一个正确)选项(只一个正确) 选择题注意事项选择题注意事项: :(6 6项项 p398p398)2.2.是非题是非题 注意事项:(注意事项:(5 5项项 p398p398)3.3.简答题简答题 (3 3条原则)条原则)4.4.操作题操作题 明确将测量目标操作化明确将测

50、量目标操作化 真实性高的项目真实性高的项目 指导语明确指导语明确 制定评分标准制定评分标准第三单元:第三单元: 测验的编排与组织测验的编排与组织一、一、 合成测验合成测验1.1.选择与审定试题选择与审定试题 选择试题形式(注意选择试题形式(注意3 3点)点) 审定题目(审定题目(4 4注意事项)注意事项)2.2.测验的编排测验的编排 试题难度逐步上升试题难度逐步上升 同类试题一起同类试题一起 各类试题特点排列各类试题特点排列 两种常见排列方式两种常见排列方式: :并列直进式和混合螺旋式并列直进式和混合螺旋式二、二、 预测验与项目分析预测验与项目分析 1.1.预测验(应多备几种)预测验(应多备几

51、种) 2.2.项目分析项目分析 三、信度与效度考察三、信度与效度考察四、四、 常模制订常模制订五、五、 编写指导手册:编写指导手册:6 6个内容个内容1 1、测验的目的和功用、测验的目的和功用2 2、测验编制的理论背景、测验编制的理论背景3 3、如何实施测验的说明、如何实施测验的说明4 4、测验的标准答案或记分标准、测验的标准答案或记分标准5 5、常模资料、常模资料6 6、测验的基本特征:难度、鉴别力、信度、效度等、测验的基本特征:难度、鉴别力、信度、效度等第七节 心理测验的使用 第一单元:第一单元: 主试的资格主试的资格一、一、 知识结构知识结构二、二、 专业理论与专业技能专业理论与专业技能三、三、 职业道德职业道德第二单元:第二单元: 测验的选择测验的选择一、一、 适合测量目的适合测量目的二、二、 测验工具符合心理测量学的要求测验工具符合心理测量学的要求第三单元:测验前的准备及注意事项第三单元:测验前的准备及注意事项一、一、 测验前的准备工作测验前的准备工作预告测验预告测验准备测验材料准备测验材料熟悉测验指导语熟悉测验指导语熟悉测验具体程序熟悉测验具体程序二、二、 测验中主测者的职责测验中主测者的职责按指导语实施按指导语实施不多

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论