第四讲测量的基本理论_第1页
第四讲测量的基本理论_第2页
第四讲测量的基本理论_第3页
第四讲测量的基本理论_第4页
第四讲测量的基本理论_第5页
已阅读5页,还剩79页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四讲测量的基本理论第1页,课件共84页,创作于2023年2月心理测量学1.概化理论简介

一、概化理论的发展(一)概化理论的发展思路概化理论(GeneralizabilityTheory,GT)是经典理论宏观发展,重在研究误差控制、研究测验整体设计。第2页,课件共84页,创作于2023年2月心理测量学1、测验分数方差的测量学意义测验分数方差有目标分数方差和误差分数方差之区别。如:被试真正能力水平间的分数方差是目标分数方差。同一被试不同次测验分数间的方差是误差方差。同一作品多个评分间的方差也是误差方差。第3页,课件共84页,创作于2023年2月心理测量学2、误差来源的多样性与总分方差结构的复杂性测量误差的原因多方面,误差方差的种类多种。总分方差结构复杂:不同来源的误差方差与目标分数方差共存。第4页,课件共84页,创作于2023年2月心理测量学3、经典测验理论处理分数方差的办法假定X=T+E,然后有:再定义信度为:

第5页,课件共84页,创作于2023年2月心理测量学优点:定义了随机误差,可设法估计其大小。缺点:没有能告诉我们误差由哪些原因造成,各种原因造成的误差各有多大。第6页,课件共84页,创作于2023年2月心理测量学

4、概化理论的研究目的探清总分方差结构、区分误差原因,明确各种误差大小,找到最优设计方案。第7页,课件共84页,创作于2023年2月心理测量学(二)概化理论发展的理论与技术基础1、经典测验理论概化理论与经典测验理论相比,不同之处多于相同之处。2、方差分量分析依靠方差分量分析将总分方差分解、定性。第8页,课件共84页,创作于2023年2月心理测量学(三)概化理论发展史用方差分量分析研究测量误差的历史可以追溯到20世纪上半叶。公认的GT正式诞生的标志物是克朗巴赫等的专著《行为测量的可靠性》的正式出版。第9页,课件共84页,创作于2023年2月心理测量学二、概化理论基本框架(一)概化理论的测验情境关系说为了探清测验误差的来源、类型、大小,必须建立一个理论模型。第10页,课件共84页,创作于2023年2月心理测量学概化理论模型的建立依赖于对测验情境关系的详细调查。测验情境关系是指测量目标与各测量侧面所组成的一种关系结构。

第11页,课件共84页,创作于2023年2月心理测量学1、测量目标测量目标:测量者希望通过测量用测量值描绘的心理品质。确定测量目标的方法:问“测谁”和“测什么”。一般一场测量目标只能一个研究同一测量问题测量目标一经确定不能改变。第12页,课件共84页,创作于2023年2月心理测量学2、测量侧面测量侧面:测量的条件。测量侧面水平:测量条件的不同水平。测量侧面类型:随机侧面固定侧面第13页,课件共84页,创作于2023年2月心理测量学固定侧面的优点:测量的误差会减小,测量的信度会提高。固定侧面的缺点:固定侧面成目标的一部分,测量结果拓广受限。第14页,课件共84页,创作于2023年2月心理测量学3、概化理论下的真分数概念经典测验理论认为个体真分数只能有一个。概化理论认为在不同测量条件下会有不同的真分数。第15页,课件共84页,创作于2023年2月心理测量学测验情境关系说结论:情境关系中的测量目标、测量侧面、侧面的水平变化,会引起测验误差的来源,误差的大小、真分数的种类以及测验信度的变化,进而引起测验分数的解释范围发生变化。第16页,课件共84页,创作于2023年2月心理测量学(二)测验设计的模型与种类 测验设计的任务(两个方面):(1)界定测量目标和测量侧面的个数及名称、意义,确定各侧面的水平数。(2)设计数据采集方法。第17页,课件共84页,创作于2023年2月心理测量学数据采集方法类型:以侧面数分:

单侧面设计、双侧面设计、多侧面设计第18页,课件共84页,创作于2023年2月心理测量学以数据结构分:交叉设计:测量目标在所有侧面的各个水平上被测量。如p×I、p×i×r

第19页,课件共84页,创作于2023年2月心理测量学嵌套设计:测量目标在一个或多个侧面的部分水平以下被测量。如p:r、p:r:s混合设计:既有交叉,又有嵌套的测验设计。如i×(p:r)

第20页,课件共84页,创作于2023年2月心理测量学数据采集设计原则:数据充分体现测量目标与各个测量侧面及各侧面相互之间关系侧面数、水平数的设置要符合客观的测验情境;能获得充分的数据信息;简化模型、节约投入。施测时要控制设计之外的各种无关变量。第21页,课件共84页,创作于2023年2月心理测量学(三)G研究

G研究目的:用方差分量分析,定量估计观察领域中测量目标方差和各个测量侧面方差,以及其间的交互作用的方差。第22页,课件共84页,创作于2023年2月心理测量学方差分量分析(二步):1、分解总体方差为测量目标主效应方差、各测量侧面主效应方差和各种交互效应方差。2、应用样本方差估计各种效应的期望均方差。第23页,课件共84页,创作于2023年2月心理测量学各种期望均方差性质:测量目标效应期望均方差:测量目标个体差异的描写量;各测量侧面效应期望均方差:各侧面对目标干扰程度描写量,就是误差;各交互效应期望均方差:各侧面对目标的交互干扰程度描写量,也是误差。第24页,课件共84页,创作于2023年2月心理测量学(四)D研究D研究的目的:在G研究的基础上,在原设计的测验情境关系范围之内,分析比较各种可能的测验方案,由研究者结合实际,优选实施方案。第25页,课件共84页,创作于2023年2月心理测量学D研究调整原方案获取新方案的方法:1、固定原测验情境关系中的某一个或某几个侧面。2、改变原测验情境关系中的一个或某几个测量侧面的水平数。3、改变原测验情境关系中某些测量侧面的结构关系。第26页,课件共84页,创作于2023年2月心理测量学D研究的统计分析步骤(两步)1、估计拓广领域(新测验方案)下各种效应期望方差。2、估计新方案下测验误差的总体指标和测验质量指标,以提供比较依据。第27页,课件共84页,创作于2023年2月心理测量学测验误差指标:1、相对误差指标:所有与测量目标有关的交互效应方差之和,2、绝对误差指标:除目标主效应方差之外的所有效应方差之和。第28页,课件共84页,创作于2023年2月心理测量学测验质量综合指标:1、概化系数G;目标效应方差与目标效应方差加相对误差方差之和的比。2、相依系数:目标效应方差与目标效应方差加绝对误差方差之和的比。第29页,课件共84页,创作于2023年2月心理测量学D研究的最后工作:根据综合指标,找出最优测验设计方案。第30页,课件共84页,创作于2023年2月心理测量学概化理论分析常用软件:

GENOVA

或mGENOVA。第31页,课件共84页,创作于2023年2月心理测量学三、概化理论评价优点:1、概化理论是一套全新的测验误差分析方法,而且非常精细。2、概化理论引进了测验设计的思想和方法。3、概化理论具有严谨的科学理论体系。第32页,课件共84页,创作于2023年2月心理测量学缺点:1、概化理论本质上还是抽样,研究本身会有误差。2、计算方法相对复杂,给应用带来一定困难。第33页,课件共84页,创作于2023年2月2·

项目反应理论介绍第34页,课件共84页,创作于2023年2月内容提要:项目反应理论的发展IRT的基本理论体系项目反应模型计算机程序IRT的应用、优点与不足第35页,课件共84页,创作于2023年2月(一)、经典测验理论一、项目反应理论的发展:(二)、项目反应理论的发展第36页,课件共84页,创作于2023年2月1、CTT的理论体系很完善,是其他测验理论赖以产生的基石。优点有:理论方法体系相对完整前提假设比较弱所涉及到的数学模型以及参数的概念和估计方法易理解和掌握标准化技术在控制测验误差等方面有明显的效果(一)、经典测验理论第37页,课件共84页,创作于2023年2月基本假设难以成立:①真分数与观测分数间存在线性关系的假定不合理;②平行测验的假设难以成立;③误差与真分数独立的假设难以满足。2、CTT在理论体系和方法体系方面存在许多其本身难以克服的缺点,具体表现为:项目统计量严重依赖于测验所实施的被试样组。第38页,课件共84页,创作于2023年2月被试测验分数依赖于所施测项目的难度。

测验信度观存在严重问题。CTT的信度是针对被试全体的,只代表平均测量精度,假设所有被试测量标准误相等,而实际上,不同能力水平的被试不可能具有同样的测量标准误。缺乏预测力对测验等值、适应性测验、标准参照性测验的编制等问题不能给以满意的解决。第39页,课件共84页,创作于2023年2月尽管存在以上缺点,CTT仍在广泛地应用。CTT、IRT和概化理论是当今最有影响的三种测验理论。简单地说,IRT在处理微观问题(即被试水平与答题目之间的实质性关系)时优势明显,CTT在处理中观问题(如处理常见的标准化考试等)时方便易懂,GT则在处理宏观问题(如对结果作推论)时更显出色。三种测验理论体系有内在联系,各有长短,应相互促进,互相补充。第40页,课件共84页,创作于2023年2月(二)、项目反应理论的发展由于项目特征曲线(ICC)对项目反应理论的产生具有重要意义,所以在讲项目反应理论的产生和发展问题时,一般都追溯到1905年比奈和西蒙编制第一个智力量表时的工作,他们当时所使用的作业成绩随年龄增长而提高的散点图与现在的ICC曲线十分类似。第41页,课件共84页,创作于2023年2月IRT的真正创立者是美国心理测量学家洛德(Lord)。1952年,洛德发表博士论文《一个测验分数的理论》,提出了IRT的第一个数学模型(Two-parameterNormalOgiveModel,双参数正态卵形曲线模型)及其参数的估计方法,并把该模型应用到了学业成绩和态度测量工作之中。第42页,课件共84页,创作于2023年2月(一)、概念(二)、基本思想及基本思路(三)、基本理论假设二、IRT的基本理论体系第43页,课件共84页,创作于2023年2月(一)、概念项目反应理论(ItemResponseTheory,简称IRT),又称潜在特质理论(LatentTraitTheory)或项目特征曲线理论(ItemCharacteristicCurseTheory),是为了克服经典测验理论(CTT)的局限而提出的现代测验理论。从测验的内部或微观方面入手,采取数学建模和统计调整的方法,重点讨论被试的能力水平与测验项目之间的实质性关系,测验的每一个项目都有自己的项目特征曲线,描述了每一个特定能力水平的被试答对或答错该项目的概率。第44页,课件共84页,创作于2023年2月(二)、基本思想及基本思路潜在特质:把表现在一个人身上所特有的相对稳定的行为方式称为心理特质(trait),由于这种心理特质是隐含于其行为之中的,所以也称做潜在特质。第45页,课件共84页,创作于2023年2月与CTT一样,IRT也认为被试的潜在特质是不能被观察和测量的,但却可以通过其外显行为表现出来。不同的是,CTT是以被试对所有测验项目的反应总和(测验总分)为显变量来预测被试的潜在特质的,并不认为被试对单个项目的反应与其特质间有任何有意义的联系。第46页,课件共84页,创作于2023年2月IRT则认为被试的能力与其对某一特定项目的反应(以正确或错误反应概率表示)有某种函数关系存在,确定这种关系就是IRT的基本思想和出发点。所以IRT可以被理解为一种探讨被试对项目的反应与其潜在特质间关系的概率性方法。第47页,课件共84页,创作于2023年2月用θ表示被试的潜在特质或能力,用Pi(θ)表示其对项目i正确反应概率,项目反应理论的关键就是确定θ与Pi(θ)间的函数关系。第48页,课件共84页,创作于2023年2月表1某个项目假设的项目特征曲线1.000.000.50潜在特质:θ

正确反应的概率:Pi(θ)第49页,课件共84页,创作于2023年2月潜在特质空间(LatentTraitSpace)对于某一特殊行为的发展起作用的所有潜在特质的集合。第50页,课件共84页,创作于2023年2月维度在潜在特质空间中互相独立的潜在特质的个数。一个K维的潜在特质空间可以表示为:H=(θ1,θ2,θ3,...,θk)总之,潜在特质理论是一切心理测量理论研究的基础。第51页,课件共84页,创作于2023年2月1、潜在特质空间的单维性假设2、局部独立性假设3、项目特征曲线假设4、非速度性假设(三)、基本理论假设第52页,课件共84页,创作于2023年2月1、潜在特质空间的单维性假设(unidimensionality)潜在特质空间单维性指测验测量的是单一的特质而非多元特质,即被试对测验中任一项目的反应是其单一特质θ的函数。第53页,课件共84页,创作于2023年2月如何判断是否满足单维性假设?因素分析的方法当因素分析抽取的第一个公共因素解释的变异远大于第二个公共因素时,就可认为测验是单维的。第54页,课件共84页,创作于2023年2月但严格的单维性是大多数测量工具都难以满足的,这也是IRT受到批评的主要原因。所以,解决测验的单维性问题及建立多维反应模型是IRT将要研究的任务之一。第55页,课件共84页,创作于2023年2月在项目反应理论中,常用一般的统计依存性和统计独立性概念来讨论项目间关系。2、局部独立性假设(localindependence)Pi(+):表示正确回答第i个项目的概率Pi(-):表示答错第个i项目的概率Pj(+):表示正确回答第j个项目的概率Pj(-):表示答错第j个项目的概率第56页,课件共84页,创作于2023年2月P(+,+)表示正确回答第i和第j个项目的概率同理,……。根据以上定义,在下列条件下,两个项目得分在统计上是独立的。第57页,课件共84页,创作于2023年2月P(+,+)=Pi(+)Pj(+)P(+,-)=Pi(+)Pj(-)P(-,+)=Pi(-)Pj(+)P(-,-)=Pi(-)Pj(-)如果四个等式中的任何一个不成立,则这两个项目在统计上就是依存的。第58页,课件共84页,创作于2023年2月例:如果Pi(+)=.8Pi(-)=.2

Pj(+)=.6Pj(-)=.4那么当且仅当P(+,+)=.48P(+,-)=.32P(-,+)=.12P(-,-)=.08时两个项目才独立。实际就是指,如果两个项目的每种反应模式的概率,仅仅根据对每个项目正确与不正确反应的概率就能计算出来,那么项目之间便是独立的。第59页,课件共84页,创作于2023年2月如何理解局部独立性假设呢?由于这种独立性是针对特定的θ值的被试而言的,所以称为“局部”。例:假设1000名能力相同的被试参加某一能力测验,600名被试答对了项目i,400名答错了;这1000名被试对项目j的正确反应概率与对项目i的正确反应概率统计上是独立的。总之,同一特质水平的被试回答某一项目时不受其他项目的影响。第60页,课件共84页,创作于2023年2月3、项目特征曲线假设IRT假定正确反应概率Pi(θ)与θ间存在规律性的变化关系,这种关系可以用一个数学函数的形式表示出来,这一函数称为项目反应函数(ItemResponseFunction),项目特征曲线(ICC)就是这一函数的图像。第61页,课件共84页,创作于2023年2月大量事实证明,对两级记分的项目,被试的能力水平与他对项目的反应之间呈S型的曲线关系,而且这一关系具有相当的普遍性。S型ICC具有一些共同点,即都有一条Y=1的上渐近线和一条Y=c(c≥0)的下渐进线,且是严格单调上升的,一条ICC的形状取决于三个变量:下渐近线的高度,曲线拐点的位置及拐点处的斜率。这三个变量恰好相当于三个项目参数:猜测参数ci,难度参数bi和区分度参数ai。第62页,课件共84页,创作于2023年2月1.000.000.50θPi(θ)上渐近线下渐近线c拐点切线b第63页,课件共84页,创作于2023年2月(1)难度参数bi在一条ICC中,bi等于曲线在拐点处的θ值。当猜测参数ci=0(曲线的下渐近线为0)时,bi等于Pi(θ)=0.50时的θ值,因为对一条完整的ICC,拐点恰好是曲线的中点和对称点。当ci>0时,P(θ)=(1+c)/2第64页,课件共84页,创作于2023年2月在IRT中,bi表示一个项目的难度,其取值范围一般在-3.0到+3.0之间。bi越大,表示项目的难度越大。1.000.000.50θPi(θ)b1b2项目1项目2第65页,课件共84页,创作于2023年2月从上图可以看出,项目2比项目1更难些,因为能力相同的同一组被试对项目1的正确反应概率要大于对项目2的正确反应概率。在其他条件不变的情况下,增大项目的难度会使ICC向右平移。第66页,课件共84页,创作于2023年2月(2)区分度参数ai在一条ICC中,ai的大小决定曲线在拐点bi处的陡度。ai很大时,在bi附近能力θ的增加会导致正确反应概率Pi(θ)有很快的增长;ai很小时,在bi附近能力θ的等量增加不会导致正确反应概率Pi(θ)有明显的增长。ai的取值范围通常在0.30~2之间。第67页,课件共84页,创作于2023年2月图区分度参数ai对正确反应概率的影响1.000.000.50θPi(θ)b项目1项目2第68页,课件共84页,创作于2023年2月ai越大,曲线在bi附近就会越陡,项目在bi附近的区分能力就越大,但在远离bi的区域,曲线就会变得越平坦,项目的区分能力就越低。也就是说,区分度参数ai大的项目对能力水平接近bi的被试有较大的区分能力,而对能力水平远大于或小于bi的被试区分能力小。相反,区分度参数ai小的项目则在能力分布更广泛范围内对被试都有一定的区分能力。第69页,课件共84页,创作于2023年2月(3)猜测参数ci被试完全凭机遇答对项目i的概率即是该项目的猜测参数ci。注意:CTT中没有猜测参数,IRT引入此概念是为了提高对能力估计的精度。对包含m个选择项的选择题,其猜测参数ci一般接近1/m。ci的取值范围一般在0~0.50之间。第70页,课件共84页,创作于2023年2月二级评分IRT模型多级评分IRT模型连续型IRT模型三、项目反应模型第71页,课件共84页,创作于2023年2月(一)、正态卵形模型(NormalOgiveModel)正态卵形模型将项目特征曲线视为一条S形正态累积函数曲线,相应的数学模型即是正态累积分布函数。可分为三参数、双参数和单参数模型三种。第72页,课件共84页,创作于2023年2月(1)三参数正态卵形模型表达式为:ai、bi、ci,y为正态曲线纵线的高度,dy表示对y积分,∫为积分符号,上下角表示积分的范围,求从z=-∞到z=ai(θ-bi)范围内正态曲线下的累积面积。第73页,课件共84页,创作于2023年2月(2)双参数正态卵形模型当猜测参数为0时,三参数变成了双参数。(3)单参数正态卵形模型当ci=0,ai=1时,双参数变成了单参数。第74页,课件共84页,创作于2023年2月由于正态卵形模型中的积分运算不易进行,伯恩鲍姆(Birnbaum,1957)在洛德正态卵形模型的基础上提出了逻辑斯蒂模型。(二)、逻辑斯蒂模型(LogisticModels)逻辑斯蒂模型避免了复杂的积分运算,在估计能力和项目参数时要简便得多。逻辑斯蒂模型是使用最广的模型,其次是正态卵形模型。第75页,课件共84页,创作于2023年2月逻辑斯蒂模型也包括三参数、双参数和单参数模型三种。(1)三参数逻辑斯蒂模型的表达式:ai、bi、ci分别为区分度参数、难度参数、猜测参数,含义与正态卵形模型相同。第76页,课件共84页,创作于2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论