(教育技术学专业论文)ga在irt中2plm参数估计中的应用研究.pdf_第1页
(教育技术学专业论文)ga在irt中2plm参数估计中的应用研究.pdf_第2页
(教育技术学专业论文)ga在irt中2plm参数估计中的应用研究.pdf_第3页
(教育技术学专业论文)ga在irt中2plm参数估计中的应用研究.pdf_第4页
(教育技术学专业论文)ga在irt中2plm参数估计中的应用研究.pdf_第5页
已阅读5页,还剩53页未读 继续免费阅读

(教育技术学专业论文)ga在irt中2plm参数估计中的应用研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文摘要 本研究就项目反应理论( i r t ) 二参逻辑斯蒂克模型( 2 p l m ) 的参数 估计问题为主要关注点,通过对i r t 参数估计方法和g a 进行了详细的探 究,提出一种基于g a 的2 p l m 参数估计方法,并且编制相应的算法程序 。 对不同的项目参数进行估计。 i r t 是一种现代教育与心理测量理论。参数估计是应用i r t 的前提, 将这些参数估计出来是建设题库、评价被试、评价考试质量等具体应用 方面的需要。可以说,i r t 的发展史也就是能力参数和项目参数估计的发 展史。 相关文献中介绍的参数估计方法,基本都是采用极大似然估计法或 贝叶斯方法,似然函数的获取、对待估参数初值的选取以及对待估参数 求导是此类估计方法的主要特征。然而参数初值如果选取不恰当,在计 算过程中“真值”可能不收敛,甚至会产生“振荡”现象,这显然不是 施测者所期望的现象。同时对参数的求导乃至二阶偏导的计算将是非常 繁杂的过程,而且每次的迭代必然会产生一定的误差,随着迭代次数的 增多,误差有可能会变大,为克服上述缺点,笔者提出了一种新的参数 估计的方法,即通过g a 的思想来对参数进行估计,通过该方法进行参数 估计时对参数初值的选取没有严格要求,而且不需要有待估参数的任何 导数信息。 g a 是一种寻优方法,它具有其它寻优算法所没有的自适应性、全局 优化性和隐含并行性等特点。笔者通过对g a 编码、遗传算子的分析和借 鉴,提出了对遗传算子的改进策略和算法加速收敛策略,编制了算法验 证程序并通过一定量的数据资料与国外流行的b i l o g 软件进行了对比, 结果表明,在一定的误差范围内,文中所提出的估计算法能够收敛到较 好的最优解。 关键词:i r t ,2 p l m ,g a ,遗传算子,早熟 h a v i n gt h o r o u g h l ys m d m dt h ei t e mr e s p o n s et h e o r y , t h et w op a r a m e t e r s l o g i s t i cm o d e l ,t h i sa r t i c l ep r o p o s e sak i n do fp a r a m e t e re s t i m a t i o nm e t h o d b a s e do nt h eg e n e t i ca l g o r i t h ma n dt h et w op a r a m e t e r sl o g i s t i cm o d e l m e t h o d s ,a n da l s ow o r k so u tar e l e v a n ta r i t h m e t i cp r o g r a mt oe s t i m a t et h e d i f f e r e n ti t e mp a r a m e t e r s i t e mr e s p o n s et h e o r yi so n eo ft h em o d e m e d u c a t i o n a la n dp s y c h o l o g i c a l m e a s u r et h e o r i e s p a r a m e t e re s t i m a t i o ni st h ep r e m i s eo fu t i l i z i n gt h ei t e m r e s p o n s et h e o r y , i ti sn e c e s s a r yt oe s t i m a t et h e s ep a r a m e t e r so u tf o rt h e a p p l i c a t i o n o f e s t a b l i s h i n gq u e s t i o nb a s e ,e v a l u a t i n g t h e s u b j e c t a n d l e v a l u a t i n gt h eq u a l i t yo fe x a m i n a t i o n ,e t c i tc a nb es a i dt h a tt h ed e v e l o p i n g h i s t o r yo f i t e mr e s p o n s et h e o r yi st h ed e v e l o p i n gh i s t o r yo fc a p a b i l i t y p a l a m e t e ra n di t e mp a r a m e t e r s r e c e n t p a r a m e t e r e s t i m a t i o nm e t h o d sa r e m a i n l y t h em a x i m u m l i k e l i h o o dm e t h o da n db a y e r sm e t h o d ,t h ei m p o r t a n tp a r t so ft h e s em e t h o d s a l et oo b t a i nt h el i k e l i h o o df u n c t i o n ,s e l e c tt h ei n i t i a lv a i u eo ft h ep a r a m e t e r e s t i m a t i o na n dt h ed e r i v a t i v eo nu n k n o w np a r a m e t e r s h o w e v e r , i ft h ei n i t i a l v a l u ei sn o tp r o p e r , t h er e a lv a l u ec o u l dn o tb ec o n v e r g e n c e ,a n de v e ns u r g e , t h i si sn o tt h ep h e n o m e n o nt h ea d m i n i s t r a t o re x p e c t e d i nt h em e a n w h i l e ,t h e c a l c u l a t i o no f b o t hp a l a m e t e r s e e k i n gd i f f e r e n t i a lc o e f f i c i e n ta n ds e c o n do r d e r p a r t i a ld e r i v a t i v ea r ev e r yd i f f i c u l tp r o c e s s e a c hi t e r a t i o nm u s tb r i n gs o m e e r r o r s ,w i t ht h ei n c r e a s eo ft h ei t e r a t i v et i m e s ,e r r o r sw o u l db el a r g e r , t h e r e f o r e ,t h i sa r t i c l ep u tf o r w a r da n e wk i n do fp a r a m e t e re s t i m a t i o n m e t h o d sa c c o r d i n gt ot h o s ed i s a d v a n t a g e sm e n t i o n e da b o v e t h a ti st os a y , t o e s t i m a t et h ep a r a m e t e rb yt h et h i n k i n go fg e n e t i ca l g o r i t h m ,t h i sm e t h o di sn o t s t r i c ti nt h ep a r a m e t e ri n i t i a lv a l u e ,a n di td o e s n tn e c e s s a r i l yn e e da n yd a t ao f u n e v a l u a t e dp a r a m e t e r g e n e t i ca l g o r i t h mi sap r e m i u ms e e k i n gm e t h o d ,w i t ht h ec h a r a c t e r so f s e l f - a d a p t a t i o n ,w h o l eo p t i m i z a t i o n ,a n dc o n c e a l e dp a r a l l e lp r o c e s s i n g t h e a u t h o rp r o p o s e st h ei m p r o v i n gs t r a t e g i e so fg e n e t i co p e r a t o r sa n dt h es p e e d u p c o n s t r i n g e n c ys t r a t e g i e s a n dw o r ko u tt h ea r i t h m e t i cv a l i d a t i n gp r o g r a m t h r o u g ht h ea n a l y s i sa n dr e s e a r c ho fc o d i n ga n dg e n e t i co p e r a t o r so ng e n e t i c a l g o r i t h m c o m p a r e dw i t ht h ep o p u l a rf o r e i g ns o f t w a r eb i l o g a n dt os o m e e x t e n t ,t h ee s t i m a t i o nm e t h o dj u s tm e n t i o n e dc a l lm a k eab e t t e rc o n s t r i c t e d a n s w e r k e yw o r d s :i t e mr e s p o n s et h e o r y ,t w op a r a m e t e r sl o g i s t i cm o d e l , g e n e t i ca l g o r i t h m ,g e n e t i co p e r a t o r s ,p r e c o c i t y 文中所用到的主要字符说明 项目反应理论 经典测试理论 项目特性曲线 项目特征函数 逻辑斯蒂克模型 极大似然估计 条件极大似然估计 联合极大似然估计 遗传算法 盯 盯 u 则 遗 m 哪眦研哪眦 呲皿 内蒙古师范大学硕士学位论文 一引言 ( 一) 项目反应理论的基本原理 项目反应理论( i t e mr e s p o n s et h e o r y ,简称i r t ) 是一种新兴的心理与教育测量 理论,它突破了经典测试理论( c l a s s i c a lt e s tt h e o r y ,简称c t t ) 的局限性,将被 试特质水平与被试在项目上的行为关联起来并将其参数化,模型化。i r t 最突出的特 性是将不可观察的被试能力通过观察其对项目的反应用数学函数关联起来“1 。i r t 的 优点:被试能力水平的估计不依赖于测验项目的特性选择;项目参数的估计独立于被 试样本;能力参数和项目难度参数的配套性( 同一量表) 脚。1 9 5 2 年,美国学者洛德 ( l o r d ) 提出了双参数正态肩形曲线模型,这是现代测量理论中第一个项目反应模型, 特别是第一次导出这种模型参数的估计方法,并成功地将这种模型与方法应用于真实 的学业成绩与态度的测量资料,此事件标志着i r t 的创立。 i r t 建立在心理学中的潜在特质理论基础之上。1 ,它的基本思路是确定考生的心 理特质值和他们对于项目的反应之间的关系,这种关系的数学形式是“项目反应模 型”。实际上,这种模型并不是确定模型,项目特征函数表示的是一个概率模型,其 函数值就限制在 0 ,1 区间内,如果被试应答没有猜测的情况,对应曲线上端渐近于 1 ,下端渐近于0 ,这样的曲线一般成为s 形曲线,其原因是考生对于测验项目的反 应除了受到某种特定“能力”的支配外,还受到许多随机因素的影响,如焦虑、动机、 考试技能等因素的影响,所以确切的讲,项目反应模型表示的是考生。能力”和考生 对测验项目“正答概率”之间关系的数学形式。所谓“正答概率”,对于成就测验和 能力测验是指正确回答的概率,对于人格测验是指肯定回答的概率。 1 项目反应理论的基本假设 任何一个数学模型都有其适用条件和一定程度的近似,任何一种测量理论都有一 定的假设,在i r t 中有三条最基本的假设“1 ,它们是: ( 1 ) 潜在特质空间的单维性假设 严格地说,任何测验都不是单维的,这是因为影响被试对测验项目反应的因素, 除了该测验所测量的能力特质外,往往还包含被试的其他方面因素的影响,如被试的 认知的、人格的和施测时的客观条件,以及被试的动机水平、焦虑程度、反应速度等 g a 在i r t 中2 p l m 参数估计中的应用研究 等。因此,在i r t 中,只要所测量的心理特质是影响被试对项目作出反应的主要因素, 那么,就认为这组测验数据是满足单维性假设的。为了便于对测验的结果进行解释, 任何一个测验编制者在设计测验时,总是首先要确定该测验所要测量的是哪一种心理 特质。如果有多种心理特质需要测量,则一般采用分测验的形式,就像韦克斯勒成人 智力量表一样,决不会把测量不同心理特质的各种项目混合在同一个测验中。因此, 单维性假设对于实际的测量工作是合理的“1 。 ( 2 ) 局部独立性假设 局部独立性假设是指某个被试对于某一项目的正答概率不会受到该被试对于该 测验中其他项目反应的影响,也就是说只有被试的特质水平和项目的特性会影响到被 试对该项目的反应。用统计的术语来讲,局部独立性就意味着对于具有相同特质水平 的被试在测验中的各个项目是不相关的,即统计的独立性。如果这一假设得到满足的 话,那么任何一个项目的内容都不能为回答同一测验中的其他项目提供线索。 当局部独立性假设得到满足时,对于某个被试来说,测验得分的任何形式的概率 等于该被试对于每一项目得分概率的简单乘积。例如,若某被试q 对于5 个项且( 项 目为二级记分模式) 的反应形式玑= ( 0 ,l ,1 ,0 ,1 ) ,其中0 表示误答,l 表示正 答,该被试的这一反应类型表示他正答了第2 、第3 和第5 题,误答了第l 和第4 题。 用弓表示该被试正答第j 题的概率( 即为弓( “。= l 口) ) ,9 = ( 卜弓) 表示误答第 j 题的概率( 即为只( u 。j = o i 口) ) ,j = 1 ,2 ,3 ,4 ,5 ,根据局部独立性假设,则该 被试对于这5 个项目出现反应形式虬的概率等于q 1 罡只q 4 b 。由此可见,对于某个特 质水平为目的被试而言,他得到某个特定测验分数x 的概率可表示为 n 乃q ! h 切,其中m 为项目个数。 。 t - - l - ( 3 ) 项目特征曲线( i t e mc h a r a c t e r i s t i cc u r v e ,简称i c c ) 假设 所谓项目特征曲线是项目特征函数( i t e m c h a r a c t e r i s t i cf u n c t i o n ,简称i c f ) 的图像形式,在i r t 中,对应于每项目都有一个项目特征函数,它是该项目所测量 的潜在特质( 一般称之为能力) 和被试对该项目正答概率只之间关系的数学表达式,即 项目分数关于所测特质的非线性回归函数。 2 内蒙古师范大学硕士学位论文 2 项目反应模型 不同的项目特征曲线假设对应着不同的项目反应模型,i r t 数学模型的整体框架 包括:单维和多维模型;线性和非线性的模型;二值记分和多值记分的模型”1 。 从某种意义上讲,i r t 的核心就是数学模型的建立和对模型中各个参数的估计。i r t 不但认为考生的潜在特质和正答概率之间的关系可以用某个数学模型表示,而且假设 该模型可以用单调递增函数表示,该函数被称为项目特征函数,其图像就是项目特征 曲线。i r t 研究的一项重要工作就是确定项目特征函数的解析式,进而确定曲线的形 态。 项目特征曲线描述的是各种特质水平( 用口表示) 的被试对某一测验项目的正确 反应概率。一定能力的被试对某一测验项目的正确反应概率只与该项目的质量有关。 一般来说,被试群体的特质水平可视为连续变化的,因此,反映各特质水平上被试的 正答概率的连线必定是一条连续的曲线。由于特质水平越高的被试答对概率越大,所 以这条曲线应是单调递增函数的曲线。经研究,被试的正答概率与其特质水平之间的 关系是非线性的,即当特质水平f 大或小到一定程度以后,正答概率p ( 口) 随之变 大或变小的速度显著变小。研究表明,这种曲线的形状,是一条以拐点为对称中心的 s 形曲线。本研究中所使用的模型是逻辑斯蒂克( l o g i s t i c ) 模型,该模型是伯恩鲍 姆于1 9 5 7 年提出的,他所假设的项目特征曲线如图i - i 所示,其中p ( 口) 为被试 正确回答某一项目的概率,b ,c 分别为项目的难度和猜测系数,曲线拐点处切线斜 率为项目区分度。 3 g a 在i r t 中2 p l m 参数估计中的应用研究 图1 - 1 逻辑斯蒂克模型 在逻辑斯蒂克模型中,测验项目的质量采用项目难度、项目区分度和猜测系数三 个参数来描述,该函数实际描述的是被试的正答率p ( 口) 与项目参数和被试的特质 水平8 在数值上的关系。它的数学表达式为p ( 8 ) - c + 五石石f 1 历- c 夏矿面其中a b c 分别为项目的区分度、难度和猜测系数,口为被试的某种特质水平。 3 参数估计 , 在单维性假设的前提下,任何项目反应模型都可以统描述成1 9 ( f ) = f ( 口, a ,b ,c ) 的形式,它们均有两类参数,一类是能力参数,通常用目标识,一类是项 目质量参数,通常用a ,b ,c 来标识,分别是项目的区分度、难度和猜测系数。测验 的作用就是通过测验分数对被试的相应能力( 或特质水平) 作出有效的估计,当然满 足假设的高质量测验项目是作出精确估计的重要前提。参数的估计有三种类形:第一 种是已知被试特质水平估计项且质量参数:第二种是已知项目质量参数估计被试特质 水平;第三种是被试特质水平和项目质量参数均未知而进行的联合估计。 ( 二) 问题的提出 较之经典测量理论,i r t 具有诸多优点。然而,在i r t 的使用上它却需要较多的 准备工作,而且用它分析一个项目比经典测试理论复杂。i r t 之所以难以推广,除了 人们的观念转变需要一定时间之外,掌握i r t 比较困难也是一个重要原因叫。参数估 计是应用i r t 的前提,将这些参数估计出来是建设题库、评价被试、评价考试质量等 4 内蒙古师范大学硕士学位论文 具体应用方面的需要。可以说,i r t 的发展史也就是能力参数和项目参数估计的发展 史。i r t 中项目参数与能力参数的估算比较复杂,龙其针对2 参和3 参闽题,没有计 算机支持是难以完成的,所以编制相应的参数估计程序,特别是较高质量的参数估计 程序尤为重要。 在i r t 参数估计中,一般用极大似然法( 娩e ) 估计项目参数和被试参数卿。以往用 极大似然估计法进行参数估计时必然要对似然函数求导并令其等于零,这样,就形成 了两类非线性方程( 组) ,一个是对被试参数能力参数求导形成的方程( 组) ,另一类则 是对项目参数求导形成的方程( 组) 。求解这两个非线性方程 组) ,就可以得到所求的 参数。在求解非线性方程( 组) 时,通常采用牛顿拉夫逊( n - r ) 迭代。然而,这种 迭代方法属于局部搜索算法,虽通用易实现,但有许多缺陷嗍:( 1 ) 计算复杂,尤其 是会出现对参数求偏导的现象:( 2 ) 对初始值具有依赖性。初值的选取不同贝算法最 终的性能将会有差异,一般初值越靠近真值,收敛的越快;( 3 ) 容易局部收敛,不容 易找到全局最大值;( 4 ) 迭代时容易产生极大值“振荡”。这说明用传统的迭代方法 估计出来参数精度可能不太高。由此又影响蓟其它待估参数的准确性,使得最后迭代 出的所有参数估计值不十分理想。近年来,有学者引入神经网络算法和四参数b e t a 作为项目参数的先验分布参数估计法,但是他们的方法受到先验分布等信息的约束, 其项目参数估计的实验结果也并不太理想“。 为克服参数估计中存在的某些缺陷,笔者欲寻求一种突破传统估计参数的方法, 尝试将其转化为一个无约束的函数优化问题,在工程领域中函数优化问题有许多智能 优化算法可以借鉴。其中,遗传算法( 6 e n e t i ca l g o r i t h m 简称g ) 是近几十年发展起 来的基于生物自然选择和自然遗传理论的随机化全局优化算法。与其它优化方法相 比,遗传算法具有其它算法所没有的自适应性、全局优化性和隐含并行性等特点。因 此,笔者尝试通过遗传算法的思想对二参逻辑斯蒂克模型( 简称2 p l i ) 中的参数进 行估计,并且对遗传算法的三个算子进行了相应的改进,加入算法加速策略,将基于 二进伟4 编码的遗传算法用于i r t 中2 p l m 参数的估计通过该方法进行参数估计时对 参数初值的选取没有严格要求,而且不需要有待估参数的任何导数信息。 g 在i r t 中2 p l m 参数估计中的应用研究 二现有参数估计方法介绍 目前,虽然i r t 的模型众多,但比较成熟的是二值记分的单维模型。一个优良的 项目反应模型能揭示被试行为与相关心理特质之间的真实关系,在实际的测验工作 中,施测者所能得到的只是被试对测验项目答对或答错的一组反应数据,并没有任何 一个项目参数的真实值,因此,需要根据观察分数来对项目参数进行估计。项目参数 估计的过程是i r t 中最困难、最重要的过程“”。所有的项目参数估计过程都是从被 试对项目反应的观察数据矩阵开始的,这一矩阵是由数字0 或1 所组成的,其中0 表示“答错”,1 表示“答对”。对于有j 砷个项目组成的测验,每一个被试的反应就组 成一个有m 个元素的矢量,其中每一个元素都代表该被试对于某一个项目的反应。如 果有n 个被试,他们的反应矢量就组成一个n x m 的观察数据矩阵。 得到了观察数据矩阵,就有了参数估计原始资料。尽管参数估计的方法很多,但 其中大多数都直接或闻接她涉及到似然函数。似然函数是一个条件概率函数,在项目 反应模型的参数估计过程中,运用似然函数的目的是寻找一组项目及被试的参数估计 值,使得在取这组估计值时,出现所观察到的实际反应数据的可能性最大。 目前常甩逻辑斯蒂克模型来刻画棱试的反应与潜在特质的关系,下面针对二参逻 辑斯蒂克模型( 2p a r a m e t e rl o g i s t i cm o d e l ,简称2 p l m ) 参数估计常用方法作介 绍。设有n 个被试参加长度为m 个项目的测试,第n 个被试的能力记为o o ,l o 扎 第j 个试题( 又称项目) 的难度、区分度分别为a j ,b j ,1 j m 。所有试题均采用 o 一记分模式,于是可以得到全体被试的作答模式矩阵,即得分矩阵u = ( u 。i ) 。, 其中,u 为n m 的项目反应资料矩阵,其元素为。: u 。;= r1 ,当被试a 答对项目j 时 。 1 lo ,当被试d 答错项耳j 对( z ,1 ) 于是,某个具有能力眈的被试对这m 个试题的作答模式是一个m 维的向量,记 为h 。,且“。= ( m 。1 ,g 。2 - “。3 ,“。) ,1 a n 显然,( 2 1 ) 式所定义的u 。j 依据被试项目的变化而变化,它是一个取值为0 ,1 6 内蒙古师范大学硕士学位论文 的随机变量a 我们用尸( u 。j 2 1 ip = 巳) ( 简记只,) 表示能力为巳的被试答对第j 题 的概率,用q ,= 1 - 只,表示能力为见的被试答错第j 题的概率。于是用 己产7 玩1 嘞,u 。j 2 0 ,1 ( 2 2 ) 表示该被试在该项目上的分布函数,在局部独立性假设的前提下,反应矩阵u 的似然函数为 b l u ,2 蠡愈已,q 。卜限。, 在( 2 3 ) 式中,目,a ,b ,u 均为向量,上式可以简化为 c5 自尊l 乜吨t , 由于对于不同的被试a ,不同的项目j ,u 。i 的分布不同,因此无法用矩估计对 口,a ,b 进行估计“4 ,而且在一定条件下极大似然函数有其自身优点“”,故估计参 数最常用的方法是极大似然估计法。 根据似然函数估计原理,我们希望找到( a ,占) 和占,使得 l ( 占;a ,占) = m a x 工( p ;,6 ) ( 2 5 ) 由于( 2 4 ) 中具有指数,又注意到l ( 0 ;4 ,6 ) 与i j l 工( 日;口,6 ) 具有相同的极值点“”,所以,欲使( 2 5 ) 式成立,只要使以下等式成立即可: m ( 每;d 。占) = m a x l n ( 0 ;4 ,6 ) ( 2 6 ) 通过求( 2 6 ) 式的条件极值便可获得参数的极大似然估计值。在已有的文献中, 对似然函数的极值均采用迭代方法进行求解,而牛顿拉夫逊( n r ) 迭代法是最 常用的迭代方法“”。为此,对已有的参数估计方法引述如下: ( 一) 条件极大似然估计( c m l e ) 条件极大似然估计包括能力参数已知对项目参数进行估计和已知项目参数对能 力参数进行估计两种。 1 项目参数已知,对能力值进行估计 根据似然函数原理,对被试能力进行估计,则需对( 2 6 ) 式中的日求一阶导数, 7 g a 在i r t 中2 p 参数估计中的应用研究 并使其等于0 ,即 a l n l :0 ( 2 7 ) a 8 其中,日为向量,日= ( q ,如,钆) ,( 2 7 ) 式是关于能力参数的非线性方 程,故需用迭代法进行求解,通常通过牛顿一拉夫逊( n r ) 迭代进行迭代计算。 使用n r 迭代对能力似然函数估计流程如图2 1 所示( 其中,l = 号笋, ,2 = 等) : 8 内蒙古师范大学硕士学位论文 图2 - i 能力似然函数估计流程图 9 g a 在i r t 中2 p l m 参数估计中的应用研究 由于n _ r 迭代的极值是在一定范围内取得,所以对于初值的选取尤为重要。n r 迭代中对能力的初值通常取被试在该测试中的得分与失分之比的自然对数“”,对 于卜1 - - 伽分妣能力御叫0 ) = 1 n ( 泓肛泓) ) 。 j qj - 上 上述估计是已知项目参数a ,b 的前提下进行求解的,在求解过程中可能出现有 些估计值会越界的现象。对于这种情况,一般在程序中应该对估计值的范围给出一个 限定,如果越界则应该将其进行约束,比如约束到 一5 ,5 ,如果吃,5 ,则令以= 5 , 如果吼 一5 ,则令吃= 一5 。 采用n _ 一r 迭代法必须保证迭代过程中分母不可以为o ,如果出现分母为0 时, 则应该输出迭代失败的相应提示信息。对于所有项目全部答对或全部答错的被试, c m l e 不能正确估计其能力j 可在迭代开始前将这些特殊反应模式剔除。 2 能力已知,对项目参数进行估计 对于每个项目j ,( 2 6 ) 式有两个未知参数a j ,b j ,分别令( 2 6 ) 对a j ,b j 的一 阶导数等于0 ,即:、 ( j = 1 , 2 ,3 ,m ) ( 2 8 ) 对于( 2 8 ) 式,依然采用n r 法进行迭代计算,由于迭代采用向量的形式,所以 对第j 个项目中的参数a j ,b j ,有如下关系: ,2 二_ ! :o 喜l n l c ,= ,z ,。,m ,( 2 9 ) 1 0 = = 忆一,些呜些哆 五 、-,、,l 内蒙古师范大学硕士学位论文 ,a 2 i n 工 a 2 i n l - 、 t 、,l 8 a 2。n 8 6 i ( 2 1 0 ) 驴l0 2 1 n l 0 2 1 n l i 。 lo b o a o b 2 根据向量的迭代原理,综合( 2 9 ) 和( 2 1 0 ) ,计算a 和b 的迭代公式为: ( 考) ( ) 一。旷一1 ( 羔) 。厂。,。,声。:。c z , 由于( 2 1 1 ) 是向量迭代,所以迭代终止条件应该用范数表示,即: ao)叫-af0)j1)il 辱万可矸面研t s 通过条件似然估计对能力和项目参数进行估计时,由于使用牛顿拉夫逊法迭 代,所以初值的选取尤为重要,一般要求初值特别靠近真值,估计过程中增长不能太 大,通常将点二列相关系数与z 分数相结合的方法或通过极小化z 2 准则导出参数a 、 b 的初值,虽然可以通过不同的估计方法导出初值,但是在具体的迭代过程中仍然可 能出现某个项目参数值过大的现象,这样导致下一次迭代不收敛的情况。因此,这种 估计方法对初值的要求非常严格。 同样,对于这种类型的参数估计,需要对待估计值的范围给出一个限定,如果越 界则应该将其进行约束。与第一种情况类似,对于所有被试都答对( 或都答错) 的项目, 不能正确估计项目参数,在迭代开始前将这些项目剔除。 ( 二) 联合极大似然估计( j b l e ) 条件似然估计是参数估计类型中的其中两种,而联合似然估计是另外一种类型的 参数估计。联合似然估计是在被试能力和项目参数均未知的情况下同时对这两种参数 进行的估计。 1 】 g 在i 盯中2 p l m 参数估计中的应用研究 联合似然估计中包含许多不确定因素,由于项目反应是在局部独立性假设的前 提下进行,所以联合似然估计可以分为能力参数的估计和项目参数的估计,能力参数 估计与项目参数估计是一个不断项目校正的过程,将这两部分反复迭代求取稳定值, 这是联合似然估计联合求解参数的重要思想“”。具体计算流图如下: 图2 - 2 联合似然估计计算流程图 联合似然估计的求解公式和条件似然估计的求解公式相同,二者相互结合,相互 校正,所以,可以将联合似然估计分成两步进行迭代计算。 内蒙古师范大学硕士学位论文 上面介绍两种参数的估计方法是使用最广泛的参数估计方法,也是最基本的参数 估计方法,但是对于特殊反应模式情况不能采用以上估计方法,贝叶斯估计可以解决 这一现象。但是,贝叶斯估计需要有待估参数的先验分布信息,引入贝叶斯方法,其 最重要的作用就在于能够处理特殊的反应模式,二是对似然估计中出现的越界估计会 自动调节。先验分布的作用是起收缩作用。我们希望所获得的先验分布是信息先验分 布( 该先验分布的方差小) ,这样就会将估计值压缩到先验分布的均值附近。使用贝叶 斯估计就必须给出参数的先验分布,如果这个先验分布比较符合实际情况,用这种方 式所计算的参数值比较接近真值,但是先验分布一旦偏离实际情况很远,那么所得到 的结果就可能远离真实值“”。 三遗传算法 遗传算法( g e n e t i ca l g o r i t h m ,简称g a ) 的基本思想是基于达尔文进化论和 m e n d e l 的遗传学说的“”。达尔文进化论最重要的是“适者生存”原理。它认为每一 物种在发展中越来越适应环境。物种每个个体的基本特征由后代所继承,但后代又会 产生一些异于父代的新变化。在环境变化时,只有那些能适应环境的个体特征才能保 留下来。m e n d e l 遗传学说最重要的是“基因遗传”原理。它认为遗传以密码方式存 在细胞中,并以基因形式包含在染色体内。每个基因有特殊的位置并控制某种特殊性 质。所以,每个基因产生的个体对环境具有某种适应性。基因突变和基因杂交可产生 更适应于环境的后代。经过存优去劣的自然淘汰,适应性高的基因结构得以保存下来。 g a 是由美国m i c h i g a n 大学的j h o l l a n d 教授于1 9 7 5 年首先提出的,它是以 编码空间代替问题的参数空间,以适应度函数为评价依据,以编码群体为进化基础, 以对群体中个体位串的遗传操作实现选择和遗传机制,建立起一种全新的迭代过程, 在这一过程中,通过随机重组编码位串中重要的基因,使新一代的位串集合优于老一 代的位串集合,群体的个体不断进化,逐渐接近最优解,最终达到求解问题的目的。 g a 实质上是一种“生成+ 检验”特征的搜索算法,它的目的是择优。 ( 一) g a 的基本思想 g a 在整个进化过程中的遗传操作是随机性的,但它所呈现出的特性并不是完全 g 在i r t 中2 p l m 参数估计中的应用研究 随机搜索,它能有效地利用历史信息来推测下一代期望性能有所提高的寻优点集。这 样逐代不断进化,最后收敛到一个最适应环境的个体上,求得问题的最优解。g a 所 涉及的五大要素:参数编码、初始群体的设定、适应度函数的设计、遗传操作的设计 和控制参数的设定。 16 a 中的基本概念及术语 由于g a 是由进化论和遗传学机理产生的直接搜索优化方法,所以g a 中要用到各 种进化和遗传学的概念,这些概念如下: 种群( p o p u l a t i o n ) :所求解问题的多个解的集合。 个体( i n d i v i d u a l ) :所处理的基本对象、结构,即组成种群的每一个解,种 群是由个体所组成。 演化代( g e n e r a t i o n ) :算法迭代步。 父代( p a r e n t ) 及子代( o f f s p r i n g ) :根据某种规则来产生下一代个体的个体称 为其下一代个体的父代,产生出的下一代个体称为它的子代。 群体规模( g e n e r a t i o ns i z e ) :种群内个体的数目。 位串( b i ts t r i n g ) :个体的表示形式,即组成个体的串。 基因( g e n e ) :位串中的元素,表示不同的特征。 染色体( c h r o m o s o m e ) :经过编码后得到的代表问题的解的串称为染色体。每 个个体实际上是染色体带有特征的实体。 编码( c o d i n g ) :在使用g a 解决问题之前,需要将问题的解进行编码,即将问 题的解通过变换映射到基因空间,作为g a 的搜索空间,基因空间中的点通常 是字符串的形式,最简单的是用 0 ,1 ) 定义的二进制串。 解码( d e c o d i n g ) :编码的逆过程。末代种群中的最优个体经过解码得到的解 可以作为问题的近似最优解。 适应度( f i t n e s s ) :个体适应环境的程度( 与最优解接近的程度) 称为适应度。 适应度较高的个体将获得更多的繁殖机会。 选择( s e l e c t i o n ) :又称复制,是一种在有限空间上的排他性的竞争,以一 定的概率从种群中选择若干个体的操作。一般而言,选择的过程是一种基于 适应度的优胜劣汰的过程,指从种群中选择若干个体直接插入到新一代种群 中去的操作。 1 4 内蒙古师范大学硕士学位论文 交叉( c r o s s o v e r ) :又称为杂交或基因重组,在两个染色体的某一个或某几 个相同位置进行切断,将各子串分别交叉组合形成两个新的染色体的过程。 变异( m u t a t i o n ) :指染色体的基因发生某种改变,从而产生出新的染色体的 过程。 遗传算子( g e n e t i co p e r a t o r s ) 即遗传操作,包括复制、交叉、变异等。 2g a 的基本步骤 ( 1 ) 选择编码策略,将参数集合域转化为位串结果空间; ( 2 ) 定义适应度函数f ( x ) ; ( 3 ) 确定遗传策略,包括选择群体规模大小,以及选择、交叉和变异等方法: ( 4 ) 随机初始化生成种群; ( 5 ) 确定适应度,计算种群中个体解码后的适应值f ( x ) ; ( 6 ) 按照遗传策略,将遗传算子作用于种群,产生下一代; ( 7 ) 判断群体性能是否满足某一目标,或者已完成预定迭代次数,不满足 则返回步骤( 6 ) ,或者修改遗传策略再返回步骤( 6 ) 。 3b a 的基本流程框图 ( 二) g a 的规则 1 遗传编码 图3 - 1g a 的基本流程框图 g 在1 1 1 t 中2 p l m 参数估计中的应用研究 按照g a 的工作流程,当用g a 求解问题时,必须对目标问题实际表示与g a 的染 色体位串结构之间建立联系,确定编码和艇码运算,以实现解空间到g a 搜索空间的 映射。 基本g a 使用二进制编码将求解问题的解空间映射到位串空间,然后在位串空间 进行遗传操作,将褥到的结果再进行解码还原成其表现型以进行适应度的评价。二进 制串的长度取决于变量的定义域及变量所需的精度。假设连续实函数f ( x ) ,变量x 的定义域为 u ,v ,那么采用编码长度为l 的二进制串进行定长编码,建立位串空间: s l = 伽1 ,4 2 ,) ,a k = ( a k l , a k 2 c ,a k ) ,a k 0 ,1 , k = 1 ,2 ,k = l ,2 ,l k = 2 0 其中,个体的向量表示为a k = ( a k l , a 也,a 肼) ,其字符串形式为a k l a 乜a “, 从右到左依次表示低位到高位,这种表示方法变量的精度为 6 = 拦( 3 1 ) 将位串个体从位串空间转化成问题参数空间的解码函数1 1 : 0 ,1 ) l 一【u ,v 】的 公式定义为: x t2 氓,a 也,a n ) = u + 拦( 善lak j 2 h ) ( 3 2 ) 2 适应度函数的设计 g a 在进行搜索时基本不用外部信息,仅以目标函数即适应度函数为依据,它是在 适应度函数的指导下进行搜索,而不是穷举式的全面搜索。g a 的适应度函数不受连 续可微的约束且定义域可以为任意集合,它是将问题空间表示为染色体位串空间,为 了执行适者生存的原则,必须对个体位串的适应性进行评价,其个体适应度的大小决 定了它们是继续繁衍还是消亡,相当于是自然界中各生物对环境适应能力的大小,而 适应函数是构成个体的生存环境。 3 遗传操作( 遗传算子) g a 的操作算子一般包括选择( 或复制) 、交叉( 或重组) 和变异三种基本形式, 内蒙古师范大学硕士学位论文 它们构成了g a 具备强大搜索能力的核心,是模拟自然选择以及遗传过程中发生的繁 殖、杂交和突变现象的主要载体1 。g a 利用遗传算子产生下一代群体实现群体进化, 算子的设计是遗传策略的主要组成部分。 ( 1 ) 选择( s e l e c t i o n ) 从当前群体中选择优胜的个体( 适应度高的个体) 以生成交配池的过程,适应值 比例选择是最基本的选择方法,其中每个个体被选择的期望数量与其适应值和群体平 均适应值的比例有关,通常采用轮盘赌( r o u l e t t ew h e e l ) 方式实现。这种方式首先 针算每个个体的适应值,然后计算出此适应值在群体适应值总和中所占的比例,表示 该个体在选择过程中被选中的概率。选择过程体现了生物进化过程中的“适者生存, 优胜劣汰”的思想,并且保证了优良基因遗传给下一代。 对于给定规模为n 的群体p = a - ,a 2 ,a a ) ,个体a ,的适应值为f ( a j ) ,其选 择概率为: 导。o l ,j = 1 ,2 ,n 芝f ( a j ) 通过g a 进行选择的同时,通常加入期望值方法来计算群体中每个个体在下一代 生存的期望数目: m :耋。 三 f ( a j ) n 个体i 的期望数就是个体在下一代群体中出现的个数。 ( 2 ) 交叉( c r o s s o v e r ) 交叉操作是g a 具备原始性的独有特征。g a 交叉算子是模仿自然界有性繁殖的基 因重组过程,其作用在于将原有的优良基因遗传给下一代个体,并生成包含更复杂基 因结构的新个体。交叉算子的具体操作为:从种群中随机取出需要交叉的一对个体; 根据位串的长度l ,随机选取 1 ,l 一1 中一位作为交叉位置;根据交叉概率p c ( 0 p c 1 ) 实施交叉操作,交叉个体按照交叉概率在交叉位置处相互交换各自的部分内容, 从而形成新的一对个体。 ( 3 ) 变异( m u t a t i o n ) 1 7 g a 在r r t 中2 p l m 参数估计中的应用研究 变异操作是模拟自然界生物体进化中染色体上某位基因发生的突变现象,从而改 变染色体的结构和物理性状。在g a 中,变异算子通过按变异概率随机反转某位基因 的二进制字符值实现( “0 ”变“1 ”,“1 ”变“0 ”) 。 g a 中,交叉算子因其全局搜索能力而作为主要算子,变异算子因其局部搜索能力 而作为辅助算子。g a 通过交叉和变异这一对相互配合又相互竞争的操作而使其具备 兼顾全局和局部的均衡搜索能力。 ( 三) g a 的特点 g a 具有如下的特点噙1 : ( 1 ) 自组织、自适应和自学习性( 智能性) 。应用g a 求解问题时,在编码方案、 适应度函数及遗传算子确定后,算法将利用进化过程中获得的信息自行组织搜索。由 于基于自然的选择策略为“适者生存,不适应者被淘汰”,因而适应度大的个体具有 较高的生存概率。通常,适应度大的个体具有更适应环境的基因结构,再通过基因重 组和基因突变等遗传操作,就可能产生更适应环境的后代。进化算法的这种自组织、 自适应特征,使它同时具有能根据环境变化来自动发现环境的特性和规

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论