




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
岩石力学反问题吕爱钟岩石力学反问题1第一章绪论
第一节反问题第一章绪论
第一节反问题2一、反问题的内容及特点一、反问题的内容及特点3
固体力学的正问题是指在物体的几何形状、材料性质及外荷载已知的情形下,求其物体内部的应力分布与变形规律。而相应的反问题是指正问题中的某些待求量通过实地量测或人为指定变为已知量,而某些已知量作为待求量。固体力学的正问题是指在物体的几何形状、材料性质及外荷载已4
近几年固体力学所关心的反问题有孔形优化问题,即已知材料性质及外荷载,如何设计孔洞的形状,使孔洞周边或孔外域的二次应力场(或位移场)满足预先指定的要求。孔形优化问题也是岩石力学工作者所关心的一类反问题,它可以指导我们如何开挖巷道,使巷道在有一定工作空间的要求下处于最佳的受力状态,以利于巷道的维护。近几年固体力学所关心的反问题有孔形优化问题,即已知材料性5
矿山岩石力学所关心的第二类反问题是:已知巷道的开挖形状,根据实地量测的变形规律(位移场),求其描述这个系统的最佳模型及模型参数(岩石的性质参数)或原始地应力场,这类反问题称为位移反分析。矿山岩石力学所关心的第二类反问题是:已知巷道的开挖形状,6
在数学中我们早就接触过反问题,例如,在初等代数学中已知方程求根若称为正问题的话,那么由根求方程的系数就是代数方程的反问题;在矩阵论中,由矩阵求特征值也对应着它的反问题——已知特征值反求矩阵。在数学中我们早就接触过反问题,例如,在初等代数学中已知方7
由“结果”推断“原因”的反问题在人类认识自然与改造自然中起到了重要的作用,例如,遥测与遥感技术是通过接收回波(反射波)信息去判断人们感兴趣的物体的形状,地球物理勘探中的反问题就是借助于地球表面接收到的主动场或被动场的数据,经过处理判断地层的结构。由“结果”推断“原因”的反问题在人类认识自然与改造自然中8
应用反问题思想解决实际问题的例子比比皆是,例如:(1)各类案件的侦破(2)建筑质量的判断(3)各类设备故障原因的调查与确定(4)各类事故的调查与责任的判定(5)考古研究(6)内科大夫看病应用反问题思想解决实际问题的例子比比皆是,例如:9
以往在矿山岩石力学中实际上也求解了一些反问题,例如,利用应力解除法求原始地应力,就是通过量测应变或位移反求荷载,平板试验就是利用量测位移反求岩体性质参数,所采用的求解方法都为逆法,只是未被普遍认识。以往在矿山岩石力学中实际上也求解了一些反问题,例如,利用10
由“结果”推断的“原因”可能解不唯一(多解性),即某一特定“结果”可能引起的“原因”有多种,这是反问题的一类不适定性,反问题还可能具有解的不存在性和解的不稳定性这些特点,如果反问题的提法不正确,可能会导致反问题的解不存在,反问题的不稳定性是指实测资料有一定的微小误差时,反求出的结果产生很大偏差,甚至无法控制。如果反问题的解存在,唯一且稳定,则我们称反问题为适定的。由“结果”推断的“原因”可能解不唯一(多解性),即某一特11
不适定问题的解法研究已成为计算数学中心问题之一,在这一领域中理论上作出重要贡献的是原苏联学者古洪诺夫,1974年他出版了“不适定问题的解法”一书,这是有关这方面的第一本专著,美国、中国相继翻译成英文、中文出版。不适定问题的解法研究已成为计算数学中心问题之一,在这一领12二、研究岩石力学反问题的意义二、研究岩石力学反问题的意义13巷道形状优化设计(孔形优化)是一项很有实际意义的工作,它可以指导我们如何设计巷道断面使巷道在有一定工作空间的要求下,处于容易维护的状态,达到既安全又经济的目的。巷道形状优化设计(孔形优化)是一项很有实际意义的工作,它可14
孔形优化是在岩石性质参数及原始地应力已知的条件下进行的,岩石的性质参数及地应力的确定是解决岩石力学问题的关键所在,岩石力学工作者多年来一直在专门研究这个问题,但效果并不理想。岩石性质参数的确定一般都是在实验室或现场试件进行的,试件尺寸与巷道尺寸比较仍然太小,试件不能反映实际岩体的结构,试件的受力状态与巷道的实际受力状态相差很大,这样根据试件确定的岩石性质参数对于解决实际的岩石力学问题,其结果相差很大。孔形优化是在岩石性质参数及原始地应力已知的条件下进行的,15
计算结果与实际量测结果相差很大的原因并非完全是由以上原因引起的,通常的原始地应力测定可靠性较差或者是选择的力学模型不正确都可以造成很大的误差。以往求解岩石力学问题的主要特点是把力学模型的选择、岩石性质参数及地应力的确定三个过程单独进行的。现在,有了位移反分析我们可以直接利用实地量测的变形规律,根据选择的力学模型同时求出岩石性质参数及原始地应力。计算结果与实际量测结果相差很大的原因并非完全是由16
实地量测就是一个最反映实际情况的现场试验,究竟采用何种力学模型这不能凭空事先决定,而必须由实地量测的变形规律在已知的一组模型里求出与实际变形规律最接近的最佳模型,这就是模型鉴别的内容。求出了模型(包括参数)和原始地应力,我们再按正问题去计算,预测以后开挖所表现的各种力学行为。实地量测就是一个最反映实际情况的现场试验,究17
确定支护结构上的荷载,这是地下结构设计与地面结构设计的最大不同点,对于地面结构所承受的荷载较易确定,而地下支护结构所承受的荷载是不能事先知道的,结构承受的荷载取决于结构与岩体的相互作用,它的大小及分布规律与岩体性质、原始地应力场、支护刚度及支护时间等多种因素有关,分析结构与岩体的相互作用,要利用岩体和结构的力学模型,但由于目前岩体力学模型的研究尚未成熟,故根据相互作用从理论上精确给出结构上的荷载是困难的。确定支护结构上的荷载,这是地下结构设计与地面18
现在有了位移反分析,我们可以在可靠性较高的结构模型的基础上,利用结构上的位移量测值反求结构上的荷载,当结构的力学模型正确时,反算的荷载是可信的。现在有了位移反分析,我们可以在可靠性较高的结构模型的基础19长期以来,地下结构的荷载缺乏合适的确定方法,设计主要依靠经验类比,从而往往导致安全储备不足而破坏或者安全储备过大而严重浪费。目前,位移反分析已广泛应用于岩体的力学性质参数及原始地应力的辨识。当然,利用位移反分析也可以辨识出支架上的荷载。长期以来,地下结构的荷载缺乏合适的确定方法,设计主20根据岩石力学的发展水平,地下结构上荷载的确定可划分为三个阶段:第一阶段(上世纪末和本世纪前半叶),沿用地面结构的特点,地下结构被看作仅是承受荷载的结构,荷载大小(为了区别,这里的荷载称为主动荷载)是根据当时的地压假说来确定。假定地下结构本身对作用在其上的荷载大小和分布不产生影响,在地压计算中不考虑地下结构的变形,即不考虑围岩抗力(围岩抗力称为被动荷载)。比较有影响的地压假说是冒落拱假说和压力拱假说。根据岩石力学的发展水平,地下结构上荷载的确定可划21第二阶段(自本世纪30年代起),与第一阶段不同的是考虑在主动荷载作用下地下结构的变形,其特点是作用在地下结构上的荷载由主动荷载和被动荷载组成。主动荷载仍根据地压假说确定;被动荷载是根据围岩限制地下结构在主动荷载作用下产生的变形而引起的抗力来确定。围岩抗力通常根据熟知的文克尔(E.Winkler)假设(围岩的弹性抗力与结构变位成正比)计算。第二阶段(自本世纪30年代起),与第一阶段不同的是22第三阶段(现代阶段),不再区分主动荷载和被动荷载,地下结构的荷载根据围岩支架共同作用原理来确定。即,给定支架、围岩的力学模型,通过计算围岩对支架的作用力来确定地下结构受到的荷载。常用的力学模型有弹性模型、弹塑性模型及粘、弹塑性模型等。第三阶段(现代阶段),不再区分主动荷载和被动23从理论上讲,根据支架围岩共同作用原理确定地下结构的荷载是完善的。这样获得的荷载能够综合反映岩体性质、原始地应力、地下结构的性质及开挖与支护间隔时间等多种因素的影响,不仅能够得到地下结构的法向荷载而且能够得到其切向荷载,克服了直接按主动荷载和被动荷载确定地下结构荷载的不足。但是,由于岩体是地质介质,其力学性质具有非均质、各向异性、流变性质等特性,更重要的是岩体是裂隙体,即岩体中含有断层、节理、裂隙等不连续面,因此,至今未能建立起符合实际情况的力学模型,故此,难以根据围岩支架共同作用原理有效地确定地下结构的荷载。从理论上讲,根据支架围岩共同作用原理确定地下结构的24此外,人们曾通过在衬砌与围岩之间埋设测压元件直接量测地下结构的荷载。由于测压元件的刚度与围岩的刚度不匹配,测压元件的存在扰动了地下结构上的荷载分布,因此,通过测压元件量测得到的地下结构荷载不可靠,而且该方法不能量测地下结构的切向荷载,此外该法费用较高。此外,人们曾通过在衬砌与围岩之间埋设测压元件直接量25上述确定地下结构荷载的三个阶段都是沿用地面结构设计的思路——先确定荷载,再进行结构设计、计算。地下工程的特点是应先求反问题再求正问题。这里的反问题指,通过量测受载后支架上某些点间的相对位移,反算支架的荷载。上述确定地下结构荷载的三个阶段都是沿用地面结26第二节系统辨识和参数辨识第二节系统辨识和参数辨识27如果把所讨论的对象作为一个系统的话,则正问题是指已知描述系统的模型及输入,求输出,如图1.1所示,在这种情况下,不但模型结构是已知的,而且所有有关的参数也是已知的。而反问题是指通过量测输出,来求系统的模型或模型参数,有些情况下,当模型和模型参数已知时,反问题是指由输出求输入。按对系统的了解程度,反问题可分为系统辨识和参数辨识两类。如果把所讨论的对象作为一个系统的话,则正问题是指已知描述28一、系统辨识一、系统辨识29
系统辨识是通过量测得到系统的输出和输入数据来确定描述这个系统的数学方程,即模型结构。为了得到这个模型,我们可以用各种输入来试探该系统并观测其响应(输出),然后将输入——输出数据进行处理来得到模型。系统辨识是通过量测得到系统的输出和输入数据来确定描述这个30
近年来,系统辨识的应用领域日益扩大,在通信工程、航空航天工程、地质学、经济学、生物学、医学等方面都得到应用,各个领域都在利用系统辨识方法建立各自系统的定量模型,从而由定性到定量地解决实际问题,另一方面,也由于现代计算工具发展,使许多问题可以通过计算机加以解决,这又推动了系统辨识的发展。近年来,系统辨识的应用领域日益扩大,在通信31
基于对系统先验信息的了解程度,我们可以把系统辨识问题分为两类:“黑箱问题”:也叫完全辨识问题,在这种情况下,被辨识的系统的基本特性是完全未知的。例如,系统是线性的还是非线性的,是动态的还是静态的,对这些基本的信息都一无所知,要辨识这类系统当然是很困难的,目前尚无有效的办法。基于对系统先验信息的了解程度,我们可以把系统辨识32
“灰箱问题”又叫不完全辨识问题,在这一类问题中,系统的某些基本特性(例如线性)为已知的,不能确切知道的只是系统方程的阶次和系数。当然,这类问题比“黑箱问题”容易处理。幸好,许多工程上的辨识问题属于“灰箱问题”,这样,系统辨识问题就简化为模型鉴别和参数辨识问题了,参数辨识是系统辨识中最重要也是研究得最成熟的部分。“灰箱问题”又叫不完全辨识问题,在这一类问题中,33二、参数辨识二、参数辨识34
参数辨识是近几年发展较快的年轻学科,在各个领域都引起了重视,它的名字还没有完全统一起来,参数辨识的其它名字有非线性估计(nonlinearestimation)、非线性回归(nonlinearregression)、参数优化(optimizationofparameters),有的文献干脆称为建模(modelbuilding)或系统辨识(identificationofsystems)。“估计”是数理统计中的术语,“辨识”是电气工程上的术语。参数辨识是近几年发展较快的年轻学科,在各个领域都35
对于矿山岩石力学问题,我们一般把易量测的位移作为系统的输出,巷道及支护的形状、尺寸作为输入,与模型结构有关的变形参数可作为模型参数,地应力既可以作为输入,也可看作为待识别的参数。对于矿山岩石力学问题,我们一般把易量测的位移作为系统的输36
第二章参数辨识方法
的基础知识
第一节参数辨识的几个要素第二章参数辨识方法
的基础知识
第一节参数37一、模型一、模型38
在自然科学和工程领域中,模型的建立与实验、观察具有同等重要的地位,模型的建立是实验、观察、认识问题的一个飞跃。模型是实际系统“原型”的一种“类似”,它与“原型”必定存在一定的差别,任何原型都有数不清的层次和特征,能反映出原型一切特征的只能是原型本身,而不是模型。建模的目的不是将原型的一切方面都表达出来,模型只是在所要研究的主题范围内能表达人们最需要知道的那些特征即可,从而达到对原型的抽象,以模型为基础,较方便地对原型进行分析、研究,以便通过模型的预测结果来正确指导我们作出某种决策。在自然科学和工程领域中,模型的建立与实验、观察具有39模型的表达形式可以是概念性的、物理的或者是数学的,这取决于模型建立的特定目的。采用数学描述的形式所建立的模型我们称为数学模型,它是系统中的各个物理量之间的关系所构成的数学结构,象代数方程、微分方程等等。不言而喻,目前在岩石力学中采用的弹性模型、弹塑性模型、粘弹模型都为数学模型。模型结构的形式有:静态的或是动态的,线性的或是非线性的,参数是定常的或是时变的,确定型的或是随机型的,参数模型或是非参数模型。模型的表达形式可以是概念性的、物理的或者是数学的,这取决40二、参数和状态二、参数和状态41由常微分或偏微分方程给出的数学模型,有时它的解是一组比较简单的代数方程。在任何情形下,都有自变量和因变量以及一些常数。因变量有时称为状态变量(或信号),而常数称为参数。由常微分或偏微分方程给出的数学模型,有时它的解是一组比较42
在实验中,常常直接量测的是状态,而参数一般不能直接量测出来,参数只能由状态的量测值反求出来。有的教科书所关心的是参数估计问题,而有的教科书则侧重于状态的估计(预测)。参数估计与状态估计(预测)两个问题非常相似,在参数估计的同时,通常状态估计(预测)自动完成。在实验中,常常直接量测的是状态,而参数一般不能直接量测出43
参数和状态这两个概念可以由下面的简单例子说明之。例1:根据牛顿第二定律可知:ax(t)=mFx(t)这里Fx(t)是x方向的力,ax(t)是x方向的加速度,它们都是时间t的函数,m是质量。Fx(t),ax(t)我们可以看作为状态,而质量m则是参数。力和加速度通常可容易地通过量测获得。对此问题,质量不但可以根据力和加速度求得,而且也可以直接量测获得,但是对有些情况,质量则必须根据力和加速度推算而得,例如,要确定慧星和行星的质量就是一个例子,这时不可能直接量测而得它们的质量。参数和状态这两个概念可以由下面的简单例子说明之。44例2:以初速度v0垂直上抛一个物体,已知物体离开地面的距离s可由公式s=v0t-1/2gt2表示。这里g是重力加速度,它是一个参数,时间t为自变量,s是状态。v0既可看作为参数,也可看作为状态。例2:以初速度v0垂直上抛一个物体,已知物体离开地面的距离s45例3:一等截面拉杆,截面积为A,原长为L,它一端固定,一端受拉力P的作用(图2.1),每个截面都产生x方向的位移,距原点O,x处的截面位移为u(x):
u(x)=Px/EA这里u(x)为状态,x是自变量,E、A、P为参数,但A、P可直接量取获得,E必须由状态值求得。例3:一等截面拉杆,截面积为A,原长为L,它一端固定,一端受46
以上所举的这些参数与统计参数比较,一般称为物理参数,象量测误差的方差、相关系数这样的参数称为统计参数。物理参数和统计参数在某些问题中可能都要辨识,而我们最关心的是物理参数的辨识。以上所举的这些参数与统计参数比较,一般称为物理参47三、准则函数三、准则函数48若模型能精确地反映我们对“原型”所关心的那些特征,则模型的输出就是系统的实际输出,如果对输出的量测值也不存在误差,且所讨论的反问题为适定的,则由量测的输出总可列出也只能列出与待辨识参数个数相等的独立方程,由这些方程即可唯一地求出待求的参数。若模型能精确地反映我们对“原型”所关心的那些特49
实际上,由于模型的近似性和量测误差的存在,则按以上方法求得的参数不能很好地反映整个系统的特征。如何能够求出反映整个系统的最优参数呢?最直观的做法是:量测的数量必须大大地超过待求参数的个数,这样可以降低量测噪声对待求参数的影响,这样列出的方程个数多于待求的参数个数,所得的方程组为矛盾方程组,通过适当的最优化技术可以求解这样的问题,使得在某种意义下求得的参数为最优参数。如何衡量最优?最优准则如何确定?这是参数辨识首先要解决的问题。实际上,由于模型的近似性和量测误差的存在,则按以上方法求50
我们一般把最优化准则称为准则函数,记为J。准则函数总体上可分为两大类,一类是以输出信号为基础的准则函数,一类是以量测误差或参数的概率统计性质为基础的准则函数,后面我们将分别称为第一类和第二类准则函数。我们一般把最优化准则称为准则函数,记为J。准则函数总体上51
第一类准则函数一般表示为系统的实际输出量测值y(t)和模型的输出η(t)的偏差的某个函数,例如,可取等一些误差函数作为准则函数。式中:n为量测数量,η(ti)是输入和参数的函数,给定模型结构也就是知道了η(ti)的函数形式,t是自变量。对于以时间作为自变量的模型,ti表示第i时刻,对于以位置作为自变量的模型,ti表示第i个位置。y(ti)是已知的量测值,当输入为已知时,显然,准则函数J的大小随着所选的模型参数不同而不同,当J达到最小值时的参数即为最优参数。第一类准则函数一般表示为系统的实际输出量测值y(52
对于第一类准则函数,参数辨识实际上可作为一个最优化问题处理,即通过所选的准则函数如何寻求使准则函数达到极小的参数值。就此而言,准则函数称为目标函数。根据求解的问题不同,在不同场合下J往往还有其它的名字,例如误差函数、损失函数、成本函数等等。对于第一类准则函数,参数辨识实际上可作为一53以量测误差或参数的概率统计性质为基础的第二类准则函数的参数辨识,事先考虑了输出信号量测误差的统计特性,把待求参数作为确定性常数或随机变量。参数的最优并不是象第一类准则函数直接以输出的偏差最小为衡量准则,而是以参数误差(参数真值与参数估计值的差)为最小或以特定输出量测值出现可能性为最大等概率统计特性为衡量准则。
对于第二类准则函数,参数辨识作为估计问题处理,参数估计的具体实现同样离不开最优化技术。以量测误差或参数的概率统计性质为基础的第二类准则函数的参数54
两类准则函数相比,由于后者利用了一些概率统计知识,所以后者比前者的最大优点是可以计算量测噪声对参数辨识的影响程度,有时所求出的参数估计值具有较好的统计特性。两类准则函数相比,由于后者利用了一些概率统计知识,所以后55第二节参数辨识的方法分类第二节参数辨识的方法分类56参数辨识具有多种方法。根据不同的准则函数可得出一系列参数辨识法,例如,以第一类准则函数为基础的最小二乘法、加权最小二乘法,以第二类准则函数为基础的最小方差法、极大似然法、贝叶斯法等等。以第一类准则函数为基础的各种参数辨识方法统称为确定性方法,以第二类准则函数为基础的各种参数辨识方法统称为随机性方法。参数辨识具有多种方法。57
根据辨识的方式可分为离线辨识和在线辨识,所谓离线辨识是在全部量测数据的基础上求解模型参数;而在线辨识是指收集到新的量测值以后,就在前一次参数估计值的基础上立刻进行递推计算,尽快地给出新的估计值,例如,序贯最小二乘法就是一种在线辨识。准则函数选定以后,参数辨识的过程是寻求准则函数的极值点,对于岩土工程问题,根据问题的性质及寻求准则函数极值点的算法,参数辨识方法可分为逆法和正法两大类。根据辨识的方式可分为离线辨识和在线辨识,所谓离线58以第一类准则函数(2-1)为例说明逆法和正法。所谓逆法是指能把模型输出表示成待求参数的显函数,由模型输出的量测值,利用这个函数关系反求出待求参数,这个过程恰好与正问题的求解过程相反,逆法由此而得名。若考虑误差的存在,则这个方法的具体实施过程是这样的:由(2-1)的J达到极小值的必要条件(即J关于参数的一阶偏导数等于零)所列的方程组,求解待求参数。以第一类准则函数(2-1)为例说明逆法和正法。59
逆法的应用决定于模型输出是否能表示成待求参数的函数,以及函数关系的性质如何?当模型输出是参数的线性函数时,一般才利用逆法。此时,由极值必要条件所列的以参数为未知量的方程组为线性方程组,线性方程组的求解是轻而易举的事。逆法的应用决定于模型输出是否能表示成待求参数的函60
模型输出可以是待解的微分方程组,也可以是它的解析解。若已有解析解,参数辨识就可以以解析解为出发点,这时计算量少。若无解析解则需要以待解方程组及具体问题的定解条件为出发点,在岩土工程中,这是一种普遍情形,这时要利用有限单元法等数值方法。模型输出可以是待解的微分方程组,也可以是它61
正法与逆法不同,它不是利用极值的必要条件求出待求参数,而是首先对待求参数指定“初值”,然后计算模型输出值并和输出量测值比较,如果吻合良好,假设的参数“初值”就是要找的参数值,实际上当然不会这么巧,这时修改参数值,重新计算模型输出值,重新比较一直到准则函数达到极小值,此时的参数值即为所要求的参数。若模型输出是待解的微分方程组,则由参数“初值”计算模型输出是求解正问题,由此看出此时的参数辨识过程是解一系列正问题,正法由此而得名。正法与逆法不同,它不是利用极值的必要条件求出待求62
可以看出,正法和逆法都是寻求准则函数的极小点,但寻求的算法不同。正法比逆法具有更广泛的适用性,它既适用于模型输出是参数的线性函数的情形,也适用于模型输出是参数的非线性函数的情形。它的另一个优点是仍可沿用现成的正问题计算方法及程序。
最优化技术中的直接法是求解正法的有力工具,模式搜索法(Hooke-Jeeves)(也有称步长加速法)、变量轮换法、单纯形法、鲍威尔(Powell)法等方法都是最优化技术中广泛应用的直接法。以上用第一类准则函数说明了正法和逆法,同样对第二类准则函数也存在正法和逆法。可以看出,正法和逆法都是寻求准则函数的极小点,但63第三节参数辨识方法简述第三节参数辨识方法简述64
本节主要讲述按第一、二类准则函数分类的各种参数辨识方法的基本思想,而不涉及方法的本身细节。本节主要讲述按第一、二类准则函数分类的各种参数辨识方法的65一、观测变量和参数之间的关系一、观测变量和参数之间的关系66一组可观测变量(y,x1,…,xk),一批参数(β1,…,βm)和一组随机变量(ε,ε(1),…,ε(p))总可以假定以一定的函数关系存在。这里,我们只讨论每次观测只包含一个随机变量的情形,即只有一个ε存在,其它的ε(1),…,ε(p)不考虑,不同次的观测用下标i区别,即第i次的观测包含的随机变量用εi表示。一组可观测变量(y,x1,…,xk),一批参数(67
选择一个量测变量y,并用其它量测变量x1,…,xk表示,即y=f(x1,…,xk;β1,…,βm;ε)(2-2)通常称y为因变量,称x1,…,xk为自变量。如果误差ε是可加的,即y=η(x1,…,xk;β1,…,βm)+ε(2-3)那么这是很幸运的,这对于我们求解问题是方便的,在式(2-3)中,ε的分布与未知参数β1,…,βm无关。选择一个量测变量y,并用其它量测变量x1,…,xk表68
把式(2-3)用矢量记法进行缩写对于书写是方便的,记
X=(x1,x2,…,xk)T则:第i次观测通过下标i表示,即yi=η(xi1,…,xik;β1,…,βm)+εi
=η(Xi;β)+εi=ηi+εi把式(2-3)用矢量记法进行缩写对于书写是方便的,记69
进行了n次量测,则有y1,…,yn,ε1,…,εn等等,为了书写更方便,则可记Y=(y1,…,yn)T
ε=(ε1,…,εn)T(X1,…,Xn)可写成矩阵形式,即X=[X1,…,Xn]T=进行了n次量测,则有y1,…,yn,ε1,…,εn等等70
ε的分布一般来说是未知的,如果εi(i=1,…,n)是相关的,那么以第二类准则函数为基础的参数辨识困难较大,本文主要讨论εi(i=1,…,n)不相关的情形。ε的分布一般来说是未知的,如果εi(i=1,…,n)是相71二、线性问题二、线性问题72如果能够把η(X;β)写成以下形式
η(X;β)=β1x1+β2x2+…+βmxm(2-4)即在同一时刻(或同一位置),模型输出η(X;β)是参数β的线性函数,则称式(2-4)为线性模型。对于线性模型,有
y=β1x1+β2x2+…+βmxm+ε(2-5)由式(2-5)来确定参数β的估计值,称为线性估计。如果模型输出η(X;β)是参数β的非线性函数,则称非线性模型,非线性模型的参数估计比线性模型的参数估计复杂。如果能够把η(X;β)写成以下形式73三、常规最小二乘估计
三、常规最小二乘估计
74已有一组量测值y1,…,yn则在模型结构已知的情形下可写出使式(2-6)达到极小值的称为参数估计值。这个参数估计方法称为常规最小二乘法(ordinaryleastsquaresmethod)。对于线性模型,由逆法可以求出的解析式,对于非线性模型,一般用正法求解。常规最小二乘法没有利用ε的概率统计特性。已有一组量测值y1,…,yn则在模型结构已知的情形下可写75四、高斯—马尔可夫估计(Gauss-markovestimation)四、高斯—马尔可夫估计(Gauss-markovestim76如果对于不同的量测时刻(或量测位置),式(2-5)中的εi(i=1,…,n)是不相关的,但εi的方差不尽相同,若令εi相应的方差分别为:σ12,…,σn2则可令准则函数为由(2-7)极小求出的参数估计值
一般比常规最小二乘法求得的参数估计值好,这是因为量测精度越高,相应的量测数据占的比重越大,这由式(2-7)可清楚看出(量测精度越高,误差εi的方差σi2越小)。如果对于不同的量测时刻(或量测位置),式(2-5)中的ε77五、最大似然估计(maximumlikelihoodestimation)
五、最大似然估计(maximumlikelihoodes78如果已知εi(i=1,…,n)的联合分布形式,那么yi(i=1,…,n)的联合分布即可确定,此时把参数作为未知的确定性常量,则yi的联合分布为条件分布,它可由概率密度函数p(Y/β)描述。由p(Y/β)极大求出的参数估计值称为参数β的最大似然估计。p(Y/β)即为准则函数。最大似然估计与εi(i=1,…,n)的分布有关,后面我们将会发现,如果εi是零均值同方差的独立正态分布(高斯分布)时,最大似然估计量与常规最小二乘估计量是相同的。如果已知εi(i=1,…,n)的联合分布形式,那么yi(79六、最大验后估计与贝叶斯估计六、最大验后估计与贝叶斯估计80如果随机变量ε的分布已知(并知道ε的分布参数,例如方差是已知的),待求参数β也为随机变量,并且它的概率密度函数p(β)(称为参数β的验前分布)也为已知,那么根据贝叶斯定理,我们可以获得最大验后估计(MAPestimation,MAP是MaximumAPosterior的简写)和贝叶斯估计(Bayes′sestimation)。最大验后估计量是根据验后分布p(β/Y)取极大值的条件求得的,它是观测值为Y的条件下,参数β的“最可能”数值。p(β/Y)即为准则函数。如果随机变量ε的分布已知(并知道ε的分布参数,例如方差是已81岩石力学反问题吕爱钟课件82
最大似然估计、最大验后估计、贝叶斯估计与最小二乘估计、高斯—马尔可夫估计一样,既适合线性模型的情形,也适合非线性模型的情形,但对于非线性模型,难于直接求出概率密度函数p(Y/β)或p(β/Y),所以此时的参数估计也存在一定的困难,它们可通过线性模型的估计值经多次迭代而求得。当模型结构和参数β的验前分布满足一定的要求时,最大似然估计量、最大验后估计量、贝叶斯估计量与最小二乘估计量、高斯—马尔可夫估计量是相同的。最大似然估计、最大验后估计、贝叶斯估计与最小二乘83第四节参数估计量的统计特性第四节参数估计量的统计特性84上节介绍的各种参数辨识方法,一种情形是事先把参数作为确定性的量,一种情形是事先把参数作为随机变量。而两种情形求出的参数估计量都是随机变量,后种情形是显然的。前种情形也不难理解,由n次量测可求出参数估计值,由于量测误差的存在,所求出的估计值不可能是参数真值,如果另取一组n个量测值去求参数,由于误差的随机性,则得到的和上次不同,所以说,尽管参数β本身不是随机变量,但是这样求出的估计量却总是随机变量。估计量是随机变量,必须从统计的观点分析,衡量估计量的优劣,无偏性、有效性和一致性是鉴别和比较估计量好坏的重要标准。上节介绍的各种参数辨识方法,一种情形是事先把参数作85一、无偏性一、无偏性86我们总是希望未知参数β与它的估计值在某种意义上最接近,当然作为某一次的估计值它与真值可能是不同的,然而,如果通过一系列试验求出的不同估计值,我们很自然地要求这些估计值的平均值与未知参数的真值相等,这就是说,要求参数β的估计量的数学期望(也有称数学期望为均值)等于参数的真值β,即如果关系式E()=β成立,那么我们称满足这种要求的估计量为参数β的无偏估计量。估计量的无偏性意味着无论重复多少次量测,要求估计值能在被估计参数的真值附近摆动,而其平均值就等于参数真值。我们总是希望未知参数β与它的估计值在某种意义上最接近,87二、有效性二、有效性88无偏性还不能完全决定估计量的性质,对于一个估计量,还需要进一步考虑到估计值和参数真值的平均偏离的大小,或者说估计值围绕真值摆动幅度的大小问题,方差能够反映估计值的这种离散程度,一个估计量的方差愈小,这个估计量取得接近它的数学期望的值就愈频繁,或者说未知参数的估计值处在它的真值附近的概率愈大。用不同估计方法得到的各种无偏估计中,某估计量的方差达到最小,则称该估计量为参数的有效估计。在参数β的所有无偏估计量中,可能存在一个方差最小的估计量,这个估计量叫做佳效估计量。无偏性还不能完全决定估计量的性质,对于一个估计量,89三、一致性三、一致性90一个估计量,不论它是无偏的还是有偏的,也不论它的方差大小如何,我们总是希望当量测次数增加时,对未知参数β的估计值会愈来愈精确。或者说,估计值会越来越靠近参数的真值。因此提出了估计量的一致性要求,按照数学定义,如果随着量测次数n增加,依概率收敛于β,则称为β的一致估计。一致性也有这样定义的:估计差-β的协方差矩阵cov[-β]作为估计值对真值的平均偏离程度的量度,若为无偏估计,则cov[-β]=E[(-β)(-β)T]。如果满足则就是β的一致估计,也有称是相容估计量。一个估计量,不论它是无偏的还是有偏的,也不论它的方差大小如91第三章简单线性模型
的参数辨识第一节引言第三章简单线性模型
的参数辨识第一节引92处理问题都是从简单到复杂,参数辨识也是一样,本章研究2个简单的线性代数模型的参数辨识问题,通过这些简单线性代数模型的讨论可以引出许多参数辨识有关的概念,对于非线性代数模型或者由微分方程表示的模型的参数辨识,在概念理解上没有增加任何复杂性。简单的代数模型除有利于教学外,实际上,在许多问题中也得到了广泛的应用。简单的代数模型也称为回归函数。本章只讨论以下两个模型:模型1ηi=β1xi
(3-1)模型2ηi=β1xi1+β2xi2
(3-2)变量η称为因变量,xi,xi1,xi2称为自变量,它可以表示时间、位置、温度等等。在这些模型中,自变量xi也可以是时间t(或位置等)的各种函数,或者是它们的某些组合。处理问题都是从简单到复杂,参数辨识也是一样,本章93在这些模型中,自变量xi也可以是时间t(或位置等)的各种函数,或者是它们的某些组合。本章讨论的误差一般假定是可加的,例如,对于模型1有:
yi=β1xi+εi
(3-3)这里εi是未知误差,yi是在xi时(处)的量测值。式(3-3)给出的模型可以表示下列两种情形:误差模型A,误差在量测中产生,即
ηi=β1xiyi=ηi+εi
(3-4)误差模型B,误差(噪声)在过程中,即
ηi=β1xi+εiyi=ηi
(3-5)这里ηi表示要量测的量,yi表示它的量测值。在这些模型中,自变量xi也可以是时间t(或位置等)94必须注意,在这些模型中有这样的假定:在xi中没有误差,即xi不是一个随机变量,而只有yi和εi是随机变量,在模型B中,ηi同样也是一个随机变量。在误差模型A中,只存在量测误差,而在ηi中不存在误差,为了确定εi,我们可以研究量测装置的误差特性,量测装置越精确,这些误差越小,随着技术不断改进,误差会愈来越小,系统模型本身假定是无误差的(无噪声的)是指对物理现象有充分的了解,以致于没有随机噪声参入ηi。必须注意,在这些模型中有这样的假定:在xi中没有95在误差模型B中,量测假定是无误差的,但模型(η)含有误差,误差是由某些随机性引起的,实际上,误差也可能是由于模型本身的近似性引起的。误差模型A和B分别表示了误差存在于量测中和模型中,实际上误差可以同时存在于量测和模型中。无论是误差模型A正确还是误差模型B正确,对于本章讨论的模型,参数辨识形式上是相同的,我们将把模型A作为本章讨论的模型。在误差模型B中,量测假定是无误差的,但模型(η)含96第二节常规最小二乘估计(简称OLS估计)第二节常规最小二乘估计(简称OLS估计)97常规最小二乘估计的准则函数由式(2-6)已经给出,即式中ηi是参数的函数,n表示n次量测,量测次数必须大于待求参数的个数。使(3-6)达到极小的参数值便为常规最小二乘估计量。常规最小二乘法的最早应用可以追溯到大约1795年,那时高斯为了完成行星轨道预测工作首先开创了此法,以后这种方法成为参数辨识的主要工具,虽然目前有其它几种方法可利用,例如,最大似然法、贝叶斯法等等,但最小二乘法仍然是工程师和科学家最熟悉的方法,这方法之所以普及,是因为它比其它方法容易理解,并且在获得参数估计量时不需要任何统计假设。但获得了参数估计量后,为了讨论估计量的统计特性,这时量测误差的统计信息必须给出。常规最小二乘估计的准则函数由式(2-6)已经给出98岩石力学反问题吕爱钟课件99由xi时(处)的量测值yi,我们求得了参数估计值,在xi处模型输出的估计值我们可以根据模型求出,此时模型中的参数用估计值代替。用yi*表示xi处的估计值,则估计值为yi*=β1*
xi
(3-10)设xi处的量测值yi减去估计值yi的差为ei,则ei=yi-yi*
(3-11)ei称为残差,注意ei不等于误差εi,但ei能够用来估计εi。由xi时(处)的量测值yi,我们求得了参数估计值,在100(一)估计量的均值和方差若误差εi是可加的,有零均值,且β1不是随机变量,由此我们可以求得模型1的参数估计值β1*的均值为
E(β1*)=(∑xi2)-1∑xiE(yi)=(∑xi2)-1∑xiβ1xi=β1因此,在以上所述的假设下,最小二乘估计β1*是无偏估计。若再假定误差εi是互不相关的且具有相同的方差,则可求得β1*的方差为
V(β1*)=(∑xi2)-2∑xi2σ2=σ2(∑xi2)-1
(3-12)从(3-12)可以看出:量测次数越多,估计量的方差越小,当xi满足一定的取值要求时,有
,这说明β1*是一致估计量。随着量测次数的增多,估计精度越来越高,这自然要求量测误差满足以上的假定,例如,量测是相关的,则以上结论不一定成立。同样必须注意,对于该模型有一个优化的量测位置,当量测位置(时刻)取在xi值较大处时,估计值的方差(3-12)越小,这样(3-12)给我们提供了最优量测位置,根据估计值方差安排量测位置,这是优化实验设计的内容。(一)估计量的均值和方差101(二)例题轴对称圆形巷道径向位移计算公式为此式是按平面应变条件求得的,式中μ为围岩的泊松比,E为围岩的弹性模量,R0为巷道半径,P0为原始地应力,r为围岩内任一点距巷道中心的距离。现假设ri处的径向位移uri量测值为yi,围岩的弹性模量和泊松比是已知的,根据yi使用常规最小二乘法确定原始地应力P0的估计值P0*。(二)例题102(3-23)表示的模型,在E、μ、R0已知的情况下,符合模型1的情形,即β1=P0,xi=(1+μ)R02/(Eri),则直接利用(3-9)可得P0*的方差可由(3-12)得到由此可以看出,ri越小,V(P0*)越小,即量测点越靠近巷道周边估计值P0*的方差越小,从而估计精度越高;反之,ri越大,V(P0*)越大,即量测点越远离巷道,估计值P0*的方差越大,从而估计精度越差。(3-23)表示的模型,在E、μ、R0已知的情况下,103第三节最大似然估计(maximumlikelihoodEstimation)第三节最大似然估计(maximumlikelihood104最大似然估计在估计理论中是一个很老的估计方法,1906年弗希尔(R.A.Fisher)首先使用了这个方法。为了方便,我们把最大似然估计简记为ML估计。ML估计是在量测误差分布已知的情形下的参数估计,它利用了有关量测的所有信息。ML估计的前提条件为:误差是可加的,即yi=η(Xi;β)+εi;式中的误差εi(i=1,…,n)是相互独立的正态分布,且有零均值和已知方差σi2;参数β是确定性的量,即不是随机变量。因ε1,…,εn是n个随机变量,则由以上的假定知:y1,…,yn也是n个随机变量。一次试验所获得的n次量测只是n个随机变量的样本值y1,…,yn,这里随机变量和样本使用同一符号yi(i=1,…,n)。最大似然估计在估计理论中是一个很老的估计方法,1906年弗105
量测值yi是随机变量是指在同样的条件下,重复量测所得的各次量测值也会各不相同。这意味着同一观测者使用相同的仪器,如果试验是可重复的,那么在同一时刻(或位置)的量测值也可能是不会相同的,这主要是偶然误差引起的,例如,观测者本身感官分辨本领的限制,就是偶然误差的一个来源。
为了辨识参数,对系统输出进行了n次量测yi(i=1,…,n),因εi(i=1,…,n)是相互独立的,则这n次量测是相互独立的,每个yi的概率密度函数可由εi的概率密度函数确定,yi(i=1,…,n)的联合概率密度函数称为样本的似然函数。因yi(i=1,…,n)是相互独立的,则样本的似然函数为每个yi的概率密度之积,即量测值yi是随机变量是指在同样的条件下,重复量测所得的各次106对于一组给定的量测值y1,…,yn,似然函数(3-34)只是未知参数β的函数,选择使似然函数取得最大值的参数β*作为参数的估计值,这是很自然的一种选取估计值的办法,称β*为β的最大似然估计,即ML估计。(3-34)表示的似然函数即为ML估计的准则函数,使准则函数达到最大的似然估计β*应当是方程的解。由于似然函数L是多个因子的乘积,利用对数lnL进行计算比较方便(lnL是单调函数,并且当L为最大时,lnL也为最大,所以这样做是可行的),所以通常解似然方程以求得ML估计β*。对于一组给定的量测值y1,…,yn,似然函数(3-34)只107由ML估计的前提条件可知εi的概率密度函数为
在yi=η(Xi;β)+εi中,εi的概率密度函数已知,η(Xi;β)是非随机的确定性量,则可以求出yi的概率密度函数为这样似然函数可根据式(3-36)写出由ML估计的前提条件可知εi的概率密度函数为108式(3-37)两边取对数,可得式(3-37)两边取对数,可得109岩石力学反问题吕爱钟课件110第四节最大验后估计(贝叶斯估计)第四节最大验后估计(贝叶斯估计)111在最大似然估计中,利用了有关量测的所有信息,认为误差是可加的,误差εi(i=1,…,n)是相互独立的正态分布,且有零均值和已知方差,事先把参数β作为是确定性的量。而在本节讨论的最大验后估计中,除把参数作为随机变量外,其它假设条件与最大似然估计相同。在以上假设条件下,同样可求出yi(i=1,…,n)的联合概率密度函数p(y1,…,yn/β),在求p(y1,…,yn/β)的时候把β作为常量,这时求得的p(y1,…,yn/β)与最大似然估计中求得的p(y1,…,yn/β)完全相同。在最大验后估计中,只知道p(y1,…,yn/β)还不够,还必须知道参数β的概率密度函数p(β),p(β)称为验前分布,这里我们假定p(β)是已知均值和方差的正态分布。在最大似然估计中,利用了有关量测的所有信息,认为误差112
在p(Y/β)[p(Y/β)是p(y1,…,yn/β)的简写]和p(β)已知的情形下,贝叶斯给出了验后概率密度函数p(β/Y),p(β/Y)表示当量测结果恰好为某一组特定值的条件下,参数β的概率分布,即使式(3-49)达到极大值的β*称为最大验后估计,简记为MAP估计,因MAP估计是以贝叶斯公式(3-49)为基础的,所以也有称MAP估计为贝叶斯估计(Bayes′sestimation)。在p(Y/β)[p(Y/β)是p(y1,…,yn/β113式(3-49)给出的验后概率密度函数为贝叶斯估计的准则函数,它比ML估计的准则函数(似然函数)多了两项p(β),p(Y),并且p(Y/β)和p(β)是相乘的,不言而喻通过式(3-49)求MAP估计比ML估计要复杂。本节我们只讨论模型1:ηi=β1xi,在此β1是随机变量,贝叶斯估计除上面已给的假设条件外,还有一条假设,即β1与εi(i=1,…,n)相互独立,由此可以得到β1与εi不相关,由独立性可以推出不相关性,但是反过来不一定成立,不过当β1和εi都为正态分布时,独立性与不相关性却是一致的。式(3-49)给出的验后概率密度函数为贝叶斯估计的114因p(β1)为正态概率分布,有E(β1)=μβ,V(β1)=Vβ,p(εi)也为正态概率分布,并有E(εi)=0,V(εi)=σi2,所以由yi=β1xi+εi知,在β1和εi互相独立的条件下,yi也服从正态分布,这可由数理统计中已知的定理得证。定理:若ξ1和ξ2是两个互相独立的正态变量,其概率密度函数分别为N(ξ1,μ1,σ12)和N(ξ2,μ2,σ22),则随机变量ξ=ξ1+ξ2也服从正态分布,其均值及方差分别为ξ1和ξ2的均值及方差之和,即ξ=ξ1+ξ2~N(ξ,μ1+μ2,σ12+σ22)在此不给出定理的证明,这里我们利用了N()表示概率密度函数。因p(β1)为正态概率分布,有E(β1)=μβ,V(β1)115对于我们的问题yi=β1xi+εi,这与ξ=ξ1+ξ2的形式大体相同,稍有不同的是,β1xi项为一随机变量β1与一确定性量xi之积。我们知道,β1的概率密度函数已知,则可求出β1xi的概率密度函数为p(β1xi)=1/|xi|p(β1/xi),式中p(β1/xi)与p(β1)的形式完全相同,不同的是把p(β1)中的β1换为β1/xi,这说明p(β1/xi)与p(β1)为同分布,即都为正态分布,但分布的均值和方差不同。由此证明了yi也服从正态分布。对于我们的问题yi=β1xi+εi,这与ξ=ξ116因即p(β1xi)的均值和方差分别为μβxi和Vβxi2,这个结果实际可以更方便地求出为:E(β1xi)=xiE(β1)=xiμβV(β1xi)=xiV(β1)=xi2Vβ这样yi的均值和方差可根据定理和已知条件求得
E(yi)=E(β1xi)+E(εi)=xiμβ+0=xiμβV(yi)=V(β1xi+εi)=V(β1xi)+V(εi)=xi2Vβ+σi2因117由此可以写出yi的概率密度函数则yi的联合概率密度函数为式(3-49)中的p(Y/β)在式(3-37)中已经给出,将ηi=β1xi代入,则由此可以写出yi的概率密度函数118验后概率密度函数p(β/Y)即为式(3-54)与式(3-50)之积并除以式(3-53)。因式(3-53)中不含有参数β1,故在求使p(β/Y)达到极大值的β1*时,可去掉p(Y)。这样准则函数变为式(3-54)与式(3-50)之积,即在上式两边取对数得验后概率密度函数p(β/Y)即为式(3-54)与式(119岩石力学反问题吕爱钟课件120因所以β1*为β1的无偏估计,这与以前定义的无偏估计稍有不同,那时无偏估计的条件是:E(β1*)=β1,β1是确定性量。对于贝叶斯估计,β1是随机变量,所以按E(β1*)=E(β1)定义无偏估计是合理的。因121岩石力学反问题吕爱钟课件122在推导(3-61)的过程中,利用了V(-β1)=V(β1),对于OLS估计和ML估计,若也求β1*-β1的方差,则因β1为确定性量,故V(β1*-β1)=V(β1),即β1*的方差与估计误差的方差相同。由式(3-61)可以看出:量测次数越多,越大,则V(β1*-β1)越小,这说明量测次数越多,估计的精度越高。另外,量测次数越多,参数β1的先验信息Vβ-1对式(3-61)的影响相对削弱。在推导(3-61)的过程中,利用了V(-β1)=V(123将式(3-61)和式(3-44)比较可知,贝叶斯估计的误差方差总小于ML估计的误差方差,就此而言,贝叶斯估计优于ML估计。从式(3-59)可以看了,若Vβ=∞,那么可得式(3-62)表示的估计量β1与式(3-43)表示的估计量完全相同。Vβ=∞表明我们对参数β1的验前信息毫无了解,这是贝叶斯估计(MAP估计)的一种特殊情形,此时参数估计值与ML估计值完全相同,不言而喻,当σi2=σ2时,此时的贝叶斯估计与常规最小二乘估计也是相同的。将式(3-61)和式(3-44)比较可知,贝叶斯估计的误差124第四章线性模型参数辨识
的矩阵方法
及非线性模型参数辨识方法
的最优化方法第四章线性模型参数辨识
的矩阵方法
及非线性模型参125第三章讨论的线性模型参数辨识是在模型参数不多于两个(而本次课讨论了只有一个模型参数)的情形下进行的。对于许多问题,模型的参数往往多于两个,这时根据第三章求解问题的思路当然也可以得到这种情形的解,但得到的解没有一般性,有了矩阵的知识,我们可以把各种各样的线性模型,归结为一个用矩阵表示的通用式子,这样可以有效地进行参数辨识,使运算符号更紧凑,运算起来更方便,适用性更强。第三章讨论的线性模型参数辨识是在模型参数不多于两个(而本126
在此有必要再强调一下什么是线性模型?所谓线性模型是指模型输出是参数的线性函数,这有别于固体力学中所提的线性问题,若把位移作为模型输出,则位移可以是弹性模量和泊松比的非线性函数,这时,在固体力学中虽是线性问题,但在参数辨识中就是非线性问题。本章前三节用矩阵方法讨论与第三章相应的各种参数估计方法,为了讨论方便起见,附录A给出了矩阵的有关基本知识,以便于后面各节的使用。在此有必要再强调一下什么是线性模型?所谓线性模型是指模型127一、线性模型的矩阵表示一、线性模型的矩阵表示128用矩阵表示的线性模型比用代数符号表示的线性模型一般性强,用矩阵表示的线性模型的一般式为
η=Xβη表示模型输出,β表示参数矢量,它是一个m维的列矩阵,若对η量测n次,则η可记为n维列矩阵,由上式可以看出,此时X必为一n×m的矩阵,我们称X为灵敏矩阵,这是因为它是η关于参数的导数。η,X和β的矩阵表示为此式包括了第三章讨论的所有模型。用矩阵表示的线性模型比用代数符号表示的线性模型一般性强,用129二、常规最小二乘法二、常规最小二乘法130
对于线性模型η=Xβ,常规最小二乘法的准则函数为J=(Y-Xβ)T(Y-Xβ)(4-1)显然,准则函数J的值,随着所选的参数的不同而不同,使J为最小的β*,应该是β的最好估计。当XTX为非奇异阵,可解得β*为
β*=(XTX)-1XTY
(4-4)式(4-4)这个结果称为参数的最小二乘估计量,由式(4-4)可以看出,估计量β*是量测值Y的线性函数。也有称这样的估计为线性估计。可以证明估计量式(4-4)是无偏、有效估计,只有特定的某些X,才是一致估计。对于线性模型η=Xβ,常规最小二乘法的准则函数为131三、加权最小二乘法三、加权最小二乘法132一般地说,由于量测往往是在不同条件(时刻或位置,仪器精度、环境)下进行的,这些量测所得的数据对于参数估计,有的“价值”大,有的“价值”小,在利用这些数据来估计时,往往希望“价值”大的数据占有较大的比重,使其对估计结果产生较多的影响,我们就用一个数值来表示量测的“信任程度”,这就称之为“权”,引入“权”这个概念以后,最小二乘法就进一步推广为加权最小二乘法。它与上述的常规最小二乘法的不同点是在准则函数(4-1)中乘上一个权矩阵,即
J=(Y-Xβ)TW(Y-Xβ)(4-25)这里W限于对称正定矩阵。显然,准则函数J的值,除了随着β的不同而不同外,它也随着所选权的不同而不同,即当J(β*)=minJ(β)时,所求的参数估计值β*也与权有关。当权矩阵W取为ψ-1时加权最小二乘估计就变为高斯—马尔可夫估计()。一般地说,由于量测往往是在不同条件(时刻或位置,仪器精度、133可求得加权最小二乘估计量为
β*=(XTWX)-1XTWY(4-26)为了唯一地求出β*,XTWX必须为非奇异矩阵。由式(4-26)可以看出,当权矩阵为单位矩阵In时,则表示不同时刻(或不同位置)的量测数据一样好,此时的加权最小二乘估计就是常规最小二乘估计,因此常规最小二乘法只是加权最小二乘法的一种特殊情形。如何选择权,对这个问题并没有普遍适用的规律,需要根据实际量测情况选取权的形式。一般来说,权的形式通常根据各次量测的精度来选择。可求得加权最小二乘估计量为134四、最大似然估计四、最大似然估计135与式(3-37)类似,这里取似然函数为将线性模型η=Xβ代入(4-31)得由此看出,这是加权最小二乘法中准则函数(4-25)的特例。故最大似然估计可以直接由(4-26)写出
当量测误差不相关,且有相同的方差σ2时,ψ=σ2In,则由式(4-36)可得
β*=(XTX)-1XTY这与常规最小二乘法的估计值完全相同。与式(3-37)类似,这里取似然函数为136五、最大验后估计(贝叶斯估计)
五、最大验后估计(贝叶斯估计)
137由第三章第四节知,最大验后估计也叫贝叶斯估计,这种估计不但要利用量测误差的统计特性,而且也要利用参数的统计特性,与最大似然估计的不同点是:贝叶斯估计事先把参数作为随机变量。而其它假设条件与最大似然估计完全相同,且认为参数也是正态分布,本节我们仍讨论线性模型,这样有
Y=Xβ+ε,ε~N(0,ψ)(4-43ab)
β~N(μβ,Vβ),cov(β,ε)=0(4-43cd)这里ψ,μβ,Vβ都是已知矩阵,若有n次量测yi(i=1,…,n),m个参数要辨识,则ψ是n×n的对称阵;μβ是m×1的列矩阵,它由每个参数的均值组成,Vβ是m×m的方阵,它是参数的协方差矩阵。(4-43d)表明β和ε是不相关的。由第三章第四节知,最大验后估计也叫贝叶斯估计,这种估计不但138岩石力学反问题吕爱钟课件139由式(4-37)可知,最大似然估计误差的协方差为cov(β-β*)=cov(β*)=(XTψ-1X)-1与式(4-57)比较,显然有(Vβ-1+XTψ-1X)-1<(XTψ-1X)-1所以贝叶斯估计的误差小于最大似然估计的误差,就此而言,贝叶斯估计比最大似然估计好。由式(4-37)可知,最大似然估计误差的协方差为140六、各种估计的关系六、各种估计的关系141
由以上几节我们可以看出:贝叶斯估计是各种估计的最一般情形,它包括了最大似然估计和常规最小二乘估计,而最大似然估计又是常规最小二乘估计的一般情形,但它是加权最小二乘估计的特殊情形,所以加权最小二乘估计是最大似然估计和常规最小二乘估计的一般情形。讨论的几种估计,只有贝叶斯估计事先把参数作为随机变量,当对参数的统计特性一无所知(Vβ=∞Im)时,贝叶斯估计退化为最大似然估计。当量测误差不相关且有相同的方差时,最大似然估计又退化为常规最小二乘估计。当权矩阵取为ψ-1时,加权最小二乘估计与最大似然估计相同,当权矩阵取为单位阵时,加权最小二乘估计又与常规最小二乘估计完全相同,所以Vβ=∞Im时的贝叶斯估计与权矩阵为ψ-1时的加权最小二乘估计完全相同。从参数估计值的统计特性来看:讨论的几种估计都为无偏估计。从估计误差的协方差可知,贝叶斯估计的参数估计误差最小,就此而言,贝叶斯估计是最优估计。本章前三节仅限于线性模型η=Xβ的讨论,求解参数的方法都为逆法,所得结果都能表示成解析式。由以上几节我们可以看出:贝叶斯估计是各种估计142七、非线性模型的参数辨识及最优化方法七、非线性模型的参数辨识及最优化方法143所谓非线性模型是指模型输出η是参数β的非线性函数。前面讨论了线性模型的参数辨识,无论是以第一类准则函数为基础的确定性方法,还是以第二类准则函数为基础的随机性方法,都是根据准则函数达到极值的必要条件所列的线性方程组,解出待求参数,所用方法都归结为逆法。对于非线性模型,我们是否能沿用这种逆法求解待求参数呢?答案是一般不能。以模型输出有解析解的简单情形为例,此时模型输出能表示成参数的非线性函数,以准则函数的极值必要条件列出的方程组为非线性方程组,非线性方程组的求解比线性方程组复杂得多,只有少数情形下才能求出非线性方程组的解析解。这是模型输出有解析解的情形,对于实际中的很多问题,模型输出是待解的微分方程组,我们能求出的解析解是很有限的,若无解析表达式,我们必须用有限元等数值方法列出模型输出和参数之
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 船舶租赁合同标准示范文本
- 签订的办公楼租赁与物业管理合同
- 维护网络安全应该怎做
- 国际物流模拟题与参考答案
- 电工基础复习题(附参考答案)
- 旅游经济学试题库含答案
- 中级制图员考试模拟题(附答案)
- 新上任管理岗位指南
- 场地租赁合同范例
- 采购供应合同集合
- 食品安全自查制度、从业人员健康管理、进货查验记录
- 南宁2025年3月高三二模英语试卷
- 产教融合校企合作框架协议书8篇
- 2025-2030年中国加湿器数据监测研究报告
- 儿童生长发育迟缓
- 班组级安全教育培训内容
- 《无人机操控培训材料》课件
- 电气控制技术基础应用知到智慧树章节测试课后答案2024年秋兰州石化职业技术大学
- 2025版科技创新合伙人股权期权激励与业绩考核协议3篇
- 骨灰寄存架合同模板
- Z20名校联盟(浙江省名校新高考研究联盟)2025届高三第二次联考 历史试卷(含答案)
评论
0/150
提交评论