实验数据分析方法误差理论与最小二乘法_第1页
实验数据分析方法误差理论与最小二乘法_第2页
实验数据分析方法误差理论与最小二乘法_第3页
实验数据分析方法误差理论与最小二乘法_第4页
实验数据分析方法误差理论与最小二乘法_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

实验数据分析方法误差理论与最小二乘法1第1页,课件共62页,创作于2023年2月第五章误差理论与最小二乘法

天文学的诸多理论是以天文观测为基础的,如地球自转理论、人造卫星运动理论等都离不开天文观测。人们通过对某一天文量(静态的或动态的)的直接或间接观测,获得大量的数据。而任何观测都不可避免的含有误差。因此,当我们在利用观测结果时,必须分析这些数据的可靠程度:只有当它们的误差在我们允许的范围之内时,我们才能放心大胆的去使用它,否则则不能使用。

误差的研究无论是对生产实践还是基础理论研究都有着重要意义!2第2页,课件共62页,创作于2023年2月

例1:由于牛顿在其最初计算中使用了具有较大误差的地球半径值,使得他测得的月球加速度的值和理论计算值相差约10%,因而推迟了20年发表他的引力理论!

例2:爱因斯坦广义相对论的观测证明:1916年爱因斯坦在德国《物理学纪事》上发表了具有划时代意义的重要文献《广义相对论基础》。文章指出,当光线行经太阳附近时,光线产生弯曲,其弯曲曲率预计为

=1.”75,而1911年他用经典方法得到=0.”9,相差两倍。如果观测能测得在1.”75附近,这将证明他的广义相对论是正确的,如果测得的值是在经典值附近,则将否定其理论。幸好1919年英国天文学家爱丁顿爵士在西非几内亚湾的普林西比岛的日全食观测中测得=1.”610.”30;与此同时有人在巴西东北海岸外索伯雷尔的日食观测中测得=1.”980.”12。这两个结果与广义相对论的预言值相近,远大于经典理论值,强有力的证明了广义相对论的正确性!如果他们当时的观测误差很大,置信度很低,以致于和理论值相差甚远,那么也就很难由此来验证这个理论了。由此可见,观测和误差分析对基础理论的研究起了一个不可估量的作用!3第3页,课件共62页,创作于2023年2月

最小二乘法是用来处理具有误差的观测数据的一种有效的方法,也是最早用于天文观测资料处理的一种数学工具。早在l794年,高斯为了利用小行星坐标的多次观测准确地推算小行星的轨道,第一次应用了最小二乘法。1805年勒让德应用测量平差方法确定了彗星的轨道和地球子午线弧长。1809年高斯又推证了误差的概率定律,从而使最小二乘法高度完善化,成为数据处理中应用最广的一个分支。随着概率统计学和矩阵理论的发展以及电子计算机的广泛应用,最小二乘法进入了近代数据处理方法的行列。4第4页,课件共62页,创作于2023年2月误差是实验科学术语,指测量结果偏离真值的程度。对任何一个物理量进行的测量都不可能得出一个绝对准确的数值,即使采用测量技术所能达到的最完善的方法,测出的数值也和真实值存在差异,这种测量值和真实值的差异称为误差。(fromWiki)误差按其表达形式分:绝对误差、相对误差误差按其性质及产生原因分:系统误差、随机误差、过失(人为)误差

误差不仅存在于测量值中,计算时采用近似的理论模型,计算中一些理论常数的不准确以及数值计算中取位的多少等也会在计算结果中产生误差。§5.1误差的定义与分类5第5页,课件共62页,创作于2023年2月5.1.1绝对误差和相对误差一个量值的给出值的绝对误差定义为该量值的给出值与其真值之差,或用公式表示为:

绝对误差=给出值-真值公式中的给出值如果是被测量的观测结果,则相应的误差为观测误差;如果给出值是某量的计算近似值,则相应的误差为计算近似值的误差。式中的真值是被测量本身的真实大小,它是一个理想的概念:一般说来,真值是未知的,通常用约定值来代替。例如某一系统的天文常数也可看作相应量值的真值。从绝对误差的定义式不难看出,绝对误差和被测量具有相同的量纲。因此,若说一颗星其位置误差为0."1,测时的记录误差为0."0001,都是指的绝对误差。6第6页,课件共62页,创作于2023年2月我们把误差的反号值定义为修正值,则可得:真值=给出值-误差=给出值+修正值这表明,带有误差的给出值加上修正值后可消除或减小误差的影响。在有些情况下用绝对误差来表示测量的精度是不恰当的:如目前卫星激光测距的准确度(测量值与被测量真值之间的偏离程度)已达cm级,卫星的距离一般为103km量级;但如果我们测定的是恒星的距离(这里指离太阳在20pc以内的恒星),用三角视差法一般可准确到0.”02,相当于2pc的测距误差,显然它和卫星的测距误差是无法直接比较的!但如果我们引入相对误差的概念,它们的测距误差就有了可比性。7第7页,课件共62页,创作于2023年2月被测量的绝对误差∆与其真值a之比定义为这个量的相对误差,并用下式表示:当误差较小时,相对误差式中真值a可用给定值代替。对于上面的例子,它们测距的相对误差分别为1×10和1×10-1。

即三角视差测量的相对误差反而要比卫星激光测距的相对误差小!8第8页,课件共62页,创作于2023年2月

由观测的环境因素差异、仪器性能、不同的观测者等因素造成的按某一确定的规律变化的误差称为系统误差。系统误差的大小和符号在多次重复观测中几乎相同,通常使观测值往一个方向偏离。另外,这种误差可以归结为某一因素或某几个因素的函数,而这种函数通常可以用解析公式表达出来。人们总是设法找出代表系统误差的解析表达式,然后在观测结果中扣除。由某些难以控制的随机因素造成的,绝对值和符号的变化时大时小、时正时负,以不可预测的方式变化的误差称为随机误差。虽然就其个体而言,随机误差没有规律、不可预料,但就其总体而言,随着观测次数的增加,它又服从某种统计规律。下面我们将从概率论的角度出发讨论随机误差所满足的统计规律。

5.1.2系统误差、随机误差和过失误差

9第9页,课件共62页,创作于2023年2月古典误差理论认为,随机误差服从正态分布,因此我们可以用正态分布密度曲线来表征随机误差,随机误差的分布密度曲线可表为:

其被称为高斯误差方程,其相应图形也常被称为高斯误差曲线。式中称为精密度指数,=x-a,

为随机误差的均方差。高斯误差方程的一般表达式:10第10页,课件共62页,创作于2023年2月

随机误差有下列统计特征,当观测样本足够大时:(1)绝对值相等、符号相反的正负误差近于相等。因此,随机误差的算术平均值随着观测次数的增加愈来愈小,以零为极限。(2)误差的概率与误差的大小有关,绝对值小的误差出现的概率比绝对值大的误差出现的概率大,绝对值很大的误差出现的概率很小。

根据随机误差的这些特征,当不存在系统误差的影响时,多次测量结果的平均值将更接近于真值。随机误差产生的原因很多,观测时环境因素的微小变化,设备中的热噪声等都是产生随机误差的重要原因。11第11页,课件共62页,创作于2023年2月实际上,系统误差和随机误差之间并没有明显的界限有时,我们把一些具有复杂规律但暂末掌握的系统误差都当作随机误差处理。而随着人们对误差及其规律的认识的加深,就有可能把这些以往认识不到因而归之于随机误差的这类误差确认为系统误差。反之,在一个较短时期内可能呈现出某种规律,故而归为系统误差,但经过一段较长时间的观测,发现这种变化规律破坏了,并呈现出随机性,这就是说,随着时间的推移,两种不同性质的误差有可能互相转化。过失(人为)误差是指测量结果与事实明显不符的一种误差。如观测时对错星或观测过程中望远镜/记录仪器的小故障等过失原因造成的结果异常。这种误差一般比较容易发现,而且只要观测人员认真细致,基本上是可以避免的。12第12页,课件共62页,创作于2023年2月

数据处理中一个很重要的方面是评定一列观测值的可靠程度。它是指观测结果与真值的一致程度,是观测结果中系统误差和随机误差大小的综合度量,常用准确度这个词来表征。在消除了系统误差之后,观测的可靠程度由随机误差的大小来衡量。一列观测值精度高低必须从全列观测值的误差来衡量,而不能只根据个别值的误差来判断。另外,观测的目的是要从一列观测值中确定(直接地或间接地)被测量的真值,但由于观测手段和观测次数的限制,真值实际上是测不到的,只能得到它的一个近似值或估计值。在天文学中通常把最接近于被测量的真值的一个近似值称为它们的最或然值,因此,数据处理的又一个重要的问题是给出被测量的最或然值及其精度。最或然值的精度是衡量观测结果的精度和处理方法有效性的综合指标。§5.2观测精度13第13页,课件共62页,创作于2023年2月标准偏差(又称均方误差)是用来衡量一列观测值精度高低的一个较好指标。设为被测量的一组观测值,a为被测量的真值,且{xi}中只包含随机误差,则称为{xi}的真误差,我们定义真误差的平方的算术平均值的平方根为这列观测值的标准偏差或标准误差,天文上又常称之为中误差,并用表示,即:

这里定义的标准误差和统计学中从方差的正平方根定义的标准差是一致的,因为从概率论的角度来说,xi的真值可用其数学期望表示。5.2.1精度标准14第14页,课件共62页,创作于2023年2月下面我们来说明标准偏差的大小为什么可以用来衡量一列观测值的精度高低:由正态分布的性质可知,观测值xi在(a,a+)区间上的概率,或说i出现在(,+)范围内的概率为68.3%,已知1

2.则区间(a1,a+1)小于(a2,a+2),也就是说

=1的观测数据在a

周围的分布较密集,而

=2的观测值在a

周围的分布较分散,即标准偏差

的大小可以衡量一列观测值在真值周围分布的密度程度,而这种密集程度是具有概率含义的,即误差在(,+)内的置信水平是68.3%。15第15页,课件共62页,创作于2023年2月下表列出了一些常用的置信水平误差限:置信水平误差限置信水平误差限50.0%68.3%95.0%0.6741.01.9695.5%99.0%99.7%22.583

可见,误差落在3中的概率为99.7%,亦即绝对值大于3的误差仅有0.3%,这显然是一个小概率事件。所以在有限次观测中,误差值大于3的观测值可能含有过失误差,应考虑舍去该观测值;当然,也有可能这个值并不含有过失误差,如舍去它会犯“弃真”错误,但这种误差的最大概率也只有0.3%。这种取舍观测值的原则称为拉依达准则或简称为3准则。

16第16页,课件共62页,创作于2023年2月高斯函数的性质17第17页,课件共62页,创作于2023年2月在比较两个观测结果时,应在相同的置信水平上比较它们的误差限,误差限较小的观测较精确,为了说明观测的精度,通常把观测结果报导为

(置信水平)。凡是没有注明置信水平的,一般均指=68.3%,相应的误差限即为标准误差。

在上述各式中,真值a(或x)通常是未知的,因此真误差也是未知的,通常用被测量的最或然值或真值的估计值代替真值,观测值与其最或然值之差称为观测值的残差或离差。标准误差不取决于观测中个别误差的符号,对观测值中较大误差和较小误差比较灵敏,是表示精度的较好方法。实际应用中,有时也常用平均误差离差绝对值的算术平均值来表示精度;也有时采用概率误差:即绝对值比它大的误差和绝对值比它小的误差出现的可能性一样大,将误差绝对值按大小顺序排列,序列的中位数即为概率误差。平均误差和概率误差只有当N较大时才较可靠。天体物理中还经常采用半峰宽度来表示观测的精度,所谓半峰宽度,即观测值分布曲线在极大值半高度处的全宽(FullWidthatHalfMaximum)。18第18页,课件共62页,创作于2023年2月

在很多实际问题中,待求量往往不能直接观测得到,但它们可通过对其它量的观测,再利用它们之间的函数关系换算求得:这种情况就称为间接观测。间接观测在天文观测中是普遍存在的,例如:在人造卫星的定轨预报中要测的是卫星在某一历元的轨道根数,但它们不能直接测得而只能通过测定卫星的赤经、赤纬换算而得到。对于间接观测的情况,应首先由直接观测量求出间接观测量的最或然值,然后由直接观测量的精度估计出间接观测量的精度。通常用下面的式子表示间接观测量y与m个直接观测量xk(k=1m)的关系:5.2.2误差传递公式19第19页,课件共62页,创作于2023年2月为了求得间接观测时误差传递的关系,需要对上式进行线性化处理如果直接观测量的误差相对于它们的观测值来说是较小的量,则非线性函数可以在各个观测值的邻近点上展开成泰勒级数,然后取误差的一阶项而略去一切高阶误差项:式中为观测量xk的离差,我们把它记为νk。若对xk(k=1m)各进行了N次观测,设间接观测量任一次观测的离差为νy=yy0,y0=f(x10,x20,…,xm0),将y=νy+y0,νk=xkxk0

代入上式,可得:直接观测量xk的误差以的形式出现在间接观测量y的误差中,或说间接观测量y的误差是m个直接观测量的误差加权和,权重因子称为y的误差传递系数。

20第20页,课件共62页,创作于2023年2月设m个直接观测量的标准偏差为,根据标准偏差的定义及随机变量方差的运算法则,可得间接观测量y的标准偏差为:

式中kj为第k个观测量与第j个观测量的相关系数。当各个直接观测量相互独立时,有kj=0,则有:

上式通常称为独立观测量的误差合成定理。若间接观测量与直接观测量的关系为线性关系时,即:。则有:此式即为线性情况下的标准偏差传递公式。21第21页,课件共62页,创作于2023年2月例:利用IRAF进行测光时,其会根据误差传递以如下的公式给出测光误差:

根据信噪比的定义:S/N=Flux/Err,故1/Merr≈S/N,即IRAF里给出的测光误差的倒数即为信噪比。除了信噪比会引起测光误差外,还有很多其他的因素也会带来误差,如减本底、除平场、减暗流等过程都会带来附加的误差:一般平场的精度可以达到千分之五左右。目标源的测光误差可以按如下形式给出:

Eref为多颗比较星测光误差的平均值,Eobj为目标源测光误差,Eothers为其他误差,根据不同的情况确定,比如误差小于千分之五的时候“其他误差”就可能需要包括平场误差,再比如比较星的定标误差等。22第22页,课件共62页,创作于2023年2月

观测精度的高低是由观测条件决定的,它包括观测的手段、仪器的精度、观测的次数、观测者技术熟练的程度等,因此我们按观测时的条件把观测分成两大类:如果某一列观测是在完全相同的条件下进行的,则为等精度观测,所得到的序列称为等精度观测列;如果某一列观测是在不同的条件下进行的,称为非等精度观测,相应的观测序列为非等精度观测列。

等精度观测列的标准偏差对于等精度观测列,可以用全列观测值的标准偏差来衡量这列观测值的精度。但是,由于观测值的真误差一般是未知的,为此通常用观测值的残差代替真误差。而对于一列等精度观测值来说,被测量的最或然值就是这列观测值的算术平均值,则有残差,而真误差为:5.2.3等精度观测和非等精度观测

23第23页,课件共62页,创作于2023年2月

为算术平均值的真误差,对上式两边求平方和,得:并有:

由线性情况下的标准偏差传递公式,并将算术平均值的标准偏差代入上式则得:

整理后得到一等精度观测列用残差表示的标准偏差公式(这里用高斯符号[]表示求和):24第24页,课件共62页,创作于2023年2月

权与非等精度观测列处理非等精度观测序列的情况在天文学中是很普遍的:例如利用观测星表编制基本星表就是一个典型的例子。各种星表中的星位都具有误差;即使是在同一星表中,它所包含的星位也不都具有相同的标准偏差。它们大多数和观测次数的多少有关,故而大多数星表中有一栏同时列出了各恒星观测的次数,相应的精度随所用的观测数目的增加而增加。因此,在编制基本星表时,需根据它们精度的高低区别对待。在数据处理中,通常用数值pi表示对某一观测结果xi的重视程度,并称之为权。观测值精度的高低是和其误差大小密切相关的:误差越大,观测值精度就越低,对它的重视程度也应相应减小。在观测值只包含随机误差的情况下,通常定义权与标准偏差的平方成反比。25第25页,课件共62页,创作于2023年2月设非等精度观测列的标准偏差分别为1,2…,N

,通常把和最大的标准偏差对应的观测值的权定为1,设1=maxi(i=1N),则标准偏差为i的观测值xi的权为:不难看出p1=1,故x1被称为单位权观测值。对非等精度观测序列被测量的最或然值需要加权平均,即:

标准偏差公式为:

权只是从相对意义上表示一个量的精确程度:我们同样可以取和最小的i对应的观测值为单位权观测值;这时虽然各个观测值权的数值和原来不同了,但这些观测值权的比值并未改变。有时为了使所有观测值的权均为整数,可以根据要求选取单位权观测值。26第26页,课件共62页,创作于2023年2月由于被测量的真值在有限次观测中是无法得到的,数据处理的任务是通过对被测量的有限次观测求出被测量的最接近于真值的量,即被测量的最或然值。§5.3直接观测量的最或然值及其精度5.3.1最小二乘准则

最小二乘法是求解被测量最或然值的基本方法。按照最或然值的定义,它是最接近于真值的值。设一组观测值为x1,x2,…,xN

,待求的最或然值为x*,则它们的残差为νi=xi-x*(i=1N),最小二乘准则就是选择x*,使得残差平方和为最小。即x*必须满足:27第27页,课件共62页,创作于2023年2月对于一列等精度观测列,设由最小二乘准则求出的最或然值为x*,由N个观测值可得N个残差方程:

νi=xi-x*(i=1N)

根据最小二乘准则,最或然值x*应满足:由极值原理,有:于是得:设观测值的标准偏差为,则由上式并利用标准偏差的传递公式得:5.3.2等精度观测列的最或然值及精度

多次观测取平均可以减小观测结果的随机误差!28第28页,课件共62页,创作于2023年2月设x1,x2,…,xN为一非等精度观测列,x*为被测量的最或然值,由于各个xi的精度不同,不能像处理等精度观测列那样直接应用来求解x*,而必须先将它转化为等精度观测列,再利用等精度观测列的最小二乘准则来求最或然值及其精度。设观测值xi的权为pi,可以证明,只要将每个观测值乘以相应的权的平方根,就可以把原来的非等精度观测列转化为一等精度观测列,与之对应的残差序列为。由最小二乘准则有:5.3.3非等精度观测列的最或然值及精度

则非等精度观测列的加权平均值为29第29页,课件共62页,创作于2023年2月非等精度观测列的最或然值的标准偏差为:由于非等精度观测列中每个观测值的标准偏差可表示为,则上式又可写为:

其中为单位权标准偏差,它可按等精度观测列的标准偏差公式计算,但它对应的残差是,最后得:

实例30第30页,课件共62页,创作于2023年2月间接观测中一种较普遍的情况是观测量为待求量的线性函数。设对直接观测量进行了N次观测,待求的未知量为xk

(k=1m),则可得N个观测方程:如果li没有误差且各方程是独立的,则由其中m(m<N)个方程可以解出m个未知量的真值。但实际上观测值总会有误差。如果我们用未知量的最或然值代入上式,则观测量li与待求量的最或然值的关系可表示成如下的方程组:§5.4间接观测量的最或然值及其精度5.4.1误差方程

式中ν1,ν2,…,νN

分别为l1,l2,…,lN

的残差。31第31页,课件共62页,创作于2023年2月通常称以上方程组为误差方程或条件方程,在这个方程组中有N个方程,m+N个未知量,即使不考虑vi

的影响,也不能找出严格满足所有方程的解,更何况残差νi必须要考虑,但它又是未知的。因此,要求出未知量必须要有附加条件,而使用最小二乘准则能得到这个方程圆满的解。根据最小二乘准则,在等精度观测列的情况下,未知量的最或然值是使残差平方和最小的那些值,即由极值原理,xk

(k=1

m)

应满足:5.4.2正态方程

32第32页,课件共62页,创作于2023年2月

即:经过简单整理并引用高斯符号,则由此可得到线性方程组常称以上方程组为正态方程或法方程。33第33页,课件共62页,创作于2023年2月

间接观测另一种常见的情况是观测值是待求量的非线性函数。例如,人造卫星的轨道改正中,观测量是某一历元卫星的球面坐标,待求量是相应历元的六个轨道根数,它们之间的关系是很复杂的非线性关系;利用甚长基线(VLBI)观测测定地球自转参数,观测量是来自射电源同一波前到达VLBI两个测站的钟面时之差即几何延迟,待求量是地球自转参数,它们之间的关系也是很复杂的非线性关系;又如,利用食双星的光变曲线确定其轨道要素是目前测定食双星轨道要素的惟一方法,而食双星的光变曲线不仅和轨道根数有关,还依赖于其它一些因素:包括两颗子星的大小、光度、形状等…因此,利用光变曲线得到食双星的轨道要素(称为食双星的测光轨道解)是一个典型的复杂非线性间接观测问题。34第34页,课件共62页,创作于2023年2月观测量yi与待求量xk

(k=1m)之间的非线性关系可写为设x0k为xk的近似值(或初值),并用xk表示xk与其近似值之差。则由上式可以算出已知待求量近似值的函数y0k,并记yi

=yi

–y0i,对上式在x0k(k=1~m)上进行泰勒展开,并略去xk的二次及二次以上的项,这样可得:其中(k=1m)当x0k给定时为己知系数,下面我们用bik(k=1m)表示。因为观测值yi有误差,因此必须考虑yi中的误差,故而得到误差方程:35第35页,课件共62页,创作于2023年2月利用最小二乘准则,可得到法方程:

解此方程得到xk(k=1m),分别加上近似值x0k(k=1m),就可得待求量的最或然值。当|xk|较大时,可将得到的xk代替原来的近似值x0k重新算出系数bik

和yi并解法方程得到新的xk。这种过程可以反复迭代,直到最后的|xk|值小于给定的误差限为止,这时最后得到的xk即为所求。这种算法常被称为高斯—牛顿法或泰勒展开法,此法在求解过程中需反复迭代和修正,逐次迭代的结果将使最后的xk更接近真解。当初值选得较好时,随着迭代次数的增加,修正值|k|将越来越小,即为迭代“收敛”;否则称迭代“发散”:迭代得到的新值可能比原来的值更远离真解,而这种情况在实际应用中时有发生,所以初值的选取是至关重要的。36第36页,课件共62页,创作于2023年2月为了求最或然值的标准偏差,必须要知道它们与观测值li的标准偏差之间的关系以及li的标准偏差;要求li的标准偏差,首先要求出li的残差,而这只要将从法方程解得的未知量的最或然值代入误差方程便可得到。(由残差求标准偏差的公式推导请详见书中叙述)观测值的标准偏差为:其中,N-m称为自由度,意思是指求解m个未知量只需在m个不同条件下测得m个观测值;但现有N>m个测得值,故而多测了N-m个值。从上面的推导可知,用最小二乘法求解未知量时,为了得到较小的标准偏差;通常要求N-

m越大越好。5.4.3最或然值的标准偏差

=37第37页,课件共62页,创作于2023年2月有了观测值的标准偏差后,就可以求m个最或然值的标准偏差。设m个最或然值的标准偏差为对应的权分别为,则由非等精度观测列的标准偏差公式可以得到:式中按观测值标准偏差公式计算。pxk的计算可借助法方程求得,即只要将法方程右端项[b1l],[b2l],···,[bml]改为1,0,0,···0,解此法方程得到的x1即为;若把法方程右端项分别改为0,1,···,0则由可解得px2。依次类推……

38第38页,课件共62页,创作于2023年2月§5.5最小二乘曲线拟合

天文工作中常遇到达样两个问题,其一是:y和x是可被观测的天文量,且y是x的函数,它们的函数关系由公式(曲线):y=f(x,ck)(k=1~m)给出,但式中含有m个未知参数ck

(k

=1~m)。我们的任务是根据y和x的N组观测值寻求参数ck的最佳估计ĉk,进而得到以上公式(曲线)具体形式的最佳估计;另一问题是:y和x之间的函数形式未知,而需要利用对y和x的观测求出y和x之间关系的一个经验公式(或经验曲线)。39第39页,课件共62页,创作于2023年2月

由于观测值总含有误差,通常只能用曲线拟合的方法由y和x的观测值(yi,

xi)[i=1N],求得理论曲线或经验曲线中参数的估计值。曲线拟合的特点在于,被确定的曲线原则上并不特别要求真正通过给定的所有观测点,而只要尽可能在绝大多数观测点附近通过。这对于含有误差的观测来说较之过所有点的曲线拟合更合理,并有利于减小对未知数据进行预测时的偏差*。确定表达式中的参数是曲线拟合中的基本问题。另外,经验公式的确定又是参数估计的基础,但它与客观实际联系紧密,必须结合专业知识并依据经验才能得到较好的解决。40第40页,课件共62页,创作于2023年2月41第41页,课件共62页,创作于2023年2月最小二乘法(又称最小平方法)是一种数学优化技术,它通过最小化误差的平方和找到一组数据的最佳函数匹配;其是用最简的方法求得一些绝对不可知的真值,而令误差平方之和为最小;最小二乘法通常用于曲线拟合。很多其他的优化问题也可通过最小化能量或最大化熵用最小二乘形式表达。1801意大利天文学家朱赛普·皮亚齐发现了第一颗小行星谷神星,在40天的跟踪观测后,谷神星运行至太阳背后。皮亚齐失去了谷神星的位置。随后全世界的科学家通过皮亚齐的观测数据开始了寻找谷神星的行动。但是大多数的计算都没有结果,只有当时年仅24岁的高斯成功计算出了谷神星的轨道,奥地利天文学家海因里希·奥尔伯斯在高斯计算出的轨道上重新发现了谷神星,从此高斯闻名世界。他的这个最小二乘的方法发表在1809年的著作《天体运动论》中。法国科学家勒让德也于1806年独立发明最小二乘法。1829年,高斯提供了这个方法较其它方法为优的证明:最小二乘法在很大方面上优化效果强于其它方法,被称为高斯-莫卡夫定理。42第42页,课件共62页,创作于2023年2月理论曲线(或经验公式)中参数的估计问题可用如下的数学语言描述:若y是关于自变量x和待定参数ck(k=1m)的形式已知的函数:y=f(x,c)。今给出(x,y)的N对观测值(xi,yi)(i=1N),要确定参数ck(k=1m),使某个目标函数

取极值(极大值或极小值)。因此曲线拟合就是对目标函数进行最优化计算,寻求使目标函数d取极值的一组参数值。目标函数的具体形式可根据具体问题的要求来选取,可以在非最小二乘意义下确定c使得:5.5.1目标函数和最优化43第43页,课件共62页,创作于2023年2月

达到极小。也可以在最小二乘意义下求解c,即使目标函数:达到极小。我们称这种选取各观测点的残差平方和作为目标函数的拟合为最小二乘曲线拟合最小二乘曲线拟合用拟合的2量:

作为目标函数。寻求使2最小的参数c作为参数的估计值。其中pi为观测值yi的权重因子:5.5.2最小二乘曲线拟合44第44页,课件共62页,创作于2023年2月满足最小二乘准则的参数值ĉ可由下列方程组解出,即由:解此参数的最小二乘估计ĉk(k=1~m)。—

线性情况:

理论曲线是未知参数的线性情况时,它的一般形式可表示为对于N组观测值(xi,yi),把线性函数代入上述方程组,则可得到未知参数c的线性方程组:45第45页,课件共62页,创作于2023年2月例如在m=2且为等精度的情况下(2个未知参数),方程组化为:

已知:y=y0(x)+c1f1(x)+c2f2(x)c1f1(xi)f1(xi)+c2f2(xi)f1(xi)=[yi-y0(xi)]f1(xi)c1f1(xi)f2(xi)+c2f2(xi)f2(xi)=[yi-y0(xi)]f2(xi)解之便可以得到c1和c2的最佳估计值46第46页,课件共62页,创作于2023年2月把参数估计值代入理论关系式,可以得到对应各个自变量xi的y的估计值:线性情况最典型的例子是:这是标准的线性模型,形式简单。但是有些看来较复杂的模型,常常可以通过变量代换的方法简化成这样的形式。下面我们给出几个例子:例1:是一个多项式模型,尽管观测值y对自变量而言是非线性的,但它对参数是线性的,因此仍属线性问题。只要作变量代换:则多项式即可化为标准的线性形式47第47页,课件共62页,创作于2023年2月例2:观测量y对自变量x及参数均为非线性,但通过变量代换仍可化为线性问题来处理。即对两边取导数,得令,得例3:

这是标准的直线模型,解出C0,Cl后,用逆变换求c0,c1:

式中Aj,j

(j=1,2)分别为周期函数的振幅和初相位,它们都是拟合过程中待估计的参数pj为已知的周期。48第48页,课件共62页,创作于2023年2月这个函数形式是非线性的,但我们亦可以通过变量变换将其转化为线性的:这是以c1,c2,c3,c4参数的标准化模型。由线性情况的最小二乘拟合的参数估计公式解得参数c1,c2,c3,c4

后可得周期函数的拟合参数

将它们代入周期函数公式中即得周期函数拟合曲线

变量变换的方法可以把看来较复杂的模型化简,且变换既适用于待定参数也适用于观测量和自变量。这种能通过变量代换的方法化为线性模型的理论或经验公式称为广义线性模型。49第49页,课件共62页,创作于2023年2月思考:若把观测量y和x进行调换,最终由上式得到的最小二乘拟合结果是否不变??—

对dy—

对dx—

对(dx2+dy2)1/250第50页,课件共62页,创作于2023年2月实例:测定星系中心大质量黑洞的质量UsingRBLRthecentralmassis:VistheBLRcloudsvelocity(eitherfromFWHMorsLINE)fisadimensionlessfactorthatdependsonthegeometryandkinematicsoftheBLR.

如何测定

RBLR?Findingthecentral(blackhole)massisoneofthe“holygrails”ofreverberationmappinginthepastdecade….

(butthesamplemightbebiased….)第51页,课件共62页,创作于2023年2月Continuumluminosityvary.BLRrespondtothevariations(viaphotoionization).测定RBLR:ReverberationMappingTheentireBLRdoesnotrespondatthesametime.AcloudatadistanceRfromthecentralsourceandangleq

tothelineofsightwillappeartorespondafteratime:qLine

ContinuumForathickshellBLRtheresponsetoacontinuumflashwillbe:TimeLineflux52第52页,课件共62页,创作于2023年2月TimeLightcurvesLineFluxContinuumFluxHbKaspietal.200053第53页,课件共62页,创作于2023年2月BLRsize(RBLR)vs.Luminosity—Botharefundamentalmeasuredquantities.Petersonetal.(2004)compiledallstudiestodate.35objectswithBalmer(mainlyHb)linestimelag.CharacteristicBLRsize=TimeLag*speedoflight.LuminositiesintheOptical,UV,andX-rays.BLRsizefromaveragingallBalmerlinestimelagsperobject.BLRSize–LuminosityRelation测定

RBLR

进而计算黑洞质量的更普适方法54第54页,课件共62页,创作于2023年2月LinearRegressionUncertaintiesinbothquantitiesandIntrinsicscatterintherelationTworegressionmethods:1.FITEXYfromPressetal.(1992)implementedbyTremaineetal.(2002).2.BCES(BivariateCorrelatedErrorsandintrinsicScatter)byAkritas&Bershady(1996).…andalsooutlierpoints…55第55页,课件共62页,创作于2023年2月HbRBLR–Opticalluminosity(5100A)RBLR

[lLl(5100Å)](0.69±0.05)Kaspietal.200556第56页,课

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论