数值分析教案_第1页
数值分析教案_第2页
数值分析教案_第3页
数值分析教案_第4页
数值分析教案_第5页
已阅读5页,还剩216页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数值分析教案绪论§1。数值分析的对象与特点随着计算机的发展,人们对计算方法的需要就显的越来越重要,同一个问题选择的计算方法不同所得结果就完全不一样。当然人力,物力,财力等的消耗也不尽相同。《数值分析》课程的主要内容就是研究如何较好的处理数学模型问题。它是数学的一个重要分支,其内容不像纯数学那样只研究理论,而是着重研究求解的数值方法及相关的理论。这些理论包括方法的收敛性,稳定性及误差分析。数值分析课程的特点:既有纯数学高度抽象性与严密科学性的特点,又有应用的广泛性与实际实验的高度技术性的特点,是一门与使用计算机密切结合的实用性很强的数学课程。§2。误差的来源及误差分析的重要性我们先来考察一下用计算机解决实际问题的主要过程:实际问题→数学模型→数值计算方法→程序设计→→上机求结果在以上的过程中可以产生下列误差:模型误差:由实际问题转化为数学模型时产生的误差。观测误差:由观测产生的误差。截断误差(方法误差):近似解与精确解之间的误差。EMBEDEquation.3今求,则有由于不可能得到精确值,若取,则此时的截断误差为另外,由于计算机在计算过程中并非是精确运算,它也是只对有限位数进行运算,对于超过位数的数字便自动施行四舍五入,这样在计算过程中又产生一定的误差,这种误差称为舍入误差。本课程主要研究截断误差和舍入误差。以下举例说明误差分析的重要性。例求 解:容易求得,而是个无理数,不可能取到精确值,今取,得到一个递推公式:EMBEDEquation.3计算结果见下表:00.18232155↓00.18232155↑10.08839221610.08839221620.05803891820.05803891930.04313874230.04313873440.0343020840.0343063350.0284895850.0284683560.0242187560.0243249170.02176339↓70.02123260↑80.01618305↓80.01883699↑90.0301958890.0169261710-0.05097941100.01536914110.017324710110.01407133812-0.003290219120.01297664113-0.093374172130.01203986714-0.39544229140.0112229233152.0438787↓150.010520499↑16-10.156890160098975041750.843276170.00933600718-254.16082180.008875522191270.8567190.008253968220-6354.2338↓200.0087301587↑注:上表前两列是由公式计算所得值,后两列是由以下的公式计算所得值。我们分析一下的特性:ⅰⅱ;ⅲ;ⅳ由此可知公式计算的值是不可应用的。那么怎样计算才能使结果可靠呢?由公式的递推公式及可知,,所以,取,显然误差是比较大的。建立以下递推公式:由式重新计算到的值(上表的后两列)。可见尽管的初值取的比较粗糙,但计算到及时还是比较精确的。以下我们来分析EMBEDEquation.3两式的区别。由于计算机只能对有限位数进行计算,当取用式计算时,因为带有的误差会一直传下去。具体传播过程为,设为理论值;为实际计算值,则有==(2-1)尽管误差很小,但是却是很大的。而用式时,有=(2-2)尽管误差很大,但是却是很小的。由以上两式知,一个是误差在积累,一个误差在缩小。我们称舍入误差积累的递推公式(比如)为不稳定的,而称舍入误差缩小(至少不增)的递推公式(比如)为稳定的计算公式。§3。误差的基本概念3-1误差与误差限定义1设为精确值,为的一个近似值,称为近似值的绝对误差。(简称误差)。由于精确值是不知道的,所以误差是不可计算的。通常只能估计,常用来估计,我们称为误差限。3-2相对误差与相对误差限定义2称为的相对误差。(与同上)由于是不知道的,所以通常取EMBEDEquation.3作为的相对误差。这时产生的误差可忽略不计。同样,我们把其绝对值的上界称为相对误差限。记作。3-3有效数字我们知道,当精确值有很多位数时,常按四舍五入的原则取其前几位数字作为其近似值。例:若取,或取,则它们分别具有误差为及。误差限分别为及。由此我们给出以下定义,定义3。若近似值的误差限是某一位的半个单位,该位到的左边第一位非零数字共有位,则称有位有效数字。由此知,以上的3.14和3.1416作为的近似值分别具有3位和5位有效数字。有位有效数字的近似数可以写成标准形式:(3-1)其中,是0—9中的数(),。且例如,用作为的近似值,可以写成=.且EMBEDEquation.3,∴作为的近似值,它有6位有效数字。例:以下数字都是经过四舍五入得到的数字,问它们各有几位有效数字?,,有效数字与相对误差限的关系有以下定理,定理1。由(3-1)表示的近似数,若有位有效数字,则其相对误差限为(3-2)反之,若的相对误差限(3-3)则至少有位有效数字。定理说明,有效位数越多,相对误差限越小。例:为使的近似数的相对误差限小于0.1﹪,问查开方表时,要取几位有效数字?解:设查开方表时取位有效数字,那么由(3-2)式并注意到,所以取,因此要使的近似数的相对误差限小于0.1﹪,只需取满足EMBEDEquation.3﹪解得n=3。即取。3-4数值运算的误差估计数值运算的误差估计一般是很复杂的。通常我们利用Taylor展开的方法来估计误差,假设要计算的值,已知是的近似值。此时A的近似值为,那么作为A的近似值时的误差限EMBEDEquation.3(3-4)而的相对误差限为EMBEDEquation.3(3-5)例:要计算,取。求解:EMBEDEquation.3§4数值运算中误差分析的若干原则一个工程技术问题的解决往往要经过若干次运算,若每一步都要分析误差的话那当然是最好的,但这是不可能的。为鉴别计算结果的可靠性,我们提出若干原则。要使用稳定的计算公式。要避免两相近数相减。出现这种情况时,最好对公式进行处理,(1)时,变换(2)时,变换(3)充分大时,变换防止大数“吃掉”小数在计算机运算过程中,若两个数的数量级相差很大,那么数量级小的数往往被忽略。这就是所说的大数“吃掉”小数。如:要计算53480+,,。就需要先计算之和,然后再加上53480。注意简化计算步骤,减少运算次数。绝对值较小的数不宜做分母。第二章 方程求根在许多实际问题中,常常会遇到方程f(x)=0求解的问题。当f(x)为一次多项式时,f(x)=0称为线性方程,否则称为非线性方程。对于非线性方程,由于f(x)的多样性,求其根尚无一般的解析方法可以使用,因此研究非线性方程的数值解法是十分必要的。本章主要介绍求非线性方程根的一些常用方法。它们是增值寻根法、二分法、迭代法、牛顿法及割线法。这些方法均是知道根的初始近似值后,进一步把根精确化,直到达到所要求的精度为止。也即求非线性方程根的数值方法。第一节

增值寻根法与二分法2.1.1增值寻根法设非线性方程f(x)=0的根为,增值寻根法的基本思想是,从初始值开始,按规定的一个初始步长h来增值。令=+h(n=0,1,2,…),同时计算f()。在增值的计算过程中可能遇到三种情形:(1)f()=0,此时即为方程的根。(2)f()和f()同符号。这说明区间[,]内无根。(3)f()和f()异号,即有f()·f()<0此时当f(x)在区间[,]上连续时,方程f(x)=0在[,]一定有根。也即我们用增值寻根法找到了方程根的存在区间,或均可以视为根的近似值。下一步就是设法在该区间内寻找根更精确的近似值,为此再用增值寻根法把作为新的初始近似值,同时把步长缩小,例如选新步长,这样会得到区间长度更小的有根区间,从而也得到使f(x)更接近于零的,作为更精确的近似值,若精度不够,可重复使用增值寻根法,直到有根区间的长度|-|<(为所要求的精度)为止。此时f()或f()就可近似认为是零。或就是满足精度的方程的近似根(如图2-1).2—1例1用增值寻根法求方程f(x)=-10=0的有根区间。解取=-4,h=1,则计算结果如下表2-1: 表2-1x-4-3-2-1012f(x)-10-1-2-7-10-514所以f(x)=0的有根区间为(1,2).再取=1,h=0.1,计算结果如表2-2: 表2-2x11.11.21.21.4f(x)-5-3.829-2.512-1.0430.584

所以f(x)=0更进一步的有根区间为(1.3,1.4)2.1.2二分法设f(x)在区间[a,b]上连续,且f(a)·f(b)<0,则由连续函数性质知,方程f(x)=0在(a,b)内至少有一实根,为以下讨论方便,设(a,b)内仅有唯一实根。二分法的基本思想:就是逐步对分区间[a,b],通过判断两端点函数值乘积的符号,进一步缩小有根区间,将有根区间的长度缩小到充分小,从而求出满足精度的根的近似值,如图。2-2具体做法如下:用区间[a,b]的中点平分区间,并计算f(),同时记(,)=(a,b),如果恰好有f()=0,则我们已经找到方程的根=。如若不然,f()≠0,如果f()·f()<0,则记(,)=(,),如果f()·f()<0,则记(,)=(,),在后两种情形区间(,)为新的有根区间。它包含在旧的有根区间(,)内,其区间长度是原区间的一半。对区间(,)施行同样的办法。即平分区间,求中点判断函数值乘积的符号,得到新的有根区间(,),它包含在区间(,)内,其区间长度是(,)的,(,)的。如此重复n次,如果还没有找到方程的精确根,此时我们得到方程的有根区间序列:(,),(,),…,(),…它满足(,)(,)…()…f()f()<0-=,n=1,2,…n-1当n充分大时,()的长度缩小到充分小,此时它的中点与夹在与之间,它们的距离也充分小,且序列{}满足:上式表明=(2)即序列{}以等比数列的收敛速度收敛于。同时也表明序列{}是的一个近似值序列。因此对任意给定的精度<0,总存在n,使此时,我们可以取作为的近似值,即可满足精度。例2:用二分法求方程f(x)==0在[1,2]内的一个实根,且要求满足精度解:用二分法计算结果如表2-3:nf()11.02.01.52.37521.01.51.25-1.7968731.251.51.3750.1621141.251.3751.3125-0.8483951.31251.3751.34375-0.3509861.343751.3751.359375-0.0964171.3593751.3751.36718750.0323681.3593751.36718751.36328125-0.0321591.363281251.36718751.3652343750.000072101.363281251.3652343751.364257813-0.01605111.3642578131.3652343751.364746094-0.00799

迭代11次,近似根=1.364746094即为所求,其误差这种方法的优点是简单,对f(x)只要求连续。它的收敛速度与比值为的等比级数相同,它的局限性是只能用于求实根,不能用于求复根及偶数重根。迭代法的基本思想由函数方程f(x)=0,构造一个等价方程:x=(1)从某个近似根出发,令,n=0,1,2,…(2)可得到序列{},若{}收敛,即lim=只要连续,有也即从而可知是方程(1)的根,也就是f(x)=0的根。此时{}就是方程(1)的一个近似解序列,n越大,的近似程度就越好。若{}发散,则迭代法失败。例1用迭代法求方程f(x)=-10=0在[1,2]内的一个近似根,取初始近似值.表2-4n(1)(2)(3)(4)01.51.51.51.51-0.8750.81651.286953771.3483997326.7322.99691.402540801.367376373-469.7(-8.651.345458381.3649570141.03

1.375170251.365264755

1.360094191.365225596

1.367846971.3652230587

1.363887001.365229948

1.365916731.365230029

1.364878221.3652300110

1.36541006

15

1.36522368

20

1.36523024

23

1.36522998

25

1.36523001

解原方程的等价方程可以有以下不同形式:(1)(2)(3)(4)对应的迭代公式有:(1)(2)(3)(4)取,列表计算如表2-2。与上节二分法比较,(3)、(4)都得到较好的结果,而用二分法达到同样的精度,需要迭代27次,同时也看出迭代函数构造不同,收敛速度也不尽相同,迭代函数构造不当(如(1),(2)),序列{}就不收敛。二、迭代法的几何意义以上可以看到迭代法可能收敛,也可能不收敛。一般来说从f(x)=0,构造不止一种,有的收敛,有的不收敛,这取决于的性态。方程x=的根,在几何上就是直线y=x与曲线y=交点的横坐标,如图2-3所示。(a)(b)(c)(d)图2-3中(1)、(2)收敛,(3)、(4)发散。三、迭代法收敛的条件定义1如果在根的某个邻域B=∈B,迭代过程,n=0,1,2,…收敛,则称迭代过程在附近局部收敛。定理1设=(),在的某个邻域B内连续,并且||≤q<1,则对任何∈B,由迭代公式决定的迭代序列{}收敛于。且|-|≤(3)|-|≤(4)证:由拉格朗日中值定理,存在B,使由已知||≤q,从而得|-|≤q||≤…≤|-|所以这样我们就证明了{}收敛于。再由拉格朗日中值定理,存在,使==()所以||≤q||≤…≤q||(5)又由于||=|()+()+…+()|≤||+||+…+||所以||≤(q+q+…+q+1)||=||令p→+∞,有|-|≤||也即|-|≤||这样(4)式得证。再由(5)得|-|≤||这样(3)式也得证。这个定理是一个很实用的收敛定理。一方面它可以判定我们所构造的迭代函数是否收敛。另一方面(3)式还可以估计迭代次数。但结果偏保守,次数也偏大,实际中很少用。通常由(4)式,当||<(为给定精度)时,认为|-|<就是满足精度的一个近似解了。定理2〖HTSS〗对于方程x=,如果满足(1)对任意x∈[a,b],有∈[a,b](2)对任意x∈[a,b],有|(x)|≤q<1则对任意x∈[a,b],迭代x=(x)所决定的序列{x}收敛于x=(x)的根x,且(3)、(4)式也都成立。证明与定理1相仿,故略去。以上两定理中的条件要严格验证都较困难,实用时常用以下不严格的标准。有根区间[a,b]较小,对某一x∈[a,b],|(x)|明显小于1,由(x)连续性知在的x某领域内|(x)|也小于1,则迭代收敛。例2考察例1中四种迭代法在根附近的收敛情况,取根的近似值为x=。解(1)17.75>1不收敛(2)5.128>1不收敛〖ZK〗〗(3)0.656<1收敛(4)0.122<1收敛)上例说明值越小,收敛速度就越快。四、迭代法的收敛速度用迭代法求方程的近似根,我们不仅要构造适当的要求它收敛,而且还需要知道它的收敛速度。关于收敛速度,有如下定义:定义2设序列{x}收敛于,令=-x,若存在某实数p≥1及正常数C,使(6)则称序列{x}阶收敛。如果序列{x}是由=(x)产生的,且p阶收敛,则称这种迭代过程是p阶收敛的。当p=1,且C<1时,称为线性收敛;当p=2时,称为平方收敛(或二次收敛);当1<p<2时,称为超线性收敛。同前面一样,设,=(x),=()则有-=(-x)(在在与x之间)所以=因而=||(n→∞)若0<<1,则迭代过程为线性收敛。若=0,由泰勒展开得(x)=()+设()≠0,则-=(x)-()=从而〖→>0(n→∞)此时迭代过程为二阶收敛。定理3设在x=的根邻近有连续的p阶导数,当||<1,且()≠0时,迭代过程=(x)为线性收敛;而当()=0,()≠0时为二阶收敛。一般来说,若()=()=…=()=0,而()≠0,则称=(x)在附近为p阶收敛。第三节迭代收敛的加速从f(x)=0构造出的迭代格式x=(x)可能收敛也可能不收敛,在收敛的情形,收敛速度也取决于|(x)|的大小,当|(x)|接近于1时,收敛可能很慢。后两种情形都影响迭代法的应用。能否从x=(x)出发构造出新的迭代形式,使收敛速度加快呢?松驰法对x=(x)引入一个任意常数作为参数,并假设≠-1,在方程两边加上x,得(1+)x=x+(x)于是x=(x)(1)显然方程(1)与方程x=(x)等价,若令(x)=(x),(1)可写成x=(x)(2)为了使得用x=(x)作迭代比用x=(x)作迭代收敛的更快,我们希望|(x)|比|(x)|更小,又由于(x)=(3)若(x)连续,则当x在根x*附近时,(x)也在(x*)附近,为此选取=-(x*)。这样可以使得|(x)|较小。但在求解过程中x*未知,故用x来代替,只要-()≠-1,记,于是代入(1)有松弛法迭代公式:x(n=0,1,2,…)(4)称为松弛因子。松弛法的加速效果是明显的,甚至不收敛的迭代函数经加速后一般也能获得收敛。二、埃特金方法用松弛法计算时,要先算(x),在使用时有时不太方便,假若在求得x以后,先求出和再利用和构造格式-由此得到埃特金(Altken)公式:==()-(n=0,1,2,…)(5)它的加速效果也十分明显。例1分别用松弛法、埃特金法求方程-10=0在初值附近的一个根,取迭代格式解用松弛法计算,取因此松弛法的迭代公式为n=0,1,2,…列表计算如下:表2-3n01230.8908036860.8871231410.887130869

1.51.3649539161.3652300121.365230013

用埃特金方法计算,迭代格式为n=0,1,2,…列表计算如下:表2-4n01230.8908036860.8871231410.887130869

1.51.3649539161.3652300121.365230013

与上节例1中(3)与(4)相比收敛速度明显增加。第四节

牛顿法解非线性方程f(x)=0的牛顿(Newton)法,就是将非线性方程线性化的一种方法。它是解代数方程和超越方程的有效方法之一。一、牛顿法的基本思想把非线性函数f(x)在处展开成泰勒级数f(x)=f()+(x-)f′()+(x-)+…取其线性部分,作为非线性方程f(x)=0的近似方程,则有f()+(x-)f′()=0设f′()≠0,则其解为x=-(1)再把f(x)在x处展开为泰勒级数,取其线性部分为f(x)=0的近似方程,若f′(x)≠0,则得x=-如此继续下去,得到牛顿法的迭代公式:x=-(n=0,1,2,…)(2)例1用牛顿法求方程f(x)=x+4x-10=0在[1,2]内一个实根,取初始近似值x=1.5。解f′(x)=3x+8x所以迭代公式为:x=-n=0,1,2,…列表计算如下:n01231.51.37333331.365262011.36523001

二、牛顿法的几何意义方程f(x)=0的根就是曲线y=f(x)与x轴交点的横坐标x*,当初始近似值选取后,过(,f())作切线,其切线方程为:y-f()=f′()(x-)它与x轴交点的横坐标为x=-一般地,设是x*的第n次近似值,过(,f()作y=f(x)的切线,其切线与x轴交点的横坐标为:x=-即用切线与x轴交点的横坐标近似代曲线与x轴交点的横坐标,如图2-4。2-4牛顿法正因为有此明显的几何意义,所以也叫切线法。三、牛顿法的收敛性及收敛速度定理设f(x)在[a,b]满足(1)

f(a)·f(b)<0(2)f(x)∈[a,b],f′(x),f″(x)均存在,且f′(x)与f″(x)的符号均保持不变。(3)f()·f″(x)>0,、x∈[a,b],则方程f(x)=0在[a,b]上有且只有一个实根,由牛顿法迭代公式计算得到的近似解序列{}收敛于方程f(x)=0的根x*。由方程f(x)=0得到的牛顿迭代形式x=x-==1-=由于f(x*)=0,所以当f′(x*)≠0时,(x*)=0,牛顿法至少是二阶收敛的,即牛顿法在单根附近至少是二阶收敛的,在重根附近是线性收敛的。牛顿法收敛很快,而且可求复根,缺点是对重根收敛较慢,要求函数的一阶导数存在。

四、牛顿二阶导数法这里将简单介绍一下牛顿二阶导数法。对其几何意义及收敛性不作详细的叙述,读者可仿照牛顿法进行讨论,其基本思想是:将f(x)在处展开泰勒级数f(x)=f()+f′()(x-)+f″()(x-)+…取右端前三项近似代替f(x),于是得f(x)=0的近似方程为f()+f′()(x-)+f″()(x-)=0也即f()+(x-)[f′()+f″()(x-)]=0(3)设其解为.利用(1),-=-,代入(3)中括号内-,则得f()+(-)[f′()+f″()]=0于是解出,得=-重复以上过程得:=-于是得牛顿二阶导数法的迭代公式为:=-n=0,1,2,…(4)上式与牛顿法迭代公式(2)相比,利用此公式求根收敛更快,迭代次数更少。其缺点是要求f(x)的二阶导数存在。第五节割线法用牛顿方法解非线性方程f(x)=0,虽然在单根附近有较高的收敛速度,但需要计算f′(x)。若f(x)比较复杂时,每次计算f′(x)带来很多不便;如果用不计算导数的迭代方法,往往只有线性收敛的速度。本节我们介绍割线法,采取在迭代过程中不仅用前一步处的函数值,而且还使用处的函数值来构造迭代函数。这样做能提高迭代的收敛速度。一割线法的基本思想设非线性方程f(x)=0,其中f(x)为[a,b]上的连续函数,且f(a)·f(b)<0。设,为f(x)=0的根x*的两个初始近似值,过(,f())和(,f())作一直线,其方程为:y=f()+(x-)当f()≠f()时,此直线与x轴交点为=-(-)(1)作为f(x)=0根的第二次近似值,可以预期比,更接近于x*。重复上述过程可得,,…,,从而可得割线法的迭代公式:=-(-)(n=1,2,…)(2)很明显,它也可由牛顿法用差商近似代替微商f′()而得。若把(2)中的换为,则得迭代公式=-(-)(n=1,2,…)(3)显然,它也可由牛顿法用差商近似代替微商f′()而得。以上两种迭代方法都称为割线法(或弦截法)。(2)称为双点割线法。也称为有记忆割线法。(3)称为单点割线法。它们都需要x*邻近的两个初始近似值,才能启动。例1

用双点割线法求方程x-3x+1=0在0.5附近的根。精确到小数点后第六位。解:令f(x)=x-3x+1=-(-)(n=1,2,…)即=-(-)(n=1,2,…)取=0.5,=0.2列表计算如下:表2-6n123450.50.20.3563220.3477310.3472950.20.3563220.3477310.3472950.347296

二割线法的几何意义双点割线法是用过点(,f())和(,f())两点的割线与x轴交点的横坐标x2作为x*的新近似值。重复此过程,用过点(,f())和(,f())两点的割线法与x轴交点的横坐标来作为x*的下一新的近似值。如图2-5。单点迭代法则是用过点(,f())和(,f())两点的割线与x轴交点的横坐标来作为x*的近似值,如图2-6。2-52-6三割线法收敛的速度定理设方程f(x)=0的根为x*。若f(x)在x*附近有连续的二阶导数,f′(x*)≠0,而初值,充分接近x*,则双点割线法的迭代过程收敛,收敛速度为|-x*|≈|-x*|这说明它是超线性收敛的(p=1.618>1)。而单点割线法在单根附近是线性收敛的。第三章解线性方程组的直接法3.1引言与矩阵一些基础知识3.1.1引言线性方程组求解是科学计算中最常遇到的问题,如在应力分析、电路分析、分子结构、测量学中都会遇到解线性方程组问题.在很多广泛应用的数学问题的数值方法中,如三次样条、最小二乘法、微分方程边值问题的差分法与有限元法也都涉及到求解线性方程组.本章讨论n个变量n个线性方程的方程组求解,其表达式为通常用向量矩阵表示,则上述方程可写成(3.1.1)其中并记做,分别表示A为n×n阶实矩阵,x,b为n维实向量.根据线性代数知识可知A非奇异,即detA≠0,方程组(3.1.1)有唯一解,并可用Cramer法则将解用公式表示出来,但由于计算量太大,因此不能用于实际求解.本章要讨论的直接方法是将方程组(3.1.1)转化为三角方程组,再通过回代求三角方程组的解.理论上,直接法可在有限步内求得方程的精确解,但由于数值运算有舍入误差,因此实际在计算机上求得的数值解仍是近似解,仍要对它进行误差分析.解线性方程组的另一类方法是迭代法,将在下一章讨论.下面给出本章和下章需要的一些矩阵基础知识.3.1.2矩阵特征值与谱半径定义1.1设,若存在一个数(实数或复数)和非零向量,使(3.1.2)则称为A的特征值,x为A对应的特征向量,A的全体特征值称为A的谱,记作,即(3.1.3)称为A的谱半径.由式(3.1.2)知,可使齐次方程有非零解,故系数行列式det(I-A)=0,即(3.1.4)称为特征多项式,方程(3.1.4)称为特征方程,在复数域中有n个根,故由行列式(3.1.4)展开可知:于是,矩阵的n个特征值是它的特征方程(3.1.4)的n个根,A的迹trA有(3.1.5)(3.1.6)此外,A的特征值和特征向量x还有如下性质:(1)与A有相同的特征值及相同的特征向量x.(2)若A非奇异,则的特征值为,特征向量为x.(3)相似矩阵有相同特征多项式.例3.1求的特征值及谱半径.解A的特征方程为故A的特征值为.谱半径为.讲解:根据特征值定义(3.1.2)式知它等价于齐次方程有非零解,它的充分必要条件是系数行列式为零即,将行列式展开,由(3.1.4)看到它是的n次多项式,记作称为特征多项式,将行列式对角元素相乘,即它决定了中及的系数,因为行列式的展开式中其余各项的次数均不超过,故,利用,有n个根(在复数域中,复根成对出现),故,可知,于是有,称为矩阵A的迹。另外行列式中令,则得,从而得到(3.1.6)3.1.3对称正定矩阵定义1.2设,如果,即,则称A为对称矩阵,若还满足对于,则称A为对称正定矩阵,如果对有,则称A为半正定矩阵.当A为对称时,A的特征值皆为实数,且有n个线性无关的特征向量.对称正定矩阵还有以下重要性质:(1)对称正定,则〖WTHX〗A非奇异,且也对称正定;(2)A对称正定的充要条件是,A的所有特征值;(3)A对称正定,则A的对角元素;(4)A对称正定的充要条件是A的所有顺序主子式以上性质可直接由定义证明,证明略.讲解:对称正定矩阵性质都可直接由定义证明为了更好理解,下面就性质(1)给出证明先证A非奇异,用反证法,假定A奇异,则,使,故与A正定的假定矛盾,故A非奇异,即存在。由于是,即对称,再证正定。对,令,于是,由A正定得,故也正定。3.1.4正交矩阵与初等矩阵定义1.3若且,则称A为正交矩阵.由定义知,且与均为正交阵,且有.定义1.4设.则为单位矩阵,称为(实)初等矩阵.显然,例如,则设,则若σ已知,选,使则当时,令(3.1.7)则有(3.1.8)此外,还有(3.1.9)下面给出两个常用的初等矩阵.例3.2初等排列矩阵.令则矩阵也称初等置换矩阵,它由单位矩阵I交换i行与j行得到,它有以下性质:(1),故为正交矩阵.(2).(3)是将A的i,j行互换,是将A的i,j列互换.例3.3初等下三角矩阵.设,则记称为指标为j的初等下三角矩阵,即(3.1.10)矩阵有以下性质:(1).(2).(3),为单位下三角矩阵.初等下三角矩阵也称为Gauss变换矩阵.讲解:例3.2中给出的初等排列阵,其作用是实现矩阵A的i,j行互换及列互换,即表示A的i、j两行互换,而,表示A的i,j两列互换。例3.3初等下三角阵,由(3.1.10)所表示的矩阵,在下节Gauss消去法中有应用,其逆矩阵,表示为3.2Gauss消去法3.2.1顺序消去法Gauss消去法就是将方程组(3.1.1)通过(n-1)步消元,将(3.1.1)转化为上三角方程组(3.2.1)再回代求此方程组的解.下面记增广矩阵,即第1步设,计算l,记为,若用乘第一行加到第i行,可消去,用Gauss变换矩阵表示令其中一般地,假定已完成了(k-1)步消元,即已将转化为以下形式:第k步,假定,计算(3.2.2)记,,则其中(3.2.3).当k=1,2,…,n-1则可得到,即方程组(3.2.1).直接回代解(3.2.1)得,(3.2.4)并且有,由以上顺序消去过程可得如下定理.定理2.1设非奇异,则通过两行互换总可使,k=1,2,…,n-1.可将方程组(3.1.1)转化为(3.2.1)并求得方程组(3.1.1)的解为(3.2.4),且有.如果不做行交换,则使的条件如下.定理2.2非奇异,且各阶顺序主子式,则,k=1,2,…,n-1.证明用归纳法,当,故.现假设(k-1)成立,即,对i=1,2,…,k-1已推出,故Gauss消去法能进行(k-1)步消元,A已约化为,即故对k=1,2,…,n均成立,证毕.在整个消去法消元过程中,k从1到(n-1)共需乘除法运算次数为加减法次数为回代过程中由公式(3.2.4)可知乘除法次数为,加减法次数为,于是Gauss消去法的乘除法总次数为,加减法次数为例3.4用Gauss消去法解方程组并求detA.解消元得再由(3.2.4)回代,得解讲解:Gauss消去法是将方程组AX=b,通过消元转化为上三角方程组(3,2,1)求解,消元第一步做完后有用矩阵表示第K-1步完成后得到当,可做K步,得到得到,对应的方程组就是(3.2.1),利用公式(3.2.4)就可求得解。定理2.2给出了进行顺序消去法的条件,即A的所有顺序生子式,而方程(3.1.1)解存在唯一的条件是3.2.2消去法与矩阵三角分解上述Gauss消去法的消元过程从矩阵变换角度看,就是进行了(n-1)次的Gauss变换,即若令,则,则由,得其中L为单位下三角矩阵,U为上三角矩阵.定理2.3设非奇异,且A的顺序主子式(i=1,2,…,n-1),则存在唯一的单位下三角矩阵L和上三角矩阵U,使A=LU.证明存在性已从上面A的Gauss变换中得到,下面只证唯一性.假定A有两种不同的分解式,其中,为单位下三角矩阵,为上三角矩阵,因A非奇异,故,,,均非奇异,于是上式用左乘,用右乘,则得因仍为上三角矩阵,则为上三角矩阵,而仍为单位下三角矩阵,故,且.由此可得=,=.证毕.将A分解为单位下三角矩阵L及上三角矩阵U的乘积A=LU,称为A的Doolittle(杜里特尔)分解.讲解:从上面讨论的消元过程看到每消元一步就是用相应Gauss变换左乘矩阵A,因而有(上三角阵),即,其中为单位下三角,这就是A的三角分解。它说明只要能进行顺序Gauss消元就能将矩阵A分解为LU的乘积。定理2.3给出了LU分解的存在唯一性条件。3.2.3列主元消去法在顺序消元过程中,只要(k=1,2,…,n-1)即可进行计算,但如果很小,则将导致舍入误差增长,使解的误差很大,见下例.例3.5用Gauss消去法求解方程组解因,,故方程有唯一解,且精确解为.若用Gauss消去法取四位有效数字计算,可得解,与比较,误差很大,若将两个方程互换为仍用Gauss消去法求解,则得,它有四位有效数字,即.这例子表明通过行交换可避免舍入误差增长,这就是列主元消去法的基本思想。其计算步骤是:第1步,在中的第1列选主元,即行为主元.若,将的第行与第1行互换,再按消元公式计算得到.假定上述过程已进行(k-1)步,得到.第k步,在中第k列选主元,,若,则在中将与k行互换(若=k则不动),再按公式(3.2.2)、(3.2.3)求出.对k=1,2,…,n-1,重复以上过程则得,如果某个k出现主元,则表明detA=0,方程没有唯一解或严重病态,否则可由(3.2.4)求得解.上述每步行交换后再消元相当于(3.2.5)其中是指标为k的初等下三角矩阵,为初等排列矩阵,=k时,表示不换行,经过(n-1)步换行与消元,A化为上三角矩阵,即它也表明当A非奇异时,存在排列矩阵P(若干初等排列矩阵的乘积),使PA=LU,其中L为单位下三角矩阵,其元素,U为上三角矩阵.例3.6用列主元消去法解Ax=b,其中解:由回代公式(3.2.4)求得解此例的精确解为,可见结果精度较高.若不选列主元Gauss消去法,求解得,误差较大.除列主元消去法外,还有一种消去法,是在A的所有元素中选主元,称为全主元消去法.因计算量较大且应用列主元已能满足实际要求,故不再讨论.目前很多数学软件库都有列主元消去法,可直接调用.讲解:为了减少计算的舍入误差,使用消去法通常都要选主元,目前最常用的是列主元消去法,也就是每步消元之前选主元,当第一步选A中第1列的主元,即,然后将行与1行互换,再进行消元,以后每步消元做法类似,先选主元,再消元。3.3直接三角分解法3.3.1Doolittle分解法上节定理2.3已经证明当非奇异,且(i=1,2,…,n-1),则A可做LU分解,即A=LU,其中L为单位下三角矩阵,U为上三角矩阵.现在可直接通过矩阵乘法求得L及U的元素,于是解方程(3.1.1)就转化为求解(3.3.1)若令Ux=y,则解方程(3.1.1)转化为求两个三角方程下面直接用矩阵乘法求U及L的元素,由直接得到(3.3.3)若已求得U的(i-1)行及L的(i-1)列,则由矩阵乘法有可得(3.3.4)这就求得U的第i行元素,求L的第i列可由若,可得(3.3.5)计算规律是先由(3.3.3)求U的第1行和L的第1列元素,再由(3.3.4)求U的第i行(i=2,3,…,n)元素,再由(3.3.5)计算L的第i列元素,求出L及U后再解方程(3.3.2),其计算公式为(3.3.6)(3.3.7)例3.7用Doolittle分解法求方程的解.解先用公式(3.3.3)~(3.3.5)求出,,,,,,,,于是,再由(3.3.6)求得的解由(3.3.7)求得的解.讲解:直接利用矩阵乘法求A=LU的L及U的元素,一般只要掌握矩阵乘法规则,对U中元素由上而下逐行计算,L元素由左向右逐列计算,总的次序是先算一行U的元素再算一列L元素,按次序交替进行,完成分解后再解两个三角方程组(3.3.2),计算公式为(3.3.6)和(3.3.7)。3.3.2Cholesky分解与平方根法当对称正定时,A的顺序主子式,故由定理2.3知,A=LU的分解存在且唯一,其中L为单位下三角矩阵,U为上三角矩阵,且.定理3.1若对称,且A的顺序主子式,则A可唯一分解为,其中L为单位下三角矩阵,D为对角矩阵.证明由定理2.3可知A=LU,而,故这里,,为单位上三角矩阵.因.由A=LU的分解唯一性,得,于是有.证毕.定理3.2若对称正定,则存在唯一的对角元为正的下三角矩阵L,使A分解为(3.3.8)这种分解称为Cholesky分解.证明由定理3.1可知,这里为单位下三角矩阵,,.由于A的顺序主子式,因A正定,故,可推出.若记,于是有.若,则L为下三角矩阵,且对角元为正,故有,即为(3.3.8).证毕.利用Cholesky分解式(3.3.8)将求方程组(3.1.1)的解转化为求方程的解.令,则得(3.3.9)根据矩阵乘法,由,求L的元素CONTROLShockwaveFlash.ShockwaveFlash.1\s得当i=j有(3.3.10)当i>j,得(3.3.11)注意当j=1时有,对j=2,3,…,n由(3.3.10),(3.3.11)逐列求得L的元素,这就是A的Cholesky分解,然后再解(3.3.9)的两个三角方程组,得(3.3.12)及(3.3.13)这就是对称正定方程组的平方根法.其工作量约为Doolittle分解法的一半.另外,由于故有这表明分解过程中矩阵L中元素的数量级不增长,因此平方根法计算是数值稳定的.例3.8用平方根法求以下方程组的解.解先验证系数矩阵A对称正定,对称显然,,,故A对称正定,可用Cholesky分解(3.3.10),(3.3.11)计算,求得即,求解.由公式(3.3.12)得,再由的公式(3.3.13)求得Cholesky分解法要用到开方运算,为避免开方运算,可将A分解为(其中L为单位下三角矩阵),再分别解方程组及或,这种方法称为改进平方根法,可作为练习自行推导.讲解:当A为对称正定矩阵时,可将A分解为,其中L为下三角阵,这种分解为Cholesky分解,它也是存在唯一的,求L的元素仍可直接用矩阵乘法,由公式(3.3.10)和(3.3.11)逐列求得L的元素,注意,当j=1时得然后对j=2,3...n逐列计算.由(3.3.10)可得及,所以这表明,平方根法得到的中间量是有界的,完全可以控制,舍入误差也同样可以控制,故计算过程是稳定的。使用平方根法要计算开方,为避免开方可用改进平方根法,将A分解为,即其中,由矩阵乘法,比较等式两边,按行计算L,T元素,对于i=2,3,…n解方程组以下步骤进行:所以,这就是改进平方根法。3.3三对角方程组的追赶法在许多科学计算问题中,常常所要求解的方程组为三对角方程组,即(3.3.14)其中(3.3.15)并满足条件(3.3.16)称A为对角占优的三对角矩阵,对这种简单方程可通过对A的三角分解建立计算量更少的求解公式.现将A分解为下三角矩阵L及单位上三角矩阵U的乘积.即A=LU,其中(3.3.17)直接用矩阵乘法公式可得到于是有(3.3.18)由此可见将A分解为L及U,只需计算及两组数,然后解,计算公式为(3.3.19)再解Ux=y则得(3.3.20)整个求解过程是先由(3.3.18)及(3.3.19)求,及,这时i=1,…,n是"追"的过程,再由(3.3.20)求出,这时i=n,…,1是往回"赶",故求解方程组(3.3.14)的整个过程称为追赶法.它只用(5n-4)次乘除法运算,计算量只是,而通常方程组求解计算量为,另外,追赶法计算,是数值稳定的,因为在式(3.3.16)表示的条件下,可证明所以,追赶法是一种计算量少及数值稳定的好算法.讲解:注意追赶法满足条件(3.3.16)时,直接由(3.3.18)则可推出它表明及有界,因此即使不选主元,方法也是数值稳定的,并且,故方程组(3.3.14)解时存在唯一的。3.4向量和矩阵范数3.4.1内积与向量范数为了研究方程组Ax=b解的误差和迭代法收敛性,需对向量及矩阵的"大小"引进一种度量,就要定义范数,它是向量"长度"概念的直接推广,通常用表示n维实向量空间,表示n维复向量空间.定义4.1设(或),,,实数或复数,称为向量x与y的数量积也称内积.非负实数,称为向量x的欧氏范数或2-范数.定理4.1设设(或)则内积有以下性质:(1),当且仅当x=0时等号成立;(2),或;(3),或;(4);(5)(3.4.1)称为Cauch-Schwarz不等式.(6),称为三角不等式.定义4.2向量的某个实值函数N(x),记作,若满足下列条件:(1)‖x‖≥0,当且仅当x=0时等号成立(正定性);(2)(齐次性);(3)(三角不等式);则称是上的一个向量范数.对于,由内积性质可知它满足定义4.2的三个条件,故它是一种向量范数.此外还有以下几种常用的向量范数.(称为∞-范数)(称为1-范数)容易验证及均满足定义4.2的三个条件.更一般的还可定义但只有p=1,2,∞时的三种范数是常用的向量范数.例如给定,则可求出定理4.2设是上任一种向量范数,则N(x)是向量x的分量的连续函数.定理4.3设与是上任意两种向量范数,则存在常数,使(3.4.2)不等式称为向量范数等价性.以上两定理证明可见[2],[3].讲解:在向量得内积(x,y)的性质中,定理4.1的(5)为Cauch-Schwarz不等式(3.4.1)是经常使用的,下面给出证明,显然当x=0或y=0时(3.4.1)成立,现设,考察若取则上式为于是两边开方则得(3.4.1)利用(3.4.1)直接可证三角不等式,从而可证明向量2一范数,满足定义中的三个条件。及是三种最常用的范数。实际上可以给出很多不同的向量范数,只要证明它们满足定义4.2中的三个条件,定理4.3表明任意的两种向量范数及,它们都是等价的,对于的等价性在习题10中给出,可自己证明。3.4.2矩阵范数矩阵可看成n×n维向量,如果直接将向量的2-范数用于矩阵A,则可定义(3.4.3)称为矩阵A的Frobenius范数,简称F-范数.它显然满足向量范数的三条性质,但由于矩阵还有乘法运算,因此矩阵范数的定义中应增加新条件.定义4.3如果的某个非负实函数N(A),记作‖A‖,满足条件:(1)‖A‖≥0,当且仅当A=0(零矩阵)时等号成立;(2);(3);(4);则称N(A)=‖A‖为上的一种矩阵范数.显然满足定义中的四个条件[(3),(4)两条均可由Cauchy-Schwarz不等式(3.4.1)证明,故是一种矩阵范数.除矩阵自身的运算外,在解方程中矩阵乘向量的运算即Ax,也是必不可少的.因此要求所引进的范数应满足条件:(3.4.4)上式称为相容性条件.为使引进的矩阵范数满足条件(3.4.4),我们给出以下定义.定义4.4设,当给定向量范数时可定义(3.4.5)称为矩阵的算子范数或从属范数.定理4.4设是上的一种向量范数,则由(3.4.5)定义的是一种矩阵范数,且满足相容性条件(3.4.4).证明因是中有界闭集上的连续函数,故在D上有最大值,即使,而对,令

故所以从而当时(3.4.4)成立,而x=0时(3.4.4)显然也成立.下面验证由(3.4.5)定义的满足矩阵定义的四个条件.条件(1),(2)显然成立.下面只需证(3),(4).由(3.4.5)及(3.4.4)有故(3)成立,又因故有.证毕.定理4.5设则(A的行范数)(A的列范数)(A的2范数)这里ρ(·)为矩阵的谱半径.证明这里只给出的证明,其余可见[2].设,由其中.故对均有.下面证明,使得现设,其中显然,且.证毕.从定理可以看出,计算及较容易,而计算2时因为要求的特征值,所以较为困难.但当A对称时,有例3.9已知,求.解.定理4.6对任何为任一种从属范数则(3.4.6)反之,对任意ε>0,至少存在一种从属范数,使(3.4.7)证明只证定理前一半,后半证明可见[3].设为A的特征值,则,使,由(3.4.4)有及得即证毕.注意,当A对称时,,表明(3.4.6)可取等号.定理4.7(矩阵范数等价性)对上的任两种范数及,存在常数,使(3.4.8)证明略.例3.10证明(3.4.9)解因对称半正定,,利用特征值性质(3.1.5)及和的定义,有另一方面于是,证毕.定理4.8设1则非奇异,且(3.4.10)证明用反证法.假定(I+B)奇异,则齐次方程有非零解,即使故而与‖B‖<1的假设矛盾,故(I+B)非奇异.又,即,得,取范数,于是得(3.4.10).证毕.讲解:矩阵范数可看作向量范数的扩充,它的定义中除了向量范数定义的三条性质,只增加了由矩阵乘法的得到的第4条即但为使矩阵与向量运算AX能相容,要求它们满足条件(3.4.4)即这就是相容性条件,由此给出了矩阵的算子范数,即从属范数为等式(3.4.5),它是由相应的向量范数定义的,定理4.4证明了(3.4.5)定义的从属范数,满足矩阵范数的定义,并针对三种常用的范数及得到了及,它们的表达式已有定理4.5给出。这就是必须记住的,并且当给定具体的矩阵A以后要能算出和.如例3.9.定理4.6给出了矩阵范数与谱半径关系,是一个很重要的结果,必须记住,定理4.8给出阵非奇异的条件和它的逆矩阵估计式是一个经常使用的结论。3.5误差分析与病态方程组3.5.1矩阵条件数与扰动方程组误差界在解方程组Ax=b时,由于各种原因,A或b往往有误差,从而使得解也产生误差.例3.11方程组的准确解为,当A与b有微小变化时,如变为方程则准确解变为,它表明A,b的微小扰动引起方程解x的很大变化,这就是病态方程.定义5.1求解线性方程组Ax=b时,若A或b有微小扰动或时,解x的误差很大,则称此方程组为病态方程组,相应的系数矩阵A称为病态矩阵.反之,若此时很小,则称方程组为良态方程组,矩阵A为良态矩阵.注意方程组是否病态与用什么数值方法无关,它是由方程自身性质决定的.在例3.11中因为行列式,因此出现病态.但有时A从表面上看性质很好,也可能是病态的.例3.12方程组Ax=b表示为它的准确解,A对称正定且.表面看性质"较好",但若对右端b作微小变化,如方程改为,则解变为T.这里b的相对误差大约只有,但解的相对误差却很大,故A也是病态矩阵.那么如何判断A是否病态?先给出如下定义.定义5.2设非奇异,‖·‖为矩阵的任一种从属范数,则(3.5.1)称为矩阵A的条件数.从定义看到矩阵条件数依赖于范数的选取,如范数为2-范数,则记为.同理有等等.条件数有以下性质:(1);(2);(3)U为正交矩阵,则(4)若与为A的按模最大与最小特征值,则.若A对称,则下面给出扰动方程组解的误差分析.先考察b有扰动,则扰动方程为由于Ax=b,故得,于是,再由Ax=b,有,即,故得(3.5.2)下面再研究方程Ax=b,当A有扰动时,其解的误差分析.此时扰动方程为因Ax=b,故有(3.5.3)因存在,若假定则由定理4.8可知非奇异,并有由(3.5.3)可得即故有(3.5.4)综合(3.5.2)与(3.5.4)的结果可得到如下定理.定理5.1设是方程组Ax=b的解,是扰动方程组的解.如果,则有误差估计(3.5.5)此定理包含了(3.5.2)及(3.5.4)两种特例.当则得(3.5.2)式;当时则得(3.5.4)式.实际使用时,由于误差‖‖及‖‖很小,并且一般是可以控制的,故定理中的条件是可以成立的.从(3.5.5)看到,当A的条件数Cond(A)很大时,解的相对误差也很大,故方程组为病态.在例3.11中1,而于是条件数很大,故方程是严重病态的.例3.13Hibert矩阵是一个著名的病态矩阵,记作

它是一个对称正定矩阵,当n≥3时它是病态矩阵.例如,故.另外还有.等等因此是严重的病态矩阵,且n越大越大.例3.14在例3.12的方程组中可算出A的特征值,,,,故例中,,,实际相对误差是而根据(3.5.2)的误差估计为这与实际相差不大,即相对误差放大了将近3000倍.故方程为病态方程组.定理5.2设方程组,若实际求得解为,则(3.5.6)证明记剩余,则,,,又故有.证毕.这是关于方程解的事后误差估计,它表明如果方程组病态,即使剩余‖r‖很小,解的相对误差仍可能很大.讲解:矩阵条件数是判断矩阵是否病态的依据,要求在n3时能够计算,一般情况由于计算较困难,只要知道它的性质则可,利用条件数估计解方程组AX=b的误差,主要根据定理5.1的误差估计式(3.5.5)。3.5.2病态方程组的解法如果A的条件数Cond(A)>>1,则Ax=b为病态方程,但计算Cond(A)时需要求,计算量很大,相当于解方程组,在实际中常可通过求解过程直观地判断方程组的病态性质,如果解方程时出现下述情况之一,则可能是"病态"方程组.(1)在列主元消去法中出现小主元;(2)在计算过程中行或列几乎线性相关或三角分解中对角元出现近似零的元素;(3)矩阵A的元素数量级相差很大且无规律;(4)剩余很小,而解很大,又达不到精度要求.对病态方程组求解可采用以下措施:(1)采用高精度运算,减轻病态影响,例如用双倍字长运算.(2)用预处理方法改善A的条件数,即选择非奇矩阵,使与Ax=b等价,而的条件数比A改善,则求的解,即为原方程的解.计算时可选择P,Q为对角矩阵或三角矩阵.(3)平衡方法,当A中元素的数量级相差很大,可采用行均衡或列均衡的方法改善A的条件数.设非奇异,计算,令,于是求Ax=b等价于求,或.这时的条件数可得到改善,这就是行均衡法.例3.15给定方程组Ax=b为A的条件数,若用行均衡法可取,则平衡后的方程为,用三位有效数字的列主元消去法求解得.【本章小结】1.本章主要讨论解方程组AX=b的Gauss消去法和直解三角分解法,首先要理解消去法原理并能用列主元消去法求解方程组。当矩阵A的顺序主子式,则可通过顺序消去得到方程组的解,通过n-1步消去相当于用n-1次Gauss变换使方程转化为,其中,即为上三角阵,于是,其中L为单位下三角阵,为上三角阵,这就是A的LU分解具体计算时也可直接利用矩阵乘法求得L与U的元素。从而将方程AX=b的求解转化为解两个三角方程及,要求在不记公式的前提下对n=3的方程组能直接求出L及U和解x,要注意A能进行LU分解的条件。例3.16非奇异矩阵不一定都有LU分解。解设非奇异,要说明A不一定能做LU分解,只需举出一个例子不能分解即可,通常应尽量找简单例子。现考虑矩阵显然A为非奇异,若A有LU分解,则于是,而显然不能同时成立,这矛盾说明A不能做LU分解,所有只假定A非奇异不能保证A能作LU分解,充分条件是A的所有顺序主子式2.特殊方程组的三角分解法。当A为对称正定矩阵,使用Cholesky分解,得,其中L为下三角阵,再用平方根法求得方程组的解x,分解仍用矩阵乘法规则求得L的元素,然后解两个三角方程组Ly=b及,计算公式(3.3.12),(3.3.13),为避免开方可用改进的平方根法。当A为三对角矩阵时通常用追赶法求解,它也是一种三角分解,只要A的元素满足条件(3.3.16),则追赶法(见公式(3.3.18)-(3.3.20))计算是稳定的,得到的解是可靠的,且整个计算过程只需(5n-4)次乘除和3(n-1)次加减法运算。3.向量和矩阵的范数是本章另一重点,要熟记向量范数定义的3条性质和矩阵范数的4条性质,并能根据定义检验每种具体的范数及是否符合定义要求。对常用的向量范数和矩阵范数及要熟记并能正确算出结果。为使同学更好掌握范数定义,再给出以下两个例题。例3.17设为非奇异阵,为上的向量范数,定义,证明是上的一种向量范数。证明只要证满足范数定义3.1中的3个条件。(1)因P非奇异,故对,故时x=0,且当,于是例当且仅当成立。(2)对(3)故是上的一种向量范数。例3.18设,证明(1)是一种矩阵范数(2)不是A的矩阵范数证明(1)要证明是一种矩阵范数只要证明它满足矩阵范数定义的4个条件。(1),且成立。(2)(3)(4)由此可知是A的一种矩阵范数。(2)由于不满足条件例如于是显然不成立,故不是矩阵范数5.矩阵的条件数是衡量矩阵A病态程度的条件,若,就称A为病态矩阵,通常为病态,P越大,病态越严重,当A为对称矩阵分别为A的绝对最大与最小特征值,利用矩阵条件数还可估计解方程组的计算误差,即当A和b有误差及时解的误差,由(3.5.5)式可得到的估计。例3.19已知Hilbert矩阵解方程组时,及b有微小误差(取3位有效数字),估计解的误差解方程组在及b有微小变化时为简记为,它的精确度为,而且的精确解为于是而.这表明及b的相对误差不超过0.3%,而引起解的相对误差超过50%下面利用定理3.6给出的误差估计式(3.2.1)可得这个估计结果是比实际误差大是合理的。第三章解线性方程组的直接法3.1引言与矩阵一些基础知识3.1.1引言线性方程组求解是科学计算中最常遇到的问题,如在应力分析、电路分析、分子结构、测量学中都会遇到解线性方程组问题.在很多广泛应用的数学问题的数值方法中,如三次样条、最小二乘法、微分方程边值问题的差分法与有限元法也都涉及到求解线性方程组.本章讨论n个变量n个线性方程的方程组求解,其表达式为通常用向量矩阵表示,则上述方程可写成(3.1.1)其中并记做,分别表示A为n×n阶实矩阵,x,b为n维实向量.根据线性代数知识可知A非奇异,即detA≠0,方程组(3.1.1)有唯一解,并可用Cramer法则将解用公式表示出来,但由于计算量太大,因此不能用于实际求解.本章要讨论的直接方法是将方程组(3.1.1)转化为三角方程组,再通过回代求三角方程组的解.理论上,直接法可在有限步内求得方程的精确解,但由于数值运算有舍入误差,因此实际在计算机上求得的数值解仍是近似解,仍要对它进行误差分析.解线性方程组的另一类方法是迭代法,将在下一章讨论.下面给出本章和下章需要的一些矩阵基础知识.3.1.2矩阵特征值与谱半径定义1.1设,若存在一个数(实数或复数)和非零向量,使(3.1.2)则称为A的特征值,x为A对应的特征向量,A的全体特征值称为A的谱,记作,即(3.1.3)称为A的谱半径.由式(3.1.2)知,可使齐次方程有非零解,故系数行列式det(I-A)=0,即(3.1.4)称为特征多项式,方程(3.1.4)称为特征方程,在复数域中有n个根,故由行列式(3.1.4)展开可知:于是,矩阵的n个特征值是它的特征方程(3.1.4)的n个根,A的迹trA有(3.1.5)(3.1.6)此外,A的特征值和特征向量x还有如下性质:(1)与A有相同的特征值及相同的特征向量x.(2)若A非奇异,则的特征值为,特征向量为x.(3)相似矩阵有相同特征多项式.例3.1求的特征值及谱半径.解A的特征方程为故A的特征值为.谱半径为.讲解:根据特征值定义(3.1.2)式知它等价于齐次方程有非零解,它的充分必要条件是系数行列式为零即,将行列式展开,由(3.1.4)看到它是的n次多项式,记作称为特征多项式,将行列式对角元素相乘,即它决定了中及的系数,因为行列式的展开式中其余各项的次数均不超过,故,利用,有n个根(在复数域中,复根成对出现),故,可知,于是有,称为矩阵A的迹。另外行列式中令,则得,从而得到(3.1.6)3.1.3对称正定矩阵定义1.2设,如果,即,则称A为对称矩阵,若还满足对于,则称A为对称正定矩阵,如果对有,则称A为半正定矩阵.当A为对称时,A的特征值皆为实数,且有n个线性无关的特征向量.对称正定矩阵还有以下重要性质:(1)对称正定,则〖WTHX〗A非奇异,且也对称正定;(2)A对称正定的充要条件是,A的所有特征值;(3)A对称正定,则A的对角元素;(4)A对称正定的充要条件是A的所有顺序主子式以上性质可直接由定义证明,证明略.讲解:对称正定矩阵性质都可直接由定义证明为了更好理解,下面就性质(1)给出证明先证A非奇异,用反证法,假定A奇异,则,使,故与A正定的假定矛盾,故A非奇异,即存在。由于是,即对称,再证正定。对,令,于是,由A正定得,故也正定。3.1.4正交矩阵与初等矩阵定义1.3若且,则称A为正交矩阵.由定义知,且与均为正交阵,且有.定义1.4设.则为单位矩阵,称为(实)初等矩阵.显然,例如,则设,则若σ已知,选,使则当时,令(3.1.7)则有(3.1.8)此外,还有(3.1.9)下面给出两个常用的初等矩阵.例3.2初等排列矩阵.令则矩阵也称初等置换矩阵,它由单位矩阵I交换i行与j行得到,它有以下性质:(1),故为正交矩阵.(2).(3)是将A的i,j行互换,是将A的i,j列互换.例3.3初等下三角矩阵.设,则记称为指标为j的初等下三角矩阵,即(3.1.10)矩阵有以下性质:(1).(2).(3),为单位下三角矩阵.初等下三角矩阵也称为Gauss变换矩阵.讲解:例3.2中给出的初等排列阵,其作用是实现矩阵A的i,j行互换及列互换,即表示A的i、j两行互换,而,表示A的i,j两列互换。例3.3初等下三角阵,由(3.1.10)所表示的矩阵,在下节Gauss消去法中有应用,其逆矩阵,表示为3.2Gauss消去法3.2.1顺序消去法Gauss消去法就是将方程组(3.1.1)通过(n-1)步消元,将(3.1.1)转化为上三角方程组(3.2.1)再回代求此方程组的解.下面记增广矩阵,即第1步设,计算l,记为,若用乘第一行加到第i行,可消去,用Gauss变换矩阵表示令其中一般地,假定已完成了(k-1)步消元,即已将转化为以下形式:第k步,假定,计算(3.2.2)记,,则其中(3.2.3).当k=1,2,…,n-1则可得到,即方程组(3.2.1).直接回代解(3.2.1)得,(3.2.4)并且有,由以上顺序消去过程可得如下定理.定理2.1设非奇异,则通过两行互换总可使,k=1,2,…,n-1.可将方程组(3.1.1)转化为(3.2.1)并求得方程组(3.1.1)的解为(3.2.4),且有.如果不做行交换,则使的条件如下.定理2.2非奇异,且各阶顺序主子式,则,k=1,2,…,n-1.证明用归纳法,当,故.现假设(k-1)成立,即,对i=1,2,…,k-1已推出,故Gauss消去法能进行(k-1)步消元,A已约化为,即故对k=1,2,…,n均成立,证毕.在整个消去法消元过程中,k从1到(n-1)共需乘除法运算次数为加减法次数为回代过程中由公式(3.2.4)可知乘除法次数为,加减法次数为,于是Gauss消去法的乘除法总次数为,加减法次数为例3.4用Gauss消去法解方程组并求detA.解消元得再由(3.2.4)回代,得解讲解:Gauss消去法是将方程组AX=b,通过消元转化为上三角方程组(3,2,1)求解,消元第一步做完后有用矩阵表示第K-1步完成后得到当,可做K步,得到得到,对应的方程组就是(3.2.1),利用公式(3.2.4)就可求得解。定理2.2给出了进行顺序消去法的条件,即A的所有顺序生子式,而方程(3.1.1)解存在唯一的条件是3.2.2消去法与矩阵三角分解上述Gauss消去法的消元

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论