第六章 非对称特征值问题的计算方法(共11页)_第1页
第六章 非对称特征值问题的计算方法(共11页)_第2页
第六章 非对称特征值问题的计算方法(共11页)_第3页
第六章 非对称特征值问题的计算方法(共11页)_第4页
第六章 非对称特征值问题的计算方法(共11页)_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章 非对称特征值问题(wnt)的计算方法这一章我们(w men)来介绍矩阵特征值和特征向量的计算方法。大家知道,求一个矩阵的特征值问题实质上是求一个多项式的根的问题。而数学上已经证明:5阶以上的多项式的根一般不能用有限次运算求得。因此,矩阵特征值的计算方法本质(bnzh)上都是迭代的。目前,已有不少非常成熟的数值方法用于计算矩阵的全部或部分特征值和特征向量。而全面系统地介绍所有这些重要的数值方法,会远远超出我们这门课程的范围,因而这里我们仅介绍几类最常用的基本方法。61 基本概念和性质设,一个复数称作是的一个特征值是指存在非零向量使得复向量称作是关于特征值的特征向量复数是的一个特征值的充分

2、必要条件是,因而称多项式为的特征多项式显然阶矩阵的特征多项式是一个首项系数为的次多项式,而且有个特征值记的特征值的全体为,通常称之为的谱集假定有如下分解其中,则称为的代数重数(简称重数);而称数为的几何(j h)重数。易知如果(rgu),则称是A的一个(y )单特征值;否则,称是A的一个重特征值。对于一个特征值,如果,则称其是A的一个半单特征值。显然,单特征值必是半单特征值。如果A的所有特征值都是半单的,则称A是非亏损的。容易证明,A是非亏损的充分必要条件是A有个线性无关的特征向量(即A是可对角化矩阵)。设若存在非奇异阵使得则称与是相似的,而上述变换称作是相似变换若与相似,则和有相同的特征值,

3、而且是的一特征向量的充分必要条件是是的一个特征向量这样,如果我们能够找到一个适当的变换矩阵,使的特征值和特征向量易于求得,则我们就可立即得到的特征值和相应的特征向量很多计算矩阵特征值和特征向量的方法正是基于这一基本思想而得到的从理论上讲,利用相似变换可以将一个矩阵约化成的最简单形式是Jordan标准型,即有定理(Jordan分解定理)设有个互不相同的特征值,其重数分别为,则必存在一个非奇异矩阵使得其中并且(bngqi)除了的排列(pili)次序可以改变外是唯一(wi y)确定的。上述定理中的矩阵称作A的Jordan标准型,其中每个子矩阵称作Jordan块。如果限定变换阵为酉矩阵,则有如下著名的

4、Schur分解定理。定理612(Schur分解定理) 设,则存在酉矩阵使得其中是上三解矩阵;而且适当选取,可使得的对角元素按任意指定的顺序排列。这一定理无论在理论上还是在实际应用上都是非常重要的,著名的QR方法就是基于这一定理而设计的。下述定理对于估计某些特征值的界限是十分方便而有用的。定理613(Gerschgorin圆盘定理)设,令则有从数值计算的角度来看,首先(shuxin)应弄清楚的问题是要计算的特征值和特征向量是否是病态的,也就是说矩阵的元素有微小的变化,是否会引起所关心的特征值和特征向量的巨大变化。对于一般的方阵来说,这一问题是非常复杂的,即于篇幅,这里我们只介绍一个简单而又非常重

5、要的结果。假定(jidng)是的一个(y )单特征值,是属于它的单位特征向量(即)。令是酉矩阵(),即的列向量构成的一组标准正交基,则有其中阶方阵。由是的一个单特征值的假定,知且于是我们可定义此外,由于,故必存在非零向量使。通常称为这属于的左特征值。是单特征值的条件蕴含着故可选取使若给矩阵以微小的扰动使其变为,记,则存在的一个特征值和对应的特征向量,使得这表明和的敏感性分别与和的大小有关因此,我们分别称和为特征值和特征向量的条件数,记作有关特征值和特征向量的敏感性问题的较详细(xingx)讨论参见幂法幂法是计算(j sun)一个矩阵的模最大特征值和对应的特征向量的一种迭代方法为了说明幂法的基本

6、思想,我们先假定是可对角化(jio hu)的,即有如下分解 (.)其中非奇异,再假定 (6.2.2)现任取一向量由于的列向量构成的一组基,故可表示为 (6.2.3)这里这样,我们有 (6.2.4)由此即知这表明,当而且充分大时,向量 (6.2.5)就是(jish)的一个(y )很好的近似特征向量这样,我们(w men)自然想到用(6.2.5)来求的近似特征向量然而,实际计算时,这是行不通的其原因有二:一是我们事先并不知道的特征值;二是对充分大的计算的工作量太大,有可能造成溢出仔细观察(6.2.5),不难发现(6.2.5)中的仅改变向量的长度,并不影响它的方向而我们所感兴趣的只是的方向,并非它的

7、长度因此,我们不必非用来约化的长度,而可用其他方便的常数来进行约化(为了防止溢出,约化是必要的);其次计算也并不需要事先将算好之后再计算,只需迭代地进行即可基于这样的考虑,我们可设计如下的迭代格式:算法6.2.1(幂法:计算矩阵的模最大的特征向量)预始步取任意非零向量,且算法终止常数,置;主步()计算;()求;()计算()如果,则输出近似特征向量和近似特征值终止算法;否则,置,返回()注:算法(sun f)中:,其中(qzhng)定理(dngl).设有个互不相等的特征值满足并且是半单的(即的几何重数等于它的代数重数)如果初始向量在的特征子空间上的投影不为零,则由算法6.2.1产生的向量序列收敛

8、到的一个特征向量,而且由算法.2.1产生的数值序列收敛到证明略当定理6.2.1的条件不满足时,由幂法6.2.1产生的序列的收敛性分析将变得非常复杂,这时可能有若干个收敛于不同向量的子序列(参见本章习题)例如,假定,其中此时有两个模最大的特征值因此定理条件不满足,取初始向量为,通过简单的计算知由此即知,由幂法产生的向量序列有两个收敛子列,分别收敛于向量注意(zh y)此时分别(fnbi)是属于和的特征向量事实上,适当(shdng)修改算法6.2.1可使幂法对于此例所述的情况下亦是收敛的请读者作为练习修改算法6.2.1使其适用于而的情形此外,从算法.2.1的基本思想亦可看出,幂法的收敛速度主要取决

9、于的大小在定理6.2.1的条件下,这个数总是小于的它越小收敛就越快,当它接近于时,收敛是很慢的为了加快算法的收敛速度,通常可采用位移的方法,即应用幂法于上,如果适当选取可使的模最大的特征值与其他特征值的模的距离更大,就起到加速的目的例如若在上例中取,即若对上面给出的矩阵应用幂法于,则此时产生的向量序列将收敛到之属于的一个特征向量用幂法可以求矩阵的一个模最大的特征值及其对应的一个特征向量假如我们还要求第二个模最大的特征值,直接用算法6.2.1进行迭代是不行的,必须先对原矩阵降阶才行降阶就是在知道了的前提下,把矩阵降低一阶,使它只包含的其余特征值用来完成这一过程的方法通常称作收缩技巧,最简单实用的

10、收缩技巧是利用正交变换假设 (6.2.9)现假设酉矩阵使 (6.2.10)这里,则将(6.2.10)代入(6.2.9)并整理可得,这表明(biomng)的首列为,即其中(qzhng)是阶方阵(fn zhn)并且它的特征值是因此,要求只要把幂法应用于即可而变换(6.2.10)可用复的Householder变换来实现作为本节的结束,我们希望指出的是,由于幂法的计算公式依赖于矩阵特征值的分布情况,因此实际使用时很不方便,特别是不适用于自动计算,只是在矩阵阶数非常高,无法利用其他更有效的算法时,才用幂法计算少数几个模最大的特征值和相应的特征向量然而,幂法的基本思想是重要的,由它可以诱导出一些更有效的算

11、法6.3 反幂法设是非奇异矩阵,可以对作幂法迭代,求出的特征值。现设的特征值满足,则的特征值满足,即为按模最大的特征值,将幂法计算6.2.1用于,具体计算时,可不求逆矩阵,而用解方程组的方法,即反幂法迭代计算过程为 (6.3.1)与幂法相同(xin tn)的分析,有 (6.3.2)其中(qzhng)是对应(duyng)的特征向量反幂法的收敛速度取决于假设的特征值为,对应线性无关的特征向量为,设,则矩阵的特征值为对应的特征向量为如果选择接近某一特征值,满足 (6.3.3)则对矩阵的反幂法迭代为 (6.3.4)注:算法中:,其中必有而且(r qi),只要选择(xunz)得能很好地满足(6.3.3),则收敛(shulin)速度可以很快一般(6.3.4)第一式的方程组用矩阵的选列主元的分解方法来求解可以证明,虽然越接近,越接

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论