酉矩阵和正交矩阵的性质和应用论文.doc_第1页
酉矩阵和正交矩阵的性质和应用论文.doc_第2页
酉矩阵和正交矩阵的性质和应用论文.doc_第3页
酉矩阵和正交矩阵的性质和应用论文.doc_第4页
酉矩阵和正交矩阵的性质和应用论文.doc_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

正交矩阵与酉矩阵的性质和应用0 前 言11 欧式空间和正交矩阵21.1 欧式空间21.2 正交矩阵的定义和性质21.2.1 正交矩阵的定义和判定21.2.2 正交矩阵的性质42正交变换的定义和性质122.1正交变换定义的探讨122.2正交变换的判定142.3正交变换的性质153正交矩阵的应用173.1正交矩阵在线性代数中的应用173.2利用正交矩阵化二次型为标准形223.2.1 对称矩阵可对角化的相关理论证明223.2.2 对称矩阵对角化的具体方法及应用举例233.2.3利用正交矩阵化简直角坐标系下的二次曲面方程253.3正交矩阵在矩阵分解中的作用273.4正交矩阵在方程组的求解中的应用364 酉空间和酉矩阵394.1 酉空间394.1.1 酉空间的定义394.1.2 酉空间的重要结论394.2 酉矩阵414.2.1 酉矩阵的定义414.2.2 酉矩阵的性质415酉矩阵的应用505.1酉矩阵在矩阵的分解中的应用505.2 利用酉矩阵化正规矩阵为对角形矩阵556 正交矩阵与酉矩阵597结论62参考文献63致谢640 前 言正交矩阵是一类特殊的实方阵,酉矩阵是一类重要的复矩阵,它们的一些特殊性质,使得它在不同的领域都有着广泛的应用,也推动了其它学科的发展. 随着科学技术的迅速发展,特别是计算机的广泛应用,矩阵问题特别是特殊矩阵的性质及其构造越来越受到科学工作者以及工程人员的重视.它不仅局限于一个数学分支,而且许多理工方法和技术的发展就是矩阵理论的创造的应用与推广的结果.在矩阵理论的研究中,正交矩阵与酉矩阵在线性代数、优化理论、计算方法等方法都占有重要的地位.戴立辉等(2002)对正交矩阵进行了详细的研究,得到了正交矩阵的若干性质;2005年,雷纪刚在矩阵理论与应用中给出了正交矩阵和酉矩阵的关系并证明了酉矩阵就是等距变换;2006年,苏育才在矩阵理论中介绍了酉矩阵的概念的推广和酉矩阵的一系列性质;2008年,吴险峰在正交矩阵的进一步探究中给出了正交矩阵和酉矩阵的一些性质定理,这些都为正交矩阵和酉矩阵的应用奠定了基础.在矩阵理论中,经常利用矩阵来描述变换.在实空间中正交变换保持度量不变,而正交变换中对应的变换矩阵就是正交矩阵,所以对正交矩阵的研究就显得格外重要.同样道理,想要得到复空间中保持度量不变的线性变换,就应该对正交变换进行推广,将其推广到复数域上,那对应的正交矩阵相应的也推广到复数域酉矩阵.下面将通过矩阵理论的深入研究,对正交矩阵与酉矩阵进行比较,得到了酉矩阵的若干结果. 1 欧式空间和正交矩阵1.1 欧式空间设是实数域上一个线性空间,在上定义了一个二元实函数称为内积,记作,它具有以下性质:1) (对称性);2) (线性);3) (线性);4) 是非负实数,且当且仅当(正定性).这里是中任意的向量,是任意实数,这样的线性空间称为欧式空间.1.2 正交矩阵的定义和性质在欧式空间中,由标准正交基到标准正交基的过渡矩阵是正交矩阵;反过来,如果第一组基是标准正交基,同时过渡矩阵是正交矩阵,那么第二组基一定也是标准正交基.1.2.1 正交矩阵的定义和判定正交矩阵有以下几种等价定义及其判定定义1.1 为阶实矩阵,若,则称为正交矩阵.定义1.2 为阶实矩阵,若,则称为正交矩阵.定义1.3 为阶实矩阵,若,则称为正交矩阵.定义1.4 为阶实矩阵,若的个行(列)向量是两两正交的单位向量,则称为正交矩阵.由正交矩阵的定义可以推出几个重要的关于正交矩阵的判定定理:判定定理 1 为正交矩阵.判定定理 2 为正交矩阵当且仅当的行向量组满足其中且是记号.即的行向量组是欧几里得空间的一个标准正交基. 证明 为正交矩阵 .判定定理 3 为正交矩阵当且仅当的列向量组满.其中且是记号.即的列向量组是欧几里得空间的一个标准正交基. 证明 为正交矩阵 .例1.1 判断矩阵(其中是实数)是否是正交矩阵.解 . 因此是正交矩阵.1.2.2 正交矩阵的性质性质1 设为正交矩阵,则1) ;2) 可逆,即存在,其逆也是正交矩阵;3) 也是正交矩阵.并且当为阶正交矩阵时,当时,即;当时,即.证明 1) 由,可知,则.对正交矩阵,当时,我们称为第一类正交矩阵;当时,则称为第二类正交矩阵.2) 由可知可逆且又,故是正交矩阵. 3) 由1)知,是正交矩阵.而由,可以得出,故是正交矩阵.由,当时,即;当时,即.性质2 设都是阶正交矩阵,则1) , (为自然数),等都是正交矩阵.2) 也是正交矩阵.3) 准对角矩阵为正交矩阵均为正交阵.证明 1)由可知,所以为正交矩阵.从而再由性质1可推知(为自然数),等均为正交矩阵. 2) 因为及 故是正交矩阵.3) 准对角矩阵为正交矩阵 均为正交阵.性质3 1阶正交矩阵只有.性质4 2阶矩阵为正交矩阵的充要条件是为下列四型之一: ; ;. 其中;性质5 设为阶正交矩阵,且,则必不可逆,即;设为奇数阶正交矩阵,且,则必不可逆,即;设是第二类正交矩阵,则必不可逆;设是奇数阶第一类正交矩阵,则必不可逆.证,得,即不可逆. 知当为奇数时, ,即.从而不可逆. 由是第二类正交矩阵,则,而,所以,即必不可逆. 由是第一类正交矩阵,则.而.所以当是奇数时,有,即必不可逆.性质6 阶非零矩阵为正交矩阵的充要条件是对任意的阶矩阵有 .证明 必要性. 设是阶正交矩阵.由得.从而根据矩阵理论可知对任意阶矩阵,有.充分性. 设对任意的阶矩阵,.特别地我们可选取.这里表示位于第行第列交叉位置上的元素为1,其余元素均为零的阶矩阵.记,那么 记的个列分别为,于是有 所以易知而由矩阵是1阶矩阵,可知综合以上数式,可得进而得到 由此即知为正交矩阵.正交矩阵的性质主要有以上几点,另外还有以下性质,例如性质7 正交矩阵的实特征值的模为1,且属于不同特征值的特征向量相互正交. 证明 设为正交矩阵,为的实特征值,为对应的实特征向量,则,取共轭转置得,再右乘有.利用得.由于,所以,故有.设1和-1是正交矩阵的不同特征值,设其对应的特征向量分别是,即,则易得由是正交矩阵,则故而因此即正交矩阵对应不同的特征值的特征向量是相互正交的.性质8 如果是正交矩阵的特征值,那么也是它的特征值.证明 设是的特征值,则.由于是正交矩阵,于是.但与的特征值全部相同,而是的特征值.因此是的特征值.性质9 奇数维欧式空间的旋转一定以1作为它的一个特征值. 证明 设旋转对应的正交矩阵为,那么由于为奇数,且,于是,故,即1为的一个特征值.性质10 设均为阶正交矩阵.(1)当时,则是的特征值;(2)当且为偶数时,则1是的特征值;(3)当且为奇数时,则1是的特征值.证明 (1)只需证事实上, 其中从而,得证是的特征值.(2,3)只需证事实上,当且为偶数时,当且为奇数时,从而得证1是的特征值.性质11 设均为阶正交矩阵,为的特征多项式,则当为偶数时, 其中为奇数时, 其中当为偶数时, 其中为奇数时, 其中证明 正交矩阵的特征多项式为其中为的一切阶主子式的和乘以.令为的阶主子式,为阶主子式的代数余子式,为的余子式.若,则因为的阶主子式,所以为的阶主子式,故的一切阶主子式之和等于的一切阶主子式之和.为偶数时,有奇数项,由且为所有的之和乘以为所有的之和乘以其中故为奇数时,有偶数项,由且为所有的之和乘以为所有的阶主子式之和乘以其中相差一个符号.故所以,若,当为偶数时,的特征多项式有奇数项,它以为中间项,左右对称项的系数相同,其中包括首项系数与常数项;当为奇数时,的特征多项式有偶数项,处于对称位置的左右两端系数仅差一个符号,因首项系数为1,且为-1,故也包括在内.若,则故的一切阶主子式之和与的一切阶主子式之和仅差一个符号.为偶数时,有奇数项,由且为所有的之和乘以为所有的之和乘以其中故为奇数时,有偶数项,由且为所有的阶主子式之和乘以为所有的阶主子式之和乘以其中相差一个符号.故所以若,当为偶数时,的特征多项式有奇数项,它以为中间项,左右两边对称项的系数相差一符号,因首项系数为1,为,故也包括在内;当为奇数时,的特征多项式有偶数项,处于对称位置的左右两端系数相同,其中包括首项系数与常数项均为1,也包括在内.性质13 正交矩阵的一切阶主子式之和与一切相应阶主子式之和或相等或仅差一符号.性质14 正交矩阵可以对角化,即存在复可逆阵使得,其中为的全部特征值,即.性质15 对称正交矩阵的行列式证明 由对称正交矩阵的特征值只有1或.设的个特征值中有个,则剩下的就是个1.由故所以例如对称正交阵有性质16 当阶正交矩阵为基础循环矩阵时,则它的全部特征值为实根,且为个次单位根.证明 设为基础循环矩阵.可知的特征多项式为则其特征根为.故为次单位根.2正交变换的定义和性质在标准正交积下,正交变换与正交矩阵对应,本文中提到在探讨性质应用之前,先得了解正交矩阵的出处,正交矩阵来自于正交变换的定义,设(v)是欧几里得空间的线性变换,如果保持内积不变,也就是说,对任意的,有.正交变换是保内积的,也即保长度和夹角,则变换前后的图形全等.2.1正交变换定义的探讨 在解析几何中,我们学过正交变换的定义,正交变换就是保持点之间距离不变的变换,正交变换也是高等代数与线性代数中常见的定义,其表述方式为: 定义2.1.1 设是欧氏空间的一个线性变换,如果保持向量内积不变,即对,都有,则它是正交变换.定义2.1.2 设是欧氏空间的一个线性变换,如果保持向量的长度不变,即对,有,则此线性变换叫做正交变换. 因此由上述可知,在线性变换的前提条件下,保持向量的长度不变与保持向量的内积不变是等价的.探讨1 事实上,我们可以对定义2.1.1作一个修改.在此之前,我们先看下面 的命题:命题 设是欧氏空间的一个变换,如果保持向量内积不变,即有,则它一定是线性的,因而也是正交变换.证明 先证. 对,有 ,故即其次再证 即是线性变换,因此也是正交变换. 由命题可知,定义1中是线性变换是多余的,因此定义可以修改为:定义1 欧氏空间中的一个变换,若它保持向量内积不变,即有,则为正交变换.探讨2 由定义1到定义1,将条件中线性变换降弱为变换,于是我们就问可以将定义2中的线性变换也降弱为变换?事实上,这是不行的,我们用一道考研题来说明.中国人民大学1991年考研试题:欧式空间中,保持向量长度不变的变换是否一定是正交变换?若是给出证明,若不是举出反例.答 不一定是正交变换.例如设内积如通常所述,定义.令,则,显然.即变换保持长度不变,但不是线性变换.设,则,而,显然.故不是正交变换. 探讨3 在解析几何中,正交变换是保持点之间距离不变的变换,下面将研究,在欧式空间中,保持向量距离不变的变换是否为正交变换?下面以一道山东大学考试题说明:设欧氏空间定义为距离,问保持距离不变的变换是否为正交变换?答 不一定是正交变换,比如在中的向量平移令,则 显然它保持距离不变,不是线性变换.但, 而,所以不是线性变换,也不是正交变换.总之,由以上讨论线性变换在欧氏空间的前提条件下,它保持向量的内积与保持向量长度以及保持向量距离不变是等价,但是在仅为欧氏空间的变换前提下上述三者之间不存在等价关系. 2.2正交变换的判定定理 设是维欧式空间的一个线性变换,则以下命题等价:是正交变换;是线性变换,是标准正交积,则也是标准正交积;是线性变换,在任意一组标准正交积下的矩阵是正交矩阵;对任意的,有,对任意的,有,对任意的,有,证明 用两步循环法:其中见课本教材定理4.下面证明 是正交变换是线性变换.故对任意的,有. 是正交变换 对任意的,有.两边开方即得.设,有取,则由,有由即.又 得.故是正交变换. 2.3正交变换的性质性质1 正交变换的行列式等于+1或者-1.行列式等于+1的正交变换称为旋转,或者称为第一类的;行列式等于的正交变换称为第二类的.证明 正交变换在标准正交基下的矩阵是正交矩阵,的行列式等于的行列式. 所以正交变换的行列式等于+1或者-1. 行列式等于+1的正交变换称为旋转,或者称为第一类的; 行列式等于的正交变换称为第二类的. 性质2 第二类正交变换一定以-1作为它的一个特征值.证明 设是一个第二类正交变换对应的矩阵,则.由于所以即-1是的一个特征值. 性质3 正交变换是欧氏空间的一个自同构映射.证明 设是的正交变换,在任一标准正交基下的矩阵为正交矩阵,它有逆矩阵,故有逆变换,因而是到上的双射.对于任意的,由是正交变换知,所以是到的一个自同构映射. 性质4 正交变换的乘积、正交变换的逆变换还是正交变换.证明 设是的正交变换,及 知都是的线性变换. 3正交矩阵的应用3.1正交矩阵在线性代数中的应用在正交矩阵中,有一类初等旋转矩阵,我们也称它为givens矩阵.这里,我们将利用正交矩阵可以表示成若干初等旋转矩阵的乘积,给出化欧式空间的一组基为标准正交基的另一种方法. 设向量,令,则称阶矩阵 i列 j列为初等旋转矩阵.初等旋转矩阵,是由向量的第两个元素定义的,与单位矩阵只在第行和第列相应的四个元素上有差别.设是由向量定义的初等旋转矩阵,则有如下的性质: 是正交矩阵; 设,则有; 用左乘任一矩阵,只改变的第行和行元素(用右乘任一矩阵,只改变的第列和列元素). 证明 ,故,是正交矩阵. 由得定义知,用左乘向量,只改变的第两个元素,且所以左乘,使的第个分量非负,第个分量为0,其余分量不变. 根据 及矩阵乘法即可以得出结论. 引理 3.1.1 任何阶实非奇异矩阵,可通过左连乘初等旋转矩阵化为上三角矩阵,且其对角线元素除最后一个外都是正的.定理 3.1.1 设是阶正交矩阵 若,则可表示成若干个初等旋转矩阵的乘积,即; 若,则可以表示成若干个初等旋转矩阵的乘积再右乘以矩阵,即,其中是初等旋转矩阵.证明 由于是阶正交矩阵,根据引理3.1.1知存在初等旋转矩阵使这里是阶上三角阵,而且得对角线上的元素除最后一个外都是正的,所以有 (3-1-1)由是正交矩阵和(3-1-1)式得 即 (3-1-2)设 其中,则 由上式得 所以 (3-1-3)于是由(3-1-1)和(3-1-3)式得 当时,; 当时,.记,是初等旋转矩阵,故定理1结论成立. 引理 3.1.2 设,秩,则可以通过左连乘初等旋转矩阵,把变为的形式,其中是阶上三角阵,是矩阵.证明 由引理3.1.1知,其中是阶正交矩阵,是阶上三角阵,又根据定理3.1.1知,其中是初等旋转矩阵. 当时,令 当时,于是有显然,是阶上三角阵. 当时,与除最后一行对应元素绝对值相等、符号相反外,其余元素对应相等. 当时,所以由、知本定理的结论成立.设是欧式空间的子空间的一组基,记,则是秩为的矩阵. 若满足引理3.1.2的条件,则存在初等旋转矩阵使得 (3-1-4)且 (3-1-5)由(3-1-4)和(3-1-5)两式知,对和做同样的旋转变换,在把化成的同时,就将化成了,而的前个列向量属于子空间.综上所述可得化欧式空间的子空间的一组基为一组基为准正交基的方法为(其中): 由已知基为列向量构成矩阵; 对矩阵施行初等旋转变换,化为,同时就被化为正交矩阵,这里是阶上三角阵; 取的前个列向量便可得的一组标准正交基.显然,上述方法是求子空间的一组标准正交基的另一种方法.下面,我们通过实例说明此方法的应用:例 3.1.1 求以向量为基的向量空间的一组标准正交基.解 矩阵 对分块矩阵依次左乘,其中得 则 取则就是由得到的的一组标准正交基.3.2利用正交矩阵化二次型为标准形任意一个阶矩阵可对角化的充要条件是有个线性无关的特征向量,那么对称矩阵的对角化需要什么条件,怎样进行对角化?下面的讨论将给出答案.3.2.1 对称矩阵可对角化的相关理论证明定理 3.2.1 实对称矩阵的特征值都是实数. 证 设是阶实对称阵,是的特征值,是属于的特征向量,于是有.令,其中是的共轭复数,则,考察等式,其左边为,右边为.故=,又因是非零量,故,即是一个实数.因实对称矩阵的特征值为实数,所以齐次线性方程组为实系数方程组,由知必有实的基础解系,从而对应的特征向量可以取实向量.此定理的逆命题不成立.例如,均为实数,而不是对称的.定理 3.2.2 设是实对称矩阵,定义线性变换: (3-2-1)则对任意向量,有或.证 只证明后一等式即可.定理 3.2.3 设是实对称矩阵,则中属于的不同特征值的特征向量必正交.证 设是的两个不同的特征值,分别是属于的特征向量,则,.定义线性变换如定理3.2.2中的(3-2-1),于是,.由,有.因为,所以.即正交.定理 3.2.4 对任意一个级实对称矩阵,都存在一个级正交矩阵,使成为对角形且对角线上的元素为的特征值.证 设的互不相等的特征值为,它们的重数依次为.则对应特征值,恰有个线性无关的实特征向量,把它们正交化并单位化,即得个单位正交的特征向量,由知,这样的特征向量共可得个.由定理3知对应于不同特征值的特征向量正交,故这个单位特征向量两两正交.以它们为列向量作成正交矩阵,则,其对角矩阵中的对角元素含个,个,恰是的个特征值.3.2.2 对称矩阵对角化的具体方法及应用举例定理3.2.4说明,对任何一个实对称矩阵总有正交矩阵存在,使它化为对角形.定理3.2.4的证明过程也给出了将实对称矩阵对角化找出正交阵的方法,具体步骤如下:求出实对称矩阵的全部特征值.对每个,由求出的特征向量.用施密特正交法,将特征向量正交化,再单位化,得到一组正交的单位向量组.以这组向量为列,作一个正交矩阵,它就是所要求的正交阵.根据上述讨论,下面举例说明.例 3.2.1 求一正交矩阵,将实对称矩阵化为对角阵.解 由于,的特征值为,.对,由得基础解系;对,由得基础解系,与恰好正交,所以,两两正交.再将,单位化,令得,于是得正交阵, 则.例 3.2.2 设,求.解 先将对角化求出正交阵.,.由,分别得基础解系,.则,则.利用求.定理3.2.5 任意的一个实二次型都可以经过正交的线性替换变成平方和其中平方项的系数就是矩阵的特征多项式全部的根.3.2.3利用正交矩阵化简直角坐标系下的二次曲面方程二次曲面的一般方程是 (3-2-2)令则(3-2-2)可以写成 (3-2-3)经过转轴,坐标变换公式为 其中为正交矩阵且在新坐标系中,曲面的方程就是 根据上面的结果,有行列式为1的正交矩阵使得 也就是说,可以作一个转轴,使得曲面在新坐标系中的方程为 其中这时,再按照是否为零的情况,作适当的移轴与转轴就可以把曲面的方程化成标准方程.譬如说,当全不为零时,就作移轴变换 于是方程就可化为其中例3.2.3 二次曲面的直角坐标系方程.作直角坐标变换,把它化成标准方程,并指出是什么二次曲面.解 首先把方程左端的二次项部分经过正交替换化成标准型.二次型的矩阵是.则存在正交矩阵使得于是作正交替换可把二次型化成标准形.因此,作直角坐标替换,二次曲面在新的直角坐标系中的方程为由此可以看出,是单叶双曲面.3.3正交矩阵在矩阵分解中的作用一些重要的矩阵分解涉及到了正交矩阵,包括:qr分解 奇异值分解 谱分解 极分解定理 3.3.1设是可逆的阶实方阵.求证:存在正交阵和正定阵,使,且这个分解式是唯一的;存在正交阵和正定阵,使,且这个分解式是唯一的.证明 可逆正定,从而存在正定阵,使.则 即 故现假设还有另一分解,即.则 ,为正交阵,而的特征值为实数且是正的 可对角化,即 分解式是唯一的.后者对用已证结果可得.推论1 设是一个阶实可逆矩阵,是极分解,其中是正定矩阵,是正交矩阵,则 .证明 充分性.;必要性. 由及均为正定矩阵知它们均有正定平方根且和的平方根是唯一的,所以,故.定理 3.3.2 任一实满秩矩阵可分解成一个正交阵与一个主对角线元素都大于零的上三角阵之积,且这种分解是唯一的,这个分解也称为矩阵的qr分解.证明 设,其中为的列向量.为实满秩矩阵 线性无关则可用施密特正交化方法,令 (3-3-1) 其中再将单位化,令 , (3-3-2)则为标准正交基,而为正交阵 由(3-3-1)和(3-3-2)解出,得 其中为上三角阵且为正实数.再证唯一性 设还有正交阵及对角线元素为正实数的上三角阵,使.下证. 令,则,则既是正交阵又是上三角矩阵,即为对角矩阵,但与的主对角线元素为正实数,从而 而由是正交阵 即 .事实上,设是任一阶实满秩矩阵,则可唯一地分解成以下形式之一: 其中为正交阵,为主对角元均正的上三角矩阵;其中为正交阵,为主对角元均正的上三角矩阵;其中为正交阵,为主对角元均正的下三角矩阵;其中为正交阵,为主对角元均正的下三角矩阵;证明 已经证明.此时非奇异,按可得从而令则仍为主对角元都为正的上三角矩阵,令则仍为正交阵,从而同理,对与用的结果可证明和.例3.3.1将分解为正交矩阵与上三角矩阵之积.解 令,其中为的列向量,对用施密特正交化方法得到正交向量,即再单位化得,即令 ,则为正交矩阵,为上三角矩阵,并且. 注 可见在掌握分解定理时,对证明的思路及步骤也必须熟练掌握.这样在求矩阵的分解时才能用到.例3.3.2 (华中师大1994,1996)设是n阶实可逆阵.求证存在阶正交阵和,使得,其中且为的全部特征值. 证明 由定理3.3.1知,存在正交阵和使 (3-3-3)其中的特征值均为正,且为的全部特征值由为正定阵,从而存在正交阵,使得 (3-3-4)将(3-3-4)代入(3-3-3)得 ,即 (3-3-5) 其中,均为正交阵. 注 我们可以将(3-3-5)改写为,这就是的一个分解即实可逆阵表示为(正交阵)(正定阵)(正交阵)之积.例3.3.3(浙江大学,天津师范大学)设为阶实矩阵,且,则矩阵,其中,分别为阶和阶的正交矩阵,而.证明 由题意知不是正定阵 从而存在正交阵,使 (3-3-6)又 不失一般性,不妨设,令 ,由(3-3-6)得 (3-3-7) 将分块,令 (3-3-8)由于为正交阵用左乘,右乘(3-3-8)两端得 (3-3-9)令 ,则为实矩阵,且 (3-3-10) (3-3-11)由(3-3-11)得 (3-3-12)由于 有个线性无关的解,将它们正交单位化后构造矩阵,这样由,可得 但 令,由于从而为正交阵,并(3-3-8)(3-3-13)式 由(3-3-14)式得 (3-3-15)其中由(3-3-15)知 .(证法二)由假设存在阶与阶可逆矩阵,使对,作分解, 其中,分别为m阶与n阶正交矩阵,分别为非奇异的正三角矩阵与下三角矩阵,则 (3-3-16)其中为的 阶顺序主子阵,为的 阶下三角顺序主子阵,所以是阶可逆矩阵,因而存在正交矩阵,使得 ,其中,. (3-3-17)令 将(3-3-17)代入(3-3-16)得 且,.例3其实矩阵分解的一个类型,也就是矩阵的奇异值分解问题,而由矩阵的奇异值分解,我们可以得到矩阵的另一种分解模式,即矩阵的极因子分解问题.定理3.3.3设为阶实方阵,那么 必有分解式,其中为正交阵; 当时,式中的分解是唯一解.证明 由矩阵的奇异值分解,知存在正交阵,使得,其中. , 其中 (3-3-18) (3-3-19) 其中 用左乘(3-3-18)式两边,得 其中 用右乘(3-3-19) 式两边得 令 即 由可唯一确定,而当非奇异时存在,可唯一决定.例3.3.4 设为任意n阶实矩阵,且 ,则,这里为正交矩阵.证明 由矩阵的极因子分解,我们有 ,其中,为正交阵, ,这里为正交阵.注 当是非奇异矩阵时,本条极易证明.由 得这证明是正交矩阵 以上均说明了矩阵分解与正交阵之间的关系,但作为正交阵分解本身而言,也是特殊的.例3.3.5 设是正交矩阵,求证存在正交阵,使得.证明 是正交阵存在可逆阵,使得显然存在正交阵,使得而 .例3.3.6 设为阶矩阵,且,证明:秩+秩.(厦门大学06)解 由于,则.因此为的化零多项式.从而有.所以的最小多项式的根只能为-1或1.又的特征多项式与最小多项式有相同的根,因此的特征值为-1或1.假设的特征值中有个-1(或1),则的另外的个特征值必为-1(或1).故而存在正交矩阵,使得 则有 因此 同理可得 则有 从而有 秩+秩 . 3.4正交矩阵在方程组的求解中的应用如果线性方程组的系数阵是列正交矩阵,则其有唯一解例3.4.1 设为正交矩阵,且求解矩阵方程解 的第一行为单位向量,因而 的第一列为单位向量,因而 将矩阵的正交三角分解代入方程的正规化方程得,即所以正规化方程的解为此即原方程的最小二乘解.如果是实矩阵,则 例3.4.2 用分解解线性方程组其中 解 将的三个列向量正交化,可得 再单位化,得 则由于所以由可得 所以将代入原方程组成立.所以它是原方程组的解.例3.4.3 方程组显然无解,但列满秩矩阵的正交分解为 因此原方程两端同乘以得显然这是原方程组的最小二乘解.理论中,经常利用矩阵来描述变换. 在实空间中正交变换保持度量不变,而正交变换中对应的变换矩阵就是正交矩阵,所以对正交矩阵的研究就显得格外重要. 同样道理,想要得到复空间中保持度量不变的线性变换,就应该对正交变换进行推广,将其推广到复数域上,那对应的正交矩阵相应的也推广到复数域就是酉矩阵.4 酉空间和酉矩阵4.1 酉空间4.1.1 酉空间的定义设是复数域上一个线性空间,在上定义了一个二元复函数,称为内积,记作,它具有以下性质:1) ,是的共轭复数;2) ;3) ;4) 是非负实数,且当且仅当.这里是中任意的向量,是任意复数,这样的线性空间称为酉空间. 例4.1.1 在线性空间,对向量定义内积为 显然上述内积满足定义4.1.1中的条件.这样就成为一个酉空间.4.1.2 酉空间的重要结论由于酉空间的讨论与欧氏空间的讨论很相似,有一套平行的理论,因此在这只简单地列出重要的结论,而不详细论证. ,是的共轭复数. .由和,设,则因为在酉空间v中对于是一个非负实数,所以可以像空间那样,定义向量的长度为这样,中任意非零向量的长度总是一个正实数,长度是1的向量称为单位向量显然都有 在一个酉空间中,柯西布涅柯夫斯基不等式仍然成立设则当且仅当与线性相关时等号成立注意:酉空间中的内积一般是复数,故向量之间不易定义夹角,但仍引入向量,当时称为正交的或互相垂直.在一个酉空间里,同样可以定义正交组和标准正交组的概念酉空间的一组两两正交的非零向量叫做的一个正交组若一个正交组的每一个向量都是单位向量,则称这个正交组是一个标准正交组 在一个有限维酉空间中,同样可以定义正交基和标准正交基的概念正交化方法对于酉空间的向量仍然适用,任意一组线性无关的向量可以用施密特过程正交化,并扩充为一组标准正交基,并且对于的任意一个基,可以通过正交化方法将它化为标准正交基设是酉空间的一个有限维线性子空间,令则也是的子空间,叫做的正交补我们有 4.2 酉矩阵4.2.1 酉矩阵的定义与正交矩阵相平行的概念是酉矩阵设,其中表示复数域上的全体阶矩阵的集合.记 (是的共轭复数),定义4.2.1 一个满足的阶复矩阵叫做一个酉矩阵定义4.2.2 若阶复方阵满足则称为酉矩阵.定义4.2.3 若阶复方阵满足则称为酉矩阵.定义4.2.4 若阶复方阵满足则称为酉矩阵.定义4.2.5 若阶复方阵的个行(列)向量是两两正交的单位向量,则称为酉矩阵.从定义4.2.1-4.2.4知,酉矩阵是可逆矩阵.根据定义4.2.5可得,阶酉矩阵的个行(列)向量构成的标准正交基.4.2.2 酉矩阵的性质性质1 设阶矩阵为酉矩阵,则 酉矩阵的行列式的模(或绝对值)等于1.即或者. 的伴随矩阵也是酉矩阵. 都是酉矩阵. 证明 由得,从而或者.由所以为酉矩阵.因为,所以是酉矩阵.因为,所以是酉矩阵.因为,所以是酉矩阵.例4.2.1 令则 ,(1)因为所以 即,所以是酉矩阵.(2) 因为所以故由(1)知所以是酉矩阵.(3) 即 也是酉矩阵.(4) ;,而.因此,也为酉矩阵.性质2 (酉矩阵的乘积和乘方)设和是酉矩阵,则,也是酉矩阵.证明 因为,所以是酉矩阵,同理可证也是酉矩阵.(为正整数)是酉矩阵.,;,;,;,也是酉矩阵.,也是酉矩阵.,(,为正整数)也是酉矩阵.设,是酉矩阵,则, 也是酉矩阵.证明 因为所以是酉矩阵.因为 所以是酉矩阵.定理 与酉矩阵酉相似的矩阵也为酉矩阵.即为酉矩阵,为酉矩阵,则也为酉矩阵.证明 由为酉矩阵,则. 所以是酉矩阵.性质3 设是酉矩阵,则对的任一行(列)乘以模为1的数或任两行(列)互换,所得矩阵仍为酉矩阵.证明 设其中是的两两正交单位向量.显然 ()及也都是的两两正交的单位向量.由定义4.2.5知结论成立.性质4 设是上(下)三角的酉矩阵,则必为对角矩阵,且主对角线上的元素的模等于1.证明 不妨设是上三角的酉矩阵.则其逆矩阵(上三角)等于其共轭转置(下三角),所以只能是对角矩阵.又故可得的主对角线上的元素的模等于1.性质5 二阶矩阵为酉矩阵的充分必要条件是为下列三种形式之一 这里,为整数.证明 必要性 设是二阶酉矩阵,于是即展开得 (4-1) (4-2) 由(4-1)式得 ,于是可设 (4-3)其中和为非负实数,且当时,即可得定理中的形式.当时,即可得定理中的形式.当且时. 显然,(4-2)式中第一个等式与第二个等式等价,把(4-3)代入(4-2)的第一个等式,得 根据实部、虚部同时为零,有 利用和差化积公式,可得 以上两式左端平方求和,可得 再次利用和差化积公式,有另外,(4-2)中第三个等式与第四个等式等价,把(4-3)代入(4-2)的第三个等式,与上述推导同理可得所以即可得定理中的形式.充分性 设为定理中的三种形式之一. 当为形式或形式时,通过简单计算可知,为酉矩阵. 当为形式时,由于在必要性的证明过程中,每一步推导都是可逆推的,因此可以全部反推回去,即得.所以为酉矩阵.性质6 设,是酉矩阵,若是反矩阵,则也是酉矩阵,因此证明 因为 因此,当是反矩阵时,记也是酉矩阵,从而注 酉矩阵的和未必是酉矩阵.性质7 对任意的阶酉矩阵和阶可逆矩阵有.性质8 对任意的阶酉矩阵和阶酉矩阵有.性质9 设是酉矩阵,则的特征值的模为1,即分布在复平面的单位圆上.证明 设,则由可得于是而,故即性质10 设为酉矩阵,是的特征值,则是的特征值,而是的特征值.证明 设是的特征值,则.而又可知是的特征值,但与的特征值全部相同,因此是的特征值,而,所以是的特征值.性质11 设是酉矩阵,则属于的不同特征值的特征向量正交.证明 设是的属于特征值的特征向量,是的属于特征值的特征向量.由可得 所以,而,从而故,即与正交.性质12 设是酉矩阵,且为矩阵,则必为对合矩阵,从而的特征值等于1或.证明 由得.又因矩阵的特征值为实数,所以的特征值等于或1.性质13 矩阵为酉矩阵的充分必要条件是这里表示行列式的模,表示的共轭复数.证明设是酉矩阵. 则且.在等式两边左乘的逆矩阵并注意到,可得所以.设则 故而,两边取行列式并注意到,得,但由的非奇异性知.从而,注意到及,可得于是有.由知为酉矩阵.性质14 维酉空间的一个标准正交基到另一个标准正交基的过渡矩阵是一个酉矩阵性质15 酉空间的线性变换,满足,就称为的一个酉变换. 酉变换在标准正交基下的矩阵是酉矩阵.性质16 如矩阵满足则叫做埃尔米特矩阵.在酉空间中令是埃尔米特矩阵,则也是对称变换.性质17 若是埃尔米特矩阵,则存在酉矩阵使得是对角型矩阵.性质18 设为埃尔米特矩阵,二次齐次函数叫做埃尔米特二次型.必有酉矩阵,当时 .证明 因为为埃尔米特矩阵,所以,其中为实数.令 ,则 5酉矩阵的应用5.1酉矩阵在矩阵的分解中的应用定理5.1.1 设是一个级可逆复矩阵,则可以分解成其中是酉矩阵,是一个上三角矩阵其中对角线元素都是正实数,并证明这个分解是唯一的;也唯一地存在酉矩阵和主对角线元素为正数的下三角矩阵使得.证明 设,其中为的列向量 可逆,即为实满秩矩阵 线性无关则可用施密特正交化方法,令 (5-1) 其中 再将单位化,令 , (5-2)则为标准正交基,而为酉矩阵 由(5-1)和(5-2)解出,得 . 其中为上三角阵且为正实数.再证唯一性 设还有酉矩阵阵及对角线元素为正实数的上三角阵,使.下证.令,则,则既是酉矩阵又是上三角矩阵,即为对角矩阵,但与的主对角线元素为正实数,而由是酉矩阵 即 ,所以分解是唯一的.后者同理证明.定理5.1.2 (三角化定理)任意的复方阵酉相似于上三角矩阵.即对任意阶矩阵,存在酉矩阵,使得,其中为矩阵的特征值,称形如这样的分解叫做矩阵的特征值分解.例5.1.1 设为阶实矩阵,为阶单位矩阵.求证 ,其中为虚数单位.(清华大学06)证明 由性质1,知存在可逆的酉矩阵,使得从而有 由于为阶实矩阵,所以的特征多项式为次实多项式,又实多项式的复根是成对共轭出现的,因此的复特征值是成对共轭出现的.当的所有特征值都不是(或),则的特征值不存在(或).则此时 ,且有 ,而此时从而得 当的特征值中存在有(或),则一定有一特征值(或)存在.并且有几个(或)存在,相应的就有几个(或)存在.又由于 ,从而知 ()中不为零的个数()中不为零的个数从而可得定理5.1.2 任意阶矩阵,存在酉矩阵,使得,其中,且为矩阵的特征值.例5.1.2 设为级矩阵,求证(1) 存在正整数使得秩()秩(); (2) 若存在正整数使得秩()秩(),则对于任意正整数,秩()秩().证明 由性质,知存在酉矩阵,使得,其中,且为矩阵的特征值.不妨假设,则可得 ,为可逆矩阵,因此对任意的正整数,有 , (5-3)又对任意,且, (5-4)因此可令,则由(5-4)式,知 (5-5)由(5-5)得对任意的,有 从而由(5-3)和(5-5)得且对任意的正整数,也有 通过上述的讨论,对矩阵的分解有了一定的认识.定理5.1.3 (矩阵的酉相抵标准形)设复矩阵的秩是,则有酉矩阵和使得 其中为正实数,为的所有非零特征根,而矩阵中右下角的o为零矩阵.定理5.1.4(矩阵的奇异值分解)设且则存在阶和阶的酉矩阵使得其中人造卫星常常需要将一些照片发回地面控制中心.大部分照片的规格是(像素),即每幅图片实际上包含超过260000个数据,因此将这些数据全部传输需要大量的计算并花费大量的时间.所以往往在传输之前必须对原始数据进行压缩.以下我们需要叙述利用奇异值分解进行图像压缩的过程.用矩阵表示要传输的原始数据.设是的一个奇异值分解.其中对角矩阵的对角元素(即的奇异值)从小到大排列.假定我们选择前个大奇异值进行图像传输,就是说仅传输奇异值以及相对应的左右奇异向量则我们实际上传输了个数据,而不是原来的个数据.比值称为图像的压缩比(其倒数称为数据压缩率).利用矩阵的截尾奇异值分解可根据实际接收的数据还原图像,即显然,较大的可以获得保真度较高的还原数据,较小的可以获得较高的传输效率.在实际应用时,可以根据不同的需要适当选择以获得满意的还原数据.定理5.1.5(方阵的极分解)任一复方阵可表示为其中为酉矩阵,为半正定方阵,且由唯一决定.5.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论