数据结构 第五章 数组与广义表_第1页
数据结构 第五章 数组与广义表_第2页
数据结构 第五章 数组与广义表_第3页
数据结构 第五章 数组与广义表_第4页
数据结构 第五章 数组与广义表_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章数组和广义表5.1数组的定义5.2数组的顺序表示和实现5.3矩阵的压缩存储

5.3.1特殊矩阵

5.3.2稀疏矩阵5.4广义表的定义5.5广义表的存储结构数组和广义表可看成是一种特殊的线性表,其特殊在于,表中的所有元素本身也是一种线性表。数组是我们最熟悉的数据类型,在早期的高级语言中,数组是唯一可供使用的数据类型。由于数组中各元素具有统一的类型,并且数组元素的下标一般具有固定的上界和下界,因此,数组的处理比其它复杂的结构更为简单。多维数组是向量的推广。例如,二维数组:5.1数组的定义二维数组可以看成是由行向量组成的向量,也可以看成是列向量组成的向量。同样,可把三维数组看成是一个线性表,表中每一个数组元素为一个二维数组。依次类推,可把n维数组看成是一个线性表,表中每一个数据元素是一个n-1维数组。数组的运算:数组一旦被定义,它的维数和维界就不再改变。因此,除了结构的初始化和销毁之外,数组只有存取元素和修改元素值的操作。即给定一组下标,存取或修改相应的数组元素。5.1数组的定义1、顺序存储结构5.2数组的顺序表示和实现顺序存储结构:用一组地址连续的存储单元依次存放数据元素,称为数组的顺序存储结构。由于计算机的内存结构是一维的,因此用一维内存来表示多维数组,就必须按某种次序将数组元素排成一列序列,然后将这个线性序列存放在存储器中。由于对数组一般不做插入和删除操作,也就是说,数组一旦建立,结构中的元素个数和元素间的关系就不再发生变化。因此,一般都是采用顺序存储的方法来表示数组。

通常有两种顺序存储方式:2、顺序存储方式⑴行优先顺序——将数组元素按行排列,第i+1个行向量紧接在第i个行向量后面。以二维数组为例,按行优先顺序存储的线性序列为:a11,a12,…,a1n,a21,a22,…a2n,……,am1,am2,…,amn

在PASCAL、C语言中,数组就是按行优先顺序存储的。⑵列优先顺序——将数组元素按列向量排列,第j+1个列向量紧接在第j个列向量之后,A的m*n个元素按列优先顺序存储的线性序列为:a11,a21,…,am1,a12,a22,…am2,……,a1n,a2n,…,amn在FORTRAN语言中,数组就是按列优先顺序存储的。

a11a12……..a1n

a21a22……..a2n

am1am2……..amn

….Loc(aij)=Loc(a11)+[(i-1)n+(j-1)]*l

按行序为主序存放

amn

……..

am2am1……….a2n

……..

a22a21a1n

…….a12

a1101n-1m*n-1n

按列序为主序存放01m-1m*n-1m

amn

……..

a2n

a1n……….

am2

……..

a22

a12

am1

…….

a21

a11

a11

a12

……..

a1n

a21

a22……..

a2n

am1

am2

……..

amn

….Loc(aij)=Loc(a11)+[(j-1)m+(i-1)]*l

以上规则推广到多维数组的情况:行优先顺序可规定为先排最右的下标,从右到左,最后排最左下标;3、n维数组按上述两种方式顺序存储的数组,只要知道开始结点的存放地址(即基地址)、维数和每维的上、下界,以及每个数组元素所占用的单元数,就可以将数组元素的存放地址表示为其下标的线性函数。因此,数组中的任一元素可以在相同的时间内存取,即顺序存储的数组是一个随机存取结构。列优先顺序与此相反,先排最左下标,从左向右,最后排最右下标。例如,二维数组Amn按“行优先顺序”存储在内存中,假设每个元素占用d个存储单元。4、地址公式元素aij的存储地址应是数组的基地址加上排在aij前面的元素所占用的单元数。因为aij位于第i行、第j列,前面i-1行一共有(i-1)×n个元素,第i行上aij前面又有j-1个元素,故它前面一共有(i-1)×n+j-1个元素,因此,aij的地址计算函数为:LOC(aij)=LOC(a11)+[(i-1)*n+j-1]*d同样,三维数组Aijk按“行优先顺序”存储,其地址计算函数为:

LOC(aijk)=LOC(a111)+[(i-1)*n*p+(j-1)*p+(k-1)]*d上述讨论均是假设数组各维的下界是1,更一般的二维数组是A[c1..d1,c2..d2],这里c1,c2不一定是1。aij前一共有i-c1行,二维数组一共有d2-c2+1列,故这i-c1行共有(i-c1)*(d2-c2+1)个元素,第i行上aij前一共有j-c2个元素,因此,aij的地址计算函数为:

4、地址公式LOC(aij)=LOC(ac1c2)+[(i-c1)*(d2-c2+1)+j-c2)]*d例如,在C语言中,数组各维下标的下界是0,因此在C语言中,二维数组的地址计算公式为:LOC(aij)=LOC(a00)+(i*(d2+1)+j)*d在科学与工程计算问题中,矩阵是一种常用的数学对象,在高级语言编制程序时,简单而又自然的方法,就是将一个矩阵描述为一个二维数组。但是在矩阵中非零元素呈某种规律分布或者矩阵中出现大量的零元素的情况下,看起来存储密度仍为1,但实际上占用了许多单元去存储重复的非零元素或零元素,这对高阶矩阵会造成极大的浪费,为了节省存储空间,我们可以对这类矩阵进行压缩存储。5.3矩阵的压缩存储压缩存储:为多个相同的非零元素只分配一个存储空间;对零元素不分配空间。假若值相同的元素或零元素在矩阵中的分布有一定规律,则我们称此类矩阵为特殊矩阵;反之,称为稀疏矩阵。1、对称矩阵5.3.1特殊矩阵在一个n阶方阵A中,若元素满足下述性质:aij=aji0≦i,j≦n-1则称A为对称矩阵。如图5.1便是一个5阶对称矩阵。对称矩阵中的元素关于主对角线对称,故只要存储矩阵中上三角或下三角中的元素,让每两个对称的元素共享一个存储空间,这样,能节约近一半的存储空间。不失一般性,我们按“行优先顺序”存储主对角线(包括对角线)以下的元素,其存储形式如图所示:

a00a01

….

……..a0n-1

a10

a11

……..…….a1n-1

an-10

an-11

……..an-1n-1

….a00a10a11a20a21a23………………..an-10an-11an-12…an-1n-1

a00a01

….

……..a0n-1

a10

a11

……..…….a1n-1

an-10

an-11

……..an-1n-1

….在这个下三角矩阵中,第i行恰有i+1个元素,元素总数为:(i+1)=n(n+1)/2。这样可将n2个压缩到n(n+1)/2个元的空间中。因此,我们可以按图中箭头所指的次序将这些元素存放在一个向量sa[0..n(n+1)/2-1]中。为了便于访问对称矩阵A中的元素,我们必须在aij和sa[k]之间找一个对应关系。1、对称矩阵i≧j,则aij在下三角形中。aij之前的i行(从第0行到第i-1行)一共有1+2+…+i=i(i+1)/2个元素,在第i行上,aij之前恰有j个元素(即ai0,ai1,ai2,…,aij-1),因此有:1、对称矩阵k=i*(i+1)/2+j0≦k<n(n+1)/2若i<j,则aij是在上三角矩阵中。因为aij=aji,所以只要交换上述对应关系式中的i和j即可得到:k=j*(j+1)/2+i0≦k<n(n+1)/2令I=max(i,j),J=min(i,j),则k和i,j的对应关系可统一为:

k=I*(I+1)/2+J0≦k<n(n+1)/2aij的地址可用下列式计算:

LOC(aij)=LOC(sa[k])=LOC(sa[0])+k*d=LOC(sa[0]+[I*(I+1)/2+J]*d)a00a10a11a20……an-10……an-1,n-1根据下标交换关系,对于任意给定一组下标(i,j),均可在sa[k]中找到矩阵元素aij,反之,对所有的k=0,1,2,…n(n-1)/2-1,都能确定sa[k]中的元素在矩阵中的位置(i,j)。由此,称sa[n(n+1)/2]为阶对称矩阵A的压缩存储,见下图:k=0123n(n-1)/2n(n-1)/2-1例如a21和a12均存储在sa[4]中

k=I*(I+1)/2+J=2*(2+1)/2+1=4以主对角线划分,三角矩阵有上三角和下三角两种。2、三角矩阵a00a01…a0n-1ca11…a1n-1……………..cc…an-1n-1(a)上三角矩阵a00c…ca10a11…c……………..an-10an-11…an-1

n-1

(b)下三角矩阵上三角矩阵如图所示,它的下三角(不包括主对角线)中的元素均为常数。下三角矩阵正好相反,它的主对角线上方均为常数,如图所示。在大多数情况下,三角矩阵常数为零。带状矩阵:在带状矩阵中,所有的非零元素集中在以主对角线为中心的带状区域中,即除了主对角线和主对角线相邻两侧的若干条对角线上的元素之外,其余元素皆为零。这个带状区域若包含主对角线下面及上面各d条对角线上的元素,那么,方阵称为半带宽为d的带状矩阵。设n阶方阵A是半带宽为d的带状矩阵,则当|i-j|>d时,aij=0,2d+1称为带状矩阵的带宽。3、带状矩阵

a11a120

…………….

0

a21

a22a23

0

……………0

0

0

…an-1,n-2an-1,n-1

an-1,n

0

0

……an,n-1

ann.

0

a32

a33a34

0

………0

……………非零元素仅出现在主对角上,紧邻主对角线上面的d条对角线上和紧邻主对角线下面的d条对角线上。显然,当∣i-j∣>d时,元素aij=0。对带状矩阵可按行优先顺序或对角线的顺序,将其压缩存储到一个向量中,并且也能找到每个非零元素和向量下标的对应关系。对于n阶半带宽为d的带状矩阵,只需存放带状区域之内的n(2d+1)-d(d+1)个非零元素。为了计算非零元素存放位置方便,除第1行和第n行外,每行都当做有

2d+1个元素,若少于2d+1个,则添零补足。将带状矩阵存储在[(2d+1)n-2d)]s个存储单元中,元素aij的地址公式为:LOC[i,j]=Loc[1,1]+[(i-1)(2d+1)+(j-i)]s(1in,1jn,|i-j|d)上述的各种特殊矩阵,其非零元素的分布都是有规律的,因此总能找到一种方法将它们压缩存储到一个向量中,并且一般都能找到矩阵中的元素与该向量的对应关系,通过这个关系,仍能对矩阵的元素进行随机存取。5.3.2稀疏矩阵什么是稀疏矩阵?精确点,设在的矩阵A中,有s个非零元素。令e=s/(m*n),称e为矩阵的稀疏因子。通常认为e≦0.05时称之为稀疏矩阵。简单说,设矩阵A中有s个非零元素,若s远远小于矩阵元素的总数(即s≦m×n),则称A为稀疏矩阵。在存储稀疏矩阵时,为了节省存储单元,很自然地想到使用压缩存储方法。但由于非零元素的分布一般是没有规律的,因此在存储非零元素的同时,还必须同时记下它所在的行和列的位置(i,

j)。1、三元顺序表

反之,一个三元组(i,j,aij)唯一确定了矩阵A的一个非零元。因此,稀疏矩阵可由表示非零元的三元组及其行列数唯一确定。例如,下列三元组表((1,2,12)(1,3,9),(3,1,-3),(3,6,14),(4,3,24),(5,2,18),(6,1,15),(6,4,-7))加上(6,7)这一对行、列值便可作为下列矩阵M的另一种描述。而由上述三元组表的不同表示方法可引出稀疏矩阵不同的压缩存储方法。1、三元顺序表#defineM20typedef

structnode{inti,j;

intv;}JD;JDma[M];三元组表所需存储单元个数为3(t+1)其中t为非零元个数678

121213931-3361443245218611564-7maijv012345678ma[0].i,ma[0].j,ma[0].v分别存放矩阵行列维数和非零元个数行列下标非零元值2、稀疏矩阵的压缩存储方法3、求转置矩阵问题描述:已知一个稀疏矩阵的三元组表,求该矩阵转置矩阵的三元组表。解决思路:(1)将矩阵行、列维数互换(2)将每个三元组中的i和j相互调换(3)重排三元组次序,使mb中元素以T的行(M的列)为主序67

8

121213931-3361443245218611564-7ijv012345678maijv76

8

13-3161521122518319342446-76314012345678mb?一个m×n的矩阵A,它的转置B是一个n×m的矩阵,且a[i][j]=b[j][i],0≦i≦m,0≦j≦n,即A的行是B的列,A的列是B的行。方法一将A转置为B,就是将A的三元组表a.data置换为表B的三元组表b.data,如果只是简单地交换a.data中i和j的内容,那么得到的b.data将是一个按列优先顺序存储的稀疏矩阵B。要得到按行优先顺序存储的b.data,就必须重新排列三元组的顺序。

由于A的列是B的行,因此,按a.data的列序转置,所得到的转置矩阵B的三元组表b.data必定是按行优先存放的。按这种方法设计的算法,其基本思想是:对A中的每一列col(0≦col≦n-1),通过从头至尾扫描三元表a.data,找出所有列号等于col的那些三元组,将它们的行号和列号互换后依次放入b.data中,即可得到B的按行优先的压缩存储表示。方法一StatusTransmatrix(TSMatrixM,TSMatrix&T){T.mu=M.nu;T.nu=M.mu;T.tu=M.tu;if(T.tu){q=1;for(col=1;col<=M.nu;col++)

for(p=1;p<=M.tu;p++)

if(M.data[p].j==col){

T.data[q].i=M.data[p].j;

T.data[q].j=M.data[p].i;

T.data[q].e=M.data[p].e;q++;}returnOK;}//TransposeSMatrix6

7

8

121213931-3361443245218611564-7ijv012345678ma7

6

8

13-3161521122518319342446-76314ijv012345678mbkppppppppkkkkppppppppcol=1col=2方法一分析这个算法,主要的工作是在p和col的两个循环中完成的,故算法的时间复杂度为O(n*t),即矩阵的列数和非零元的个数的乘积成正比。而一般传统矩阵的转置算法为:

for(col=1;col<=nu;++col)

for(row=1;row<=mu;++row)

t[col][row]=m[row][col];时间复杂度为O(n*m)。当非零元素的个数t和m*n同数量级时,算法transmatrix的时间复杂度为O(m*n2)。三元组顺序表虽然节省了存储空间,但时间复杂度比一般矩阵转置的算法还要复杂,同时还有可能增加算法的难度。因此,此算法仅适用于t<=m*n的情况。方法一按照a.data中三元组的次序进行转置,并将转置后的三元组置入b中的恰当位置。方法2:快速转置算法如果能预先确定矩阵M中每一列(即T中每一行)的第一个非零元素在b.data中应有的位置,那么在对a.data中的三元组一次作转置时,便可直接放到b.data中恰当位置上去。为了确定这些位置,在转置前,应先求得M的每一列中非零元的个数,进而求得每一列的第一个非零元在b.data中应有的位置。快速转置算法的思想:对A扫描一次,按A第二列提供的列号一次确定装入B的一个三元组的位置。具体实施如下:一遍扫描先确定三元组的位置关系,二次扫描由位置关系装入三元组。可见,位置关系是此种算法的关键。

实现:需要附设num和cpot两个数组。num[col]:表示矩阵M中第col列中非零元个数;cpot[col]:指示M中第col列第一个非零元在mb中位置显然有:cpot[1]=1;cpot[col]=cpot[col-1]+num[col-1];(2cola.nu)1357889colnum[col]cpot[col]12223241506170方法2:快速转置算法快速转置算法StatusFastTransmatrix(TSMatrixM,TSMatrix&T){T.mu=M.nu;T.nu=M.mu;T.tu=M.tu;if(T.tu){for(col=1;col<=M.nu;++col)num[col]=0;for(t=1;t<=M.tu;++t)++num[M.data[t].j];//求M中每一列含非零元个数cpot[1]=1;//求第col列中第1个非零元素在b.data中的序号。快速转置算法for(col=2;col<=M.nu;++col)cpot[col]=cpot[col-1]+num[col-1];for(p=1;p<=M.tu;p++){col=M.data[p].j;q=cpot[col];}//ifreturnOK;}//FastTransposeSMatrix

T.data[q].i=M.data[p].j;T.data[q].j=M.data[p].i;

T.data[q].e=M.data[p].e;++cpot[col];}//for这个算法仅比前一个算法多用了两个辅助数组。快速转置算法分析从时间上看,算法中有四个并列的单循环,循环次数分别为nu和tu,因而总的时间复杂度为O(nu+tu)。在M的非零元素个数tu和mu×nu等数量级时,其时间复杂度为O(mu×nu),和经典算法的时间复杂度相同。67

8

121213931-3361443245218611564-7ijv012345678maijv012345678mbcolnum[col]cpot[col]1122323524715806817907

6

8

13-3161521122518319342446-76314pppppppp4629753tpedef

struct

OLNode{inti,j;ElemTypee;struct

OLNode*down,*right;}OLNode;*OLink;ijedownright在链表中,每个非零元素可用一个含5个域的结点表示,right域用以链接同一行中下一个非零元素,down域用以链接同一列中下一个非零元素。4、十字链表同一行的非零元素通过right域链接成一个线性表,同一列的非零元素通过down域链接成一个线性表,每个非零元素既是某行链表中的一个结点,又是某个列链表中的一个结点,整个矩阵构成了一个十字交叉的链表,故称这样的存储结构为十字链表,可用两个分别存储行链表的头指针和列链表的头指针的一维数组表示。113418225234^^^^^^^4、十字链表例题:两个矩阵相加假设两个矩阵相加后的结果为A’,则和矩阵A’中的非零元aij’只可能有三种情况:aij+bij

当将B加到A上去时,A矩阵的十字链表:改变接点的e值(aij+bij0)aij(bij=0)bij(aij=0)不变(bij=0)插入一个新结点(aij=0)另一种情况:和A矩阵中的某个非零元相对应,和矩阵A’中是零元,即对A的操作是删除一个接点(aij+bij=0)。整个运算过程可从矩阵的第一行起逐行进行。对每一行都从表头出发分别找到A和B在该行中的第一个非零元结点后,开始比较,然后按上述四种不同情况分别处理。例题:两个矩阵相加广义表(Lists,又称列表)是线性表的推广。在第2章中,我们把线性表定义为n0个元素a1,a2,a3,…,an的有限序列。线性表的元素仅限于原子项,原子是作为结构上不可分割的成分,它可以是一个数或一个结构,若放松对表元素的这种限制,容许它们具有其自身结构,这样就产生了广义表的概念。5.4广义表的定义广义表是n(n0)个元素a1,a2,a3,…,an的有限序列,其中ai或者是原子项,或者是一个广义表。通常记作LS=(a1,a2,a3,…,an)。LS是广义表的名字,n为它的长度。若ai是广义表,则称它为LS的子表。通常用圆括号将广义表括起来,用逗号分隔其中的元素。为了区别原子和广义表,书写时用大写字母表示广义表,用小写字母表示原子。若广义表LS(n>=1)非空,则a1是LS的表头,其余元素组成的表(a1,a2,…an)称为LS的表尾。5.4广义表的定义显然广义表是递归定义的,这是因为在定义广义表时又用到了广义表的概念。广义表的例子如下:(1)A=()——A是一个空表,其长度为零。(2)B=(e)——表B只有一个原子e,B的长度为1。(3)C=(a,(b,c,d))——表C的长度为2,两个元素分别为原子a和子表(b,c,d)。(4)D=(A,B,C)——表D的长度为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论