南京邮电大学数据结构A第5章_第1页
南京邮电大学数据结构A第5章_第2页
南京邮电大学数据结构A第5章_第3页
南京邮电大学数据结构A第5章_第4页
南京邮电大学数据结构A第5章_第5页
已阅读5页,还剩122页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据结构A·第5章树第5章树内容提要1、树的基本概念给出树的定义,关于树中的一些术语;2、二叉树的定义、性质及其规范;3、二叉树的遍历等算法的实现;4、树和森林的表示、存储和遍历;5、堆和优先权队列6、二叉树的应用实例——哈夫曼树和哈夫曼编码。7、并查集和等价关系5.1树的根本概念5.1.1树的定义层次结构的数据在现实自然界中大量存在。国家、省、市、县和区。书的章节、回目。上级和下级。整体和局部。祖先和后裔。课堂提要第5章树5.1树的根本概念5.2二叉树5.3二叉树的遍历5.5树和森林5.7哈夫曼树和哈夫曼编码5.1树的根本概念5.1.1树的定义层次结构的数据在现实自然界中大量存在。图5-1西欧语言谱系图原始印欧语古意大利语日耳曼语西日耳曼语拉丁语西班牙语法语意大利语希腊语北日耳曼语冰岛语瑞典语挪威语英语荷兰语德语古希腊语5.1树的根本概念5.1.1树的定义层次结构的数据在现实自然界中大量存在。图5-2操作系统的目录结构树形结构5.1树的根本概念5.1.1树的定义2、树的递归定义定义5.2树是包括n个结点的有限非空集合T,其中一个特定的结点r称为根,其余结点〔T-{r}〕划分成m〔m≥0〕个互不相交的子集T1,T2,...Tm,其中,每个子集都是树,被称为树根r的子树。定义5.2是递归的,用子树来定义树,也就是说,在树的定义中引用了树概念本身,所以,树被称为递归数据结构。5.1树的根本概念5.1.2根本术语结点(node):树中的元素。根结点和它的子树根〔如果存在〕之间形成一条边。E、A、F、B、G、C、D、L、J、M、N均为结点。EAFGBCDLJMN路径(path):从某个结点沿树中的边可到达另一个结点,那么称这两个结点之间存在一条路径。E和N之间存在一条路径。5.1树的根本概念5.1.2根本术语EAFGBCDLJMN结点G和C互为兄弟否?双亲(parent):假设一个结点有子树,那么该结点称为子树根的双亲。A、F、B的双亲是E。C、D的双亲是F。孩子(child):某结点子树的根是该结点的孩子。E有三个孩子:A、F、B。D有一个孩子:J。兄弟(sibling):有相同双亲的结点互为兄弟。A、F、B互为兄弟,C和D互为兄弟。5.1树的根本概念5.1.2根本术语EAFGBCDLJMN后裔(decendent):一个结点的所有子树上的任何结点都是该结点的后裔。结点C的后裔为:L、M、N。祖先(ancestor):从根结点到某个结点的路径上的所有结点都是该结点的祖先。结点L的祖先为:E、F、C。5.1树的根本概念5.1.2根本术语EAFGBCDLJMN结点的度(degree):结点拥有的子树数。结点E的度为3,结点F的度为2,结点A的度为1,结点G的度为0。叶子(leaf):度为零的结点。B、G、J、M、N均为叶子结点。分支结点(branch):度不为零的结点。E、A、F、C等为分支结点。树的度:树中结点的最大的度。该树的度为3。5.1树的根本概念5.1.2根本术语结点的层次:根结点的层次为1,其余结点的层次等于其双亲结点的层次加1。结点E的层次为1。结点M的层次为5。树的高度:树中结点的最大层次。∵树中结点的最大层次为5。∴树的高度为5。12345EAFGBCDLJMN5.1树的根本概念5.1.2根本术语AG无序树:如果树中结点的各子树之间的次序是不重要的,可以交换位置。以下是同一棵无序树:将左边树中所有结点的子树互换次序就是右边的树。EAFGBCDLJMNEFBCDLJNM5.1树的根本概念5.1.2根本术语有序树:如果树中结点的各棵子树看成是从左到右有次序的,那么称该树为有序树。有序树的各子树从左到右为第一棵子树、第二棵,…以下是二棵有序树:AGEAFGBCDLJMNEFBCDLJNM5.1树的根本概念5.1.2根本术语森林:是树的集合。0个或多个不相交的树组成森林。果园或有序森林:有序树的有序集合。假设将树中的根去掉,那么得到根的子树组成的森林。BEAGFCDLJMNE假设增加一个结点,将森林中各树的根作为新增结点的孩子,那么森林即成为树。5.2二叉树二叉树是非常重要的树形数据结构。很多从实际问题中抽象出来的数据是二叉树形的;以后我们将看到任意树或森林可方便地转换成二叉树,从而为一般树和森林的存储和处理提供了有效方法。课堂提要第5章树5.1树的根本概念5.2二叉树5.3二叉树的遍历5.5树和森林5.7哈夫曼树和哈夫曼编码5.2二叉树5.1.2根本术语方法二:改进结构,组织成树形结构。比较次数不会超过树高,提高了效率。二叉树应用实例设有序表为〔21,25,28,33,36,45〕,现在要在表中查找元素33。282136253345方法一:顺序搜索。效率低,平均比较一半的元素。〔21,25,28,33,36,45〕比较了4次!比较了3次!33335.2二叉树5.2.1二叉树的定义定义5.3二叉树(binarytree)是结点的有限集合,该集合或者为空集,或者是由一个根和两个互不相交的、称为该根的左子树和右子树的二叉树组成。上述定义说明二叉树可以为空集,因此,二叉树有5种根本形态。(a)(b)(c)(d)(e)图5-4二叉树的五种基本形态5.2二叉树5.2.1二叉树的定义树与二叉树的区别:⑴树不能是空树,即至少有一个根结点。而二叉树可以是空树。⑵一般树的子树之间是无序的。而二叉树中结点的子树要区分左、右子树,即使只有一棵子树。⑶树中每个节点可有0棵或假设干子树。而二叉树的每个节点最多只能有2棵子树。EFEF5.2二叉树5.2.2二叉树的性质性质5.1

二叉树的第i(i≥1)层上至多有2i-1

个结点。可用归纳法证明之。当i=1时,二叉树至多只有一个结点,结论成立。设当i=k时结论成立,即二叉树上至多有2k-1

个结点当i=k+1时,∵每个结点最多只有两个孩子,∴第k+1层上至多有2*2k–1=2k个结点,性质成立。5.2二叉树5.2.2二叉树的性质性质5.2

高度为h的二叉树上至多有2h–1个结点。当h=0时,二叉树为空二叉树。当h>0时,利用性质1,高度为h的二叉树中结点的总数最多为:5.2二叉树5.2.2二叉树的性质5.2二叉树5.2.2二叉树的性质性质5.3包含n个元素的二叉树的高度至少为log2(n+1)根据性质2,高度为h的二叉树最多有2h–1个结点〔性质2〕,因而n2h–1,那么有hlog2(n+1)。由于h是整数,所以hlog2(n+1)。5.2二叉树5.2.2二叉树的性质性质5.4任意一棵二叉树中,假设叶结点的个数为n0,度为2的结点的个数为n2,那么必有n0=n2+1。设二叉树的度为1的结点数为n1,树中结点总数为n,那么n=n0+n1+n2……①〔∵二叉树中只有度为0、1、2三种类型的结点〕设分支数为B,n个结点的二叉树,除了根结点外,每个结点都有一个分支进入,那么B=n-1;分支是由度为1或者度为2的射出的,又有B=2n2+n1;那么有:n-1=2n2+n1n=2n2+n1+1……②由①②可得到:n0+n1+n2=2n2+n1+1n0+n2=2n2+1 即n2=n0-1。5.2二叉树5.2.2二叉树的性质定义5.4

高度为h的二叉树恰好有2h

–1个结点时称为满二叉树。01234567891011121314(a)满二叉树0123456789(b)完全二叉树图5.6几种特殊的二叉树9定义5.5一棵二叉树中,只有最下面两层结点的度可以小于2,并且最下一层的叶结点集中在靠左的假设干位置上。这样的二叉树称为完全二叉树。5.2二叉树5.2.2二叉树的性质定义5.6扩充二叉树也称2-树,其中除叶子结点外,其余结点都必须有两个孩子。5323301112131735895.2二叉树5.2.2二叉树的性质:完全二叉树的性质性质5.5

具有n个结点的完全二叉树的高度为

log2

(n+1)

。证明:根据性质2高度为h-1的完全二叉树结点个数最多为2h-1-1高度为h的完全二叉树结点个数最多为2h-1高度为h的完全二叉树结点个数取值范围[2h-1,2h)结论:⑴n个结点的二叉树中完全二叉树最矮,高度为

log2(n+1)

。⑵n个结点的完全二叉树和二叉判定树的高度是一样的2h-1≤n<2hlog2n<h≤log2n+1∵h是整数∴h=①①②②性质2高度为h的二叉树上至多有2h

–1个结点。2h-1-1<n≤2h

–1log2(n+1)≤h<log2(n+1)+1h=

log2

(n+1)

5.2二叉树5.2.2二叉树的性质:完全二叉树的性质性质5.6假定对一棵有n个结点的完全二叉树中的结点,按从上到下、从左到右的顺序,从0到n-1编号〔见图5.6(c)〕,设树中一个结点的序号为i,0i<n,那么有以下关系成立:〔1〕当i=0时,该结点为二叉树的根。〔2〕假设i>0,那么该结点的双亲的序号为(i-1)/2〔3〕假设2i+1<n,那么该结点的左孩子的序号为2i+1,否那么该结点无左孩子。〔4〕假设2i+2<n,那么该结点的右孩子的序号为2i+2,否那么该结点无右孩子。(a)满二叉树012345678910111213140123456789(b)完全二叉树5.2二叉树5.2.3二叉树ADTADTBinaryTree{Data:二叉树是结点的有限集合,该集合或者为空集,或者是由一个根和两个互不相交的称为该根的左子树和右子树的二叉树组成。Operations:Create():创立一棵空二叉树。Destroy():撤销一棵二叉树。IsEmpty():假设二叉树空,那么返回true,否那么返回false。Clear():移去所有结点,成为空二叉树。Root(x):取x为根结点;假设操作成功,那么返回true,否那么返回falseMakeTree(x,left,right):创立一棵二叉树,x为根结点,left为左子树,right为右子树。BreakTree(x,left,right):拆分二叉树为三局部,x为根的值,left和right分别为原树的左右子树PreOrder:使用函数Visit访问结点,先序遍历二叉树。InOrder:使用函数Visit访问结点,中序遍历二叉树。PostOrder:使用函数Visit访问结点,后序遍历二叉树。}5.2二叉树5.2.4二叉树的存储表示1.完全二叉树的顺序表示完全二叉树中的结点可以按层次顺序存储在一片连续的存储单元中。根结点保存在编号为0的位置上。注意:一般的二叉树不适合用这种存储结构。01234567890123456789图6.5图6.4(b)完全二叉树的顺序表示0123456789图6.4(b)完全二叉树5.2二叉树5.2.4二叉树的存储表示lChildelementrChild一棵有n个结点的二叉树中,每个结点有2个指针域。∵指针域有2n个。除了根结点外,其它结点均有一个指向它的指针,此项开支用掉n-1个指针域。∴空指针域的数目为2n-(n-1)=n+1。2.二叉树的链接表示ABCDEFAB^C^D^^E^^F^(a)二叉树 (b)二叉树的链接表示图6-6二叉树的链接表示5.2二叉树5.2.4二叉树的存储表示二叉树的二叉链表结构有利于从双亲到孩子方向的访问,但从孩子无法反向访问其父节点。如果在二叉链表结点中增加一个parent域,令它指向该结点的双亲结点,就可以实现从孩子到双亲,以及从双亲到孩子的双向链接结构。AB^C^D^^E^^F^^5.2二叉树5.2.5二叉树类template<classT>structBTNode{BTNode(){lChild=rChild=NULL;}BTNode(constT&x){element=x;lChild=rChild=NULL;}BTNode(constT&x,BTNode<T>*l,BTNode<T>*r){element=x;lChild=l;rChild=r;}Telement;BTNode<T>*lChild,*rChild;};程序5.1二叉树结点类5.2二叉树5.2.5二叉树类template<classT>classBinaryTree{public:BinaryTree(){root=NULL;}~BinaryTree(){Clear();}boolIsEmpty()const;voidClear();boolRoot(T&x)const;voidMakeTree(constT&e,BinaryTree<T>&left,BinaryTree<T>&right);voidBreakTree(T&e,BinaryTree<T>&left,BinaryTree<T>&right);voidPreOrder(void(*Visit)(T&x));voidInOrder(void(*Visit)(T&x));voidPostOrder(void(*Visit)(T&x));protected:BTNode<T>*root;private:intSize(BTNode<T>*t);voidClear(BTNode<T>*t);voidPreOrder(void(*Visit)(T&x),BTNode<T>*t);voidInOrder(void(*Visit)(T&x),BTNode<T>*t);voidPostOrder(void(*Visit)(T&x),BTNode<T>*t);};程序5.2二叉树类5.2二叉树5.2.6实现二叉树根本运算本小节中,我们主要实现MakeTree、BreakTree和Root运算,而将二叉树遍历算法留待下一小节专门讨论。Clear()函数释放二叉链表中的所有结点,它需要通过遍历二叉树来实现。5.2二叉树5.2.6实现二叉树根本运算程序5.3局部二叉树运算template<classT>boolBinaryTree<T>::Root(T&x)const{if(root){x=root->element;returntrue;}elsereturnfalse;}ABCDEF5.2二叉树5.2.6实现二叉树根本运算程序5.3局部二叉树运算template<classT>voidBinaryTree<T>::MakeTree(constT&x, BinaryTree<T>&left,BinaryTree<T>&right){if(root||&left==&right)return;root=newBTNode<T>(x,left.root,right.root);left.root=right.root=NULL;}DCEFBTNode(constT&x,BTNode<T>*l,BTNode<T>*r){element=x;lChild=l;rChild=r;}Aleft.rootright.root=NULL=NULL5.2二叉树5.2.6实现二叉树根本运算程序5.3局部二叉树运算…if(root||&left==&right)return;root=newBTNode<T>(x,left.root,right.root);left.root=right.root=NULL;}D^C^E^^F^t3t2(1)t1.root!=NULL;(2)&t2==&t3t1.MakeTree(‘A’,t2,t3);N^^P^t1(1)t1的结点全部丧失?(2)t1左右子树的结点是同一空间?5.2二叉树5.2.6实现二叉树根本运算程序5.3局部二叉树运算template<classT>voidBinaryTree<T>::BreakTree(T&x, BinaryTree<T>&left,BinaryTree<T>&right){if(!root||&left==&right||left.root||right.root)return;x=root->element;left.root=root->lChild;right.root=root->rChild;deleteroot;root=NULL;}DCEFAleft.root→←right.rootroot=∧root5.2二叉树5.2.6实现二叉树根本运算intmain(void){BinaryTree<char>a,b,x,y,z;y.MakeTree('E',a,b);z.MakeTree('F',a,b);x.MakeTree('C',y,z);y.MakeTree('D',a,b);z.MakeTree('B',y,x);z.BreakTree(e,y,x);return0;}程序5.4

main函数——一个测试程序abxyzEyCxFzDyBz5.3二叉树的遍历5.1.2根本术语遍历〔traverse〕一个有限结点的集合,意味着对该集合中的每个结点访问且仅访问一次。课堂提要第5章树5.1树的根本概念5.2二叉树5.3二叉树的遍历5.5树和森林5.7哈夫曼树和哈夫曼编码ABDCEF二叉树遍历算法:

(I)先左后右:VLR,LVR,LRV(II)先右后左:VRL,RVL,RLV-逆5.3二叉树的遍历5.3.1二叉树遍历算法⑴先序遍历〔VLR〕假设二叉树为空,那么空操作;否那么①访问根结点;②先序遍历左子树;③先序遍历右子树。ABDCEF先序遍历序列:ABDCEF

先序遍历序列:ABDGHECF

t→t→t→t→t→t→t=∧t=∧t=∧t=∧t→t→t=∧t=∧t=∧ABCDEFGH5.3二叉树的遍历5.3.1二叉树遍历算法(2)中序遍历〔LVR〕假设二叉树为空,那么空操作;否那么①中序遍历左子树;②访问根结点;③中序遍历右子树。中序遍历序列:BDAECF

ABDCEF中序遍历ABCDEFGHIJK5.3二叉树的遍历5.3.1二叉树遍历算法(3)后序遍历〔LRV〕假设二叉树为空,那么空操作;

否那么①后序遍历左子树;②后序遍历右子树;③访问根结点。后序遍历序列:DBEFCA

ABDCEF后序遍历ABCDEFGHIJK层次遍历ABCDEFGHIJK5.3二叉树的遍历5.3.2

二叉树遍历的递归算法

对于遍历运算,设计了一个面向用户的公有成员函数和一个具体实现遍历操作的递归私有成员函数,两者共同完成遍历运算的功能。公有成员函数:非递归函数,作为与用户的接口。它调用私有的递归函数。私有成员函数:递归函数,具体实现遍历操作。被公有成员函数调用。5.3二叉树的遍历5.3.2

二叉树遍历的递归算法程序5.5访问元素函数template<classT>voidVisit(T&x){cout<<x<<"\t";}程序5.6先序遍历template<classT>voidBinaryTree<T>::PreOrder(void(*Visit)(T&x)){PreOrder(Visit,root);}template<classT>voidBinaryTree<T>::PreOrder(void(*Visit)(T&x),BTNode<T>*t){if(t){Visit(t->element);PreOrder(Visit,t->lChild);PreOrder(Visit,t->rChild);}}5.3二叉树的遍历5.3.2

二叉树遍历的递归算法补充:中序遍历template<classT>voidBinaryTree<T>::InOrder(void(*Visit)(T&x)){InOrder(Visit,root);}template<classT>voidBinaryTree<T>::InOrder(void(*Visit)(T&x),BTNode<T>*t){if(t){InOrder(Visit,t->lChild);Visit(t->element);InOrder(Visit,t->rChild);}}5.3二叉树的遍历5.3.2

二叉树遍历的递归算法补充:后序遍历template<classT>voidBinaryTree<T>::PostOrder(void(*Visit)(T&x)){PostOrder(Visit,root);}template<classT>voidBinaryTree<T>::PostOrder(void(*Visit)(T&x),BTNode<T>*t){if(t){PostOrder(Visit,t->lChild);PostOrder(Visit,t->rChild);Visit(t->element);}}5.3二叉树的遍历显然,二叉树遍历算法根本操作是访问结点,不管按何种次序遍历,对含有n个结点的二叉树,其时间复杂度均为O(n)。5.3二叉树的遍历关于三种遍历算法:1.给定一棵二叉树,能写出它的三种遍历序列。2.给出二叉树的先序遍历序列和中序遍历序列可以唯一确定一棵二叉树。3.给出二叉树的后序遍历序列和中序遍历序列可以唯一确定一棵二叉树。4.当n>1时,给出二叉树的先序遍历序列和后序遍历序列不

可以唯一确定一棵二叉树。例如:先序序列:AB,后序序列:BAABAB5.3二叉树的遍历例结点的先序序列和中序序列分别为:先序序列ABCDEFG中序序列CBEDAFG那么可按上述分解求得整棵二叉树,其构造过程:(1)由先序序列可知二叉树的根为A,A的左子树的中序序列为CBED,右子树的中序序列为FG。(2)此外,A的左子树的先序序列必为BCDE,右子树的前序序列为FG。(3)类似地,可由左子树的先序序列和中序序列构造A的左子树,由右子树的先序序列和中序序列构造A的右子树。5.3二叉树的遍历5.3.3

二叉树遍历的应用实例1.计算二叉树的结点数

程序5.7求二叉树的结点数template<classT>intBinaryTree<T>::Size(){returnSize(root);}template<classT>intBinaryTree<T>::Size(BTNode<T>*t){if(!t)return0;returnSize(t->lChild)+Size(t->rChild)+1;}利用二叉树遍历思想可以解决许多二叉树的应用问题。ABDCEF5.3二叉树的遍历5.3.3

二叉树遍历的应用实例2.二叉树复制程序5.8二叉树复制template<classT>BTNode<T>*BinaryTree<T>::Copy(BTNode<T>*t){if(!root)returnNULL;BTNode<T>*q=newBTNode<T>(t->element);q->lChild=Copy(t->lChild);q->rChild=Copy(t->rChild);returnq;}利用二叉树遍历思想可以解决许多二叉树的应用问题。ABDCEFtABDCEFq==>5.3二叉树的遍历5.3.3

二叉树遍历的应用实例3.补充:删除二叉树template<classT>voidBinaryTree<T>::Clear(BTNode<T>*t){if(t){Clear(t->lChild);Clear(t->rChild);cout<<"delete"<<t->element<<"..."<<endl;deletet;}}利用二叉树遍历思想可以解决许多二叉树的应用问题。5.3二叉树的遍历5.3.3

二叉树遍历的应用实例二叉树在很多领域都有着广泛的应用——〔1〕编译原理中的表达式树先序遍历前缀表达式中序遍历中缀表达式后序遍历后缀表达式编译原理中还用了语法树(d)a*(b+c*d)/e/*+eb*acd(c)a*(b+c)*ac+b(b)a*b+c+*bca(a)a/b/ab5.3二叉树的遍历5.3.3

二叉树遍历的应用实例二叉树在很多领域都有着广泛的应用——〔2〕猜谜游戏的决策树5.5树和森林

前两几节中,我们已介绍了树和森林的定义和概念,并对二叉树作了详细介绍,现在再回过头来讨论森林和二叉树的转换、树或森林的存储表示及其遍历算法。课堂提要第5章树5.1树的根本概念5.2二叉树5.3二叉树的遍历5.5树和森林5.7哈夫曼树和哈夫曼编码5.5树和森林5.5.1

森林与二叉树的转换1.树(Tree)转换为二叉树(BTree)算法树可以唯一地表示成一棵二叉树:⑴连线:将树中的兄弟用线连接;⑵去线:保存最左孩子的连线,去掉其余孩子的连线;⑶整形:调整为习惯的二叉树形(水平右斜,垂直左斜)。ABCKDEFGHJABCKDEHFJG(a)森林F=(T1,T2)(b)F所对应的二叉树5.5树和森林5.5.1

森林与二叉树的转换1.树(Tree)转换为二叉树(BTree)算法DEFGHJABCKDEFGHJABCKGACKGA==>CK==>再看一例5.5树和森林5.5.1

森林与二叉树的转换1.树(Tree)转换为二叉树(BTree)算法注意:⑴左孩子右兄弟。(树→二叉树)

二叉树中有两个结点X和Y,且X是Y的双亲

⑵树的根结点没有兄弟,所以树对应的二叉树根结点没有右子树二叉树中树中Y是X左孩子Y是X孩子Y是X右孩子Y是X兄弟5.5树和森林5.5.1

森林与二叉树的转换2.森林(Forest)转换成二叉树(BTree)可以将任何森林唯一地表示成一棵二叉树。方法如下:(1)假设F为空,那么B为空二叉树(2)假设F非空,那么B的根是F中第一棵子树T1的根R1,B的左子树是T1的子树森林〔T11,T12,…,T1m〕,B的右子树是森林〔T2,…,Tn〕所对应的二叉树最后所形成的二叉树就是森林所对应的二叉树。5.5树和森林5.5.1

森林与二叉树的转换2.森林(Forest)转换成二叉树(BTree)ABCKDEFGHJABCKDEHFJG①ADEHFJGBCK②5.5树和森林5.5.1

森林与二叉树的转换3.二叉树转换成森林(B→F)ABCKDEFGHJADEHFJGBCK连线去线整形5.5树和森林5.5.1

森林与二叉树的转换3.二叉树转换成森林(B→F)一棵二叉树B转换成的森林中有多少棵树?

一棵二叉树转化成的森林中所具有的树的数目,等于二叉树从根结点开始沿右链到第一个没有右孩子的结点所经过的结点数目。ABECDFGHIJ经过3个结点,故森林中3棵树5.5树和森林5.5.1

森林与二叉树的转换3.二叉树转换成森林(B→F)ABCDEFGHIJABCDEFGHIJ5.5树和森林

树和森林的存储表示1.多重链表表示法其中m是树的度。每个结点的指针域个数均为m,故又称为等长的多重链表。优点:处理简单。 缺点:空指针域多,有浪费。设树中有n个结点,总共有n*m个指针域,其中,只有n-1个非空指针域,故空指针域个数为:

n*m-(n-1)=n(m-1)+1elementchild1child2……childm5.5树和森林

树和森林的存储表示2.孩子兄弟表示法

孩子兄弟(左子/右兄弟)表示法实质上就是树所对应的二叉树的二叉链表表示法。其每个结点为:leftChildelementrightSiblingDEFGHJDEFGHJ∧J∧∧G∧F

∧H∧E

D∧5.5树和森林

树和森林的存储表示3.双亲表示法

每个结点有两个域:element和parent。parent域为指向该结点的双亲结点的下标。可以对树中结点按自上而下、自左向右(按层次)的次序顺序存储起来。思考:如何查找结点的双亲和孩子?012345DEFGHJ-100012elementparent顺序存储的双亲表示法DEFGHJ双亲表示法5.5树和森林

树和森林的存储表示4.三重链表表示法优点:可以很方便地得到节点的双亲和孩子信息。leftChildelementrightSiblingparentDEFGHJ∧J∧∧G

∧F

H

D

∧∧

E5.5树和森林

树和森林的存储表示5.带右链的先序表示法

数据元素有三个数据项,element,lTag,sibling。

sibling指向结点的兄弟

lTag为0表示有孩子,孩子存于相邻单元

lTag为1表示无孩子数据元素按对应二叉树的先序遍历的顺序存储结点。5.5树和森林

树和森林的存储表示5.带右链的先序表示法5.5树和森林

树和森林的遍历

1.按深度方向遍历对森林的深度遍历与二叉树类似,根据树的递归定义,可以有两种遍历次序:先序遍历和中序遍历。森林(F)对应二叉树(B)先序遍历等价于先序遍历中序遍历等价于中序遍历后序遍历不常用。5.5树和森林

树和森林的遍历

1.按深度方向遍历

对上图〔a)的森林的先序遍历的结果是:ABCKDEHFJG,它等同于对(b)的二叉树的先序遍历。〔1〕先序遍历:假设森林为空,那么遍历结束。否那么、a)访问第一棵树的根;b)按先序遍历第一棵树的根结点的子树组成的森林;c)按先序遍历其余树组成的森林。5.5树和森林

树和森林的遍历

1.按深度方向遍历

对上图〔a)的森林的中序遍历的结果是:BKCAHEJFGD,它等同于对(b)的二叉树的中序遍历。〔1〕中序遍历:假设森林为空,那么遍历结束,否那么

a)按中序遍历第一棵树的根结点的子树组成的森林;b)访问第一棵树的根;c)按中序遍历其余树组成的森林。5.5树和森林

树和森林的遍历

1.按宽度方向遍历首先访问处于第一层的结点,然后访问处于第二层的结点,再访问第三层,…,等,最后访问最下层的结点。对上图的森林按宽度方向的遍历结果是:ADBCEFGKHJ5.6堆和优先权队列

树和森林的遍历5.6.1堆

一个大小为n的堆是一棵包含n个结点的完全二叉树,该树中每个结点的关键字值大于等于其双亲结点的关键字值。完全二叉树的根称为堆顶,它的关键字值是整棵树上最小的。这样定义的堆称为最小堆。类似地,还可以定义最大堆。5.6堆和优先权队列

树和森林的遍历5.6.1堆5.6堆和优先权队列

树和森林的遍历5.6.1堆堆是n个元素的序列〔k0,k1,,kn-1〕,当且仅当满足kik2i+1且kik2i+2,(i=0,1,…,(n-2)/2〕时称为堆(最小堆)。堆顶元素是序列的第一个元素。向下调整voidAdjustDown(Theap[],intr,intj)设〔heap[r+1],…,heap[j]〕这j-r个位置上的元素已满足特性:heap[i]heap[2i+1]且heap[i]heap[2i+2](i=r+1,2,…,(j-1)/2)的条件,运行此函数将使得增加一个元素heap[r],(heap[r],heap[r+1],…,heap[j])这j-r+1个元素也满足堆的特性。5.6堆和优先权队列

树和森林的遍历5.6.1堆5.6堆和优先权队列

树和森林的遍历5.6.1堆template<classT>voidAdjustDown(Theap[],intr,intj){//下标从r+1到j已满足堆的条件

intchild=2*r+1;//左孩子

Ttemp=heap[r];while(child<=j){if((child<j)&&(heap[child]>heap[child+1]))child++;if(temp<=heap[child])break;heap[(child-1)/2]=heap[child];child=2*child+1;}heap[(child-1)/2]=temp;}5.6堆和优先权队列

树和森林的遍历5.6.1堆template<classT>voidCreateHeap(Theap[],intn){for(inti=(n-2)/2;i>-1;i--)AdjustDown(heap,i,n-1);}n/2-1=3,下标范围:3,n-1建堆的时间为O(nlog2n)。更深入分析可知,建堆时间复杂度为O(n)。5.6堆和优先权队列

树和森林的遍历5.6.1堆5.6堆和优先权队列

树和森林的遍历5.6.2优先权队列ADTADTPrioQueue{数据:n0个元素的最小堆。运算:Create():建立一个空队列。Destroy():撤消一个队列。IsEmpty():假设队列空,那么返回true;否那么返回false。IsFull():假设队列满,那么返回true;否那么返回false。Append(x):元素值为x的新元素入队列。Serve(x):在x中返回具有最高优先权的元素值,并从优先权队列中删除该元素。}5.6堆和优先权队列

树和森林的遍历5.6.3优先权队列类template<classT>classPrioQueue{public: PrioQueue(intmSize=20); ~PrioQueue(){delete[]q;}; boolIsEmpty()const{returnn==0;} boolIsFull()const{returnn==maxSize;} voidAppend(constT&x); voidServe(T&x);private: voidAdjustDown(intr,intj); voidAdjustUp(intj); T*q; intn,maxSize;};5.6堆和优先权队列

树和森林的遍历5.6.3优先权队列类template<classT>PrioQueue<T>::PrioQueue(intmSize){ maxSize=mSize;n=0;q=newT[maxSize];}5.6堆和优先权队列

树和森林的遍历5.6.4实现优先权队列voidAdjustUp(intj)设〔q[0],…,q[j-1]〕这j位置上的元素已满足特性:q[i]q[2i+1]且q[i]q[2i+2](i=0,1,,(j-2)/2),运行此函数将使得增加一个元素q[j],(q[0],q[1],…,q[j])这j+1个元素也满足堆的特性。5.6堆和优先权队列

树和森林的遍历5.6.4实现优先权队列template<classT>voidPrioQueue<T>::AdjustUp(intj){inti=j;Ttemp=q[i];while(i>0&&temp<q[(i-1)/2]){ q[i]=q[(i-1)/2];i=(i-1)/2;}q[i]=temp;}5.6堆和优先权队列

树和森林的遍历5.6.4实现优先权队列5.6堆和优先权队列

树和森林的遍历5.6.4实现优先权队列template<classT>voidPrioQueue<T>::Append(constT&x){if(IsFull()){cout<<“Overflow〞;return;}q[n++]=x;AdjustUp(n-1);}5.6堆和优先权队列

树和森林的遍历5.6.4实现优先权队列template<classT>voidPrioQueue<T>::Serve(T&x){if(IsEmpty()){cout<<“Underflow〞;return;} x=q[0];q[0]=q[--n];AdjustDown(0,n-1);}5.6堆和优先权队列

树和森林的遍历5.6.4实现优先权队列5.7哈夫曼树和哈夫曼编码

树和森林的遍历

本节将讨论:树的路径长度哈夫曼树和哈夫曼算法课堂提要第5章树5.1树的根本概念5.2二叉树5.3二叉树的遍历5.5树和森林5.7哈夫曼树和哈夫曼编码5.7哈夫曼树和哈夫曼编码5.7.1树的路径长度定义5.7

从根到树中任意结点的路径长度是指从根结点到该结点的路径上所包括的边的数目。树的内路径长度定义为除叶子结点外,从根到树中其他所有结点的路径长度之和。树的外路径长度是指从根到树中所有叶子结点的路径长度之和。5.7哈夫曼树和哈夫曼编码5.7.1树的路径长度定理5.1设I和E分别是一棵扩充二叉树的内路径长度和外路径长度,n是树中非叶结点的数目,那么E=I+2n。证明:归纳法,设扩充二叉树中,非叶子结点个数为n(1)n=1时,E1=2,I1=0,E1=I1+2满足(2)设n-1时满足等式En-1=In-1+2(n-1)vv得到:In-1=In–kEn-1=En–2(k+1)+k=En–(k+2)又因为En-1=In-1+2(n-1)从而得到En=In+2n由(1)(2)定理得证。k为从根到v的路径长度5.7哈夫曼树和哈夫曼编码5.7.1树的路径长度定义5.8如果叶子结点是带权的,那么叶子结点的加权路径长度是从根到该叶子的路径长度与叶子的权的乘积。树的带权路径长度为树中所有叶子结点的加权路径长度之和,记作其中,m是叶子结点的个数,wk是第k个叶子结点的权,lk是该叶子结点的路径长度。5.7哈夫曼树和哈夫曼编码5.7.1树的路径长度A:WPL=(6×1+2×2+1×3+2×3)=19B:WPL=(1×1+2×2+6×3+2×3)=295.7哈夫曼树和哈夫曼编码5.7.2哈夫曼树和哈夫曼算法一般地,权越大的叶子离根越近,那么二叉树的加权路径长度越小。哈夫曼给出了求具有最小加权路径长度二叉树的算法,称为哈夫曼算法。用哈夫曼算法构造的二叉树称为哈夫曼树。5.7哈夫曼树和哈夫曼编码5.7.2哈夫曼树和哈夫曼算法哈夫曼算法可以描述如下:⑴用给定的一组权值{w1,w2,…,wn}生成一个森林F={T1,T2,…,Tn},其中每棵二叉树Ti只有一个权值为wi的根结点,其左、右子树均为空。⑵从F中选择两棵根结点权值最小的树作为新树根的左、右子树,新树根的权值是左、右子树根结点的权值之和。(约定左子树根权值小)⑶从F中删除这两棵树,另将新二叉树参加F中。⑷重复⑵和⑶,直到F中只包含一棵树为止。此树即为哈夫曼树。5.7哈夫曼树和哈夫曼编码5.7.2哈夫曼树和哈夫曼算法构造哈夫曼树的例子⑴W={1,2,2,6}⑵W={3,5,9,11,12,13}5.7哈夫曼树和哈夫曼编码5.7.2哈夫曼树和哈夫曼算法构造哈夫曼树的过程5.7哈夫曼树和哈夫曼编码5.7.2哈夫曼树和哈夫曼算法⑵W={3,5,9,11,12,13}5.7哈夫曼树和哈夫曼编码5.7.3哈夫曼树类template<classT>classHfmTree:publicBinaryTree<T>{public: operatorT()const{returnweight;} TgetW(){returnweight;} voidputW(constT&x){weight=x;}SetNull(){root=NULL;}private:

Tweight;};5.7哈夫曼树和哈夫曼编码5.7.4构造哈夫曼树HfmTree<T>CreateHfmTree(Tw[],intn)设数组w[]中保存n个元素类型为T的权值,函数返回一棵构造成功的哈夫曼树。5.7哈夫曼树和哈夫曼编码5.7.4构造哈夫曼树函数CreateHfmTree的步骤:首先构造n棵哈夫曼树对象,每棵树只有一个权值为w[i]的根结点,且该对象的weight为w[i],将它们逐一参加优先权队列。从优先权队列中取出两棵根结点值最小和次最小的哈夫曼树x和y。以它们根的权值之和为根的权值,x和y为左、右子树构造一棵新哈夫曼树,并将新树对象进优先权队列。重复执行n-1次,此时,队列中只剩下合并完成的哈夫曼树。从队列中取出构造完毕的哈夫曼树,函数返回该哈夫曼树。5.7哈夫曼树和哈夫曼编码5.7.4构造哈夫曼树template<classT>HfmTree<T>CreateHfmTree(Tw[],intn){PrioQueue<HfmTree<T>>pq(n);//空优先权队列

HfmTree<T>x,y,z,zero;//空哈夫曼树

for(inti=0;i<n;i++){//构造n棵只有一个结点哈树

z.MakeTree(w[i],x,y);z.putW(w[i]);pq.Append(z);z.SetNull(); }5.7哈夫曼树和哈夫曼编码5.7.4构造哈夫曼树for(i=1;i<n;i++){ pq.Serve(x);//取出最小权值的哈树对象xpq.Serve(y);//取出最小权值的哈树对象y

z.MakeTree(x.getW()+y.getW(),x,y); z.putW(x.getW()+y.getW()); pq.Append(z); z.SetNull();}pq.Serve(z);returnz;}5.7哈夫曼树和哈夫曼编码5.7.5哈夫曼编码1.等长编码

A:00,B:01,C:10,D:11.

电文:ABACABDA.编码:译码:两位一个字符。

ASCII编码是等长编码。2.不等长编码

A:0,B:01,C:10,D:101.

电文:ABACABDA.编码:译码:产生二义性。原因:一个字符的编码是另一个字符编码的前缀。前缀编码:一个字符的编码不是另一个字符编码的前缀。5.7哈夫曼树和哈夫曼编码5.7.5哈夫曼编码8442211010011ABCDA:0B:10C:110D:111可以利用哈夫曼树得到前缀编码。

例:字符集S={A,B,C,D},权值W={4,2,1,1}

用权值构造哈夫曼树,约定左分支为0,右分支为1。电文:ABACABDA。

编码:0

10

0

110

0

10

111

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论