数据的组织结构与算法课件_第1页
数据的组织结构与算法课件_第2页
数据的组织结构与算法课件_第3页
数据的组织结构与算法课件_第4页
数据的组织结构与算法课件_第5页
已阅读5页,还剩95页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章数据的组织结构与算法6.1数据结构的基本概念6.2常用的几种数据结构6.3算法6.4程序设计方法1第六章数据的组织结构与算法6.1数据结构的基本概念16.1数据结构的基本概念6.1.1数值计算与非数值计算数据是描述客观事物的数值、字符以及能输入机器且能被处理的各种符号集合。换句话说,数据对客观事物采用计算机能够识别、存贮和处理形式所进行的描述。简言之,数据就是计算机化的信息。数学模型有定量模型和定性模型两类之分,定量模型指的是可以用数值方程表示的一类计算模型,而定性模型则是指非数值性的数据结构,如表、树和图等及其运算。26.1数据结构的基本概念6.1.1数值计算与非数值计算2

数据结构(DataStructure)问题起源于程序设计的发展。第一个8008芯片只有4K的内存,微软的最初成立就是为这个芯片的机器编写BASIC语言,优化在每一处都非常重要。逐渐地,人们注意了数据表示与操作的结构化,把一些确实能够有效解决问题的数据表示和算法总结出来,如表、栈、队、树、图(稍后会介绍这些术语)等被单独抽出研究,而这些方法便形成一门学问,这就是“数据结构”这门学科的来源。6.1.2数据结构的起源3数据结构(DataStructure)问题起源于数据结构有逻辑上的数据结构和物理上的数据结构之分。逻辑上的数据结构反映成分数据之间的逻辑关系。物理上的数据结构反映成分数据在计算机内部的存储安排。6.1.3对数据结构的理解4数据结构有逻辑上的数据结构和物理上的数据结构之分。6.1.1.表示对象/实体及其关系在计算机中的表示。只有对象及其相互关系已存储(表示)在计算机中,才能被进一步处理;2.操作:对对象/实体进行处理、访问。数据结构的一般定义:相互之间存在着一定关系的数据元素的集合及定义在其上的操作(运算)称为数据结构。51.表示51.插入:在数据结构中的指定位置增添新的数据元素2.删除:删去数据结构中指定的数据元素。3.查找:在数据结构中寻找某个特定要求的数据元素。4.排序:(在线性结构中)重新安排数据元素之间的逻辑顺序关系,使之按某个关键字值由小到大或由大到小的次序排列。5.遍历:按某一次序访问数据结构中的每一个数据元素。6.1.4对数据结构中数据元素的操作61.插入:在数据结构中的指定位置增添新的数据元素6.1.4

[例6.1]解一元二次方程ax2+bx+c=0.利用计算机解此方程,第一个问题就是如何在计算机中表示该方程。分析该方程,可知决定方程的是方程的三个系数值:a、b、c,而它们的次序表示它们分别属于那一项,其他符号是为增加可读性而引入的,因此,可用这三个系数的线性排列在计算机中表示该方程。例如:3x2-x+1=0表示为(3,-1,1)x2-3=0表示为(1,0,-3)在数据结构中,将若干个数线性排列的数(元素)称为线性表,因此,一元二次方程ax2+bx+c=0就在计算机中表示为线性表(a,b,c)。解方程实质上是对线性表(a,b,c)进行操作。6.1.5数据结构能解决什么问题7[例6.1]解一元二次方程ax2+bx+c=0.6.定义变量X和一个线性表,如数组intS[3];

S[2],S[1],S[0]可以分别存放三个系数值输入S[2],S[1],S[0]三个系数值输入任意一个值X开始S[2]*X*X+S[1]*X+S[0]<1E-5?输出X结束YESNO8定义变量X和一个线性表,如数组intS[3];

S[2][例6-2]电话号码查询系统设有一个电话号码薄,它记录了N个人的名字和其相应的电话号码,假定按如下形式安排:(a1,b1)(a2,b2)…(ai,bi)其中ai,bi(i=1,2…n)分别表示某人的名字和对应的电话号码。要求设计一个算法,当给定任何一个人的名字时,该算法能够打印出此人的电话号码,如果该电话簿中根本就没有这个人,则该算法也能够报告没有这个人的标志。假定名字和其电话号码逻辑上已安排成N元向量的形式,它的每个元素是一个数对(ai,bi),1≤i≤n。9[例6-2]电话号码查询系统9[例6-3]家族成员的族谱表示一个家族的族谱就构成了一个层次结构,在数据结构中,称为树。图6-2给出了这种族谱关系。10[例6-3]家族成员的族谱表示10一般用示意图表示数据结构。用小圆圈代表数据元素,用小圆圈之间的连线代表小圆圈对应的数据元素具有的关系,如果强调关系的方向性,可用带箭头的线段表示关系。具体地讲,若d1和d2表示两个数据元素,它们具有关系<d1,d2>,则表示为如图6-3所示的结构。

图中表示的只是一个抽象关系,不代表具体意义。对于具体的应用,也可以表示家族关系中的父子关系。例如,<d1,d2>可代表d1是d2的父亲。6.1.6数据结构的图示

11一般用示意图表示数据结构。用小圆圈代表数据元素,用小圆圈之间6.2常用的几种数据结构

根据数据元素之间的关系的不同,将数据结构的逻辑结构分为集合结构、线性结构、树状结构和图结构(图6-4)。

126.2常用的几种数据结构根据数据元素之间的关系的不同,将

集合:数据元素间除了“同属于一个集合”外,别无其它关系。

线性结构:数据元素间存在一个对一个的关系。

树形结构:数据元素间存在一个对多个的关系。

图或网状结构:数据元素间存在多个对多个的关系。6.2常用的几种数据结构13

集合:数据元素间除了“同属于一个集合”外,别无其它关系。61.栈(stack)栈是只能在某一端插入和删除的特殊线性表。进行删除和插入的一端称栈顶,另一堆称栈底。插入一般称为进栈(Push),删除则称为出栈(Pop)。栈也称为后进先出表(LIFO:LastIn,FirstOut)。操作系统中的中断调用及返回就是采用栈结构

6.2.1线性结构141.栈(stack)6.2.1线性结构14队列是限定在一端进行插入,另一端进行删除和特殊线性表。通常把队列的删除和插入分别称为出队和入队。允许出队的一端称为队头,允许入队的一端称为队尾。所有需要进队的数据项,只能从队尾进入,队列中的数据项只能从队头离去。由于总是先入队的元素先出队(先排队的人先买完东西),这种表也称为先进先表(FIFO:FirstIn,FirstOut)表。2.队列15队列是限定在一端进行插入,另一端进行删除和特殊线性表。2.队1.链表是指用一组任意的存储单元来依次存放线性表的数据元素。2.在存储每个结点值的同时,必须存储指示其后继(或前趋)结点的地址(或位置)信息,这个信息称为指针(pointer)或链(link)。如果链表的每一个结点只有一个指针域,则这种链表称为单链表结点结构,如图6-9(a)所示;如果链表的每一个结点有两个指针域,则这种链表称为双链表结点结构。一个指针域指向其前趋结点,一个指针域向其后继结点。如图6-9(b)所示。3.链表161.链表是指用一组任意的存储单元来依次存放线性表的数[例6.4]单循环链表的应用

单循环链表的一个典型例子是约瑟夫环(JosephCircle),其描述如下:编号为1,2,...,n的n个人按顺时针方向围坐一圈,每人持有一个密码(正整数)。现在给定一个随机数m>0,从编号为1的人开始,按顺时针方向1开始顺序报数,报到m时停止。报m的人出圈,同时留下他的密码作为新的m值,从他在顺时针方向上的下一个人开始,重新从1开始报数,如此下去,直至所有的人出列为止。17[例6.4]单循环链表的应用单循环链表的一个典型例当n和m较大时,用人工求解约瑟夫环问题是相当繁琐的。采用单循环链表就容易解决。其基本思路是:n人围成一圈,把一人看成一个结点,n人之间的关系采用链接方式,即每一结点有一个前趋结点和一个后继结点,每一个结点有一个指针指向下一个结点,最后一个结点指针指向第一个结点。这就是单循环链的数据结构。当m人出列时,将m结点的前趋结点指针指向m结点的后继结点指针,即把m结点驱出循环链。18当n和m较大时,用人工求解约瑟夫环问题是相当繁琐的。181.树的定义树是由一个或多个结点组成的有限集合,如图6-12所示。6.2.2树结构

191.树的定义6.2.2树结构19必有一个特定的称为根(ROOT)的结点,根的每个分支称为子树(sub-tree),子树也是一棵树树中的每一个结点都可以不止一个直接后继,结点的后继结点称为该结点的“子结点”(Children)除根结点外的所有结点有且只有一个直接前趋,结点的前趋结点称为该结点的“父结点”(Parent)同一父结点的子结点称为“兄弟”(Sibling)结点下不再有分支的称为树叶(leaf),或者叶子结点树结构的特点20必有一个特定的称为根(ROOT)的结点,根的每个分支称为子树二叉树的特点:树中的每个结点最多只有两棵子树,即树中任何结点的度数不得大于2。二叉树的子树有左右之分,称为左子树和右子树。而且子树的左右次序是重要的,即使在只有一棵子树的情况下,也应分清楚。例如图6-13是两棵不同的二叉树。

2.二叉树21二叉树的特点:树中的每个结点最多只有两棵子树,即树中任何结点所谓遍历二叉树,就是按一定的规则和顺序走遍二叉树的所有结点,使每一个结点都被访问一次,而且只被访问一次。二叉树的遍历可分为先序遍历中序遍历后序遍历

3.二叉树的遍历22所谓遍历二叉树,就是按一定的规则和顺序走遍二叉树的所有结点,1.先序遍历递归算法定义:

若二叉树非空,则依次执行操作:

(1)访问根结点;

(2)遍历左子树;

(3)遍历右子树。ABDGECF

2.中序遍历递归算法定义:

若二叉树非空,则依次执行操作:

(1)遍历左子树;

(2)访问根结点;

(3)遍历右子树。GDBEACF

3.后序遍历递归算法定义:

若二叉树非空,则依次执行操作:

(1)遍历左子树;

(2)遍历右子树;

(3)访问根结点。GDEBFCA231.先序遍历递归算法定义:

若二叉树非空,则依次执行操作:

一个图由有限的顶点(Vertices)和边(Edge)组成,所以可形式化地用G=(V,E)代表一个图。图中的结点称为顶点,顶点之间的连线代表边。6.2.3图结构24一个图由有限的顶点(Vertices)和边(Edge)组成,图(Graph)是由非空的顶点集合和一个描述顶点之间关系――边(或者弧)的集合组成。其形式化定义为:G=(V,E)V={vi|vi∈dataobject}E={(vi,vj)|vi,vj∈V∧P(vi,vj)}其中,G表示一个图,V是图G中顶点的集合,E是图G中边的集合,集合E中P(vi,vj)表示顶点vi和顶点vj之间有一条直接连线,即偶对(vi,vj)表示一条边。6.2.3图结构25图(Graph)是由非空的顶点集合和一个描述顶点之间关系――下图(无向图G1)给出了一个图的示例,在该图中:集合V={v1,v2,v3,v4};集合E={(v1,v3),(v1,v4),(v2,v3),(v2,v4),(V3,V4)}6.2.3图结构26下图(无向图G1)给出了一个图的示例,在该图中:6.2.3如果数据结构中,数据元素之间不考虑关系问题(无前趋/后继之分),则称这种结构为集合。在集合中,各元素是“平等”的,它们的共同关系是:都属于同一个集合。6.2.4集合27如果数据结构中,数据元素之间不考虑关系问题(无前趋/后继之分6.3算法6.3.1算法的特性算法是对问题求解过程的一种描述,是为解决一个或一类问题给出的一个确定的、有限长的操作序列。1.有穷性2.确定性3.可行性4.有输入5.有输出286.3算法6.3.1算法的特性28算法的五个特性(1)有穷性:对任何合法的输入值,一个算法必须总是在执行有穷步之后结束,且每一步都可在有穷时间内完成;(2)确定性:算法中每一条指令必须有确切的含义,不会产生二义性,对于相同的输入只能得出相同的输出。(3)可行性:即算法中描述的操作都可以通过已经实现的基本运算执行有限次来实现的。(4)输入:一个算法有0个或多个输入,这些输入取自于某个特定的数据对象的集合,它可以使用输入语句从外部提供,也可以在算法内通过赋初值给定。(5)输出:一个算法有一个或多个的输出,这些输出是同输入有着某些特定关系的量。29算法的五个特性(1)有穷性:对任何合法的输入值,一个算法必须在设计算法时,通常应考虑以下原则:首先设计的算法必须是“正确的”其次应有很好的“可读性”,还必须具有“健壮性”最后还应考虑所设计算法的复杂性,即有“高效率与低存储量”。6.3.2什么是“好”的算法30在设计算法时,通常应考虑以下原则:6.3.2什么是“好”的算法的正确性所谓算法的正确性,也称可靠性或有效性,是指:程序不含语法错误。程序对于几组输入的数据能够得出满足规格说明要求的结果。程序对于精心选择的典型、苛刻而带有刁难性的几组输入数据能够得出满足规格说明要求的结果。程序对于一切合法的输入数据都能产生满足规格说明要求的结果。31算法的正确性所谓算法的正确性,也称可靠性或有效性,是指:31在算法是正确的前提下,算法的可读性是摆在第一位的。可读性好有助于人们对算法的理解,难懂的程序易隐藏较多错误,难以调试和修改。算法的效率指的是算法执行时计算机资源的消耗,它包括运行时间代价和存储空间代价。算法的健壮性指的是,算法应对非法输入的数据做出恰当反映或进行相应处理。它强调的是,如果输入非法数据时,算法应能加以识别并做出处理,而不是产生误动作或陷入瘫痪。32在算法是正确的前提下,算法的可读性是摆在第一位的。可读性好有算法的复杂性是算法运行所需要的计算机资源的量。算法的复杂性是算法效率的度量,是评价算法优劣的重要依据。算法的复杂性有时间复杂性和空间复杂性之分。需要的时间资源的量,即算法的运行速度,称作时间复杂性。需要的空间(即存储器)资源的量称作空间复杂性。

6.3.3算法复杂性33算法的复杂性是算法运行所需要的计算机资源的量。算法的复杂性是1.自然语言自然语言是人们日常所用的语言,如汉语、英语、德语等。例如,求3个数中最大者的问题,可以描述为:①比较前两个数。②将①中较大的数与第三个数进行比较。③步骤②中较大的数即为所求。6.3.4算法的表示341.自然语言6.3.4算法的表示342.流程图流程图是描述算法的常用工具。它采用美国国家标准化协会ANSI(AmericanNationalStandardInstitute)规定的一组图形符号来表示算法起止框判断框处理框输入/输出框注释框流向线连接点352.流程图起止框判断框处理框输入/输出框注释框流向线连接点33.伪代码伪代码是用介于自然语言和计算机语言之间的文字和符号来描述算法的工具。它不用图形符号,因此书写方便格式紧凑,易于理解,便于向计算机程序设计语言过渡。例:求两个数的较大者,用伪代码描述算法如下:FindthebiggerInput:twonumbers:a,b1.if(thefirstnumberaisgreaterthanorequaltothesecondnumberb)then1.1returnaelse1.2returnbendifend363.伪代码364.计算机程序设计语言一般而言,计算机程序设计语言描述的算法是清晰的、简明的,最终也能由计算机处理的,然而也不是完善无缺。它需要设计者用特定程序设计语言编写的算法,限制了与他人的交流;容易陷入描述计算步骤的细节而忽视算法的本质。374.计算机程序设计语言376.4程序设计方法6.4.1计算机程序的性质计算机程序包含两方面的内容:对象及对象之间关系(数据结构);描述对这些对象进行处理的加工规则(算法)。386.4程序设计方法6.4.1计算机程序的性质38目的性—程序有明确的目的,程序运行时能完成赋予它的功能。分步性—程序为完成其复杂的功能,由一系列计算机可执行的步骤组成。有序性—程序的执行步骤是有序的,不可随意改变程序步骤的执行顺序。有限性—程序是有限的指令序列,程序所包含的步骤是有限的。操作性—有意义的程序总是对某些对象进行操作,使其改变状态,完成其功能。计算机程序具有以下性质:

39计算机程序具有以下性质:39数据结构是数据构造的逻辑表示形式,算法是处理问题的方法和步骤,最后问题的解由计算机程序给出。这是程序员在程序设计时应考虑的主要问题。6.4.2程序设计与数据结构、算法之间的关系40数据结构是数据构造的逻辑表示形式,算法是处理问题的方法和步骤1.程序的控制结构一个可以用顺序、选择、循环和跳转(如goto语句)四种程序结构解决的问题,也一定能用顺序、选择、循环三种程序结构解决。但确实存在这样的问题,它可以用顺序、选择、循环三种程序结构解决,但不能用其中任何两种解决。换句话说,顺序、选择、循环三种程序结构构成了一个最小完备集。我们将这三种程序结构叫基本程序结构。6.4.3结构化程序设计

411.程序的控制结构6.4.3结构化程序设计41三种基本结构的图示:顺序结构选择结构42三种基本结构的图示:顺序结构选择结构42循环结构的图示:当型(While型)循环结构

直到型(Until型)循环43循环结构的图示:当型(While型)循环结构直到型(Unt顺序程序设计44顺序程序设计44分支结构45分支结构45循环结构46循环结构462.结构化程序设计方法结构化程序设计方法主要包括程序结构的自顶向下和模块化设计方法。472.结构化程序设计方法47程序设计的一般步骤如下:

1.分析问题对要解决的问题,首先必须分析清楚,明确题目的要求,列出所有已知量,找出题目的求解范围、解的精度等。2.建立数学模型对实际问题进行分析之后,找出它的内在规律,就可以建立数学模型。只有建立了模型的问题,才能可能利用计算机来解决。3.确定算法建立数学模型后,还不能着手编程序,必须根据数据结构,确定解决问题的算法。一般确定算法要注意:算法的逻辑结构尽可能简单;算法所要求的存贮量应尽可能少;在满足题目条件要求下,使所需的计算量最小。6.4.4程序设计的步骤48程序设计的一般步骤如下:6.4.4程序设计的步骤48

4.编写程序把整个程序看作一个整体,先全局后局部,自顶向下,一层一层分解处理,如果某些子问题的算法相同而仅参数不同,可以用子程序来表示。5.调试运行;

6.分析结果;

7.写出程序的文档主要是对程序中的变量、函数或过程作必要的说明,解释编程思路,需要时给出程序流程图,并讨论运行结果。494.编写程序49生活中的辛苦阻挠不了我对生活的热爱。12月-2212月-22Thursday,December29,2022人生得意须尽欢,莫使金樽空对月。14:05:2614:05:2614:0512/29/20222:05:26PM做一枚螺丝钉,那里需要那里上。12月-2214:05:2614:05Dec-2229-Dec-22日复一日的努力只为成就美好的明天。14:05:2614:05:2614:05Thursday,December29,2022安全放在第一位,防微杜渐。12月-2212月-2214:05:2614:05:26December29,2022加强自身建设,增强个人的休养。2022年12月29日2:05下午12月-2212月-22精益求精,追求卓越,因为相信而伟大。29十二月20222:05:26下午14:05:2612月-22让自己更加强大,更加专业,这才能让自己更好。十二月222:05下午12月-2214:05December29,2022这些年的努力就为了得到相应的回报。2022/12/2914:05:2614:05:2629December2022科学,你是国力的灵魂;同时又是社会发展的标志。2:05:26下午2:05下午14:05:2612月-22每天都是美好的一天,新的一天开启。12月-2212月-2214:0514:05:2614:05:26Dec-22相信命运,让自己成长,慢慢的长大。2022/12/2914:05:26Thursday,December29,2022爱情,亲情,友情,让人无法割舍。12月-222022/12/2914:05:2612月-22谢谢大家!生活中的辛苦阻挠不了我对生活的热爱。12月-2212月-22第六章数据的组织结构与算法6.1数据结构的基本概念6.2常用的几种数据结构6.3算法6.4程序设计方法51第六章数据的组织结构与算法6.1数据结构的基本概念16.1数据结构的基本概念6.1.1数值计算与非数值计算数据是描述客观事物的数值、字符以及能输入机器且能被处理的各种符号集合。换句话说,数据对客观事物采用计算机能够识别、存贮和处理形式所进行的描述。简言之,数据就是计算机化的信息。数学模型有定量模型和定性模型两类之分,定量模型指的是可以用数值方程表示的一类计算模型,而定性模型则是指非数值性的数据结构,如表、树和图等及其运算。526.1数据结构的基本概念6.1.1数值计算与非数值计算2

数据结构(DataStructure)问题起源于程序设计的发展。第一个8008芯片只有4K的内存,微软的最初成立就是为这个芯片的机器编写BASIC语言,优化在每一处都非常重要。逐渐地,人们注意了数据表示与操作的结构化,把一些确实能够有效解决问题的数据表示和算法总结出来,如表、栈、队、树、图(稍后会介绍这些术语)等被单独抽出研究,而这些方法便形成一门学问,这就是“数据结构”这门学科的来源。6.1.2数据结构的起源53数据结构(DataStructure)问题起源于数据结构有逻辑上的数据结构和物理上的数据结构之分。逻辑上的数据结构反映成分数据之间的逻辑关系。物理上的数据结构反映成分数据在计算机内部的存储安排。6.1.3对数据结构的理解54数据结构有逻辑上的数据结构和物理上的数据结构之分。6.1.1.表示对象/实体及其关系在计算机中的表示。只有对象及其相互关系已存储(表示)在计算机中,才能被进一步处理;2.操作:对对象/实体进行处理、访问。数据结构的一般定义:相互之间存在着一定关系的数据元素的集合及定义在其上的操作(运算)称为数据结构。551.表示51.插入:在数据结构中的指定位置增添新的数据元素2.删除:删去数据结构中指定的数据元素。3.查找:在数据结构中寻找某个特定要求的数据元素。4.排序:(在线性结构中)重新安排数据元素之间的逻辑顺序关系,使之按某个关键字值由小到大或由大到小的次序排列。5.遍历:按某一次序访问数据结构中的每一个数据元素。6.1.4对数据结构中数据元素的操作561.插入:在数据结构中的指定位置增添新的数据元素6.1.4

[例6.1]解一元二次方程ax2+bx+c=0.利用计算机解此方程,第一个问题就是如何在计算机中表示该方程。分析该方程,可知决定方程的是方程的三个系数值:a、b、c,而它们的次序表示它们分别属于那一项,其他符号是为增加可读性而引入的,因此,可用这三个系数的线性排列在计算机中表示该方程。例如:3x2-x+1=0表示为(3,-1,1)x2-3=0表示为(1,0,-3)在数据结构中,将若干个数线性排列的数(元素)称为线性表,因此,一元二次方程ax2+bx+c=0就在计算机中表示为线性表(a,b,c)。解方程实质上是对线性表(a,b,c)进行操作。6.1.5数据结构能解决什么问题57[例6.1]解一元二次方程ax2+bx+c=0.6.定义变量X和一个线性表,如数组intS[3];

S[2],S[1],S[0]可以分别存放三个系数值输入S[2],S[1],S[0]三个系数值输入任意一个值X开始S[2]*X*X+S[1]*X+S[0]<1E-5?输出X结束YESNO58定义变量X和一个线性表,如数组intS[3];

S[2][例6-2]电话号码查询系统设有一个电话号码薄,它记录了N个人的名字和其相应的电话号码,假定按如下形式安排:(a1,b1)(a2,b2)…(ai,bi)其中ai,bi(i=1,2…n)分别表示某人的名字和对应的电话号码。要求设计一个算法,当给定任何一个人的名字时,该算法能够打印出此人的电话号码,如果该电话簿中根本就没有这个人,则该算法也能够报告没有这个人的标志。假定名字和其电话号码逻辑上已安排成N元向量的形式,它的每个元素是一个数对(ai,bi),1≤i≤n。59[例6-2]电话号码查询系统9[例6-3]家族成员的族谱表示一个家族的族谱就构成了一个层次结构,在数据结构中,称为树。图6-2给出了这种族谱关系。60[例6-3]家族成员的族谱表示10一般用示意图表示数据结构。用小圆圈代表数据元素,用小圆圈之间的连线代表小圆圈对应的数据元素具有的关系,如果强调关系的方向性,可用带箭头的线段表示关系。具体地讲,若d1和d2表示两个数据元素,它们具有关系<d1,d2>,则表示为如图6-3所示的结构。

图中表示的只是一个抽象关系,不代表具体意义。对于具体的应用,也可以表示家族关系中的父子关系。例如,<d1,d2>可代表d1是d2的父亲。6.1.6数据结构的图示

61一般用示意图表示数据结构。用小圆圈代表数据元素,用小圆圈之间6.2常用的几种数据结构

根据数据元素之间的关系的不同,将数据结构的逻辑结构分为集合结构、线性结构、树状结构和图结构(图6-4)。

626.2常用的几种数据结构根据数据元素之间的关系的不同,将

集合:数据元素间除了“同属于一个集合”外,别无其它关系。

线性结构:数据元素间存在一个对一个的关系。

树形结构:数据元素间存在一个对多个的关系。

图或网状结构:数据元素间存在多个对多个的关系。6.2常用的几种数据结构63

集合:数据元素间除了“同属于一个集合”外,别无其它关系。61.栈(stack)栈是只能在某一端插入和删除的特殊线性表。进行删除和插入的一端称栈顶,另一堆称栈底。插入一般称为进栈(Push),删除则称为出栈(Pop)。栈也称为后进先出表(LIFO:LastIn,FirstOut)。操作系统中的中断调用及返回就是采用栈结构

6.2.1线性结构641.栈(stack)6.2.1线性结构14队列是限定在一端进行插入,另一端进行删除和特殊线性表。通常把队列的删除和插入分别称为出队和入队。允许出队的一端称为队头,允许入队的一端称为队尾。所有需要进队的数据项,只能从队尾进入,队列中的数据项只能从队头离去。由于总是先入队的元素先出队(先排队的人先买完东西),这种表也称为先进先表(FIFO:FirstIn,FirstOut)表。2.队列65队列是限定在一端进行插入,另一端进行删除和特殊线性表。2.队1.链表是指用一组任意的存储单元来依次存放线性表的数据元素。2.在存储每个结点值的同时,必须存储指示其后继(或前趋)结点的地址(或位置)信息,这个信息称为指针(pointer)或链(link)。如果链表的每一个结点只有一个指针域,则这种链表称为单链表结点结构,如图6-9(a)所示;如果链表的每一个结点有两个指针域,则这种链表称为双链表结点结构。一个指针域指向其前趋结点,一个指针域向其后继结点。如图6-9(b)所示。3.链表661.链表是指用一组任意的存储单元来依次存放线性表的数[例6.4]单循环链表的应用

单循环链表的一个典型例子是约瑟夫环(JosephCircle),其描述如下:编号为1,2,...,n的n个人按顺时针方向围坐一圈,每人持有一个密码(正整数)。现在给定一个随机数m>0,从编号为1的人开始,按顺时针方向1开始顺序报数,报到m时停止。报m的人出圈,同时留下他的密码作为新的m值,从他在顺时针方向上的下一个人开始,重新从1开始报数,如此下去,直至所有的人出列为止。67[例6.4]单循环链表的应用单循环链表的一个典型例当n和m较大时,用人工求解约瑟夫环问题是相当繁琐的。采用单循环链表就容易解决。其基本思路是:n人围成一圈,把一人看成一个结点,n人之间的关系采用链接方式,即每一结点有一个前趋结点和一个后继结点,每一个结点有一个指针指向下一个结点,最后一个结点指针指向第一个结点。这就是单循环链的数据结构。当m人出列时,将m结点的前趋结点指针指向m结点的后继结点指针,即把m结点驱出循环链。68当n和m较大时,用人工求解约瑟夫环问题是相当繁琐的。181.树的定义树是由一个或多个结点组成的有限集合,如图6-12所示。6.2.2树结构

691.树的定义6.2.2树结构19必有一个特定的称为根(ROOT)的结点,根的每个分支称为子树(sub-tree),子树也是一棵树树中的每一个结点都可以不止一个直接后继,结点的后继结点称为该结点的“子结点”(Children)除根结点外的所有结点有且只有一个直接前趋,结点的前趋结点称为该结点的“父结点”(Parent)同一父结点的子结点称为“兄弟”(Sibling)结点下不再有分支的称为树叶(leaf),或者叶子结点树结构的特点70必有一个特定的称为根(ROOT)的结点,根的每个分支称为子树二叉树的特点:树中的每个结点最多只有两棵子树,即树中任何结点的度数不得大于2。二叉树的子树有左右之分,称为左子树和右子树。而且子树的左右次序是重要的,即使在只有一棵子树的情况下,也应分清楚。例如图6-13是两棵不同的二叉树。

2.二叉树71二叉树的特点:树中的每个结点最多只有两棵子树,即树中任何结点所谓遍历二叉树,就是按一定的规则和顺序走遍二叉树的所有结点,使每一个结点都被访问一次,而且只被访问一次。二叉树的遍历可分为先序遍历中序遍历后序遍历

3.二叉树的遍历72所谓遍历二叉树,就是按一定的规则和顺序走遍二叉树的所有结点,1.先序遍历递归算法定义:

若二叉树非空,则依次执行操作:

(1)访问根结点;

(2)遍历左子树;

(3)遍历右子树。ABDGECF

2.中序遍历递归算法定义:

若二叉树非空,则依次执行操作:

(1)遍历左子树;

(2)访问根结点;

(3)遍历右子树。GDBEACF

3.后序遍历递归算法定义:

若二叉树非空,则依次执行操作:

(1)遍历左子树;

(2)遍历右子树;

(3)访问根结点。GDEBFCA731.先序遍历递归算法定义:

若二叉树非空,则依次执行操作:

一个图由有限的顶点(Vertices)和边(Edge)组成,所以可形式化地用G=(V,E)代表一个图。图中的结点称为顶点,顶点之间的连线代表边。6.2.3图结构74一个图由有限的顶点(Vertices)和边(Edge)组成,图(Graph)是由非空的顶点集合和一个描述顶点之间关系――边(或者弧)的集合组成。其形式化定义为:G=(V,E)V={vi|vi∈dataobject}E={(vi,vj)|vi,vj∈V∧P(vi,vj)}其中,G表示一个图,V是图G中顶点的集合,E是图G中边的集合,集合E中P(vi,vj)表示顶点vi和顶点vj之间有一条直接连线,即偶对(vi,vj)表示一条边。6.2.3图结构75图(Graph)是由非空的顶点集合和一个描述顶点之间关系――下图(无向图G1)给出了一个图的示例,在该图中:集合V={v1,v2,v3,v4};集合E={(v1,v3),(v1,v4),(v2,v3),(v2,v4),(V3,V4)}6.2.3图结构76下图(无向图G1)给出了一个图的示例,在该图中:6.2.3如果数据结构中,数据元素之间不考虑关系问题(无前趋/后继之分),则称这种结构为集合。在集合中,各元素是“平等”的,它们的共同关系是:都属于同一个集合。6.2.4集合77如果数据结构中,数据元素之间不考虑关系问题(无前趋/后继之分6.3算法6.3.1算法的特性算法是对问题求解过程的一种描述,是为解决一个或一类问题给出的一个确定的、有限长的操作序列。1.有穷性2.确定性3.可行性4.有输入5.有输出786.3算法6.3.1算法的特性28算法的五个特性(1)有穷性:对任何合法的输入值,一个算法必须总是在执行有穷步之后结束,且每一步都可在有穷时间内完成;(2)确定性:算法中每一条指令必须有确切的含义,不会产生二义性,对于相同的输入只能得出相同的输出。(3)可行性:即算法中描述的操作都可以通过已经实现的基本运算执行有限次来实现的。(4)输入:一个算法有0个或多个输入,这些输入取自于某个特定的数据对象的集合,它可以使用输入语句从外部提供,也可以在算法内通过赋初值给定。(5)输出:一个算法有一个或多个的输出,这些输出是同输入有着某些特定关系的量。79算法的五个特性(1)有穷性:对任何合法的输入值,一个算法必须在设计算法时,通常应考虑以下原则:首先设计的算法必须是“正确的”其次应有很好的“可读性”,还必须具有“健壮性”最后还应考虑所设计算法的复杂性,即有“高效率与低存储量”。6.3.2什么是“好”的算法80在设计算法时,通常应考虑以下原则:6.3.2什么是“好”的算法的正确性所谓算法的正确性,也称可靠性或有效性,是指:程序不含语法错误。程序对于几组输入的数据能够得出满足规格说明要求的结果。程序对于精心选择的典型、苛刻而带有刁难性的几组输入数据能够得出满足规格说明要求的结果。程序对于一切合法的输入数据都能产生满足规格说明要求的结果。81算法的正确性所谓算法的正确性,也称可靠性或有效性,是指:31在算法是正确的前提下,算法的可读性是摆在第一位的。可读性好有助于人们对算法的理解,难懂的程序易隐藏较多错误,难以调试和修改。算法的效率指的是算法执行时计算机资源的消耗,它包括运行时间代价和存储空间代价。算法的健壮性指的是,算法应对非法输入的数据做出恰当反映或进行相应处理。它强调的是,如果输入非法数据时,算法应能加以识别并做出处理,而不是产生误动作或陷入瘫痪。82在算法是正确的前提下,算法的可读性是摆在第一位的。可读性好有算法的复杂性是算法运行所需要的计算机资源的量。算法的复杂性是算法效率的度量,是评价算法优劣的重要依据。算法的复杂性有时间复杂性和空间复杂性之分。需要的时间资源的量,即算法的运行速度,称作时间复杂性。需要的空间(即存储器)资源的量称作空间复杂性。

6.3.3算法复杂性83算法的复杂性是算法运行所需要的计算机资源的量。算法的复杂性是1.自然语言自然语言是人们日常所用的语言,如汉语、英语、德语等。例如,求3个数中最大者的问题,可以描述为:①比较前两个数。②将①中较大的数与第三个数进行比较。③步骤②中较大的数即为所求。6.3.4算法的表示841.自然语言6.3.4算法的表示342.流程图流程图是描述算法的常用工具。它采用美国国家标准化协会ANSI(AmericanNationalStandardInstitute)规定的一组图形符号来表示算法起止框判断框处理框输入/输出框注释框流向线连接点852.流程图起止框判断框处理框输入/输出框注释框流向线连接点33.伪代码伪代码是用介于自然语言和计算机语言之间的文字和符号来描述算法的工具。它不用图形符号,因此书写方便格式紧凑,易于理解,便于向计算机程序设计语言过渡。例:求两个数的较大者,用伪代码描述算法如下:FindthebiggerInput:twonumbers:a,b1.if(thefirstnumberaisgreaterthanorequaltothesecondnumberb)then1.1returnaelse1.2returnbendifend863.伪代码364.计算机程序设计语言一般而言,计算机程序设计语言描述的算法是清晰的、简明的,最终也能由计算机处理的,然而也不是完善无缺。它需要设计者用特定程序设计语言编写的算法,限制了与他人的交流;容易陷入描述计算步骤的细节而忽视算法的本质。874.计算机程序设计语言376.4程序设计方法6.4.1计算机程序的性质计算机程序包含两方面的内容:对象及对象之间关系(数据结构);描述对这些对象进行处理的加工规则(算法)。886.4程序设计方法6.4.1计算机程序的性质38目的性—程序有明确的目的,程序运行时能完成赋予它的功能。分步性—程序为完成其复杂的功能,由一系列计算机可执行的步骤组成。有序性—程序的执行步骤是有序的,不可随意改变程序步骤的执行顺序。有限性—程序是有限的指令序列,程序所包含的步骤是有限的。操作性—有意义的程序总是对某些对象进行操作,使其改变状态,完成其功能。计算机程序具有以下性质:

89计算机程序具有以下性质:39数据结

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论