算法设计方案与分析的基本方法及技巧.PPT_第1页
算法设计方案与分析的基本方法及技巧.PPT_第2页
算法设计方案与分析的基本方法及技巧.PPT_第3页
算法设计方案与分析的基本方法及技巧.PPT_第4页
算法设计方案与分析的基本方法及技巧.PPT_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章 算法设计与分析的基本方法及技巧,2.1 程序运行时间 2.2 一类递归方程的求解 2.3 分治 2.4 平衡 2.5 贪心法 2.6 动态规则 2.7 回溯,算法(Algorithm):是对特定问题求解步骤的一种描述,它是 指令(规则)的有限序列,其中每一条指令表示一个或多个操作。,算法是在有限步骤内求解某一问题所使用的一组定义明确的规则。通俗点说,就是计算机解题的过程。在这个过程中,无论是形成解题思路还是编写程序,都是在实施某种算法。前者是推理实现的算法,后者是操作实现的算法。,Persian Textbook(波斯教科书)的作者的名字Abu Jafar Mohammed ibn Ms al-Khowrizm (约公元前825年) 从字面上看,这个名字的意思是“Jafar 的父亲,Mohammed 和 Ms 的儿子,Khowrizm 的本地人”。Khowrizm 是前苏联XBA(基发) 的小城镇 。Al-Khowrizm 写了著名的书Kitab al jabr wal-muqabala (复原和化简的规则);,资料:Algorithm与Logarithm 这个词一直到1957年之前在Websters New World Dictionary(韦氏新世界词典)中还未出现,我们只能找到带有它的古代涵义的较老形式的“Algorism”(算术),指的是用阿拉伯数字进行算术运算的过程。在中世纪时,珠算家用算盘进行计算,而算术家用算术进行计算。中世纪之后,对这个词的起源已经拿不准了,早期的语言学家试图推断它的来历,认为它是从把algiros(费力的)+arithmos(数字)组合起来派生而成的,但另一些人则不同意这种说法,认为这个词是从“喀斯迪尔国王Algor”派生而来的。最后,数学史学家发现了algorism(算术)一词的真实起源:它来源于著名的Persian Textbook(波斯教科书)的作者的名字Abu Jafar Mohammed ibn Ms al-Khowrizm (约公元前825年)从字面上看,这个名字的意思是“Jafar 的父亲,Mohammed 和 Ms 的儿子,Khowrizm 的本地人”。Khowrizm 是前苏联XBA(基发) 的小城镇 。Al-Khowrizm 写了著名的书Kitab al jabr wal-muqabala (复原和化简的规则);另一个词,“algebra”(代数),是从他的书的标题引出来的,尽管这本书实际上根本不是讲代数的。 逐渐地,“algorism”的形式和意义就变得面目全非了。如牛津英语字典所说明的,这个词是由于同arithmetic(算术)相混淆而形成的错拼词。由algorism又变成algorithm。一本早期的德文数学词典 Vollstandiges Mathematisches Lexicon (数学大全辞典) ,给出了Algorithmus (算法)一词的如下定义:“在这个名称之下,组合了四种类型的算术计算的概念,即加法、乘法、减法、除法”。拉顶短语algorithmus infinitesimalis (无限小方法) ,在当时就用来表示Leibnitz(莱布尼兹)所发明的以无限小量进行计算的微积分方法。 1950年左右,algorithm一词经常地同欧几里德算法(Euclids algorithm)联系在一起。这个算法就是在欧几里德的几何原本(Euclids Elements ,第VII卷,命题i和ii)中所阐述的求两个数的最大公约数的过程(即辗转相除法)。,递归技术 最常用的算法设计思想,体现于许多优秀算法之中 分治法 分而制之的算法思想,体现了一分为二的哲学思想 模拟法 用计算机模拟实际场景,经常用于与概率有关的问题 贪心算法 采用贪心策略的算法设计 状态空间搜索法 被称为“万能算法”的算法设计策略 随机算法 利用随机选择自适应地决定优先搜索的方向 动态规划 常用的最优化问题解决方法,“好”的算法的标准: 正确性,算法能满足具体问题的需求 可读性,首先方便阅读与交流,其次才是机器执行 健壮性,输入错误时,能作出反应,避免异常出错 效率与低存储量要求,算法的特征: 有穷性、确定性、输入、输出、能行性,对算法“正确性”的要求: 不含语法错误; 对于几组输入数据能得到满足要求的结果; 对精心选择苛刻并带有刁难的数据能得到满足要求的结果; 对于一切合法的输入均得到满足要求的结果;,算法描述: 自然语言;程序设计语言;类语言*;,关于本书采用的类语言描述: 结构类型说明 输入输出约定( cin v , cout v ) new 和 delete 引入引用类型 其他,影响算法执行的因素: 算法实现后所消耗的时间* 算法实现后所占存储空间的大小* 算法是否易读、易移植等等其它问题,影响时间特性的四个因素: 程序运行时输入数据的总量 对源程序编译所需的时间 计算机执行每条指令所需的时间 程序中指令重复执行的次数*,定义 语句频度:语句重复执行的次数,程序运行时间,渐近时间复杂度(时间复杂度)T(n),算法中基本操作重复执行的次数是问题规模n的某个函数 f(n),算法的时间度量记作: T(n)= O( f(n) 它表示随问题规模n的增大,算法执行时间的增长率和 f(n)的增长率相同。,渐近空间复杂度(空间复杂度)S(n),S(n)= O( g(n),运算法则: 设:T1(n)=O( f(n) ),T2(n)=O( g(n) ) 加法规则:T1(n)+T2(n) = O( max f(n), g(n) ) 乘法规则:T1(n) T2(n) = O( f(n) g(n) ),设:,T(x) : 取变量或常量x之值所消耗时间 T(.V): 取变量V之地址所消耗的时间 T(=) : 赋值所消耗时间 T() : 执行基本运算所耗时间 T(call/return):执行函数调用和返回所耗时间 T(par) : 将参数par传给函数所消耗时间,(1) 表达式和赋值语句 exp:=常数 | 变量 | F-name(e1,e2,em) | (exp exp) T(v=exp)=T(.v)+T(=)+T(exp) T(exp exp)=T(exp)+T()+T(exp) T(F-name(e1,e2,em)=T(call/return)+mT(par)+T(F-body) 例: T(c=a+b)=T(.c)+T(=)+T(a)+T(+)+T(b) 相应的汇编程序为: load a in R1 load b in R2 add R2 to R1 load .c in R2 store R1 in R2,通常取O(1),(2) 语句序列 T(s1,s2,sk)=maxT(s1),T(s2),T(sk) (3) 条件语句 T( if (B) s1 else s2)=T(B)+T(else)+maxT(s1),T(s2) 通常取T(B)+T(else)=O(1) T(if(B) s )=O(1)+T(s) (4) Switch语句 设语句s switch(E) case E1: S1; case Ek: Sk; default : Sm T(s)=T(E)+T(Ei)+maxT(s1),T(sk),T(sm) O(1),k i=1,(5) for语句 T( for(i=1;i=n;i+) s ) =(T(s)+T(i=1)+T(i=n)+T(i+)+T(for),O(1),(6) while语句 while(B) s i=0;while(B) s ; i+ 设RT0表示某一次循环开始执行时的绝对时间 关于循环的定时不变式RT为 RT=RT0+(i+1)(T(B)+T(while)+i(T(s)+T(j) 其中:T(while)代表测试循环终止条件所耗时间 T(j)代表跳回循环头所耗时间 可简化成:T(j)=T(while) T(while(B)s)=RT-RT0=(i+1)T(B)+iT(s)+(2i+1)T(while),(7) 函数调用 递归调用:被调用子函数运行时间 非递归调用:求解递归方程 (8) goto语句 goto语句破坏了程序结构 一般对goto语句限制使用 对有条件的goto转移可忽略不计,Void BUBBLE(A) int An; int I,j,temp; for(i=0;i=i+1;j-) O(n-i-1) if(Aj-1Aj) O(n-i-1) 1) O(n(n-1)/2) temp=Aj-1; O(1) O(1) =(n-i-1) =O(n2) Aj-1=Aj; O(1) O(1) Aj=temp; O(1) ,n-2 i=0,举例: s = 0 ; f(n) = 1; T1(n) = O(f(n) = O(1) 常量阶 for ( i=1 ; i = n ; +i ) +x; s += x; f(n) = 3n+1; T2(n) = O(f(n) = O(n) 线性阶 for ( i=1; i=n ; +i ) for( j=1 ; j =n ; +j ) +x ; s += x; f(n) = 3n2+2n+1; T3(n) = O(f(n) = O(n2) 平方阶 for ( i=1; i=n ; +i ) for ( j=1 ; j =n ; +j ) cij = 0; for ( k=1 ; k = n; +k ) cij += aik * bkj ; f(n) = 2n3+3n2+2n+1; T4(n) = O(f(n) = O(n3) 立方阶,举例: Long fact ( int n) if ( n=0 ) | ( n =1 ) return( 1 ); else return( n * fact( n 1 ) ); ,f( n ) = n G T( n ) = O( f( n ) ) = O( n ),int sort(i,j) int i,j; if(i=j) return(xi); else m=(i+j-1)/2; return(merge(sort(i,m),sort(m+1),j); ,这是一个快速排序算法 merge的运行时间正比于n(n是2的幂) 设T(n)是sort最差情况下的运行时间,则,一类递归方程的求解,猜解法: 首先猜出一个解f(n)的形式,令其带有待定参数;在归纳 推理过程中确定待定参数,并利用方程证明T(n) f(n)。 若推理过程能够完成且待定参数能够确定,则求解完毕。 f(n)可以是 O(1) , O(n) , O(nlogn) , O(n2)等等。,猜测1:对参数a,T(n) anlogn,带入n=1,由于anlogn=0 虽然满足T(1) c1,但它与a无关,无法确定a与c1关系。 此猜测失败。,猜测2:T(n)=anlogn+b,当n=1时,只要bc1即可。 当n2时,设对所有的 kn 有 T(k) aklogk+b 令k=n/2 得 T(n/2) a(n/2)log(n/2)+b 带入原式: T(n) 2T(n/2)+c2n2(a(n/2)log(n/2)+b)+c2n =an(logn-1)+c2n+2b =anlogn+b-(an-c2n-b) 只要令an-c2n-b0就有 T(n) anlogn+b 选择ac2+b,使an-c2n-b0得到满足。 使T(n) anlogn+b成立的两个约束是: bc1,ac2+b 取b=c1 , a=c1+c2 是合理的。,一类递归方程的展开式与通解,设T(n)是求解某个问题的时间开销,n使问题的数据量。设计 对此问题列出的递归方程为: T(1)=1 T(n)=aT(n/c)+d(n) n2 其中c是大于等于1的正整数。全部数据被分割成c等分,每分的 数量为n/c。T(n/c)是求解一个子问题的时间开销。aT(n/c)代表求 解a个问题的时间开销。D(n)是任意的函数,方程是严格的等式。 用n/ci代替n得: T(n/ci)=aT(n/ci+1)+d(n/ci), i=1,2,3, T(n)=aT(n/c)+d(n) =a(aT(n/c2)+d(n/c)+d(n)=a2T(n/c2)+ad(n/c)+dn =a2(aT(n/c3)+d(n/c2)+ad(n/c)+d(n) =a3T(n/c3)+a2d(n/c2)+ad(n/c)+d(n) = =ai T(n/ci)+ajd(n/cj),i-1 j=0,倍积函数:若对所有的正整数x,y,有f(xy)=f(x)f(y),则 f 是 正整数上的倍积函数。 若d(n)是倍积函数。则有: d(ck-1)=(d(c)k-1,定理:设a,c是非负常数,n是2的幂,d(n)是倍积函数,则,的齐次解是O(nlogc ),且对特解有如下结论: (1)若ad(c),则特解是O(ak),或O(nlogc ),即特解与齐次解同阶 (2)若ad(c),则特解是O(d(c)k),或O(nlogcd(c)即特解与d同阶 (3)若a=d(c),则特解是齐次解的logcn。,a,a,基本思想:分而治之。将一个规模为n的问题分解为k个规模较小 的子问题,这些子问题互相独立且与原问题相同。递 归地解这些子问题,然后将各子问题的解合并得到原 问题的解。,设问题输入数据A0n-1,函数dac(p,q)求子问题Ap,q的解。 对函数dac的首次调用是dac(0,n-1)。,int dac(int p, int q) if(small(p,q) return(G(p,q); else (m1,mk)=divide(p,q); return(Combine(dac(p,m1),dac(m1+1,m2), ,dac(mk+1,q); ,分治方法与软件设计的模块化方法非常相似。为了解决一个大的问题,可以: 1) 把它分成两个或多个更小的问题; 2) 分别解决每个小问题; 3) 把各小问题的解组合起来,即可得到原问题的解答。 小问题通常与原问题相似,可以递归使用分治策略来解决。,分治(Divide and Conquer ),1、整数乘法,求两个n位数之积,传统方法需要O(n2)次比较运算,运用分治 法可以将运算次数的阶降到O(nlog3) O(n1.59)。,设x和y都是n位数,n是2的幂,将x和y各分成两半,每一半都 是n/2位数,则xy的积可写成:,xy=(a2n/2+b) (c2n/2+d) =ac2n+(ad+bc) 2n/2+bd 也可写成: xy=ac2n+ac+ (a-b) (d-c) +bd) 2n/2+bd,a,b,c,d,x=,y=,int mult(int x, int y,int n) if(n=1) return(x*y); else s=sign(x)*sign(y); x=abs(x); y=abs(y); a=x的左n/2位; b=x的右n/2位; c=y的左n/2位; d=y的右n/2位; v=mult(a,c,n/2); u=mult(a-b,d-c,n/2); w=mult(b,d,n/2); return(s*(v*2n+(u+v+w)*2n/2+w) ,例:设 x=3141, y=5327, 利用分治法求xy,31,41,53,27,x=,y=,x=3141 a=31 b=41 a-b=-10 y=5327 c=53 d=27 d-c=-26 ac=(1643)*, bd=(1107)*, (a-b) (d-c)=(260)* xy=ac104+(ac+(a-b) (d-c)+bd) 102+bd =(1643)*104+(1643)*+(260)*+(1107)* 102+(1107)* =(16732107)*,a=31 a1=3 b1=1 a1-b1=2 c=53 c1=5 d1=3 d1-c1=-2 a1c1=15, b1d1=3, (a1-b1) (d1-c1)=-4 ac=15102+(15+3-4)101+3=1632,b=41 a2=4 b2=1 a2-b2=3 d=27 c2=2 d2=7 d2-c2=5 a2c2=8, b2d2=7, (a2-b2) (d2-c2)=15 bd=8102+(8+7+15)101+7=1107,a-b=10 a3=1 b3=0 a3-b3=1 d-c=26 c3=2 d3=6 d3-c3=4 a3c3=2, b3d3=0, (a3-b3) (d3-c3)=4 (a-b) (d-c)=2102+(2+0+4) 101+0=260,2、求两个矩阵的积,C11=A11B11+A12B21 C12=A11B12+A12B22 C21=A21B11+A22B21 C22=A21B12+A22B22,将A和B分别等分成4个小矩阵,每个元素就是一个(n/2) x(n/2)矩阵,假设用(n/2) (n/2)矩阵的m次相乘和a次相加(减)可以算出Cij, 则递归应用这种算法,对nn矩阵之积的时间开销满足: T(n)2 其中第一项是计算m对(n/2) (n/2)矩阵之积的时间开销,(n/2)2个数 第二项是a次矩阵相加的时间开销。上是可变换成: 4/aT(n)=4m/aT(n/2)+n2 U(n)=4m/aU(n/2)+n2 其中d(n)=n2是倍积函数,只要ma就有4m/ad(c),T(n)=O(nlogm) m=8,a=4,T(n)=O(n3),V.Strassen矩阵,引理2.1 两个22矩阵(元素来自任意的环)之积可以用7次相乘和 18次相加(减)完成。,M1=(A11A12)(B21+B22) M2=(A11+A22)(B11+B22) M3=(A11A21)(b11+B12) M4=(A11+A12)B22 M5=A11(B12-B22) M6=A22(B21B11) M7=(A21+A22)B11,C11=M1+M2-M4+M6 C12=M4+M5 C21=M6+M7 C22=M2M3+M5M7,定理2.2 两个nn的矩阵(元素来自任意的环)之积可用O(nlog7)次 运算完成 证:设n=2k,T(n)是计算两个nn矩阵之积,由引理2.1得 T(n)=7T(n/2)+18(n/2)2,n=2 故有:T(n)=O(nlog7),在对问题进行分割时,应使各子问题的数据量保持相等或尽可能 相等。保持平衡是算法设计的一条基本原则。,例如:常见的是“冒泡”分类算法就是一个不平衡的例子。 在分治时将输入数据a1,a2,an分成很不平衡的数据段: 从左至右扫描a1,a2,an并求出minai,1=i=n;将它与 a1交换位置;对后面的n-1个元素递归地应用此算法。,T(n)=n(n-1)/2=O(n2),考虑平衡:不妨设n是2的幂。将a1,a2,an分成两个子序列: a1,a2,an/2和a(n/2)+1,an。先对每个子序列进行分类,然后 对已分类的子序列进行归并(最多需要n-1次比较),合并成一 个有序序列。,T(n)=O(nlogn),平衡,运用局部最佳策略以求达到全局最佳结果。 给定输入数据为A1,A2,An,对解附有某些约束条件 和表示最佳结果的目标函数,欲求满足约束条件的子集Aik,使 目标函数值达到最大(或最小)。 满足约束条件的任意子集叫做可用解,使给定的目标值达到 最大(或最小)的可用解叫做最佳解。最终目的是求全局最佳解。,Dataset Gready(A, n) LIST A ; int n ; solution = ; for( i = 1; i = n; i+ ) x = select(A); if ( feasible( solution, x ) ) solution = union ( solution , x ) ; return solution ; ,select 对 A 确定一种取值办法;每步对 一个x=Ai作出判断:x是否可以包含在 最佳解中?若x加入局部最佳解时就产生 不可用解,放弃x,另作选择。,union将x和solution结合成新的解向量,并 修改目标函数的值。,贪心法,在贪心算法(greedy method)中采用逐步构造最优解的方法。在每个阶段,都作出一个看上去最优的决策(在一定的标准下)。决策一旦作出,就不可再更改。作出贪婪决策的依据称为贪婪准则(greedy criterion)。,例找零钱 一个小孩买了价值少于1美元的糖,并将1美元的钱交给售货员。售货员希望用数目最少的硬币找给小孩。假设提供了数目不限的面值为2 5美分、1 0美分、5美分、及1美分的硬币。售货员分步骤组成要找的零钱数,每次加入一个硬币。选择硬币时所采用的贪婪准则如下:每一次选择应使零钱数尽量增大。为保证解法的可行性(即:所给的零钱等于要找的零钱数),所选择的硬币不应使零钱总数超过最终所需的数目。 假设需要找给小孩6 7美分,首先入选的是两枚2 5美分的硬币,第三枚入选的不能是2 5美分的硬币,否则硬币的选择将不可行(零钱总数超过6 7美分),第三枚应选择1 0美分的硬币,然后是5美分的,最后加入两个1美分的硬币。,背包问题 设有n个对象和一个背包。对象的重量为wi。背包容量为M(重量)。 若将对象i的一部分xi(0xi1;xi表示重物wi的几分之几)放入背包, 则得增益pixi,其中pi叫做重物wi的增益率。目标:在n个对象中选 取若干对象,将背包装满(所选对象的总重量不超过M),使总增 益最大。,max(pixi) ,1in,约束条件:wixiM 0xi1, pi0, wi0, 1in 满足的任意集合x1,x2,xn就是可用解 使最大的可用解即最佳解,1in,三种贪心策略: (1)局部最大增一策略:即在第i步选过之后第i+1步将当前增益 最大的未选对象装入背包;若该对象太大而溢出背包,则装 入该对象的几分之几。 (2)贪心策略之二:背包容量局部消耗最小策略。即按先轻后重 的顺序来选择对象。 (3)贪心策略之三:消耗单位容量,获取局部最大增益策略。即 按pi/wi非增加的顺序来选择对象。,例:设n=3,M=20,(p1,p2,p3)=(25,24,15),(w1,w2,w3)=(18,15,10),按策略1,对象1的增益率p1最大,取x1=1, 则背包容量尚余M-w1=2;对象2的增益率次 之,但w2=15,不能全部装入,故令x2=2/15,得解2。 按策略2,首先取x3=1,次取x2=2/3,得解3。 按策略3,得解4,这才是最佳解。,Void KnapSack (LIST w ; int m ; LIST ,Pi/wi=(1.4,1.6,1.5),定理2.3 若 p1/w1p2/w2pn/wn 则算法Knapsack对给定的 背包问题生成全局最佳解。 证明见教材P42(略)。,实例: 设有一个背包可以放入的物品的重量为s,现有n件物品,重量分 别为w1, w2, , wn。问能否从这n件物品中选择若干件放入 此背包中,使得放入的重量之和正好为S。 如果存在一种符合上 述要求的选择,则称此背包问题有解(或称其解为真);否则称此 背包问题无解(或称其解为假)。试用递归方法设计求解背包问题 的算法。,enum boolean False, True boolean Kanp( int s, int n ) if ( s = 0 ) return True; if ( s 0 ,当一个问题的解可以看成是以序列判定的结果时,可以用动态 规划方法设计出这类问题的求解算法。,起源于二十世纪五十年代(贝尔曼B.E.Bellman) 属于现代控制理论的一部分 以长远利益为目标的一系列决策 最优化原理,可归结为一个递推公式 又称为对阶段规划,特点体现在多阶段性,动态规划,背包问题的解可以看成是一序列判定的结果,这里必须决定xi(1in)的取值。我们可以用不尽的方式首先做关于x1的判定,然后关于x2,x3,等等.最后产生一个最佳的判定序列x1,x2,xn,使目标函数pixi的值最大。,最佳原理 一个最佳判定序列有这样一个性质:无论该序列是从什么初始 状态开始首次判断的,其后续的判断队首次判断所产生的状态 而言,必构成最佳判定序列。 贪心法与动态规划方法之间的本质区别: 贪心法只生成一个判定序列,而动态规划方法则可能产生许多 判定序列。,maxpixi,1ij,例:(0/1)背包问题用Knap(1,I,y)表示下述0/1背包问题,约束条件:wixiy, xi=0 或 1 ( 1ij),1ij,则0/1背包问题是knap(1,n,M),wiziM-w1 ,pizipixi,2in,2in,2in,设:y1,y2,yn是x1,x2,xn所取0/1值的最佳序列。,若y1=0, y2,y3,yn必构成关于Knap(2,n,M)的最佳序列。不然,y1,y2,yn就不是Knap(1,n,M)的最佳序列。,若y1=1,则y2,y3,yn必是关于knap(2,n,M-w1)的最佳序列,如不然,就会有另一个0/1序列

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论