版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
算法分析与设计
AnalysisandDesignofComputerAlgorithms
第7章随机化算法
RandomizedAlgorithm2023最新整理收集do
something学习要点理解产生伪随机数的算法掌握数值随机化算法的设计思想掌握蒙特卡罗算法的设计思想掌握拉斯维加斯算法的设计思想掌握舍伍德算法的设计思想1.故事:想象自己是神化故事的主人公,你有一张不易懂的地图,上面描述了一处宝藏的藏宝地点。经分析你能确定最有可能的两个地点是藏宝地点,但二者相距甚远。假设你如果已到达其中一处,就立即知道该处是否为藏宝地点。你到达两处之一地点及从其中一处到另一处的距离是5天的行程。进一步假设有一条恶龙,每晚光顾宝藏并从中拿走一部分财宝。假设你取宝藏的方案有两种:引言地点1你地点25天5天5天方案1.花4天的时间计算出准确的藏宝地点,然后出发寻宝,一旦出发不能重新计算方案2.有一个小精灵告诉你地图的秘密,但你必须付给他报酬,相当于龙3晚上拿走的财宝
Prob1.1.1若忽略可能的冒险和出发寻宝的代价,你是否接受小精灵的帮助?显然,应该接受小精灵的帮助,因为你只需给出3晚上被盗窃的财宝量,否则你将失去4晚被盗财宝量。但是,若冒险,你可能做得更好!引言设x是你决定之前当日的宝藏价值,设y是恶龙每晚盗走的宝藏价值,并设x>9y
方案1:4天计算确定地址,行程5天,你得到的宝藏价值为:x-9y
方案2:3y付给精灵,行程5天失去5y,你得到的宝藏价值为:x-8y
方案3:投硬币决定先到一处,失败后到另一处(冒险方案)
一次成功所得:x-5y,机会1/2
二次成功所得:x-10y,机会1/2引言}期望赢利:x-7.5y2.意义 该故事告诉我们:当一个算法面临某种选择时,有时随机选择比耗时做最优选择更好,尤其是当最优选择所花的时间大于随机选择的平均时间的时侯显然,随机化算法只能是期望的时间更有效,但它有可能遭受到最坏的可能性。
3.例子快速排序中的随机划分 不用简单的划分,运行时间在1500-2600ms
用概率的方法划分,运行时间平均为300ms。8皇后问题 系统的方法放置皇后(回溯法)较合适,找出所有92个解O(2n),若只找92个其中的任何一个解可在线性时间内完成O(n)。随机法:随机地放置若干皇后能够改进回溯法,特别是当n较大时判断大整数是否为素数 确定算法无法在可行的时间内判断一个数百位十进制数是否素数,否则密码就不安全。概率算法将有所作为:若能接受一个任意小的错误的概率随机化算法的特点
(1)不可再现性在同一个输入实例上,每次执行结果不尽相同N-皇后问题 随机化算法运行不同次将会找到不同的正确解找一给定合数的非平凡因子 每次运行的结果不尽相同,但确定算法每次运行结果必定相同
(2)分析困难要求有概率论,统计学和数论的知识基本特征 随机决策 在同一实例上执行两次其结果可能不同 在同一实例上执行两次的时间亦可能不太相同分类
Numerical,MonteCarlo,LasVegas,Sherwood.
随机化算法的分类数值随机化算法 随机性被最早用于求数字问题的近似解 例如,求一个系统中队列的平均长度的问题,确定算法很难得到答案随机化算法获得的答案一般是近似的,但通常算法执行的时间越长,精度就越高,误差就越小使用的理由现实世界中的问题在原理上可能就不存在精确解 例如,实验数据本身就是近似的,一个无理数在计算机中只能近似地表示精确解存在但无法在可行的时间内求得 有时答案是以置信区间的形式给出的随机化算法的分类MonteCarlo算法(MC算法)
蒙特卡洛算法1945年由J.VonNeumann进行核武模拟提出的。它是以概率和统计的理论与方法为基础的一种数值计算方法,它是双重近似:一是用概率模型模拟近似的数值计算,二是用伪随机数模拟真正的随机变量的样本。 这里我们指的MC算法是: 若问题只有1个正确的解,而无近似解的可能时使用MC算法 例如,判定问题只有真或假两种可能性,没有近似解 因式分解,我们不能说某数几乎是一个因子特点:MC算法总是给出一个答案,但该答案未必正确,成功(即答案是正确的)的概率正比于算法执行的时间缺点:一般不能有效地确定算法的答案是否正确随机化算法的分类LasVegas算法(LV算法) LV算法绝不返回错误的答案。特点:获得的答案必定正确,但有时它仍根本就找不到答案。和MC算法一样,成功的概率亦随算法执行时间增加而增加。无论输入何种实例,只要算法在该实例上运行足够的次数,则算法失败的概率就任意小。④Sherwood算法
Sherwood算法总是给出正确的答案。 当某些确定算法解决一个特殊问题平均的时间比最坏时间快得多时,我们可以使用Sherwood算法来减少,甚至是消除好的和坏的实例之间的差别。随机化算法的分类随机数随机数在随机化算法设计中扮演着十分重要的角色。在现实计算机上无法产生真正的随机数,因此在随机化算法中使用的随机数都是一定程度上随机的,即伪随机数。线性同余法是产生伪随机数的最常用的方法。由线性同余法产生的随机序列a0,a1,…,an满足其中b
0,c
0,d
m。d称为该随机序列的种子。如何选取该方法中的常数b、c和m直接关系到所产生的随机序列的随机性能。这是随机性理论研究的内容,已超出本书讨论的范围。从直观上看,m应取得充分大,因此可取m为机器大数,另外应取gcd(m,b)=1,因此可取b为一素数。例1:设p是一个素数,a是一个整数满足1≤a<p,a模除p的指数(index)是满足ai≡1(modp)的最小正整数i。它等于集合X={ajmodp|j≥1}的势,即i=|X|。
例如,2模除31的指数等于5:25mod31=1,X={21mod31,22mod31,23mod31,24mod31,25mod31};5模除31的指数是3,即53mod31=1,3模除31的指数是30。由费马(Fermat)定理(ap-1
≡1(modp))可知,a模p的指数总是恰好整除p-1.
例如,设p=31,若a=2,则30÷5=6;若a=5,则30÷3=10。因此,X中的j至多为p-1,由此可得一种在X中随机,均匀和独立地取一个元素的算法。ModularExponent(a,j,p){ //求方幂模s=ajmodp,注意先求aj可能会溢出
s←1; whilej>0do{ if(jisodd)s←s·amodp; a←a2modp; j←jdiv2; } returns;}Draw(a,p){ //在X中随机取一元素
j←uniform(1..p-1); returnModularExponent(a,j,p);//在X中随机取一元素}
伪随机数发生器 在实用中不可能有真正的随机数发生器,多数情况下是用伪随机数发生器代替。 大多数伪随机数发生器是基于一对函数:
S:X→X,
这里X足够大,它是种子的值域
R:X→Y,Y是伪随机数函数的值域
使用S获得种子序列:x0=g,xi=S(xi-1),i>0
然后使用R获得伪随机序列:yi=R(xi),i≥0
该序列必然是周期性的,但只要S和R选的合适,该周期长度会非常长。
TC中可用rand()和srand(time),用GNUC更好数字随机化算法-用随机投点法计算
值
设有一半径为r的圆及其外切四边形。向该正方形随机地投掷n个点。设落入圆内的点数为k。由于所投入的点在正方形上均匀分布,因而所投入的点落入圆内的概率为。所以当n足够大时,k与n之比就逼近这一概率。从而doubleDarts(intn){//用随机投点法计算
值
staticRandomNumberdart;intk=0;for(inti=1;i<=n;i++){doublex=dart.fRandom();doubley=dart.fRandom();if((x*x+y*y)<=1)k++;}return4*k/double(n);}数字随机化算法-计算定积分设f(x)是[0,1]上的连续函数,且0f(x)1。需要计算的积分为,积分I等于图中的面积G。在图所示单位正方形内均匀地作投点试验,则随机点落在曲线下面的概率为假设向单位正方形内随机地投入n个点(xi,yi)。如果有m个点落入G内,则随机点落入G内的概率数字随机化算法-解非线性方程组求解下面的非线性方程组其中,x1,x2,…,xn是实变量,fi是未知量x1,x2,…,xn的非线性实函数。要求确定上述方程组在指定求根范围内的一组解
在指定求根区域D内,选定一个随机点x0作为随机搜索的出发点。在算法的搜索过程中,假设第j步随机搜索得到的随机搜索点为xj。在第j+1步,计算出下一步的随机搜索增量
xj。从当前点xj依
xj得到第j+1步的随机搜索点。当x<
时,取为所求非线性方程组的近似解。否则进行下一步新的随机搜索过程。舍伍德(Sherwood)算法设A是一个确定性算法,当它的输入实例为x时所需的计算时间记为tA(x)。设Xn是算法A的输入规模为n的实例的全体,则当问题的输入规模为n时,算法A所需的平均时间为这显然不能排除存在x∈Xn使得的可能性。希望获得一个随机化算法B,使得对问题的输入规模为n的每一个实例均有这就是舍伍德算法设计的基本思想。当s(n)与tA(n)相比可忽略时,舍伍德算法可获得很好的平均性能。舍伍德(Sherwood)算法复习学过的Sherwood算法:(1)线性时间选择算法(2)快速排序算法有时也会遇到这样的情况,即所给的确定性算法无法直接改造成舍伍德型算法。此时可借助于随机预处理技术,不改变原有的确定性算法,仅对其输入进行随机洗牌,同样可收到舍伍德算法的效果。例如,对于确定性选择算法,可以用下面的洗牌算法shuffle将数组a中元素随机排列,然后用确定性选择算法求解。这样做所收到的效果与舍伍德型算法的效果是一样的。template<classType>voidShuffle(Typea[],intn){//随机洗牌算法
staticRandomNumberrnd;for(inti=0;i<n;i++){intj=rnd.Random(n-i)+i;Swap(a[i],a[j]);}}跳跃表舍伍德型算法的设计思想还可用于设计高效的数据结构。如果用有序链表来表示一个含有n个元素的有序集S,则在最坏情况下,搜索S中一个元素需要
(n)计算时间。提高有序链表效率的一个技巧是在有序链表的部分结点处增设附加指针以提高其搜索性能。在增设附加指针的有序链表中搜索一个元素时,可借助于附加指针跳过链表中若干结点,加快搜索速度。这种增加了向前附加指针的有序链表称为跳跃表。应在跳跃表的哪些结点增加附加指针以及在该结点处应增加多少指针完全采用随机化方法来确定。这使得跳跃表可在O(logn)平均时间内支持关于有序集的搜索、插入和删除等运算。跳跃表在一般情况下,给定一个含有n个元素的有序链表,可以将它改造成一个完全跳跃表,使得每一个k级结点含有k+1个指针,分别跳过2k-1,2k-1-1,…,20-1个中间结点。第i个k级结点安排在跳跃表的位置i2k处,i
0。这样就可以在时间O(logn)内完成集合成员的搜索运算。在一个完全跳跃表中,最高级的结点是
logn级结点。完全跳跃表与完全二叉搜索树的情形非常类似。它虽然可以有效地支持成员搜索运算,但不适应于集合动态变化的情况。集合元素的插入和删除运算会破坏完全跳跃表原有的平衡状态,影响后继元素搜索的效率。跳跃表为了在动态变化中维持跳跃表中附加指针的平衡性,必须使跳跃表中k级结点数维持在总结点数的一定比例范围内。注意到在一个完全跳跃表中,50%的指针是0级指针;25%的指针是1级指针;…;(100/2k+1)%的指针是k级指针。因此,在插入一个元素时,以概率1/2引入一个0级结点,以概率1/4引入一个1级结点,…,以概率1/2k+1引入一个k级结点。另一方面,一个i级结点指向下一个同级或更高级的结点,它所跳过的结点数不再准确地维持在2i-1。经过这样的修改,就可以在插入或删除一个元素时,通过对跳跃表的局部修改来维持其平衡性。跳跃表在一个完全跳跃表中,具有i级指针的结点中有一半同时具有i+1级指针。为了维持跳跃表的平衡性,可以事先确定一个实数0<p<1,并要求在跳跃表中维持在具有i级指针的结点中同时具有i+1级指针的结点所占比例约为p。为此目的,在插入一个新结点时,先将其结点级别初始化为0,然后用随机数生成器反复地产生一个[0,1]间的随机实数q。如果q<p,则使新结点级别增加1,直至q
p。由此产生新结点级别的过程可知,所产生的新结点的级别为0的概率为1-p,级别为1的概率为p(1-p),…,级别为i的概率为pi(1-p)。如此产生的新结点的级别有可能是一个很大的数,甚至远远超过表中元素的个数。为了避免这种情况,用作为新结点级别的上界。其中n是当前跳跃表中结点个数。当前跳跃表中任一结点的级别不超过拉斯维加斯(LasVegas)算法拉斯维加斯算法的一个显著特征是它所作的随机性决策有可能导致算法找不到所需的解。voidobstinate(Objectx,Objecty){//反复调用拉斯维加斯算法LV(x,y),直到找到问题的一个解yboolsuccess=false;while(!success)success=lv(x,y);}设p(x)是对输入x调用拉斯维加斯算法获得问题的一个解的概率。一个正确的拉斯维加斯算法应该对所有输入x均有p(x)>0。设t(x)是算法obstinate找到具体实例x的一个解所需的平均时间,s(x)和e(x)分别是算法对于具体实例x求解成功或求解失败所需的平均时间,则有:解此方程可得:n后问题对于n后问题的任何一个解而言,每一个皇后在棋盘上的位置无任何规律,不具有系统性,而更象是随机放置的。由此容易想到下面的拉斯维加斯算法。在棋盘上相继的各行中随机地放置皇后,并注意使新放置的皇后与已放置的皇后互不攻击,直至n个皇后均已相容地放置好,或已没有下一个皇后的可放置位置时为止。如果将上述随机放置策略与回溯法相结合,可能会获得更好的效果。可以先在棋盘的若干行中随机地放置皇后,然后在后继行中用回溯法继续放置,直至找到一个解或宣告失败。随机放置的皇后越多,后继回溯搜索所需的时间就越少,但失败的概率也就越大。stopVegaspset01.0000262.00--262.0050.503933.8847.2380.39120.046513.0010.20222.11整数因子分解设n>1是一个整数。关于整数n的因子分解问题是找出n的如下形式的唯一分解式:其中,p1<p2<…<pk是k个素数,m1,m2,…,mk是k个正整数。如果n是一个合数,则n必有一个非平凡因子x,1<x<n,使得x可以整除n。给定一个合数n,求n的一个非平凡因子的问题称为整数n的因子分割问题。intSplit(intn){intm=floor(sqrt(double(n)));for(inti=2;i<=m;i++)if(n%i==0)returni;return1;}事实上,算法split(n)是对范围在1~x的所有整数进行了试除而得到范围在1~x2的任一整数的因子分割。Pollard算法在开始时选取0~n-1范围内的随机数,然后递归地由产生无穷序列对于i=2k,以及2k<j2k+1,算法计算出xj-xi与n的最大公因子d=gcd(xj-xi,n)。如果d是n的非平凡因子,则实现对n的一次分割,算法输出n的因子d。voidPollard(intn){//求整数n因子分割的拉斯维加斯算法
RandomNumberrnd;inti=1;intx=rnd.Random(n);//随机整数
inty=x;intk=2;while(true){i++;x=(x*x-1)%n;//intd=gcd(y-x,n);//求n的非平凡因子
if((d>1)&&(d<n))cout<<d<<endl;if(i==k){y=x;k*=2;}}}对Pollard算法更深入的分析可知,执行算法的while循环约次后,Pollard算法会输出n的一个因子p。由于n的最小素因子p
,故Pollard算法可在O(n1/4)时间内找到n的一个素因子。蒙特卡罗(MonteCarlo)算法在实际应用中常会遇到一些问题,不论采用确定性算法或随机化算法都无法保证每次都能得到正确的解答。蒙特卡罗算法则在一般情况下可以保证对问题的所有实例都以高概率给出正确解,但是通常无法判定一个具体解是否正确。设p是一个实数,且1/2<p<1。如果一个蒙特卡罗算法对于问题的任一实例得到正确解的概率不小于p,则称该蒙特卡罗算法是p正确的,且称p-1/2是该算法的优势。如果对于同一实例,蒙特卡罗算法不会给出2个不同的正确解答,则称该蒙特卡罗算法是一致的。有些蒙特卡罗算法除了具有描述问题实例的输入参数外,还具有描述错误解可接受概率的参数。这类算法的计算时间复杂性通常由问题的实例规模以及错误解可接受概率的函数来描述。蒙特卡罗(MonteCarlo)算法对于一个一致的p正确蒙特卡罗算法,要提高获得正确解的概率,只要执行该算法若干次,并选择出现频次最高的解即可。如果重复调用一个一致的(1/2+
)正确的蒙特卡罗算法2m-1次,得到正确解的概率至少为1-
,其中,对于一个解所给问题的蒙特卡罗算法MC(x),如果存在问题实例的子集X使得:(1)当x
X时,MC(x)返回的解是正确的;(2)当x
X时,正确解是y0,但MC(x)返回的解未必是y0。称上述算法MC(x)是偏y0的算法。重复调用一个一致的,p正确偏y0蒙特卡罗算法k次,可得到一个O(1-(1-p)k)正确的蒙特卡罗算法,且所得算法仍是一个一致的偏y0蒙特卡罗算法。主元素问题设T[1:n]是一个含有n个元素的数组。当|{i|T[i]=x}|>n/2时,称元素x是数组T的主元素。template<classType>boolMajority(Type*T,intn){//判定主元素的蒙特卡罗算法
inti=rnd.Random(n)+1;Typex=T[i];//随机选择数组元素
intk=0;for(intj=1;j<=n;j++)if(T[j]==x)k++;return(k>n/2);//k>n/2时T含有主元素}template<classType>boolMajorityMC(Type*T,intn,doublee){//重复调用算法Majorityintk=ceil(log(1/e)/log(2));for(inti=1;i<=k;i++)if(Majority(T,n))returntrue;retur
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 幕墙工程招标文件案例
- 货运三轮车交易协议
- 尿素采购协议合同
- 生产车间承包技术成果成果分配
- 幼儿园应急安全措施保证
- 云计算系统服务合同
- 采购合同的分类介绍
- 招标文件与合同的衔接
- 出行安全我保障
- 采石场石块销售合约
- 心房颤动课件
- 超图软件三维平台技术参数v8c2015r
- 新教材北师大版高中数学选择性必修第一册全册各章节知识点考点重点难点解题规律归纳总结
- 派出所辖区矛盾纠纷风险隐患研判材料
- 2006年度银行业金融机构信息科技风险评价审计要点
- 新视野商务英语视听说(上):第四版教学课件U9
- 十年了停下来思考
- 【论药品犯罪的刑法规制7000字(论文)】
- 基于PLC的校园照明智能控制系统设计毕业设计论文
- 三句半专题教育课件
- 新冠肺炎核酸检测报告英文版翻译模板
评论
0/150
提交评论