版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章超越经典的搜索第四章超越经典的搜索2015年1月湖南大学信息科学与工程学院内容提要局部搜索算法不确定动作的搜索使用部分可观察信息的搜索联机搜索内容提要局部搜索算法2局部搜索算法在许多最优化问题中,我们不是要寻找到达目标状态的路径,而是找到目标状态本身。N皇后问题:局部搜索算法在许多最优化问题中,我们不是要寻找到达目标状态的3局部搜索算法局部搜索算法:从单个当前结点出发,通常只移动到它的邻近状态而不保留搜索路径优点:很少的内存能在很大的或者无限的状态空间中找到合理的解局部搜索算法局部搜索算法:从单个当前结点出发,通常只移动到它4爬山法爬山法5爬山法缺点?依据初始状态,得到局部最大值爬山法缺点?6爬山法h=直接或者间接相互攻击的皇后对数h=17(左图)h=1(右图)局部极小值爬山法h=直接或者间接相互攻击的皇后对数局部极小值7模拟退火搜索爬山法不完备,随机法效率低,考虑结合两者产生了模拟退火搜索基本思想:允许算法向坏的方向移动以摆脱局部最大值,但这种移动随着时间的推移概率逐步下降模拟退火搜索爬山法不完备,随机法效率低,考虑结合两者产生了模8模拟退火搜索如果时间下降得足够的慢,那么模拟退火算法找到一个全局最优值的概率接近于1模拟退火搜索如果时间下降得足够的慢,那么模拟退火算法找到一个9局部束搜索随机产生k个状态,然后每一步从所有的后继状态中选择k个最佳的后继状态直到找到目标状态。(内存中保留K个状态)随机束搜索:不是找到k个最佳,而是随机找到k个后继状态,随机概率与状态值成正比。局部束搜索随机产生k个状态,然后每一步从所有的后继状态中选择10遗传算法一个后继状态由两个父状态决定以k个随机产生的状态开始(population)一个状态表示成一个字符串定义一个健康度量函数用来评价状态的好坏程度通过选择,交叉,突变的操作产生下一轮状态遗传算法一个后继状态由两个父状态决定11遗传算法健康度量函数:非冲突的皇后数量(min=0,max=8×7/2=28)24/(24+23+20+11)=31%,23/(24+23+20+11)=29%遗传算法健康度量函数:非冲突的皇后数量(min=0,12遗传算法样本被选择繁衍后代的概率正比于它的健康度函数值发生交叉操作的概率需要预先设定,交叉位置随机产生发生突变操作的概率需要预先设定,通常远小于交叉概率遗传算法样本被选择繁衍后代的概率正比于它的健康度函数值发生交13使用不确定性动作的搜索环境是完全可观察的和确定的可以知道任何动作序列之后达到的状态环境是部分可观察或者是不确定的无法准确预知未来状态需根据未来感知信息制定相应的行为
使用不确定性动作的搜索环境是完全可观察的和确定的14使用不确定性动作的搜索例子:真空洗尘器世界的不稳定行为在一块脏区域洗尘可以使该区域干净,有时也会清洁邻近区域在干净区域洗尘可能是该区域弄脏Suckwhenstate=1Ifstate=5then[right,suck]Elsedononthing使用不确定性动作的搜索例子:真空洗尘器世界的不稳定行为15与或搜索树或结点必须选择行动在用圆圈表示的与结点上必须处理所有后继解用粗黑线标出Q:LOOP什么意思?与或搜索树或结点必须选择行动Q:LOOP什么意思?16无观察信息的搜索Agent感知不到任何信息,称为无传感问题,也称相容问题无传感问题是可解的还是无解的?可解!真空吸尘器世界无传感问题的可解性:初始状态:{1,2,3,4,5,6,7,8}“向右”操作后:{2,4,6,8}“洗尘”操作后{4,8}“向左”操作后{1,7}“洗尘”操作后目标状态{7}在信念状态解无观察信息的问题无观察信息的搜索Agent感知不到任何信息,称为无传感问题17无观察信息的搜索无观察信息问题P的定义信念状态:包含物理状态中每个可能的集合,假定N个物理状态,最多有2N个信念状态初始状态:所有物理状态的集合行动:转移模型:对于确定行动对于不确定行动目标测试:信念状态中的所有物理状态都满足目标状态路径开销:假定所有状态下一个行动的开销相同无观察信息的搜索无观察信息问题P的定义18无观察信息的搜索256个可能的信念状态只有12个可达;初始状态出发的行动序列{S,L,S}与{R,L,S}达到相同的信念状态{5,7}如果一个行动序列是信念状态b的解,那么它也是b的任何子集的解无观察信息的搜索256个可能的信念状态只有12个可达;19部分可观察信息的搜索真空吸尘器世界问题的局部感知:位置传感器和局部垃圾传感器例如:状态1的可观察信息percept(s)=[A,dirty]一个信念状态到另一个信念状态的特定行动分三阶段发生:预测阶段:给定信念状态b和行动a,预测信念状态观察预测阶段:确定预测信念状态中可观察到的感知信息o:
更新阶段:根据每个可能的感知信息得到信念状态
部分可观察信息的搜索真空吸尘器世界问题的局部感知:20部分可观察信息的搜索部分可观察信息的搜索21部分可观察信息的搜索[Suck,Right,ifBstate={6}thenSuckelse[]]部分可观察信息的搜索[Suck,Right,ifBstat22部分可观察信息的搜索部分可观察信息的搜索23部分可观察信息的搜索部分可观察环境中的问题求解Agent形式化,搜索算法,执行解行动解是一个条件规划不是一个序列if-then-elseAgent在完成行动和接收感知信息时维护自身的信念状态部分可观察信息的搜索部分可观察环境中的问题求解Agent24部分可观察信息的搜索UPDATE(PREDICT(UPDATE(b,NSW),Move),NS)部分可观察信息的搜索UPDATE(PREDICT(UPDAT25联机搜索Agent脱机搜索算法:在行动之间计算好完整的解决方案联机搜索算法:行动,观察环境,下一步行动联机搜索Agent脱机搜索算法:在行动之间计算好完整的解决方26联机搜索Agent:竞争比竞争比=实际代价/最小代价30/20=1.5竞争比越小越好竞争比可以是无穷大,比如达到某些状态后无法达到目标状态(活动不可逆)可安全探索的状态空间:每个可达到的状态出发都有达到目标状态的行动,如迷宫问题,八数码问题联机搜索Agent:竞争比竞争比=实际代价/最小代价27总结局部搜索算法不确定动作的搜索使用部分可观察信息的搜索联机搜索总结局部搜索算法28Qa?
Qa?
第四章超越经典的搜索第四章超越经典的搜索2015年1月湖南大学信息科学与工程学院内容提要局部搜索算法不确定动作的搜索使用部分可观察信息的搜索联机搜索内容提要局部搜索算法31局部搜索算法在许多最优化问题中,我们不是要寻找到达目标状态的路径,而是找到目标状态本身。N皇后问题:局部搜索算法在许多最优化问题中,我们不是要寻找到达目标状态的32局部搜索算法局部搜索算法:从单个当前结点出发,通常只移动到它的邻近状态而不保留搜索路径优点:很少的内存能在很大的或者无限的状态空间中找到合理的解局部搜索算法局部搜索算法:从单个当前结点出发,通常只移动到它33爬山法爬山法34爬山法缺点?依据初始状态,得到局部最大值爬山法缺点?35爬山法h=直接或者间接相互攻击的皇后对数h=17(左图)h=1(右图)局部极小值爬山法h=直接或者间接相互攻击的皇后对数局部极小值36模拟退火搜索爬山法不完备,随机法效率低,考虑结合两者产生了模拟退火搜索基本思想:允许算法向坏的方向移动以摆脱局部最大值,但这种移动随着时间的推移概率逐步下降模拟退火搜索爬山法不完备,随机法效率低,考虑结合两者产生了模37模拟退火搜索如果时间下降得足够的慢,那么模拟退火算法找到一个全局最优值的概率接近于1模拟退火搜索如果时间下降得足够的慢,那么模拟退火算法找到一个38局部束搜索随机产生k个状态,然后每一步从所有的后继状态中选择k个最佳的后继状态直到找到目标状态。(内存中保留K个状态)随机束搜索:不是找到k个最佳,而是随机找到k个后继状态,随机概率与状态值成正比。局部束搜索随机产生k个状态,然后每一步从所有的后继状态中选择39遗传算法一个后继状态由两个父状态决定以k个随机产生的状态开始(population)一个状态表示成一个字符串定义一个健康度量函数用来评价状态的好坏程度通过选择,交叉,突变的操作产生下一轮状态遗传算法一个后继状态由两个父状态决定40遗传算法健康度量函数:非冲突的皇后数量(min=0,max=8×7/2=28)24/(24+23+20+11)=31%,23/(24+23+20+11)=29%遗传算法健康度量函数:非冲突的皇后数量(min=0,41遗传算法样本被选择繁衍后代的概率正比于它的健康度函数值发生交叉操作的概率需要预先设定,交叉位置随机产生发生突变操作的概率需要预先设定,通常远小于交叉概率遗传算法样本被选择繁衍后代的概率正比于它的健康度函数值发生交42使用不确定性动作的搜索环境是完全可观察的和确定的可以知道任何动作序列之后达到的状态环境是部分可观察或者是不确定的无法准确预知未来状态需根据未来感知信息制定相应的行为
使用不确定性动作的搜索环境是完全可观察的和确定的43使用不确定性动作的搜索例子:真空洗尘器世界的不稳定行为在一块脏区域洗尘可以使该区域干净,有时也会清洁邻近区域在干净区域洗尘可能是该区域弄脏Suckwhenstate=1Ifstate=5then[right,suck]Elsedononthing使用不确定性动作的搜索例子:真空洗尘器世界的不稳定行为44与或搜索树或结点必须选择行动在用圆圈表示的与结点上必须处理所有后继解用粗黑线标出Q:LOOP什么意思?与或搜索树或结点必须选择行动Q:LOOP什么意思?45无观察信息的搜索Agent感知不到任何信息,称为无传感问题,也称相容问题无传感问题是可解的还是无解的?可解!真空吸尘器世界无传感问题的可解性:初始状态:{1,2,3,4,5,6,7,8}“向右”操作后:{2,4,6,8}“洗尘”操作后{4,8}“向左”操作后{1,7}“洗尘”操作后目标状态{7}在信念状态解无观察信息的问题无观察信息的搜索Agent感知不到任何信息,称为无传感问题46无观察信息的搜索无观察信息问题P的定义信念状态:包含物理状态中每个可能的集合,假定N个物理状态,最多有2N个信念状态初始状态:所有物理状态的集合行动:转移模型:对于确定行动对于不确定行动目标测试:信念状态中的所有物理状态都满足目标状态路径开销:假定所有状态下一个行动的开销相同无观察信息的搜索无观察信息问题P的定义47无观察信息的搜索256个可能的信念状态只有12个可达;初始状态出发的行动序列{S,L,S}与{R,L,S}达到相同的信念状态{5,7}如果一个行动序列是信念状态b的解,那么它也是b的任何子集的解无观察信息的搜索256个可能的信念状态只有12个可达;48部分可观察信息的搜索真空吸尘器世界问题的局部感知:位置传感器和局部垃圾传感器例如:状态1的可观察信息percept(s)=[A,dirty]一个信念状态到另一个信念状态的特定行动分三阶段发生:预测阶段:给定信念状态b和行动a,预测信念状态观察预测阶段:确定预测信念状态中可观察到的感知信息o:
更新阶段:根据每个可能的感知信息得到信念状态
部分可观察信息的搜索真空吸尘器世界问题的局部感知:49部分可观察信息的搜索部分可观察信息的搜索50部分可观察信息的搜索[Suck,Right,ifBstate={6}the
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 合理膳食年度工作计划
- 2024客服工作计划例文
- 2024部门月工作计划
- 一年级上册体育教学计划例文
- 2024年纪检监察下半年工作计划范文
- 关于学习计划集合
- 大学生产业实践计划
- 中小学下学期体育工作计划小学体育学期计划
- 六年级潜能生辅导计划
- 《骨关节MRI读片》课件
- 加强现场生产安全要求的培训课程
- 北京市昌平区2023-2024学年六年级上学期期末数学试卷
- 2024年现代农业的精细化管理
- 医院行政查房科室汇报课件
- 2023铁艺栏杆施工合同
- 有效管理的5大兵法学习分享-20.2.4
- 深度学习及其应用-复旦大学中国大学mooc课后章节答案期末考试题库2023年
- 2023乙型肝炎病毒标志物临床应用专家共识(完整版)
- 志愿者试题库
- 云数据备份与恢复方案
- 《VPN技术介绍》课件
评论
0/150
提交评论