


版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、对优化方法和多准则 / 跨学科设计工具 VKI 系列讲 座2004 年月 15-19集体和复朵的系统设讣一、 Kroo斯坦福大学,美国1?摘要集体是最大化系统性能,通过本地 U 标追求的自我激励代理商的组。本文涉 及集 体设计的两个方面:优化设计中的集体和工程设计本身,多个个人或团队设计 大规模的 系统部件的集体使用的应用。示例来自航空工程,发达的模型,在许多相 关学科其中可 用于分析和优化的完整系统。 设计的飞机, 涉及许多个人或组织和编 队飞行的鹅,例如, 共享许多类似的功能。在每种情况下,个人必须决定采取的行 动,必须受益系统作为一 个整体,尽管要求他们本地行事,并不能立即确定他们的 行
2、动对整个系统的效果。示例 演示了如何多层次分布式优化可用于实现最佳系统性 能的同时侧重于本地的自由度和 如何采取类似的做法导致最优 V 形雁群的其至当 个别鸟只致力善用自己本地的 LI 标。 这些想法的附加应用程序显示如何集体可能提 供新的工程解决方案,以航空航天设计中 的问题。2. 介绍航空中的有趣问题的各种涉及多个代理,必须作为一个组来完成一些任务的 相互 作用。这些代理可能无人的飞行器相互合作,搜索一组行为必须实现所需的响 应,音乐 会的控制传动器或一个团队的工作整体系统设计问题的某些部分的设计专 家。事实上这 种类型是问题的共同在整个自然与社会,从昆虫殖民地和分布式企业 组织为国家经济
3、体。 而且虽然个别车辆或控制器设计技术发达,设计策略和工具优 化的多智能体系统通常原始的和启发式,尽管这些系统在丄程和社会中的重要性。 在本文中,我们考虑多智能体 系统,一组个人自我激励设法使整个系统的性能最大 化的集体的一种特殊类型。本 文描述了新兴理论的集体、他们的设讣和他们在 航空工程中的应用方法。航空系统的发展重点的个别车辆,然后有时组装成一支舰队,成为空中运输 系 统,例如设计。随着这些系统的复杂性,但是,这种方法在系统设计变得更困难 而且 非最佳。新理论的集体行为,更好地认识的应急系统属性和多智能体系统设计 的新办 法答应显著改变的航空系统正在开发的方式。是否感兴趣的系统涉及网络(
4、飞机或数据数据包的路由),山多个学科的设 计团 队,一个复杂的系统的分布式的设计或协调多个空气车辆的性能增强或空中交 通管 理、多智能体系统可以应用于创建的系统,其性能可能大大超过特设的系统科学的聚合系统。设汁或复杂的多智能体系统的控制是性能的困难的因为重要的系统方面可能 是性 能的应急系统的属性。虽然做了许多丄作领域的复杂系统理论的系统级应急行 为所产 生的本地规则简单很多例子是知名 1, 2, 我们感兴趣不在有趣的系统动 力学,而在优化 急诊的行为。系统设计的两个传统的做法是在这些情况下,有问题 的因为问题分解成 更容易处理子系统设讣问题未命中应急系统属性,而集中的优化 是不可行,因为问题
5、 的复杂性。3-5.集中的优化方法或分层问题的分解,相对于一个集体是个别代理商寻求与其 他人 同时选择增加自己本地的实用程序的操作的代理交互时将本地的实用程序,最 大限度 地优化的分布式系统。作为一种分布式的优化问题制订允许使用的机器学 习、统计、 多智能体系统和博弈论的技术。新兴领域的 '' 集体或集体智慧 " 利 用了这些相关的 字段中的结果、用品设计一个集体,框架和由自治区火星车已应 用于多种分布式的优 化问题,包括网络路山,计算资源分配和数据收集。集体的字段中存在的两个基本问题。预测系统、其均衡点,系统性能(全 球实用程序)生成动态构成正的问题。这可能是使用模
6、拟(虚构播放)来完 成,实验,或在 某些情况下,概率或聚合理论。集体的逆问题通常是更困难的问题和重点 口前的讨论。问题是要确定个别代理商本地实用程序 与他们使用选择最大化他们的公用事业机构,这样的操作的策略 整体的系统实用程序处于最大化状态。3. 集体的理论基础 在集体的设计过程中,代理选择操作(从变量空间的值),并在一些基于系统 LI标的方法获得奖励,必须根据。这些奖励然后山代理使用来确定他们的下一个 选择的行 动。代理也不能提高其奖励通过更改操作时,该进程将达到平衡。集体的 逆问题是 meta 设讣问题的一种,和中心左右两个基本问题:1. 如何不会一个选择本地实用程序为个别代理商,在实行时
7、 分布式的系统,就所需的系统性能吗?2. 哪些战略应遵守高效地导致的个别代理商 增加当地的公共设施吗?3. 1.本地或私营实用程序 在某些系统中,山系统本身的字符指定本地实用程序功能的选择。因此在经 济体 系中,代理是自我兴趣与他们自己,有时未知的 LI 标。这些可能受激励政策和 机制设 讣领域密切相关问题的实用程序选择的集体,但限制性更强。集体设讣的情 况下,我们可自 III 选择代理商寻求最大限度的实用程序功能。这种选择并不明显 , 不过,和选 择不当会导致非常低效或执行不当的集体。理论的集体由?沃尔普特和 肿瘤侵袭 6和更近的概率描述集体理论 7提供一些正式的注意事项,协助这种选择。这以
8、下各节概述的方法。在所有感兴趣在这里的案件中,存在着全球评价功能 或系 统实用程序,G(z),这是一个函数的所有环境变量和行动,乙所有代理。集 体的目标是以最大化G(z);但是,代理不做直接限度 G(z)。而每个代理,i、最大化其私人评价函数 gi(z)的作品。这种集体的设计师面临的问题是要选择g (Z)以便最大化所有g也会导致G(z)最大化。3. 1. 1. Factored ness和可学性两个属性的本地实用程序所需的实现好的价值观的集体全球的实用程序,G.第一个属性,著名的博弈,是,本地实用程序,必须与,对齐或计应对全球的实用程序。那就是,提高了它的效用的代理所采取的行动,也应提高的系统
9、实用程序。正式中计 g 时:gi > gi (z ) o'G(z) N G(z').z、z世倜 z i = z'-我。凡Z-i和z'-我包含组件的操作、Z和Z集的'的分别,不受代理我。如果代理追求自私的 LI 标,将不计对全球的实用程序常见。然而,它很容易创建本地实用程序将汁。最明显的是与"团队游戏 " ,其中所有代理都使用相同的本地实用程序关联的功能,即全局实用程序函数:gi二G.团队游戏时使用的大型集体共同困难是行动的个别代理商可能很难确定他们与全球的实用程序的影响。在一家大公司,例如,打结市场,公司估值的雇员补偿导致因式相
10、通的系统,但个别雇员通常不能告诉他或她的行动可能会对股票价格有什么影响。这对个别代理操作的敬感性和不区分大小写到他人的行为是一种信噪 比,集体智 慧文学中称为可学性。它定义定量为 6:Ai、 gi (匸)三.Ci gi (匸);/ o Z. i gi (匚)为了测量灵敬度的gi ( z)的改动和如意行动,相对于其他代理操作的更改。3.1.2实用程序的区别。创建计算在内的一个方法,learnable本地实用函数是创建差异效用函数与相关的全球实用程序功能的:gi= G(z) o G (zi + ci)z-i其中包含不受这种形式的代理i.差异公用事业的所有变量将汁任何选择 的恒定 的词, 因为第二任
11、期不取决于如意 行动 6 。可学性也增强对团队游戏 实用程序, 因 为的差分方案中删除很多影响的其他代理(噪音)对每个代理实用程序功能。 8中指出: " 在许多情况下,可以使用,它等效于以代理 ci 系统出来g 评估全球评 价,的。直觉这将导致评估无我系统的健身差评价函数的第二届并因此 代理贡献。 "儿种类型的差异实用程序已调查 5。这些包括 ' 精彩生活实用程序 " (WLU ) 在消减词的消化道的价值由忽略 ith 代理对系统和其他儿个实用程序创 建的修复或夹 "ith 代理的行动,订明的值计算的。夹紧操作使用的实际值不会影 响系统的 fac
12、tored ness但有典型的测试问题5的收敛速度的影响。3. 2.执行惜况3. 2. 1.直接优化一旦确定本地实用程序的定义,个别代理商工作,最大限度地他们当地的实用程序。这已在多方面包括渐变 basedoptimization进化方法8 和强化学习5来完成。一个集体的高效实施中的问题涉及如何单个代理计算他们当地的实用程序。在某些情况下,很难讣算的全球的实用程序,G.取决于对功能,也可能难以或无法计算差异实用程序的Counter-factuaL部分:这世界本来没有我(在"美好生活实用程序中, 例如)类似。在这些情况下是经常估计 G 或 g 基于是可用 9 的信息的价值。感兴趣 的笫
13、二个项 LI 涉及集体优化过程的收敛性。虽然这是难因为 不同的优化技术,可使用 的范围的一般分析和多层过程涉及(选择,或奖励,或 其他数据驱动更新每个代理, 随着系统的发展),一些一般的结果可能适用10 ,对于某些可能应用类型的更新方法(例如概率集体)从博弈论的额外结 果。3. 2. 2.概率集体最近,一个变体的集体智慧概念一直建议7 ,替换优化跨概率空间可能采取的行动的一个可能的操作。这种概率集体理论基于从有限的理性惮弈论与信息理论的概念。 Et a l .沃尔普特 11显示如何未知的领域,而不是行动本身作为代理操作的可能性时,系统 LI 标函数可能取代的概率 (拉) ,函数和系统问题是尽 量减少对未知的概率函数p(z)以下函数:L(p) = E p(z) G(z)l E + T E p(z) In p(z)其中E : G是预期的全球目标、G和T的价值是温度。总和采取所有可能 的联 合行动,z。拉格朗日组成一个反映预期的回报了跨行动和与这些行动的概
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2019-2025年一级注册建筑师之建筑结构能力检测试卷B卷附答案
- 2025年3月隐蔽工程影像存档补充协议条款
- 自由探索的班级工作计划
- 2025商务合同谈判策略全解「」
- 2025写字间租赁合同
- 设计有趣的班级互动游戏计划
- 闲置钢管改造方案范本
- 如何让年度工作计划更具可持续性
- 课程与德育融合的创新实践计划
- 2025家庭护理服务合同范例
- 港口营运安全生产风险分级管控体系实施指南
- DB45-T 2228.1-2020公路养护预算编制办法及定额 第1部分:公路养护工程预算编制办法及定额-(高清可复制)
- 艾滋病感染HIV筛查检测报告表
- 六年级下册道德与法治第5课应对自然灾害课件
- 黑龙江省第三次国土调查实施方案
- 中考语文复习指导PPT资料30页课件
- 案例收球器盲板伤人事故
- 第3章-中子扩散理论2014
- 银行存款余额调节表正式版
- 2×100+2×200MW供热式火力发电厂
- 模具验收检查表(出口模具)
评论
0/150
提交评论