




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、须要求傅弈方互相认识彼此的决策行为,即每个参与者都能预见其他参与者的均衡策略。当一个博弈中的参与者达到纳什均衡状态时,任何一个参与者都不能独自的改变本身的策略行为以增大自身的收益而不影响其他参与者的策略行为。因此,纳什均衡表示的是瞎弈的稳态性,一旦达到纳什均衡状态,表明该瞎弈各个参与者之间达到均衡状态,不再进行策略行为的选择。而纳什均衡也存在不足之处,纳什均衡的状态并不一定是唯一的,在有些实际问题中会存在多个纳什均衡。2.2.6帕累托最优帕累托最优(ParetoOptimality),也称为帕累托效率(ParetoEfficiency,PE)。这个概念是由意大利经济学家维弗雳多帕累托在关于经济
2、效率和收入分配的一篇论文中提出,在经济学、工程学和社会科学中有着广泛的应用。帕累托最优是博弈论中非常重要的概念,指的是资源分配的一种最优的状态,在不使任何参与者情况变坏的情况下,不可能再使某些参与者的处境变好。在一个基本的傅弈11nnG=ssuu中,由每个I専弈方的策略行为组成的策略集合()111sS,如果不存在任何的策略行为集合()212Ss使得:0()221111ininUssMUssieN(2.2)则称策略集合()111ss为该博弈的帕累托最优。当在某个博弈中,瞎弈参与者达到帕累托最优状态后,不可能再有更多的帕累托改进的余地,帕累托最优是公平与效率的“理想王国”。与纳什均衡不同的是,帕累
3、托最优是从合作的角度出发,各博弈参与者互相交换各自的信息,从而获得整体最优的效益;而纳什均衡只是表示一种均衡状态,各博弈参与者只从自己的角度出发,选择自己的最优行策略,而并不考虑其他参与者策略行为的选择,是一种自私的行为策略选择。由此可见,纳什均衡只是博弈参与者达到平衡的一种状态,而并不是一种帕累托最优,不是一种完美的结局。2.2.7超模博弈托普基斯(Topkis)在1979年提出了超模博弈模型(SupermodelGames)思23,指出若瞎弈参与者的效益函数是超模的,则该傅弈过程为超模博弈。超模博弈的定义:如果任意两个博弈参与者1a和Ja,1Ja$a,他们的效用函数满足南京邮电大学硕士研究
4、生学位论文第二章功率控制技术及博弈论18参与者的效率、公平和公正。研究的是瞎弈参与者通过合作的方式在一定的约束条件下如何分配所获得收益,合作傅弈论也可称为联盟傅弈,其存在的两个基本条件是:通过联盟的方式,系统所获得收益多于参与者单独所获得的收益和。在联盟内部,应存在具有帕累托改进性质的分配规则,即每个参与者都能获得比不加入联盟时多一些的收益。合作博弈所包含的本身特性决定了这两个基本条件是否可以顺利满足并实现,即在联盟结构中各参与者的信息是可以互换的,必须遵循共同的约朿协议。而在非合作博弈模型中,每个参与者单独选择策略行为,并不遵循保证整体效用的共同准则。合作傅弈按照合作之后的收益变化可分为本质
5、性的合作和非本质性的合作,若合作之后各傅弈参与者及整体的收益有所增加,则此合作瞎弈是本质性的,即合作后该联盟存在净增收益;若合作之后各瞎弈参与者及整体的收益并没有增加反而下降,则此合作傅弈为非本质性的。合作傅弈与非合作傅弈区别主要在于合作博弈是研究各参与者达成合作时如何分配合作所得到的收益,即收益分配问题。而非合作博弈是研究参与者在利益相互影响的情况下如何选择策略行为使自己的收益最大,即策略行为选择问题。合作瞎弈强调的是联盟内部各参与者之间的信息互通,只有通过各参与者之间信息的互相交换,合作才可进行。2.2.5纳什均衡在经济学中,均衡指的是各相关变量处于稳定状态。在傅弈论中,可以通过均衡來判定
6、傅弈的稳态性,也可以判定算法是否收敛。约翰纳什在20世纪50年代发表了两篇关于非合作博弈的文章22,对均衡解的思想作了阐述,并提供了证明均衡解存在性和唯一性的依据,即纳什均衡(NashEqulibrium,NE)。纳什均衡是判定非合作博弈是否达到稳定状态的重要依据,奠定了现代t専弈论发展的基础。在一个基本的博弈11nnG=ssuu中,由每个I専弈方的策略行为组成的策略集合()1,若任一博弈方的策略行为都是其他博弈方策略集合()111,,,,11n的最佳策略行为,即0()111111liiiniiijinusssssusssss+2(2.1)对1J1ses都成立,则可认为()*1SS为基本博弈G
7、的一个“纳什均衡”。由上可以看出,纳什均衡是所有博弈方的最优策略行为集合,此时的每一个傅弈参与者的策略行为都是对其他参与者策略行为的最优反应,达到平衡的状态。要实现纳什均衡,必172.2.4博弈论的分类实际中可从不同的方面对博弈进行划分,比如依据博弈参与者的数量多少,可分为双人傅弈和多人博弈;依据博弈参与者选择决策行为的先后顺序,可分为动态傅弈(DynamicGame)和静态傅弈(StaticGame);依据博弈参与者对其他参与者所了解信息的多少,可分为完全信息博弈(GamewithCompleteInformation)和不完全信息傅弈(GamewithlncompleteInformati
8、on);依据博弈参与者相互的合作关系,可分为非合作博弈(Non-CooperativeGameTheory)和合作I専弈(CooperativeGameTheory)o如表2.1所示表示了常见的博弈分类。表2.1博弈的分类分类依据傅弈类型参与者数量双人傅弈;多人博弈傅弈次序动态博弈;静态博弈参与者信息完全信息博弈;不完全信息博弈合作关系非合作傅弈;合作博弈近年來博弈论的主要研究方向为非合作傅弈及合作博弈。在非合作傅弈中,根据博弈参与者的行为次序及在博弈中所获信息的不同,可将非合作t専弈划分为:完全信息静态瞎弈、不完全信息静态博弈、完全信息动态博弈和不完全信息动态博弈。其中,完全信息静态博弈是由
9、纳什提出的,对应的均衡即为纳什均衡;不完全信息静态博弈由海萨尼在1967年提出,在对其他博弈参与者类型进行预测时,需采用贝叶斯法则,因此对应的均衡为贝叶斯纳什均衡;赛尔顿在1965年提出了完全信息动态博弈,将完整博弈划分成若干个子博弈,所对应的均衡为子博弈精炼纳什均衡;不完全信息动态瞎弈由赛尔顿在1975年提出,所对应的均衡为精炼贝叶斯纳什均衡。如表2.2所示。表2.2博弈按参与者信息的分类时间次序信息静态动态完全信息约翰纳什纳什均衡赛尔顿子傅弈精炼纳什均衡不完全信息海萨尼贝叶斯纳什均衡赛尔顿精炼贝叶斯纳什均衡在合作瞎弈中,每个博弈参与者釆取的是一种合作的方式,或者说是一种妥协,目的是通过合作
10、的方式使得每个博弈参与者及整个系统的收益都达到最优。合作t専弈注重的是整体南京邮电大学硕士研究生学位论文第二章功率控制技术及傅弈论的值单调不减,即:(2.3)则称该傅弈模型为超模的。由托普基斯的不动点定理可以得知纳什均衡的存在性,即超模傅弈至少最在一个纳什均衡点。而一个超模t専弈中的所有均衡点构成一个格,若其中一对均衡点己知,则其他纳什均衡点可通过计算得出。超模瞎弈的概念在博弈论中非常重要,在超模瞎弈中,每个傅弈方增加其策略行为所引起的边际效用随着其他博弈方策略行为的递增而增加。在博弈中,对最优反应的反应是递增的,所以博弈参与者的策略行为是“策略互补”的。当有两个博弈方参与时,对变量进行变化以
11、后也可以釆用超模博弈模型进行分析递减的最优反应的情况。2.3本章小结功率控制技术作为认知无线电的关键技术,在保证接收端信干比的前提下,尽可能的降低每个认知用户的发射功率,减少系统间的相互干扰,使系统容量最大化。通过功率控制技术,使得网络中用户间的相互干扰达到最小,而且降低了终端的能源消耗。本章首先介绍介绍了功率技术的分类,包括开环、闭环功率控制及集中式、分布式功率控制技术等。然后,详细阐述了博弈论的基本知识,包括博弈论的基本概念、分类及基本模型,并介绍了博弈论中的重要理论:纳什均衡及帕累托最优,为研究基于博弈的认知无线电功率控制技术奠定了理论基础。傅弈论包含自身的博弈模型,其中,一个完整的傅弈
12、模型包含3个基本组成部分,即博弈参与方(Player)策略行为集合(Strategyset)及效用函数(UtilityFunction,UF)。由此,可以从5个方面来对t専弈论的基本模型做详细的描述,即G=P,A,S,I,UoP(player),W弈的参与者,也可称为“局中人”“博弈方”,是指在博弈中独立决策、独立承担后果,并且使自身利益达到最好來选择策略行为的决策主体。其中,博弈的参与者可以是个人也可以是团体组织。无论参与者是个人还是团体,一旦参与博弈,各参与方互相平等,都必须按照一定的博弈规则确定自己的策略行为。A(action),所有博弈参与者的策略行为组成部分。指在傅弈过程中,每个参与
13、者在与其他参与者进行傅弈时,可选择的行为策略。对于博弈局中人來说,在不同的博弈过程中可以选择的策略行为是不同的,即使同属于一个博弈过程中,可选择的策略行为也是不同的,可能是一种或是多种,其至无限多种。S(strategies),博弈的次序。在实际的许许多多傅弈决策中,当有许多博弈局中人需要进行决策行为时,有时这些博弈参与者需要在同一时间做出决策行为,以保证傅弈方的公平性,而有时傅弈参与者的决策行为要有不同的先后顺序,而且有的博弈参与者需要做出多次决策行为。因此,在傅弈中,需要定义傅弈参与者之间的次序,如果两个傅弈仅仅次序不同,那么他们是不同的瞎弈。I(information),博弈信息。在傅弈中,信息的掌握对于博弈方非常重要,信息掌握的越多,傅弈参与者的决策行为就越准确。因此,傅弈参与者应尽可能的掌握更多的傅弈信息,在傅弈选择决策行为时更为主动,从而确保决策行为的准确性。U(utility),博弈参与者的效用,乂称为收益。是指傅弈参与者选择策略行为后所获得的收益,对于每个瞎弈参与者來说是其策略行为的函数,是参与者最注重的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年餐厨垃圾车合作协议书
- 课题开题报告:湖北省应用型本科院校教师数字素养评价与提升路径研究
- 课题开题报告:湖北高等教育高质量发展体系研究
- 2025年镍及镍合金材项目发展计划
- 鲁科版高中化学选择性必修2第1章第1节第1课时氢原子光谱和玻尔的原子结构模型基础课课件
- 2025年血液净化信息系统项目建议书
- 氯气安全知识培训课件
- 飞机场货物装卸服务企业ESG实践与创新战略研究报告
- 汽车专门零售企业数字化转型与智慧升级战略研究报告
- 针叶木木粒企业ESG实践与创新战略研究报告
- 2025版七年级下册历史必背知识点
- TSG21-2025固定式压力容器安全技术(送审稿)
- 作品集合同范本
- 保安员综合理论考试题库备考500题(含各题型)
- 《苗圃生产与管理》教案-第一章 园林苗圃的建立
- 山泉水公司《质量管理手册》
- X证书失智老年人照护身体综合照护讲解
- 2025年内蒙古自治区政府工作报告测试题及参考答案
- 2024年全国中学生生物学联赛试题及答案详解
- 《中药注射剂大全》课件
- 2024年全国职业院校技能大赛高职组(社区服务实务赛项)考试题库(含答案)
评论
0/150
提交评论