




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第七讲第七讲 不完全信息动态博弈(续不完全信息动态博弈(续1 1)信号博弈信号博弈主讲人:张成科 博士广东工业大学经济与贸易学院管理博弈论(ManagementManagement Game TheoryGame Theory)目录导航n一 精练贝叶斯纳什均衡基本思路贝叶斯法则精练贝叶斯纳什均衡不完美信息博弈的精练贝叶斯均衡n二 信号传递博弈及其应用举例精练贝叶斯纳什均衡的定义*11( )( ),()nnsssn1p= pp定义:精炼贝叶斯均衡是一个战略组合 和一个后验概率组合 ,满足:(P)对于所有的参与人i,在每一个信息集h,(B) 是使用贝叶斯法则从先验概率 、观测到的 和最优战略 得到
2、的(在可能情况下)。(,)argmax() ( ,)iihiiiiiiiiiiss spau s s()hiiipa()iiip hia*()is精练贝叶斯纳什均衡的要点n精练贝叶斯均衡是均衡战略和均衡信念的结合:给定信念 ,战略 是最优的;n给定战略 ,信念 是使用贝叶斯法则从均衡战略和所观测到的行动得到的。n求解精炼贝叶斯均衡的过程中,有一点需要注意的是:在完全信息博弈中,我们习惯用逆向归纳法(backward induction)求解精炼均衡;但是,在不完全信息博弈的情况下,后验概率与战略是相互依存的关系,两者互相依赖,这样,如果我们不清楚先行动者的行动选择,我们就不可能知道后行动者应该
3、如何选择。因此,逆向归纳发在不完全信息博弈求解中是不适用的,取而代之,我们必须使用前向法(forward manner)进行贝叶斯修正。*1( ,)nsss1(,)nppp1(,)nppp*1( ,)nsss信号传递博弈及其应用举例iitppt代替了描述中,用在后面的所有用同时,修正后验概率qp,P和q代替了n信号传递博弈是一种比较简单的但有广泛应用意义的不完全信息动态博弈。n它是由两阶段市场在位者和进入者博弈衍生出来的一类特定背景下的博弈,并在许多领域如劳动力市场招聘者和应聘者博弈、二手车市场博弈等等有广泛应用N高 低在位者p=5p=6进入不进入进入不进入进入不进入进入不进入(6,0)(6,
4、0)(7,0)(7,0)(6,0)(6,0)(9,0)(9,0)p=4进入者进入不进入(2,0)(2,0)进入不进入(8,0)(8,0)1-在位者p=5p=6p=4第一阶段第二阶段(3,1)(7,0)(3,1)(7,0)(5,-1)(9,0)(5,-1)(9,0)(3,1)(7,0)(5,-1)(9,0)市场进入博弈-2阶段不完全信息动态博弈 u1(m2,a*(m),t1); u1(m2,a*(m),t2)u1(m1,a*(m),t2);因此,后验概率是:p(t1m1)=1,p(t1m2)=0;p(t2m1)=0,p(t2m2)=1。在K=J=2时: 分离均衡分离均衡在K=J=2时的分离均衡分
5、离均衡后验概率p(t1m1)=1,p(t1m2)=0;p(t2m1)=0,p(t2m2)=1。意味着:2121222111221222222*1121*2222()(, , )()(, , )()(, ,)()(, , )(, , )()(, , )(, ,)()argmax(, , )()argmax(, ,)tttaap t m um a tp t m um a tp t m um a tp t m um a tum a tp t muma tuma tamum a tamuma t从而即:准分离均衡准分离均衡(semi-separating equilibrium):一些类型的发送者随机
6、地发送信号,另一些类型的发送者选择特定的信号。假定类型t1的发送者以概率分布( ,1- )随机地选择m1或m2,类型t2的发送者以概率1选择m2。如果这个策略组合是均衡策略组合,那么: u1(m1, a*(m),t1)=u1(m2, a*(m),t1) u1(m1, a*(m),t2)q 1+(1-q) 0即:q2/3.综合得到:(m1,m1),(a1,a2);p=0.5,q,对q2/3为博弈的混同精练Bayes均衡。*11*22(),()amaama在时例题分析:信号发送者(参与人信号发送者(参与人1 1)的混同战略)的混同战略2 2混同于m2战略:如果自然赋予类型t1,选择信号m2;如果赋
7、予类型t2,选择信号m2。1212*111121222*222121222*11*22()argmax ( ) (, , )( ) (, , )max0.5 3 0.5 4 , 0.5 0 0.5 1 ()argmax ( ) (, , )( ) (, , )max0.5 1 0.5 0 , 0.5 0 0.5 2 (),()aaaaaaaaa mp t u m a tp t u m a ta mp t u m a tp t u m a ta maa ma 此时:意味着:Nt1 t21m1m2a1a2a1a2a1a2a1a2(1,3)(4,0)(2,1)(0,0)(2,4)(0,1)(1,0)
8、(1,2)0.50.51m2m122后验概率p(t1m1)=p,p(t1m2)=p(t1);p(t2m1)=1-p,p(t2m2)=p(t2)。例题分析:例题分析:信号发送者(参与人信号发送者(参与人1 1)的混同战略)的混同战略2 2p1-p0.50.5例题分析:信号发送者(参与人信号发送者(参与人1 1)的混同战略)的混同战略2 2考察参与人2在对应于m1的信息集中的推断,以及给定这一推断时类型ti的参与人1的最优选择为何?设推断为q=0.50对每一i成立,且p(t1)+p(t2)+p(tI)=1。 发送者S观察到ti后,从一个可行信号集M=m1,.,mJ)中选取一个信号mj。 接收者R观
9、测到信号mj后,从可行行动集A=a1,.,aK)中选取行动ak。 S与R的盈利函数分别为US(ti,mj,ak)与UR(ti,mj,ak)。Nt1 ,SSt2 ,1-m1m1m2m2a1a2a1a2a1a2a1a2RRRRn发送者的纯策略:(m1,m1), (m1,m2), (m2,m1), (m2,m2)n(m1,m1), (m2,m2):共用(pooling)策略 n(m1,m2), (m2,m1):分离(separating)策略 n接收者的纯策略:(a1,a1), (a1,a2), (a2,a1), (a2,a2)n发送者类型的信念:p(t1)=, p(t2)=1-SN1-t1t2a2
10、a1a2a1a2a1a2m1m1m2m2SRRa1结合例子说明信号博弈中精练Bayes均衡的定义n条件条件R1:在每一个信息集,在该集具有行动的局中人关于博弈到达信息集中的每一个结必须有一个信念。对于非单结信息集,信念是信息集中各个结上的概率分布。至于单结信息集,信念则置概率1于单决策结上。n信念被提高到如同均衡定义中策略那样的重要地位。n例子:例子:完全但不完美信息的动态博弈12LRABAB(2,1)(0,0)(0,2)(0,1)(1,3)M1LMR2AB2,10,00,20,11,31,3n注:(A,L)与(R,B)均是子博弈精练均衡。12LRABAB(2,1)(0,0)(0,2)(0,1
11、)(1,3)Mp1-p转换为不完全信息的动态博弈信号博弈中的R1nSR(1):在观察到来自M的任何信息mj后,接收者R关于发出信号mj的发送者属于那一种类型必须由一个信念。这个信念应是一个概率分布,由于信念是基于信号mj的,因此可以记作(ti/mj),其中对T中的每一个ti,应有(ti/mj)0,且Ttjiimt1)( SN1- t1t2a2a1a2a1a2a1a2m1m1m2m2SRRa1p1-pq1-q条件R2n在给定的信念下,局中人的策略必须是序贯理性的(sequentially rational)。就是说,在每一个信息集,具行动的局中人所采取的行动(以及局中人往后的行动)在给定该局中人
12、在该信息集上的信念与其他局中人以后的策略下必须是最优的。12LRABAB(2,1)(0,0)(0,2)(0,1)(1,3)Mp1-p 若局中人采取行动A,期望盈利为:p*1+(1-p)*2=2-p 若局中人采取行动B,期望盈利为:p*0+(1-p)*1=1-p 局中人2在信念p下的最优行动是:A 局中人在信念p下的最优行动是:L 注:在子博弈精练均衡(A,L)与(R,B)中,条件R1与R2就排除了不合理的子博弈精练均衡(R,B) 。 SR(2R):对于M中的每一个mj,接收者R的行动a*(mj)必须在给定信念(ti/mj)下极大化自己的期望盈利。即a*(mj)是下述公式的解:TtkjiRjiA
13、aikamtUmt),()(max SN1-t1t2a2a1a2a1a2a1a2m1m1m2m2SRRa1p1-pq1-q信号博弈中的R2 SR(2S):对于T中的每一个ti,发送者S发出信号m*(ti)必须极大化发送者在给定接收者的策略a*(mj)下的盈利,即m*(ti)是下述公式的解:)(*,(maxjjiSMmmamtUjSN1-t1t2a2a1a2a1a2a1a2m1m1m2m2SRRa1p1-pq1-q均衡路径n在均衡路径上在均衡路径上:给定一个展开型博弈中的一个均衡,如果按照均衡策略进行博弈,将以正概率到达的信息集,则称这个信息集在均衡路径上。n不在均衡路径上不在均衡路径上:如果按
14、照均衡策略肯定达不到的信息集,则被称为不在均衡路径上。12LRABAB(2,1)(0,0)(0,2)(0,1)(1,3)MP=1P=0SN1-t1t2a2a1a2a1a2a1a2m1m1m2m2SRRa1p1-pq1-q信号博弈中的均衡路径条件R3nR3:局中人在均衡路径上信息集的信念,是通过Bayes法则与局中人的均衡策略来确定的。12LRABAB(2,1)(0,0) (0,2)(0,1)(1,3)Mp1-p12LRABAB(2,1)(0,0) (0,2)(0,1)(1,3)M10 SR(3):对于M中的每一个mj,如果存在T中的ti使得m*(ti)=mj,那么在对应于mj的信息集上,接收者的信念必定由Bayes法则与发送者的策略来确定:jiTtiijitptpmt)()()(信号博弈中的R3SN1-t1t2a2a1a2a1a2a1a2m1m1m2m2SRRa1p1-pq1-qSN1-t1t2a2a1a2a1a2a1a2m1m1m2m2SRRa11001信号博弈中的精练Bayes均衡n定义定义:一个精练Bayes均衡是由满足R1-R3的策略与信念构成。 结论结论:(L,A;p=1) 满足条件R1-R3,是精练bayes
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农业职业经理人考试的心得与体验分享试题及答案
- 分析游戏面试题目及答案
- 构建2024年园艺师考试的自由学习机制试题及答案
- 2024年农业职业经理人考试考点预测试题及答案
- 柏景设计面试题及答案
- 各高校招聘导师辅导员模拟考试试题及答案
- 复习园艺师考试的高效方法试题及答案
- 提升园艺师考试通过率的技巧试题及答案
- 农业职业经理人考试文化素养提升试题及答案
- 高校辅导员在人才培养中的作用及试题及答案
- 工会经费收支管理培训
- 人教版七年级地理(下)全册复习教案(含教学反思)
- JJF 1603-2016(0.1~2.5)THz太赫兹光谱仪校准规范
- 医药卫生病原微生物检测技术知识与技能比武竞赛题库
- 《民法典》-第二编 物权编-案例分析,解读-3
- 膜片钳常见问题汇总(人人都会膜片钳)
- 讲故事技能培训
- 海岸动力学全册配套完整课件
- 工作面防飞矸封闭式管理规定
- 干部人事档案管理岗位培训的讲义课件
- 财务人员廉政谈话记录 财务个人谈话记录3篇
评论
0/150
提交评论