版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
信用经济学2024/9/131什么是博弈?博弈是指一种不同个体所做的决策会产生相互影响的情形。这意味着个体的收益不仅受自己的行动影响,也受他人的行动影响。而且,个体的最优行动取决于他对其他人如何行动的期望。博弈的四要素:博弈者:参与博弈的人。规则:什么时候由谁行动;当轮到一方行动时,他所掌握的信息,以及自己可能选择的行动方案。结果:对于由每个博弈者从自己的行动方案集中所做选择形成的一个行动组合,博弈都会出现一个结果。收益:对于不同的博弈结果,每个博弈者会有相应的收益。2024/9/132博弈示例1:匹配硬币博弈者:甲和乙。规则:甲和乙同时放下一枚硬币,硬币朝上的那一面要么是正面,要么是反面。结果:如果两枚硬币匹配,即都为正面或者反面,那么甲给乙一元钱。否则,乙给甲一元钱。收益:博弈者的收益等于他所获得的金钱。2024/9/133博弈示例2:圈圈叉叉博弈者:×和○。规则:博弈者在一个3×3格的棋盘上(九宫格)轮流画圈圈和叉叉。叉叉先画。博弈者可以看到另一方之前所做的全部行动。结果:当一种符号在棋盘的竖向,或横向,或斜向形成3连的时候,该符号的游戏者胜出,赢得对方的1元钱。收益:博弈者的收益等于他所获得的金钱。2024/9/134收益函数在博弈中,使用效用函数来描述博弈者的收益,即每一种博弈结果对应一个效用值。效用是指对于消费者通过消费,或者享受闲暇等方式,使自己的需求、欲望等得到的满足的一个度量。在上述两个示例中,博弈者的收益正好等于获得的金钱。需要注意的是,收益不一定等于金钱。2024/9/135博弈示例3:相约广州2024/9/136博弈者:甲和乙。规则:甲和乙各处异地,且无法实时联系。他们相约某一时刻到广州会面共进晚餐,但忘记约定具体地点。每个人必须自己决定一个地点。结果:如果双方能够顺利见面,就可以享受有对方陪伴的晚餐。否则,他们只能独自用餐。收益:博弈者认为得到对方的陪伴价值100元钱。零和博弈和非零和博弈2024/9/137零和博弈:例1和2是存在冲突的博弈,即一个博弈者的获益是以另一方的损失为代价,博弈各方的收益和损失相加之和为零。非零和博弈:例3中博弈中各方的收益或损失之和不为零。在这种情况下,自己的幸福未必建立在他人的痛苦之上,即使伤害他人也可能“损人不利己”,所以博弈双方存在“双赢”的可能,进而达成合作。在博弈中,一方的收益取决于另一方的行动。更重要的是,一方的最优行动取决于他自己预想别人会如何行动。博弈的一种描述方式:扩展式2024/9/138博弈的扩展式是通过博弈树来描述。示例:匹配硬币博弈ver2.0,甲和乙不再同时放下硬币,而是由甲先放,当乙观察到甲的行动之后,再放下硬币。空心圆:起始决策点,也称根节点甲乙乙正面正面正面反面反面分枝:一种可能的行动实心圆:决策点,要在可能的行动集合中选择一种结束节点:博弈结束收益:按博弈顺序列示反面注意:从根节点到结束节点只有唯一一条路径,表示众多博弈行动方案中的一种。完美/不完美信息博弈2024/9/139完美信息博弈:当轮到一个博弈者行动的时候,他能看到其他对手之前已经选择的行动。例如,匹配硬币ver2.0。不完美信息博弈:当轮到一个博弈者行动的时候,他不知道之前发生的所有状况(他人行动)。在扩展式中,用信息集表示不完美信息。当一个博弈者到达信息集中的一个决策点是,他并不知道自己位于集合中的哪个节点上。匹配硬币ver3.0:当甲放出硬币之后,迅速用手遮住,此时乙在放出硬币的时候并不知道甲的行动方案。匹配硬币博弈ver3.02024/9/1310当乙在做放硬币选择时,并不知道自己处在信息集中的哪个节点上。乙处于信息集中任意一个节点的概率是相等的。当信息集中只有一个决策节点的时候,不需要将信息集画出来。甲乙乙正面正面正面反面反面反面信息集信息集的特点2024/9/1311对于信息集中的每一个决策点,博弈者都拥有相同的行动选择方案。博弈者拥有完美记忆,不会忘记自己之前的行动以及对手之前的行动。甲甲甲乙乙乙乙忘记了甲的第一次行动图1甲乙乙甲甲忘记了自己的第一次行动图2信息集的特点2024/9/1312信息集可以表示同时行动。在匹配硬币ver3.0中,由于甲先行动,所以甲不知道乙的行动;由于甲盖住了自己的硬币,所以乙不知道甲的行动。在匹配硬币ver1.0中,由于甲和乙同时行动,所以他们并不知道对方的行动。博弈用扩展式表示为:甲乙乙正面正面正面反面反面反面等价于乙先行动,甲再行动当一个博弈的所有信息集都只有一个决策点的时候,该博弈为完美信息博弈;反之为不完美信息博弈。博弈的自然节点2024/9/1313前述的博弈的结果都是博弈者采取行动的确定型函数。然而,在一些博弈中存在随机因素。匹配硬币ver4.0:放出硬币前,甲和乙通过抛硬币来决定行动的先后顺序。自然乙甲1/21/2甲甲乙乙正面正面反面正面反面反面正面正面正面反面反面反面甲和乙分别有1/2的概率先行动博弈的数学表示方式2024/9/1314博弈的基本假定:所有博弈者清楚博弈的结构,知道他们的对手清楚博弈的结构,知道对手知道他们清楚博弈的结构。一个博弈由如下数学符号组成:一个有限的节点集合X,一个有限的可能行动集合A,一个有限的博弈者集合I。一个方程p:X→{X∪Ø},表示节点x的前继节点集合。除了初始节点x0,p(x)是非空集。节点x的后继节点集合表示为s(x)=p-1(x)。结束节点集合为T={x∈X:s(x)=
Ø}。所有节点X/T都为决策节点。一个方程α:X\{x0}→a表示从前继节点p(x)选择的行动,该行动将博弈者引导至决策节点x。如果x′,x′′∈s(x),并且x′≠
x′′,那么α(x′)
≠α(x′′
)。在决策节点x上所有可能的行动集合为
c(x)={a∈A:a=α(x′),其中x′∈s(x)
}博弈的数学表示方式2024/9/1315一系列的信息集合记为H。一个方程h:X→H给每个决策节点x分配了一个信息集h(x)∈H。因此,信息集H是对节点集X的一个划分。在同一个信息集中的所有节点拥有相同的可选行动集合。如果h(x)=h(x′),那么c(x)=c(x′)。在一个信息集上所有的行动集合表示为C(h)。一个方程ι:H→{0,1,2,…,I},将H中的每个信息集分配给某个博弈者(自然可以视为博弈者0),该博弈者将在自己的信息集中的某个决策节点选择行动方案。博弈者i的信息集可以表示为Hi={h∈H:i=ι(h)}。一个方程ρ:H0×A→(0,1)对自然所在信息集上的每个行动赋予了一个概率,∑a∈C(h)
ρ(h,a)=1,其中h
∈H0。一个收益函数的集合u={u1(·),u2(·),…,ui(·)}给每个博弈者在最后的结束节点分配了一个效用。一个博弈的数学表达式为:
ГE={X,
A,I,p(·),α(·),H,h(·),ι(·),ρ(·),u(·)}策略2024/9/1316策略是博弈的核心概念,表示一个包含所有可能的计划。策略具体指明了博弈者在每个轮到他行动的可分辨的环境中该采取何种行动。一个信息集就是一个可分辨的环境。博弈者在自己每个信息集中选出一个行动,从而形成一个策略。策略的数学定义:Hi表示博弈者i所拥有的信息集,A表示该博弈中所有可能的行动。C(h)⊂A表示一个信息集h上的所有行动集合。博弈者i的一个策略是一个函数si:Hi
→A,使得对于所有h∈Hi,si
(h)∈C(h)。博弈者制定他的策略,相当于写下一份他在博弈中的行动指南。作为一个包含所有可能的计划,策略通常涵盖了博弈者在实际博弈中可能不会采取的行动。策略示例2024/9/1317在匹配硬币Ver2.0中,甲的一个策略指明了他在初始决策节点上采取的行动:出正面(H)或反面(T)。乙的一个策略指明了他在自己的每个信息集中需要采取的行动:当甲出正面时,乙该如何行动;当甲出反面时,乙该如何行动。乙有四种策略:策略1(s1):当甲出H时,乙出H;当甲出T时,乙出H。策略2(s2):当甲出H时,乙出H;当甲出T时,乙出T。策略3(s3):当甲出H时,乙出T;当甲出T时,乙出H。策略4(s4):当甲出H时,乙出T;当甲出T时,乙出T。思考:在匹配硬币Ver3.0中,甲和乙的策略是什么?匹配硬币Ver1.0中的策略又是什么?博弈的一般式2024/9/1318所有博弈者的一个策略组s=(s1,…,sI)产生了博弈的一个结果。对于该结果,博弈者会有相应的收益。博弈的一般式就是用策略和对应的福利来描述一个博弈。一般式的数学定义:对于一个存在I个博弈者的博弈,一般式ГN给出了每个博弈者i的策略集Si(si∈Si)和福利【效用函数ui(s1,…,sI)】,即ГN=[I,{Si},ui{•)}]。在一般式中,我们不需要描述出每个策略对应的具体行动,只需要用简单的符号Si={s1i,s2i,…}指代一个·博弈者的不同策略。一般式示例2024/9/1319匹配硬币Ver2.0的博弈一般式如下:s1s2s3s4H-1,+1-1,+1+1,-1+1,-1T+1,-1-1,+1+1,-1-1,+1作业:画出匹配硬币Ver3.0的博弈一般式。博弈可以视为给定一个博弈者预期其对手会采取某一策略的条件下,该博弈者从自己的策略集中选择一个策略。由于每个博弈者都面临这样的决策问题,所以博弈可被视为每个博弈者从自己的策略集{Si}中同时选择一个策略。随机选择2024/9/1320纯策略:博弈者的策略为确定型,即博弈者肯定地选择某一行动。假设博弈者i的纯策略集合为Si,则博弈者i从Si中随机选择一个策略的方式称为混合策略。混合策略:给定博弈者i的纯策略集合Si,博弈者i的一个混合策略为σi:
Si
→[0,1],即赋予每个纯策略si一个概率σi(si)≥0,其中∑si∈Si
σi(si)=1。博弈者i的混合策略的集合是Δ(Si)。博弈者采取混合策略,相当于在自己的每一个信息集中随机选取一个行动。当博弈者使自己的纯策略随机化时,博弈的结果将会是随机的(不确定的)。此时,计算博弈者收益的时候,需要对效用函数求数学期望。随机选择示例2024/9/1321假设有a、b两个博弈者,每人都有2个纯策略:
Sa={s1a,s2a},Sb={s1b,s2b}给定一个混合策略组{σa,σb},其中:
σa(s1a)=1/4,σa(s2a)=3/4;
σb(s1b)=1/3,σb(s2b)=2/3那么博弈者a的期望效用为:
ua=ua(s1a,s1b)×1/4×1/3+ua(s1a,s2b)×1/4×2/3+ua(s2a,s1b)×3/4×1/3+ua(s2a,s2b)×3/4×2/3同时行动博弈:占优和被占优策略2024/9/1322首先考虑纯策略的博弈(剔除混合策略)。同时行动博弈示例:囚徒困境。如果两个囚犯中,只有一个招供,则主动招供的可以减刑至1年,而拒招的要被监禁10年。如果同时招供,则两个人都要判处5年监禁。如果都不招供,那么法院苦于没有证据,只能判处他们2年监禁。囚犯2不招供招供囚犯1不招供-2,-2-10,-1招供-1,-10-5,-5对每个囚犯而言,无论对手采取何种策略,自己采取“招供”策略所获得的收益都是最大的。博弈的结果是(招供,招供)。自私自利的理性行为不会导致社会福利最优。严格占优策略2024/9/1323定义:在博弈ГN=[I,{Si},ui{•)}]中,对于博弈者i,如果一个策略si
∈Si
是严格占优策略,那么对于所有si
′≠
si
,有
ui(si
,s-i
)>ui(si
′,s-i
)
上述不等式对所有s-i
∈S-i
成立。无论对手采取何种策略,严格占优策略si都可以唯一使博弈者i的收益最大化。尽管博弈者会毫不犹豫采取严格占优策略,但现实中该类策略很少存在。被严格占优策略2024/9/1324通常,博弈者i的一个策略si对应于他的对手策略s-i是最好的,而其另一个策略si′又是对应于对手的另一个策略s-i′是最好的。回忆匹配硬币Ver2.0。定义:在博弈ГN=[I,{Si},ui{•)}]中,对于博弈者i,如果一个策略si
∈Si
是被严格占优策略,那么对于所有s-i
∈S-i
,存在另外一个策略si′∈Si
,使得ui(si
′,s-i
)
>ui(si
,s-i
)
在上述情形下,我们说策略si′严格占优于si。被严格占优策略示例2024/9/1325上述博弈中不存在严格占优策略。对于博弈者1,D策略被M(U)策略严格占优。博弈者不会选择严格被占优策略。博弈者2LR博弈者1U1,-1-1,1M-1,11,-1D-2,5-3,2被弱占优策略2024/9/1326定义:在博弈ГN=[I,{Si},ui{•)}]中,对于博弈者i,如果一个策略si
∈Si
是被弱占优策略,那么对于所有s-i
∈S-i
,存在另外一个策略si′∈Si
,使得ui(si
′,s-i
)
≥ui(si
,s-i
)
在上述情形下,我们说策略si′弱占优于si。对于对手的所有策略,si′至少与si一样(带来相同的收益),而对于对手的部分策略,si′比si好(前者收益大于后者)。博弈者2LR博弈者1U5,14,0M6,03,1D6,44,4对于博弈者1,策略U/M被策略D弱占优,或者说策略D弱占优于策略U/M。谨慎可以排除被弱占优策略。重复排除被严格占优策略2024/9/1327通常,我们希望排除严格被占优策略,从而使博弈得到唯一的预测结果。然而现实中不一定存在这样的理想情况。囚徒困境Ver2.0:检察官是囚犯1的兄弟,为了照顾囚犯1,规定如果两人都不招供,那么囚犯1可以被释放。囚犯1不存在被严格占优策略。“不招供”是囚犯2的被严格占优策略。排除囚犯2的“不招供”策略,囚犯1必然选择“招供”。囚犯2不招供招供囚犯1不招供0(-2),-2-10,-1招供-1,-10-5,-5重复排除被严格占优策略2024/9/1328求解博弈的前提是博弈者知道对方的收益,而且知道彼此都是理性的。对于一个博弈,当删除一条被严格占优的策略之后,其他的原本不是被严格占优的策略可能变成被严格占优策略。重复排除被严格占优策略的一个特点:删除策略的顺序不会影响最终剩下的策略集合。即给定任意一个阶段,如果博弈存在多个被严格占优策略,同时删除它们或者按照某一顺序删除它们都不会影响博弈的结果。混合策略下的被严格占优策略2024/9/1329定义1:在博弈ГN=[I,{Δ(Si)},ui{•)}]中,对于博弈者i,如果一个策略σi
∈Δ(Si)
是被严格占优的策略,那么对于所有
σ-i
∈Πj≠iΔ(Sj)
,存在另外一个策略σi′∈Δ(Si)
,使得ui(σi′,σ-i
)
>ui(σi
,σ-i
)
在上述情形下,我们说策略σi′严格占优于σi。如果博弈者i一个策略σi严格占优于Δ(Si)中的每一个策略,那么σi就是严格占优策略。混合策略下的被严格占优策略2024/9/1330命题1:在博弈ГN=[I,{Δ(Si)},ui{•)}]中,如果博弈者i的一个纯策略是被严格占优的,那么意味着存在另一个混合策略σi′∈Δ(Si),使得ui(σi′,s-i
)
>ui(si
,s-i
)上述不等式对所有s-i
∈S-i
成立。命题1告诉我们,如果博弈者i可以采取随机化的行动方式,欲检验一个纯策略si是否是被占优的,我们不必按定义1的方式进行验算。只需检验:对于对手的所有纯策略,是否存在博弈者i的一个混合策略优于si。如果一个纯策略si是被严格占优的,那么任何赋予si一个正概率的混合策略也是被严格占优的。命题1示例2024/9/1331对于博弈者1,策略U是对于对手策略L的好回应,但对于对手策略R是差回应;策略D是对于对手策略L的差回应,但对于对手策略R是好回应;策略M介于U和D之间,不好不差。当博弈者1采取随机化行动时,例如各有0.5的概率实施U和D策略,那么对于博弈者2的任何策略而言,此时博弈者1的期望收益都是5,严格优于M策略。根据命题1,纯策略M是被严格占优的,应该被排除。博弈者2LR博弈者1U10,10,4M4,24,3D0,510,2找到被严格占优策略的方法2024/9/1332在博弈ГN=[I,{Δ(Si)},ui{•)}]中,先通过命题1找到博弈者i的被严格占优的纯策略,并将其排除,此时得到博弈者i的非被占优的纯策略集合。然后,在该集合上删除被严格占优的混合策略。最后剩下的集合就是未被占优的策略集合(包含纯策略和混合策略)合理化策略2024/9/1333定义:在博弈ГN=[I,{Δ(Si)},ui{•)}]中,如果博弈者i对于他的对手的一个策略σ-i所采取的策略σi满足如下条件:ui(σi
,σ-i
)≥ui(σi′,σ-i
)上述不等式对所有σi
′∈Δ(Si
)都成立。那么,我们将博弈者i的策略σi是对对手策略σ-i的一个最优响应。只有当博弈者i推断他的对手将采取策略σ-i时,σi才是最优响应。被严格占优的策略肯定不是最优响应。不是被严格占优策略也不一定是最优响应。类似的,根据“博弈者是理性人”以及“博弈的结构”是公共知识,我们可以重复删除那些不是最优响应的策略。此时,剩下的策略集合就是合理化策略。合理性策略2024/9/1334合理化策略的集合不会大于重复删除被严格占优策略后的集合。因为删除不是最优响应的策略的过程中,一定会删除被严格占优的策略。删除非最优响应策略的顺序不会影响最后剩下的策略集合。博弈者2b1b2b3b4博弈者1a10,72,57,00,1a25,23,35,20,1a37,02,50,70,1a40,00,-20,010,-1在第一轮删除中,排除b4。如果博弈者2采取b1和b3各1/2概率的混合策略,那么b4被严格占优。在第二轮删除中,排除a4。因为当b4被删除后,a4被a2严格占优。最后,a1是b3的最优响应;a2是b2的最优响应;a3是b1的最优响应。博弈者1的合理化策略是{a1,a2,a3}博弈者可以构建一条合理的逻辑推理链条。(a2,b2,a2,b2,…)或(a1,b3,a3,b1,a1,b3,a3,b1,…)纳什均衡(纯策略的情形)2024/9/1335定义:在博弈ГN=[I,{Si},ui{•)}]中,如果一个策略组合s=(s1,…,sI)对于每个博弈者i=1,…I,都满足ui(si,s-i
)
≥ui(si′
,s-i
)上述不等式对所有si′
∈Si
成立,那么该策略组合s就是纳什均衡。在纳什均衡中,每个博弈者的策略都是对于对手实际所选策略的最优响应。区别于合理化策略集中的合理推断。纳什均衡策略必然是合理化策略,后者的集合大于等于前者的集合。博弈者2博弈者1lmrU5,30,43,5M4,05,54,0D3,50,45,3当博弈者1选择M,博弈者2对于M的最优响应是m,反之亦然。因此,策略组合(M,m)是一个纳什均衡。纳什均衡(纯策略的情形)2024/9/1336纳什均衡可能不是唯一,即存在多个。相约广州博弈存在两个纳什均衡。定义:在博弈ГN=[I,{Si},ui{•)}]中,博弈者的对应最优响应
bi:S-i
→Si使得每一个s-i
∈S-i都满足如下条件:bi(s-i
)={si
∈Si:ui(si,s-i
)
≥ui(si′
,s-i
),该不等式对所有si′
∈Si
成立}。一个策略组合s=(s1,…,sI)如果满足每个si
∈bi(s-i
),那么s是纳什均衡。甲广州塔喜来登乙广州塔100,1000,0喜来登0,0100,100纳什均衡(混合策略的情形)2024/9/1337定义:在博弈ГN=[I,{Δ(Si)},ui{•)}]中,如果一个混合策略组合σ=(σ1,…,
σI)对于每个博弈者i=1,…I,都满足ui(σi,σ-i
)
≥ui(σi′
,σ-i
)上述不等式对所有σi′
∈Δ(Si)
成立,那么该策略组合σ就是纳什均衡。匹配硬币ver1.0,不存在纯策略纳什均衡。但是,如果甲采取一个混合策略:出正面和反面的概率各为50%,那么此次乙出正面和反面的收益是无差别的。因此,乙也会愿意采取类似的混合策略。乙正面反面甲正面-1,+1+1,-1反面+1,-1-1,+1纳什均衡(混合策略的情形)2024/9/1338命题1:在博弈ГN=[I,{Δ(Si)},ui{•)}]中,如果一个混合策略组合σ是纳什均衡,那么对于每一个博弈者i,σi中赋予正概率的纯策略si是无差别的,即ui(s
i,σ-i
)
=ui(s
i′
,σ-i
)。赋予正概率的纯策略的效用大于等于赋予零概率的纯策略。示例:相约广州博弈ver2.0命题2:对于博弈ГN=[I,{Δ(Si)},ui{•)}],如果每个人的策略集合S1,S2,…,SI都有有限个元素,那么总会存在一个混合策略的纳什均衡。甲广州塔喜来登乙广州塔100,1000,0喜来登0,01000,1000假设甲到喜来登的概率为σ1。如果存在混合策略的纳什均衡,那么对于乙而言,到广州塔的效用等于到喜来登的效用。σ1=1/11动态博弈(非同时行动博弈)2024/9/1339当博弈者存在行动先后顺序的时候,博弈为动态博弈。市场博弈:企业E计划进入一个新的市场,但该市场中已经存在一个经营的企业I。如果E选择进入市场,那么I有两种回应方式:妥协,放弃一部分市场销售,保持价格不变;或者展开价格竞争企业E企业I不进入
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 指纹锁招标文件交换解读3篇
- 教育机构认证合同3篇
- 文明市民停车文明的不乱停3篇
- 安徽餐饮业劳动合同模板3篇
- 推广用品选购合同3篇
- 出行业合同管理策略
- 医疗科研合作合同准则
- 制造业合同存档查阅指南
- 城市公园给水设施建设工程合同
- 建材生产钢板租赁协议
- 2022-2023学年广东省广州市增城区教科版(广州)六年级上册期末测试英语试卷(含听力音频) 【带答案】
- 恶性综合征课件
- 2024年春季国开《学前教育科研方法》期末大作业(参考答案)
- 2024年中考物理复习精讲练(全国)专题22 计算题(力热电综合)(讲练)【学生卷】
- 水利水电安全生产评估报告
- MOOC 宏观经济学-南京财经大学 中国大学慕课答案
- 三年级语文试卷讲评市公开课一等奖省赛课获奖课件
- 湖南少数民族舞蹈智慧树知到期末考试答案2024年
- 仓储物流部的安全与风险管理措施
- 征兵体检人员培训课件
- 蒙牛数字化 营养世界
评论
0/150
提交评论