博弈论第一章

上传人：X*** IP属地：天津上传时间：2022-09-15 格式：DOC 页数：21 大小：836KB 积分：36 举报 版权申诉

已阅读5页，还剩16页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、完全信息静态博弈1.0 对策论研究的内容与基本形式对策论研究的内容对策论研究多个行为主体的决策问题。对策论研究的形式博弈 (game)，由多个行为主体构成的系统。例Stackelberg modelCournot model博弈的类型参与者行动的时间与顺序同时行动静态博弈；先后行动动态博弈。参与者的信息多少信息相同完全信息；信息不同不完全信息。1.1 基本理论 : 博弈的标准式和纳什均衡例 1儿童游戏：“石头、剪刀、布”。博弈的标准式表示(normal-form representation)(1) 参与人( player).个参与人： 1, 2, , i, , n.战略 (strategy)

2、.一个参与人的战略是他采取的一个行动。参与人 i 的战略： si.参与人 i 的战略空间 : Si .战略的一个组合 : s =s1，s2, , sn.简化表示： s-i = s1，, s i -1， s i+1, , sn .收益 (payoff).参与人i 的收益： ui= ui(s1，s2, , sn)n 个参与人博弈的标准形式表示:G = S1, S2,S,n；u1, u2, u, n完全信息 (complete information) ：每个参与人知道其他人的战略空间和收益。静态博弈(static game)：所有的参与人同时行动。每个人行动时，不知道其他人的行动。例 1（续）：

3、博弈石头、剪刀、布的描述：参与人：1，2。战略空间：S1 = S2 = 石头、剪刀、布收益：两人出手的函数u1 (石头，石头 ) = 0， u1 (石头，剪刀 ) = 1， u1 (石头，布 ) = -1u2 (石头，石头 ) = 0， u2 (石头，剪刀 ) = -1，u2 (石头，布 ) = 1收益表：两个参与人，有限个战略的博弈的表示方法。P2石头剪刀布石头0 ， 01，-1-1 ，1P剪刀-1，10 ， 01 ，-11布1 ，-1-1，10 ， 0博弈的问题：能否知道每个参与人选择的战略？例 2: 囚徒困境 (The Prisoner s Dilemma)囚徒2沉默招认沉默-1

4、，-1-9 ，0囚徒1招认0 ，-9-6 ，-6囚徒 1 的考虑：无论对方选沉默还是招认，自己选“招认”好于“沉默”。囚徒 2 的考虑：无论对方选什么，“招认”好于“沉默” 。两人的选择 : (招认，招认 )。定义：si 是 si 的严格劣势战略（strictly dominated ），如果 :ui(si ，s-i )ui(si ， s-i )“沉默”是“招认”的严格劣战略例 3:参与人2左中右上1 ， 01， 33 ， 0参与人1中0,20，16，0下0,22,45,3参与人1: 没有严格劣战略。参与人2: “右”严格劣于“中”考虑：重复剔除严格劣战略(iteratedelimina

5、tionof strictlydominatedstrategies)可预见的两人选择 : (下, 中)。例 4: 图参与人2左中右上0 ， 44 ， 05 ， 3参与人1中4,00，45，3下3,53,56,6两人都没有严格劣战略。两人会如何选择各自的战略？定义：s* = ( s1 ， n是一个纳什均衡(Nash equilibrium),如果*s *)ui(si *，s-i*)ui(si，s-i*)纳什均衡为最大化问题的解maxui = ui (s1*,s,i ,s,n*)siSi各例中的纳什均衡 :囚徒困境 : （招认，招认）例 3: （下，中）例 4（图 1. 1. 4）: (下,

6、右).纳什均衡与重复剔除严格劣势战略的关系:没有被剔除的唯一的战略组合是纳什均衡.如果战略是一个纳什均衡，它们在重复剔除严格劣势战略后留下.多个纳什均衡例5 性别战 (the battle of the Sexes)帕特歌剧拳击歌剧2 ， 10 ， 0克里斯拳击0 ， 01 ，2纳什均衡 :(歌剧 ,歌剧 )，(拳击 ,拳击 )1.2 应用例古诺双头垄断模型（ Cournot Model of Duopoly ）二个企业，生产产量 : q1 2, q市场需求 : P = a Q,Q = q12+ q企业成本 : Ci ii(q ) = cq, i = 1, 2.企业利润：i (q1, q2)

7、= Pqi Ci (qi) = (a (q1 + q2)qi cqi，博弈的描述：参与人：企业 1，企业 2战略：产量qi收益：i (q1, q2)企业 i 选择产量求max(s , , s*):iijsiSi一阶条件d 1= a c 2q1 q2* = 0dq1和d 2= a c q1* 2q2 = 0dq2厂商选择自己利润最大的产量q1 = ac q2q2 = ac q122解纳什均衡得q1* = q2* = ac3利润1 = 2 = ( a c ( ac + a c ) a c = (a c) 23339当 ui 是可微分的时候, 纳什均衡为下列方程组的的解：ui (s1 , s2,.,

8、 sn ) = 0, i = 1, n,si思考：用重复剔除严格劣势战略求纳什均衡比较：如果两个厂商生产q1 = q2 = ac4利润21 =2 = ( a c ( ac + a c ) a c = (a c)4448例贝特兰德双头垄断模型（ Bertrand Model of Duopoly ）两个企业生产有差别的商品。消费者对企业i 的需求qi(pi, pj) = a pi + bpj，成本 : Ci(qi) = cqi, i = 1, 2.战略 si: pi0收益 :i (pi, pj) = (a pi + bpj)( pi c)纳什均衡 (p12满足*, p *)maxi (pi,

9、pj*)= max (a pi + bpj*)( pi c)解得p12ac* = p * =2b例最后要价仲裁 (Final-offer Arbitration)一个企业和一个工会，通过一个仲裁人决定工资。企业和工会同时提出工资: wf,wu仲裁人有一个标准： x，选择双方提议中比较靠近x 的提议：如果 x ( wf + wu )/2，则wuwf(wf + wu )/2xwu企业和工会不知道 x，但知道 x的分布函数 F(x)和密度函数 f(x)。分析wf 被选择的概率： Prob x w f2wu = 1 Fw fwu2期望工资Ew = wf Fw fwu+ wu 1 Fwfwu22wf

10、*满足minwf Fw fwu*+ wu*1 Fw fwu*w f22wu*满足maxwf * Fw*fwu + wu1 Fw*fwuwu22由一阶条件Fw f wu+ 1 wf fw fwu - 1 wu fw fwu = 0222221 wf fw f wu+ 1 - F w fwu - 1 wu fwfwu = 022222由此解出工资的均衡提议。两式相减Fw fwu= 122两式相加uw fwufw fwu= 1w * f2w * f2如果 x为正态分布 :x N(m,2)w*fwu*= m2wu * wf* = 1= 22 ,f (m)纳什均衡wu * = m +2 / 2 ,wf

11、* = m 2 / 2例公共财产问题一个村庄 ,有 n 个村民，在公共草地上放羊。村民 i 放牧的羊数： gi全村的羊总数： G = g1 + . + gn养一只羊的 (私人 )成本为 c，一只羊的价值为v(G)当 G 0, v(G) 0, v(G) G max, v(G) = 0每个村民选择养羊数量使自己收益最大gi v(G) cgi一阶条件v(G) + gi v (G) c = 0, i = 1,., n将 n 个等式相加得到nv(G) + G v (G) nc = 0即纳什均衡 G1 满足v(G1) + G1 v (G1) c= 0n全村在总收益最大的放牧数G2 满足max G2 v(G

12、2) cG2一阶条件v(G2) + G2 v (G2) c = 0G1 与 G2 哪一个大？G1 大vv (G)OGmaxGG v (G)/nv (G)G v (G)决策问题：在条件变差时, 收益上升还是下降？在通常的 (一人 )决策中，如果有几个选择，决策者选择收益最大的一个。如果外界条件改变，使他的一个或几个收益下降，则它无论怎样选择，都不会使收益比原来更大。例在一块田里选择种植的 (纯)收入：棉花3000 元花生3700 元玉米3500 元如果成本上升，收入变为棉花3000 元花生3200 元玉米3400 元人决策收益通常下降例在多人决策时的收益下降与增加（1）初始时参与人212TTS5

13、， 48 ， 31参与人1S4 ， 36 ， 52均衡为（ S1， T1），参与人 1 的收益为 5。（2）外界条件使参与人1 在选择 S1 时的收益下降参与人2T1T2S13，45，2参与人1S24,36，5均衡变为（ S2，T2）参与人 1 的收益为 6。多人决策时，收益可能上升。1.3混合战略和均衡的存在例 1 儿童游戏：“石头、剪刀、布”不存在纳什均衡。如何选择战略？例 6 猜硬币 (Matching Pennies)参与人2正面反面正面-1， 11， -1参与人1反面1， -1-1， 1也不存在纳什均衡。将原来的战略sik 称为纯战略 (pure strategy) 。战略空间Si

14、（ i 1， iK ）。= ss混合战略 (mixed strategy):战略空间 Si 的概率分布i （ i 1， iK ）: p = pp .由参与人选定。（参与者在可选行动中所有行动的一个概率分布）收益 : vi(p1， nk(j jki 1， np ) =p)u (ss )=E ui(s1，sn)由概率计算的期望值。较简单的情形 : 二个参与人S1 = s11，s1J , S2= s21, s,2K 收益 :JKv1(p1, p2) =p1j p2 k u1(s1 j , s2 k )j 1 k 1猜硬币的收益：如果p1 = ( 1 ,3 ), p2= (1, 2), 则4433v

15、1= 11+12 +3 13 2= -1/643434343v2=1112313244+4 =1/634333任意的混合战略，p1，1-p)，2，1-q),则= (pp = (qv1 (p1，p2) = pq(-1) + p(1-q) + (1-p)q + (1-p)(1-q)(-1)=2p(1-2q) + 2q -1v2(p1，p2) = pq + p(1-q)(-1) + (1-p)q(-1) + (1- p)(1-q)=2q(2p-1) + 1 2p混合战略中的劣战略例 7参与人2LRT3， -0， -参与人1M0, -3， -B1, -1, -如果只考虑纯战略， B 不是严格劣战略。在

16、纯战略时，如果参与人选L，则 1 选 T，如果参与人 2 选 R，则 1 选 R。能否剔除 B？如果 1 选择 p = ( 0.5, 0.5, 0)，则对 2 的任何混合战略 (q，1 q)v1 (p, q) = 0.5q 3 + 0.5 (1-q) 0 + 0.5 q 0 + 0.5 (1-q) 3 = 1.5 考虑以概率 1 选择 B，即 pB = ( 0, 0, 1), 则v1 (pB , q) = q 1 + (1-q) 1 = 1即 B 为 p 的严格劣战略。v3MTp1BO1q似乎可以剔除B？如果改写一下：参与人2LRT3， -0， -参与人1M0, -3， -B2, -2, -结

17、果有何变化？给出其它人的混合战略p-i，i 的最优反应 : pvi(pi, p-i)vi (p i, p- i)例 6（续）在猜硬币中，参与人1 的收益：v1(p1，p2) = pq(-1) + p(1-q) + (1-p)q + (1-p)(1-q)(-1)=2p(1-2q) + 2q -1参与人1 的最优反应如果 q1 ，p =1；2如果 q1 ， p = 0；2如果 q = 1 ，p 在0, 1中任意。2参与人 2 的收益：v2(p1，p2) = pq + p(1-q)(-1) + (1-p)q(-1) + (1-p)(1-q)=2q(2p-1) + 1 2p参与人2 的最优反应如果 p

18、1 ， q = 0；2如果 p1 ， q = 1；2如果 p = 1 ， q 在0, 1 中任意。2pp111/2O1/21qO1q参与人 1参与人 2混合战略的纳什均衡纳什均衡： p* = （p1* ，pn* ）满足v i (p* i，p* -i )v i (pi ，p* -i)纳什均衡为最大化问题的解maxvi = vi (p1*,p, i,p, n*)i在猜硬币中 ,（ 1,1）, （1,1 ）是一个纳什均衡 .2222p1O1/21q例 8性别战（续）克里斯取混合战略(p, (1 p)，帕特取（ q, (1 q)）克里斯收益v1 = 2pq + (1-p)(1-q)=p(3q -1)

19、 +1 - q她的最优反应p = 0，当 q1 ,3p = 1, 当 q13p 任意在 0, 1中，当q = 13帕特收益v2 = pq + 2(1-p)(1-q)=q(3p-2) + 2 2p他的最优反应q = 0，当 p2 ；3q = 1，当 p2 ；3q 任意在 0, 1中，当p = 2 .3ppOqOq克里斯帕特纳什均衡：(2, 1),(1, 2);3333(0, 1), (0, 1);(1, 0), (1, 0).纳什均衡的存在二个参与人，二个战略参与人2LRUx， ay， b参与人1Dz， cw， d参与人1 的混合战略 : (p, 1- p);参与人2 的混合战略 : (q, 1- q).参与人1 的收益 :v1(p, q) = pq x+ p(1 q)y + (1 p)qz + (1 p)(1 q)w =pq(x z + w y) (w y) + q(z w) + w分 3 种情况：x z + w y = 0。v1(p，q) = p(y w) + q(z w) + wp = 1, 当 yw；p = 0, 当 yw；p0, 1 ，当 y = w.ppOqOqywyw(2) xz + w yp = 0, 当 qp = 1, 当 q0(w(wy)/(x y)/(xz + w z + wy)y)；p0, 1, 当 q = (w

人人文库> 全部分类> 应用文书 > 研究报告

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

博弈论第一章

文档简介

温馨提示

最新文档

评论

博弈论第一章

文档简介

温馨提示

最新文档

评论

相关文档