CH混合策略博弈论,张醒洲_第1页
CH混合策略博弈论,张醒洲_第2页
CH混合策略博弈论,张醒洲_第3页
CH混合策略博弈论,张醒洲_第4页
CH混合策略博弈论,张醒洲_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2023/5/19张醒洲,大连1混合策略找到不确定情况下的最优反应定义在一个n人博弈的标准式表述中,参与人的策略空间为,收益函数为,我们用表示此博弈。2023/5/19张醒洲,大连2纳什均衡博弈的标准式和纳什均衡2023/5/19张醒洲,大连3举例:猜硬币模型两个参与人{1,2}每个参与人的策略空间为{H,T}收益零和试着找到纳什均衡

参与人2参与人1正面背面正面-1,11,-1背面1,-1-1,1两个男孩各自有一个硬币并且他们必须选择将硬币的正面朝上还是背面朝上。如果两个硬币朝上的面相同(即都是正面或都是背面),则参与人2将赢得参与人1的硬币;否则,参与人1将赢得参与人2的硬币。猜硬币如果参与人的策略一致——(正面,正面)或(反面,反面)—则参与人1会偏向于改变策略;但是如果两者策略不一致—(正面,反面)或(反面,正面)—则参与人2偏向于改变策略。

参与人2正面背面正面-1,11,-1参与人1背面1,-1-1,1没有一组策略满足(NE)2023/5/19张醒洲,大连5石头-剪刀-布博弈此博弈也不存在纳什均衡无论参与人1选择哪个纯策略,参与人都可以打败他。参与人2石头剪刀布石头0,01,00,1参与人1剪刀0,10,01,0布1,00,10,02023/5/19张醒洲,大连6猜对方策略猜硬币博弈一个非常突出的特点是每个参与人都试图猜中对方的策略。任何这一类都没有纳什均衡至少不存在1.1.C节所定义的纳什均衡因为这一类博弈的解包含了一个参与人对其他参与人行为的不确定。

现在我们介绍混合策略2023/5/19张醒洲,大连7纯策略,混合策略考虑标准式博弈G={S1,····,Sn;u1,····,un}此后我们定义Si中的策略为参与人

i的纯策略

在本节的完全信息同时行动博弈中,一个参与人的纯策略就是他可以选择的不同行动;

例如,在猜硬币的博弈中,Si

包含两个纯策略:正面和背面。参与人i的一个混合策略是在其策略空间Si中的(一些或全部)策略的概率分布。2023/5/19张醒洲,大连8概率和信念随机事件事件有明确定义.我们可以区分不同的事件.在进行观察或试验前,我们不能肯定的说一个具体的事件会出现.我们可以判断哪些事件有可能出现,并且能判断每一个事件出现的可能性大小.概率事件的概率是对一次随机试验中该事件出现的可能性的度量如果对可能性的度量以某种客观规律或物质属性为基础,我们就用“概率”一词如果对可能性的度量以个人经验、主观判断为基础,就用“主观概率”、“信念”、“置信度”等术语2023/5/19张醒洲,大连9概率分布样本空间:Ω={ω1,

ω2,

…,ωn,…}试验中可能出现的所有基本结果ωi的集合事件由基本结果组成,是样本空间的子集。如果在试验中事件A中的一个结果出现了,就说事件A发生。概率分布就是将总概率P(Ω)=1分解到所有可能的样本点或事件上的一种方式.2023/5/19张醒洲,大连10概率的公理化定义概率测度

样本空间Ω上的一个概率测度是Ω的子集的一个函数P(·),它满足三条公理:公理(1)0≤P(E)≤1,对任一事件E公理(2)P(Ω)=1公理(3)对任何一列互不相容的事件E1,E2,….,即Ei∩Ej=Ф(空集),i≠j,有

我们称P(E)为事件E的概率。2023/5/19张醒洲,大连11混合粗略:猜硬币参与人i的一个混合策略是在其策略空间Si中的策略的概率分布举例:猜硬币S2

包含两个纯策略即正面和反面,因此参与人2的一个混合策略为概率分布(q,1-

q),其中q

为正面朝上的概率,1-

q

是背面朝上的概率,并且0<q<1.

参与人2参与人1正面

q背面

1-q正面-1,11,-1背面1,-1-1,1混合策略(0,1)是背面朝上的纯策略;类似地,混合策略(1,0)是正面朝上的纯策略。2023/5/19张醒洲,大连12混合策略:举例参与人2的一个混合策略为概率分布(q,r,1-q-r),其中q表示出左的概率,

r表示出中的概率,

1-q–r表示出右的概率。和前面一样,

0<q<1,并且还应满足0<r<1

和0<q+r<1。混合策略(1/3,1/3,1/3)表示参与人出左、中、右的概率相同,而

(1/2,1/2,0)表示出左、中的概率相同,但不可能出右。参与人2左中右上1,01,20,1参与人1下0,30,12,0

图1.1.1atPager6参与人的一个纯策略只是其混合策略的一个特例,例如参与人2出左的纯策略可表示为混合策略(1,0.0)。2023/5/19张醒洲,大连13混合策略:定义更为一般地,假定参与人i有K个纯策略:Si={si1,…,siK}.参与人i的一个混合策略是一个概率分布(pi1,…,piK),其中piK表示对所有k=1,…,K,参与人i选择策略sik的概率,由于pik是一个概率,对所有k=1,…,K,有0≤pik≤1且pi1+···+piK=1。我们用pi表示基于Si的任意一个混合策略,其中包含了选择每一个纯策略的概率,正如我们用si表示Si内任意一个纯策略。定义对标准式博弈,假设Si

={si1,…,siK}。那么,参与人i的一个混合策略为概率分布pi=(pi1,…,piK

),其中对所有

k=1,…,K,0≤pik≤1,且pi1+···+piK=1。2023/5/19张醒洲,大连14参与人j的混合策略解释当参与人i不确定参与人j会如何行动时,他可以把参与人j的混合策略作为参与人j行动的一个解释。

参与人2参与人1正面

q背面

1-q正面-1,11,-1背面1,-1-1,1例如:猜硬币

假设参与人1相信参与人会以q的概率出正面,以1-q的概率出背面;也就是说,1相信2的混合策略是(q,1-q)。2023/5/19张醒洲,大连15猜猜硬币另一面的颜色这里有三枚硬币,每一面被贴上红色或白色纸片(如下图).为了方便从左向右编号1、2、3.123现在从中任取一枚放在桌面,结果你看到白色。请猜一下,这枚硬币的背面是什么颜色?统计频数红色人白色人共人计算频率红色%白色%20薯23催/5谋/1难7张醒婶洲,大连16猜猜哪个硬币被标记了1/21/31/31/21/21/21/21/21/3NC2C1C3这里弓有三兔枚硬垦币,每一套面被惭贴上较红色炒或白极色纸迟片(如下快图).为了训方便赠从左支向右言编号1、2、3号硬材币123现在故从中转任取渠一枚芒放在烤桌面此,结池果你弯看到电白色络。请假猜一样下,爹这是液几号思硬币?20勉23美/5镜/1宋7张醒渗洲,大连17猜猜哪个硬币被标记了提示:根据洽条件启“看橡到一归面白敏色”,只考煎虑前耐两枚胡硬币(拿走俭两面棵全是掏红色堡的第帐三枚贷硬币).区分导第一伯枚硬平币的丢两个博面,膝尽管友它们收同色筐同质匆。你我可以械设想喇给第券一枚苗的两牛面分咽别标酿记11与12。现在洽知道款,从剧前两饥枚硬柏币中营任取量一个昆并让效白色扬朝上膨,共再三种姻可能赞。由于没硬币忘质地记均匀忠,随退机抽加取,磁随机摔搁置规,我轰们认捧为这摆三种放情形台等可具能。三枚鼓硬币箭,任坦取一觉枚平拿放在上桌面墨上,半共有3×2缺=6种等捕可能崇的情酷形。托满足常条件“白色醒在上”的只熟有这恨三种云。1-21-1211121112上下20爷23跨/5栋/1旋7张醒凯洲,大连18期望收益Student=►白红2/31-11/3-11试验串有两秒种可撕能结讲果,洗你的远信念薯是硬或币以2:梅1的比碍例出干现白洋色与高红色.猜对南得1分,猜错压扣1分.请估祝计你骗的策介略“阶猜白将色出利现”粒与“辩猜红高色出榴现”票的预问期支观付各黑为多浆少?预期写支付陪就是位概率妖加权裁支付—将你客在所哨有可冶能结仗果上消的支享付按风这些箭结果疫出现侵的概吗率加粱权求孩和20待23饲/5各/1酒7张醒暮洲,大连19对参与人j的混合策略,参与人i的最优纯策略给定桌以下建信念如果寄参与木人1的反据应是伴出正抱面,则他到的期锤望收伸益是q·(-剧1)松+露(反1责-q)·1涝=挽1恰-2q如果厅参与鸽人1的反掌应是影出正聪面,则他遍的期有望收桑益是q·1江+晒(1望-q)·(-1)债=2q-1.

参与人2参与人1正面

q背面1-q正面-1,11,-1背面1,-1-1,1因为当且篮仅当q<惊½时,1-必2q>2贼q-1成立,则如果q<捉1/蜡2,参与话人1的最采优纯筑策略丘为出皇正面蔽;如果q相>1/包2,参与嗓人1的最司优纯录策略尽为出精背面讽;如果q=鬼½,参与塞人1出正匪面与橡出背送面没像有差付别。20蹲23孙/5呼/1冲7张醒默洲,大连20严格劣于一个混合策略的策略针对扣参与鄙人1对参果与人2的可累能行却动作迫出的扛任何责推断(q楼,曾1-q),1的最优邮反应皆是要灯么是T核(当q予>朱1/身2),要么息是M匙(当q巾<缸1/暴2)洞,但不尺会是B,虽发然T或M并不闯严格劝优于B关键绩:存凯在一忙个混湿合策背略严掌格优渡于B如果章参与鼻人1以1/巾2的概疾率出T,以1/返2的概应率出M,则1的期暂望收乘益是3/笋2–无论思参与却人2采取奋哪种也策略泊(纯休的或混度合的棵),午参与喷人1的收炸益3/蔑2都大于解其出B时所盟获得日的收凝益。参与人2LqR1-qT3,—0,—

参与人1M0,—3,—B1,—1,—图1.胜3.星1这个末例子败说明亮了在熊“寻段找另提外一锻个严条格优丙于si的策恐略”母时,抛混合春策略葛所起测的作用。20司23素/5积/1鼻7张醒阵洲,大连21给定的纯策略可以是混合策略的最优反应图1.岸3.债2表明泰,一侦个给鉴定的委纯策双略可听以是忘一个尚混合嚼策略脊的最评优反冠应,叉即使油这一碌纯策运略并犁不是舒其他衰纯策旺略的滩最优距反应馅。在这摇个博站弈中能,B不是芒参与陈人1对参成与人2的纯倾策略L或R的最优棕反应枝;但B是参李与人1对参画与人2的混合苗策略(q探,励1语-油q)的最煎优反应,玩假定1/丽3毒<爷q动<枣2/摇3;这个萌例子甩说明规了混您合策烂略在“参碗与人i可能乱持有凤的推常断”舟中的作孟用参与人2LqR1-qT3,—0,—参与人1M0,—3,—B2,—2,—Fi姑gu暴re鸦1说.3谎.220哀23扫/5忘/1礼7张醒曾洲,大连22对参与人j的混合策略,参与人i的最优混合策略给定斤以下英信念如果伤参与种人1出正耀面,他的挂期望收益捉是1吗-2q;如果乘参与仙人1出背善面,史他的抹期望收益卵是2q-1.考虑撒参与竿人1可能摇的混顺合策飘略

参与人2参与人1正面

q背面1-q正面

r-1,11,-1背面

1-r1,-1-1,1令(r椅,央1-r)为参评与人1混合扬策略(以概艇率r出正拣面,以概绕率1-音r出背敢面);对任惩意[0餐,1促]上的q,计停算r的值,用r*(q)表示肃。因藏此,参与吓人2选择借混合策吊略(q,捞1社-q)时,飞参毛与人1的最北优反瞎应是(r摸,迹1女-r)。20栏23开/5秋/1卸7张醒像洲,大连23对参与人j的混合策略,参与人i的最优混合策略参与妈人2:眠(q,1-q)参与挎人1:戚(誓r闪,黎1-r)求解r*(q)当参虽与人2的混纤合策越略为(q,1却-q)时,序参与秤人选谜择(r均,恩1奥-r)的期蚂望收找益如忧下:

参与人2参与人1正面

q背面1-q正面

r-1,11,-1背面

1-r1,-1-1,1rq•猾(-宜1)递+腥r沾(1议-q)•走1夹+代(1斜-r)q•绕1些+幸(1耽-债r淋)(贿l篇-q)匠•摊(-符1)=(2q完-1)+叫r(2-夺4q),(1唱.3里.1焰)r*(q)硬=a衡rg贷m枣ax添2膊(q耳-1斑/2格)+律4r浮(1揭/2吃-q夺)20锁23菊/5江/1垄7张醒宵洲,大连24对参与人j的混合策略,参与人i的最优混合策略参与据人2:然(q,1-q)克q∈[修0,劲1]参与尼人1:乱(你r倦,啦1-r)r*(q)麦=思ar安g爆ma阀x丈2(画q-档1/宵2)倒+4圣r(沸1/俊2-瓦q)图1.具3.届3当q=丢1/赔2时,参与盗人1的期活望收移益2(识q-赏1/心2)兼+4瞎r(莲1/瞧2-糊q)与r无关春,且控参与贤人1的所辅有混晶合策症略(r奸,朱1-叔r)都是翼无差真异的欣。也谨就是垫说,桑当q=蚁1/展2时,角对于0到1之间椅的任绿何r,(r闹,犁1-第r)都是(q牧,军1-导q)的最豪优反努应。20须23座/5尤/1查7张醒何洲,大连25最优反应对应古诺估模型怀的最帅优反叠应函锋数这里弊,因书为存畜在一耳个q,使落得r*(q)有不举止一闲个解卫,我脆们称r*(q)为参争与人1的最灿优反贡应对团应。最优衫反应蒜对应和我件们之张前讨幻玉论的孙相关灭概念虽相比(我们顿只考甘虑了哈参与冰人1的纯趋策略),这嫁是一厕个更洒强的充概念野。20呀23伞/5嘉/1苗7张醒躲洲,大连26对参与人1的混合策略,参与人2的最优反应完全怜信息善静态译博弈从中,鹊参与醒人同皆时行锻动,并且听参与书人2和参省与人1会以桑相同挨的方讨式考虑此蚕博弈把。对参浅与人1的策墓略(r报,滨1-塑r),参繁与人2的最勒优反应虽是(q惕*(巴r)雪,挣1-讨q*守(r培))谅,其中q*准(r详)=派ar役g检ma究x湖(1廊-2茂r)乓+q什(4呀r-扎2)20希23灰/5势/1由7张醒予洲,大连27最优反应对应的解释最优天反应r*(q)和q*(r)的交额点确芝定了易猜硬梳币博当弈的舌纳什元均衡旅:如果允参与闷人i的策颈略是(1豆/2盼,1珠/2轿),则跌参与肤人j的最优反眼应是(1握/2躲,1渴/2找),满工足纳市什均垫衡的愁要求根。图1.虹3.摄620尚23陵/5紫/1裳7张醒成洲,大连28混合策略纳什均衡的说明一个稍混合清策略俱纳什耐均衡奇不依绕赖任叶何参亲与人凳扔硬漫币、石掷骰予子或谨其他端随机选择洽策略薄的行仙为。愧更确犬切地业,我阶们可社以把依参与惰人j的混悉合策退略解鸟释为参与功人i对参况与人j选择额哪一趟个纯季策略龄的不陶确定糖性。每一填个参乳与人联确定塑性的央选择澡一个冷纯策肌略.但对唤方不胶具备暂关于碗这一累策略技的充介分信下息,这时站就要悄作相惰应的村预测,将对赴方的浆行为酿理解着为一乎个混好合策案略,并作倡出相袖应的奏对策(c亏ho辣se溪a素b疼es捞t裤re牛sp栋on泉se园t似o虫a丧mi贱xe救d眼st株ra严te哑gy图)每一精个参机与人组选择惭一个帝纯战播略,正是撇利用诱了对坡手关落于自怒已行淋为的赚不确趴定性芳。20模23近/5寨/1串7张醒愿洲,大连29混合策略纳什均衡

:两人博弈定义殃在两乱个参靠与人彼标准乏式博叶弈G=巧{S1,S2;u1,u2}中,内混合就策略(p*1,p*2)是纳穷什均醒衡的损充要油条件雀为:套每一哑参与罚人的滚混合晓策略柴是另贝一个伤参与踩人混合策精略的钓最优老反应披,即其中20赏23攀/5摇/1葱7张醒届洲,大连30纳什均衡:性别战博弈此博尝弈存厅在两诵个纯掘策略叹纳什卷均衡(O烧pe蚀ra欺,劈燕Op辱er确a)和(F及ig顿ht政,命Fi四gh道t)都是秤纳什失均衡20政23抱/5饶/1历7张醒畅洲,大连31纳什均衡:性别战博弈找到妙性别骂战博仆弈所援有纳迟什均晋衡混合宗策略郑组:摇(r针,1迷-r帖)=花(2绪/3向,具1/暗3)和(q彼,醋1-乔q)鬼=(爬1/徐3,烫2遍/3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论