版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
(一)“石头,剪刀,布”游戏
(Rock,Scissor,Paper)思考:
双方应该怎么选择才是最优的?
是否存在绝对致胜的方法?
我们总是在选择自己的战略前试图猜中对手的行动选择;同时,我们又会力图避免自己的选择被对方猜中,还要根据自己对对方行动的事前预测来做出最优的行动选择,即这样的游戏行动选择带有随机性。(一)“石头,剪刀,布”游戏
(Rock,Scissor,1(二)著名的“囚徒困境”
(Prisoners’Dilemma)
假设有两个小偷联合犯事,私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行单独审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两人都认罪,则各被判刑8年。如果一人认罪,另一人不认,则认罪者立即释放,不认罪者加重判刑至10年。如果两人都不认罪,则警方因证据不足不能判两人有罪,但可以因私入民宅的罪名将两人各判入狱一年。并且,每个小偷都被告知,他的同伙也面对着同样的政策。(二)著名的“囚徒困境”
(Prisoners’Dilemm2想想:
他们会如何选择,最终的决策结果会是什么?分析:
这个模型有如下要素:1.两个小偷必须在不知道对方的选择的情况下独立进行自己的决策2.双方都会为自己的利益考虑,即使自己的盈利最大化想想:
他们会如何选择,最终的决策结果会是什3将双方的具体选择和相应的结果描述如下:-8-80-10-100-1-12认罪不认罪认罪1不认罪对1来说无论2选择什么,他选择‘认罪’总是最优的,根据对称性,对于2,‘认罪’也是最优的,所以模型的最终选择结果是(认罪,认罪)但是,实际上,显然(不认罪,不认罪)是对双方最好的结果。所以,在个人理性与集体理性之间存在不一致性。我们假定两个小偷都只在乎各自的刑期,且盈利等于刑期的相反数将双方的具体选择和相应的结果描述如下:-84博弈与决策:
博弈是建立在相互猜测对方的决策过程基础上的决策,即是“互动性”的决策。
博弈论是建立在理性人的假设基础之上(理性人一般是指主体所追求的唯一目标是自身经济利益的最大化),
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略,被广泛应用到经济活动和其他社会科学领域当中。上述两个例子,其实都可以被描述为一局博弈,而且都是二人博弈(只有两个参与者),其中隐含了时间的动态性质,被称为静态战略式博弈。下面我们给出博弈模型的战略式数学描述博弈与决策:
博弈是建立在相互猜测对方的决策5GameTheory
GameTheory
6局中人(Players):可以是个人也可以是团体、组织等,在博弈论中假定局中人是理性人。行动空间(Actionspace):每个局中人都有一行动集,而每个人在自己的行动集当中的选择所构成的一组策略,被称为行动空间,即上述
A。盈利函数(效用函数Payofffunction):指局中人从博弈中获得的效用水平,大多是数值型的,来表示自己在一局博弈当中的盈利。显然,它是A的函数,并且满足线性变换。局中人(Players):可以是个人也可以是团体、组织等,在7(
Rock,Scissor,Paper)
001-1-11-11001-11-1-11002石头剪刀布
石头剪刀布(Rock,Scissor,Paper)
08(Rock,Scissor,Paper)
显然,从支付矩阵上看,不存在一个对双方都是最优的决策,但是无论双方的选择是什么,各自的效用函数之和总是为零。这样的博弈称为二人零和博弈那么我们怎么选择才能使自己的盈利最大呢?既然,局中人的行动具有随机性,我们对每一行动选择赋予概率,组成该博弈的混合战略。(Rock,Scissor,Paper)显然,从9
10
11局中人1希望最大化自己的期望效用,而局中人2希望最小化1的效用(等价于最大化自己的期望效用,因为是零和博弈),根据二人零和博弈理论,1和2的决策问题变为:
局中人1希望最大化自己的期望效用,而局中人2希望最小化1的效12在博弈理论中,纳什均衡是一个非常重要的概念,它表达了博弈的基本原理,我们简单地给出它的定义:
在博弈理论中,纳什均衡是一个非常重要的概念,它表达了博弈的基13
对二人博弈,用计算机求解纳什均衡常用的Lemke-Howson算法主要运用下述定理:
对二人博弈,用计算机求解纳什均衡常用的Lemke-How14LINGO程序如下:model:sets:k/1..3/:p;n/1..3/:q;pay(k,n):Ma,Mb;endsetsdata:Ma=01-1
-101
1-10;Mb=0-1110-1-110;enddatava=@sum(pay(i,j):Ma(i,j)*p(i)*q(j));vb=@sum(pay(i,j):Mb(i,j)*p(i)*q(j));@for(k(i):@sum(n(j):Ma(i,j)*q(j))<=va);@for(n(j):@sum(k(i):Mb(i,j)*p(i))<=vb);@sum(k:p)=1;@sum(n:q)=1;@free(va);@free(vb);EndLINGO程序如下:model:va=@sum(pay(i,15运行结果:VariableValue
VA0.000000
VB0.000000
P(1)0.3333333
P(2)0.3333333
P(3)0.3333333
Q(1)0.3333333
Q(2)0.3333333
Q(3)0.3333333
运行结果:VariableValue
161.我们可以这么理解该游戏的混合战略,当每个人以同等的概率随机的选择时,他们认为这三个行动一样好,即没有对哪个的偏好,此时对于对方的选择,你选择哪一个行动所获得的期望效用是相同的,所以你选择哪个是无差别的。2.对于该游戏,我们选取的效用函数构成了零和博弈(Zero-SumGame),但是如果局中人的效用之和不为零,我们不能根据最小最大定理简单地去分析和计算,但是我们可以根据纳什均衡的定义去求解。1.我们可以这么理解该游戏的混合战略,当每个人以同等的概率随17我现在要求是三个人玩呢?(”Rock,Scissor,Paper”forthreepeople)我现在要求是三个人玩呢?(”Rock,Scissor,Pa18拆分成三个二维矩阵:对于某一局中人1有23石头剪刀布石头0,0,01,1,-1-1,-1,1剪刀1,-1,11,-1,-10,0,0布-1,1,-10,0,0-1,1,1石头:23石头剪刀布石头-1,1,1-1,1,-10,0,0剪刀-1,-1,10,0,01,1,-1布0,0,01,-1,11,-1,-1剪刀:拆分成三个二维矩阵:对于某一局中人1有231923石头剪刀布石头1,-1,-10,0,01,-1,1剪刀0,0,0-1,1,1-1,1,-1布1,1,-1-1,-1,10,0,0布:
23石头剪刀布石头1,-1,-10,0,020
21进一步分析:局中人的选择和盈利是对称的,所以我们考虑的局中人1怎么选让自己的盈利最大,对于2和3也是一样的
进一步分析:
22当然,也可以用MATLAB去求解,运行结果跟前面
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论