博弈论全套课件_第1页
博弈论全套课件_第2页
博弈论全套课件_第3页
博弈论全套课件_第4页
博弈论全套课件_第5页
已阅读5页,还剩589页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

引論1-1策略博弈,從故事開始1-2博弈三要素和囚徒困境等1-3“抓錢博弈”1-4利益是交易的前提1-5博弈的基本分類1-1策略博弈,從故事開始我方2個師的兵力,敵方3個師的兵力,只能整師調動。有兩條進攻路線。我方兵力超過敵方,則獲勝;我方兵力小於或等於敵方兵力,則我方負。問如何決策?敵方有四種方案:A,三個師都駐守甲方向;B,兩個師駐守甲方向,一個師駐守乙方向;C,一個師駐守甲方向,兩個師駐守乙方向;D,三個師都駐守乙方向。我方有三種方案:x,集中全部兩個師的兵力從甲方向攻擊;y,兵分兩路,一師從甲方向,另一師從乙方向,同時發起攻擊;z,集中全部兩個師的兵力從乙方向攻擊。結論:敵軍必取B或C那樣的二一佈防,而我軍必集中兵力於某一路實施攻擊,即a或c。這樣,若攻在敵軍的薄弱處,就獲勝,若攻在敵人兵力較多的地方,就失敗。敵我雙方獲勝的可能性是一樣大。1-2博弈三要素和囚徒困境等表達一個博弈,最要緊的是講清楚一下三個元素:一、誰參與這個博弈。參與這個博弈的,叫做這個博弈的參與人或者局中人(player)。n個參與人的博弈,叫做n人博弈(n—persongame)。二、可供參與人選擇的行動(action)或者策略(strategy)。對局(strategyprofile)策略組合(strategycombination)。三、在博弈的各種對局下各參與人的贏利或者得益,叫做參與人的支付(payoff)。博弈的支付矩陣(payoffmatrix)也叫做博弈矩陣(gamematrix)博弈的矩陣型表示(matrix-formrepresentationofgames)博弈的正規型表示(nomal—formrepresentationofgames)博弈的策略型表示(strategic—formrepresentationofgames),矩陣型博弈(gamesinmatrixform),簡稱矩陣博弈正規型博弈(gamesinnormalform)策略型博弈(gamesinstrategicform)。高等代數、線性代數裏面的矩陣,每個位置一個數。上述二人博弈的支付矩陣,卻是每個格子一對數,左下角的是在相應對局下“左方”參與人盟軍的得益,右上角的是在相應對局下“上方”參與人德軍的得益。為了與代數裏面的矩陣相區別,現在這種每個格子裏面一對數的表格,叫作雙矩陣(bi-matrix)。左方參與人就是行參與人,上方參與人就是列參與人。囚徒困境

-3,-30,-5-5,0-1,-1囚徒A囚徒B坦白抵賴坦白抵賴-3大於-50大於-1(坦白,坦白)是納什均衡思考:三人博弈的矩陣如何表示?智豬博弈5,14,49,-10,0等待小豬大豬按等待按4大於10大於-1納什均衡:大豬按,小豬等待各得四個單位(4,4)多勞者不多得智豬博弈的例子

大豬小豬博弈股份公司中大股東小股東監督納什均衡:大股東擔當監督經理的責任村中的富人窮人修路納什均衡:大戶修路股市的大戶小戶炒股納什均衡:大戶搜集資訊,小戶跟大戶情侶博弈2,10,00,01,2芭蕾女男足球芭蕾足球納什均衡:足球,足球;芭蕾,芭蕾先動優勢鬥雞博弈-3,-32,00,20,0退BA進退進獨木橋納什均衡:A進,B退;A退,B進鬥雞博弈的例子村子裏有兩戶富戶,有兩種可能:一家修,另一家就不修;一家不修,另一家就得修。冷戰期間美蘇搶佔地盤:一方搶佔一塊地盤,另一方就占另一塊。夫妻吵架,一方厲害,另一方就出去躲躲。田忌賽馬3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下上下中中上下中下上下上中下中上上中下上下中中上下中下上下上中下中上田忌齊威王得益矩陣取勝關鍵:不讓對方猜到自己策略,盡可能猜出對方策略猜硬幣博弈-1,11,-11,-1-1,1正面反面猜硬幣方蓋硬幣方正面反面石頭、剪子、布0,01,-1-1,1-1,11,-10,01,-1-1,10,0石頭剪子布博弈方2石頭剪子布博弈方11-3“抓錢博弈”

假如甲乙兩個人參加一個“抓錢”遊戲,他們在各自的託盤前面坐定。託盤上面將會長出鈔票,這是老天爺的恩賜。一開始時刻1,甲面前的託盤上有1元錢,乙面前的託盤上也有1元錢,甲處於決策的位置。他有兩種選擇,把錢拿走或者不把錢拿走。如果他選擇把錢拿走,即他把自己面前託盤上的1元錢拿走,乙也可以把自己面前託盤上的1元錢拿走,遊戲結束;如果他選擇不把錢拿走,遊戲進入時刻2。時刻2:這時候托老天爺的福,甲面前的託盤上變得有2元錢,乙面前的託盤上也變得有2元錢,輪到乙處於決策的位置。他同樣有兩種選擇,把錢拿走或者不把錢拿走。如果他選擇把錢拿走,即他把自己面前託盤上的2元錢拿走,甲也可以把自己面前託盤上的2元錢拿走,遊戲結束;如果他選擇不把錢拿走,遊戲進入時刻3。時刻3:甲面前的託盤上變得有3元錢,乙面前的託盤上也變得有3元錢,甲再次處於決策的位置。他仍然有兩種選擇,把錢拿走或者不把錢拿走。如果他選擇把錢拿走,即他把自己面前託盤上的3元錢拿走,乙也可以把自己面前託盤上的3元錢拿走,遊戲結束;如果他選擇不把錢拿走,遊戲進入時刻4。時刻4:這時候甲面前的託盤上變得有4元錢。乙面前的託盤上也變得有4元錢.又輪到乙處於決策的位置。他還是有兩種選擇,把錢拿走或者不把錢拿走。如果他選擇把錢拿走,即他把自己面前託盤上的4元錢拿走.甲也可以把自己面前託盤上的4元錢拿走,遊戲結束;如果他選擇不把錢拿走,老天爺被他們不為金錢所動的精神感動,決定獎勵他們每人5元錢,遊戲結束。靜態博弈和動態博弈同時決策博弈(simultaneous-movegames),是靜態博弈(staticgame);決策有先有後是序貫決策博弈(sequential-movegames),是動態博弈(dynamicgame)。只要參與人的決策不是同時的決策,就是序貫決策博弈,而不必非得是輪流決策的不可。博弈樹序貫決策博弈採用“樹型”表示方法。根和分枝點是決策節點(decisionnodes),樹梢即各枝梢是末端節點(terminalnodes)。每個末端節點標示出博弈如果走到這裏每個參與人的得益。在每個樹型博弈中,末端節點的括弧,按照明確約定或者默認約定的順序,給出各參與人的支付。如果不另外申明,就採取博弈參與人在博弈中首次出場決策的自然順序,來排列各參與人的支付。每一博弈樹都有一個根(root),並且只有一個根。正式的稱謂:博弈的展開型表示(extensive—formrepresentationofgames)展開型博弈(gamesinextensiveform)。非正式的稱謂:博弈的樹形表示樹型博弈

在兩個博弈中,老天爺在相同時刻惠予兩位參與人的金錢數額是一樣的。可是“制度安排”不同,結果就大相徑庭。

以上是“你好我好”或者“利益一致”的抓錢博弈,現在考慮下述“你死我活”的抓錢博弈。

如果我們把原來的抓錢博弈的數據修改成下麵的樣子,那就出現“溫和對抗”的抓錢博弈。命題:在交易的當時,交易各方都不會真的吃虧。證明:若不然,只要有一方真的吃虧,他就沒有道理參與和實施這筆交易。為什麼卻有那麼多人感覺因為交易而吃虧了呢?一是人們混淆了事實需求和心理期望,二是人們混淆了當時需求和事後檢討。1-4利益是交易的前提在實際經濟生活中,在交易的當時通常各方都得到交易利益(tradebenefit)。經濟成本(economiccost)不是會計成本(accountingcost),經濟成本通常比會計成本高。經濟學講究買賣雙方對交易標的物的評價

(valuation),即交易標的物對於買賣雙方各值多少。人們對於同一標的物的評價是私有資訊,出於追求更大交易利益的考慮,買賣雙方都有隱蔽自己對交易標的物的真實評價的動機。

設x為交易標的物,記賣方對交易標的物的評價為vs(x),買方對交易標的物的評價為vb(x),那麼,雙方就標的物x達成交易的前提條件可以表述為:vb(x)>vs(x)買賣雙方交易這個標的物所實現的交易利益,一共是vb(x)-vs(x)競爭市場上,價格是P*,保留價格是vb(x)的買者,交易利益是vb(x)-P*,對於保留價格是vs(x)的賣者,托競爭市場的福他實現了P*這個價錢,從而他出售一件商品享受的交易利益是P*-vs(x)。

考慮經濟人A和經濟人B交換x和y兩種商品,如下面的埃奇沃思盒(Edgeworthbox)所示,在初始時刻,A對商品x和y的持有量是XA和YA,B對商品x和y的持有量是XB和YB,存量的初始持有點為E。交易互利區域無差異曲線

主體人的提供曲線,是通過初始持有點E的每一條直線和該主體人的無差異曲線的切點的軌跡。

競爭均衡最終可以由兩位主體人的提供曲線(offercurve)的交點確定,交點就是競爭均衡點。兩位主體人的提供曲線的交點M,就是該純交換經濟的競爭均衡埃奇沃思盒的壟斷均衡主體人A處於壟斷的交易位置:

總的來說,利益是交易的前提,在理性人的條件之下,自願的交易總是互利的。需要注意,雖然交易總是互利的,但是互利的交易未必公平。1-5博弈的基本分類最基本的分類:按照博弈各方是否同時決策,分為靜態博弈和動態博弈。按照大家是否都清楚各種對局情況下每個局中人的得益,分為完全資訊博弈和不完全資訊博弈。完全資訊:各種對局情況下每個局中人的得益多少是所有局中人的共同知識(commonknowledge)。完全資訊靜態博弈(staticgamesofcompleteinformation)完全資訊動態博弈(dynamicgamesofincompleteinformation)不完全資訊靜態博弈(staticgamesofcompleteinformation)不完全資訊動態博弈(dynamicgamesofincompleteinformation)完美資訊博弈(gameswithperfectinformation)和不完美資訊博弈(gameswithimperfectinformation)。完美性:是關於動態博弈進行過程之中面臨決策或者行動的參與人對於博弈進行迄今的歷史是否清楚的一種刻畫。如果在博弈進行過程的每一時刻,面臨決策或者行動的參與人,對於博弈進行到這個時刻為止所有參與人曾經採取的決策或者行動完全清楚,這樣的博弈叫做完美資訊博弈。完全且完美資訊博弈(gamesofcompleteandperfectinformation)完全但不完美資訊博弈(gamesofcompletebutimperfectinformation)不完全但完美資訊博弈(gamesofincompletebutperfectinformation)不完全且不完美資訊博弈(gamesofincompleteandimperfectinformation)只有動態博弈才考慮完美或不完美資訊。零和博弈,常和博弈如果一個博弈在所有各種對局下全體參與人之得益的總和總是保持為0,博弈就叫做零和博弈(zero-sumgame),也稱“嚴格競爭博弈”。

—猜硬幣,田忌賽馬,石頭-剪刀-布零和博弈是利益對抗程度最高的博弈。常和博弈:博弈方之間利益的總和為常數。博弈方之間的利益是對立的且是競爭關係。

—分配固定數額的獎金、利潤,遺產官司非常和博弈(變和博弈):零和博弈和常和博弈以外的所有博弈。合作利益存在,博弈效率問題的重要性。

—囚徒困境、產量博弈等合作博弈和非合作博弈

兩者的區別在於參與人在博弈過程中是否能夠達成一個具有約束力的協議。倘若不能,則稱非合作博弈。合作博弈強調的是集體主義,團體理性,是效率、公平、公正;非合作博弈則主要研究人們在利益相互影響的局勢中如何選擇策略使得自己的收益最大,強調個人理性、個人最優決策,其結果是有時有效率,有時則不然。目前經濟學家談到博弈論主要指的是非合作博弈,也就是各方在給定的約束條件下如何追求各自利益最大化,最後達到力量均衡。回顧1-1策略博弈:諾曼第登陸1-2博弈三要素和囚徒困境等局中人,行動或策略,支付矩陣型博弈,正規型博弈,策略型博弈支付矩陣,博弈矩陣,雙矩陣囚徒博弈,智豬博弈,情侶博弈,鬥雞博弈1-3抓錢博弈樹型博弈,展開型博弈博弈樹,決策節點,末端節點,根1-4利益是交易的前提

利益是交易的前提,在理性人的條件之下,自願的交易總是互利的1-5博弈的基本分類靜態博弈和動態博弈;完全資訊博弈和不完全資訊博弈;完美資訊博弈和不完美資訊博弈;零和博弈和非零和博弈;常和博弈和變和博弈;合作博弈和非合作博弈博弈的分類及對應的均衡靜態動態完全資訊完全資訊靜態博弈;納什均衡;Nash(1950)完全資訊動態博弈;子博弈精煉納什均衡;澤爾騰(1965)不完全資訊不完全資訊靜態博弈;貝葉斯納什均衡;海薩尼(1967-1968)不完全資訊動態博弈,精煉貝葉斯納什均衡;澤爾騰(1975)Kreps,Wilson(1982),Fudenberg,Tirole(1991)同時決策博弈(1)2-1二人同時博弈的三要素博弈的三要素局中人策略/行動支付/得益1.局中人

局中人:一般是指博弈中獨立決策、獨立承擔博弈結果的個人或組織。在不完全資訊情形中,有時需要引入一個“虛擬局中人”(pseudo-player),如,上帝、老天爺、大自然等等。i=l,2,…,n表示局中人N={1,2,…,n}表示局中人的集合。博弈問題的根本特徵是博弈本身具有策略依存性。博弈中局中人的個數是博弈結構的關鍵。根據局中人的個數博弈可分為“二人博弈”和“多人博弈”。需要注意的兩點

在二人博弈中,局中人雙方的利益並不總是相互完全衝突的,有時候也會出現雙方利益方向一致的情形。如,上下游企業。在二人博弈中,個人追求自身利益最大化的行為,往往並不能導致社會的最大利益,也常常不能真正實現個人自身的最大利益。出現“個人理性”與“集體理性”的衝突。如,卡特爾結盟博弈、公共產品的供給、軍備競爭及經濟改革等。2.策略策略:參與博弈的各局中人在進行決策時,可以選擇的方法、做法或經濟活動的水準、量值等。是局中人的決策內容。在不同的博弈中,可供局中人選擇的策略的數目很不相同。囚徒困境古諾競爭的產量決策數學表示

一般用表示局中人i可以選擇的一個特定策略,而表示局中人i可以選擇的所有策略所構成的集合,稱為策略集(strategyset),也稱為策略空間(strategyspace)。n個局中人每人選擇一個特定的策略,則n維向量

=(,…,)稱為一個策略組合。例:囚徒,古諾3.支付在每一個博弈中,給定一個策略組合,參與博弈的每一個局中人都會有相應的支付。支付,是指每個局中人從博弈中獲得的利益,它體現每個參與博弈的局中人的追求,也是他們行為和決策的主要依據。支付本身可以是利潤、收入、量化的效用、社會效益、福利等。支付可取正值,也可取負值,取正值表示得益。支付向量(u1(s),…,un(s))用表示局中人i的支付,它是策略組合的函數。例子石頭,剪刀,布策略集策略組合支付向量(1贏,0平,-1輸)2-2支付矩陣試寫出“石頭剪刀布”支付矩陣二人博弈的一般性矩陣表示雙矩陣分解為兩個支付矩陣T.C.Schelling的貢獻二人有限博弈由它的一對支付矩陣A和B決定。用一對支付矩陣(A,B)來表述一個博弈的時候,稱這個博弈被表示為雙矩陣形式(bimatrixform)。有限博弈局中人數目有限並且每個局中人可以選擇的(純)策略的數目也有限的博弈,叫做有限博弈(finitegames)。判斷:諾曼第戰役模擬博弈囚徒困境博弈企業古諾產量博弈三人博弈例子局中人:A、B和C每個局中人有三種策略:數字1,2,3支付:每個局中人得到4乘以三人中所選的數字中的最小者,再減去自己所選的數字。正規型(策略型)博弈定義例子考慮三個局中人參加的一個策略型博弈,三個局中人的策略集一樣,都是[0,1]區間:支付函數為:S1×S2×S3={(x,y,z):0≤x≤1,0≤y≤1,0≤z≤1}2-3優勢策略優勢策略(dominantstrategy)在某個博弈中,如果不管其他局中人選擇什麼策略,一個局中人的某個策略選擇給他帶來的支付始終高於其他策略選擇,或者至少不低於其他策略選擇,這樣,只要這個局中人是一個理性的局中人,那麼他必定願意選擇這個策略。優勢策略可分為:整體的嚴格優勢策略(strictlydominantstrategy)如:囚徒困境弱優勢策略(weaklydominantstrategy)嚴格劣勢策略

案例-囚徒困境-8,-80,-10-10,0-1,-1囚徒A囚徒B坦白抵賴坦白抵賴-8大於-100大於-1-8大於-100大於-1抵賴是A的嚴格劣策略抵賴是B的嚴格劣策略嚴格優勢(劣勢)策略嚴格劣勢策略逐次消去法嚴格劣勢策略逐次消去法(IteratedEliminationofStrictlyDominatedStrategies)在分析一個局中人的決策行為時,首先把一個嚴格劣勢策略從該局中人的策略集中去掉,然後在剩下的策略範圍內,試圖再找出這個局中人或者別的局中人的一個嚴格劣勢策略,並將它去掉。不斷重複這一過程,直到對每一個局中人而言,再也找不出嚴格劣勢策略為止,簡記為IESDS。嚴格優勢策略均衡例子

L

局中人2CRT013103局中人1M201003B204235並不是每一個博弈都存在嚴格優勢策略。博弈並不一定存在嚴格優勢策略和與之相對的嚴格劣勢策略,嚴格劣勢策略逐次消去法在使用上有局限性。弱優勢策略:不管其他局中人選擇什麼策略,一個局中人選擇他的某個策略給他帶來的支付(僅僅只是)不低於他選擇任何其他策略。2-4優勢策略均衡例子:公明博弈裝修行要2000元,可賺1000元;公明的保留價格正好就是2000元;以1200元成交,裝修行賺了600元,公明省了800元。弱劣勢策略——弱優勢策略“嚴格優勢策略”和“弱優勢策略”統地稱為“優勢策略”“嚴格劣勢策略”和“弱劣勢策略”統地稱為“劣勢策略”。“嚴格劣勢策略逐次消去法”——“普通劣勢策略消去法”一次一次把認定的劣勢策略消去,其中有些劣勢策略可以是弱劣勢策略。一個博弈的某個策略組合中的所有策略都是各個局中人各自的優勢策略,稱為該博弈的一個優勢策略均衡。尋找優勢策略均衡求解的局限關注於尋求優勢策略試圖得到優勢策略均衡,往往會漏掉博弈的一些可能的結果。如,公明博弈一些博弈根本沒有優勢策略均衡。2-5相對優勢策略和納什均衡相對優勢策略與絕對的優勢策略不同,局中人的相對優勢策略,是在他的對手選定某個具體策略的條件下他的優勢策略。優劣的相對性,是相對對手的具體策略選擇而言的。在多人博弈的情況下,局中人的相對優勢策略,是在他的每個對手都選定各自的具體策略的條件下他的優勢策略。1200-1-121芭蕾女男足球芭蕾足球納什均衡:足球,足球;芭蕾,芭蕾先動優勢情侶博弈中,雙方都沒有嚴格優勢策略和嚴格劣勢策略。“納什均衡”指明了情侶博弈等一大類局中人各策略之間不存在絕對優劣關係的博弈的可能的結局。“相對優勢策略”的組合情侶博弈納什均衡局中人單獨改變策略不會得到好處的對局即策略組合,就叫做納什均衡。注意:納什均衡是對局,是雙方策略的組合,而不是這些對局或者策略組合下相應的支付。檢驗納什均衡

盯住一個格子,如果這個格子裏面右上方的數字向右或者向左移動都不變大、這個格子裏面左下方的數字向上或者向下移動也都不變大,那麼這個格子代表的策略組合,就是這個二人博弈的一個納什均衡。移動的方向要注意:例如:情侶博弈的(2,1)。論證否命題

一個策略組合要成為博弈的納什均衡,必須在這個策略組合下所有博弈參與人都沒有單獨改變策略選擇的動機。但要論證一個策略組合不是博弈的納什均衡,只要指出在這個策略組合下有一個博弈參與人有單獨改變策略選擇的動機,就已經足夠。2-6相對優勢策略劃線法

對於策略之間只存在相對優劣關係的二人博弈問題,如果策略集是有限的,比如局中人1有m個策略選擇,局中人2有n個策略選擇,那麼我們可以寫下m行n列共m×n個格子的支付矩陣。那麼,可以採取“相對優勢策略劃線法”(Methodofunderliningrelativelydominant-strategies),找出博弈的納什均衡。相對優勢策略劃線法

對於矩陣表達的二人有限博弈的每個局中人,找出他相對於對手的每種可能的策略選擇的相對優勢策略,並且在對手的這種策略選擇和自己的相對優勢策略組成的具體的策略對局時自己的得益之下,劃一短線。當這樣做完以後,矩陣中兩個支付數字下麵都劃了線的格子所表徵的策略對局,就是這個博弈的納什均衡。

局中人2

上125230局中人1

下712023

對於對手的每一個具體的策略選擇,相對優勢策略總是有的,但是不必唯一。

局中人2

上125230局中人1

下712023

因為“全局優勢策略一定是相對優勢策略”,所以用“劣勢策略消去法’’做出來的“優勢策略均衡”,都可以用“相對優勢策略劃線法”做出來。試:囚徒困境公明博弈需要說明的兩點隨便用什麼方法來標記都可以。原則上,相對優勢策略標記法適用於任何有限博弈,即可用於多人有限博弈。2-1二人同時博弈的三要素局中人,策略,支付的含義和數學表達策略集,策略組合,支付函數,支付向量2-2支付矩陣二人博弈的一般性矩陣表示有限博弈,T.C.Schelling的雙矩陣形式,三人博弈正規型(策略型)博弈定義2-3優勢策略優勢策略,整體的嚴格優勢策略,弱優勢策略劣勢策略,整體的嚴格劣勢策略,弱劣勢策略嚴格劣勢策略逐次消去法(IESDS)2-4優勢策略均衡優勢策略均衡,嚴格優勢策略均衡,公明博弈普通劣勢策略消去法,尋找優勢策略均衡求解的局限2-5相對優勢策略和納什均衡相對優勢策略,納什均衡,檢驗納什均衡2-6相對優勢策略劃線法同時決策博弈(2)2-7箭頭指向法基本思路:對博弈中的每個策略組合進行分析,考察在這個策略組合下各個局中人是否能夠通過單獨改變自己的策略而增加支付。具體操作方法

依次考察矩陣型博弈的每個策略組合,如果在這個策略組合某個局中人能夠通過單獨改變策略選擇增加自己的支付,則從所分析的策略組合下他所對應的支付處引一箭頭,指向他單獨改變策略後新的策略組合下他所對應的支付。當所有策略組合都這樣處理完了以後,沒有箭頭指出去的那些格子表徵的策略組合,就是博弈的納什均衡。-3-3-500-5-1-1抵賴乙甲坦白抵賴坦白12000021芭蕾麗娟大海足球芭蕾足球2-8納什均衡的正式定義

在這個策略組合裏,每個局中人的策略選擇,都是對於其他博弈參與人的策略選擇的組合的最佳策略選擇。這種策略組合,叫做博弈的納什均衡(Nashequilibrium)。納什均衡是非合作博弈理論中最重要的一個概念。策略型博弈的納什均衡定義符號約定:

當策略集不是有限集的時候,無法運用已經學過的劣勢策略消去法,相對優勢策略劃線法和箭頭指問法。但是,對於策略集都是實數的開區間並且支付函數都是可微的多元函數的情形,運用微分方法可以找出納什均衡。策略集都是實數的開區間且支付函數都是可微的多元函數極值的必要條件,是函數的所有偏導數都等於0。連續情形納什均衡的必要條件連續情形納什均衡的檢驗方法例:設一個3人的策略型博弈,每個局中人的策略集都是正實數開區間(0,),他們的策略變數分別是x,y,z,他們的支付函數分別是:求納什均衡解。討論“納什均衡檢驗方法”只是確定納什均衡的一種方法。還有一些納什均衡,不能由它確定。納什均衡檢驗方法的最大缺陷是要求滿足一階條件的“必要解”唯一。但是,必要解不唯一,並不等於博弈不存在納什均衡。例:設一個3人的博弈中,每個局中人的策略集都是正實數開區間(0,),他們的策略變數分別是x,y,z,他們的支付函數分別是:求納什均衡解。2-9“最後歸宿”博弈

a

b

cA221320

甲B312223C023222思考:既然在唯一的納什均衡之下甲的所得為2,那麼如果甲採用策略C豈不更好?要知道,採用策略C,甲之所得為2,是“保了險”的,因為這時候不管乙採用什麼策略,甲都得2。於是甲自作聰明不甘於納什均衡策略,真的採用他以為“旱澇保收”的策略C。會有什麼事情發生?

誰想偏離納什均衡另搞一套,利益角逐的最終結果,還是要回到原來的納什均衡的位置。只有納什均衡才是博弈的穩定對局。2-10納什均衡的應用古諾競爭模型兩個企業之間進行的一個策略型博弈,企業1和企業2,這兩個企業生產同質的產品,共同佔有這種產品的市場。記企業1的產量為,企業2的產量為,則兩個企業的總產量就是。設這種商品的市場需求曲線,a為常數市場的反需求函數設企業生產單位產品的總成本是,其中是正常數,

這是一個寡頭競爭的產量選擇模型,其產品滿足同質性假定。產量是連續變數,因此參與者的策略有無窮多個,無法使用矩陣表的方法求解假定有兩個壟斷者,即此博弈有兩個參與人其支付是利潤,支付函數是產量的函數這個雙寡頭競爭模型表述成一個策略型博弈,其三要素為:兩個局中人:企業1和企業2每個企業的策略集企業的支付函數即其利潤函數:用連續情形納什均衡的檢驗方法來計算納什均衡:可得方程組唯一解:二階導數計算:<0<0

我們真正要尋找的,是市場均衡的產量和價格。我們應該找到滿足市場均衡條件的一組產量和一個市場價格p古諾寡頭競爭模型第i個參與者的產量(策略)第i個參與者的成本Ci(qi),價格是總產量的函數,即P=P(q1+q2)第i個參與人的利潤函數為根據納什均衡的定義,(q1*,q2*)是納什均衡,則有上述問題是一個簡單的最優化求解,可以通過一階必要條件進行分析:一階條件定義了反應函數反應函數的含義就在於:每個企業的最優戰略都是其他企業戰略的函數,是建立在相互影響、相互博弈的基礎上的。反應函數的交點就是納什均衡例如,在反應函數為線性的情況下:具體來說,假定兩個企業具有不變單位成本c,逆需求函數P=a-(q1+q2)

假如沒有競爭,在完全壟斷的情況下:與壟斷相比,寡頭競爭的納什均衡產量比較大,而利潤則相對較小。

對古諾寡頭競爭模型的具體分析囚徒困境問題在企業競爭問題中的體現對比兩人有限博弈的企業產量確定模型假設每個企業都有兩種策略可以選擇:高產量和低產量,企業的收益表如下:得到與產量是連續變數的模型相同的結果,即選擇高產量。高產量低產量高產量600,600800,400低產量400,800700,700Hotelling價格競爭模型考慮不同空間位置上運輸成本的不同,從而造成不同企業產品的“差異性”。企業要決定的是價格,因此,其策略空間都由不同的價格組成,這裏價格是連續變數。要考慮消費者的成本和效用。為使問題簡化,做如下假定:在一個長度為1的線性城市,商品1和商品2分別位於城市的兩端,消費者均勻的分佈在[0,1]區間上,分佈密度為1。兩個商店提供單位產品的成本都為c,消費者購買商品的單位距離成本為t,消費者具有單位需求,消費者剩餘為s。x滿足:p1+tx=p2+t(1-x)商店1的需求情況D1=x,商店2的需求D2=1-x伯川德雙寡頭競爭模型

考慮兩種有差異的產品,假設在企業1和企業2這兩個雙寡頭企業分別選擇價格和的時候,市場對企業的產品的需求為:>

0>

0邊際成本為一個共同的常數<這個雙寡頭競爭模型表述成一個策略型博弈,其三要素為:兩個局中人:企業1和企業2每個企業的策略集是價格,而非產量:企業的支付函數即其利潤函數:2-11納什均衡的觀察與驗證

假設兩個人分一百塊錢,每個人獨立地提出自己要求的數額,並把要求寫在一張紙上,然後由公正的第三方來主持和判定最終的分配結果。規則是這樣的:設為第一個人要求的數額,為第二個人要求的數額,如果,則每個人得到自己要求的數額;否則,兩人一分錢都得不到。請猜測納什均衡的結果。

任何滿足的分配數對(,)都構成這個二人博弈的納什均衡,因此,這個博弈存在無數個納什均衡。

一個有N個人參加的遊戲:每個人可任意放最多100塊錢到一部可以生錢的機器裏,機器把所有人放進去的錢的總和增加到原來的3倍,然後再平分給這N個人。你能猜出這個N人博弈的一個納什均衡並給出相應的證明嗎?當N=1和2時,每個人都願意出100塊錢;當

N4時,沒有人願意出錢。因為當參與分錢的人數大於錢增加的倍數時,對於任何一個參與人,自己出錢是件虧本的事情,只有當參與分錢的人數小於錢增加的倍數時,自己出錢才是划算的。所以沒有人出錢就是納什均衡。

N=3,每人都出100元是這個博弈的一個納什均衡。每個局中人都不出錢,也是一個納什均衡。

採取普通劣勢策略逐次消去法而不是嚴格劣勢策略逐次消去法,往往有可能會遺漏可能的博弈結果。2-12弱劣勢策略消去法的討論嚴格納什均衡和普通納什均衡公明博弈中的一個納什均衡就被普通劣勢策略消去法錯過了。納什均衡也有嚴格納什均衡和普通納什均衡之分。普通納什均衡只是說任何局中人單獨把策略從均衡改變出去沒有好處,不會得到好處。但是,沒有好處也不一定有壞處。在公明博弈中右下方格子就是一個普通納什均衡。嚴格納什均衡不僅是單獨改變沒有好處,而且指那些誰單獨改變策略誰就要倒楣的納什均衡。在公明博弈中左上方格子就是一個嚴格納什均衡。2-7箭頭指向法2-8納什均衡的正式定義策略集都是實數的開區間且支付函數都是可微的多元函數連續情形納什均衡的檢驗方法2-9“最後歸宿”博弈2-10納什均衡的應用古諾競爭模型伯川德雙寡頭競爭模型2-11納什均衡的觀察與驗證2-12弱劣勢策略消去法的討論嚴格納什均衡和普通納什均衡混合策略納什均衡(1)博弈實驗分小組實驗每個小組選擇兩名同學(A和B)玩錘子剪子布的遊戲;另外4名同學負責以下工作:1名同學記錄A分別出錘子剪子布的次數;1名同學記錄A輸和贏的次數;1名同學記錄B分別出錘子剪子布的次數;1名同學記錄B輸和贏的次數。共進行30次每個小組寫下實驗報告,內容包括:A和B選擇不同策略的次數;輸贏的次數;怎麼才能贏?秘訣在於——自己的策略選擇不能預先被對方知道或者猜測到,在該博弈的多次重複中,博弈方一定要避免自己的選擇具有規律性;觀察對手方策略選擇是否具有規律或者偏好,預先猜測對手策略,從而採用針對性策略贏得這個博弈3-1混合策略與期望支付嚴格競爭博弈和混合策略的引進無法用納什均衡概念分析的博弈問題:-1,11,-11,-1-1,1正面反面猜硬幣方蓋硬幣方正面反面取勝關鍵:不能讓另一方猜到自己的策略盡可能猜出對方策略兩人博弈。每人從自己的撲克牌中抽一張,一起翻開。如果顏色一樣。甲輸給乙一根火柴;如果顏色不一樣,甲贏得乙的一根火柴。試分析該博弈納什均衡的情況。混合策略和純策略

每個局中人最合理的做法。是隨機地出紅牌或出黑牌。然後看能不能憑運氣擊敗對手。局中人這種隨機化自己可選策略的做法,就是採取“混合策略”的思想。混合策略和純策略純策略是每個局中人具體明確了一個非隨機性的行動計畫。混合策略是局中人可以按照一定的概率,隨機地從純策略集合中選擇一種純策略作為實際的行動。例:從局中人甲的角度看,他有出紅牌和出黑牌兩種“純策略”,還有以p的概率出紅牌和以1-p的概率出黑牌的“混合策略”。若p=0.4,則甲的混合策略是(p,1-p),即(0.4,0.6),甲以40%的概率出紅牌,以60%的概率出黑牌。甲的混合策略(0,1)就是純策略(只出黑牌)。因此,混合策略概念是純策略概念的推廣。乙的混合策略是(q,1-q)。就是說乙用q的概率出紅牌,用1-q的概率出黑牌。圖示:如果一個局中人有三個純策略可供選擇,選擇三種策略的機會加起來是100%。用兩個字母q和r的組合(q,r,1-q-r)就可把所有可能的策略選擇表達出來。

與混合策略相伴隨的一個問題是局中人支付的不確定性,這就需要期望支付的概念。某數量指標的期望值定義:以發生概率作為權重的所有可能取值的加權平均。補充:聖彼得堡悖論尼古拉斯.伯努利(1713)賭博的參與人擲一個硬幣,直到出現正面向上為止。如果第n次擲硬幣才出現正面向上,則參與人得到2^(n-1)美元。人們願意出多少錢來參加一次這樣的賭博?期望效用理論

對於聖彼得堡悖論的思考,引導經濟學家提出期望效用理論。期望效用理論認為:人們並不直接關心得到多少錢,而是關心這些錢所能帶來的效用。即人們直接關心的不是不確定性收益的期望值,而是由不確定性收益產生的不確定性效用的期望值。數學語言表達

如果主體人對確定性收益x的效用為u(x),那麼主體人對不確定性收益X的效用就為E(u(X))。E(u(X))稱為X的期望效用,常記為EU(X)。將X看作引數,EU(X)稱為期望效用函數。如果不確定性收益X退化成確定性收益x,則EU(X)=u(x),所以EU(X)可以同時表達主體人對確定性收益和不確定性收益的效用。

期望效用理論很好地解答了聖彼得堡悖論。如果一個主體人對確定性收益的效用函數u(x)=ln(x),那麼這個主體人從賭博中得到的期望效用為:

回到撲克對色遊戲

在博弈論中,當局中人並不清楚其他局中人的實際策略選擇時,他的支付便具有了不確定性,為此,他只能通過計算期望支付的方式來預測自己的得益情況,確定自己的策略選擇。甲乙的混合策略如圖:計算甲乙的期望支付。擴展:二人博弈標準型n人參與的策略式博弈混合策略定義

表示局中人

的混合策略空間表示博弈的一個混合策略組合表示局中人在混合策略組合下的期望支付,它是混合策略組合的函數。簡記為πi(p)=πi(pi,p-i)。局中人i的期望支付可以具體定義為:ui(s)是我們在純策略情況中熟悉的當所有局中人採取s這個純策略組合的時候局中人i的支付,而正是所有局中人各自的策略選擇正好組成純策略組合s的概率。混合策略納什均衡

如果p*=(p*1,p*2)是二人博弈的一個納什均衡,它必須滿足:和

有n個局中人參與的同時決策博弈的納什均衡:尋找同時決策有限博弈的混合策略納什均衡3-2反應函數法B的混合策略設定為(q,1-q)時,A的最佳反應函數是:A的混合策略設定為(p,1-p)時,B的最佳反應函數是:

納什均衡是(p*,q*)=(1/2,1/2),即A和B出紅牌還是出黑牌的概率都是一半對一半。情侶博弈的混合納什均衡試用反應函數法找出遺漏的納什均衡。納什均衡之間的取捨純策略納什均衡比混合策略納什均衡具有支付優勢——帕累托優勢。混合策略納什均衡(2)3-3多重納什均衡及其篩選帕累托優勢標準風險優勢標準聚點均衡相關均衡抗共謀均衡顫抖手精煉均衡3-3多重納什均衡及其甄別當博弈出現多重納什均衡時,哪個納什均衡最有可能成為最終的博弈結果?取決於某種能使局中人產生一致性預測的機制或判斷標淮。在現實生活中,人們往往可以通過一些約定俗成的觀念或者某種具有一定合理性的機制,引導博弈的結果朝著比較有利於局中人的方向發展。1.帕累托優勢標準

博弈的某一個納什均衡給所有人帶來的得益都大於其他納什均衡給他們帶來的得益,那麼,每個局中人不僅自己會選擇由該納什均衡所規定的策略,而且預料所有人都會選擇該納什均衡所規定的策略,從而該納什均衡最有可能成為博弈的最終結果。按照支付大小篩選出來的納什均衡,比其他納什均衡具有帕累托優勢。這種標準,稱為帕累托優勢標準。例子:獵人博弈

設想在古代的一個地方,有兩個獵人,那時候,狩獵是人們的主要生計。為了簡單起見,假設主要的獵物只有兩種,鹿和兔子。在古代,人類的狩獵手段越是比較落後,弓箭的威力也有限。在這樣的條件下,進一步假設,兩個獵人一起去獵鹿,才能獵獲一只鹿,如果一個獵人單兵作戰,他只能打到四只兔子。從填飽肚子的角度來說,4只兔子能管4天,一只鹿卻差不多能夠解決一個月的問題。獵人博弈

(獵鹿,獵鹿)的納什均衡比(打兔,打兔)的納什均衡具有帕累托優勢。2.風險優勢標準

考慮不同納什均衡之間的風險狀況,風險小的優先。期望贏利比較法偏離損失比較法(1)期望贏利比較法甲設想:乙採用左策略和右策略的機會是一半對一半。如果甲採用上策略,他的期望贏利將是(9+0)/2=4.5;如果甲採用下策略,他的期望贏利將是(8+7)/2=7.5。

所以,從期望贏利來看,甲採用下策略是比較穩妥的:至少可以得7,運氣好可以得8。如果採用上策略,運氣好固然可以得9,但是運氣不好可就將得0。為了穩妥起見,還是不要冒得0的風險好。可以說:右下角的“甲下乙右”的納什均衡具有風險優勢。(2)偏離損失比較法如果甲從A偏離出去,贏利從6變成5他要損失1;如果甲從B偏離出去,贏利從4變成0他要損失4;如果乙從A偏離出去,贏利從6變成5他要損失1;如果乙從B偏離出去,贏利從4變成0他要損失4。1×1=1<4×4=16,即甲的離A損失×乙的離A損失<甲的離B損失×乙的離B損失可以說:均衡B比均衡A具有風險優勢。帕累托標準與風險優勢的關係

如果在一個博弈中,按照帕累托效率的標準篩選出的納什均衡,與按照風險優勢標準篩選出來的納什均衡不一致時,應當選擇哪一個呢?帕累托優勢標準:A風險優勢:期望贏利比較法:B損失偏離比較法:B

很多人會選擇B。

理由一:人是會犯錯誤的;

理由二:人不喜歡冒大的風險(風險厭惡)。判斷經濟學傳統地研究的是理性行為:

在帕累托標準和風險標準之間,理論給帕累托優勢以優先權,而風險優勢只有在局中人面臨不知道選哪個均衡好的不確定性的時候,才變得重要。當一個均衡具有帕累托優勢的時候,局中人一定選擇這個均衡,不確定性就不存在了。3.聚點均衡

基本思想:在現實生活中,局中人可能會使用某些被博弈模型抽象掉的資訊來達到一個均衡,這些資訊往往跟社會文化習慣、局中人過去博弈的歷史和經歷有關。對於一些既不存在帕累托優劣關係,也不存在風險優劣關係的博弈,人們往往都是利用聚點均衡的思想來指導自己的決策行動。例如:情侶博弈如果今天是男的生日,(足球,足球)可能是一個聚點均衡;而如果是女的生日,(芭蕾,芭蕾)可能是一個聚點均衡。這裏,出現聚點均衡背後的原因是,在女的生日時,男的可能認為應該討女的歡心,而女的也認為男的會認為應該討自己歡心,結果,他們都出現在芭蕾舞廳。例如:靠右或靠左行駛是聚點均衡。具體靠哪邊,要看習俗和默契。例如:通話過程中線路斷了,怎麼辦?路上有兩輛車迎面而行,此時,兩個司機各有兩個選擇:走路的左側和走路的右側。如果在中國,出現(R,R),如果在英國,出現(L,L)。左L左L右R右R1,10,01,10,0乙方甲方

聚點均衡確實反映了人們在多重納什均衡選擇中的某些規律性,但因為它所涉及的方面眾多,往往受博弈雙方文化背景中的習慣或規範的影響,很難總結出具有普遍性的規律,只能具體問題具體分析地討論。4.相關均衡相關均衡的概念首先是由奧蒙(1974)提出的,其基本思想是,局中人通過一個大家都能觀測到的共同信號來選擇行動,由此確定博弈的最終結局。相關均衡往往可能是局中人事前磋商的結果。例如通過到達集合地點的先後次序信號來規定雙方行為,兩個人的選擇就相關了。所以,相關均衡是局中人主動設計某種形式的選擇機制形成制度安排從而確定對局結果的一種均衡選擇。例子:“甲先到,走甲上乙左均衡;乙先到,走甲下乙右均衡”,且雙方都認為對方先到達的概率相等。那麼,每個人的期望支付為3,優於雙方各自來用混合策略時所得到的期望支付2.5。三個納什均衡:(上,左)、(下,右)和混合策略均衡[(1/2,1/2),(1/2,1/2)]相關機制:各1/3概率發信號A、B、C甲能看到是否A,乙能看到是否C

“甲見A採用上,否則下;乙見C採用右,否則左”是一個納什均衡。奧曼證明,如果能在局中人當中設計一種機制,使得每個局中人收到不同的但相關的信號,則每個局中人還可以獲得更高的支付。當甲收到信號A時,他知道乙收到了信號(A,B),因而乙將採用策略“左”,在這種情況下,策略“上”顯然是甲的最優策略;如果甲觀察到信號(B,C),即非A,則他將預期乙會以相同的概率採用策略“左”或策略“右”,此時無論甲選擇策略“上”還是策略“下”,所得到的平均支付都是2.5,因此他會願意採用策略“下”。局中人乙的情況可按照類似的思路驗證。所以,上述“相關規則”構成一個納什均衡。因為按照上述規則,(上,左)、(下,右)和(下,左)這三種結果各以1/3的概率出現,而“壞”結果(上,右)則不會出現,所以每個局中人的期望支付都是5.抗共謀均衡

如果局中人多於兩個,有可能會發生部分局中人聯合起來追求小團體利益的共謀行為,從而導致均衡情況的變化。

博弈的純策略納什均衡:(U,L,A)、(D,R,B)前者帕累托優於後者。(U,L,A)有共謀(coalition)問題:博弈方甲和乙同時偏離。0,0,10-5,-5,0-5,-5,01,1,-5LRUD乙甲丙——A-2,-2,0-5,-5,0-5,-5,0-1,-1,5LRUD乙甲丙——B納什均衡的精髓,是單獨偏離沒有好處。但是在納什均衡要求的單獨偏離沒有好處的情況下,仍然可能存在若干局中人集體偏離或者說共謀偏離的激勵。如果一個納什均衡存在若干局中人集體偏離的激勵,它是博弈的一個不穩定的結果。抗共謀均衡要排除局中人之間共謀的可能性,需要借助“抗共謀均衡”思想。抗共謀納什均衡與一般納什均衡的區別,主要是進一步引入了沒有集體偏離的激勵的要求。一個策略組合是抗共謀納什均衡,不僅要求局中人在這個策略組合下沒有單獨偏離的激勵,且也沒有合夥集體偏離的激勵。純策略納什均衡(U,L,A)不是抗共謀納什均衡。試分析(D,R,B)是抗共謀納什均衡。0,0,10-5,-5,0-5,-5,01,1,-5LRUD乙甲丙——A-2,-2,0-5,-5,0-5,-5,0-1,-1,5LRUD乙甲丙——B結果兩個納什均衡(U,L,A)和(D,R,B)中,(U,L,A)包含共謀偏離的激勵,(D,R,B)排除了共謀偏離的激勵,在這個意義上。(D,R,B)比(U,L,A)更加穩定,所以(D,R,B)這個納什均衡更有理由成為博弈的最終結果,儘管從帕累托效率的意義上考慮(D,R,B)比不上(U,L,A)。強均衡如果在其他局中人的策略選擇給定的條件下,不存在局中人集合的任意一個子集所構成的聯盟,能夠通過聯合偏離當前的策略選擇而增加聯盟中所有成員的支付,那麼這個策略組合就叫作強均衡。強均衡一定是抗共謀均衡,但是抗共謀均衡未必是強均衡。強均衡不一定是帕累托最優的。例子:考慮如下一個三人博弈:參與人分別為甲、乙、丙,每個參與人都有兩個純策略可供選擇:甲可選擇A或者B;乙可選擇C或者D;丙可以選擇E或者F。

兩個純策略納什均衡:(A,C,E)和(B,D,F),而且這兩個納什均衡都是強均衡。但是在(A,C,E)和(B,D,F)之中,強均衡(A,C,E)不是帕累托最優的,因為如果他們轉而採取策略組合(B,D,F),就是一個帕累托改進的過程6.顫抖的手精煉均衡澤爾滕在1975提出了顫抖手精煉均衡或者簡稱顫抖手均衡的概念。基本思想:在任何一個博弈中,每一個局中人都有一定的犯錯誤的可能性。博弈的均衡是否經得起顫抖呢?局中人所選擇的一個策略組合,只有當它在允許每個局中人都可能犯小小的錯誤時仍是所有局中人的最優策略組合時,才是一個足夠穩定的均衡。納什均衡(D,R)只要B有犯錯誤的可能,D就不是局中人A的最優選擇。同樣,只要A有犯錯誤的可能,R就不是局中人B的最優選擇。(U,L)卻是一個顫抖手均衡:無論局中人A犯錯誤的概率有多大,只要犯錯誤的概率小於1,局中人B都沒有激勵要選擇R;同樣地,無論B犯錯誤的概率有多大,只要小於1,局中人A都沒有激勵選擇D。顫抖的手精煉均衡的定義

定義中的必須是嚴格混合策略,即選擇每一個純策略的概率都嚴格為正。條件(1)意味著,儘管每一個局中人i都有可能犯錯誤,但錯誤收斂於0。條件(2)意味著,每一個局中人所選擇的策略pi,不僅在其他人不犯錯誤時是最優的(即符合納什均衡的條件),而且在其他人錯誤地選擇了時也是最優的。例子:考慮每個局中人各有三種純策略可供選擇的如下二人策略型博弈,A有上中下三個策略,B有左中右三個策略。各種策略對陣的得益如圖數字所示。證明:左上方(上策略,左策略)得(4,12)的均衡,是顫抖手精煉納什均衡局中人A的期望支付是:EUA=q[4(m-2)+3+2]/m+r[0(m-2)+2+1]/m+(1-q-r)[3(m-2)+1+2]/m={q[4m-8+3+2]+3r+(1-q-r)[3m-6+1+2]}/m={q[4m-3]+3r+(1-q-r)[3m-3]}/m={4qm-3q+3r+3m-3qm-3rm-3+3q+3r}/m={qm-3r(m-2)+(3m-3)}/m可見,策略組合pA=(q,r,1-q-r)=(1,0,0)的確是局中人A對於局中人B的策略組合=(1-2/m,1/m,1/m)的最優反應。同樣可知,策略組合pB=(s,t,1-s-t)=(1,0,0)是局中人B對於局中人A的策略組合=(1-2/m,1/m,1/m)的最優反應。可見,條件(2)也成立。3-1混合策略與期望支付混合策略和純策略聖彼得堡悖論,期望效用理論n人參與的策略式博弈混合策略定義3-2反應函數法應用支付優勢3-3多重納什均衡及其篩選帕累托優勢標準、風險優勢標準、聚點均衡、相關均衡、抗共謀均衡、顫抖手精煉均衡序貫決策博弈擴展式表述考慮行動的先後順序和博弈歷史,適用於動態博弈。在戰略式基礎上要考慮:行動順序對每次(每階段)行動知道多少,有什麼具體行動可供選擇回顧:戰略式表達參與人集合參與人的戰略集合支付函數不必考慮博弈的動態過程,因此,二人有限博弈矩陣表就可以分析4-1序貫決策博弈與博弈樹擴展式表述要素:參與人集合:i=1,2……參與人的行動順序參與人的行動空間:每次行動都有什麼選擇參與人的資訊集:每次行動時,參與人都知道些什麼參與人的支付函數:是所有行動的函數外生事件(自然選擇)的概率分佈博弈的擴展式表述可以用博弈樹來實現博弈樹的特點是直觀清晰,其優點是可以體現多人博弈過程舉例:以房地產開發為例參與人是A、BA先行,然後是自然選擇市場大小,最後B行動自然選擇的概率分佈為:市場需求大的概率為1/2,需求小的概率1/2。例子:決策有先後的博弈,稱為序貫決策博弈(序貫博弈)。表述為博弈樹的博弈,也叫做展開型表示的博弈。博弈樹描述了所有局中人可以採取的所有可能的行動以及博弈的所有可能的結果。博弈樹由節點(nodes)和棱(edges)組成,節點又分為決策節點(decisionnodes)和末端節點(terminalnodes)。博弈樹以棱把節點連接起來。決策節點是局中人作出決策的地方。每個決策節點都與一個在該決策節點上進行決策的局中人相對應。每棵博弈樹都有一個初始決策節點,初始決策節點也叫做博弈樹的根(root),是博弈開始的地方。末端節點是博弈結束的地方,一個末端節點就是博弈的一個(可能的)結果(outcome)。每一個末端節點,都與一個支付向量相對應,這個向量按分量次序排列博弈的所有參與人在這個結果下的博弈所得。博弈的參與人的數目,就是支付向量的維數。首次行動順序原則:序貫博弈各結果相應的支付向量中,按照每個參與人頭一次決策行動出現先後的自然次序排列收益。博弈樹必須說明在每一個決策節點上相應的局中人能夠採取的所有可能的選擇。一些博弈樹可能包含“不做任何決策”的決策節點。每一個決策節點都有至少一條棱從它那裏出發往後延伸,但是沒有最大延伸數量的限制。對於不是根的每個節點,只能有來自別的節點的唯一的棱指向它這個節點。博弈樹並不要求每個局中人必須在至少一個非末端節點上進行決策。即,可能會出現某些局中人並不在任何一個非末端節點上進行決策的情形。進入障礙博弈一個壟斷企業因為他的產品一直可以賣高價賺取每年10億元的利潤。別的企業為了進入這個壟斷的行業,需要4億元的投資。當別的企業準備進入的時候,原有企業必須決策:或“容忍”新的企業進入,具體表現為他收縮產量以維持高價,這樣他的利潤降為5億元。這時,設對方的利潤也是5億元,減去4億元進入投資,實得1億。或壟斷企業展開商戰“抵抗”,就是加大產量,降低價格,力圖把進入者擠出去,這時原來壟斷企業的利潤降到2億元,即使對方也得2億元,卻不抵投資的4億元,結果虧損2個億。即使對方不進入,壟斷企業也可以採取降價威脅的策略。這時候其的利潤下降為4億元。n人序貫博弈的博弈樹的主要特徵

對於表達有n個局中人P1,P2,…,Pn參與的一個序貫博弈的博弈樹:在樹的每一個非末端節點上,都只有一個局中人進行決策;在樹的每一個末端節點上,都指派了一個n維的“支付”向量p(v)=(p1(v),p2(v),…,p3(v)),這裏v是這個末端節點的相應的策略表達.而1,2,…n是博弈參與人首次決策的自然順序。注意幾點:首先,末端節點並不為任何一個局中人所單獨擁有,末端節點按照一定次序給出所有局中人在這個結果的博弈所得,約定採用首次行動順序原則給出這個次序。博弈樹並不要求每個局中人必須在至少一個非末端節點上進行決策。在一個多人序貫博弈中,可能會出現某些局中人並不在任何一個非末端節點上進行決策的情形。這些局中人因為沒有行動的機會,實際上並不參與博弈,我們仍然把他們稱為博弈的局中人或者參與人,他們實際上是別人的博弈後果的承受者。博弈樹允許從一個非末端節點只伸延出一個棱的情況,在這種情況下,這個非末端節點就是一個實際上不做決策的決策節點。4-2策略與行動策略:參與博弈的各個局中人在進行決策時,可以選擇的方法、做法或經濟活動的水準、量值等。行動:局中人在博弈的某個時點上的決策變數。同時決策博弈,每個局中人的策略就是他能夠採取的行動。序貫決策博弈,策略與行動有區別。序貫決策博弈行動:每一個決策節點上局中人的決策變數或行動的具體選擇。策略:一個完整的行動計畫,就構成局中人在博弈中的一個策略。“進入者”只有一個決策節點,他有兩個純策略可以選擇:進入和不進入。“壟斷者”有四個可能的純策略:不管你怎樣,我總容忍;不管你怎樣,我總對抗;你進我抗,你不進我忍;你進我忍,你不進我抗。壟斷者的這四個純策略,可以簡單描述為四個行動集,每一個行動集都說明壟斷者在他擁有的兩個決策節點上相應的行動。{容忍,容忍}、{抵抗,抵抗}、{抵抗,容忍}、{容忍,抵抗}。4-3序貫博弈的納什均衡男策略:足球;芭蕾女策略:追隨策略:他選擇什麼,我就選擇什麼;對抗策略:他選擇什麼,我就偏不選什麼;芭蕾策略:無論他選什麼,我都選我喜歡的芭蕾;足球策略:無論他選什麼,我都選他喜歡的足球女方策略:八種可能的策略組合粗線表示法箭頭排除確定法均衡與結果均衡與結果是兩個不同的概念:均衡是策略的組合;結果是行動的組合。例如:情侶序貫博弈,其中一個納什均衡是(足球,{足球,芭蕾}),這是一個策略組合,因為它給每個局中人規定了在各種可能發生的情況下應當採取的應對行動,對於每個局中人來講,它都是一個完整的行動方案。按照上述這個均衡策略組合所導致的博弈結果是(足球,足球),即,博弈的最終結局是男女雙方都去看足球。(足球,足球)是行動的組合。同時決策博弈中,由於“策略”選擇等同於“行動”選擇,所以那時候說“均衡”與說“結果”沒有多少不同。至於符號方面,表示策略組合用圓括號,表示結果也用圓括號,但表示策略組合的圓括號裏面的各項是策略,(理應)用花括弧括住,而表示結果的圓括號裏面的各項是行動,不該用花括弧括住。練習策略組合?納什均衡?策略組合策略組合星號簡示法

:(U,{U’,*})2策略組合的節點表示法:({U/D},{U’/D’,U’’/D’’})8({ab/ac/ad},{ch/ck,dp/de},{bf/bg,em/en})4-4倒推法(逆向推導法)在序貫博弈中,由於均衡與結果是兩個不同的概念,所以求解納什均衡的虛線排除確定法(或箭頭排除確定法),並不適用於求解序貫博弈的結果。一般使用倒推法(逆向推導法)求序貫博弈的結果。一般步驟從序貫博弈的最後一個決策階段開始分析,每一次確定出所分析階段局中人的行動選擇和路徑。然後再確定前一階段決策的局中人的行動選擇和路徑。由於倒推法確定的各個局中人

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论