《博弈論簡介 微觀經(jīng)濟學課件 中山大學張豐教授》由會員分享,可在線閱讀,更多相關《博弈論簡介 微觀經(jīng)濟學課件 中山大學張豐教授(7頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、博弈論簡介 微觀經(jīng)濟學課件PPT 中山大學張豐教授
博弈論簡介1、博弈論簡介至今沒有一個理想的模型可以解釋形形色色的寡頭壟斷市場,現(xiàn)有工具內(nèi)不能完全解釋寡頭市場或總結出所謂的主要規(guī)律。為此,人們開展出了新的工具,博弈論。博弈論〔Game Theory 〕又名對策論,游戲論失火了,屋里人很多,你往哪個門跑―這就是博弈你的行動結果不僅取決于你的策略選擇,同時也取決于他人的策略選擇。它研究個體或組織之間存在利益沖突情況下如何進行最優(yōu)決策。1996 年,兩位將博弈論應用于不對稱信息下機制設計的經(jīng)濟學家莫里斯(Mirrlees) 和維克里(Vic
2、krey) 獲諾貝爾經(jīng)濟學獎。2001 年三位經(jīng)濟學家阿克洛夫(Akerlof) 、斯蒂格利茨(Stiglitz) 和斯賓塞(Spence) 因運用博弈論研究信息經(jīng)濟學所取得的成就而成為該年度的諾貝爾經(jīng)濟學獎得主。博弈的分類一、靜態(tài)博弈與動態(tài)博弈參與者行動的先后順序,靜態(tài)博弈是同時作出決策〔不了解對手的決策方案〕,動態(tài)博弈是參與者先后作出決策〔后行動的人知道先行動者的行動方案〕。二、完全信息博弈與不完全信息博弈對其他參與者收益支付信息的掌握程度。不完全信息博弈中至少有一人不能確切了解其它決策者收益函數(shù)。三、合作博弈與非合作博弈能否達成一個有約束力的協(xié)議,合作博弈強調(diào)集體理性?!步?jīng)濟學主要討論非
3、合作博弈〕四、一次性博弈與重復博弈博弈重復屢次進行?!沧⒁鈪^(qū)分動態(tài)博弈〕博弈的分類囚徒困境〔完全信息下的靜態(tài)博弈〕“囚徒的困境〔Prisoners’Dilemma)〞,從博弈論角度看,這是一個存在占優(yōu)均衡的博弈:因為對囚犯A,B來說,無論對方如何選擇,“坦白〞都是各自的最優(yōu)選擇。雖然從兩名囚犯共同利益看,最好的選擇是合作,即同時選擇保持沉默,然而,由于猜忌,試圖獲得更大好處等競爭性動機阻礙了它們到達更好的互利選擇,我們將看到,寡頭壟斷廠商經(jīng)常面臨類似的困境。啟示:個體理性決策常導致集體非理性結果斗雞博弈假設兩只公雞遇到一起,每只公雞都有兩個行動選擇:進攻或后退。后退是很丟面子的事情,假設雞甲進
4、攻,乙后退,那么甲贏。雙方前進,兩敗俱傷。3、博弈論中的均衡例:兩個寡頭進行價格戰(zhàn)博弈的收益矩陣。博弈論中的均衡是一組穩(wěn)定的博弈結果。雙方均不愿先改變策略。博弈的均衡是穩(wěn)定的,因而是可以預測的。納什均衡納什均衡〔非合作性均衡):納什均衡是這樣一組策略,它使所有博弈參與者都不能再提高其收益的狀況。此時,雙方在對方給定的策略下均不愿意調(diào)整自己的策略。下例中,A有占優(yōu)策略即正常價格策略,而廠商B沒有占優(yōu)策略,它必須根據(jù)A的占優(yōu)策略來確定其戰(zhàn)略選擇,即其選擇受A的選擇的影響。多個均衡和沒有均衡一個博弈可能有好幾個納什均衡〔即幾組穩(wěn)定并且自我堅持的策略〕,有時又可能不存在〔純策略的〕納什均衡。甲表存在兩
5、個納什均衡:其中“上,左〞是納什均衡〔A選上,那么B選左;且B選左時A仍應選上〕;“下,右〞也是納什均衡〔A選下,那么B選右;且B選右時A仍應選下〕。如某個博弈只有一個納什均衡點,這個博弈的結果是可以預測的,如有兩個或以上的納什均衡點,那么博弈結果無法預測。乙表沒有納什均衡。如A選“上〞,B那么選“左〞;然而當B選“左〞時,A卻應中選“下〞。反之,A選“下〞時,B應選“右〞;然而當B選右時,A又應選“上〞。沒有均衡點。占優(yōu)均衡與納什均衡的區(qū)別4、最大最小策略迄今為止,對廠商行為的分析都建立在利潤最大化根底上。但在一些競爭劇烈的寡頭壟斷市場,馮??諾依曼和摩根斯坦認為決策者也可能采取一種風險厭惡
6、策略。即確保在最壞的結果中得到最好的結果。這種決策規(guī)那么稱最大最小策略〔imin Strategy) :博弈者在可能最少的利潤方案中選擇利潤最大的方案。最大最小策略的結果并不是兩種納什均衡中的一種。原因是這種決策所用的準那么,不是利潤最大化,而是防止虧損過多。不同的決策目標可能導致人們選擇不同的策略,最終導致不同的博弈結果。5、重復剔除嚴格劣戰(zhàn)略“重復剔除嚴格劣戰(zhàn)略〞的思路:首先找出博弈參與人的劣戰(zhàn)略(dominated strategy) 〔假定存在的話〕,把這個劣戰(zhàn)略剔除后,剩下的是一個不包含已剔除劣戰(zhàn)略的新的博弈;然后在剔除這個新的博弈中的劣戰(zhàn)略;繼續(xù)這個過程,直到?jīng)]有劣戰(zhàn)略存在。如果剩
7、下的戰(zhàn)略組合是唯一的,這個唯一的戰(zhàn)略組合就是“重復剔除占優(yōu)均衡〞。如果這樣的解存在,我們說該博弈是“重復剔除占優(yōu)可解的〞。普林斯頓大學的一道習題題目:如果給你兩個師的兵力,由你來當“司令〞,任務是攻克“敵人〞占據(jù)的一座城市而敵軍的守備力量是三個師,規(guī)定雙方的兵力只能整師調(diào)動。通往城市的道路只有甲乙兩條。當你發(fā)起攻擊的時候,你的兵力超過敵人,你就獲勝;你的兵力比敵人的守備兵力少或者相等,你就失敗。那么,你將如何制定攻城方案? 6、重復博弈“囚徒的困境〞暗含有一次性博弈假定,結果陷入了個體理性決策導致集體非理性結果的困境?,F(xiàn)在我們改變假定條件,討論博弈可以屢次進行的重復博弈〔Repeated G
8、ame) 。如,囚徒困境博弈中,假定博弈或重復屢次,A對B宣布如下方針:我將選擇沉默,并要求你也如此來增進各自利益;然而,如果你半途背叛選擇坦白,我從下一階段游戲開始便一直采取坦白。這一方針與A利益一致,因而是可信的。重復博弈中,聲譽〔名聲〕十分重要從B角度來看,和A合作可在每階段得到較好結果;中途變卦,固然當期可得更好結果,但此后便每次面臨更壞的后果,顯然是不利的。因而,重復性博弈中,“沉默+沉默〞點可能成為對雙方最正確選擇,因而成為納什均衡點。――由于博弈條件由一次性變?yōu)橹貜托?,均衡狀態(tài)隨之發(fā)生變化。欺騙一次對方就會警覺,導致合作失敗。在重復博弈中,名聲對得出什么樣的結果十分重要。7、混合
9、策略博弈--- 警察與小偷某警察負責A、B兩地治安,兩地相隔較遠,他每晚只能去一個地方巡邏,該地區(qū)有一小偷,他每晚也只能選擇偷一個地方,A地財產(chǎn)價格2萬元,B地財產(chǎn)價格1萬元,假設警察選A地巡邏,而小偷也選擇去了A地,那么會放棄偷竊,警察保全了3萬元財產(chǎn);假設警察選擇A巡邏,小偷去了B地,那么B地財產(chǎn)被盜。問:警察如何巡邏效果最好?8、言語博弈:威脅和承諾為了在博弈中獲得對已有利的結果,往往會產(chǎn)生“威脅〞和“承諾〞的行為。語言哲學認為,語言就是行動。言語博弈涉及:聲稱的策略和實際的策略?,F(xiàn)實中,各國的外交聲明,企業(yè)發(fā)出的威脅等。伊拉克對美國:如果你打我們,我就使用大規(guī)模殺傷性武器。臺灣問題:美
10、國聲稱,如果中國武力攻打臺灣,美國將介入。中國聲稱,是否收回臺灣是中國內(nèi)政,中國原來的不率先使用核武器的聲明在國內(nèi)戰(zhàn)爭中不適用,溫家寶的“不惜一切代價〞。中國“不首先使用核武器〞的承諾。阻止市場進入的威脅公司之間經(jīng)常相互發(fā)出信號以說明他們的意圖、動機和目標。有些信號是威脅性的。只有威脅變得可信時才會生效。假定在一個市場中,某企業(yè)是市場壟斷者。現(xiàn)在有另一企業(yè)作為潛在的競爭者,試圖進入這個市場。對壟斷者來說,會設法阻止?jié)撛诟偁幷叩倪M入。在這個博弈中,潛在競爭者有兩種策略可以選擇,即進入或不進入;壟斷者也有兩種策略,或者與進入者打一場價格戰(zhàn),或者默許它的進入。該博弈的策略選擇順序是:首先由潛在進入者
11、作出進入市場或不進入市場的選擇,然后再由壟斷者來決定是默許它的進入還是與進入者進行一場價格戰(zhàn)。這個博弈的得益矩陣如表所示。 上述博弈有兩個納什均衡點〔紅、藍〕,但由于是動態(tài)博弈,〔價格戰(zhàn),不進入〕被淘汰,動態(tài)博弈的均衡---- 子博弈精練納什均衡得以實現(xiàn)?!矟蔂栻v的奉獻〕 壟斷者能阻止市場進入嗎?一種策略是,壟斷者對潛在進入者進行威脅?!叭绻氵M入市場,我將采取價格戰(zhàn)的策略。〞 但面對如上表的得益矩陣,壟斷者的威脅是不可信的。潛在進入者認為一旦進入發(fā)生,壟斷者并不會選擇商戰(zhàn)的策略,而只會默許它的進入。因此,壟斷者的這種聲明并不能到達它阻止進入的目的,進入者仍然會進入市場。這種威脅被稱為空頭威脅
12、承諾與可信性承諾,是指對局者所采取的某種行動,這種行動使其威脅成為一種令人可信的威脅。與承諾行動相比,空頭威脅無法有效阻止市場進入的主要原因是,它不需要任何本錢。阻止市場進入的有效承諾就是就是通過投資來形成一局部剩余的生產(chǎn)能力。這局部生產(chǎn)能力在沒有其他企業(yè)進入市場的時候是多余的,但在進入發(fā)生時那么成為其低價競爭的有力武器。生產(chǎn)能力的擴大需要額外的投入,我們假定壟斷者需要投資800 萬元來實行這個承諾。這一投資將改變博弈的得益矩陣,新的得益矩陣如下表。表實行承諾后的阻止市場進入博弈承諾能夠阻止市場進入的關鍵在于它是可信的。擴大投資需要花費較大的代價,但在某些情況下,只要承諾是可信的,其代價反而可
13、能會小。策略1:警察只對A巡邏,這樣可保住2萬元的財產(chǎn)不被竊。這個做法是最優(yōu)的嗎?有沒有改良的措施?改良策略:既去A地,又去B地。那么去A地多少次,B地多少次最優(yōu)?〔3,0〕〔1,2〕巡邏B地〔2,1〕〔3,0〕巡邏A地盜竊B地盜竊A地小偷警察對上例,警察的最好做法是:通過擲骰子決定去A地還是B地,1/3 的時機去B地,2/3 的時機去A地?!矊?個面的骰子,1-4 點去A地,5、6點去B地?!硨π⊥狄彩侨绱耍瑪S骰子來決定是偷什么地方,只是1-4 點去B地,5、6點去A地。警察和小偷的損益分析:警察到A地時,小偷有1/3 時機到A,2/3 時機去B,此時警察得益: 同理警察到B地時,得益也為
14、7/3 。由于警察到A的可能為2/3 ,到B的可能為1/3 ,其總得益為:可以看出警察的總得益大于2,該策略優(yōu)于只巡邏A的策略1。小偷的得益有什么改變呢?〔2/3 〕該博弈為零和博弈〔一方之所得,即為另一方之所失〕,只有混和策略均衡點,不會有純策略的納什均衡點。警察與小偷博弈如同剪刀-石頭-布游戲,或猜拳游戲,是混合策略博弈,參與者在多種備選策略中隨機選擇。在這樣的游戲中,不存在純策略均衡〔不能選擇單一策略〕,對每個人來說,出剪刀、布、還是石頭的策略應當是隨機的,不能讓對方知道自己的策略,哪怕是策略的“傾向性〞,如果對方知道你出哪一個策略的可能性較大,你在游戲中輸?shù)目赡苄跃驮龃蟆?200 ,600 900 ,1100 0 ,3000 0 ,3000 進入潛在進入者不進入壟斷者價格戰(zhàn)不打價格戰(zhàn)-400 ,400 900 ,300 0 ,2200 0 ,2200 進入潛在進入者不進入壟斷者價格戰(zhàn)默許* 博弈論是50 年代數(shù)學家馮??諾依曼和經(jīng)濟學家奧斯卡??摩根斯坦首先提出的。在經(jīng)濟學