《博弈論簡(jiǎn)介 微觀經(jīng)濟(jì)學(xué)課件 中山大學(xué)張豐教授》由會(huì)員分享,可在線閱讀,更多相關(guān)《博弈論簡(jiǎn)介 微觀經(jīng)濟(jì)學(xué)課件 中山大學(xué)張豐教授(7頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、博弈論簡(jiǎn)介 微觀經(jīng)濟(jì)學(xué)課件PPT 中山大學(xué)張豐教授
博弈論簡(jiǎn)介1、博弈論簡(jiǎn)介至今沒(méi)有一個(gè)理想的模型可以解釋形形色色的寡頭壟斷市場(chǎng),現(xiàn)有工具內(nèi)不能完全解釋寡頭市場(chǎng)或總結(jié)出所謂的主要規(guī)律。為此,人們開(kāi)展出了新的工具,博弈論。博弈論〔Game Theory 〕又名對(duì)策論,游戲論失火了,屋里人很多,你往哪個(gè)門(mén)跑―這就是博弈你的行動(dòng)結(jié)果不僅取決于你的策略選擇,同時(shí)也取決于他人的策略選擇。它研究個(gè)體或組織之間存在利益沖突情況下如何進(jìn)行最優(yōu)決策。1996 年,兩位將博弈論應(yīng)用于不對(duì)稱信息下機(jī)制設(shè)計(jì)的經(jīng)濟(jì)學(xué)家莫里斯(Mirrlees) 和維克里(Vic
2、krey) 獲諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。2001 年三位經(jīng)濟(jì)學(xué)家阿克洛夫(Akerlof) 、斯蒂格利茨(Stiglitz) 和斯賓塞(Spence) 因運(yùn)用博弈論研究信息經(jīng)濟(jì)學(xué)所取得的成就而成為該年度的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主。博弈的分類(lèi)一、靜態(tài)博弈與動(dòng)態(tài)博弈參與者行動(dòng)的先后順序,靜態(tài)博弈是同時(shí)作出決策〔不了解對(duì)手的決策方案〕,動(dòng)態(tài)博弈是參與者先后作出決策〔后行動(dòng)的人知道先行動(dòng)者的行動(dòng)方案〕。二、完全信息博弈與不完全信息博弈對(duì)其他參與者收益支付信息的掌握程度。不完全信息博弈中至少有一人不能確切了解其它決策者收益函數(shù)。三、合作博弈與非合作博弈能否達(dá)成一個(gè)有約束力的協(xié)議,合作博弈強(qiáng)調(diào)集體理性。〔經(jīng)濟(jì)學(xué)主要討論非
3、合作博弈〕四、一次性博弈與重復(fù)博弈博弈重復(fù)屢次進(jìn)行?!沧⒁鈪^(qū)分動(dòng)態(tài)博弈〕博弈的分類(lèi)囚徒困境〔完全信息下的靜態(tài)博弈〕“囚徒的困境〔Prisoners’Dilemma)〞,從博弈論角度看,這是一個(gè)存在占優(yōu)均衡的博弈:因?yàn)閷?duì)囚犯A,B來(lái)說(shuō),無(wú)論對(duì)方如何選擇,“坦白〞都是各自的最優(yōu)選擇。雖然從兩名囚犯共同利益看,最好的選擇是合作,即同時(shí)選擇保持沉默,然而,由于猜忌,試圖獲得更大好處等競(jìng)爭(zhēng)性動(dòng)機(jī)阻礙了它們到達(dá)更好的互利選擇,我們將看到,寡頭壟斷廠商經(jīng)常面臨類(lèi)似的困境。啟示:個(gè)體理性決策常導(dǎo)致集體非理性結(jié)果斗雞博弈假設(shè)兩只公雞遇到一起,每只公雞都有兩個(gè)行動(dòng)選擇:進(jìn)攻或后退。后退是很丟面子的事情,假設(shè)雞甲進(jìn)
4、攻,乙后退,那么甲贏。雙方前進(jìn),兩敗俱傷。3、博弈論中的均衡例:兩個(gè)寡頭進(jìn)行價(jià)格戰(zhàn)博弈的收益矩陣。博弈論中的均衡是一組穩(wěn)定的博弈結(jié)果。雙方均不愿先改變策略。博弈的均衡是穩(wěn)定的,因而是可以預(yù)測(cè)的。納什均衡納什均衡〔非合作性均衡):納什均衡是這樣一組策略,它使所有博弈參與者都不能再提高其收益的狀況。此時(shí),雙方在對(duì)方給定的策略下均不愿意調(diào)整自己的策略。下例中,A有占優(yōu)策略即正常價(jià)格策略,而廠商B沒(méi)有占優(yōu)策略,它必須根據(jù)A的占優(yōu)策略來(lái)確定其戰(zhàn)略選擇,即其選擇受A的選擇的影響。多個(gè)均衡和沒(méi)有均衡一個(gè)博弈可能有好幾個(gè)納什均衡〔即幾組穩(wěn)定并且自我堅(jiān)持的策略〕,有時(shí)又可能不存在〔純策略的〕納什均衡。甲表存在兩
5、個(gè)納什均衡:其中“上,左〞是納什均衡〔A選上,那么B選左;且B選左時(shí)A仍應(yīng)選上〕;“下,右〞也是納什均衡〔A選下,那么B選右;且B選右時(shí)A仍應(yīng)選下〕。如某個(gè)博弈只有一個(gè)納什均衡點(diǎn),這個(gè)博弈的結(jié)果是可以預(yù)測(cè)的,如有兩個(gè)或以上的納什均衡點(diǎn),那么博弈結(jié)果無(wú)法預(yù)測(cè)。乙表沒(méi)有納什均衡。如A選“上〞,B那么選“左〞;然而當(dāng)B選“左〞時(shí),A卻應(yīng)中選“下〞。反之,A選“下〞時(shí),B應(yīng)選“右〞;然而當(dāng)B選右時(shí),A又應(yīng)選“上〞。沒(méi)有均衡點(diǎn)。占優(yōu)均衡與納什均衡的區(qū)別4、最大最小策略迄今為止,對(duì)廠商行為的分析都建立在利潤(rùn)最大化根底上。但在一些競(jìng)爭(zhēng)劇烈的寡頭壟斷市場(chǎng),馮??諾依曼和摩根斯坦認(rèn)為決策者也可能采取一種風(fēng)險(xiǎn)厭惡
6、策略。即確保在最壞的結(jié)果中得到最好的結(jié)果。這種決策規(guī)那么稱最大最小策略〔imin Strategy) :博弈者在可能最少的利潤(rùn)方案中選擇利潤(rùn)最大的方案。最大最小策略的結(jié)果并不是兩種納什均衡中的一種。原因是這種決策所用的準(zhǔn)那么,不是利潤(rùn)最大化,而是防止虧損過(guò)多。不同的決策目標(biāo)可能導(dǎo)致人們選擇不同的策略,最終導(dǎo)致不同的博弈結(jié)果。5、重復(fù)剔除嚴(yán)格劣戰(zhàn)略“重復(fù)剔除嚴(yán)格劣戰(zhàn)略〞的思路:首先找出博弈參與人的劣戰(zhàn)略(dominated strategy) 〔假定存在的話〕,把這個(gè)劣戰(zhàn)略剔除后,剩下的是一個(gè)不包含已剔除劣戰(zhàn)略的新的博弈;然后在剔除這個(gè)新的博弈中的劣戰(zhàn)略;繼續(xù)這個(gè)過(guò)程,直到?jīng)]有劣戰(zhàn)略存在。如果剩
7、下的戰(zhàn)略組合是唯一的,這個(gè)唯一的戰(zhàn)略組合就是“重復(fù)剔除占優(yōu)均衡〞。如果這樣的解存在,我們說(shuō)該博弈是“重復(fù)剔除占優(yōu)可解的〞。普林斯頓大學(xué)的一道習(xí)題題目:如果給你兩個(gè)師的兵力,由你來(lái)當(dāng)“司令〞,任務(wù)是攻克“敵人〞占據(jù)的一座城市而敵軍的守備力量是三個(gè)師,規(guī)定雙方的兵力只能整師調(diào)動(dòng)。通往城市的道路只有甲乙兩條。當(dāng)你發(fā)起攻擊的時(shí)候,你的兵力超過(guò)敵人,你就獲勝;你的兵力比敵人的守備兵力少或者相等,你就失敗。那么,你將如何制定攻城方案? 6、重復(fù)博弈“囚徒的困境〞暗含有一次性博弈假定,結(jié)果陷入了個(gè)體理性決策導(dǎo)致集體非理性結(jié)果的困境?,F(xiàn)在我們改變假定條件,討論博弈可以屢次進(jìn)行的重復(fù)博弈〔Repeated G
8、ame) 。如,囚徒困境博弈中,假定博弈或重復(fù)屢次,A對(duì)B宣布如下方針:我將選擇沉默,并要求你也如此來(lái)增進(jìn)各自利益;然而,如果你半途背叛選擇坦白,我從下一階段游戲開(kāi)始便一直采取坦白。這一方針與A利益一致,因而是可信的。重復(fù)博弈中,聲譽(yù)〔名聲〕十分重要從B角度來(lái)看,和A合作可在每階段得到較好結(jié)果;中途變卦,固然當(dāng)期可得更好結(jié)果,但此后便每次面臨更壞的后果,顯然是不利的。因而,重復(fù)性博弈中,“沉默+沉默〞點(diǎn)可能成為對(duì)雙方最正確選擇,因而成為納什均衡點(diǎn)。――由于博弈條件由一次性變?yōu)橹貜?fù)性,均衡狀態(tài)隨之發(fā)生變化。欺騙一次對(duì)方就會(huì)警覺(jué),導(dǎo)致合作失敗。在重復(fù)博弈中,名聲對(duì)得出什么樣的結(jié)果十分重要。7、混合
9、策略博弈--- 警察與小偷某警察負(fù)責(zé)A、B兩地治安,兩地相隔較遠(yuǎn),他每晚只能去一個(gè)地方巡邏,該地區(qū)有一小偷,他每晚也只能選擇偷一個(gè)地方,A地財(cái)產(chǎn)價(jià)格2萬(wàn)元,B地財(cái)產(chǎn)價(jià)格1萬(wàn)元,假設(shè)警察選A地巡邏,而小偷也選擇去了A地,那么會(huì)放棄偷竊,警察保全了3萬(wàn)元財(cái)產(chǎn);假設(shè)警察選擇A巡邏,小偷去了B地,那么B地財(cái)產(chǎn)被盜。問(wèn):警察如何巡邏效果最好?8、言語(yǔ)博弈:威脅和承諾為了在博弈中獲得對(duì)已有利的結(jié)果,往往會(huì)產(chǎn)生“威脅〞和“承諾〞的行為。語(yǔ)言哲學(xué)認(rèn)為,語(yǔ)言就是行動(dòng)。言語(yǔ)博弈涉及:聲稱的策略和實(shí)際的策略?,F(xiàn)實(shí)中,各國(guó)的外交聲明,企業(yè)發(fā)出的威脅等。伊拉克對(duì)美國(guó):如果你打我們,我就使用大規(guī)模殺傷性武器。臺(tái)灣問(wèn)題:美
10、國(guó)聲稱,如果中國(guó)武力攻打臺(tái)灣,美國(guó)將介入。中國(guó)聲稱,是否收回臺(tái)灣是中國(guó)內(nèi)政,中國(guó)原來(lái)的不率先使用核武器的聲明在國(guó)內(nèi)戰(zhàn)爭(zhēng)中不適用,溫家寶的“不惜一切代價(jià)〞。中國(guó)“不首先使用核武器〞的承諾。阻止市場(chǎng)進(jìn)入的威脅公司之間經(jīng)常相互發(fā)出信號(hào)以說(shuō)明他們的意圖、動(dòng)機(jī)和目標(biāo)。有些信號(hào)是威脅性的。只有威脅變得可信時(shí)才會(huì)生效。假定在一個(gè)市場(chǎng)中,某企業(yè)是市場(chǎng)壟斷者。現(xiàn)在有另一企業(yè)作為潛在的競(jìng)爭(zhēng)者,試圖進(jìn)入這個(gè)市場(chǎng)。對(duì)壟斷者來(lái)說(shuō),會(huì)設(shè)法阻止?jié)撛诟?jìng)爭(zhēng)者的進(jìn)入。在這個(gè)博弈中,潛在競(jìng)爭(zhēng)者有兩種策略可以選擇,即進(jìn)入或不進(jìn)入;壟斷者也有兩種策略,或者與進(jìn)入者打一場(chǎng)價(jià)格戰(zhàn),或者默許它的進(jìn)入。該博弈的策略選擇順序是:首先由潛在進(jìn)入者
11、作出進(jìn)入市場(chǎng)或不進(jìn)入市場(chǎng)的選擇,然后再由壟斷者來(lái)決定是默許它的進(jìn)入還是與進(jìn)入者進(jìn)行一場(chǎng)價(jià)格戰(zhàn)。這個(gè)博弈的得益矩陣如表所示。 上述博弈有兩個(gè)納什均衡點(diǎn)〔紅、藍(lán)〕,但由于是動(dòng)態(tài)博弈,〔價(jià)格戰(zhàn),不進(jìn)入〕被淘汰,動(dòng)態(tài)博弈的均衡---- 子博弈精練納什均衡得以實(shí)現(xiàn)?!矟蔂栻v的奉獻(xiàn)〕 壟斷者能阻止市場(chǎng)進(jìn)入嗎?一種策略是,壟斷者對(duì)潛在進(jìn)入者進(jìn)行威脅?!叭绻氵M(jìn)入市場(chǎng),我將采取價(jià)格戰(zhàn)的策略。〞 但面對(duì)如上表的得益矩陣,壟斷者的威脅是不可信的。潛在進(jìn)入者認(rèn)為一旦進(jìn)入發(fā)生,壟斷者并不會(huì)選擇商戰(zhàn)的策略,而只會(huì)默許它的進(jìn)入。因此,壟斷者的這種聲明并不能到達(dá)它阻止進(jìn)入的目的,進(jìn)入者仍然會(huì)進(jìn)入市場(chǎng)。這種威脅被稱為空頭威脅
12、承諾與可信性承諾,是指對(duì)局者所采取的某種行動(dòng),這種行動(dòng)使其威脅成為一種令人可信的威脅。與承諾行動(dòng)相比,空頭威脅無(wú)法有效阻止市場(chǎng)進(jìn)入的主要原因是,它不需要任何本錢(qián)。阻止市場(chǎng)進(jìn)入的有效承諾就是就是通過(guò)投資來(lái)形成一局部剩余的生產(chǎn)能力。這局部生產(chǎn)能力在沒(méi)有其他企業(yè)進(jìn)入市場(chǎng)的時(shí)候是多余的,但在進(jìn)入發(fā)生時(shí)那么成為其低價(jià)競(jìng)爭(zhēng)的有力武器。生產(chǎn)能力的擴(kuò)大需要額外的投入,我們假定壟斷者需要投資800 萬(wàn)元來(lái)實(shí)行這個(gè)承諾。這一投資將改變博弈的得益矩陣,新的得益矩陣如下表。表實(shí)行承諾后的阻止市場(chǎng)進(jìn)入博弈承諾能夠阻止市場(chǎng)進(jìn)入的關(guān)鍵在于它是可信的。擴(kuò)大投資需要花費(fèi)較大的代價(jià),但在某些情況下,只要承諾是可信的,其代價(jià)反而可
13、能會(huì)小。策略1:警察只對(duì)A巡邏,這樣可保住2萬(wàn)元的財(cái)產(chǎn)不被竊。這個(gè)做法是最優(yōu)的嗎?有沒(méi)有改良的措施?改良策略:既去A地,又去B地。那么去A地多少次,B地多少次最優(yōu)?〔3,0〕〔1,2〕巡邏B地〔2,1〕〔3,0〕巡邏A地盜竊B地盜竊A地小偷警察對(duì)上例,警察的最好做法是:通過(guò)擲骰子決定去A地還是B地,1/3 的時(shí)機(jī)去B地,2/3 的時(shí)機(jī)去A地?!矊?duì)6個(gè)面的骰子,1-4 點(diǎn)去A地,5、6點(diǎn)去B地?!硨?duì)小偷也是如此,擲骰子來(lái)決定是偷什么地方,只是1-4 點(diǎn)去B地,5、6點(diǎn)去A地。警察和小偷的損益分析:警察到A地時(shí),小偷有1/3 時(shí)機(jī)到A,2/3 時(shí)機(jī)去B,此時(shí)警察得益: 同理警察到B地時(shí),得益也為
14、7/3 。由于警察到A的可能為2/3 ,到B的可能為1/3 ,其總得益為:可以看出警察的總得益大于2,該策略優(yōu)于只巡邏A的策略1。小偷的得益有什么改變呢?〔2/3 〕該博弈為零和博弈〔一方之所得,即為另一方之所失〕,只有混和策略均衡點(diǎn),不會(huì)有純策略的納什均衡點(diǎn)。警察與小偷博弈如同剪刀-石頭-布游戲,或猜拳游戲,是混合策略博弈,參與者在多種備選策略中隨機(jī)選擇。在這樣的游戲中,不存在純策略均衡〔不能選擇單一策略〕,對(duì)每個(gè)人來(lái)說(shuō),出剪刀、布、還是石頭的策略應(yīng)當(dāng)是隨機(jī)的,不能讓對(duì)方知道自己的策略,哪怕是策略的“傾向性〞,如果對(duì)方知道你出哪一個(gè)策略的可能性較大,你在游戲中輸?shù)目赡苄跃驮龃蟆?200 ,600 900 ,1100 0 ,3000 0 ,3000 進(jìn)入潛在進(jìn)入者不進(jìn)入壟斷者價(jià)格戰(zhàn)不打價(jià)格戰(zhàn)-400 ,400 900 ,300 0 ,2200 0 ,2200 進(jìn)入潛在進(jìn)入者不進(jìn)入壟斷者價(jià)格戰(zhàn)默許* 博弈論是50 年代數(shù)學(xué)家馮??諾依曼和經(jīng)濟(jì)學(xué)家?jiàn)W斯卡??摩根斯坦首先提出的。在經(jīng)濟(jì)學(xué)