歡迎來到裝配圖網(wǎng)! | 幫助中心 裝配圖網(wǎng)zhuangpeitu.com!
裝配圖網(wǎng)
ImageVerifierCode 換一換
首頁 裝配圖網(wǎng) > 資源分類 > PPTX文檔下載  

序貫決策博弈相關(guān)知識

  • 資源ID:249632550       資源大小:135.53KB        全文頁數(shù):41頁
  • 資源格式: PPTX        下載積分:15積分
快捷下載 游客一鍵下載
會員登錄下載
微信登錄下載
三方登錄下載: 微信開放平臺登錄 支付寶登錄   QQ登錄   微博登錄  
二維碼
微信掃一掃登錄
下載資源需要15積分
郵箱/手機:
溫馨提示:
用戶名和密碼都是您填寫的郵箱或者手機號,方便查詢和重復下載(系統(tǒng)自動生成)
支付方式: 支付寶    微信支付   
驗證碼:   換一換

 
賬號:
密碼:
驗證碼:   換一換
  忘記密碼?
    
友情提示
2、PDF文件下載后,可能會被瀏覽器默認打開,此種情況可以點擊瀏覽器菜單,保存網(wǎng)頁到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站資源下載后的文檔和圖紙-無水印,預覽文檔經(jīng)過壓縮,下載后原文更清晰。
5、試題試卷類文檔,如果標題沒有明確說明有答案則都視為沒有答案,請知曉。

序貫決策博弈相關(guān)知識

Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,*,單擊此處編輯母版標題樣式,*,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,第四章 序貫決策博弈,序貫決策博弈:局中人做出策略選擇時知道對手的策略選擇。,實驗:槍手博弈1,三個快槍手相互之間的仇恨到了不可調(diào)和的地步。這天他們?nèi)诮稚喜黄诙?,每個人的手都握住了槍把,一場生死決斗馬上就要開始,已知這三個人中甲槍法精準,十發(fā)八中;乙的槍法也不錯,十發(fā)六中,丙的槍法拙劣,十發(fā)四中。假如三個人同時開槍,決一死戰(zhàn),一槍后誰最后活下來的機會大一些?,實 驗:槍手博弈2,假設(shè)現(xiàn)在三個槍手決定輪流開槍,誰活下來的機會大一些?,實 驗:海 盜 分 寶,五個海盜搶到100顆寶石,他們決定按如下方法來分配:先抽簽決定順序(1,2,3,4,5);然后先由1號提出分配方案,其余的人進行表決,當且僅當半數(shù)和超過半數(shù)的人同意時,則按1號所提方案分配,否則將1號扔進大海喂鯊魚,當1號方案被否決,則由2號提出分配方案,其余的人進行表決,以此類推,假定這些海盜都是理性人,問第一個海盜應提出怎樣的分配方案才能獲得通過并使自己的收益最大?,本章討論動態(tài)博弈,所有博弈方都對博弈過程和得益完全了解的完全且完美信息動態(tài)博弈。這類博弈也是現(xiàn)實中常見的基本博弈類型。由于動態(tài)博弈中博弈方的選擇、行為有先后次序,因此在表示方法、利益關(guān)系、分析方法和均衡概念等方面,都與靜態(tài)博弈有很大區(qū)別。本章對動態(tài)博弈分析的概念和方法,特別是,子博弈完美均衡和逆推歸納法作系統(tǒng)介紹,并介紹各種經(jīng)典的動態(tài)博弈模型。,主要內(nèi)容,1、,序貫博弈的定義和表示方法,2、尋找序貫博弈納什均衡的“箭頭排除確定法”(舊版教材上稱為虛線排除確定法),3、尋找序貫博弈納什均衡的“倒推法”,4、先動優(yōu)勢和后動優(yōu)勢,5、“倒推法”的缺陷,一、序貫博弈的定義和表示方法,假如某個壟斷企業(yè)一年可以賺10億元的利潤,假定別的企業(yè)為了進入該行業(yè)需要投資4億元。當新的企業(yè)準備進入時,原有壟斷企業(yè)有兩種決策,(1),“容忍”,但利潤要變?yōu)?億元。這時新的企業(yè)可以得5億,減去4億投資,仍有1億。,(2)“抵抗”,例如降低價格,企業(yè)的利潤變?yōu)?億元,且新的企業(yè)也只得2億,但減去投資,虧損2億。,誰先動?潛在進入者,簡稱“進入者”,如何表示該博弈?,分析“進入者”和“壟斷者”的純策略。,博 弈 樹,用博弈樹來表示序貫博弈。,它描述了博弈參與人的一個序貫決策過程,從博弈數(shù)的根開始,到末端點結(jié)束。,擁有初始決策節(jié)點的局中人先做出決策,他的決策引出博弈樹的棱,而棱的末端將是下一個局中人做出決策,依此類推。,進入障礙博弈,進入者,進入,不進,壟斷者,容忍,抵抗,容忍,抵抗,(1,5),(-2,2),(0,10),(0,4),壟斷者,a,b,c,“進入者”和“壟斷者”的純策略,“進入者”的有兩個純策略:進入和不進入,“壟斷者”的有四個純策略:,不管你怎樣,我總是容忍容忍,容忍,不管你怎樣,我總是對抗對抗,對抗,你進我對抗,你不進我忍對抗,容忍,你進我忍,你不進我對抗容忍,對抗,注:花括號第一項表示壟斷者在上決策節(jié)點b,即進入者選擇進入時他要選擇的行動,第二項表示壟斷者在下決策節(jié)點c,即進入者選擇不進入時他要選擇的行動。,假設(shè)壟,斷,斷企業(yè),的,的老板,交,交給你,這,這樣的,策,策略:對抗,,,,容忍,你,明,明白應,該,該如何,行,行動嗎,?,?,策略就,是,是一個,完,完整的,行,行動計,劃,劃,使,得,得你可,以,以把它,交,交給另,外,外一個,人,人,讓,他,他知道,如,如何代,表,表你去,執(zhí),執(zhí)行這,個,個策略,。,。,什么是,計,計劃:,“,“如果,對,對手選A,我,將,將采取,行,行動X,,,,如果,,我,將,將采取,行,行動,。,?!?行動與,策,策略,在同時,決,決策博,弈,弈中,,行,行動就,是,是策略,。,。,但在序,貫,貫決策,博,博弈中,,,,行動,是,是指每,一,一個決,策,策點上,局,局中人,的,的決策,變,變量或,行,行動的,具,具體抉,擇,擇。策,略,略就是,一,一個完,整,整的行,動,動計劃,。,。,策略組,合,合,該博弈,有,有八種,可,可能的,策,策略組,合,合:,(,進,進入,,,,(,上,上)容,忍,忍,(,下,下)容,忍,忍,),),(,進,進入,,,,(,上,上)對,抗,抗,(,下,下)對,抗,抗,),),(進入,(上,),)對抗,(,下,下)容忍,),),(進入,(上,),)容忍,(,下,下)對抗,),),(不進,(上,),)容忍,(,下,下)容忍,),),(不進,(上,),)對抗,(,下,下)對抗,),),(不進,(上,),)對抗,(,下,下)容忍,),),(不進,(上,),)容忍,(,下,下)對抗,),),支 付,進入者純策,略,略與壟斷者,的,的“計劃型,”,”策略形成,策,策略組合,,構(gòu),構(gòu)成一條路,徑,徑。,支付對應每條路,徑,徑,而不是對,應,應每步選擇、,行,行為。,支付向量中,,,,數(shù)字的排,列,列按局中人,的,的出場順序,出,出現(xiàn)。(進,入,入者,壟斷,者,者),八種策略組,合,合對應的支,付,付,(進入,(上,),)容忍,(,下,下)容忍,),)(1,5),(進入,(上,),)對抗,(,下,下)對抗,),)(-2,2),(進入,(上,),)對抗,(,下,下)容忍,),)(-2,2),(進入,(上,),)容忍,(,下,下)對抗,),)(1,5),(不進,(上,),)容忍,(,下,下)容忍,),)(0,10),(不進,(上,),)對抗,(,下,下)對抗,),)(0,4),(不進,(上,),)對抗,(,下,下)容忍,),)(0,10),(不進,(上,),)容忍,(,下,下)對抗,),)(0,4),二、尋找序,貫,貫博弈的納,什,什均衡,例如:如圖,所,所示的情侶,博,博弈,分析,該,該博弈的納,什,什均衡?,男,足球,芭蕾,女,足球,芭蕾,足球,芭蕾,(2,1),(0,0),(-1,-1),(1,2),男方和女方,的,的純策略,男方有兩個,純,純策略:足,球,球和芭蕾,女方有四個,純,純策略:,不管你怎樣,,,,我總是芭,蕾,蕾芭,蕾,蕾,芭蕾,不管你怎樣,,,,我總是足,球,球足,球,球,足球,你選擇什么,,,,我就選擇,什,什么,足,足球,芭蕾,你選擇什么,,,,我就不選,擇,擇什么芭蕾,足,球,球,八種策略組,合,合,納什均,衡,衡在哪,該博弈有八,種,種可能的策,略,略組合:,(足球,(上,),)足球,(,下,下)足球,),),(足球,(上,),)足球,(,下,下)芭蕾,),),(足球,(上,),)芭蕾,(,下,下)足球,),),(足球,(上,),)芭蕾,(,下,下)芭蕾,),),(芭蕾,(上,),)足球,(,下,下)足球,),),(芭蕾,(上,),)足球,(,下,下)芭蕾,),),(芭蕾,(上,),)芭蕾,(,下,下)足球,),),(芭蕾,(上,),)芭蕾,(,下,下)芭蕾,),),用箭頭排除,確,確定法尋找,納,納什均衡,將以上策略,在,在博弈書中,用,用粗線表示,。,。,將存在單獨,改,改變激勵的,策,策略用箭頭,標,標示。方法,如,如下:,(1)找到,第,第二階段兩,根,根粗線所對,應,應的支付。,(2)比較,這,這兩個支付,前,前面的數(shù)字,,,,如果大的,數(shù),數(shù)字所對應,的,的那條“樹,枝,枝”是細的,,,,則男方存,在,在單獨偏離,的,的動機,則,男,男方的策略,選,選擇用箭頭,標,標示。,(3)比較,這,這兩個支付,后,后面的數(shù)字,,,,其中對應,第,第一階段“,樹,樹枝”是細,的,的那個數(shù)字,可,可以不再考,慮,慮,因為男,方,方?jīng)]選這個,方,方向。它是,“,“虛”的。,(4)因此,只,只在男方選,的,的那個“樹,丫,丫”上進行,比,比較女方的,支,支付,如果,大,大的數(shù)字對,應,應的“樹枝,”,”是細的,,則,則女方的策,略,略選擇“樹,枝,枝”用箭頭,標,標示。(P142),虛線排除確,定,定法的缺陷,該方法可以,找,找到納什均,衡,衡,但找不,到,到博弈的最,終,終結(jié)果。,均衡是策略,的,的組合,而,結(jié),結(jié)果則是行,動,動的組合。(P143),因此,我們,一,一般用倒推,法,法(Backwards Induction)來尋找,序,序貫博弈的,結(jié),結(jié)果。,三、尋找序,貫,貫博弈的結(jié),果,果倒推,法,法,從動態(tài)博弈,的,的最后一個,階,階段博弈方,的,的行為開始,分,分析,逐步,倒,倒推回前一,個,個階段相應,博,博弈方的行,為,為選擇,一,直,直到第一個,階,階段的分析,方,方法,稱為,“,“倒推法”,或,或者“逆,推,推歸納法”,。,。,倒推法是動態(tài)博弈分,析,析最重要、,基,基本的方法,。,。,步驟:,從博弈的最,后,后一個階段,開,開始分析,,通,通過比較最,后,后一個參與,決,決策的局中,人,人的支付,,推,推斷他或她,的,的選擇,從,而,而將他不會,選,選的策略,“枝椏”,砍,砍掉,從而,回,回到上一個,階,階段,比較,該,該階段參與,決,決策的局中,人,人的支付,,將,將他或她不,會,會選的策略,砍,砍掉,依此,類,類推,男,足球,芭蕾,女,足球,芭蕾,足球,芭蕾,(2,1),(0,0),(-1,-1),(1,2),倒推法,:(1)在,上,上面一個枝,椏,椏上,,由于最后一,階,階段是女方,做,做決策,因,此,此比較女方,的,的支付1和0,將0所,對,對應的芭蕾,策,策略砍掉,,沒,沒砍掉的打,上,上箭頭。(2)在下面,一,一個枝椏上,,,,由于最后,一,一階段是女,方,方做決策,,因,因此比較女,方,方的支付-1和2,將-1所對應,的,的足球策略,砍,砍掉,沒砍,掉,掉的打上箭,頭,頭。(3),回,回到第一個,階,階段,比較,帶,帶箭頭的兩,個,個策略男方,的,的支付(因,為,為此時男方,做,做決策),,將,將支付將較,小,小的策略砍,掉,掉。,女,博 弈 樹,例如:仿冒,和,和反仿冒博,弈,弈,A,B,B,A,不制止,制止,(-2,5),(2,2),(10,4),(5,5),不仿冒,(0,10),仿冒,不制止,制止,仿冒,不仿冒,練習:法律,保,保障不足的,開,開金礦博弈,乙,甲,乙,打,(2,2),不分,分,不借,借,(,0,,,4,),(-1,0),不打,(1,0),逆,逆推歸納,法,法,乙,借,甲,不分,分,(0,4),(2,2),不借,(1,0),逆,逆推歸納,法,法,乙,借,不借,(1,0),(0,4),練習2:有法律保障,的,的開金礦博弈,不借,乙,甲,乙,借,不分,分,(1,0),不打,打,(0,4),(1,0),(2,2),練習2:有法律保障,的,的開金礦博弈,不借,乙,甲,乙,借,不分,分,(1,0),不打,打,(0,4),(1,0),(2,2),倒推法的評,價,價,倒推法只能,分,分析明確設(shè),定,定的博弈問,題,題,要求博,弈,弈的結(jié)構(gòu),,包,包括次序、,規(guī),規(guī)則和得益,情,情況等都非,常,常清楚,并,且,且各個博弈,方,方了解博弈,結(jié),結(jié)構(gòu),相互,知,知道對方了,解,解博弈結(jié)構(gòu),。,。這些可能,有,有脫實際的,可,可能。,逆推歸納法,也,也不能分析,比,比較復雜的,動,動態(tài)博弈。,在遇到兩條,路,路徑利益相,同,同的情況時,倒,倒推法也會,發(fā),發(fā)生選擇困,難,難。,對博弈方的,理,理性要求太,高,高,不僅要,求,求所有博弈,方,方都有高度,的,的理性,不,允,允許犯任何,錯,錯誤,而且,要,要求所有博,弈,弈方相互了,解,解和信任對,方,方的理性,,對,對理性有相,同,同的理解,,或,或進一步有,理,理性的“共,同,同知識”。,四、先動優(yōu),勢,勢與后動優(yōu),勢,勢,在序貫情侶,博,博弈中,任,何,何一方率先,采,采取行動可,能,能得到的好,處,處,都比他,或

注意事項

本文(序貫決策博弈相關(guān)知識)為本站會員(xcv****223)主動上傳,裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對上載內(nèi)容本身不做任何修改或編輯。 若此文所含內(nèi)容侵犯了您的版權(quán)或隱私,請立即通知裝配圖網(wǎng)(點擊聯(lián)系客服),我們立即給予刪除!

溫馨提示:如果因為網(wǎng)速或其他原因下載失敗請重新下載,重復下載不扣分。




關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號:ICP2024067431-1 川公網(wǎng)安備51140202000466號


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請立即通知裝配圖網(wǎng),我們立即給予刪除!