版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第二章博弈論的假定與博弈分類第1節(jié)博弈的定義及構(gòu)成要素先看一個(gè)例子。例21囚徒困境.兩個(gè)共同作案偷竊的小偷被警察抓住,被帶進(jìn)警察局單獨(dú)關(guān)押。他們面臨的“政策”是“坦白從寬,抗拒從嚴(yán)”,具體的政策是:如果一方與警方合作,招認(rèn)并供出自己與對(duì)方以前所做違法之事,而對(duì)方不招認(rèn),招認(rèn)方無(wú)罪釋放,不招認(rèn)的另一方則會(huì)被判重刑10年;如果雙方都與警方合作共同招認(rèn),各被判刑5年;而如果雙方均不承認(rèn)有罪,因警察找不到他們以前違法的證據(jù),只能對(duì)他們的小偷行為
2、進(jìn)行懲戒,各被判刑3個(gè)月。這兩個(gè)小偷如何作出選擇?甲乙不招認(rèn)招認(rèn)不招認(rèn)各被判刑3個(gè)月甲:當(dāng)場(chǎng)釋放乙:被判刑10年,招認(rèn)甲:被判刑10年乙:當(dāng)場(chǎng)釋放各被判刑5年這個(gè)博弈便稱為囚徒困境博弈(prisoners’dilemma)。普遍認(rèn)為,囚徒困境最先是由普林斯頓大學(xué)的塔克(AlbertTucker)教授于20世紀(jì)50年代提出的。這個(gè)博弈模型是一類現(xiàn)實(shí)原型的抽象,該博弈被廣泛地討論;在后面我們將詳細(xì)地分析它。上述直觀的博弈表述方式被稱為支付矩
3、陣支付矩陣,用之可表示2人博弈。該矩陣為諾貝爾獎(jiǎng)獲得者托馬斯?謝林最先使用的,該發(fā)明對(duì)于博弈論的普及意義重大。我們說(shuō)過(guò),一個(gè)博弈是其收益相關(guān)的兩個(gè)或兩個(gè)以上的參與人的策略互動(dòng)。在博弈的標(biāo)準(zhǔn)式表示中,每個(gè)參與人同時(shí)選擇一個(gè)策略,所有參與人選擇策略的組合決定每個(gè)參與人的收益。形式地,一個(gè)博弈可定義為:定義2.1.在一個(gè)n人博弈的標(biāo)準(zhǔn)式中,一個(gè)博弈可定義為:G=S1S2,…Snu1u2…un,其中S1S2,…Sn為參與人的策略空間;u1u2…
4、un為參與人的收益函數(shù)。因此,簡(jiǎn)單地說(shuō),一個(gè)博弈涉及:第一,兩個(gè)或兩個(gè)以上的參與人;第二,參與人的第一,兩個(gè)或兩個(gè)以上的參與人;第二,參與人的策略空間;第三,收益。策略空間;第三,收益。對(duì)于以上述形式描述或定義的博弈,其“解”是什么?為了得到“解”概念,我們得先給出博弈論基本假定。第2節(jié)博弈論中的基本假定基本假定:在博弈中每個(gè)參與人是理性的是博弈參與人之間的公共知識(shí)?;炯俣ǎ涸诓┺闹忻總€(gè)參與人是理性的是博弈參與人之間的公共知識(shí)。這里涉
5、及兩個(gè)問(wèn)題:第一,什么是理性;第二,什么是公共知識(shí)。我們先回答第二個(gè)問(wèn)題。我們說(shuō):一個(gè)命題p是公共知識(shí)是指,每個(gè)人知道p且每個(gè)人知道p每個(gè)人都知道p……或者p是公共知識(shí)指,每個(gè)人知道每個(gè)人知道p且每個(gè)人知道且每個(gè)人知道p是公共是公共知識(shí)知識(shí)。在下面的章節(jié)中我們會(huì)詳細(xì)地討論這個(gè)概念。但對(duì)于第一個(gè)問(wèn)題“什么是理性的”,我們很難給出準(zhǔn)確回答。理性本指推理要符合理性本指推理要符合邏輯規(guī)則邏輯規(guī)則。在決策中,這里的邏輯規(guī)則是廣義的,它不僅包括形式
6、邏輯的推理要求,而且包括形式邏輯的推理要求,而且包括決策規(guī)則。包括決策規(guī)則。對(duì)之,邁爾森說(shuō):“如果一個(gè)決策者在追逐其目標(biāo)時(shí)能夠前后一致地做決策,我們就有兩個(gè)錢包,甲乙知道,其中一個(gè)人錢包中的錢的數(shù)量是另外一個(gè)的兩倍;并且他們已知道,錢的范圍為5160元。老師將錢包分給了甲和乙。甲和乙打開錢包后看到了自己錢包中錢數(shù)(看不到對(duì)方錢包中的錢的多少),假定甲錢包中的數(shù)量為20元;乙錢包中的錢包中的數(shù)量為40元。老師說(shuō):現(xiàn)在允許你們進(jìn)行交換。問(wèn):
7、甲、乙交換合算還是不交換合算?分析:對(duì)于甲,對(duì)方錢包中為40的概率為12為10的概率為12。因此,若交換的話獲得40121012=2520。因此,交換是合理的。對(duì)于乙:若交換,80122012=5040.因此,交換是合理的。但是,他們錢包中的總數(shù)是一定的,不可能通過(guò)交換雙方的收益增加了。定義。占優(yōu)與被占優(yōu)。對(duì)于兩個(gè)策略占優(yōu)與被占優(yōu)。對(duì)于兩個(gè)策略S、S’S’,如果,采取,如果,采取S的效用在任意一個(gè)可能狀的效用在任意一個(gè)可能狀態(tài)下都“不低
8、于”采取態(tài)下都“不低于”采取S’的策略的效用,那么,我們說(shuō)’的策略的效用,那么,我們說(shuō)S與S’S’相比,相比,S是占優(yōu)策略,是占優(yōu)策略,S’為被占優(yōu)策略?!癁楸徽純?yōu)策略。嚴(yán)格占優(yōu)與嚴(yán)格被占優(yōu)。如果采取嚴(yán)格占優(yōu)與嚴(yán)格被占優(yōu)。如果采取S的效用在任意一個(gè)可能狀態(tài)下都“大于”采取的效用在任意一個(gè)可能狀態(tài)下都“大于”采取S’的策略的效用,那么,我們說(shuō)’的策略的效用,那么,我們說(shuō)S與S’S’相比,相比,S是嚴(yán)格占優(yōu)策略,是嚴(yán)格占優(yōu)策略,S’為嚴(yán)格被
9、占優(yōu)策’為嚴(yán)格被占優(yōu)策略。略。例子:C1C2C3S11002000S220030050S1相對(duì)于S2是嚴(yán)格被占優(yōu)策略,S2相對(duì)于S1是嚴(yán)格占優(yōu)策略。注意:(1)某策略是占優(yōu)的或被占優(yōu)的是相對(duì)于另外一個(gè)策略而言的;因此占優(yōu)策略或被占優(yōu)策略是相對(duì)的。(2)該定義不要求策略下的效用是可計(jì)算的,但要求效用是可比較的(可計(jì)算的當(dāng)然是可比較的,反之不成立)。定理:理性人是不會(huì)采取嚴(yán)格被占優(yōu)策略的定理:理性人是不會(huì)采取嚴(yán)格被占優(yōu)策略的。這樣,在決策中
10、我們可以剔除或償付剔除嚴(yán)格被占優(yōu)策略來(lái)進(jìn)行理性選擇。在實(shí)際中我們常用“策略排序法”來(lái)進(jìn)行策略選擇,這與剔除嚴(yán)格被占優(yōu)策略是一致。我們通常說(shuō),“兩害相權(quán)取其輕,兩利相權(quán)取其重”便是策略決策法?!秾O子兵法》中所體現(xiàn)的背后的決策原則也是策略排序法。如孫子曰:“上兵伐謀,其次伐交,其次發(fā)兵,其下攻城”,再比如“百戰(zhàn)百勝非善之善者也,不戰(zhàn)而屈人之兵,善之善者也”等,體現(xiàn)了孫子的從多種可選的策略中盡可能地確定上策。第4節(jié)多標(biāo)準(zhǔn)下的博弈分類博弈分類根
11、據(jù)不同的標(biāo)準(zhǔn),博弈分為靜態(tài)與動(dòng)態(tài);完全信息與非完全信息;合作與非合作博,博弈分為靜態(tài)與動(dòng)態(tài);完全信息與非完全信息;合作與非合作博弈。零和與非零和。弈。零和與非零和。靜態(tài)博弈和動(dòng)態(tài)博弈。靜態(tài)博弈指參與人同時(shí)采取行動(dòng),或者盡管參與人行動(dòng)的采取靜態(tài)博弈指參與人同時(shí)采取行動(dòng),或者盡管參與人行動(dòng)的采取有先后順序,但后行動(dòng)的人在行動(dòng)時(shí)不知道先采取行動(dòng)的人采取的是什么行動(dòng)。動(dòng)態(tài)博弈有先后順序,但后行動(dòng)的人在行動(dòng)時(shí)不知道先采取行動(dòng)的人采取的是什么行動(dòng)。
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 博弈論
- 博弈論逃課
- 博弈論應(yīng)用
- 博弈論概論
- 從經(jīng)典博弈論到量子博弈論.pdf
- 愛(ài)情博弈論
- 論初步博弈論
- 第七章博弈論建模
- 博弈視角下的合作行為_博弈論
- 博弈論課程論文
- 經(jīng)濟(jì)博弈論復(fù)習(xí)
- 博弈實(shí)驗(yàn)對(duì)博弈論的方法論意義
- 博弈論經(jīng)典例子
- 身邊的博弈論博弈論與信息經(jīng)濟(jì)學(xué)淺說(shuō)
- 身邊的博弈論博弈論與信息經(jīng)濟(jì)學(xué)淺說(shuō)
- 股市博弈論下篇
- 演化博弈論簡(jiǎn)介
- 博弈論的經(jīng)典案例
- 經(jīng)濟(jì)博弈論第三講混合博弈
- “博弈論”習(xí)題及參考答案
評(píng)論
0/150
提交評(píng)論