版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第三講混合策略納什均衡,,,我們將納什均衡定義為一組滿足所有參與人的效用最大化要求的策略組合,即( s1*,…, si* , … , sn* )是一個(gè)納什均衡,當(dāng)且僅當(dāng)(ui(si*, s-i *) ≥ ui(si′, s-i *)。根據(jù)這一定義,有些博弈不存在納什均衡的。,,社會(huì)福利博弈 流浪漢
2、 找工作 游蕩 救濟(jì) 3,2 -1,3 政府 不救濟(jì) -1,1 0,0,,,,,,這個(gè)博弈不存在納什均衡。給定政府救濟(jì),流浪漢的最優(yōu)策略是游蕩;給定流浪漢游蕩,政府的最優(yōu)策略是不救濟(jì);給定政府不救濟(jì),流浪漢的最優(yōu)策略是找工作;給定流浪漢找工作,政府的最優(yōu)戰(zhàn)略是救濟(jì);如此等等,
3、沒(méi)有一個(gè)策略組合構(gòu)成納什均衡。,,猜謎游戲(A決定,B來(lái)猜;B猜中,獎(jiǎng)勵(lì);否則,懲罰) B 正面 反面 正面 -1,1 1,-1 A 反面
4、 1,-1 -1,1,,,,,,上述兩個(gè)博弈的顯著特征是,每個(gè)參與人都想猜透對(duì)方的策略,而每一個(gè)參與人又都不能讓對(duì)方猜透自己的策略。這樣的情況出現(xiàn)在諸如體育比賽和戰(zhàn)爭(zhēng)等情況中都會(huì)出現(xiàn)。在這類(lèi)博弈中,都不存在納什均衡。,,上述兩個(gè)博弈不存在純策略納什均衡,但是存在下面將要定義的混合策略納什均衡。這里的混合策略是指參與人以一定的概率選擇某種策略,比如說(shuō),參與人以0.3概率選擇第一種策略,以0.2的概率選擇第二種策略,以0
5、.5的概率選擇第三種策略。如果一個(gè)采取混合策略,他的對(duì)手就不能準(zhǔn)確猜出他實(shí)際上會(huì)選擇的策略,但在均衡點(diǎn)可以知道對(duì)手不同策略的概率分布。,,流浪漢 找工作 游蕩 救濟(jì) 3,2 -1,3 政府 不救濟(jì) -1,1 0,0設(shè)想
6、政府以1/2的概率選擇救濟(jì),1/2的概率選擇不救濟(jì)。對(duì)流浪漢來(lái)說(shuō),選擇尋找工作的期望效用是1/2×2+ 1/2×1=1.5,選擇游蕩帶來(lái)的期望效用為1/2×3+ 1/2×0=1.5。所以流浪者的任何一種策略(純的或混合)都是對(duì)政府所選擇的混合策略的最優(yōu)反應(yīng)。如果流浪漢以0.2的概率選擇找工作,以0.8的概率選擇游蕩,政府的任何一種策略(純的或混合)都是對(duì)流浪漢所選擇的混合策略的最優(yōu)反應(yīng)。每一個(gè)參
7、與人的混合策略都是給定對(duì)方混合策略時(shí)的最佳選擇,這一混合策略組合就是一個(gè)納什均衡,,混合策略的定義:在博弈G={s1,s2, …,sn}中,博弈方i的策略空間為Si=(si1,si2, …,sik),則博弈方以pi=(pi1,pi2, …,pik)隨機(jī)選擇k個(gè)可選策略稱(chēng)為一個(gè)混合策略。其中,0≤pik≤1,k=1,2, …,k,且pi1+pi2+…+pik=1相對(duì)于這種以一定概率分布在一些策略中隨機(jī)選擇,原來(lái)的確定性的具體的策略稱(chēng)為純
8、策略,原來(lái)的納什均衡也稱(chēng)為純策略納什均衡。純策略也可看作特殊的混合策略。我們把納什均衡的概念也作相應(yīng)的擴(kuò)大:對(duì)一個(gè)策略組合,無(wú)論它是純策略還是混合策略,只要滿足各博弈方都不想單獨(dú)偏離它,就稱(chēng)其為納什均衡。,,混合策略納什均衡的求法,可以通過(guò)計(jì)算各方的期望得益,尋求使自己期望得益最大化的最佳反應(yīng)函數(shù),求各博弈方的最佳反應(yīng)函數(shù)的公共解??梢杂们笞罴逊磻?yīng)函數(shù)交點(diǎn)的方法,也可以用解方程組得方法。還可以應(yīng)用下面的原則來(lái)計(jì)算:任何博弈方的在混合策
9、略納什均衡中的所選策略,都必須使其他博弈方選擇其任何策略的期望得益相同。即自己的選擇要使對(duì)方無(wú)機(jī)可乘,不能通過(guò)有針對(duì)性的傾向是某一策略成為優(yōu)勢(shì)策略。再舉一個(gè)例子。,,例 某博弈的得益矩陣為 乙 C D A 2,3 5,2
10、 甲 B 3,1 1,5這個(gè)博弈沒(méi)有純策略納什均衡。要計(jì)算混合策略納什均衡,設(shè)甲的混合策略為(p,1-p),則甲的選擇必須使乙選C和選D的期望得益相等,即:p×3+(1-p) ×1=p×2+(1-p) ×5解得p=0.8。即甲的混合策略是(0.8,0.2),,同樣,設(shè)乙的混合策略為(q,1-q) ,則乙的納什均衡策略也必須
11、使甲無(wú)論選A還是選B的期望收益相等。即: q×2+(1-q) ×5=q×3+(1-q) ×1解得 q=0.8 即乙的混合策略也是(0.8,0.2)容易算出在這個(gè)混合策略納什均衡下,甲乙各自的得益都是2.6.它的意義是說(shuō),雖然在一次博弈中,其結(jié)果只能是得益矩陣中四個(gè)得益的一種,但多次獨(dú)立重復(fù)進(jìn)行,平均結(jié)果是雙方各得2.6.,,1.制式問(wèn)題 彩電有不同的制式,采用相同的
12、制式,則不同廠商間的零部件可以通用,相關(guān)設(shè)備可以相互匹配,對(duì)大家有一定的好處,但也有互相競(jìng)爭(zhēng)的壓力和損失。設(shè)兩個(gè)廠商要引進(jìn)生產(chǎn)線,面臨A、B 兩個(gè)制式,其得益矩陣如下: 廠商2 A B A 1,3 0,0 廠商
13、1 B 0,0 2,2,,容易看出,該博弈有兩個(gè)純策略納什均衡:(A,A)和(B,B),但會(huì)出現(xiàn)哪一個(gè)均衡呢?可以看出,廠商1喜歡后一個(gè)而廠商2 喜歡前一個(gè)均衡。沒(méi)有必然的結(jié)果,因此,雙方的決策要進(jìn)行混合策略決策。不難算出廠商1的納什均衡混合策略是(0.4,0.6) 廠商2的混合策略納什均衡策略是(0.67,0.33)在此均衡下,雙方的期望得益分別為0.664
14、 和1.926,都小于任何一個(gè)純策略納什均衡的得益。由此可見(jiàn),政府或行業(yè)組織制定統(tǒng)一的標(biāo)準(zhǔn)或規(guī)定是非常重要的。這也是世界上各國(guó)甚至國(guó)際間對(duì)許多重要產(chǎn)品規(guī)定統(tǒng)一規(guī)格、標(biāo)準(zhǔn)的原因。當(dāng)然因?yàn)榧夹g(shù)壟斷等因素,也有相反的、各廠商間不統(tǒng)一的例證:如打印機(jī)墨盒、手機(jī)充電器等。,,2.市場(chǎng)機(jī)會(huì) 設(shè)兩個(gè)廠商都發(fā)現(xiàn)了一個(gè)市場(chǎng)機(jī)會(huì),但市場(chǎng)容量不大。若只有一家進(jìn)入,能賺100,若同時(shí)進(jìn)入,則各虧50.
15、 廠商2 進(jìn) 不進(jìn) 進(jìn) -50,-50 100, 0廠商1 不進(jìn) 0 ,100 0 , 0,0本博弈也有兩個(gè)純策略納什均衡(不進(jìn),進(jìn)),(進(jìn),不進(jìn))但它們分別有利于兩個(gè)廠商,因此這兩個(gè)均衡都不容易實(shí)現(xiàn),
16、都應(yīng)采取混合策略。請(qǐng)同學(xué)們自己計(jì)算混合策略納什均衡及得益。,,在包括混合策略的情況下,嚴(yán)格劣策略消去法有時(shí)仍然使用。因?yàn)閲?yán)格劣策略消去法不會(huì)消去任何納什均衡。如下面的例子: 乙 A B C 3,1
17、 0,2 甲 D 0,2 3,3,,甲、乙的策略沒(méi)有好壞之分。但若甲以混合策略(0.5,0.5,0)選擇C、D、E,則博弈方乙選擇純策略A時(shí),甲期望得益0.5×3+0.5×0+0×1=1.5乙選擇純策略B時(shí),甲期望得益0.5×0+0.5×3+0×1=1.5乙選擇混合策略(q,1-q) 時(shí),甲期望得益
18、0.5×q×3+0.5×(1-q) ×0+0.5×q×0+0.5×(1-q) ×3=1.5,,可見(jiàn),無(wú)論乙采用什么策略,甲采用混合策略都大于采用E的得益1,因此,E是甲的嚴(yán)格劣策略。因此去掉E,博弈就簡(jiǎn)化為: 乙 A
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 經(jīng)濟(jì)博弈論復(fù)習(xí)
- 博弈論
- 身邊的博弈論博弈論與信息經(jīng)濟(jì)學(xué)淺說(shuō)
- 身邊的博弈論博弈論與信息經(jīng)濟(jì)學(xué)淺說(shuō)
- 經(jīng)濟(jì)博弈論課后答案答案
- 博弈論逃課
- 博弈論應(yīng)用
- 博弈論概論
- 從經(jīng)典博弈論到量子博弈論.pdf
- 愛(ài)情博弈論
- 論初步博弈論
- 博弈論課程論文
- 博弈論經(jīng)典例子
- 股市博弈論下篇
- 演化博弈論簡(jiǎn)介
- 博弈視角下的合作行為_(kāi)博弈論
- 洪開(kāi)榮《經(jīng)濟(jì)博弈論》習(xí)題答案
- 博弈實(shí)驗(yàn)對(duì)博弈論的方法論意義
- 基于博弈論的第三方支付監(jiān)管分析
- 博弈論導(dǎo)論課程提綱
評(píng)論
0/150
提交評(píng)論