版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、<p><b> 畢業(yè)論文開題報告</b></p><p><b> 理論物理</b></p><p> 公共品博弈的空間效應(yīng)研究</p><p><b> 選題的背景與意義</b></p><p> 無論對于生物界種群的進化還是人類社會的發(fā)展,合作都扮演著
2、至關(guān)重要的角色。然而,自私個體之間的無私利他行為與達爾文的物競天擇理論是相互抵觸的。在尋求這一問題的答案的過程中,博弈論以及演化博弈論扮演了重要角色并提供了強有力的理論框架。</p><p> 社會和自然界中復(fù)雜系統(tǒng)的結(jié)構(gòu)形態(tài)和系統(tǒng)結(jié)構(gòu)可以從網(wǎng)絡(luò)的角度進行描述。近年來,復(fù)雜網(wǎng)絡(luò)研究的興起與發(fā)展,使得人們對各種現(xiàn)實網(wǎng)絡(luò)的結(jié)構(gòu)演化、復(fù)雜性有了比較清晰的認識。而復(fù)雜網(wǎng)絡(luò)理論為描述博弈個體之間的博弈關(guān)系提供了方便的系統(tǒng)
3、框架。網(wǎng)絡(luò)上的節(jié)點表示博弈個體,邊代表與其鄰居的博弈關(guān)系。這樣一來,就可以利用復(fù)雜網(wǎng)絡(luò)拓撲關(guān)系,來研究一些復(fù)雜的博弈關(guān)系下的博弈。由于真實系統(tǒng)中的個體或要素之間存在策略依賴關(guān)系,所以可在復(fù)雜網(wǎng)絡(luò)上建立空間博弈模型。在復(fù)雜網(wǎng)絡(luò)上建立的空間博弈模型更加客觀真實,更加符合實際的演化規(guī)則,更加貼切生活,使得復(fù)雜網(wǎng)絡(luò)的演化博弈方興未艾。隨著演化博弈動力學(xué)行為與復(fù)雜網(wǎng)絡(luò)之間的關(guān)系逐漸清晰,空間博弈必定會推動復(fù)雜網(wǎng)絡(luò)中其他領(lǐng)域的發(fā)展。而本文將在了解公
4、共品模型的研究現(xiàn)狀和數(shù)值方法基礎(chǔ)上,通過數(shù)值方法研究個體的各類空間效應(yīng),探索各類空間效應(yīng)對公共品博弈中合作行為的影響,從而得到相應(yīng)的研究成果。</p><p> 二、研究的基本內(nèi)容與擬解決的主要問題</p><p> 1、對公共品模型的研究現(xiàn)狀和數(shù)值方法進行文獻調(diào)研</p><p> 2、 在了解前人的模型工作的基礎(chǔ)上,獨立進行模型建立</p>
5、<p> 3、對所建立的模型進行計算分析,得到研究結(jié)果</p><p> 4、對研究結(jié)果進行總結(jié)分析,撰寫出實驗論文</p><p> 三、研究的方法與技術(shù)路線</p><p> 1、在公共品模型框架下,分析各種可能的空間行為,基于相關(guān)文獻及前人模型工</p><p> 作之上獨立建立模型 </p>&l
6、t;p> 2、對所建立模型通過數(shù)值方法研究個體的各類空間效應(yīng)從而得到研究結(jié)果</p><p> 四、研究的總體安排與進度</p><p> 2010.12.15 完成基本文獻的閱讀,了解基本原理和研究背景</p><p> 2010.12.16-2011.1.15 熟悉基本數(shù)值方法,并提出自己新的模型</p>&
7、lt;p> 2011.2.-2011.3 進行模型計算和分析</p><p> 2011.4 進行總結(jié)并撰寫論文,準備答辯</p><p><b> 五、主要參考文獻</b></p><p> Nowak M A and Sigmund K, 2004 Science 303, 793&
8、lt;/p><p> 2、Szabo G and Fath G, 2007 Phys. Rep. 446, 97</p><p> 3、Doebeli M, Hauert C and Killingback T, 2004 Science 306, 859</p><p> 4、Nowak M A and May R M, 1992 Nature 359, 826
9、</p><p> 5、Hauert C and Doebeli M, 2004 Nature 428, 643</p><p> 6、Santos F C and Pacheco J M, 2005 Phys. Rev. Lett. 95, 098104</p><p> 7、復(fù)雜網(wǎng)絡(luò)上的演化博弈 智能系統(tǒng)學(xué)報167324785 (2007) 0
10、220001210</p><p> 8、復(fù)雜網(wǎng)絡(luò)上博弈行為的研究進展 電子測量技術(shù)第30卷第4期 TP39</p><p> 9、復(fù)雜網(wǎng)絡(luò)演化博弈理論研究綜述 復(fù)雜系統(tǒng)與復(fù)雜性科學(xué)第5卷第4期</p><p> 10、博弈[M] 白波,郭興文 哈爾濱出版社 2005.</p><p><b> 畢業(yè)論文文獻綜述
11、</b></p><p><b> 物理學(xué)</b></p><p> 公共品博弈的空間效應(yīng)研究</p><p> 摘要:博弈理論在社會、經(jīng)濟、生物以及生態(tài)等系統(tǒng)中存在著廣泛的應(yīng)用, 復(fù)雜網(wǎng)絡(luò)理論則是研究復(fù)雜系統(tǒng)全新而有力的工具, 因此將博弈理論與復(fù)雜網(wǎng)絡(luò)理論相結(jié)合成為研究復(fù)雜系統(tǒng)一個新的熱點概述國內(nèi)外當(dāng)前關(guān)
12、于復(fù)雜網(wǎng)絡(luò)上博弈動力學(xué)的研究情況和發(fā)展動態(tài), 包括基本的博弈模型、主要關(guān)注的問題、以及網(wǎng)絡(luò)結(jié)構(gòu)和博弈動力學(xué)的相互作用等, 最后探討進一步的研究課題。</p><p> 關(guān)鍵詞:復(fù)雜網(wǎng)絡(luò) 演化博弈 合作行為</p><p><b> 正文:</b></p><p> 我閱覽了大量關(guān)于復(fù)雜網(wǎng)絡(luò)和博弈的相關(guān)文獻資料。不管是書
13、目、期刊、論文,在這兩方面的研究都始終是蓬勃發(fā)展碩果累累的。然而關(guān)于博弈的問題最終都要歸結(jié)到對于合作的探究。根據(jù)博弈論,合作能給種群內(nèi)的其他成員帶來好處,卻常常會損害個體自身的利益。根據(jù)達爾文進化論最適者生存的自然法則,有益于種群內(nèi)所有成員的合作行為應(yīng)該滅絕。然而,事實并非如此。在真實的生物、社會等復(fù)雜系統(tǒng)中在生物和社會等科學(xué)領(lǐng)域,合作是一種普遍存在的現(xiàn)象。從單細胞的微生物到高級哺乳動物,從社會性昆蟲到人類社會。生物個體之間的合作,增加
14、了整個種群的生存機會。那么自私個體間合作是如何產(chǎn)生和維持的,成為人們討論的熱點問題。為了理解合作行為是如何從自私的個體之間演化產(chǎn)生的,近年來,一些可能的合作機理。如群體選擇、親緣選擇、直接(間接)互惠、空間互惠、聲望與懲罰等得到一定的探討。自從Alelrod利用迭代囚徒困境博弈研究合作的演化以來,演化博弈論為研究合作演化提供了方便的數(shù)學(xué)框架,受到越來越多的關(guān)注,囚徒困境博弈和雪堆博弈是被研究者廣泛采用的研究合作行為的兩個范例。</
15、p><p> 在經(jīng)典博弈論中,個體被假定是超理性的(所有個體都知道其他個體也是理性的,并且會按照理性行事),且個體對收益矩陣元的信息完全了解。在這種機制下,所有個體最終都會采取納什平衡策略。但是這種個體的超理性會導(dǎo)致機體的非理性(因為相互合作時集體的收益最大)。一般而言,在復(fù)雜的環(huán)境中個體沒有充分的能力去選擇最佳策略以最大化收益。此時,個體通常根據(jù)其所掌握的局部信息采取啟發(fā)式的方法,做出令其“滿意”的決策,這種選擇
16、過程表明個體是有限理性的。演化博弈理論著重研究有限性的個體如何在重復(fù)博弈過程中,通過自適應(yīng)學(xué)習(xí)來實現(xiàn)自身收益的最大化問題。</p><p> 復(fù)雜網(wǎng)絡(luò)理論為描述博弈個體之間的博弈關(guān)系提供給了方便的框架。由于真實系統(tǒng)中的個體或要素之間存在策略依賴關(guān)系,所以可在復(fù)雜網(wǎng)絡(luò)上建立空間博弈模型。這樣就可以利用復(fù)雜網(wǎng)絡(luò)拓撲關(guān)系來研究一些復(fù)雜博弈關(guān)系下的博弈。由于真實的社會網(wǎng)絡(luò)比一些模型網(wǎng)絡(luò)復(fù)雜,而后者通常只是前者的一個特性
17、或某些特性的反映,因此研究真實社會網(wǎng)絡(luò)上的演化博弈對揭示合作的演化具有重要意義。而小世界效應(yīng)、無標度性質(zhì)等對網(wǎng)絡(luò)上演化博弈的影響自然受到了研究者的關(guān)注,成為了有意義的課題。</p><p> 公共品博弈是以公共品為博弈對象的博弈,這種博弈廣泛存在于發(fā)雜網(wǎng)絡(luò)之中。一般來說,公共品是指在消費過程中具有非競爭性和非排他性的物品。因為公共品具有這樣的性質(zhì),所以集體中的每個人都會希望由其他人來提供,而自己坐享其成,這種行
18、為被稱為搭便車。搭便車問題使集體行動變得難以實現(xiàn)——每個人都想搭便車的結(jié)果,就是沒有便車可搭。 搭便車問題的存在,解釋了很多社會困境。例如,惡劣的環(huán)境無人清理,不合理的制度人人抱怨卻無人抵制。 </p><p> 公共品博弈的理論結(jié)果和現(xiàn)實的差異是巨大的。大量的實驗研究表明,集體成員的搭便車動機是有限的,合作能夠達到一個客觀且穩(wěn)定的水平。這就表明,在重復(fù)公共品博弈過程中,個體不僅要考慮自身收益,還受到很多外在因
19、素的影響,如激勵與懲罰,而且社會系統(tǒng)中的個體還具有某種異質(zhì)性——稱為社會偏好,這種社會偏好使得個體會考慮他人的選擇,具體表現(xiàn)為互惠、不平等厭惡、學(xué)習(xí)和遷移等。很顯然,這些外在因素的存在會降低個體搭便車的動機,并提高合作水平。</p><p> 關(guān)于公共品博弈的研究貫穿各個方面,在生物與科學(xué)領(lǐng)域的研究尤為顯著。我主要列舉了一下三種說法:</p><p> 群體選擇學(xué)說:群體選擇學(xué)說將種群
20、看作一個進化的單位,在群體層次上考慮公共品博弈。在群體中,那些對種群有利的特征之所以能夠保存下來,是因為在進化過程中,雖然群選擇與個體選擇的方向是相反的,但是個體的選擇可能導(dǎo)致種群的滅亡,這種來自于外部的壓力促使個體間相互合作。</p><p> 互惠和強互惠效應(yīng):互惠機制包括直接互惠和間接互惠。直接互惠中的個體之所以冒著可能會被背叛的風(fēng)險去跟其他個體合作是因為希望在日后與該個體再次進行博弈時能夠取得更大的收益
21、,所以回報才是互惠利他主義者的真正目的。間接互惠的基礎(chǔ)是“聲譽”。個體選擇跟其他個體進行合作是期望提高自己的聲譽,得到更多個體的合作,但是這種合作是不穩(wěn)定的。直接互惠和間接互惠都無法很好的解決公共品博弈中的合作現(xiàn)象,這種情況下,強互惠理論應(yīng)運而生。</p><p> 強互惠理論認為,人類之所以能維持比其他物種更高度的合作關(guān)系,在于許多人都具有這樣一種行為傾向:在團體中與別人合作,并不惜花費個人成本去懲罰那些破壞
22、群體規(guī)范的人,即使這些成本并不能被預(yù)期得到補償。強互惠能夠有效的抑制團體中的背叛、逃避責(zé)任和搭便車行為,提高合作水平。但實施這種行為需要個人承擔(dān)成本,這樣就帶來一個新的問題,成本由誰來負擔(dān)?每一個合作者都會寄希望于其它合作者承擔(dān)這個成本,即所謂“二階搭便車問題”。解決這個問題又產(chǎn)生了許多討論,包括合作懲罰以及制度的制定等。</p><p> 空間效應(yīng): 由于真實系統(tǒng)中的個體或要素之間存在策略依賴關(guān)系,我們可以
23、在各種網(wǎng)絡(luò)上建立空間博弈模型,這樣又發(fā)現(xiàn)了許多空間因素的影響。比如說公共品博弈中獨立者的引入——獨立者是在公共品博弈模型中引入不參與博弈,但會每局收到少而固定的收益的獨立者。這樣,在一定r下,就會出現(xiàn)一種動態(tài)平衡。除此之外還有很多各種各樣的影響,如網(wǎng)絡(luò)的影響(不同的網(wǎng)絡(luò)對于合作的促進作用也是不同的)、策略的改變(在博弈中引入學(xué)習(xí)和遷移的策略,個體在博弈中有一定的幾率改變策略和交換位置)等等,也會明顯影響博弈的結(jié)果。</p>
24、<p> 復(fù)雜網(wǎng)絡(luò)上的演化博弈研究是近年來隨著復(fù)雜網(wǎng)絡(luò)研究興起而逐漸引起關(guān)注的一個重要研究領(lǐng)域。目前大部分工作都集中在囚徒困境博弈或雪堆博弈研究上,其他類型的博弈還缺乏系統(tǒng)的研究。因此有必要進一步考慮多人博弈的情形,如公用品博弈——本文所主要研究的課題,或多策略的博弈等。如石頭- 剪刀- 布( rock-scissors-paper) 博弈. 近來一些學(xué)者開始關(guān)注這些問題,也得到了一些有趣的結(jié)果。</p>&
25、lt;p> 對于自然界中廣泛存在的合作行為的理解,以及如何又到自私個體之間產(chǎn)生合作一直是數(shù)學(xué)、物理、生物、管理乃至工程學(xué)科的學(xué)者關(guān)注的話題。隨著復(fù)雜網(wǎng)絡(luò)的興起,人們對于字兒按揭中復(fù)雜系統(tǒng)的組織結(jié)構(gòu)有了新的認識。從網(wǎng)絡(luò)結(jié)構(gòu)的角度研究演化博弈行為是一個既具有理論意義又有工程實踐價值的課題。</p><p> 目前很多工作只是一些數(shù)值仿真結(jié)果,由于數(shù)學(xué)工具的不足,對復(fù)雜網(wǎng)絡(luò)上的博弈動力學(xué)進行解析分析是非常困難
26、的,目前的一些近似方法,如平均場方法、對估計方法在異質(zhì)程度很大的網(wǎng)絡(luò)很有可能失效. 因此尋求有效的數(shù)學(xué)工具,探求更好的理論結(jié)果,將一些數(shù)值結(jié)果命題化、嚴格化,將是十分有意義的。</p><p> 該課題將在了解公共品模型的研究現(xiàn)狀和數(shù)值方法基礎(chǔ)之上,通過數(shù)值方法研究個體的各類空間效應(yīng),探索各類空間效應(yīng)對公共品博弈中合作行為的影響,從而得出在各種因素之間多人博弈情況下的合作行為的發(fā)生情況?,F(xiàn)實中,公共品博弈普遍存
27、在,當(dāng)然也存在很多社會困境??紤]到影響公共品博弈的各種因素,如何更有效的促進合作行為的產(chǎn)生成為我們現(xiàn)在研究的主要方向。希望該項研究不僅能在理論方面,更能對真實系統(tǒng)中公共品博弈提供建設(shè)性的意見和建議。</p><p><b> 參考文獻</b></p><p> 1、Nowak M A and Sigmund K,&
28、#160;2004 Science 303, 793 2、Szabo G and Fath G, 2007 Phys. Rep. 446, 97 3、Doebeli M, Hauert
29、0;C and Killingback T, 2004 Science 306, 859 4、Nowak M A and May R M, 1992 Nature 359, 826
30、160;5、Hauert C and Doebeli M, 2004 Nature 428, 643 6、Santos F C and Pacheco J M, 2005 Phys. Rev. Lett.
31、0;95, 098104 7、復(fù)雜網(wǎng)絡(luò)上的演化博弈 智能系統(tǒng)學(xué)報167324785 (2007) 0220001210 8、復(fù)雜網(wǎng)絡(luò)上博弈行為的研究進展 電子測量技術(shù)第30卷第4期 TP39
32、0; 9、復(fù)雜網(wǎng)絡(luò)演化博弈理論研究綜述 復(fù)雜系統(tǒng)與復(fù)雜性科學(xué)第5卷第4期 10、博弈[M] 白波,郭興文 哈爾濱出版社</p><p><b> 本科畢業(yè)設(shè)計</b></p><p><b> ?。?0 屆)
33、</b></p><p> 公共品博弈的空間效應(yīng)研究</p><p><b> 摘 要</b></p><p> 【摘要】 本文基于復(fù)雜網(wǎng)絡(luò)下的公共品博弈演化模型,研究各類空間效應(yīng)對合作演化動態(tài)的影響以及引入獎勵機制后合作行為演化的方向。通過允許對合作個體的獎勵作為一種積極因素促進合作的產(chǎn)生,結(jié)果表明獎勵可以通過提供一個避免相
34、互背叛情況出現(xiàn)的方式促進合作的產(chǎn)生。然而與懲罰相比,獎勵無法使合作穩(wěn)定下來,卻提高了穩(wěn)定的合作者的數(shù)目。最后分析了復(fù)雜網(wǎng)絡(luò)上公共品演化博弈論的未來發(fā)展方向與應(yīng)用前景。</p><p> 【關(guān)鍵詞】公共品;復(fù)雜網(wǎng)絡(luò);演化博弈;獎勵機制</p><p><b> Abstract</b></p><p> 【ABSTRACT】Based on
35、 the public goods game, this thesis presents a model in which individuals are rewarded who contribute to the public goods. It is shown that reward is capable of promoting cooperation by providing an escape hatch out of s
36、tates that we defect each other mutually. Reward, contrast with punishment, is unable to stabilize cooperation although it gives rise to a persistent minority of cooperators. Finally unresolved open problems and future r
37、esearch directions and possible applicatio</p><p> 【KEYWORDS】public goods;complex networks ;evolutionary games ;incentive system</p><p><b> 目 錄</b></p><p><b> 摘
38、 要8</b></p><p> Abstract8</p><p><b> 目 錄8</b></p><p><b> 1 研究背景10</b></p><p> 1.1 博弈論10</p><p> 1.1.1 經(jīng)典博弈論、博弈模型與納什
39、均衡10</p><p> 1.1.2 從經(jīng)典博弈到演化博弈12</p><p> 1.2 復(fù)雜網(wǎng)絡(luò)13</p><p> 1.2.1 復(fù)雜網(wǎng)絡(luò)的特征度量14</p><p> 1.2.2 復(fù)雜網(wǎng)絡(luò)的分類14</p><p> 1.2.3 復(fù)雜網(wǎng)絡(luò)上的演化博弈15</p><p
40、> 2 公共品博弈背景簡介....................................................................................................................................6</p><p> 2.1 背景簡介17</p><p> 2.2 群選擇學(xué)說17&
41、lt;/p><p> 2.3 互惠與強互惠效應(yīng)18</p><p> 2.4 空間效應(yīng)19</p><p><b> 3 模型建立21</b></p><p> 3.1 模型介紹21</p><p> 3.2 現(xiàn)象及描述22</p><p><b&g
42、t; 3.3 結(jié)語24</b></p><p> 4 結(jié)論與展望24</p><p><b> 參考文獻6</b></p><p> 致謝錯誤!未定義書簽。</p><p> 附錄:錯誤!未定義書簽。</p><p><b> 研究背景</b&g
43、t;</p><p> 無論對于生物界種群的進化還是人類社會的發(fā)展,合作都扮演著至關(guān)重要的角色。自私個體之間是如何產(chǎn)生合作的一直是物理、生物、數(shù)學(xué)乃至工程科學(xué)的學(xué)者關(guān)注的話題。然而,依據(jù)達爾文主義,自然選擇是基于競爭的,個體將自私的最大化自身的利益,這顯然不能解釋處處可見的合作行為。為了理解合作行為是如何從自私的個體之間演化產(chǎn)生的,近年來,一些可能的合作機理,如群體選擇(group selection)、親緣選
44、擇(kin selection)、直接(間接)互惠(direct/indirectreciprocity)、空間互惠(spatial reciprocity)、聲望與懲罰(reputation and punishment)等得到了一定的探討。而博弈論在尋求這一問題答案的過程中扮演了重要角色并提供了強有力的理論框架。隨著計算機技術(shù)的飛速發(fā)展,對復(fù)雜網(wǎng)絡(luò)的研究也不斷深入,人們對現(xiàn)實世界中復(fù)雜系統(tǒng)的組織結(jié)構(gòu)有了新的認識。在復(fù)雜網(wǎng)絡(luò)的基礎(chǔ)上研
45、究博弈行為成為一個既具有理論意義又有現(xiàn)實價值的話題,受到人們越來越多的關(guān)注。</p><p><b> 博弈論</b></p><p> 經(jīng)典博弈論、博弈模型與納什均衡</p><p> 博弈論,又稱對策論,主要是研究依據(jù)參與博弈的其他個體的策略情況,理性個體所采取的策略之間交互作用下的個體的行為演化。在交互作用中,個體所獲得的收益不是純
46、粹由其自身所采取的策略決定,而是受到很多其他方面的影響,如其他個體的策略、博弈規(guī)則等等。博弈論主要是由匈牙利數(shù)學(xué)家馮-諾依曼所創(chuàng)立的,在20世紀40年代作為一門正式的學(xué)科發(fā)展起來。1944年馮-諾依曼和摩根斯坦出版的著作《博弈論和經(jīng)濟行為》,標志著現(xiàn)代系統(tǒng)博弈論的初步形成。早期的博弈論過于抽象,實用性不強,而且人們對博弈論的研究知之甚少,影響力有限。隨著現(xiàn)代博弈論的不斷研究發(fā)展,它作為一種數(shù)學(xué)理論被廣泛應(yīng)用于經(jīng)濟、政治、生物、信息等許多
47、領(lǐng)域,日漸成為非常重要且有用的分析工具,為解決不同實體的沖突和合作提供了一種有效的方法。近十多年來,諾貝爾經(jīng)濟學(xué)獎先后授予研究博弈論的科學(xué)家Nash、Selten等人也說明,博弈論越來越受到更多人的重視,也得到了越來越廣泛的承認。</p><p> 通常一個博弈由以下5個部分所組成:(1)博弈主體,即博弈過程中進行獨立決策的個體,在一輪博弈中至少要有兩位決策者參與博弈(2)博弈信息,博弈個體所掌握的有利于策略選
48、擇的各方面信息,在博弈中占重要地位,根據(jù)博弈個體對參與博弈所有個體收益信息的掌握程度可將博弈分為完全信息博弈與非完全信息博弈(3)策略集,參與博弈的個體可選擇的所有可能策略的集合,根據(jù)該集合是有限還是無限,可分為有限博弈和無限博弈,其中無限博弈又表現(xiàn)為連續(xù)對策、重復(fù)博弈和微分對策等(4)收益矩陣,策略選定后,博弈個體所獲得的收益是由相應(yīng)的收益函數(shù)或收益矩陣來確定的,根據(jù)博弈個體的不同收益情況可以分為零和博弈與變和博弈(5)策略演化,在重
49、復(fù)博弈過程中,博弈個體以自身收益最大化為目標進行策略調(diào)整。就某一輪博弈而言,當(dāng)所有個體的策略選定以后,我們可以用集合的形式來描述,S=(S1,S2,...),其中每一項代表了所對應(yīng)個體采取的策略,進而得到某種策略概況下個體所獲得的收益U。經(jīng)典博弈論中的一個重要概念納什均衡(Nash equilibrium),是美國科學(xué)家約翰-納什在二十世紀提出來的,從實質(zhì)上說是一種非合作博弈狀態(tài)。所謂納什均衡</p><p>
50、 囚徒困境博弈(Prisoner's dilemma Game):小偷甲和乙合伙作案,被捕后,警方將兩人分別置于兩個房間內(nèi)進行審訊。警方給出的政策是:如果雙方都拒絕坦白同伴的罪行,兩人將會被輕判1年徒刑;如果甲(乙)坦白(背叛)罪行,而乙(甲)拒不供認(合作)罪行,則甲(乙)將無罪釋放,而乙(甲)將被重判5年徒刑;如果甲、乙互相揭發(fā)對方罪行,則雙方均被判刑3年。該博弈的收益矩陣可列表如下:</p><p>
51、; 從上表我們可以看出,如果甲選擇坦白,即選擇“背叛”(defect-D)乙,則乙也應(yīng)該選擇坦白——因為如果此時乙選擇合作,甲將被無罪釋放,而乙會被重判5年,而如果此時乙也選擇背叛,則將會跟甲均判3年,顯然,對乙來說,背叛總是最佳策略。反之,對甲來說也是如此。但是整體來看,甲乙的最優(yōu)策略應(yīng)該是選擇跟對方合作,此時兩人均被判1年。這樣就陷入了兩難困境,那么這種情況下,甲乙兩個體應(yīng)如何做出抉擇?從理性個體自身利益最大化為目標來看,相互合作
52、的情況不會發(fā)生,對甲乙來說,因為不論對方采取哪種策略,背叛始終是自身的最佳策略(注意到此時集體的收益最低)。所以當(dāng)雙方都選擇背叛時,沒有個體會主動選擇改變策略(因為單方面改變策略使自身收益降低),此時這種相互背叛的狀態(tài)就是該系統(tǒng)的納什均衡狀態(tài)?,F(xiàn)實生活中,類似囚徒困境的例子很多,也揭示出各種社會困境。上面所述的是單次發(fā)生的囚徒困境,但是在重復(fù)囚徒困境中,參與博弈的個體可以通過記憶或?qū)W習(xí)、或者采取某種報復(fù)措施對背叛者進行懲罰,那么在合適的
53、機制下,合作將會作為均衡的結(jié)果出現(xiàn)并逐漸占據(jù)優(yōu)勢,從而有利于合作策略的涌現(xiàn)與維持。在接近無限次的博弈中,納什均衡會趨向于帕累托</p><p> 從經(jīng)典博弈到演化博弈</p><p> 經(jīng)典博弈論中,個體被假定是超理性的——完全信息博弈,而且所有個體都知道其他個體也是理性的,并且會按照理性行事。這種機制下,博弈最終會達到納什均衡狀態(tài),即所有的個體最終都會采取納什均衡策略。從囚徒困境的例
54、子可以看出,這種個體的超理性會導(dǎo)致集體的非理性(因為相互合作時集體的收益最大)。但是,在真實的復(fù)雜社會系統(tǒng)中,個體沒有充分的能力去選擇能最大化其收益的最佳策略。此時,個體通常根據(jù)其掌握的局部信息來做出其相對滿意的策略——非完全信息博弈,這種選擇過程表明個體是有限理性(bounded rationality)的。演化博弈理論(evolutionary game theory)著重研究重復(fù)博弈過程中有限理性的博弈個體之間怎樣涌現(xiàn)出合作行為以
55、及博弈個體如何通過自適應(yīng)學(xué)來實現(xiàn)自身收益最大化的問題。</p><p> 演化博弈論(evolutionary game theory)以達爾文的進化論和拉馬克的遺傳基因理論為思想基礎(chǔ),將博弈理論與動態(tài)演化過程分析結(jié)合起來,分析從個體到群體行為的行為機制,研究種群的進化趨勢及穩(wěn)定性,為描述個體之間的相互作用提供了一種通用數(shù)學(xué)框架。參與博弈的個體采取一定的策略,獲得一定的收益(該收益依賴于個體本身的策略跟參與博弈
56、的其他個體的策略)。在每一輪博弈中,博弈個體以某種策略更新規(guī)則更新自己的策略,最終達到一種演化穩(wěn)定策略(Evolutionarily stable strategy,ESS)——所有參與博弈的個體在重復(fù)博弈中選擇的某個最優(yōu)的、穩(wěn)定的策略,即演化博弈中的均衡點。與經(jīng)典博弈中所討論的納什均衡不同,演化穩(wěn)定策略是一種更加嚴格的均衡,該策略所對應(yīng)的收益相對變異者來說是占優(yōu)勢的,而且演化穩(wěn)定策略只是一種初始狀態(tài)的優(yōu)勢策略,并不是演化的結(jié)果狀態(tài)。演
57、化穩(wěn)定策略最大的不足之處就在于它把影響系統(tǒng)的因素都看成是一個個的孤立事件,而在現(xiàn)實中系統(tǒng)常常會受到各種沖擊。復(fù)雜網(wǎng)絡(luò)上的演化博弈研究主要是在結(jié)構(gòu)化的群體結(jié)構(gòu)上,考慮復(fù)雜網(wǎng)絡(luò)上所刻畫的博弈者之間的相互作用關(guān)系。正是由于這種</p><p> 博弈論最早體現(xiàn)在真實的生物學(xué)領(lǐng)域中,也最早的應(yīng)用來解釋生物科學(xué)中的問題。1973年Smith 和Price發(fā)表的動物沖突的邏輯,是博弈論第一次被正式的應(yīng)用于生物學(xué)中,也是演化
58、穩(wěn)定策略的來源。該文運用博弈論的思想從個體選擇的角度解釋了動物間的爭斗為什么從來都是有限且非惡性的。從經(jīng)典博弈論發(fā)展到演化博弈論,其中有3個關(guān)鍵性的內(nèi)涵發(fā)生了轉(zhuǎn)變。</p><p> 第一個是策略內(nèi)涵的轉(zhuǎn)變。經(jīng)典博弈論中,博弈個體被假定是超理性的,所有可能選擇的不同策略構(gòu)成策略集。在演化博弈論中個體的超理性被達爾文的“適者生存”規(guī)則所代替。那些不采取“理性”策略的個體會在漫長的演化過程中趨于滅絕。</p&
59、gt;<p> 第二個是均衡意義的轉(zhuǎn)變。在演化博弈論中,經(jīng)典博弈論中的納什均衡被演化穩(wěn)定策略所代替。演化穩(wěn)定策略可以是純策略,也可以是混合策略。與納什均衡相比,演化穩(wěn)定策略是一種更嚴格的均衡。</p><p> 第三個是個體交互作用內(nèi)涵的轉(zhuǎn)變。經(jīng)典博弈論中,博弈個體只進行一次博弈,或者與相同的個體進行多次博弈。而在演化博弈論中,博弈個體隨機選配成對進行多次博弈,且假定再次遇到相同對手的概率很小。
60、</p><p> 上述3個重要概念的內(nèi)涵轉(zhuǎn)變,使得演化博弈理論從一個靜態(tài)的過程成為一個動態(tài)演變的理論,更著重于對演化穩(wěn)定策略的研究,能夠描述動態(tài)系統(tǒng)的局部動態(tài)性質(zhì),預(yù)測個體行為。</p><p><b> 復(fù)雜網(wǎng)絡(luò)</b></p><p> 最近二十多年來,網(wǎng)絡(luò)的研究有了突飛猛進的進展。這主要得益于計算機和通信網(wǎng)絡(luò)技術(shù)的巨大進步。借助于
61、它們,我們可以收集和分析以往難以想象的海量的網(wǎng)絡(luò)數(shù)據(jù),并可以研究數(shù)以百萬計甚至數(shù)以億計大小的網(wǎng)絡(luò)。通過對真實世界大量復(fù)雜系統(tǒng)的研究,人們發(fā)現(xiàn)它們的結(jié)構(gòu)不能簡單的用規(guī)則圖或完全隨機圖來描述。但另一方面,這些復(fù)雜的結(jié)構(gòu)有很多共性,比如小的平均距離,高成團系數(shù)以及連接度為冪律分布等拓撲性質(zhì)。人們把這類介于規(guī)則圖和完全隨機圖之間的網(wǎng)絡(luò)稱之為復(fù)雜網(wǎng)絡(luò)(complex networks)。復(fù)雜網(wǎng)絡(luò)是研究復(fù)雜系統(tǒng)的一門新興學(xué)科,近幾年受到研究學(xué)者的廣
62、泛關(guān)注。自然界中的任何復(fù)雜系統(tǒng)都可以抽象成為由相互作用的個體組成的網(wǎng)絡(luò),如互聯(lián)網(wǎng)、萬維網(wǎng)、航空網(wǎng)、電力網(wǎng)、蛋白質(zhì)相互作用網(wǎng)以及各種合作網(wǎng)絡(luò)等。對于復(fù)雜網(wǎng)絡(luò)的研究極大的改變了人們對復(fù)雜外部世界的認識,讓人們認識到了以前的理論尚未涉及到的問題,也迅速引起了諸多領(lǐng)域中科研工作者的興趣,特別是物理學(xué)界、生物學(xué)界,復(fù)雜網(wǎng)絡(luò)理論得到了充分的探索和發(fā)展。研究這些網(wǎng)絡(luò)不僅對于人們的工作和生活至關(guān)重要,而且對于揭示自然界特別是生物系統(tǒng)的奧秘也至關(guān)重要。&
63、lt;/p><p><b> 復(fù)雜網(wǎng)絡(luò)的特征度量</b></p><p> 隨著對復(fù)雜網(wǎng)絡(luò)研究的不斷深入,人們提出了許多概念和度量方法來表示復(fù)雜網(wǎng)絡(luò),這里主要主要介紹節(jié)點的度、簇系數(shù)和平均路徑長度。</p><p> 1、節(jié)點的度 度是描述網(wǎng)絡(luò)局部特性的基本參數(shù),指的是與該節(jié)點連接的其他節(jié)點的數(shù)量。度分布 (degree distribu
64、tion),則表示節(jié)點度的概率分布。如果某一節(jié)點的度分布函數(shù)為P(k),表示該節(jié)點恰好有k條邊的概率。目前度分布較為常見的有兩種,一種是指數(shù)分布,另一種是冪律分布。度分布函數(shù)反應(yīng)了網(wǎng)絡(luò)系統(tǒng)的宏觀統(tǒng)計特征。</p><p> 2、簇系數(shù) (clustering coefficient),又稱為集聚系數(shù),指與同一個節(jié)點相連接的一對節(jié)點相連接的概率,衡量網(wǎng)絡(luò)的集團化程度。全連通的網(wǎng)絡(luò)中,簇系數(shù)為1,一般均小于1。&
65、lt;/p><p> 3、平均路徑長度(average path length,APL),指網(wǎng)絡(luò)中所有節(jié)點與節(jié)點之間平均的最短距離。節(jié)點間的距離是通過從一個節(jié)點到另一個節(jié)點所經(jīng)歷的邊的最小數(shù)目來計算的。復(fù)雜網(wǎng)絡(luò)研究中一個重要發(fā)現(xiàn)就是大部分真實系統(tǒng)中的平均路徑程度都遠比想象中小,我們稱之為小世界效應(yīng)。</p><p> 除上述度分布、簇系數(shù)和平均路徑長度三個最基本的結(jié)構(gòu)特性外,復(fù)雜網(wǎng)絡(luò)還有其
66、他許多度量特征,如介數(shù)(反映了相應(yīng)的節(jié)點或邊在整個網(wǎng)絡(luò)中的作用和影響力,具有很強的現(xiàn)實意義)、網(wǎng)絡(luò)彈性(指網(wǎng)絡(luò)節(jié)點的刪除對連通度的影響)等。</p><p> 不同類型復(fù)雜網(wǎng)絡(luò)簡介</p><p> 根據(jù)復(fù)雜網(wǎng)絡(luò)的特性不同,衍生出很多不同的類型,由于真實社會網(wǎng)絡(luò)具有小世界和無標度等特性,所以這里我們也主要介紹這兩種網(wǎng)絡(luò)。</p><p> 隨機網(wǎng)絡(luò)是最簡單的復(fù)
67、雜網(wǎng)絡(luò),在20世紀50年代由匈牙利的兩位數(shù)學(xué)家提出的。在ER隨機網(wǎng)絡(luò)模型中,首先給定網(wǎng)絡(luò)中的節(jié)點數(shù)目,然后讓任意兩節(jié)點之間以相同的概率連接在一起完全隨機地構(gòu)成網(wǎng)絡(luò)。該模型自提出后被廣泛應(yīng)用于社會與生態(tài)學(xué)的研究。</p><p> 小世界網(wǎng)絡(luò)模型,由Watts和Strogatz提出的,這個模型構(gòu)建在一維格子基礎(chǔ)上,是對一個臨近節(jié)點耦合的規(guī)則網(wǎng)絡(luò)進行隨機化重連之后所能生成的網(wǎng)絡(luò)模型。與隨機網(wǎng)絡(luò)相比,其顯著特性是簇系
68、數(shù)大、平均路徑長度小。小世界網(wǎng)絡(luò)上的空間純策略主要分為兩類:一類是基于環(huán)的小世界網(wǎng)絡(luò),另一類是基于方格的小世界網(wǎng)絡(luò)。根據(jù)網(wǎng)絡(luò)中度的變化特性又可將小世界網(wǎng)絡(luò)分為同質(zhì)與異質(zhì)。</p><p> 1.2.3 復(fù)雜網(wǎng)絡(luò)上的演化博弈</p><p> 人們對網(wǎng)絡(luò)的研究由來已久,圖論是最早涉足網(wǎng)絡(luò)研究的數(shù)學(xué)理論。圖論中網(wǎng)絡(luò)被稱為圖,圖是網(wǎng)絡(luò)的數(shù)學(xué)表達形式,它由頂點和邊構(gòu)成。圖論的起源很早,瑞士數(shù)
69、學(xué)家Eul目在1736年解決了著名的哥尼斯城堡七橋問題,從而使他成為圖論和拓撲學(xué)的創(chuàng)始人。此后開展的研究工作大多基于網(wǎng)格等規(guī)則網(wǎng)絡(luò),直到上世紀五十年代,匈牙利數(shù)學(xué)家Efdos和R∞yi創(chuàng)造性的將概率論引入圖論并成功地提出了第一個隨機圖模型一ER模型。在過去幾十年中,ER模型已成為隨機圖論的研究基礎(chǔ)并一直占據(jù)著復(fù)雜網(wǎng)絡(luò)研究的主導(dǎo)地位。近年來,以還原論和整體論相結(jié)合為重要特色的復(fù)雜性科學(xué)的興起,促使人們開始關(guān)注復(fù)雜網(wǎng)絡(luò)的拓撲結(jié)構(gòu)及其產(chǎn)生機理
70、:諸如因特網(wǎng)等大量新型網(wǎng)絡(luò)的相繼出現(xiàn)使得人們對復(fù)雜網(wǎng)絡(luò)性質(zhì)的了解變得越來越迫切;計算機技術(shù)的飛速發(fā)展為大規(guī)模復(fù)雜網(wǎng)絡(luò)的研究提供了有效的工具,使得人們可以對那些包含上百萬乃至于上千萬個頂點的網(wǎng)絡(luò)進行分析,而這在若干年前還是不可想象的事情;不同領(lǐng)域中反映復(fù)雜網(wǎng)絡(luò)拓撲結(jié)構(gòu)的數(shù)據(jù)庫相繼出現(xiàn)為復(fù)雜網(wǎng)絡(luò)的研究提供了可靠的實驗數(shù)據(jù),使得研究者能夠?qū)Σ煌愋偷臄?shù)據(jù)進行分析進而發(fā)現(xiàn)復(fù)雜網(wǎng)絡(luò)所具有的共同特征;上述因素加之各學(xué)科間的相</p>
71、<p> 模仿最優(yōu)秀者(best-takes-over):每一輪博弈過后,個體采取與其博弈的個體中最大收益的個體的策略進行下一輪博弈;</p><p> 模仿優(yōu)勝者(proportional updating):個體在進行策略更新時,與跟其進行博弈的其他個體比較,并以某種正比于收益的概率采取收益比自身高的個體的策略進行下一輪博弈;</p><p> 配對比較(match-p
72、airing comparision):個體隨機選擇參與博弈的其他個體進行收益比較,并以某種概率(通常是兩個體收益差的函數(shù))轉(zhuǎn)變?yōu)閷Ψ降牟呗浴?lt;/p><p> 以上三種是復(fù)雜系統(tǒng)中比較常用的策略更新方法?,F(xiàn)在大部分研究中采用的更科學(xué)的策略更新規(guī)則是:</p><p> 式中:等號左邊表示的是節(jié)點x模仿鄰居節(jié)點y策略的概率,M代表節(jié)點的累計收益,T表示節(jié)點的理性程度。當(dāng)T=0時,表示節(jié)
73、點完全理性;當(dāng)T趨向于無窮時,表示節(jié)點毫無理性,隨機選擇;易知,存在一個適當(dāng)?shù)腡使得合作達到最高水平。</p><p> 網(wǎng)絡(luò)中參與博弈的個體比較多時,策略的更新又受到一個先后秩序的影響,我們稱之為同步更新與隨機更新。同步更新是指所有參與博弈的個體同時進行策略的更新,通常應(yīng)用在生物模型中;隨機更新也叫非同步更新,是指在網(wǎng)絡(luò)中隨機選擇參與博弈的個體進行策略的更新,這種更新規(guī)則很好的反應(yīng)了真實社會系統(tǒng),因而受到了更
74、多的關(guān)注。但在很多情況下,這兩種更新方式對博弈的結(jié)果并沒有明顯的影響。</p><p> 2 公共品博弈背景簡介</p><p><b> 2.1 背景簡介</b></p><p> 由于現(xiàn)實生活中往往不只是兩個個體間的博弈,而是多人之間的博弈,因此有必要將囚徒困境模型擴展為一個多人博弈的模型,這就是本文研究的新的網(wǎng)絡(luò)模型之一——公共品
75、博弈模型。</p><p> 公共品博弈是以公共品為博弈對象的博弈,這種博弈廣泛存在于復(fù)雜網(wǎng)絡(luò)之中。一般來說,公共品是指在消費過程中具有非競爭性和非排他性的物品。因為公共品具有這樣的性質(zhì),所以集體中的每個人都會希望由其他人來提供,而自己坐享其成,這種行為被稱為搭便車。搭便車問題使集體行動變得難以實現(xiàn)——集體成員存在搭便車的動機,隨著集體中社會成員數(shù)量的增加,這種動機會更強烈,導(dǎo)致合作水平降低。搭便車問題的存在,
76、解釋了很多社會困境。例如,惡劣的環(huán)境無人清理,不合理的制度人人抱怨卻無人抵制。在公共品博弈中,合作者C的貢獻a經(jīng)過一個r倍的放大后在全體參與者N中平均分配,如果N=Nc,這所有參與者的收益都將提高r倍。但如果N中出現(xiàn)了背叛者D,不貢獻a而同樣軒參與分配(搭便車),則可獲得比合作者更高的凈收益Pd=a·r·Nc/N。從納什均衡的角度看,公共品博弈中,背叛將始終是最佳策略。從演化均衡的角度看,D將侵入C所組成的團體,并最
77、終取代C。</p><p> 然而,公共品博弈的理論結(jié)果與現(xiàn)實的差異很大。大量的實驗研究表明,集體成員的搭便車動機是有限的,合作能夠達到一個客觀且穩(wěn)定的水平。這就表明,在重復(fù)公共品博弈過程中,個體不僅要考慮自身收益,還受到很多外在因素的影響,如激勵與懲罰(本文通過引入一個積極因素——獎勵,來研究其對合作演化的影響),而且社會系統(tǒng)中的個體還具有某種異質(zhì)性——稱為社會偏好,這種社會偏好使得個體會考慮他人的選擇,具體
78、表現(xiàn)為互惠、不平等厭惡、學(xué)習(xí)和遷移等。很顯然,這些外在因素的存在會降低個體搭便車的動機,并提高合作水平。</p><p><b> 2.2 群選擇學(xué)說</b></p><p> 在群選擇學(xué)說中,把種群看做一個進化的單位在群體層次上起作用。那些對種群有利但對個體不利的特征之所以能夠保存下來,是因為種群的選擇會使這一特征出現(xiàn)的頻率增加,而個體選擇服從群體的利益,是為避
79、免群體被淘汰。公共品博弈與此相似,搭便車行為雖然使個體的收益提高了,但是卻損害了集體的利益,導(dǎo)致集體被淘汰,于是,在外界壓力下,個體選擇合作來避免此情況的發(fā)生。 </p><p> 2.3 互惠與強互惠效應(yīng)</p><p> 互惠機制包括直接互惠和間接互惠。</p><p> 直接互惠中的個體之所以冒著被背叛的風(fēng)險去與其他個體合作是因為希望在日后與受惠者再次相
80、遇時有可能得到回報,以便獲益更大?;貓蟛攀腔セ堇髁x者的真正目的,這次利他是想在下次更有益于自己。直接互惠雖然有利于合作的而建立,但也可能陷入相互背叛的困境。</p><p> 間接互惠的基礎(chǔ)是“聲譽”。B幫助A是為了提高聲譽,以期待第三方C的幫助。在這種情況下,由于報復(fù)策略的制約,合作可能因為一個背信行為而導(dǎo)致合作的失敗。因為第一個受背叛者的報復(fù)行為要經(jīng)過許多回合之后才會打擊到始作傭者,這樣許多無辜者會受到
81、懲罰,合作是不穩(wěn)定的。</p><p> 直接互惠和間接互惠都無法很好的解決公共品博弈中的合作現(xiàn)象,這種情況下,強互惠理論應(yīng)運而生。</p><p> 強互惠理論認為,人類之所以能維持比其他物種更高度的合作關(guān)系,在于許多人都具有這樣一種行為傾向:在團體中與別人合作,并不惜花費個人成本去懲罰那些破壞群體規(guī)范的人,即使這些成本并不能被預(yù)期得到補償。強互惠能抑制團體中的背叛、逃避責(zé)任和搭便車
82、行為,從而有效提高團體成員的福利水平,但實施這種行為需要個人承擔(dān)成本。這樣就帶來一個新的問題,既然這種強互惠行為所提高的是團隊的收益,那么這個成本由誰來負擔(dān)?每一個合作者都會寄希望于其它合作者承擔(dān)這個成本,這就是所謂的“二階搭便車問題”。解決這個問題又產(chǎn)生了許多討論,包括合作懲罰以及制度的制定等。</p><p><b> 2.4 空間效應(yīng)</b></p><p>
83、; 由于真實系統(tǒng)中的個體或要素之間存在策略依賴關(guān)系,我們可以在各種網(wǎng)絡(luò)上建立空間博弈模型,這樣又發(fā)現(xiàn)了許多空間因素的影響。</p><p> a) 獨立者的引入:在公共品博弈模型中引入不參與博弈,但會每局收到少而固定的收益的獨立者。這樣,在一定r下,就會出現(xiàn)一種動態(tài)平衡。當(dāng)群體較小時,合作者占優(yōu)勢地位;群體較大時,背叛者占優(yōu)勢地位。</p><p> b)網(wǎng)絡(luò)的影響:不同的網(wǎng)絡(luò)(規(guī)則
84、網(wǎng)絡(luò),無標度網(wǎng)絡(luò),小世界網(wǎng)絡(luò))對于合作的促進作用是不同的。</p><p> c)策略的改變:在博弈中引入學(xué)習(xí)和遷移的策略。使個體在博弈中有一定幾率交換位置會明顯影響博弈的結(jié)果。</p><p><b> 3 模型建立</b></p><p><b> 3.1 模型介紹</b></p><p>
85、; 本文所建立的模型是基于復(fù)雜網(wǎng)絡(luò)的公共品演化博弈模型。模型中只考慮個體與其最近鄰的博弈。</p><p> 模型大小為的網(wǎng)絡(luò),節(jié)點數(shù)N=10000,其中每個節(jié)點分別與其最近鄰的8個節(jié)點(稱為節(jié)點的度,即博弈半徑R<2)發(fā)生博弈,包括節(jié)點本身在內(nèi)的九個節(jié)點之間的博弈稱為節(jié)點的博弈環(huán)境。初始時刻網(wǎng)絡(luò)中的節(jié)點等概率的隨機選擇策略C和D,在博弈的過程中我們采取同步升級的博弈策略,即所有節(jié)點的新策略在下一時刻同
86、時影響其他節(jié)點。我們模擬時選擇的蒙特卡羅步數(shù)為20000,并選擇最后500步的平均作為輸出結(jié)果。每個節(jié)點都有兩種選擇,合作(cooperation)或者背叛(defection),博弈環(huán)境中選擇C策略的節(jié)點數(shù)占總的節(jié)點數(shù)記為,每個節(jié)點周圍包括該節(jié)點本身在內(nèi)選擇C策略的節(jié)點數(shù)記為。一輪博弈之后,每個節(jié)點在其博弈環(huán)境內(nèi)可以等概率選擇進行策略學(xué)習(xí)或遷移,其中,本文所采用的策略更新規(guī)則是模仿最優(yōu)秀者(best-takes-over),即在每一輪
87、博弈過后,個體采取其博弈環(huán)境中獲得最高收益?zhèn)€體的策略進行下一輪博弈;遷移策略則是在博弈環(huán)境內(nèi)選擇最大收益的個體進行強制性換位(被選定的個體具有優(yōu)先權(quán))。節(jié)點(i,j),在博弈過程中的收益P(i,j)定義為</p><p> 其中,pc是選擇C策略所獲得收益,pd為選擇D策略所獲得的收益;t為引入的獎勵因子,是與總收益有關(guān)的一個量,令</p><p><b> 獎勵收益=<
88、;/b></p><p> 獎勵收益是總收益的一部分,用來獎勵合作者,獎勵收益占總收益的比例即是我們引入的獎勵因子t。</p><p> 為了保證選擇合作的收益大于選擇背叛的收益,我們規(guī)定r>1.下面我們討論l取不同值時對合作演化的動態(tài)影響。</p><p><b> 3.2 現(xiàn)象及描述</b></p><
89、p> 我們?nèi)=4.0時為例:</p><p> (a)取t=0.1時,概率的演化情況如下圖(1)所示:</p><p><b> ?。▓D 1)</b></p><p> 圖(1)表明,合作者概率隨局數(shù)m(時間)的演化狀況,開始時呈現(xiàn)震蕩變化,隨著局數(shù)的增加,概率逐漸穩(wěn)定在確定的數(shù)值不再變化。</p><p&g
90、t; ?。╞)下圖(2)表示的是合作者概率隨隨t占總收益的不同比例(t=0.1~0.9)的變化情況:</p><p><b> ?。▓D 2)</b></p><p> 圖(2)表明,隨t的單位變化,pc在0~1之間震蕩。</p><p> (c)當(dāng)增益系數(shù)r(r=2.0~10.0)變化時,對應(yīng)的合作者概率隨t的變化情況如下:</p&
91、gt;<p><b> i</b></p><p><b> ?。?圖 3)</b></p><p><b> 3.3 結(jié)語</b></p><p> 有關(guān)模型結(jié)果的理論分析及解釋需等待后續(xù)工作的完成,在此不再詳述。</p><p><b> 4
92、 結(jié)論與展望</b></p><p> 復(fù)雜網(wǎng)絡(luò)上的演化博弈研究是近年來隨著復(fù)雜網(wǎng)絡(luò)研究興起而逐漸引起關(guān)注的一個研究領(lǐng)域。關(guān)于公共品博弈還缺乏系統(tǒng)的研究,大多數(shù)的工作只是一些數(shù)值仿真結(jié)果。由于數(shù)學(xué)工具的不足,對復(fù)雜網(wǎng)絡(luò)上的博弈動力學(xué)進行解析是非常困難的。目前的一些近似方法,如平均場方法、對估計方法對異質(zhì)程度很大的網(wǎng)絡(luò)很有可能失效。因此,尋求有效的數(shù)學(xué)工具,探求更好的理論結(jié)果,將一些數(shù)值結(jié)果命題化、
93、嚴格化、一般化,將是十分有意義的。</p><p> 在演化博弈上的博弈動力學(xué)還沒有得到充分的研究,因此研究網(wǎng)絡(luò)拓撲和博弈動力學(xué)的共同演化將是一個非常有前景的方向。另外,還可以對個體的異質(zhì)性進行進一步的探究,使得模型更合理的描述、反映現(xiàn)實,解決一些社會、經(jīng)濟中的公開問題。對合作機制的研究,目前還沒有統(tǒng)一的認識,依然是演化博弈中最重要的方向,也是當(dāng)前演化博弈的焦點問題,除了要考慮可能的內(nèi)在機制外,我們還應(yīng)考慮下復(fù)
94、雜網(wǎng)絡(luò)上的其他動力學(xué)行為,應(yīng)用演化博弈的思想解決一些實際問題,如“傳染病傳播問題”、“生物進化”、“市場經(jīng)濟行為規(guī)律”等等。</p><p> 目前關(guān)于博弈模型的研究大多集中在囚徒困境模型、雪堆博弈模型等,應(yīng)拓展我們的研究范圍,研究不同類型下的博弈模型,例如本文的公共品博弈模型等。</p><p> 關(guān)于公共品博弈的研究,現(xiàn)在大部分集中在經(jīng)濟學(xué)領(lǐng)域,對公共品博弈的未來發(fā)展,應(yīng)對復(fù)雜網(wǎng)絡(luò)
95、的異質(zhì)性進一步研究,將現(xiàn)實社會中個體之間的差異、各種社會影響因素等考慮在內(nèi),使得模型更加系統(tǒng)完善,更好的反映現(xiàn)實,進而解決現(xiàn)實社會中的社會困境。</p><p><b> 參考文獻</b></p><p> Public goods games with reward in finite populations,J.Marh.biol.DOI 10.1007/s0
96、0285-010-0363-7</p><p> [2]Neumann JV,Morgenstern O.Theory of Games and Economic Behavior.Princeton:Princeton University Press,1953</p><p> [3]Nash J F.Equilibrium points in n-person games.Pro
97、natl Acad Sci USA,1950,36:48</p><p> [4]Alvard MS, Nolin DA (2002) Rousseau’s whale hunt? Coordination among big-game hunters. Curr Anthro 43(4):533–559</p><p> [5]Antal T, Scheuring I (200
98、6) Fixation of strategies for an evolutionary game in finite populations. BullMath</p><p> Biol 68:1923–1944</p><p> [6]Antal T, Scheuring I (2006) Fixation of strategies for an evolutionary g
99、ame in finite populations. BullMath</p><p> Biol 68:1923–1944</p><p> [7]Berg J, Dickhaut J, McCabe K (1995) Trust, reciprocity, and social history. Games Econ Behav 10:122–142</p><
100、p> [8]Boyd R, Richerson PJ (1988) The evolution of reciprocity in sizeable groups. J Theor Biol 132:337–356</p><p> Brandt H, Hauert C, Sigmund K (2006) Punishing and abstaining for public goods. Proc N
101、atl Acad Sci</p><p> USA 103(2):495–497</p><p> [9]Clutton-Brock TH, O’Riain MJ, Brotherton PNM, Gaynor D, Kansky R, Griffin AS, Manser M (1999)</p><p> [10]Selfish sentinels in
102、cooperative mammals. Science 284:1640–1644</p><p> [11]Colman A (2006) The puzzle of cooperation. Nature 440:744–745</p><p> [12]Dawes RM (1980) Social dilemmas. Annu Rev Psychol 31:169–193<
103、;/p><p> [13]De Silva H, Sigmund K (2009) In games, groups and the global good. In: Levin SA (ed) Game theory.</p><p> [14]Springer, Berlin pp 85–114</p><p> [15]Fehr E, Gächte
104、r S (2000) Fairness and retaliation: the economics of reciprocity. J Econ Perspect 14(3):159–181</p><p> [16]Fehr E, Gächter S (2002) Altruistic punishment in humans. Nature 415:137–140</p><
105、p> of costly punishment. Science 316:1905–1907</p><p> [17]Henrich J, Boyd R, Bowles S, Camerer C, Fehr E, Gintis H, McElreath R (2001) Cooperation, reciprocity</p><p> and punishment in f
106、ifteen small scale societies. Am Econ Rev 91:73–78</p><p> [18]Hilbe C, Sigmund K (2010) Incentives and opportunism: from the carrot to the stick. Proc R Soc Lond B</p><p><b> (online)&l
107、t;/b></p><p> [19]陳亮、朱士群;小世界網(wǎng)絡(luò)中的公共品博弈[M],蘇州大學(xué)學(xué)報(自然科學(xué)版),第24卷第3期</p><p> [20]王龍、伏鋒、陳小杰、王靖、李卓政、楚天廣;復(fù)雜網(wǎng)絡(luò)上的演化博弈[M],智能系統(tǒng)學(xué)報,第2卷第2期</p><p> [21]鄭金連、狄增如;復(fù)雜網(wǎng)絡(luò)研究與復(fù)雜現(xiàn)象[M],系統(tǒng)辯證學(xué)學(xué)報,第13卷第4期&
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 公共品博弈的空間效應(yīng)研究【文獻綜述】
- 公共品博弈的空間效應(yīng)研究【開題報告】
- rock-sciessors-paper(rsp)博弈模型的空間效應(yīng)研究【開題報告+文獻綜述+畢業(yè)論文】
- 公共品博弈的空間效應(yīng)研究【畢業(yè)設(shè)計】
- 博弈視角的中美貿(mào)易爭端分析【開題報告+文獻綜述+畢業(yè)論文】
- 初探博弈論及其應(yīng)用【開題報告+文獻綜述+畢業(yè)論文】
- 藥品保健品廣告的倫理分析【開題報告+文獻綜述+畢業(yè)論文】
- 矩陣分解的研究[畢業(yè)論文+開題報告+文獻綜述]
- 反常積分的研究[畢業(yè)論文+開題報告+文獻綜述]
- 外商對華直接投資的外溢效應(yīng)研究【開題報告+文獻綜述+畢業(yè)論文】
- 關(guān)于拓撲空間連通性的研究 【畢業(yè)論文+文獻綜述+開題報告】
- 關(guān)于拓撲空間分離性的研究[畢業(yè)論文+開題報告+文獻綜述]
- 人民幣匯率波動的就業(yè)效應(yīng)研究【開題報告+文獻綜述+畢業(yè)論文】
- 基于利他動機差異的動機擁擠效應(yīng)研究【開題報告+文獻綜述+畢業(yè)論文】
- 我國企業(yè)工會在勞資博弈中的角色研究【文獻綜述+開題報告+畢業(yè)論文】
- 囚徒困境在博弈演化中的自適應(yīng)行為研究【開題報告+文獻綜述+畢業(yè)論文】
- 被xx現(xiàn)象研究【開題報告+文獻綜述+畢業(yè)論文】
- 論航運金融衍生品法律監(jiān)管【開題報告+文獻綜述+畢業(yè)論文】
- 漢代奢侈之風(fēng)研究【開題報告+文獻綜述+畢業(yè)論文】
- 政府危機管理研究【開題報告+文獻綜述+畢業(yè)論文】
評論
0/150
提交評論