2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩78頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、在自然界與人類社會活動中,各種復(fù)雜類型的系統(tǒng)都可以轉(zhuǎn)化成相應(yīng)的復(fù)雜網(wǎng)絡(luò),比如經(jīng)濟(jì)系統(tǒng)、生物系統(tǒng)、群體生態(tài)系統(tǒng)以及其他領(lǐng)域內(nèi)系統(tǒng)。復(fù)雜網(wǎng)絡(luò)分析領(lǐng)域的一個重要研究方向是社區(qū)結(jié)構(gòu)及其社區(qū)挖掘。一個復(fù)雜網(wǎng)絡(luò)的社區(qū)結(jié)構(gòu)大致可描述為:在這個社區(qū)內(nèi)部里,頂點(diǎn)連接比較緊密,而這個社區(qū)連接外部社區(qū)的聯(lián)系是比較稀疏的。在結(jié)構(gòu)上,一個社區(qū)往往是相對獨(dú)立的,通常它們各自對應(yīng)一些基本的功能單元。例如,在生物基因遺傳網(wǎng)絡(luò)中,一個社區(qū)往往包含具有類似功能的基因模塊;

2、在萬維網(wǎng)中,一個社區(qū)對應(yīng)著相同類型主題或者資源的網(wǎng)頁。從復(fù)雜的網(wǎng)絡(luò)中挖掘和分析這樣的社區(qū)結(jié)構(gòu),為復(fù)雜網(wǎng)絡(luò)的功能解析和揭示網(wǎng)絡(luò)的組織原則提供了一種創(chuàng)新的研究方法。
  相對于單分網(wǎng)絡(luò),二分網(wǎng)絡(luò)不僅是復(fù)雜網(wǎng)絡(luò)中重要的表現(xiàn)形式之一,而且在現(xiàn)實(shí)社會復(fù)雜網(wǎng)絡(luò)中具有普遍性,已經(jīng)成為復(fù)雜網(wǎng)絡(luò)的重要研究對象。在現(xiàn)實(shí)社會中,許多復(fù)雜網(wǎng)絡(luò)都自然地呈現(xiàn)出二分結(jié)構(gòu)。譬如:作者與文章的合作網(wǎng)絡(luò)、演員與影視作品的合作網(wǎng)絡(luò)、投資者與股份制公司的股份合作網(wǎng)絡(luò)、疾

3、病與基因的作用網(wǎng)絡(luò)、俱樂部成員與俱樂部舉辦活動的參與網(wǎng)絡(luò)、觀眾與歌曲的喜好網(wǎng)絡(luò)、P2P系統(tǒng)中終端計(jì)算與交互數(shù)據(jù)的網(wǎng)絡(luò)等。因此,二分網(wǎng)絡(luò)社區(qū)挖掘?qū)τ谘芯繌?fù)雜網(wǎng)絡(luò)有非常重要的理論意義和實(shí)用價值。譬如,在學(xué)術(shù)圈的探測、功能分析、推薦系統(tǒng)、疾病診斷以及鏈接預(yù)測等方面都有很多重要的應(yīng)用。
  在最近的二分網(wǎng)絡(luò)社區(qū)挖掘研究中,學(xué)者們提出了許多的社區(qū)挖掘算法和二分模塊度指標(biāo)。為了評估網(wǎng)絡(luò)社區(qū)挖掘結(jié)果的質(zhì)量,Newman介紹了一種量化的方法,稱為

4、模塊度。Guimera等人提出了一種基于同質(zhì)頂點(diǎn)共同鄰居的二分模塊度,只針對一種類型的頂點(diǎn)劃分的社區(qū)。Barber拓展了Newman的單分網(wǎng)絡(luò)的模塊度,提出了異質(zhì)社區(qū)間一一對應(yīng)的二分模塊度,同時提出了adaptive BRIM算法用來社區(qū)挖掘通過最大化獲得二分模塊度。Murata基于Newman的單分網(wǎng)絡(luò)模塊度提出了異質(zhì)社區(qū)間一對多關(guān)系的二分模塊度,對于單分網(wǎng)絡(luò),該模塊度和Newman的單分網(wǎng)絡(luò)模塊度一致。Suzuki和Liu Xin等

5、人基于異質(zhì)社區(qū)間多關(guān)系對應(yīng)分別提出了兩種不同的二分模塊度。Raghavan等人介紹了一種標(biāo)號傳播算法用于社區(qū)挖掘。Murata還對標(biāo)簽傳播算法(LPA)做了改進(jìn),提出一種更加適合二分網(wǎng)絡(luò)的算法。同時,Murata等人提出了LP&RRIM算法,該算法是對BRIM算法和LPA算法的整合和改進(jìn)。
  針對二分網(wǎng)絡(luò)社區(qū)挖掘的研究,本文中的主要工作以及研究成果有:
  (1)我們提出了基于蟻群優(yōu)化的二分網(wǎng)絡(luò)社區(qū)挖掘算法。首先,我們先將

6、二分網(wǎng)絡(luò)社區(qū)挖掘問題轉(zhuǎn)化成二分網(wǎng)絡(luò)頂點(diǎn)組合優(yōu)化問題。其次,我們以蟻群優(yōu)化算法為基礎(chǔ),結(jié)合二分網(wǎng)絡(luò)的統(tǒng)計(jì)特性,重新定義了信息素和啟發(fā)式信息,設(shè)計(jì)了新穎的螞蟻覓食的社區(qū)劃分模型。最后,我們選擇適當(dāng)?shù)亩帜K度衡量社區(qū)劃分的質(zhì)量。通過實(shí)驗(yàn)驗(yàn)證發(fā)現(xiàn),我們的算法不僅準(zhǔn)確地識別二分網(wǎng)絡(luò)的社區(qū)個數(shù),還可以獲得很好的劃分效果。該算法的另一個優(yōu)點(diǎn)是它不需要預(yù)先制定社區(qū)的個數(shù),而是在優(yōu)化過程中形成最優(yōu)的個數(shù)。
  (2)針對二分網(wǎng)絡(luò)中多關(guān)系社區(qū)的挖掘

7、問題,我們提出了一種多關(guān)系社區(qū)的二分網(wǎng)絡(luò)社區(qū)挖掘算法。該算法以異質(zhì)社區(qū)之間多對多對應(yīng)關(guān)系為基礎(chǔ),以同類型頂點(diǎn)的共同鄰居數(shù)作為啟發(fā)式信息。該啟發(fā)式信息表示同類型頂點(diǎn)的相似程度,以多關(guān)系異質(zhì)社區(qū)的二分模塊度為量化標(biāo)準(zhǔn),結(jié)合蟻群優(yōu)化策略進(jìn)行二分網(wǎng)絡(luò)社區(qū)挖掘,對二分網(wǎng)絡(luò)進(jìn)行多關(guān)系異質(zhì)社區(qū)劃分。通過實(shí)驗(yàn)驗(yàn)證發(fā)現(xiàn),我們的算法能較準(zhǔn)確地對實(shí)際二分網(wǎng)絡(luò)進(jìn)行多關(guān)系異質(zhì)社區(qū)劃分。
  (3)針對現(xiàn)有二分網(wǎng)絡(luò)的模塊度的局限性,我們提出了一種基于密度的二

8、分模塊度,用來量化二分網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)劃分的質(zhì)量。在二分網(wǎng)絡(luò)中,學(xué)者們根據(jù)對二分網(wǎng)絡(luò)社區(qū)定義的不同理解,提出了多種二分模塊度。然而,這些二分模塊度往往取決于網(wǎng)絡(luò)社區(qū)中連接的數(shù)量而忽略二分網(wǎng)絡(luò)中頂點(diǎn)的數(shù)量,無法識別規(guī)模較小的社區(qū)結(jié)構(gòu),存在一定的局限性。我們通過幾個數(shù)據(jù)集以及理論上和數(shù)學(xué)公式的邏輯證明,我們提出的基于密度的二分網(wǎng)絡(luò)模塊度不存在類似的局限性,還可以作為目標(biāo)函數(shù)進(jìn)行優(yōu)化,也可歸結(jié)為一個數(shù)值的非線性規(guī)劃問題。通過實(shí)驗(yàn)驗(yàn)證發(fā)現(xiàn),基于密度

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論