版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、Google Scholar為我們搜索各種來(lái)源的學(xué)術(shù)文獻(xiàn)信息提供了一個(gè)簡(jiǎn)單易用的平臺(tái)。它使用網(wǎng)絡(luò)爬蟲來(lái)把各種來(lái)源的文獻(xiàn)信息集中存儲(chǔ)到Google自己的數(shù)據(jù)庫(kù)里,然后通過(guò)web向用戶提供這些信息。從技術(shù)上來(lái)講,Google Scholar是基于客戶端/服務(wù)器端模型的,作為一個(gè)集中式的系統(tǒng),有著它自身的缺陷。近年來(lái),P2P(Peer-to-Peer,點(diǎn)對(duì)點(diǎn))計(jì)算越來(lái)越盛行,它能夠以分布,自治的方式來(lái)處理海量數(shù)據(jù),其特征在搜索能力、可擴(kuò)展性、
2、高效率,以及對(duì)故障和動(dòng)態(tài)環(huán)境的應(yīng)變能力方面展現(xiàn)了巨大的潛力。 在本篇論文中,我們提出了一種面向?qū)W術(shù)文獻(xiàn)檢索的P2P網(wǎng)絡(luò)研究--PPScholar,它建立在P2P網(wǎng)絡(luò)和Dublin Core元數(shù)據(jù)標(biāo)準(zhǔn)的基礎(chǔ)之上。我們的主要研究?jī)?nèi)容就是如何使各個(gè)學(xué)術(shù)文獻(xiàn)信息源的數(shù)據(jù)庫(kù)以P2P的方式合作,建立起一個(gè)適用于學(xué)術(shù)文獻(xiàn)檢索的基于元數(shù)據(jù)的P2P網(wǎng)絡(luò)。在研究過(guò)程中,我們主要致力于兩大問(wèn)題:一是如何隱藏信息源的異構(gòu)性;二是如何建立一個(gè)適合于本應(yīng)用
3、的P2P網(wǎng)絡(luò)。在建立P2P網(wǎng)絡(luò)的過(guò)程中,我們基于在Gnutella網(wǎng)絡(luò)中發(fā)現(xiàn)的兩種冪律分布,在Gnutella網(wǎng)絡(luò)的基礎(chǔ)之上,增加學(xué)習(xí)型節(jié)點(diǎn)來(lái)以多種方式改進(jìn)我們的應(yīng)用。 首先,我們根據(jù)在P2P網(wǎng)絡(luò)中發(fā)現(xiàn)的節(jié)點(diǎn)連接數(shù)的冪率分布規(guī)律,將那些擁有連接數(shù)多,性能強(qiáng)大的節(jié)點(diǎn)選擇為學(xué)習(xí)型節(jié)點(diǎn),形成一種兩層架構(gòu)的P2P網(wǎng)絡(luò)。這些學(xué)習(xí)型節(jié)點(diǎn)可以學(xué)習(xí)整個(gè)網(wǎng)絡(luò)的知識(shí),比如緩沖查詢請(qǐng)求與結(jié)果等,從而使得查詢請(qǐng)求能夠在少數(shù)的學(xué)習(xí)型節(jié)點(diǎn)中就能得到結(jié)果。同
4、時(shí)通過(guò)模擬實(shí)驗(yàn),在將TTL(Time-to-Live)控制在可接受的前提下,盡量選擇那些擁有連接數(shù)最多,性能最強(qiáng)大的節(jié)點(diǎn)作為學(xué)習(xí)型節(jié)點(diǎn),從而盡可能減少學(xué)習(xí)型節(jié)點(diǎn)的數(shù)量。另外,我們還根據(jù)P2P網(wǎng)絡(luò)中發(fā)現(xiàn)的搜索關(guān)鍵字的冪率分布規(guī)律,提出了新的緩沖算法--適應(yīng)性最少頻率使用算法(Adaptive Least Frequently Used),并根據(jù)此算法在學(xué)習(xí)型節(jié)點(diǎn)中建立緩沖區(qū),作為學(xué)習(xí)型節(jié)點(diǎn)的學(xué)習(xí)能力之一。 通過(guò)實(shí)際模擬實(shí)驗(yàn),我們驗(yàn)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- P2P信息檢索的研究.pdf
- P2P網(wǎng)絡(luò)基于異構(gòu)本體的語(yǔ)義檢索機(jī)制的研究.pdf
- 面向中文文本的P2P信息檢索系統(tǒng)的研究.pdf
- 基于語(yǔ)義檢索的結(jié)構(gòu)化P2P網(wǎng)絡(luò)模型研究.pdf
- P2P網(wǎng)絡(luò)仿真研究.pdf
- 基于小世界模型的P2P網(wǎng)絡(luò)文本檢索.pdf
- 基于P2P的生物信息檢索.pdf
- 面向移動(dòng)設(shè)備的P2P網(wǎng)絡(luò)的安全改進(jìn).pdf
- 面向P2P的Markov模型.pdf
- 面向P2P網(wǎng)絡(luò)的分布式Web Crawler的研究.pdf
- 面向P2P網(wǎng)絡(luò)的可信路由理論和機(jī)制研究.pdf
- P2P僵尸網(wǎng)絡(luò)的研究.pdf
- 新型P2P僵尸網(wǎng)絡(luò)的研究——半分布式P2P僵尸網(wǎng)絡(luò).pdf
- 面向P2P網(wǎng)絡(luò)借貸的個(gè)人信用評(píng)價(jià)方法研究.pdf
- 基于p2p技術(shù)下的信息檢索研究
- 基于P2P的網(wǎng)絡(luò)戲曲音樂(lè)檢索技術(shù)的研究與實(shí)現(xiàn).pdf
- 基于P2P的SIP網(wǎng)絡(luò)研究.pdf
- P2P網(wǎng)絡(luò)借貸風(fēng)險(xiǎn)研究.pdf
- P2P網(wǎng)絡(luò)信譽(yù)模型研究.pdf
- p2p網(wǎng)絡(luò)借貸風(fēng)險(xiǎn)研究
評(píng)論
0/150
提交評(píng)論