版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著互聯(lián)網(wǎng)的快速發(fā)展,網(wǎng)上的信息也成幾何級(jí)數(shù)爆炸增長(zhǎng),同時(shí)用戶(hù)對(duì)信息的需求也越來(lái)越高,他們希望搜索引擎提供最新的數(shù)據(jù),最符合要求的信息。傳統(tǒng)網(wǎng)絡(luò)爬蟲(chóng)作為提供搜索引擎原始信息的最基本途徑,其性能已經(jīng)幾乎達(dá)到瓶頸,逐漸無(wú)法適應(yīng)新型的網(wǎng)絡(luò)應(yīng)用需要。
本文研究了現(xiàn)有的網(wǎng)絡(luò)爬蟲(chóng)模型及其目前的研究方向,介紹了各種對(duì)傳統(tǒng)網(wǎng)絡(luò)爬蟲(chóng)的改進(jìn)方法,并對(duì)各種方法的優(yōu)缺點(diǎn)進(jìn)行了詳盡的分析,總結(jié)了爬蟲(chóng)面臨的主要挑戰(zhàn),如網(wǎng)頁(yè)更新收錄慢,網(wǎng)站訪問(wèn)壓力大,無(wú)法
2、處理多媒體文件等。為解決這些問(wèn)題,本文提出一種基于P2P的被動(dòng)式爬蟲(chóng)系統(tǒng),從根本上摒棄了傳統(tǒng)爬蟲(chóng)的工作模式,它通過(guò)客戶(hù)端-服務(wù)器模式由網(wǎng)站推送數(shù)據(jù),搜索引擎只負(fù)責(zé)接收,并且借助于智能體技術(shù)和P2P傳輸,提高了搜索引擎原始網(wǎng)頁(yè)獲取能力。
該被動(dòng)式爬蟲(chóng)分為爬蟲(chóng)客戶(hù)端和爬蟲(chóng)服務(wù)器兩部分,其主要功能有:客戶(hù)端和服務(wù)器相互發(fā)現(xiàn)及注冊(cè),客戶(hù)端監(jiān)視網(wǎng)站目錄更新,客戶(hù)端預(yù)處理數(shù)據(jù)并安排傳輸時(shí)間,客戶(hù)端與服務(wù)器數(shù)據(jù)傳輸。本文在全能體技術(shù)平臺(tái)的層
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于p2p網(wǎng)絡(luò)爬蟲(chóng)設(shè)計(jì)——爬行模塊設(shè)計(jì)---畢業(yè)論文
- 基于P2P網(wǎng)絡(luò)的匿名通信系統(tǒng).pdf
- 新型P2P僵尸網(wǎng)絡(luò)的研究——半分布式P2P僵尸網(wǎng)絡(luò).pdf
- 基于P2P的網(wǎng)絡(luò)備份系統(tǒng)的設(shè)計(jì).pdf
- 基于P2P網(wǎng)絡(luò)的分離聲譽(yù)系統(tǒng)模型.pdf
- 基于P2P系統(tǒng)的網(wǎng)絡(luò)蠕蟲(chóng)傳播研究.pdf
- 基于P2P網(wǎng)絡(luò)的IPTV系統(tǒng)研究.pdf
- 基于P2P的SIP網(wǎng)絡(luò)研究.pdf
- 基于P2P的網(wǎng)絡(luò)存儲(chǔ)系統(tǒng)的研究.pdf
- P2P分布式網(wǎng)絡(luò)文件傳輸系統(tǒng).pdf
- 基于P2P的分布式網(wǎng)絡(luò)數(shù)據(jù)管理.pdf
- 一種基于P2P技術(shù)的分布式微博爬蟲(chóng)系統(tǒng).pdf
- 基于P2P的分布式網(wǎng)絡(luò)故障監(jiān)測(cè)系統(tǒng)的研究.pdf
- 基于P2P網(wǎng)絡(luò)流媒體點(diǎn)播系統(tǒng)的研究.pdf
- 基于網(wǎng)絡(luò)編碼的P2P點(diǎn)播系統(tǒng)研究.pdf
- 基于Chord的層次式P2P網(wǎng)絡(luò)模型的研究.pdf
- 基于網(wǎng)絡(luò)編碼的P2P覆蓋網(wǎng)絡(luò)研究.pdf
- 基于P2P網(wǎng)絡(luò)信任機(jī)制研究.pdf
- P2P系統(tǒng)網(wǎng)絡(luò)路由協(xié)議的研究.pdf
- 基于P2P網(wǎng)絡(luò)的RP私密保護(hù).pdf
評(píng)論
0/150
提交評(píng)論