版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、隨著Web2.0理念和技術的興起,全球互聯網用戶享受到了豐富多樣的交互性信息服務,博客正是這種交互性信息服務的典型代表。在這種時代背景下,圖書情報學領域的學生、研究人員等紛紛開設博客進行信息交流。然而,圖情博客分散、博文質量參差不齊的現狀給界內人士的使用帶來了不便,雖然Google博客搜索、百度博客搜索等相關的主題搜索引擎已經解決了一些問題,但是仍舊不能滿足圖情界用戶的需求。本文就是針對這一問題嘗試構建圖情博客搜索引擎,以滿足圖情用戶的
2、需求。本文首先對搜索引擎相關技術和圖情博客進行分析,其次引入Nutch這一開源搜索引擎并基于Nutch制定了圖情博客搜索引擎的設計方案,再次依據該設計方案開發(fā)出相應的主題搜索引擎,最后以實驗的方法對該主題搜索引擎的性能進行評估。本文各章節(jié)的主要內容如下:
1.緒論。本章介紹了論文的選題背景、選題意義、國內外研究現狀、所采用的研究方法和創(chuàng)新之處。
2.搜索引擎相關技術及圖情博客分析。本章首先分析了搜索引擎、主題搜索引擎
3、的運行原理,指出二者的主要區(qū)別在于信息采集模塊和網頁內容解析模塊兩部分,主題搜索引擎改進了網絡爬蟲模塊和并在網頁內容解析模塊增加了主題詞庫進行信息過濾。其次從博客站點結構、博客頁面內容、博客之間鏈接結構三方面對圖情博客進行分析,以增加對圖情博客的全面認識。
3 Nutch簡介及Nutch系統(tǒng)的運行環(huán)境配置與運行。本章首先介紹了開源搜索引擎Nutch的基本情況和框架結構,對Nutch有個初步的認識。然后配置Nutch系統(tǒng)的運行環(huán)
4、境并詳細闡釋其運行流程,對Nutch的運行原理和詳細結構有進一步的認識。
4基于Nutch的圖情博客搜索引擎的設計。本章依據軟件工程的思想,首先分析搜索引擎系統(tǒng)要實現的目標、要解決的問題以及可行性,然后通過用例圖(Use Case Diagram)和序列圖(Sequence Diagram)對系統(tǒng)的用戶需求進行闡述,最后給出了系統(tǒng)的總體設計方案和詳細設計方案。
5基于Nutch的圖情博客搜索引擎的核心模塊實現。本章對
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于Nutch的搜索引擎系統(tǒng)的設計與實現.pdf
- 基于Nutch的垂直搜索引擎研究與實現.pdf
- 基于Nutch的可信搜索引擎研究與實現.pdf
- 基于Nutch的中文主題搜索引擎的設計與實現.pdf
- 基于Nutch的企業(yè)搜索引擎的研究與實現.pdf
- 基于Nutch的學術搜索引擎的研究與實現.pdf
- 基于Nutch的垂直搜索引擎的分析與實現.pdf
- 基于nutch的農業(yè)垂直搜索引擎研究與實現
- 基于Lucene的博客搜索引擎設計與實現.pdf
- 基于評論的博客搜索引擎的設計與實現.pdf
- 基于Nutch的職位信息搜索引擎的設計與實現.pdf
- 基于Nutch的智能語義搜索引擎.pdf
- 基于nutch海關主題搜索引擎的研究與設計
- 基于Nutch的搜索引擎排序算法的研究與實現.pdf
- 基于Nutch搜索引擎的中文分詞算法研究與實現.pdf
- 基于Nutch的中醫(yī)腦病垂直搜索引擎的設計與實現.pdf
- LUCENE實現的基于RSS的博客搜索引擎.pdf
- 基于Nutch的學校信息垂直搜索引擎的研究與實現.pdf
- 基于nutch+lucene搜索引擎的搭建--搜索引擎技術的相關設計與分析-開提報告
- 基于Nutch的維文與哈文搜索引擎的研究與實現.pdf
評論
0/150
提交評論