針對社會協(xié)作生成型數據的信息檢索.pdf_第1頁
已閱讀1頁,還剩63頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、信息檢索是協(xié)助用戶在海量信息中找到所需內容的關鍵技術。盡管信息檢索技術已經發(fā)展了幾十年,針對傳統(tǒng)文本文檔的檢索模型也已經比較成熟;然而,面對不斷涌現的各種新數據類型,信息檢索技術還需要繼續(xù)發(fā)展。近幾年,隨著網絡用戶的飛速增加以及We b2.0理念的興起,網絡用戶成為產生各種信息的主角。一方面,他們通過網絡瀏覽各種資源;另一方面,他們的各種網絡行為產生了大量有價值的信息。例如:搜索引擎用戶在搜索過程中留下點擊記錄;美味標簽(delicio

2、us.com)的用戶通過該平臺分享他們喜歡的網站;網頁創(chuàng)建者通過錨文本將網頁鏈接到其他相關站點。一個用戶的行為及其產生的信息可能作用不大,但有海量用戶每天都在不斷生成數據,這將形成一個良好的知識庫。我們把這種用戶生成的對網絡資源的描述數據稱為社會協(xié)作生成型數據??傮w上講,社會協(xié)作生成型數據提供的信息具有很高的質量,是對網絡上一些資源的有效概括,有助于計算機對這些內容的理解,對于信息檢索是很有幫助的。
  本文根據包含社會協(xié)作生成型

3、數據的信息檢索應用中可利用的數據源情況,提出兩種不同場景的信息檢索,并針對每個場景提出了信息檢索方法。
  在只有社會協(xié)作生成型數據的場景下,利用這種數據生成特性的信息檢索模型。針對傳統(tǒng)文檔數據的信息檢索研究已經有相當長的歷史了,但由于社會協(xié)作生成型數據和傳統(tǒng)文檔數據存在很大不同,某些傳統(tǒng)的模型不適合直接應用到這種數據上。本文具體建模了這種新數據的生成特性,并將其與信息檢索關聯(lián)起來,提出了新的檢索模型。實驗表明,對于社會協(xié)作生成型

4、數據的信息檢索,本文提出的新模型的效果比傳統(tǒng)模型有顯著的提高。
  在既有社會協(xié)作生成型數據又有傳統(tǒng)文本數據的場景下,整合這兩種數據的信息檢索方案。一些傳統(tǒng)的信息檢索應用已經取得了一定的成功,但這只利用到那些傳統(tǒng)的文本信息。社會協(xié)作生成型數據作為一種新的、高質量的信息源,應該有潛力進一步提高信息檢索的效果。本文根據兩類數據互相補充的特性,提出基于相互增強的數據整合方案,并用整合后的數據進行信息檢索。實驗表明,與簡單的把數據組合到一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論