語義關聯數據模型及其檢索機制的研究.pdf_第1頁
已閱讀1頁,還剩104頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著互聯網技術的發(fā)展,大量的數據資源不斷涌現,信息變得更加復雜,如何從海量信息中獲取有用的知識成為亟待解決的難題,基于語義關聯的數據模型是解決該問題的一種有效方法,這主要包括兩個方面:1)語義關聯數據模型,即基于語義關聯的數據表達和組織結構模型;2)在語義關聯數據模型的基礎上,更加有效的、智能的檢索機制。圍繞以上兩個方面對語義關聯數據模型中的若干問題進行研究,主要工作包括以下內容:
   針對目前語義數據檢索缺乏語義關聯分析和知

2、識評價的問題,提出了支持知識評價的語義關聯數據模型RSS。語義數據不僅包括數據資源,而且包括資源之間異構的語義關聯。RSS是一種支持知識評價的語義關聯數據模型,該模型充分發(fā)掘知識實體之間語義關聯的異構性,以決定知識實體的全局重要性;檢索結果擴展到與查詢請求語義最相關聯的知識實體,并結合資源的全局評價值和查詢關聯度,對檢索結果進行合理的排序。該模型能有效的支持推理并將檢索結果擴展到語義關聯的實體;同時能有效支持知識實體的評價,防止返回大量

3、無序檢索結果。
   針對當前語義數據檢索主要采用復雜的本體查詢語言,從而造成用戶認知困難的問題,提出了一種基于關鍵字的語義檢索機制,該方法是RSS模型中非概念約束檢索機制的擴展。當前的語義數據檢索主要采用標準的W3C本體查詢語言,但是基于關鍵字的檢索機制仍然是一種可行且更加實用的方法,因為普通用戶無需理解后臺的語義數據結構。在本方法中,滿足關鍵字查詢請求的答案被定義為包含所有查詢關鍵字的連通子圖,且該答案為最小化,即其任意的真

4、子圖不能成為滿足該查詢請求的答案;檢索的答案具有明確的語義,表達查詢關鍵字之間的語義關聯性以及關聯程度,為實現大規(guī)模的語義數據圖中有效的Top-k檢索,提出了一種時間復雜度為多項式的近似檢索算法。
   針對數據的語義模糊特性及用戶的搜索偏好,提出了一種在RSS模型中支持模糊語義的檢索機制。由于語義應用的內在復雜性,智能的、能更好滿足用戶檢索請求的檢索機制仍然是具有挑戰(zhàn)性的問題。通常,用戶檢索請求不僅具有模糊性或不精確性,而且包

5、含個性化的檢索目標請求。該檢索機制通過緊密的結合知識模糊性以及能表達用戶偏好的主觀權重,對用戶請求進行規(guī)范化的模糊知識表達,并智能的檢索與用戶請求相關聯的數據;同時,提出了一種評價方法,該方法支持用戶模糊請求以及個性化需求,能有效的獲取用戶檢索目標。
   針對基于對等網絡的信息檢索缺乏語義的問題,提出了一種基于語義小世界的數據檢索機制。大規(guī)模的基于對等網絡的信息檢索/共享系統越來越受到人們關注,是RSS模型需要支持的重要應用,

6、但是如何有效的組織對等網絡中共享的信息并搜索到用戶需要的查詢結果仍是待解決的重要問題。首先使用潛在語義索引和支持向量機將網絡中的共享文檔準確的分類,形成分類信息,該信息標志節(jié)點對文檔類別的興趣比例;然后利用社會網絡中的小世界現象,使每個節(jié)點都有直接相連的與其文檔興趣相似的短鏈接節(jié)點,同時,每個節(jié)點有極少的某一種興趣比例非常高的長鏈接,從而形成具有語義小世界特征的網絡拓撲;查詢消息被路由到最有可能回答該請求的節(jié)點以提高查詢效率,并充分利用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論