基于本體的異構(gòu)數(shù)據(jù)源集成系統(tǒng)模型及其查詢處理.pdf_第1頁
已閱讀1頁,還剩46頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、  Web提供了一個極其豐富而有價值的信息資源庫。如何從Web數(shù)據(jù)源中獲取并提供給用戶符合需要的Web信息這是一個具有重要意義的理論和實際應(yīng)用課題。Web上的數(shù)據(jù)具有半結(jié)構(gòu)性、異構(gòu)性和分布性等特點(diǎn),使用傳統(tǒng)的數(shù)據(jù)庫技術(shù)來存儲和查詢Web上的所有類型的數(shù)據(jù)是十分困難的。這篇文章主要研究如何實現(xiàn)Web上異構(gòu)數(shù)據(jù)源的集成和有效的查詢。
  每個Web站點(diǎn)中的信息處于某特定語義背景當(dāng)中,這個背景中的特定知識蘊(yùn)涵在Web信息當(dāng)中,與Web信

2、息一起構(gòu)成了Web信息的語義。由于Web信息的分布性,Web信息的語義可能存在異構(gòu)問題。本文在分析Web信息特點(diǎn)和當(dāng)前Web信息集成方法的基礎(chǔ)上,對如何在語義層上實現(xiàn)Web信息的集成,以及如何進(jìn)行查詢處理進(jìn)行了研究。這些研究包括了基于本體的異構(gòu)數(shù)據(jù)源集成系統(tǒng)模型的提出,查詢的重寫,查詢的分解及查詢的優(yōu)化等內(nèi)容,所做的工作和創(chuàng)新點(diǎn)主要體現(xiàn)在以下幾個方面:
  1.提出了一種通用的基于本體的異構(gòu)數(shù)據(jù)源集成系統(tǒng)模型OBISUA(Onto

3、logy-Based Integration System Universal Architecture)。該模型通過引入本體來解決各數(shù)據(jù)源在語義層上的異構(gòu),為用戶提供一個語義統(tǒng)一的接口,隨時隨地提供對數(shù)據(jù)統(tǒng)一、透明的訪問,從而實現(xiàn)各異構(gòu)數(shù)據(jù)源中信息的共享。
  2.在模型的查詢處理部分提出了兩個查詢重寫算法。算法一將用戶提出的對全局本體的查詢轉(zhuǎn)化為對局部本體的查詢,算法二將對局部本體的查詢轉(zhuǎn)化為對數(shù)據(jù)源的查詢。用RDFS來描述本

4、體,對全局本體的查詢使用RDQL語言,對數(shù)據(jù)源的查詢使用XQuery語言。
  3.提出了基于緩存的查詢優(yōu)化策略。由于對WWW上的數(shù)據(jù)源檢索速度慢,每次從數(shù)據(jù)源檢索的效率太低,為了提高全局查詢的速度,引入緩存將查詢結(jié)果存放于緩存中,用LRU算法淘汰最近不常用的查詢結(jié)果。為了判斷查詢結(jié)果是否包含的緩存中,提出了“緩存入口”的概念,另外在判斷兩個查詢是否具有包含關(guān)系時引入了“查詢關(guān)系四元組”的概念。數(shù)據(jù)緩存可以大大降低對數(shù)據(jù)源處理能力

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論