基于模式映射的異構數據集成模型研究.pdf_第1頁
已閱讀1頁,還剩61頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著各種企業(yè)級系統的快速發(fā)展和異構框架的不斷豐富,將各種異構系統進行的集成就成為當前數據庫領域的一個熱點問題。要實現系統集成就首先進行數據集成,而基于本體的數據集成在各種數據集成方法中脫穎而出,成為目前數據集成領域中的重要研究點。一般情況下,由于數據源的異構性和多樣性,數據集成中會存在各種各樣的沖突,比如常見的命名沖突,單位沖突,順序沖突等等,所以必須首先發(fā)現沖突,然后按照人工的或者自動的沖突消除規(guī)則對沖突進行處理。
   鑒于

2、上述考慮,本文利用本體的語義性,提出了一個基于模式映射的數據集成模型,該模型構建于映射規(guī)則(Rule-based),并且能夠自動發(fā)現和消除特定的沖突(Conflict-solved),所以將其命名為RCM。本文首先對RCM進行建模,該模型包含了局部概念集、全局概念集、映射集、沖突集和約束集,其中后三者是該模型的核心。我們用映射文檔的形式來對后三者進行描述,然后在此基礎上提出了一個沖突發(fā)現和消除的算法,最后闡述了RCM框架的實現。

3、   在數據源描述方面,每個局部數據源由它自己的本體來描述語義。但是為了使每個源本體之間能夠相互比較,在最上層建了一個共享的詞匯集,共享的詞匯集包含了領域內基本的術語,即構建了一個代表全局數據源的本體,這樣就涵蓋了RCM模型中的局部概念集和全局概念集。在此基礎上,用OWL自定義的映射文檔對局部數據源與全局數據源之間的映射關系進行描述,從而將RCM中的映射集、沖突集和約束集的信息記錄到映射文檔中。
   本文研究了基于板映射模型

4、的沖突消除算法和常用的查詢重寫算法,分析了它們的部分不足之處,提出了適合在RCM上進行沖突發(fā)現和消除的算法。在映射文檔中自動發(fā)現沖突并判斷沖突發(fā)生的子數據源及對應的屬性,并同時在映射文檔中進行修改。在查詢重寫的過程中,將借助該映射文檔來消除以單位沖突和格式沖突為代表的數據沖突和以命名沖突為代表的語義沖突,從而保證查詢結果的正確性。
   本文最后介紹了由RCM延伸出來的框架,具體包括用戶接口、查詢處理、文檔處理和結果提取四大部分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論