異構(gòu)信息集成與語義沖突消解策略的研究.pdf_第1頁
已閱讀1頁,還剩135頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、隨著我國信息化建設(shè)的發(fā)展,各行各業(yè)建立起各種管理信息系統(tǒng),基本實(shí)現(xiàn)了內(nèi)部信息的高效管理。但是由于早期系統(tǒng)在建設(shè)時缺乏統(tǒng)一規(guī)劃和技術(shù)標(biāo)準(zhǔn),使得這些系統(tǒng)中對數(shù)據(jù)的描述千差萬別,數(shù)據(jù)環(huán)境有很大差異。它們構(gòu)成了一個巨大而復(fù)雜的異構(gòu)數(shù)據(jù)環(huán)境,數(shù)據(jù)之間彼此分離,難以溝通,形成了無數(shù)的“信息孤島”。如何減少“信息孤島”,充分利用已有的信息資源,已經(jīng)成為各行業(yè)信息化建設(shè)急需解決的共同問題。這需要應(yīng)用信息集成技術(shù)對異構(gòu)數(shù)據(jù)源進(jìn)行科學(xué)有效的集成,屏蔽它們的

2、分布性和異構(gòu)性,向用戶提供一致的數(shù)據(jù)界面和高效、簡便的信息服務(wù)。信息集成技術(shù)成為當(dāng)今信息技術(shù)發(fā)展的趨勢之一。 由于大多數(shù)管理信息系統(tǒng)的數(shù)據(jù)都是結(jié)構(gòu)化的存儲模式,因此異構(gòu)數(shù)據(jù)庫集成是信息集成的基礎(chǔ)和前提。它涉及人工智能、高級數(shù)據(jù)庫與知識庫系統(tǒng)、分布式信息系統(tǒng)、等多個領(lǐng)域。 本文對信息集成系統(tǒng)的研究現(xiàn)狀和發(fā)展趨勢進(jìn)行了深入的分析和探討,并圍繞異構(gòu)數(shù)據(jù)庫信息集成,對異構(gòu)數(shù)據(jù)庫復(fù)制技術(shù)、異構(gòu)數(shù)據(jù)庫信息集成架構(gòu)、以及異構(gòu)數(shù)據(jù)庫信息

3、集成中的沖突發(fā)現(xiàn)和解決等問題展開研究。 首先綜合分析了信息集成技術(shù)的研究現(xiàn)狀和發(fā)展趨勢,對信息集成的兩種方法:物化方法和虛擬方法做了分析和比較,詳細(xì)說明了基于數(shù)據(jù)倉庫和基于Mediator/Wrapper的信息集成過程。其次針對信息集成全局?jǐn)?shù)據(jù)模型物化方法,本文提出了應(yīng)用異構(gòu)數(shù)據(jù)庫復(fù)制技術(shù)構(gòu)建全局?jǐn)?shù)據(jù)模型,在各個子系統(tǒng)與全局?jǐn)?shù)據(jù)模型間進(jìn)行數(shù)據(jù)轉(zhuǎn)換的方法,提出一個“基于SQL重現(xiàn)法”的異構(gòu)數(shù)據(jù)庫復(fù)制技術(shù)。然后針對信息集成過程中不可

4、避免的數(shù)據(jù)沖突問題進(jìn)行研究,給出了基于本體的語義沖突解決算法。最后對研究工作進(jìn)行了總結(jié)和展望。 論文在以下方面作了有益的探索和創(chuàng)新性工作。 (1)對異構(gòu)數(shù)據(jù)庫復(fù)制技術(shù)進(jìn)行深入分析,提出了一種基于“SQL重現(xiàn)法”的異構(gòu)數(shù)據(jù)庫復(fù)制技術(shù)。該技術(shù)針對已有的異構(gòu)數(shù)據(jù)庫復(fù)制技術(shù)在屏蔽異構(gòu)性方面的缺陷,將日志法和觸發(fā)器法等多種復(fù)制方法相結(jié)合,并利用SQL語句記錄源端數(shù)據(jù)的凈變化,同時把產(chǎn)生該變化的SQL語句在目的端重現(xiàn)的方法,實(shí)現(xiàn)不同

5、數(shù)據(jù)庫間的數(shù)據(jù)復(fù)制。由于SQL的通用性,使之能夠成為異構(gòu)數(shù)據(jù)庫的跨平臺復(fù)制工具。這里充分考慮了異構(gòu)數(shù)據(jù)庫復(fù)制的平臺無關(guān)性,可以為用戶提供多快捷可靠的復(fù)制方法。 (2)從軟件工程的角度,提出一種基于異構(gòu)數(shù)據(jù)庫復(fù)制技術(shù)的開放式信息集成架構(gòu)。應(yīng)用這種集成架構(gòu),能夠縮短信息集成系統(tǒng)的開發(fā)周期,提高運(yùn)行效率。 (3)本文提出按照信息集成過程進(jìn)行數(shù)據(jù)沖突分類的方法。把數(shù)據(jù)沖突分為概念集成時的語義沖突、模式集成時的模式?jīng)_突和實(shí)例集成時

6、的實(shí)例沖突。并對各種沖突進(jìn)行詳細(xì)的分析研究,提出沖突的綜合解決策略。給出基于屬性空間的模式結(jié)構(gòu)沖突解決算法,把模式結(jié)構(gòu)沖突的解決轉(zhuǎn)換為可度量的矢量空間求解。同時針對語義沖突,本文應(yīng)用本體技術(shù),提出一個新的綜合語義相似度度量改進(jìn)算法。 (4)把本文研究的成果應(yīng)用到數(shù)字校園的信息集成建設(shè)實(shí)踐中。進(jìn)行了原型系統(tǒng)CIS(CentralInformationSystem)的開發(fā)。通過把本文的研究成果在數(shù)字校園領(lǐng)域進(jìn)行技術(shù)實(shí)現(xiàn),以驗(yàn)證本文研

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論