一種原生XML數(shù)據(jù)庫—Xindice的研究與改進.pdf_第1頁
已閱讀1頁,還剩82頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、隨著萬維網(wǎng)的飛速發(fā)展,XML的應(yīng)用范圍不斷擴大,支持XML的數(shù)據(jù)庫成為眾人矚目的焦點。關(guān)系型數(shù)據(jù)庫不能很好地支持XML。關(guān)系型數(shù)據(jù)庫將XML轉(zhuǎn)換成二維表的形式存儲,但XML,與二維表存儲形式的轉(zhuǎn)換存在性能問題。 原生(Native)XML數(shù)據(jù)庫是當(dāng)前數(shù)據(jù)庫領(lǐng)域的研究熱點之一。XML文檔在NativeXML數(shù)據(jù)庫中的存儲和查詢策略,是十分重要的問題。本文以一個開放源代碼的Native XML,數(shù)據(jù)庫產(chǎn)品—Xindice為對象,深入

2、分析了它的分層存儲模型,研究了它的頁面存儲策略以及B樹索引結(jié)構(gòu)。在此基礎(chǔ)上,并闡明了Xindice存儲策略和查詢策略存在的不足。針對這些不足,本文作了以下分析研究工作。 在存儲策略方面,當(dāng)集合中加入了新的XML文檔時,Xindice數(shù)據(jù)庫分配“空閑”頁面用于存儲文檔的數(shù)據(jù),如果沒有空閑頁面,則創(chuàng)建新的頁面;但是系統(tǒng)在刪除XML文檔時,僅僅將其占用的頁面標(biāo)記為“空閑”而并不釋放其占用的空間。隨著文檔的插入和刪除,頁面文件占用的磁盤

3、空間將會不斷的增大。本文在實驗的基礎(chǔ)之上,分析了Xindice數(shù)據(jù)庫存儲策略在“空閑”頁面管理上存在不足的原因,提出并實現(xiàn)了尾部頁面截斷策略和頁面移動策略,釋放了“空閑”頁面占用的磁盤空間,提高了系統(tǒng)對磁盤資源的利用率。而針對頁面移動策略頁面移動次數(shù)過多,本文又提出了尾部頁面移動策略,減少了釋放“空閑”頁面所需要的時間。 在查詢策略方面,Xindice數(shù)據(jù)庫的查詢語言是XPath,不支持XQuery查詢語言。而XPath的查詢功

4、能有限,如不能分組、排序、連接等,不能對多個文檔進行聯(lián)合查詢,影響了Xindice數(shù)據(jù)庫查詢上的靈活性。本文設(shè)計了XQuery表達式的文法,利用JavaCC工具和JJTree工具對XQuery表達式的文法生成詞法語法分析器,用來識別輸入的XQuery表達式的語法結(jié)構(gòu),并生成相應(yīng)的語法樹。根據(jù)此語法樹,對構(gòu)成該查詢的XQuery表達式的各子句分別進行相應(yīng)的查詢處理,得到XML文檔的最終查詢結(jié)果,實現(xiàn)了XQuery查詢,提高了Xindice

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論