版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著各組織間數(shù)據(jù)交換的與日俱增,作為Web上數(shù)據(jù)存儲(chǔ)和交換格式事實(shí)標(biāo)準(zhǔn)的XML變得越來(lái)越重要,但是不正確數(shù)據(jù)、不一致數(shù)據(jù)、不精確數(shù)據(jù)等XML中的劣質(zhì)數(shù)據(jù)給XML上的有效查詢處理帶來(lái)了挑戰(zhàn)。研究在包含劣質(zhì)數(shù)據(jù)的XML上直接進(jìn)行查詢,對(duì) XML的研究與推廣具有重要意義。由于twig查詢具有重要的研究意義,針對(duì)劣質(zhì)標(biāo)簽,本文研究標(biāo)簽劣質(zhì)XML數(shù)據(jù)上twig查詢的處理算法及其優(yōu)化算法。
利用XML的內(nèi)容與結(jié)構(gòu)信息,本文提出了標(biāo)簽劣質(zhì)X
2、ML數(shù)據(jù)上的查詢處理算法。為了對(duì)文檔實(shí)施必要的預(yù)處理以支持查詢處理算法的高效執(zhí)行,本文將整個(gè)查詢處理算法劃分為線下的文檔處理和線上的查詢處理。本文的算法首先利用文檔和查詢中標(biāo)簽的內(nèi)容以及文檔中各標(biāo)簽間的父子等關(guān)系求得每個(gè)標(biāo)簽的拼寫相近標(biāo)簽、松弛標(biāo)簽、同義標(biāo)簽等相似標(biāo)簽。然后,利用這些相似標(biāo)簽,定義了相似查詢及其相似距離,并定義了支持查詢處理高效執(zhí)行的三種操作。利用這三種操作,采用以空間換時(shí)間的方式,提出了在XML文檔中求出與原查詢相似的
3、所有查詢結(jié)果,并按照與原查詢相似程度由大到小的順序返回結(jié)果的高效算法。通過(guò)實(shí)驗(yàn)驗(yàn)證了該查詢算法的有效性和效率。
針對(duì)上述方法中存在的不夠高效之處,本文提出了上述算法的兩點(diǎn)優(yōu)化思想,以及它們的實(shí)現(xiàn)方法——文檔處理優(yōu)化和查詢處理優(yōu)化。文檔處理優(yōu)化利用文檔處理程序遍歷XML文檔中所有路徑的性質(zhì),提前生成文檔中所有標(biāo)簽的串聯(lián)信息;利用該串聯(lián)信息,查詢處理優(yōu)化對(duì)查詢中所有標(biāo)簽間的串聯(lián)關(guān)系進(jìn)行判斷,以盡早過(guò)濾掉不可能產(chǎn)生結(jié)果的標(biāo)簽。本文用
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 圖模型XML數(shù)據(jù)上查詢處理方法的研究.pdf
- 劣質(zhì)數(shù)據(jù)庫(kù)上查詢估計(jì)技術(shù)的研究.pdf
- 壓縮XML數(shù)據(jù)的多查詢處理技術(shù).pdf
- XML數(shù)據(jù)查詢處理技術(shù)的研究.pdf
- 劣質(zhì)數(shù)據(jù)庫(kù)上查詢優(yōu)化關(guān)鍵技術(shù)的研究.pdf
- XML數(shù)據(jù)流上的Xpath查詢處理研究.pdf
- XML數(shù)據(jù)的查詢優(yōu)化與處理技術(shù)的研究.pdf
- 壓縮XML數(shù)據(jù)庫(kù)查詢處理方法的研究.pdf
- 基于XML的異構(gòu)數(shù)據(jù)源查詢處理研究.pdf
- 基于謂詞的XML數(shù)據(jù)流查詢處理研究.pdf
- XML數(shù)據(jù)的查詢優(yōu)化研究.pdf
- XML文檔查詢處理與數(shù)據(jù)庫(kù)存儲(chǔ)的研究.pdf
- XML數(shù)據(jù)庫(kù)的數(shù)據(jù)模型、模式管理及查詢處理.pdf
- XML上的XPath全文查詢技術(shù).pdf
- 多版本XML文檔的查詢處理.pdf
- 樹模型XML數(shù)據(jù)的壓縮存儲(chǔ)及查詢處理方法的研究.pdf
- 并行XML數(shù)據(jù)分片與查詢處理技術(shù)研究.pdf
- XML數(shù)據(jù)的查詢、轉(zhuǎn)換和集成.pdf
- IPE編碼的XML數(shù)據(jù)查詢.pdf
- 基于“自動(dòng)機(jī)”的XML數(shù)據(jù)流多查詢處理.pdf
評(píng)論
0/150
提交評(píng)論