版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、傳統(tǒng)的寫優(yōu)化數(shù)據(jù)庫管理系統(tǒng)多數(shù)采用按行存儲(chǔ)的方式,而對(duì)讀優(yōu)化的數(shù)據(jù)倉庫管理系統(tǒng)而言,列存儲(chǔ)表現(xiàn)出比行存儲(chǔ)更加顯著的性能。這是由于列存儲(chǔ)技術(shù)是將數(shù)據(jù)表以列為單位進(jìn)行存儲(chǔ),在查詢中能有效避免讀取無關(guān)的列,從而獲得較高的查詢效率。由于數(shù)據(jù)倉庫中存儲(chǔ)的信息量非常龐大,如何對(duì)這些龐大的數(shù)據(jù)進(jìn)行有效的管理對(duì)數(shù)據(jù)倉庫管理系統(tǒng)來說是一個(gè)巨大的挑戰(zhàn)。解決這個(gè)問題的一個(gè)有效的方式就是采用數(shù)據(jù)壓縮技術(shù)。因此,如何對(duì)壓縮的列存儲(chǔ)數(shù)據(jù)進(jìn)行查詢及優(yōu)化的研究變得十分
2、有意義。
本文以東華-達(dá)夢數(shù)據(jù)庫技術(shù)聯(lián)合實(shí)驗(yàn)室“DWMS原型系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)”項(xiàng)目為背景,主要工作包括:
1)對(duì)目前存在的一個(gè)基于字典的保留順序的字符串壓縮方法進(jìn)行研究,在繼續(xù)延用原方法中共用葉子的索引結(jié)構(gòu)的同時(shí),對(duì)原壓縮方法進(jìn)行了改進(jìn),提出了一個(gè)新的基于概率的字符串壓縮方法,能快速的將字符串屬性進(jìn)行壓縮和解壓,降低了系統(tǒng)對(duì)壓縮數(shù)據(jù)的查詢時(shí)間。
2)在列存儲(chǔ)的數(shù)據(jù)經(jīng)過壓縮之后,對(duì)壓縮數(shù)據(jù)上的查詢策
3、略進(jìn)行了研究。首先將傳統(tǒng)的代價(jià)模型進(jìn)行修改,為了使其是基于壓縮的,新增了數(shù)據(jù)壓縮和解壓的代價(jià)。然后針對(duì)必須要求解壓的數(shù)據(jù),研究如何合理的選擇解壓時(shí)機(jī)來進(jìn)一步降低CPU消耗。最后給出了在壓縮的數(shù)據(jù)上進(jìn)行查詢操作的一些具體算法,包括壓縮數(shù)據(jù)的選擇、連接和聚集操作。
3)根據(jù)壓縮的列存儲(chǔ)數(shù)據(jù)的特點(diǎn),并結(jié)合現(xiàn)有的數(shù)據(jù)庫查詢優(yōu)化方法,提出了對(duì)壓縮的數(shù)據(jù)進(jìn)行查詢的一些優(yōu)化策略。為了便于對(duì)數(shù)據(jù)的快速檢索和提高查詢的速度,研究了索引結(jié)構(gòu)和
4、臨時(shí)表的合理選擇。然后對(duì)查詢中經(jīng)常存在的謂詞和子查詢進(jìn)行了優(yōu)化重寫策略,最后給出了壓縮數(shù)據(jù)上的選擇和聚集操作的優(yōu)化算法。
4)采用本文提出的基于概率的保留順序的字符串壓縮方法對(duì)DWMS中的字符串屬性進(jìn)行壓縮,對(duì)字符串的壓縮效率進(jìn)行了實(shí)驗(yàn)比較。然后將本文提出的一些查詢優(yōu)化策略應(yīng)用于DWMS中經(jīng)過壓縮的數(shù)據(jù),并對(duì)經(jīng)過各種優(yōu)化策略優(yōu)化后的查詢的執(zhí)行時(shí)間進(jìn)行了一系列實(shí)驗(yàn)測試。
本文提出的基于概率的字符串壓縮方法能快速
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- DWMS中列存儲(chǔ)的查詢優(yōu)化研究與實(shí)現(xiàn).pdf
- 列存儲(chǔ)數(shù)據(jù)倉庫中的查詢優(yōu)化研究.pdf
- 基于列存儲(chǔ)的OLAP多查詢優(yōu)化策略研究與實(shí)現(xiàn).pdf
- 列存儲(chǔ)數(shù)據(jù)倉庫中壓縮技術(shù)的研究與實(shí)現(xiàn).pdf
- 列存儲(chǔ)DWMS中查詢執(zhí)行的研究與實(shí)現(xiàn).pdf
- 列存儲(chǔ)數(shù)據(jù)倉庫中的查詢重寫關(guān)鍵技術(shù)的研究與實(shí)現(xiàn).pdf
- 基于列存儲(chǔ)的數(shù)據(jù)復(fù)用研究與實(shí)現(xiàn).pdf
- 列存儲(chǔ)DWMS中查詢執(zhí)行優(yōu)化.pdf
- 海量數(shù)據(jù)存儲(chǔ)與查詢策略的優(yōu)化研究.pdf
- 基于支持列存儲(chǔ)的數(shù)據(jù)壓縮算法研究.pdf
- 列存儲(chǔ)系統(tǒng)中并行查詢處理的研究與實(shí)現(xiàn).pdf
- 基于內(nèi)存的列存儲(chǔ)數(shù)據(jù)集動(dòng)態(tài)壓縮技術(shù)的研究與應(yīng)用.pdf
- 基于MongoDB的數(shù)據(jù)存儲(chǔ)與查詢優(yōu)化技術(shù)研究.pdf
- 列存儲(chǔ)數(shù)據(jù)倉庫的位圖索引研究與實(shí)現(xiàn).pdf
- 基于列數(shù)據(jù)庫存儲(chǔ)稀疏數(shù)據(jù)壓縮算法的研究.pdf
- RDF語義數(shù)據(jù)存儲(chǔ)編碼與查詢優(yōu)化研究.pdf
- 內(nèi)存數(shù)據(jù)庫中的存儲(chǔ)管理與查詢優(yōu)化.pdf
- 樹模型XML數(shù)據(jù)的壓縮存儲(chǔ)及查詢處理方法的研究.pdf
- DWMS列存儲(chǔ)中執(zhí)行引擎的優(yōu)化與實(shí)現(xiàn).pdf
- 列存儲(chǔ)系統(tǒng)的數(shù)據(jù)安全與網(wǎng)絡(luò)性能優(yōu)化模型研究.pdf
評(píng)論
0/150
提交評(píng)論