版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著社會(huì)的發(fā)展和數(shù)據(jù)產(chǎn)生成本的下降,人類(lèi)產(chǎn)生的數(shù)據(jù)量正在呈指數(shù)級(jí)增長(zhǎng),所以海量數(shù)據(jù)的分析逐漸被人們所關(guān)注。分布式計(jì)算被越來(lái)越廣泛地應(yīng)用到海量數(shù)據(jù)分析上,因?yàn)榧惺降臄?shù)據(jù)倉(cāng)庫(kù)在面對(duì)爆炸式增長(zhǎng)的數(shù)據(jù)時(shí)不能提供較好的可擴(kuò)展性,而利用分布式計(jì)算可以將一個(gè)任務(wù)分配到多個(gè)節(jié)點(diǎn)上并行執(zhí)行,從而獲得更好的執(zhí)行效果。而google提出的map-reduce框架則為分布式計(jì)算提供了很好的框架,它是業(yè)界廣泛認(rèn)可的解決海量數(shù)據(jù)分析的有效工具。在map-redu
2、ce上執(zhí)行多表連接的方法主要有兩種,分別是層疊法和復(fù)制哈希法。但這兩種方法都有各自的缺點(diǎn),它們?cè)谀承┣闆r下的效率會(huì)比較差。
通過(guò)研究,本文提出一種將層疊法和復(fù)制哈希法相結(jié)合的方法(CRMJ)。在執(zhí)行多連接的過(guò)程中,會(huì)對(duì)一些連接采用復(fù)制哈希法,而對(duì)另外一些連接采用層疊法,這樣會(huì)取得比這兩種方法都好的效果。
采用這種方法會(huì)產(chǎn)生很多種執(zhí)行計(jì)劃,從而需要判斷哪種執(zhí)行計(jì)劃所需執(zhí)行代價(jià)最低,所以本文提出了兩種尋優(yōu)算法以找到最優(yōu)執(zhí)
3、行計(jì)劃。第一種是窮舉法尋優(yōu)算法。該算法使用連接圖劃分和遞歸思想近似遍歷所有可能的執(zhí)行計(jì)劃,找到最優(yōu)的執(zhí)行計(jì)劃,并進(jìn)一步通過(guò)剪枝縮減搜索空間。但該種方法通過(guò)減枝進(jìn)行優(yōu)化所消耗的時(shí)間會(huì)隨著連接表個(gè)數(shù)的增加而急劇增加,導(dǎo)致算法復(fù)雜度很高。第二種是基于貪婪的尋優(yōu)算法。該算法在多連接的層疊法最優(yōu)執(zhí)行計(jì)劃的基礎(chǔ)上,尋找代價(jià)節(jié)省最多的復(fù)制哈希連接。應(yīng)用該算法可以在較低的復(fù)雜度下找到近似最優(yōu)的執(zhí)行計(jì)劃。
經(jīng)過(guò)實(shí)驗(yàn)驗(yàn)證,本文提出的CRMJ連接方
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于Map--Reduce的多表連接框架的研究與實(shí)現(xiàn).pdf
- 異構(gòu)環(huán)境下Map-Reduce調(diào)度算法的研究.pdf
- 基于Map-Reduce框架云環(huán)境時(shí)空查詢技術(shù)研究與實(shí)現(xiàn).pdf
- Hadoop Map Reduce Shuffle過(guò)程優(yōu)化方案研究.pdf
- 基于Map-Reduce的海量數(shù)據(jù)約簡(jiǎn)算法研究.pdf
- 基于Map-Reduce并行聚類(lèi)算法的研究.pdf
- 云環(huán)境中基于Map-Reduce的虛擬機(jī)調(diào)度策略研究.pdf
- 基于Hadoop平臺(tái)的Map-Reduce應(yīng)用研究.pdf
- Platform Map Reduce的GUI的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 移動(dòng)商務(wù)環(huán)境下的XML查詢優(yōu)化研究.pdf
- 基于Agent-aid的Map-Reduce架構(gòu)負(fù)載平衡優(yōu)化研究與設(shè)計(jì).pdf
- 基于關(guān)系數(shù)據(jù)庫(kù)和map-reduce的綜合查詢系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 數(shù)據(jù)庫(kù)中查詢重寫(xiě)及基于遺傳算法的多連接查詢優(yōu)化研究.pdf
- 基于Map-Reduce的圖像匹配算法研究與實(shí)現(xiàn).pdf
- 基于Map-Reduce的分布式搜索模型研究.pdf
- 基于演化計(jì)算的多連接式并行查詢優(yōu)化技術(shù)研究.pdf
- 基于連接索引的查詢優(yōu)化研究.pdf
- pagerank算法簡(jiǎn)介及map-reduce實(shí)現(xiàn)-
- Map-Reduce模式下的位置服務(wù)數(shù)據(jù)索引設(shè)計(jì)與應(yīng)用.pdf
- 基于蟻群算法的數(shù)據(jù)庫(kù)多連接查詢優(yōu)化問(wèn)題研究.pdf
評(píng)論
0/150
提交評(píng)論