版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著人類(lèi)社會(huì)快速的發(fā)展,人們?nèi)粘I町a(chǎn)生了海量數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)處理方法已不適合海量數(shù)據(jù)的分析處理,Hadoop應(yīng)運(yùn)而生。Hadoop有兩個(gè)最核心的組成部分,分別是MapReduce和HDFS。MapReduce具有處理分析海量數(shù)據(jù)的能力,HDFS具有存儲(chǔ)和管理海量數(shù)據(jù)的能力。HDFS的副本選擇機(jī)制直接影響著數(shù)據(jù)的可靠性、可用性、均衡性和讀取效率。由于HDFS默認(rèn)副本選擇機(jī)制選擇副本的存放位置具有一定的隨機(jī)性且未充分考慮數(shù)據(jù)節(jié)點(diǎn)的負(fù)載狀況
2、,進(jìn)而出現(xiàn)HDFS數(shù)據(jù)分布不均勻和Hadoop集群負(fù)載不均衡等問(wèn)題,本文對(duì)HDFS的默認(rèn)副本選擇機(jī)制進(jìn)行改進(jìn)和實(shí)現(xiàn),主要包含以下方面:
首先,本文提出根據(jù)數(shù)據(jù)節(jié)點(diǎn)當(dāng)前的CPU使用率、內(nèi)存使用率、磁盤(pán)IO使用率、磁盤(pán)使用率以及帶寬使用率五個(gè)因素綜合描述其在集群中的負(fù)載狀況,這五個(gè)因素為數(shù)據(jù)節(jié)點(diǎn)負(fù)載狀況的量化打下了基礎(chǔ)。根據(jù)每種因素對(duì)數(shù)據(jù)節(jié)點(diǎn)負(fù)載影響的大小賦予其不同的權(quán)重值,量化數(shù)據(jù)節(jié)點(diǎn)負(fù)載狀況的數(shù)值。
其次,本文剖析D
3、ataNode到NameNode周期性心跳機(jī)制的原理,改進(jìn)的副本選擇機(jī)制利用心跳機(jī)制將影響數(shù)據(jù)節(jié)點(diǎn)負(fù)載的因素匯報(bào)給NameNode,使NameNode掌握整個(gè)集群數(shù)據(jù)節(jié)點(diǎn)的負(fù)載狀況。通過(guò)對(duì)HDFS默認(rèn)副本選擇機(jī)制的分析,針對(duì)其存在的缺陷,根據(jù)每個(gè)數(shù)據(jù)節(jié)點(diǎn)、機(jī)架的負(fù)載狀況以及集群中所有數(shù)據(jù)節(jié)點(diǎn)的平均負(fù)載狀況,提出了對(duì)HDFS默認(rèn)副本選擇機(jī)制的改進(jìn)方法。
最后,編譯修改后的HDFS源代碼,搭建Hadoop集群環(huán)境,以本文改進(jìn)的HD
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于QoS的Web服務(wù)選擇機(jī)制與系統(tǒng)實(shí)現(xiàn).pdf
- 刑法的價(jià)值選擇機(jī)制.pdf
- HDFS副本管理策略研究與實(shí)現(xiàn).pdf
- 環(huán)境敏感的信息服務(wù)發(fā)現(xiàn)和選擇機(jī)制研究.pdf
- 基于對(duì)等網(wǎng)絡(luò)的Web服務(wù)選擇機(jī)制研究.pdf
- 企業(yè)家的選擇機(jī)制研究.pdf
- 基于HDFS的云計(jì)算動(dòng)態(tài)副本策略研究.pdf
- HDFS的副本管理策略研究.pdf
- 注意力選擇機(jī)制的研究-算法設(shè)計(jì)以及系統(tǒng)實(shí)現(xiàn).pdf
- 基于車(chē)聯(lián)云的協(xié)調(diào)點(diǎn)選擇機(jī)制研究.pdf
- 物聯(lián)網(wǎng)業(yè)務(wù)表示與選擇機(jī)制的研究與實(shí)現(xiàn).pdf
- 隱喻理解加工策略的選擇機(jī)制.pdf
- 基于蟻群算法的測(cè)試用例選擇機(jī)制研究.pdf
- 基于對(duì)等網(wǎng)絡(luò)的web服務(wù)選擇機(jī)制研究(1)
- 企業(yè)培訓(xùn)員工的選擇機(jī)制研究.pdf
- 多連接技術(shù)研究及基于流的路徑選擇機(jī)制的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于HDFS的小文件處理與副本策略?xún)?yōu)化研究.pdf
- 基于統(tǒng)計(jì)學(xué)習(xí)P2P節(jié)點(diǎn)選擇機(jī)制的研究與實(shí)現(xiàn).pdf
- 色彩和色調(diào)的選擇機(jī)理剖析
- 戰(zhàn)略招聘與招聘渠道選擇機(jī)制
評(píng)論
0/150
提交評(píng)論