版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、隨著微處理器和網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,以工作站機群系統(tǒng)為代表的計算環(huán)境成為當(dāng)前并行計算系統(tǒng)的研究熱點。但隨著機群系統(tǒng)中節(jié)點數(shù)目的增加,任意節(jié)點失敗而導(dǎo)致整個系統(tǒng)發(fā)生故障的機率大大提高;并且隨著任務(wù)規(guī)模的擴大,計算時間不斷增加,節(jié)點發(fā)生失敗的機率也會隨之增加。在缺乏必要的保護措施下,某個計算節(jié)點發(fā)生故障將導(dǎo)致整個系統(tǒng)失敗,從而使此前大量的計算工作付諸東流。所以,并行系統(tǒng)要求具有良好的容錯功能來保證和提高其可靠性。 檢查點能夠保存和恢復(fù)
2、程序的運行狀態(tài),是并行系統(tǒng)中實現(xiàn)容錯的重要手段。檢查點設(shè)置方法可以分為同步檢查點和異步檢查點。同步檢查點方法具有算法簡單,空間開銷較小,直接恢復(fù)等優(yōu)點,已廣泛應(yīng)用在工作站機群系統(tǒng)中。但它必須在生成全局檢查點前后進行系統(tǒng)同步,同步操作將暫時中止進程的運行并導(dǎo)致大量的同步通訊開銷。PVM是目前比較流行的并行程序設(shè)計環(huán)境,它所提供的消息傳遞機制支持高效的異構(gòu)網(wǎng)絡(luò)計算。雖然PVM具有一定的容錯功能,能檢測系統(tǒng)故障,但卻沒有提供容錯策略,對系統(tǒng)故
3、障進行恢復(fù)。傳統(tǒng)的基于消息驅(qū)趕機制的同步檢查點設(shè)置方法,雖然簡單有效,但由于協(xié)調(diào)過程中引入的輔助控制消息數(shù)目和節(jié)點數(shù)目之間呈O(N2)關(guān)系,隨著節(jié)點數(shù)目的增多,這些控制消息的數(shù)目將會急劇增加,其帶來的時間開銷是不容忽視的。 為了降低同步檢查點設(shè)置的時間開銷,本文提出了一種基于PVM的準(zhǔn)同步檢查點設(shè)置方法。通過檢查點控制進程向所有進程發(fā)送檢查點設(shè)置信號,各節(jié)點接收到信號后,停止應(yīng)用程序的運行,開始進行檢查點操作,檢查點操作完成后各
4、進程獨立地啟動應(yīng)用程序;同時引入檢查點計數(shù)器,識別在檢查點時刻處于通信信道中的消息,對它們采取延后記錄的方法,構(gòu)造出一個一致性全局狀態(tài)。同步檢查點要求各進程在檢查點發(fā)起時刻與結(jié)束時刻都要進行同步,并且通過清空通信信道中的消息來構(gòu)造一致性全局狀態(tài)。與此不同的準(zhǔn)同步檢查點方法只是在檢查點發(fā)起時刻發(fā)送同步信號請求檢查點操作,然后各節(jié)點獨立地進行狀態(tài)保存,對于通信信道內(nèi)的消息采用異步記錄的方式來實現(xiàn)一致性全局狀態(tài)。準(zhǔn)同步檢查點方法吸取了同步檢查
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于PVM的并行計算在PC機群上的實現(xiàn).pdf
- 機群容錯系統(tǒng)的設(shè)計與實現(xiàn).pdf
- 基于PVM的任務(wù)調(diào)度策略的研究與實現(xiàn).pdf
- 基于PVM的CLIPS并行性的研究與實現(xiàn).pdf
- 基于android的機群監(jiān)控系統(tǒng)研究與實現(xiàn).pdf
- 基于中間結(jié)果檢查點的MapReduce容錯方法研究與實現(xiàn).pdf
- 基于機群的并行教學(xué)輔助系統(tǒng)的設(shè)計與實現(xiàn).pdf
- 機群系統(tǒng)容錯中間件技術(shù)研究.pdf
- 一種基于PVM的負(fù)載均衡系統(tǒng)的設(shè)計與實現(xiàn).pdf
- 基于PVM并行圖像處理的研究.pdf
- 基于消息傳遞的Beowulf機群系統(tǒng)的研究與實現(xiàn).pdf
- 基于服務(wù)的機群作業(yè)管理系統(tǒng)設(shè)計與實現(xiàn).pdf
- 容錯OSGi的研究與實現(xiàn).pdf
- 基于MiniCore系統(tǒng)的容錯設(shè)計與實現(xiàn).pdf
- 基于網(wǎng)格的機群遠程通信控制平臺的設(shè)計與實現(xiàn).pdf
- 基于GIS的機群智能化施工監(jiān)控系統(tǒng)的研究與實現(xiàn).pdf
- 基于主動任務(wù)復(fù)制的透明容錯計算研究與實現(xiàn).pdf
- 容錯不死系統(tǒng)的研究與實現(xiàn).pdf
- 基于OWL容錯性推理系統(tǒng)的研究與實現(xiàn).pdf
- 基于任務(wù)復(fù)制的容錯并行任務(wù)調(diào)度研究與實現(xiàn).pdf
評論
0/150
提交評論