基于CMP+GPU異構(gòu)計算系統(tǒng)的并行離散事件仿真優(yōu)化技術(shù)研究.pdf_第1頁
已閱讀1頁,還剩136頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、隨著仿真應用的不斷深入,仿真規(guī)模越來越大,模型越來越復雜,導致其對計算能力的需求越來越高,如何縮短仿真的運行時間,滿足時效性的需求,是一個亟待研究的問題。近年來,由CMP和GPU構(gòu)建的異構(gòu)計算系統(tǒng),具有強大計算能力、低功耗以及可持續(xù)增長等特點,正成為新一代高效能計算機發(fā)展的重要方向,同時也為加速仿真應用帶來了重要的機遇。然而,當前并行仿真系統(tǒng)多以傳統(tǒng)的共享存儲多處理機和集群為目標體系結(jié)構(gòu),難以針對多/眾核化、異構(gòu)化等特點有效利用CMP和

2、GPU的計算資源。因此,開展基于CMP+GPU異構(gòu)計算系統(tǒng)的并行離散事件仿真優(yōu)化技術(shù)研究,對于充分利用計算資源、提高仿真運行效率、滿足仿真時效性要求等具有十分重要的理論意義和實用價值。
  論文針對當前并行離散事件仿真存在的尚未充分發(fā)揮CMP的優(yōu)勢,難以有效支持基于GPU的離散事件仿真以及CMP+GPU協(xié)同效率低下等問題,在深入分析處理器微體系結(jié)構(gòu)特點和離散事件仿真應用特征的基礎上,對面向CMP的并行仿真內(nèi)核優(yōu)化、基于GPU的存儲

3、管理算法、時間管理算法以及CMP+GPU協(xié)同機制等進行了深入研究,主要工作和創(chuàng)新點如下:
  (1)提出了一種基于CMP的層次化并行仿真內(nèi)核模型?,F(xiàn)有并行仿真內(nèi)核常常以多進程方式使用多核資源,存在較大的同步和通信開銷,無法深入發(fā)掘多核處理器潛能。針對這一問題,提出了一種層次化并行仿真內(nèi)核模型HPSK,以多線程架構(gòu)進行仿真調(diào)度和事件執(zhí)行,并重點對時間管理服務和事件管理服務進行優(yōu)化:(i)基于混合時間推進模式,提出最小發(fā)送時戳計算協(xié)議

4、。該協(xié)議將同步計算分割為預備態(tài)和計算態(tài),由各個線程異步地參與時間同步計算,僅記錄發(fā)送到計算態(tài)消息的時戳,在確保正確性的前提下支持高效的時間同步。(ii)基于并行離散仿真事件交互的特點,提出無鎖創(chuàng)建,異步提交和指針通信的事件管理算法,以最小化線程之間的鎖開銷和減少內(nèi)存的消耗。實驗表明,采用上述優(yōu)化服務的HPSK具有很好的加速效果和可擴展性。特別在事件局部率和前瞻值較低的情況下,可獲得相比于多進程仿真內(nèi)核8x的相對加速比。
  (2)

5、提出了一種基于GPU的并行離散事件仿真存儲管理算法?;贕PU的離散事件仿真中,存在動態(tài)不規(guī)則的存儲空間需求,難以存儲于相對規(guī)則的GPU數(shù)據(jù)結(jié)構(gòu)中,且深度并發(fā)的存儲空間分配請求將導致大量的線程沖突,使得仿真事件的存儲管理十分困難。針對這一問題,提出了一種基于入口映射的并行離散事件仿真存儲管理算法 AMM。AMM算法集成一個具有“單射”和“概率均等”特性的入口映射來控制線程訪問存儲資源,“單射”特性保證每個線程分配到唯一的存儲空間訪問入口

6、,支持深度并發(fā)的存儲空間分配請求;“概率均等”特性確保仿真事件均衡地存放在存儲空間中。實驗表明,AMM算法能夠顯著降低存儲消耗和提高運行效率。
 ?。?)提出了一種基于GPU的并行離散事件仿真時間管理算法。GPU擁有數(shù)百個可并行處理的運算單元,其性能高度依賴于并行度。但傳統(tǒng)的保守時間管理算法過于悲觀,極大地限制了可并行處理事件的數(shù)目,無法有效發(fā)掘 GPU性能。針對這一問題,提出了一種基于擴展輔助的保守時間管理算法ESCTM。算法利

7、用運行時信息擴展可安全執(zhí)行事件的時間界限以提高可并行執(zhí)行的事件數(shù)量,同時采用模擬退火算法動態(tài)地調(diào)整參數(shù)來控制事件擴展次數(shù)以避免過度擴展,從而確保在不同條件下算法都能在高并行度和過度擴展之間取得平衡。實驗表明,相比傳統(tǒng)保守時間管理算法,ESCTM算法可獲得多達30%的性能提升。
 ?。?)提出了面向并行離散事件仿真的CMP和GPU協(xié)同機制。GPU內(nèi)核函數(shù)需要由某個CPU線程(主機線程)來調(diào)度,容易加重該線程工作負載,造成CPU線程間

8、負載不均衡,且大量消息交互容易成為系統(tǒng)瓶頸,導致協(xié)同效率低下。針對這一問題,提出了一種面向并行離散事件仿真的CMP和GPU協(xié)同機制CoopCG。該機制將事件處理任務和GPU調(diào)度任務分離,由各個CPU線程動態(tài)地獲取GPU的控制權(quán)分擔負載,以實現(xiàn)CPU線程之間負載平衡;同時,通過二級緩存方法降低通信開銷,由一級緩存處理高度并發(fā)的訪存操作,然后通過并行前綴和計算剔除無效數(shù)據(jù)后存入二級緩存進行數(shù)據(jù)傳輸,可有效降低數(shù)據(jù)傳輸量。實驗表明,CoopC

9、G能有效利用CMP和GPU資源,具有良好的可擴展性。在4核CPU+GPU配置下,可獲得相比于單核CPU約24.87-67.34x的并行加速比。
  在上述研究成果的基礎上,論文在課題組研制的YH-SUPE并行離散事件仿真支撐環(huán)境的基礎上,設計實現(xiàn)了一個支持 CMP+GPU異構(gòu)計算系統(tǒng)的并行仿真支撐環(huán)境 CGSUPE;通過人群暴動模型對其進行了綜合測試,結(jié)果表明論文提出的仿真優(yōu)化方法在4核CPU+1GPU配置下可獲得相比于4核CPU

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論