版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、近年來,隨著GPGPU在生物計算、金融分析、天氣預測等高性能計算領(lǐng)域發(fā)揮著越來越重要的作用,有關(guān)GPGPU的相關(guān)研究逐漸成為研究的熱點。在模擬器設(shè)計方面,一個高性能的模擬器對GPGPU的研究而言至關(guān)重要,而當前GPGPU模擬器大多為串行模擬器,模擬速度極慢,極大制約了模擬器在GPGPU體系結(jié)構(gòu)研究中的應用。在GPGPU體系結(jié)構(gòu)設(shè)計方面,隨著GPGPU計算能力的不斷增加,GPGPU中越來越多的計算節(jié)點需要通過片上網(wǎng)絡與存儲節(jié)點進行通信。隨
2、著片上網(wǎng)絡在片上多核系統(tǒng)設(shè)計中所占的開銷不斷增大,如何在保持性能不變的前提下設(shè)計低開銷的片上網(wǎng)絡對于GPGPU的發(fā)展至關(guān)重要。
針對于第一個問題,本文提出了GPGPU并行模擬的方案,充分利用現(xiàn)有宿主平臺多機多核的計算優(yōu)勢加速GPGPU程序的模擬速度;針對第二個問題,本文提出了GPGPU低開銷片上網(wǎng)絡設(shè)計的方案,首先通過一系列的設(shè)計避免了網(wǎng)絡中報文的沖突,然后通過簡化路由器微體系結(jié)構(gòu)設(shè)計降低了片上網(wǎng)絡的開銷。
本文的研
3、究工作和成果有:
?。?)提出了GPGPU在多核多機平臺下的并行模擬方案
在多核宿主平臺下,本文提出了Kernel內(nèi)部的并行模擬,一方面使用多個模擬線程同時對多個Cluster進行模擬,并要求多個模擬線程在每個時鐘周期進行同步以保持模擬精度,另一方面并行化執(zhí)行驅(qū)動中的功能模擬和性能模擬以彌補時鐘同步帶來的性能損失。在多機宿主平臺下,本文提出了Kernel之間并行模擬的方案,將Kernel函數(shù)進行分組后利用多機平臺并行的
4、對各組進行模擬以獲得性能的提升。在GPGPU模擬器對程序進行模擬的過程中,它會依賴功能模擬提供的結(jié)果,因此功能模擬在一定程度上會制約GPGPU模擬器的模擬速度,本文針對CUDA編程模型的特點提出了一種并行化功能模擬的方法,并就它應用到了Kernel內(nèi)部、Kernel之間并行模擬中。
(2)提出了GPGPU低開銷片上網(wǎng)絡設(shè)計方案
本文針對GPGPU中Request網(wǎng)絡的通信特點提出了低開銷的片上網(wǎng)絡設(shè)計。將計算節(jié)點分為
5、若干組,通過向各組分配專屬子網(wǎng)避免了不同組之間的報文沖突;設(shè)計了令牌發(fā)射機制以及令牌傳輸網(wǎng)絡,徹底避免了組內(nèi)的報文沖突,并對網(wǎng)絡不存在任何沖突進行了證明;設(shè)計了低開銷的路由器微體系結(jié)構(gòu),實現(xiàn)了報文在相鄰路由器之間的單周期傳輸;設(shè)計了狀態(tài)回傳網(wǎng)絡,使計算節(jié)點可以感知存儲節(jié)點中報文緩存隊列的狀態(tài)變化,從而進行相應的發(fā)包調(diào)整。
本文對上述方案進行實現(xiàn),并針對多個CUDA測試集中的測試程序?qū)ο到y(tǒng)性能進行了詳細的測試與分析。實驗結(jié)果表明
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 片上網(wǎng)絡低費用測試方法研究.pdf
- 片上網(wǎng)絡低能耗和低延遲研究.pdf
- 低負載片上網(wǎng)絡通訊路徑約束方法研究.pdf
- 片上網(wǎng)絡性能評估平臺設(shè)計.pdf
- 片上網(wǎng)絡低功耗設(shè)計研究.pdf
- 基于多fpga的片上網(wǎng)絡模擬平臺設(shè)計和實現(xiàn)
- 機會網(wǎng)絡低開銷路由算法研究.pdf
- 基于片上網(wǎng)絡的層級并行可進化硬件系統(tǒng)研究.pdf
- 片上網(wǎng)絡的低功耗模擬及映射研究.pdf
- 低開銷的Ad Hoc網(wǎng)絡路由協(xié)議.pdf
- 片上網(wǎng)絡低功耗設(shè)計方法研究.pdf
- 片上網(wǎng)絡路由算法的優(yōu)化設(shè)計.pdf
- 片上網(wǎng)絡優(yōu)化策略設(shè)計與仿真.pdf
- 片上網(wǎng)絡映射算法研究和設(shè)計.pdf
- 實時約束下的低擁堵片上網(wǎng)絡映射技術(shù)研究.pdf
- 基于GPU平臺的片上網(wǎng)絡模擬器的研究與設(shè)計.pdf
- 片上網(wǎng)絡模擬器在GPU平臺上的設(shè)計與優(yōu)化.pdf
- 片上網(wǎng)絡系統(tǒng)模型.pdf
- 片上網(wǎng)絡交換結(jié)構(gòu)研究.pdf
- 基于微片狀態(tài)模擬的片上網(wǎng)絡能耗計算.pdf
評論
0/150
提交評論