版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、計(jì)算流體力學(xué)(Computational Fluid Dynamics,CFD)作為一種強(qiáng)有力的計(jì)算分析工具,已經(jīng)廣泛應(yīng)用到航空、航天、氣象、船舶、武器裝備等領(lǐng)域。隨著其向高精度、大規(guī)模、高時(shí)效方向發(fā)展,對(duì)計(jì)算與存儲(chǔ)量的需求日益增加,開(kāi)展高效大規(guī)模并行計(jì)算成為必然趨勢(shì)。
近年來(lái),隨著眾核技術(shù)的不斷發(fā)展,異構(gòu)眾核體系結(jié)構(gòu)逐漸成為高端超級(jí)計(jì)算機(jī)系統(tǒng)的主流架構(gòu)。與傳統(tǒng)同構(gòu)并行計(jì)算機(jī)系統(tǒng)相比,異構(gòu)眾核體系結(jié)構(gòu)兼顧了通用性和能效比,為大
2、規(guī)模科學(xué)和工程計(jì)算提供了很好的機(jī)遇。同時(shí),異構(gòu)眾核體系結(jié)構(gòu)的復(fù)雜硬件結(jié)構(gòu)和編程環(huán)境也給包括CFD在內(nèi)的領(lǐng)域應(yīng)用開(kāi)發(fā)帶來(lái)了諸多現(xiàn)實(shí)的困難和挑戰(zhàn)。
本文以一個(gè)有限體積的CFD實(shí)際應(yīng)用為背景,在圖形處理器(Graphics Processing Unit,GPU)和英特爾集成眾核(Many Integrated Core,MIC)兩種主流眾核處理器架構(gòu)上開(kāi)展了典型隱式CFD求解方法的并行算法和優(yōu)化方法研究。主要工作包括:
3、(1)詳細(xì)介紹了兩種主流眾核處理器架構(gòu)特點(diǎn)和編程環(huán)境,總結(jié)了各自的性能優(yōu)化方法,從硬件和軟件兩個(gè)方面對(duì)比分析了兩者的異同,并根據(jù)自身的經(jīng)驗(yàn),給出了兩種架構(gòu)編程和優(yōu)化的學(xué)習(xí)曲線。
(2)對(duì)ADI、JACOBI等隱式CFD求解方法基本原理、CFD計(jì)算流程、計(jì)算數(shù)據(jù)依賴關(guān)系等進(jìn)行了深入分析,結(jié)合GPU眾核體系結(jié)構(gòu)和并行編程模型特點(diǎn),提出了基于網(wǎng)格點(diǎn)并行和基于網(wǎng)格線并行的GPU并行算法;對(duì)實(shí)際CFD應(yīng)用場(chǎng)景下的ADI和JACOBI方法
4、進(jìn)行了GPU并行算法設(shè)計(jì)、實(shí)現(xiàn)與性能優(yōu)化,并采用不同規(guī)模的結(jié)構(gòu)網(wǎng)格真實(shí)算例進(jìn)行了并行性能測(cè)試與分析。結(jié)果顯示:在200萬(wàn)規(guī)模的單區(qū)結(jié)構(gòu)網(wǎng)格上,ADI和JACOBI求解方法的GPU(NVIDIA Tesla M2050)并行分別取得了10.3倍和14.25倍的加速比(相對(duì)于Intel Xeon X5670單核);相對(duì)而言JACOBI迭代求解方法體現(xiàn)出了較好的GPU并行計(jì)算性能。
(3)基于LIKWID性能分析工具,對(duì)MIC眾核架
5、構(gòu)下LU-SGS、ADI、JACOBI的OpenMP并行性能進(jìn)行了深入分析,提出了基于微體系架構(gòu)硬件指標(biāo)的優(yōu)化方法,有助于深入理解眾核架構(gòu)下Cache、SIMD等對(duì)應(yīng)用性能的影響。針對(duì)JACOBI方法,MIC性能優(yōu)化在理想和真實(shí)場(chǎng)景下取得加速性能差異,借助性能分析工具—LIKWID,通過(guò)收集和分析程序執(zhí)行中的硬件指標(biāo),對(duì)不同場(chǎng)景下這種加速性能差異進(jìn)行了比較研究與合理性解釋。測(cè)試結(jié)果表明:在單區(qū)200萬(wàn)網(wǎng)格規(guī)模下,JACOBI方法相對(duì)于C
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 結(jié)構(gòu)網(wǎng)格高精度cfd高效隱式求解及眾核并行計(jì)算
- 面向高精度CFD的JFNK方法及其并行計(jì)算.pdf
- 并行計(jì)算在CFD問(wèn)題中的應(yīng)用.pdf
- 面向新型異構(gòu)眾核系統(tǒng)的多設(shè)備協(xié)同并行計(jì)算關(guān)鍵技術(shù)研究.pdf
- 8148.全球數(shù)值天氣預(yù)報(bào)譜模式眾核并行計(jì)算與優(yōu)化技術(shù)研究
- 面向并行計(jì)算環(huán)境的微重啟方法研究.pdf
- 基于GPU并行計(jì)算的格子Boltzmann方法研究.pdf
- 基于并行計(jì)算的LIDAR數(shù)據(jù)濾波方法研究.pdf
- matlab并行計(jì)算簡(jiǎn)介
- 基于gpu并行計(jì)算的格子boltzmann方法研究
- 8148.全球數(shù)值天氣預(yù)報(bào)譜模式眾核并行計(jì)算與優(yōu)化技術(shù)研究(1)
- 基于并行計(jì)算的數(shù)據(jù)流處理方法研究.pdf
- 并行計(jì)算及并行程序的推導(dǎo).pdf
- 基于CUDA的可視外殼并行計(jì)算方法研究.pdf
- 虛擬心臟電生理模型并行計(jì)算方法.pdf
- 面板堆石壩并行計(jì)算方法研究.pdf
- 開(kāi)放式核磁共振磁體設(shè)計(jì)的并行計(jì)算方法研究_.pdf
- 水動(dòng)力學(xué)有限元并行計(jì)算求解器開(kāi)發(fā).pdf
- FDTD的網(wǎng)絡(luò)并行計(jì)算研究.pdf
- 分布式并行計(jì)算中MPI標(biāo)準(zhǔn)的初步實(shí)現(xiàn).pdf
評(píng)論
0/150
提交評(píng)論