版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著異構(gòu)平臺(tái)的興起,高性能計(jì)算領(lǐng)域獲得快速的發(fā)展?;贑PU+GPU的異構(gòu)平臺(tái)在以生物信息學(xué)、醫(yī)學(xué)成像和計(jì)算流體力學(xué)等為代表的諸多領(lǐng)域獲得廣泛應(yīng)用。但是,CPU和GPU使用不同指令集和編程模型,對(duì)程序編程優(yōu)化有較高要求。Intel于2012年推出了基于眾核架構(gòu)的Xeon Phi協(xié)處理器,兼容傳統(tǒng) x86編程模型和特性,某種程度上降低了程序編程優(yōu)化的難度。Xeon Phi集成50個(gè)以上的x86輕量核,每個(gè)核支持4個(gè)硬件線程和512位 SI
2、MD向量處理,因而具有強(qiáng)大的并行處理能力。目前,使用Xeon Phi進(jìn)行算法優(yōu)化加速的研究尚處于起步階段。
本文面向典型圖像處理算法在Xeon Phi平臺(tái)上的實(shí)現(xiàn)與加速展開(kāi)研究。圖像處理算法對(duì)計(jì)算性能需求較高,具有數(shù)據(jù)量大和較高實(shí)時(shí)性的特點(diǎn)。本文選取了兩個(gè)代表性算法作為研究實(shí)例,分別是2D IDCT算法和3D GVF場(chǎng)算法。
本文主要工作包括:
?。?)在Xeon Phi平臺(tái)上實(shí)現(xiàn)2D IDCT及相關(guān)優(yōu)化。首
3、先依據(jù)行列分離計(jì)算原理串行實(shí)現(xiàn)2D IDCT,以此作為后續(xù)優(yōu)化的性能基準(zhǔn),然后采用512位 SIMD和OpenMP對(duì)串行2D IDCT進(jìn)行向量化和線程擴(kuò)展,最后進(jìn)行數(shù)據(jù)預(yù)取優(yōu)化。實(shí)驗(yàn)結(jié)果表明,對(duì)單精度圖像格式,相比未向量化版本,向量化處理可獲得約5.84倍的性能加速,且算法性能隨線程擴(kuò)展近似線性增加;使用數(shù)據(jù)預(yù)取優(yōu)化可在已有優(yōu)化基礎(chǔ)上再獲得約1.24的性能加速。綜合來(lái)說(shuō),優(yōu)化后的2D IDCT算法在Xeon Phi上的最好性能相比在一顆
4、E5-2670 CPU上的最好性能有約1.53倍的加速比。
?。?)在Xeon Phi平臺(tái)上實(shí)現(xiàn)3D GVF場(chǎng)計(jì)算及相關(guān)3D GVF場(chǎng)優(yōu)化。除討論向量化和線程擴(kuò)展等通用優(yōu)化外,側(cè)重在模板計(jì)算優(yōu)化對(duì)計(jì)算性能的影響,提出一種有效的循環(huán)分塊優(yōu)化策略,有效提高了緩存利用率。實(shí)驗(yàn)結(jié)果表明,對(duì)雙精度圖像格式,經(jīng)線程擴(kuò)展和向量化能顯著提升3D GVF場(chǎng)運(yùn)算性能,通過(guò)提出的分塊優(yōu)化策略,在問(wèn)題規(guī)模為256?256?256和512?512?512
5、時(shí),3D GVF在Xeon Phi上的計(jì)算性能在相比于在一顆E5-2670 CPU上的性能分別有約1.78和2.77的加速比。
(3)歸納總結(jié)圖像處理算法在Xeon Phi平臺(tái)上的優(yōu)化規(guī)律,整理出有指導(dǎo)意義的優(yōu)化技術(shù),方便后續(xù)其他圖像處理算法的優(yōu)化。一般而言,對(duì)計(jì)算密集型的算法,直接采用諸如向量化和線程擴(kuò)展等通用優(yōu)化技術(shù)可獲得不錯(cuò)的性能提升;對(duì)計(jì)算訪存比較低的圖像處理算法,需要考慮提高緩存的利用效率,本文提出的循環(huán)分塊策略即是
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 圖像標(biāo)注算法研究及其在Hadoop平臺(tái)上的實(shí)現(xiàn).pdf
- 高速圖像處理算法研究與實(shí)現(xiàn).pdf
- 基于并行編程的輪對(duì)圖像在線處理算法優(yōu)化技術(shù)研究.pdf
- MPEG-4在ARM平臺(tái)上的算法優(yōu)化研究與實(shí)現(xiàn).pdf
- 車(chē)載視頻圖像處理算法的優(yōu)化與融合研究.pdf
- 復(fù)雜信號(hào)處理算法的FPGA實(shí)現(xiàn)技術(shù)研究.pdf
- 基于RenderScript的圖像處理算法研究與實(shí)現(xiàn).pdf
- 車(chē)牌識(shí)別圖像處理算法的研究與實(shí)現(xiàn).pdf
- 圖像處理算法的快速驗(yàn)證平臺(tái).pdf
- 基于DSP的圖像預(yù)處理算法研究與實(shí)現(xiàn).pdf
- 圖像預(yù)處理算法的硬件實(shí)現(xiàn).pdf
- 基于VLIW DSP的圖像處理算法與實(shí)現(xiàn)研究.pdf
- 基于NiosII的紅外圖像處理算法與實(shí)現(xiàn).pdf
- 通用圖像處理算法流程組裝平臺(tái).pdf
- DSP算法不同平臺(tái)上的實(shí)現(xiàn)、性能研究與優(yōu)化.pdf
- 靶場(chǎng)光斑儀圖像處理算法與實(shí)現(xiàn).pdf
- 基于仿生智能優(yōu)化的圖像處理算法研究.pdf
- 基于OMAP3530的穩(wěn)定平臺(tái)圖像處理算法設(shè)計(jì)與實(shí)現(xiàn).pdf
- 改進(jìn)的圖像增強(qiáng)算法及在ARM平臺(tái)上的實(shí)現(xiàn).pdf
- 視頻監(jiān)控圖像后處理算法的研究與實(shí)現(xiàn)
評(píng)論
0/150
提交評(píng)論