

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、相似度計(jì)算是計(jì)算機(jī)學(xué)科中一個(gè)重要的問(wèn)題,其應(yīng)用遍及多個(gè)領(lǐng)域,如互聯(lián)網(wǎng)、數(shù)據(jù)挖掘以及生物信息學(xué)等。隨著信息技術(shù)的發(fā)展,每時(shí)每刻都會(huì)產(chǎn)生龐大的數(shù)據(jù),使得相似度計(jì)算在海量信息的快速檢索中顯得非常重要。為了適應(yīng)數(shù)據(jù)的急劇增長(zhǎng),迫切需要利用高性能的計(jì)算平臺(tái)對(duì)已有方法進(jìn)行改進(jìn)和加速。
GPU具有強(qiáng)大的計(jì)算能力和高內(nèi)存帶寬,可以很好地滿足相似度計(jì)算并行化的需求。此外,GPU擁有很高的性能/價(jià)格比和性能/功耗比,使得GPU成為搭建超級(jí)計(jì)算機(jī)的
2、良好選擇,而其低廉的價(jià)格也使其普遍出現(xiàn)在桌面計(jì)算機(jī)中。
利用GPU平臺(tái)對(duì)相似度計(jì)算的性能進(jìn)行優(yōu)化,一方面要解決相似度計(jì)算的高維、數(shù)據(jù)稀疏性、數(shù)據(jù)依賴性等問(wèn)題,另一方面要考慮GPU內(nèi)部架構(gòu)、執(zhí)行模式的特殊性和局限性,如多級(jí)存儲(chǔ)層次有效利用、訪存優(yōu)化、線程負(fù)載均衡、規(guī)避線程分支等。對(duì)于不同的相似度計(jì)算方法,存在著不同的問(wèn)題,相應(yīng)的性能優(yōu)化機(jī)制也會(huì)有所不一樣。
當(dāng)利用稀疏矩陣向量乘算法來(lái)計(jì)算相似度時(shí),其性能往往受限于計(jì)算平
3、臺(tái)的內(nèi)存帶寬。為了解決這個(gè)問(wèn)題,一種基于混合存儲(chǔ)的稀疏矩陣存儲(chǔ)格式從一些經(jīng)典稀疏矩陣存儲(chǔ)格式的數(shù)據(jù)布局、數(shù)據(jù)處理策略和存儲(chǔ)空間開(kāi)銷入手,分析潛在的存儲(chǔ)格式發(fā)展方向,從而采用行交錯(cuò)合并的方式來(lái)減少存儲(chǔ)空間的開(kāi)銷,其相應(yīng)的稀疏矩陣向量乘處理過(guò)程采用分段處理的方式來(lái)控制負(fù)載均衡。結(jié)果表明,新的存儲(chǔ)格式無(wú)論在計(jì)算性能方面還是在存儲(chǔ)空間開(kāi)銷方面,都優(yōu)于NVIDIA公司實(shí)現(xiàn)的多種稀疏矩陣格式。
當(dāng)利用矩陣奇異值分解來(lái)計(jì)算相似度時(shí),傳統(tǒng)QR
4、迭代分解法耗時(shí)嚴(yán)重,并且難以使用GPU并行化??紤]到很多計(jì)算機(jī)配備了多核CPU和多個(gè)GPU,基于分而治之模型的奇異值分解方法能充分發(fā)揮此類平臺(tái)所有計(jì)算資源的計(jì)算能力。該方法采用兩級(jí)分而治之模型,使得GPU盡量處于忙碌狀態(tài),達(dá)到GPU資源的最大化利用;同時(shí)CPU與GPU協(xié)同計(jì)算使得多GPU平臺(tái)中的空閑CPU核心也利用起來(lái)。結(jié)果表明基于兩級(jí)分而治之模型的奇異值分解算法比較適合大規(guī)模的矩陣計(jì)算,并且能在多GPU平臺(tái)達(dá)到良好的加速效果。
5、 針對(duì)Smith-Waterman算法需要大量的計(jì)算和內(nèi)存空間,并且當(dāng)實(shí)現(xiàn)于GPU平臺(tái)時(shí)受限于全局內(nèi)存的訪問(wèn)速度等問(wèn)題,一種基于壓縮的多線程處理方法能利用有限的GPU內(nèi)存來(lái)進(jìn)行物種的序列比對(duì)。該方法使Smith-Waterman算法的兩個(gè)階段連續(xù)地在GPU上執(zhí)行,提供所有比對(duì)序列的相似度和最優(yōu)匹配片段。此外,該方法能滿足生物學(xué)家對(duì)其研究領(lǐng)域內(nèi)的一個(gè)或多個(gè)物種進(jìn)行比對(duì)的需求。結(jié)果表明,對(duì)于中等規(guī)模的數(shù)據(jù)庫(kù),該方法能取得優(yōu)于使用Ssear
6、ch回溯的CUDASW++2.0和DOPA。
為加快大規(guī)模信息數(shù)據(jù)的相似拷貝檢測(cè),一種結(jié)合simhash與漢明距離的檢測(cè)方法使用GPU平臺(tái)并行執(zhí)行。該方法包含三個(gè)內(nèi)核,分別為指紋生成內(nèi)核、候選指紋篩選內(nèi)核和漢明距離計(jì)算內(nèi)核。為了適應(yīng)GPU平臺(tái),該方法采用兩種優(yōu)化策略:數(shù)據(jù)緩存策略可以減少全局內(nèi)存的訪問(wèn)次數(shù)、內(nèi)存動(dòng)態(tài)分配策略用來(lái)改善內(nèi)存的使用狀況和后續(xù)線程的分配。結(jié)果表明,該GPU實(shí)現(xiàn)方案能達(dá)到很好的加速效果。
綜上所
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于語(yǔ)義相似度的比價(jià)系統(tǒng)關(guān)鍵技術(shù)研究.pdf
- 語(yǔ)義檢索中的概念相似度計(jì)算和關(guān)鍵技術(shù)研究.pdf
- 短文本相似度的關(guān)鍵技術(shù)研究.pdf
- 面向GPU計(jì)算平臺(tái)的若干并行優(yōu)化關(guān)鍵技術(shù)研究.pdf
- 面向應(yīng)用的GPU并行計(jì)算關(guān)鍵技術(shù)研究.pdf
- 基于GPU的醫(yī)學(xué)數(shù)據(jù)可視化關(guān)鍵技術(shù)研究.pdf
- 單GPU及GPU異構(gòu)集群的若干關(guān)鍵技術(shù)研究.pdf
- 虛擬化環(huán)境下的GPU通用計(jì)算關(guān)鍵技術(shù)研究.pdf
- 基于可編程GPU的體繪制關(guān)鍵技術(shù)研究.pdf
- 基于云計(jì)算的WebGIS關(guān)鍵技術(shù)研究.pdf
- 基于OSGI的普及計(jì)算關(guān)鍵技術(shù)研究.pdf
- 基于GPU圖像搜索中文本檢索的關(guān)鍵技術(shù)研究.pdf
- 基于GPU的車牌定位關(guān)鍵技術(shù)并行研究.pdf
- 面向CPU-GPU異構(gòu)并行計(jì)算的代碼生成關(guān)鍵技術(shù)研究.pdf
- 基于GPU的大規(guī)模地形實(shí)時(shí)繪制關(guān)鍵技術(shù)研究與實(shí)現(xiàn).pdf
- 基于云計(jì)算的軟件測(cè)試關(guān)鍵技術(shù)研究.pdf
- 基于網(wǎng)格計(jì)算的協(xié)同設(shè)計(jì)關(guān)鍵技術(shù)研究.pdf
- 基于移動(dòng)Agent的網(wǎng)格計(jì)算關(guān)鍵技術(shù)研究.pdf
- 基于云計(jì)算的數(shù)據(jù)安全關(guān)鍵技術(shù)研究.pdf
- GPU加速的幾何處理若干關(guān)鍵技術(shù)研究.pdf
評(píng)論
0/150
提交評(píng)論