類(lèi)數(shù)據(jù)流驅(qū)動(dòng)的分片式處理器體系結(jié)構(gòu).pdf_第1頁(yè)
已閱讀1頁(yè),還剩166頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、納米工藝代微處理器設(shè)計(jì)中存在的功耗、線延遲和設(shè)計(jì)復(fù)雜度等問(wèn)題嚴(yán)重地制約了傳統(tǒng)的程序執(zhí)行模型和處理器體系結(jié)構(gòu)的發(fā)展。分片式處理器體系結(jié)構(gòu)就是為了應(yīng)對(duì)這些挑戰(zhàn)性問(wèn)題而產(chǎn)生的,其基本思想是將計(jì)算、存儲(chǔ)和互連資源組織成片式的基本結(jié)構(gòu)單元,這些片式單元是相對(duì)簡(jiǎn)單的、分布式控制且可重用的;大量的片式單元由高能效、可擴(kuò)展的片上網(wǎng)絡(luò)連接起來(lái)構(gòu)成高效能的處理器。這種體系結(jié)構(gòu)避免了片上長(zhǎng)線延遲的產(chǎn)生,能夠充分利用摩爾定律發(fā)展帶來(lái)的豐富而廉價(jià)的晶體管資源,獲

2、得系統(tǒng)性能的提升。但目前分片式處理器體系結(jié)構(gòu)還處于初級(jí)研究階段,有許多關(guān)鍵技術(shù)值得探討。
   本文分別從分片式處理器的程序執(zhí)行模型和體系結(jié)構(gòu)兩個(gè)方面開(kāi)展了深入的研究。主要研究?jī)?nèi)容和成果包括:(1)研究了類(lèi)數(shù)據(jù)流計(jì)算模型的原理,提出了一種適于分片式處理器體系結(jié)構(gòu)的類(lèi)數(shù)據(jù)流驅(qū)動(dòng)程序執(zhí)行模型。在該程序執(zhí)行模型中,由編譯器將串行程序劃分成一系列包含幾十至上百條指令的超塊;程序的執(zhí)行以超塊為原子單位進(jìn)行取指、執(zhí)行和提交。超塊內(nèi)部的計(jì)算采

3、用數(shù)據(jù)流表示,用數(shù)據(jù)流圖作為機(jī)器語(yǔ)言,向硬件顯式表達(dá)指令間的并行性,無(wú)需硬件動(dòng)態(tài)檢測(cè)依賴(lài),從而降低了硬件設(shè)計(jì)的復(fù)雜性;超塊間采用控制流表示,既可以有效地利用程序中的數(shù)據(jù)局部性,又可以進(jìn)一步利用線程級(jí)推測(cè)并行性。(2)分析了類(lèi)數(shù)據(jù)流驅(qū)動(dòng)的分片式處理器體系結(jié)構(gòu)的設(shè)計(jì)空間,研究了影響分片式處理器性能的關(guān)鍵因素。首先,為了提高分片式處理器上計(jì)算資源的利用率,分別從數(shù)據(jù)流和控制流的角度分析了激進(jìn)推測(cè)執(zhí)行的可行性,并對(duì)推測(cè)深度給出了量化的標(biāo)準(zhǔn);其次

4、,為了給分片式處理器選擇合適的互連網(wǎng)絡(luò)結(jié)構(gòu),分析了多種互連拓?fù)浣Y(jié)構(gòu)對(duì)處理器性能的影響;然后,為了緩解分片式處理器結(jié)構(gòu)及其多跳式的互連結(jié)構(gòu)可能對(duì)訪存造成的影響,分析了多種應(yīng)用在分片式處理器的訪存特征,研究了數(shù)據(jù)預(yù)取機(jī)制對(duì)降低訪存延遲的作用;最后,為了更準(zhǔn)確地探究應(yīng)用對(duì)結(jié)構(gòu)的需求,綜合分析了應(yīng)用在類(lèi)數(shù)據(jù)流驅(qū)動(dòng)的程序執(zhí)行模型上的行為特征。(3)研究了分片式處理器的優(yōu)化設(shè)計(jì)方案,提出了一種既能充分挖掘并行性,又能有效降低通信代價(jià)的片式單元設(shè)計(jì)思

5、想。將單個(gè)片式單元的計(jì)算復(fù)雜度限制在應(yīng)用潛在的指令級(jí)并行粒度上,同時(shí),結(jié)合程序的通信局部性特征適當(dāng)增大片式單元內(nèi)的局部通信相聯(lián)度,而無(wú)需改變整體的通信網(wǎng)絡(luò)設(shè)計(jì)。實(shí)驗(yàn)表明,這種設(shè)計(jì)思想既能夠滿(mǎn)足應(yīng)用對(duì)于指令級(jí)并行性的需求,又能夠有效地降低關(guān)鍵路徑上的數(shù)據(jù)流通信延遲。(4)基于該優(yōu)化設(shè)計(jì)方案,設(shè)計(jì)并實(shí)現(xiàn)了一種類(lèi)數(shù)據(jù)流驅(qū)動(dòng)的分片式處理器體系結(jié)構(gòu)TPA-PI。TPA-PI處理器采用DISC-I指令集體系結(jié)構(gòu),遵循類(lèi)數(shù)據(jù)流驅(qū)動(dòng)的程序執(zhí)行模型。TP

6、A-PI在開(kāi)發(fā)更大的指令級(jí)并行性、片式單元有限的計(jì)算能力以及日益嚴(yán)峻的線延遲約束之間為單個(gè)片式單元的設(shè)計(jì)找到一個(gè)較好的設(shè)計(jì)折衷點(diǎn),使得TPA-PI設(shè)計(jì)具有較好的可擴(kuò)展性。(5)在TPA-PI的軟件模擬環(huán)境上,評(píng)估了類(lèi)數(shù)據(jù)流驅(qū)動(dòng)程序執(zhí)行模型及TPA-PI體系結(jié)構(gòu)設(shè)計(jì)的有效性。實(shí)驗(yàn)結(jié)果印證了類(lèi)數(shù)據(jù)流驅(qū)動(dòng)的程序執(zhí)行模型與控制流執(zhí)行模型相比所具有的性能優(yōu)勢(shì)、片式單元的設(shè)計(jì)思想的正確性以及優(yōu)化后的TPA-PI體系結(jié)構(gòu)設(shè)計(jì)的合理性。
  

7、本文的研究工作獲得了如下一些重要的認(rèn)識(shí)。首先,在分片式處理器體系結(jié)構(gòu)設(shè)計(jì)中,程序執(zhí)行模型、處理器核粒度、片上互連模型以及目標(biāo)應(yīng)用的特征都是影響其性能的重要因素。其次,將類(lèi)數(shù)據(jù)流驅(qū)動(dòng)的程序執(zhí)行模型與分片式處理器相結(jié)合能夠有效地利用片上提供的大量計(jì)算資源,在利用數(shù)據(jù)流驅(qū)動(dòng)執(zhí)行開(kāi)發(fā)指令級(jí)并行性的同時(shí),利用控制流的局部性開(kāi)發(fā)更高層次的超塊級(jí)和線程級(jí)并行性,適應(yīng)不同特征的應(yīng)用的需求。
   本文的研究工作和結(jié)果可用于指導(dǎo)分片式處理器的體系

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論