

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、并行處理與體系結(jié)構(gòu),聯(lián)系方式:綜合樓605房間電話:,課程背景,并行處理技術(shù)已經(jīng)成為現(xiàn)代計(jì)算機(jī)科研與發(fā)展的關(guān)鍵技術(shù);其推動(dòng)力來自實(shí)際應(yīng)用對(duì)高性能、低價(jià)格和持續(xù)生產(chǎn)力日益增長的要求,計(jì)算機(jī)原理的概念計(jì)算機(jī)體系結(jié)構(gòu)的概念(Amdahl);,并行主要研究:先行方式、流水方式、向量化;并發(fā)性、同時(shí)性;數(shù)據(jù)并行性、劃分;交叉、重疊、多重性、重復(fù);時(shí)間共享、空間共享;多任務(wù)處理、多道程序、多線程方式和分布式計(jì)算?!?第一章
2、 并行計(jì)算機(jī)模型,?1 計(jì)算技術(shù)的現(xiàn)狀?2 多處理機(jī)和多計(jì)算機(jī)?3 多向量機(jī)和SIMD計(jì)算機(jī)?4 并行計(jì)算機(jī)的抽象模型?5 可擴(kuò)展的范圍和設(shè)計(jì),?1 計(jì)算技術(shù)的現(xiàn)狀,一、并行技術(shù)的出現(xiàn),,第六代:超標(biāo)量,超流水線,超長指令字?第七代:CMP(chip multiprocessor),Kunle Olukotun 博士,斯坦福大學(xué)計(jì)算機(jī)系教授,第一片CMP的設(shè)計(jì)者,推動(dòng)了片上多處理器的研究熱潮。,二、現(xiàn)代并行計(jì)算機(jī)的組成,涉及
3、6個(gè)問題:1.計(jì)算問題 現(xiàn)實(shí)生活中對(duì)問題要求快速而精確地求解推動(dòng)了計(jì)算機(jī)的廣泛使用??茖W(xué)技術(shù)中的數(shù)值計(jì)算問題人工智能(AI)問題事務(wù)處理,2.算法和數(shù)據(jù)結(jié)構(gòu) 并行計(jì)算問題中的運(yùn)算和通信,需要各種專門的算法和數(shù)據(jù)結(jié)構(gòu)。符號(hào)處理科學(xué)計(jì)算存在的問題?,3.硬件資源 處理機(jī)、存儲(chǔ)器和外圍設(shè)備組成了計(jì)算機(jī)系統(tǒng)的硬件核心外圍設(shè)備可以直接或通過局域網(wǎng)和廣域網(wǎng)與主機(jī)相連,4.操作系統(tǒng) 管理用戶程序執(zhí)行過程中的資源分配和再分
4、配。映射是一種算法結(jié)構(gòu)與硬件結(jié)構(gòu)相匹配的雙向過程。并行操作系統(tǒng)的映射算法和數(shù)據(jù)結(jié)構(gòu)到機(jī)器結(jié)構(gòu)的映射包括處理機(jī)調(diào)度、存儲(chǔ)器映象、處理器間的通信等。這些問題通常都與系統(tǒng)結(jié)構(gòu)有關(guān)。,5.系統(tǒng)軟件支持 存在的問題:不能以通用和可移植方式進(jìn)行并行程序設(shè)計(jì)開發(fā)并行編程環(huán)境:一種與系統(tǒng)結(jié)構(gòu)無關(guān)的語言、編譯器和軟件工具。,兩個(gè)方向:對(duì)于開發(fā)并行語言,將著眼點(diǎn)放在語言執(zhí)行的效率、對(duì)不同機(jī)器的可移植性、與現(xiàn)有的順序語言的兼容性、并行性的
5、表達(dá)和編程的簡便性等上面。可以設(shè)計(jì)一種新的語言,逐步擴(kuò)展現(xiàn)有的順序語言。新語言有用顯式高級(jí)結(jié)構(gòu)描述并行性的優(yōu)點(diǎn),但是新語言往往與現(xiàn)有語言不兼容,而需要新的編譯器或者通過新的步驟才能利用現(xiàn)有的編譯器。大部分系統(tǒng)選用的是語言擴(kuò)展方式。,6.編譯器支持 改進(jìn)編譯器有三種途徑:預(yù)處理程序;預(yù)編譯器;并行化編譯器。,預(yù)處理程序采用順序編譯器和目標(biāo)計(jì)算機(jī)的低層程序庫實(shí)現(xiàn)高級(jí)并行結(jié)構(gòu)。預(yù)編譯器需要程序流分析、相關(guān)性檢查和有限的優(yōu)化來檢測
6、并行性。聯(lián)接過程效果取決于預(yù)處理程序、預(yù)編譯器、并行化編譯器、加載程序和操作系統(tǒng)支持的功效。由于程序行為的不可預(yù)測,現(xiàn)有的編譯器在檢測所有類型的并行性時(shí)都不是完全自動(dòng)或完全智能進(jìn)行的。存在一些有效的方法:將編譯器命令插入源代碼,幫編譯器做出較好的結(jié)果。這樣,用戶可與編譯器進(jìn)行交互重構(gòu)程序,這已被證明對(duì)提高并行計(jì)算機(jī)性能是十分有用的。,7.并行程序的設(shè)計(jì)環(huán)境 隱式并行性伊利諾依大學(xué)的David Kuck和Rice大學(xué)的KenK
7、ennedy以及他們的合作者都已采用這種隱式并行性方法。 顯式并行性 加州理工學(xué)院的CharlesSeitz和麻省理工學(xué)院的WilliamDaily在開發(fā)多計(jì)算機(jī)時(shí)采用了這種顯式方法。,總結(jié):要使一個(gè)環(huán)境對(duì)用戶更加友好,必須要有專用軟件工具。一些工具是傳統(tǒng)高級(jí)語言的并行擴(kuò)展;一些則是集成環(huán)境其中包括提供不同級(jí)別的程序抽象、驗(yàn)證、測試、查錯(cuò)和調(diào)試等各種工具;性能預(yù)測和監(jiān)控;輔助程序開發(fā)的可視化支持、性能測量以及計(jì)算結(jié)果的圖形
8、顯示及動(dòng)畫表示,三、計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)向高性能發(fā)展歷程,主要探討順序到并行的過程,1.先行、并行性和流水線技術(shù)用先行技術(shù)預(yù)取指令可使I/E(指令讀?。g碼和執(zhí)行)支持功能并行性的方法有兩種:一種是同時(shí)使用多個(gè)功能部件;另一種是在不同處理級(jí)分別實(shí)施流水線技術(shù)。 流水線指令執(zhí)行、流水線算術(shù)計(jì)算和存儲(chǔ)器存取操作。,2.Flynn分類法MkhealFlynn(1972)根據(jù)指令和數(shù)據(jù)流概念提出了不同計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)的分類法。,傳統(tǒng)的順序
9、機(jī)被稱為SISD(單指令流單數(shù)據(jù)流)計(jì)算機(jī)。向量計(jì)算機(jī)--標(biāo)量和向量硬件裝備,或以SIMD(單指令流多數(shù)據(jù)流)機(jī)的形式出現(xiàn)。并行計(jì)算機(jī)則屬M(fèi)IMD(多指令流多數(shù)據(jù)流)機(jī),MISD(多指令流單數(shù)據(jù)流)機(jī)在執(zhí)行不同的指令流時(shí),同一數(shù)據(jù)流通過處理機(jī)線性陣列。這種系統(tǒng)結(jié)構(gòu)也就是所謂流水線執(zhí)行特定算法的脈動(dòng)陣列(Systolicarrays)。由卡內(nèi)基—梅隆大學(xué)的美籍華人學(xué)者H.T.Kung于1978年提出的。這一結(jié)構(gòu)是隨著VLSI技術(shù)
10、的發(fā)展和各種大運(yùn)算量的信號(hào)/圖象處理及科學(xué)計(jì)算的運(yùn)算要求而建立起來的。,脈動(dòng)陣列的特點(diǎn):處理單元簡單流水算法專業(yè),例:數(shù)據(jù)流計(jì)算機(jī)數(shù)據(jù)流的計(jì)算模型--試圖使并行計(jì)算的基本方面在機(jī)器層顯式化,而不利用有可能限制程序并行性的人為約束。它的想法是程序由一個(gè)基本數(shù)據(jù)依賴圖來表示;一個(gè)指令可能在獲得了它的操作數(shù)后的任意時(shí)刻被執(zhí)行,不是顯式控制線性程序列的固定組合。,3.并行/向量計(jì)算機(jī) 真正的并行計(jì)算機(jī)是那些以MIMD模式執(zhí)行程序的
11、計(jì)算機(jī)。并行計(jì)算機(jī)有兩大類,即共享存儲(chǔ)型多處理機(jī)和消息傳遞型多計(jì)算機(jī)。多處理機(jī)和多計(jì)算機(jī)之間的主要差別就在于存儲(chǔ)器共享和處理機(jī)間通信機(jī)制的不同。多處理機(jī)系統(tǒng)中的處理機(jī)通過公用存儲(chǔ)器的共享變量實(shí)現(xiàn)互相通信。多計(jì)算機(jī)系統(tǒng)的每個(gè)計(jì)算機(jī)結(jié)點(diǎn)有一個(gè)與其它結(jié)點(diǎn)不共享的本地存儲(chǔ)器。處理機(jī)之間的通信通過結(jié)點(diǎn)間的消息傳遞來實(shí)現(xiàn)。,顯式向量計(jì)算機(jī)指令是隨向量處理機(jī)的問世而出現(xiàn)的。一臺(tái)向量處理機(jī)可以裝備有用硬件或固件并發(fā)控制的多條向量流水線。,4.
12、開發(fā)層次 Lionel Ni的最新分類法(1990),并行計(jì)算機(jī)的分層開發(fā)可表示于下圖,四、性能的系統(tǒng)屬性,1 .時(shí)鐘頻率和CPI 主頻當(dāng)前數(shù)字計(jì)算機(jī)的CPU(或簡稱處理機(jī))是由一個(gè)恒定周期(τ,以ns表示)的時(shí)鐘驅(qū)動(dòng)的。周期的倒數(shù)是時(shí)鐘頻率(f=1/ τ )(以MHz表示)。,程序的規(guī)模是由其指令數(shù)(Ic),也就是程序串要執(zhí)行的機(jī)器指令數(shù)來決定的。執(zhí)行不同的機(jī)器指令所需要的時(shí)鐘周期數(shù)也是不一樣的。一條指令的周期數(shù)(C
13、Pl)就成為衡量執(zhí)行每條指令所需時(shí)間的重要參數(shù)。,2.性能因子執(zhí)行程序所需的CPU時(shí)間:設(shè)Ic為已知程序的指令條數(shù)。執(zhí)行程序所需的CPU時(shí)間(T,以秒/程序表示)可用三個(gè)主要因素的乘積來計(jì)算: T= Ic × CPI × τ,可將上式重寫成如下形式: T= Ic × (p+m×k) × τ 一種指令類型的CPI可分為完成指令所需的處理機(jī)周期數(shù)和存儲(chǔ)器周期數(shù)兩部分。完整
14、的指令執(zhí)行過程可能包含一至四次存儲(chǔ)器訪問(一次用于取指令,兩次用于取操作數(shù),一次用于存儲(chǔ)結(jié)果),這與指令的類型有關(guān)。,式中的細(xì)化:p為指令譯碼和執(zhí)行所需的處理機(jī)周期數(shù);m為所需的存儲(chǔ)器訪問次數(shù);k為存儲(chǔ)周期與處理機(jī)周期之比;Ic為指令條數(shù),為處理機(jī)周期。,3.系統(tǒng)屬性計(jì)算機(jī)系統(tǒng)屬性可以由五元組表示:(Ic,p,m,k,τ),五個(gè)量可以稱為性能因子。與四種系統(tǒng)屬性有關(guān):指令系統(tǒng)結(jié)構(gòu)、編譯技術(shù)、CPU實(shí)現(xiàn)和控制技術(shù)、高速緩存
15、與存儲(chǔ)器層次結(jié)構(gòu)。,推廣---并行系統(tǒng)的性能屬性機(jī)器規(guī)模 n—處理機(jī)個(gè)數(shù)時(shí)鐘速率 f工作負(fù)載 W--程序中的計(jì)算操作數(shù)順序執(zhí)行時(shí)間 T1并行執(zhí)行時(shí)間 Tn速度 Pn=W/Tn加速比 Sn=T1/Tn效率 En=Sn/n 利用率 Un=Pn/n(Ppeak)啟動(dòng)時(shí)間 t0 漸進(jìn)帶寬
16、 r∞,4.Mips速率(其中C是總的周期數(shù)),5.吞吐率系統(tǒng)的吞吐率:系統(tǒng)在單位時(shí)間內(nèi)能執(zhí)行多少個(gè)程序,這稱為系統(tǒng)的吞吐率(單位為程序數(shù)/秒) Ws 。,在多道程序系統(tǒng)中,系統(tǒng)吞吐率常低于CPU吞吐率Wp。Wp可用下式表示:,或: Wp=(MIPS)×106/Ic Wp的單位是程序數(shù)/秒。,CPU吞吐率是根據(jù)MIPS速率和程序的平均長度(Ic)來衡量機(jī)器每秒鐘能執(zhí)行多少個(gè)程序的尺度。Ws<Wp,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 網(wǎng)絡(luò)處理器并行體系結(jié)構(gòu)研究與性能改進(jìn).pdf
- 流處理器體系結(jié)構(gòu)上的并行編程模型實(shí)驗(yàn)研究.pdf
- 并行數(shù)據(jù)處理中間件體系結(jié)構(gòu)的研究和應(yīng)用.pdf
- 儀用主從耦合分布式并行處理容錯(cuò)系統(tǒng)體系結(jié)構(gòu)研究.pdf
- 體系結(jié)構(gòu)
- arm體系結(jié)構(gòu)與編程
- 猜測并行多核體系結(jié)構(gòu)模擬環(huán)境研究與實(shí)現(xiàn).pdf
- arm體系結(jié)構(gòu)
- 網(wǎng)絡(luò)處理器軟件體系結(jié)構(gòu)研究與實(shí)現(xiàn).pdf
- 分片式流處理器體系結(jié)構(gòu).pdf
- 體繪制并行體系結(jié)構(gòu)互連網(wǎng)絡(luò)及存儲(chǔ)設(shè)計(jì).pdf
- 一種面向數(shù)據(jù)挖掘的并行體系結(jié)構(gòu)研究.pdf
- IPSec VPN并行體系結(jié)構(gòu)的關(guān)鍵技術(shù)研究.pdf
- mips體系結(jié)構(gòu)
- 多媒體信息獲取、處理與呈現(xiàn)的硬件體系結(jié)構(gòu).pdf
- 基于異構(gòu)體系結(jié)構(gòu)的圖像匹配算法并行設(shè)計(jì)與優(yōu)化研究.pdf
- 軟件體系結(jié)構(gòu)風(fēng)格分析與應(yīng)用---通用體系結(jié)構(gòu)風(fēng)格---畢業(yè)論文
- 基于FPGA的圖計(jì)算并行算法和體系結(jié)構(gòu)研究.pdf
- 高可靠處理器體系結(jié)構(gòu)研究.pdf
- 軟件體系結(jié)構(gòu)作業(yè)
評(píng)論
0/150
提交評(píng)論