微機原理與接口技術(shù)課程設(shè)計---計算機并行處理機制的研究_第1頁
已閱讀1頁,還剩17頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、<p>  計算機科學(xué)與技術(shù)學(xué)院</p><p><b>  課程設(shè)計報告</b></p><p>  2011 — 2012學(xué)年第 1 學(xué)期</p><p>  課程名稱 微機原理與接口技術(shù) </p><p>  設(shè)計題目 計算機并行處理機制的研究 </p><p&

2、gt;  學(xué)生姓名 </p><p>  學(xué) 號 </p><p>  專業(yè)班級 </p><p>  指導(dǎo)教師 </p><p><b>  目錄</b><

3、/p><p><b>  一、概述1</b></p><p><b>  二、并行的概念1</b></p><p>  2. 1 并行性1</p><p>  2. 2 并行等級的劃分1</p><p>  2. 3 實現(xiàn)并行處理的技術(shù)途徑3</p>&l

4、t;p>  三、計算機內(nèi)部并行處理機制3</p><p><b>  3.1流水線3</b></p><p>  3.2超標(biāo)量結(jié)構(gòu)4</p><p>  3.3 超流水線結(jié)構(gòu)6</p><p>  3.4 VLIW(超長指令字)6</p><p>  四、計算機間的并行處理機制8

5、</p><p>  4. 1對稱多處理機SMP8</p><p>  4. 1. 1 SMP的結(jié)構(gòu)和特性8</p><p>  4. 1. 2 多處理機中的擴展存儲層次結(jié)構(gòu)9</p><p>  4. 2大規(guī)模并行處理機MPP10</p><p>  4. 2. 1 MPP的結(jié)構(gòu)和特性10</p&

6、gt;<p>  4. 2. 2 當(dāng)代MPP系統(tǒng)的公共體系結(jié)構(gòu)11</p><p><b>  4. 3機群12</b></p><p>  4 . 3. 1機群的概念和特性12</p><p>  4. 3. 2 機群的分類13</p><p>  4. 3. 3 機群的體系結(jié)構(gòu)13</p

7、><p>  五、總結(jié)與展望16</p><p><b>  六、參考資料16</b></p><p><b>  一、概述</b></p><p>  計算機從1946年的ENIAC機問世以來,至今已經(jīng)歷了五次更新?lián)Q代。每一代計算機的性能都成數(shù)量級倍的提高,計算機的體積、重量、價格、穩(wěn)定性、可靠性

8、、可維護性及功能的多樣性等均有了顯著的改善。人們通常以電子管、晶體管、中小規(guī)模集成電路、大規(guī)模和超大規(guī)模集成電路等器件的變革作為計算機換代的標(biāo)志。但是,計算機系統(tǒng)實際上是器件、硬件、軟件、算法、語言、系統(tǒng)結(jié)構(gòu)以及通訊技術(shù)等的綜合,所以計算機的換代也反映在上述各方面的巨大變革上。</p><p>  促使計算機迅速發(fā)展和系統(tǒng)性能極大提高的因素是多方面的,其中,器件技術(shù)尤其是微電子技術(shù)的迅速發(fā)展無疑是最為關(guān)鍵的因素,

9、它是計算機得以迅速發(fā)展的物質(zhì)基礎(chǔ)。然而,應(yīng)當(dāng)看到,如果不能最合理地利用這些新器件、新設(shè)備,最大限度地發(fā)揮出它們的內(nèi)在潛力,設(shè)計和構(gòu)成綜合性能指標(biāo)最佳的計算機系統(tǒng),只靠器件技術(shù)的變革是不行的,還需要硬件、軟件、算法、語言、系統(tǒng)結(jié)構(gòu)、通訊技術(shù)等多方面的發(fā)展變革才行。</p><p>  在特定的時期里,器件的發(fā)展變化會因物理、工藝、價格等條件限制而有一定限度。在同一種器件技術(shù)水平上,進一步提高計算機系統(tǒng)性能的有效途徑

10、就是在系統(tǒng)結(jié)構(gòu)上使用并行處理技術(shù),挖掘出系統(tǒng)固有的并行性潛力,提高其并行性操作的程度。</p><p>  并行性在不同的處理級別中可表現(xiàn)為多種形式,如先行方式、流水方式、向量化、并發(fā)行、同時性、數(shù)據(jù)并行性、劃分、交叉、重疊、多重性、重復(fù)、時間共享、空間共享、多任務(wù)處理、多道程序、多線程方式和分布式計算等。</p><p><b>  二、并行的概念</b></

11、p><p><b>  2. 1 并行性</b></p><p>  只要在同一時刻或是同一時間間隔內(nèi)完成兩種或兩種以上性質(zhì)相同或不同的工作,它們在時間上相互重疊,都體現(xiàn)了并行性。也就是說,并行性包括同時性和并發(fā)性兩重含義。同時性(simultaneity)指的是兩個或多個時間在同一時刻發(fā)生,并發(fā)性(concurrency)指的是兩個或多個事件在同一時間間隔內(nèi)發(fā)生。<

12、;/p><p>  2. 2 并行等級的劃分</p><p>  并行性可以劃分為不同的等級,從不同的角度出發(fā),等級的劃分方法也不一樣。</p><p>  從計算機系統(tǒng)內(nèi)部執(zhí)行程序的角度來劃分</p><p>  指令內(nèi)部——一條指令內(nèi)部各種微操作之間的并行</p><p>  指令之間——多條指令在某一時刻或同一時間間

13、隔內(nèi)并行執(zhí)行</p><p>  任務(wù)或進程之間——多個任務(wù)或程序段之間的并行執(zhí)行</p><p>  作業(yè)或程序之間——多個作業(yè)或多道程序之間的并行執(zhí)行</p><p>  從計算機系統(tǒng)中處理數(shù)據(jù)的并行性角度來看</p><p>  字串位串——同時只對一個字的一位進行處理,通常指傳統(tǒng)的串行單處理機,沒有并行性</p><

14、;p>  字串位并——同時對一個字的全部位進行并行處理,通常指傳統(tǒng)的并行單處理機,開始出現(xiàn)并行性</p><p>  字并位串——同時對許多字的同一位進行處理,開始進入并行處理領(lǐng)域</p><p>  字并位并——同時對許多字的全部或部分位組進行處理。</p><p>  從計算機信息加工的各個步驟和階段來看</p><p>  存儲器

15、操作并行——可以采用單體多字、多體單字或多體多字方式在一個存儲周期內(nèi)訪問多個字,進而采用按內(nèi)容訪問方式在一個存儲周期內(nèi)用位串字并獲全并行方式實現(xiàn)對存儲器中大量字的高速并行比較、檢索、更新、變換等操作。典型的例子就是并行存儲器系統(tǒng)和以相聯(lián)存儲器為核心構(gòu)成的相聯(lián)處理機。</p><p>  處理機操作步驟并行——處理機操作步驟可以指一條指令的取指、分析、執(zhí)行等操作步驟,也可指如浮點加法的求階差、對階、尾加、舍入、規(guī)格

16、化等具體操作的執(zhí)行步驟。操作步驟并行就是將操作步驟或具體操作的執(zhí)行步驟在時間上重疊流水地進行。典型的例子就是流水線處理機。</p><p>  處理機操作并行——為支持向量、數(shù)組運算,可以通過重復(fù)設(shè)置大量處理單元,讓它們在同一控制器控制下按照同一條指令的要求對多個數(shù)據(jù)組同時操作。典型的例子就是并行處理機。</p><p>  指令、任務(wù)、作業(yè)并行——這是較高級的并行,雖然它也可包含如操作、

17、操作步驟等較低等級的并行,但原則上與操作級并行是不同的。指令級以上的并行是多個處理機同時對多條指令及有關(guān)的多數(shù)據(jù)組進行處理,而操作級并行是對同一條指令及其有關(guān)的多數(shù)據(jù)組進行處理。因此,前者構(gòu)成的是多指令流多數(shù)據(jù)流(MIMD)計算機,后者構(gòu)成的則是單指令流多數(shù)據(jù)流(SIMD)計算機。典型的例子是多處理機。</p><p>  2. 3 實現(xiàn)并行處理的技術(shù)途徑</p><p>  實現(xiàn)并行處理

18、的技術(shù)途徑是各種各樣的,其中主要有時間重疊、資源重復(fù)和資源共享等方法。</p><p>  時間重疊在并行性概念中引入時間因素,使多個處理過程在時間上錯開,輪流重疊地使用同一套硬件設(shè)備的不同部件,以加快硬件周轉(zhuǎn)而贏得速度。最典型的例子就是流水線工作方式。時間重疊原則上不需要重復(fù)增加硬件設(shè)備就可提高系統(tǒng)的性能。</p><p>  資源重復(fù)在并行性概念中引入空間因素,通過重復(fù)設(shè)置硬件資源

19、,如處理機或外圍設(shè)備等,來達到大幅度提高可靠性和處理速度的目的。</p><p>  資源共享讓多個用戶按一定時間間隔輪流使用同一套資源,以提高系統(tǒng)的整體性能。</p><p>  三、計算機內(nèi)部并行處理機制</p><p>  RISC處理機內(nèi)部可以采用如下技術(shù)來增加其并行性:</p><p> ?。?)哈佛結(jié)構(gòu):即設(shè)計分開的指令cac

20、he和數(shù)據(jù)cache,可以并行工作。</p><p> ?。?)多端口的寄存器堆。如果一個寄存器堆有兩個源操作數(shù)端口和一個目的操作數(shù)端口,那么兩個源操作數(shù)可以同時取出,還可以寫入或取出另一條指令的目的操作數(shù)。</p><p><b> ?。?)流水線。</b></p><p> ?。?)編譯優(yōu)化技術(shù)。充分利用硬件資源、優(yōu)化分配寄存器。&l

21、t;/p><p>  (5)超標(biāo)量(super scalar)結(jié)構(gòu)。即設(shè)置多個執(zhí)行部件。</p><p> ?。?)超流水線(superpipeline)結(jié)構(gòu)。</p><p> ?。?)VLIW(Very Long Instruction Word)</p><p>  指令級并行處理(ILPP,Instruction Level Par

22、allel Processing)是實行低層機器操作的并行執(zhí)行,如存、取、整數(shù)加和浮點乘等。</p><p>  其中的流水線、超長指令字VLIW、超標(biāo)量結(jié)構(gòu)等技術(shù)都屬于處理機指令級并行技術(shù),下面將分別對其加以介紹。</p><p><b>  3.1流水線</b></p><p>  一條典型指令的執(zhí)行基本上由取指、譯碼、執(zhí)行和寫回4個階段組

23、成。由于不同階段的執(zhí)行由不同的功能部件來進行,因此可以使得指令的執(zhí)行在時間上重迭起來。流水線的基本思想就是重迭連續(xù)指令的執(zhí)行以節(jié)省執(zhí)行時間和增加吞吐率。</p><p>  一般流水線結(jié)構(gòu)如下圖所示:</p><p>  IPC(Instruction Per Cycle)=1,但由于數(shù)據(jù)相關(guān)、轉(zhuǎn)移相關(guān)和資源相關(guān)使得IPC<1。</p><p><b&g

24、t;  3.2超標(biāo)量結(jié)構(gòu)</b></p><p><b>  主要特點:</b></p><p>  (1)配置多個處理部件,采用多條流水線并行處理;</p><p> ?。?)能同時對若干條指令進行譯碼,將可并行執(zhí)行的指令送往不同的執(zhí)行部件,從而達到每個周期啟動多條指令的目的。</p><p>  (3)在

25、程序運行期間由硬件完成指令調(diào)度。</p><p>  下圖中,一個周期內(nèi)同時發(fā)出三條指令,有多個執(zhí)行部件,三條指令發(fā)到三個獨立的執(zhí)行部件去分別執(zhí)行。</p><p><b>  超標(biāo)量的典型結(jié)構(gòu):</b></p><p><b>  指令的執(zhí)行部件:</b></p><p>  存儲器操作部件:執(zhí)行

26、Load、Store指令</p><p><b>  ALU:整數(shù)運算</b></p><p>  轉(zhuǎn)移控制部件:執(zhí)行轉(zhuǎn)移指令</p><p>  狀態(tài)記錄部件(調(diào)度部件):</p><p>  進行流水動態(tài)調(diào)度。依靠硬件在程序運行過程中對可能出現(xiàn)的相關(guān)情況加以檢測,從而保證流水線中的各個功能部件能最大限度的重疊工作。&

27、lt;/p><p>  它對流水線中的各個功能部件的工作狀態(tài)、進入流水線中的各條指令的工作狀態(tài)、它們所使用的源寄存器和目的寄存器情況等進行集中的統(tǒng)一記錄和調(diào)度。</p><p>  在譯碼階段,狀態(tài)記錄部件根據(jù)所記錄的狀態(tài)決定是否將譯碼后的指令發(fā)送給有關(guān)功能部件進行處理。</p><p>  狀態(tài)記錄部件主要檢查:</p><p>  該指令要使

28、用的功能部件是否已被流水線中的其它指令占用(資源沖突);</p><p>  該指令的源操作數(shù)寄存器是否為其它指令的目的寄存器,或者它所要寫入的目的寄存器又正好是前面其它指令所要讀出的操作數(shù),或是要寫入的目的寄存器。即檢查是否存在RAW、WAR、WAW的數(shù)據(jù)相關(guān)。</p><p>  3.3 超流水線結(jié)構(gòu)</p><p>  下圖中,一個流水段(一個周期)分成三個子

29、段,每個子段取出的仍只有一條指令,但總體來看,一個周期內(nèi)取出了三條指令,執(zhí)行部件可以一套,每個部件在一個子段時間內(nèi)完成。</p><p>  超標(biāo)量結(jié)構(gòu)、超流水線結(jié)構(gòu)一般采用指令窗方法,把一段指令取到窗口中,判斷這段指令能否并行執(zhí)行。</p><p>  超標(biāo)量和超流水線的比較</p><p>  超標(biāo)量:工作部件多,晶體管數(shù)目也多,每個部件的工作速度相對的可以低

30、一些。以空間換取時間。</p><p>  超流水線:工作部件少,晶體管數(shù)目少了,每一個部件必須在一個子周期內(nèi)執(zhí)行,工作速度較高。以時間換取了空間。</p><p>  3.4 VLIW(超長指令字)</p><p>  1983年,Yale大學(xué)Fisher教授首先提出。</p><p>  一條長指令來實現(xiàn)多個操作的并行執(zhí)行,以減少對存儲器

31、的訪問,這種長指令往往達上百位,甚至上千位。</p><p>  如下面的圖。每拍啟動一條長指令,執(zhí)行3個操作,相當(dāng)于3條指令,要求并行度為3。</p><p><b>  主要特點:</b></p><p>  單一的控制流。只有一個控制器,每個周期啟動一條長指令。</p><p>  超長指令字被分成多個控制字段,每

32、個字段直接獨立的控制每個功能部件。</p><p>  含有大量的數(shù)據(jù)通路和功能部件,由于編譯器在編譯時間已經(jīng)考慮可能出現(xiàn)的數(shù)據(jù)相關(guān)和資源相關(guān),故控制硬件比較簡單。</p><p>  在編譯階段完成超長指令中多個可并行執(zhí)行操作的調(diào)度(超長指令字的生成是由編譯器完成)。</p><p>  VLIW機的結(jié)構(gòu)框圖</p><p>  四、計算機

33、間的并行處理機制</p><p>  體系結(jié)構(gòu)的并行性才是并行計算機真正的特點,下面主要介紹當(dāng)代流行的幾種主要的并行體系結(jié)構(gòu):對稱多處理機SMP,大規(guī)模并行處理機MPP,機群。</p><p>  4. 1對稱多處理機SMP</p><p>  4. 1. 1 SMP的結(jié)構(gòu)和特性</p><p>  SMP機器結(jié)構(gòu)圖如下: </p&g

34、t;<p>  SMP結(jié)構(gòu)具有以下特性:</p><p>  對稱性 系統(tǒng)中任何處理機都可以對稱地訪問任何存儲單元和I/O設(shè)備,且具有相同的訪存時間,所以也常叫均勻存儲訪問UMA結(jié)構(gòu)</p><p>  單一物理地址空間所有處理器的存儲單元按照單一地址空間編址</p><p>  高速緩存及其一致性多極高速緩存可支持?jǐn)?shù)據(jù)局部性,且其一致性由硬件來

35、實現(xiàn)</p><p>  低通信延遲處理機間的通信用簡單的讀/寫指令來完成</p><p>  正是這些特性使得對稱處理機得到了廣泛使用。例如,由于存在單一物理地址空間,只需要一個OS副本駐留在共享存儲器中,OS可以按工作負載情況在多個處理機上調(diào)度進程,從而易于達到動態(tài)負載平衡和有效地利用系統(tǒng)資源。這一點使得它非常適合作為對吞吐率要求很高的服務(wù)器。</p><p>

36、;  從分層角度來看,SMP機器的硬件直接支持共享地址空間變成模型。由于存在類似于串行編程的單地址空間,任何處理機都可以用普通的讀/寫指令來高效地存取共享數(shù)據(jù),并且共享數(shù)據(jù)在本地高速緩存間進行自動復(fù)制和移動,使得SMP對并行編程具有很大吸引力。從可移植性的角度出發(fā),在大部分SMP機器上也實現(xiàn)了消息傳遞編程模型。這通常是通過一些運行庫的支持,在這些運行庫中將共享地址空間的一部分指派給每個進程,同時顯式地給每個進程制定消息緩沖區(qū),通過在緩沖

37、區(qū)間拷貝數(shù)據(jù)來實現(xiàn)Send/Recv對。由于它們不需要操作系統(tǒng)的干預(yù),通常能獲得比傳統(tǒng)的分布式消息傳遞系統(tǒng)更好的消息傳遞性能,當(dāng)然前提是共享總線不能成為通信瓶頸。</p><p>  4. 1. 2 多處理機中的擴展存儲層次結(jié)構(gòu) </p><p>  在SMP中所有的通信和本地計算都將導(dǎo)致對存儲器的讀/寫,因此從系統(tǒng)設(shè)計的角度出發(fā),擴展存儲器的組織就是一個關(guān)鍵的設(shè)計因素。通常,隨著規(guī)模的增

38、大,多處理機中的存儲結(jié)構(gòu)分別屬于如圖所示的四種擴展存儲層次結(jié)構(gòu),其中前三種是對稱多處理機,而第四種不是。</p><p>  在共享高速緩存的結(jié)構(gòu)中,互連網(wǎng)絡(luò)位于處理器和共享的一級高速緩存之間。為了提高帶寬,高速緩存和主存系統(tǒng)都是可以交叉存取的。在20世紀(jì)80年代中期,這種結(jié)構(gòu)常被用來連接一個主板上的多個處理器,現(xiàn)在這種結(jié)構(gòu)可被用來實現(xiàn)單片多處理機(Multiprocessor-on-a-chip)。然而,這種結(jié)

39、構(gòu)中當(dāng)多個對稱處理器同時存取共享高速緩存時,對高速緩存的帶寬要求很高;另外,對高速緩存數(shù)據(jù)的存取必須通過處理器和高速緩存間的互連網(wǎng)絡(luò),從而使得高速緩存存取延遲變大。所以,這種方法的可擴展性很差,只適用于機器規(guī)模很小的情況,通常只支持2-8個處理器。</p><p>  在基于總線的共享內(nèi)存結(jié)構(gòu)中,互連網(wǎng)絡(luò)是處理器的私有高速緩存和共享內(nèi)存系統(tǒng)間的共享總線。這種結(jié)構(gòu)被廣泛地應(yīng)用于小規(guī)模和中等規(guī)模的多處理機中,其處理器

40、數(shù)目通常能達到20-30個。受共享總線和內(nèi)存系統(tǒng)的帶寬限制,基于總線的共享內(nèi)存方法的可擴展性也不是很好。</p><p>  舞廳(Dancehall)結(jié)構(gòu)把互連網(wǎng)絡(luò)放在高速緩存和主存之間,但是互連網(wǎng)絡(luò)是一個可擴展的點到點網(wǎng)絡(luò),同時內(nèi)存被劃分為許多邏輯模塊,連到互連網(wǎng)絡(luò)的不同連接點。這種結(jié)構(gòu)是對稱的,所有的處理器到內(nèi)存的距離是相同的,缺點是所有內(nèi)存存取都要經(jīng)過互連網(wǎng)絡(luò),當(dāng)其規(guī)模較大時,內(nèi)存存取延遲較大。</

41、p><p>  分布式內(nèi)存的結(jié)構(gòu)不是對稱的,處理節(jié)點之間銅鼓哦一個可擴展的互連網(wǎng)絡(luò)相連,每個節(jié)點有本地內(nèi)存,對本地內(nèi)存的存取比對遠地內(nèi)存的存取快得多。通過利用數(shù)據(jù)分布的局部性原理,大多數(shù)的高速緩存的缺失的存取幾乎都能在本地內(nèi)存中得到滿足。這種結(jié)構(gòu)對于設(shè)計可擴展的多處理器最具有吸引力。</p><p>  4. 2大規(guī)模并行處理機MPP</p><p>  4. 2. 1

42、 MPP的結(jié)構(gòu)和特性</p><p>  MPP并行機體系結(jié)構(gòu)模型如下圖示:</p><p>  MPP通常具有如下特點:</p><p>  在處理節(jié)點中使用通用微處理器,且每個節(jié)點有一個或多個微處理器</p><p>  在處理節(jié)點內(nèi)使用物理上分布的存儲器</p><p>  使用具有高通信帶寬和低延遲的互連網(wǎng)絡(luò)

43、,節(jié)點間彼此緊密耦合</p><p>  能擴展成具有成百上千個處理器</p><p>  是一個異步多指令流多數(shù)據(jù)流MIMD機,進程同步采用鎖方式消息傳遞操作,而不是用共享變量同步操作加以實現(xiàn)</p><p>  程序由多個進程組成,每個進程有自己的私有地址空間,通過顯示的消息傳遞實現(xiàn)進程間互相通信,數(shù)據(jù)分布對于用戶不是透明的。</p><p&

44、gt;  MPP的主要應(yīng)用是科學(xué)計算、工程模擬和信號處理等以計算為主的領(lǐng)域。目前的MPP系統(tǒng)主要有兩種獲取大規(guī)模并行的不同途徑,包括以Cray T3E系統(tǒng)為代表的無硬件支持的高速緩存一致性的分布式存儲器NCC-NUMA體系結(jié)構(gòu),和以Intel/Sandia ASCI Option Red系統(tǒng)為代表的非遠程存儲訪問的NORMA體系結(jié)構(gòu)。</p><p>  4. 2. 2 當(dāng)代MPP系統(tǒng)的公共體系結(jié)構(gòu)</p&

45、gt;<p>  當(dāng)代MPP系統(tǒng)的公共體系結(jié)構(gòu)如圖所示。</p><p>  所有MPP都使用物理上分布的主存,并且越來越多的MPP使用了分布式I/O。每個節(jié)點有一個或多個處理器和高速緩存(P/C)、一個局部存儲器、有或沒有磁盤。節(jié)點內(nèi)有一個本地互連網(wǎng)絡(luò),連接處理器、主存和I/O設(shè)備。</p><p>  MPP采用如下技術(shù)來提高可擴展性:</p><p&

46、gt;  使用物理上分布式主存的體系結(jié)構(gòu),它比集中式主存體系結(jié)構(gòu)提供了更高的總主存帶寬,因此有潛在的更高可擴展性;</p><p>  平衡的處理能力和主存與I/O能力,若沒有成比例的高速主存和I/O子系統(tǒng),那么數(shù)據(jù)不能以足夠的速度送入處理器,高速處理器就幾乎毫無價值;</p><p>  平衡的計算能力和并行性與交互能力,如無此特征,則進程/線程管理及通信和同步的開銷將是執(zhí)行時間的主要部

47、分。</p><p>  MPP與機群的關(guān)鍵差別在于節(jié)點間的通信。在機群中,節(jié)點通常通過標(biāo)準(zhǔn)局域網(wǎng)相連,而在MPP中,節(jié)點希由高帶寬及低時延的高速專有網(wǎng)絡(luò)互連,同時還提供專有通信軟件,以實現(xiàn)高性能。所有這些使得現(xiàn)有MPP在通信性能上超過機群,然而,由于標(biāo)準(zhǔn)網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,目前無法確定應(yīng)用于MPP的連接技術(shù),在未來多長時間內(nèi)還將繼續(xù)領(lǐng)先于應(yīng)用于機群的網(wǎng)絡(luò)技術(shù)。</p><p>  MPP

48、面臨的主要問題:</p><p>  實際的性能差:MPP實際的可用性能通常遠低于其峰值性能;</p><p>  可編程性差:并行程序的開發(fā)比較困難,串行程序向并行程序的自動轉(zhuǎn)換效果不好,且不同平臺間并行程序的有效移植也有一定的難度。</p><p><b>  4. 3機群</b></p><p>  4 . 3.

49、1機群的概念和特性</p><p>  機群是一組獨立的計算機(節(jié)點)的集合體,節(jié)點間通過高性能的互連網(wǎng)絡(luò)連接;各節(jié)點除了可以作為一個單一的計算資源供交互式用戶使用外,還可以協(xié)同工作,并表現(xiàn)為一個單一的、集中的計算資源,供并行計算任務(wù)使用。機群是一種造價低廉、易于構(gòu)筑、并且具有較好可擴展性的體系結(jié)構(gòu)。</p><p>  機群具有如下重要特征:</p><p>  

50、機群的各節(jié)點都是一個完整的系統(tǒng),節(jié)點可以是工作站,也可以是PC機或SMP機器;</p><p>  互連網(wǎng)絡(luò)通常使用標(biāo)準(zhǔn)局域網(wǎng)絡(luò),如以太網(wǎng)、FDDI、光纖通道等,部分商用機群也采用專用網(wǎng)絡(luò)相連;</p><p>  網(wǎng)絡(luò)接口與節(jié)點的I/O總線松耦合相連;</p><p><b>  各節(jié)點有本地磁盤;</b></p><p&

51、gt;  各節(jié)點有自己完整的操作系統(tǒng)。</p><p>  MPP通常是一種無共享(Shared-Nothing)的體系結(jié)構(gòu),節(jié)點可以有多種硬件構(gòu)成方式,不過大多數(shù)只有主存和處理器。SMP可以認為是一種完全共享(Shared-Everything)的體系結(jié)構(gòu),所有的處理器共享所有可用的全局資源(總線、內(nèi)存和I/O等)。對于機群來說,機群的節(jié)點復(fù)雜度通常比MPP高,因為各機群節(jié)點都有自己的本地磁盤和完整的操作系統(tǒng);

52、MPP的節(jié)點通常沒有磁盤,并且可能只是使用一個微內(nèi)核,而不是一個完整的操作系統(tǒng);SMP服務(wù)器則比一個機群節(jié)點要復(fù)雜,因為它有更多的外設(shè)終端,如終端、打印機和外部RAID等。</p><p>  4. 3. 2 機群的分類</p><p>  根據(jù)不同的分類標(biāo)準(zhǔn),有不同的分類方法。</p><p>  根據(jù)應(yīng)用目標(biāo),可分為高性能機群(High Performance

53、Cluster, HP Cluster)和高可用性機群(High Available Cluster, HA Cluster)</p><p>  根據(jù)節(jié)點擁有情況,可以分為專用機群(Dedicated Cluster)和非專用機群(Nondedicated Cluster)。專用機群中所有的資源是共享的,并行應(yīng)用可以在整個機群上運行;而在非專用機群中,全局應(yīng)用通過竊取CPU時間來獲得運行,非專用機群中由于存在本

54、地用戶和遠地用戶對處理器的競爭,帶來了進程遷移和負載平衡等問題</p><p>  根據(jù)節(jié)點的硬件構(gòu)成,可以分為PC機群(Cluster of PCs, CoPC)、工作站機群(Cluster of workstation, COW)和對稱多處理機SMP機群(Cluster of SMPs, CLUMPs)</p><p>  根據(jù)節(jié)點的操作系統(tǒng),可以分為Linux機群(如Beowulf)

55、、Solaris機群(如Berkeley NOW)、NT機群(如HPVM)、AIX機群(如IBM SP2)</p><p>  根據(jù)節(jié)點的配置,可以分為同構(gòu)機群和異構(gòu)機群。同構(gòu)機群中各節(jié)點有相似的體系,并且使用相同的操作系統(tǒng),而異構(gòu)機群中節(jié)點可以有不同的體系,運行的操作系統(tǒng)也可以不盡相同。</p><p>  4. 3. 3 機群的體系結(jié)構(gòu)</p><p><

56、b>  機群節(jié)點連接方式</b></p><p>  機群節(jié)點有三種連接方式,如下圖所示。 </p><p>  無共享機群,節(jié)點間通過I/O總線連接;共享磁盤的體系常用于注重可用性的商用小規(guī)模及其上,在節(jié)點失效時能由其他節(jié)點承擔(dān)失效節(jié)點的工作;共享存儲器的集群節(jié)點間通過存儲總線連接,由于比前兩種機群難于實現(xiàn),還沒有得到廣泛的應(yīng)用。</p><p>

57、;  機群的理想體系結(jié)構(gòu)如下圖所示:</p><p><b>  五、總結(jié)與展望</b></p><p>  在上一個學(xué)期的《微機原理與接口技術(shù)》的課程中,我們對微機的一些主要的原理技術(shù)進行了學(xué)習(xí)。在學(xué)習(xí)的過程中上我們對微型計算機的各種體系結(jié)構(gòu)和各種技術(shù)有了更深入的認識和了解。這對我們今后進一步的學(xué)習(xí)打下了堅實的理論技術(shù)。而通過本課程的上機實驗,又使我們對本課程中的一

58、些技術(shù)在應(yīng)用層面的認識得到加深。</p><p>  本文作為《微機原理與接口技術(shù)》的課程設(shè)計論文,主要從計算機內(nèi)部的并行處理機制以及計算機間的并行處理機制給予探討。通過在編寫本論文中,不斷的搜集有關(guān)并行技術(shù)的資料以及對這些資料進行歸類總結(jié),是我對并行技術(shù)有了更進一步的認識以及領(lǐng)悟。這對我今后的工作有很大的幫助。</p><p>  現(xiàn)今比較流行的物聯(lián)網(wǎng)技術(shù)中,少不了對并行技術(shù)的應(yīng)用。在整

59、個物聯(lián)網(wǎng)的系統(tǒng)中,各個應(yīng)用的實現(xiàn)大多數(shù)是要實現(xiàn)實時響應(yīng)的,這些應(yīng)用中可能會同時要求系統(tǒng)對請求給予響應(yīng)。在此處,我們就可以看到了并行處理在此處應(yīng)用的好處,它可以使系統(tǒng)能夠同時對進程進行響應(yīng)。</p><p>  最后,感謝xx老師的課程講授以及輔導(dǎo)!</p><p><b>  六、參考資料</b></p><p>  陳國良等著,《并行計算機體

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論