本科生畢業(yè)論文cache(高速緩存)與主存一致性

上傳人：奔*** IP屬地：河北更新時間：2024-03-01 格式：doc 頁數：22 大小：222.00KB 人氣指數：12 舉報 版權申訴

已閱讀1頁，還剩21頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

1、　　本科生畢業(yè)論文(設計)　　Cache(高速緩存)與主存一致性初探　　2012年3月25日　院系名稱信息工程系　姓　　名姓名　學　　號2008341142　專

2、　業(yè)計算機科學與技術專業(yè)　指導教師導師教授　　摘　要　　存儲器是具有“記憶”功能的部件，它在計算機系統(tǒng)中占有十分重要的地位。存儲器的基本功能是存放以二進制形式表示的程序與數據。如何設計容量大、速度快且造價低的存儲器，一直是計算機發(fā)展中的關鍵問題，目前還沒有哪一種存儲器功能

3、完全滿足計算機系統(tǒng)對存儲器的需求。因此，計算機系統(tǒng)通常配備分層結構的存儲系統(tǒng)，以滿足容量、速度和造價等方面的要求。　　衡量存儲器有三個指標：容量、速度和價格/位。一般地說，速度高的存儲器，每位價格也高，因此容量不能太大。所以存儲器設計的約束有容量、速度和價格。容量似乎沒有限制，不管容量多大，總要開發(fā)出應用程序來使用。為了獲得更好的性能，存儲器的速度必須能夠跟上CPU，即當CPU執(zhí)行指令時，不想讓

4、他停下來等待指令或操作數。價格問題也必須考慮，對于實用的系統(tǒng)，存儲器的價格必須相對于其他部件是合理的。因此三個指標之間需要進行權衡。　　高速緩存系統(tǒng)中能否確保高速緩沖存儲器和主存內容一致性，這個問題直接關系到整個計算機系統(tǒng)的性能。這兩部分的數據一致性問題產生的原因有二：其一，由于CPU對高速緩沖存儲器的寫入導致它的內容更新而主存內容陳舊；其二，由于I/O處理機或多處理機系統(tǒng)中某一處理機修改了主存

5、內容導致高速緩沖存儲器內容陳舊。針對不同原因，分析了寫策略中七種解決方案，并就高速緩存系統(tǒng)采用的第二級脫片高速緩沖存儲器，以及第三級脫片高速緩沖存儲器結構數據一致性問題進行初步探討。　　本文通過對存儲器系統(tǒng)Cache（高速緩存）與主存的概念進行描述和目前兩者之間一致性存在的一些問題進行研究。并分析在多處理機系統(tǒng)中，主存與各處理機私有Cache之間及各私有Cache之間存在的數據不一致性。對解決不

6、一致性的方法：監(jiān)聽總線協議、基于目錄的Cache一致性協議、軟件控制方法等進行詳細的定性分析，并指出各種方法的優(yōu)缺點，供設計者參考；同時提出軟件和硬件相結合的方法，能有效解決Cache的一致性問題。　　關鍵詞：存儲器；主存；緩存；一致性　　Abstract　　Memory i

7、s a " memory " function components , it in a computer system occupies a very important position . The basic function of memory is stored in binary form of said programs and data . How to design capacity ,

8、 speed is quick and low cost of memory , is always the key problems in the development of the computer , there is no memory function fully meet the needs of the memory of a computer system. Therefore, the computer

9、system usually equipped with a layered structure of storage sy　　Measure memory has three index : capacity , speed and price/a. Generally speaking , the high speed of memory, every price is high , th

10、erefore capacity can not be too big . So memory design constraints capacity , speed and price . There seems to be no limit capacity , no matter how much capacity , the total to develop applications to use . In orde

11、r to obtain the better performance, the speed of the memory must be able to keep up with the CPU,and that is when the CPU executing instruct　　Cache system can ensure cache memory and main m

12、emory contents consistency , the directly related to the entire computer system performance . The two parts of the data consistency issues of two reasons : first , because of the CPU cache memory write

13、 led to its contents to update the memory and out-of-date contents ; Second , because of I/O processor or multi-processor systems of a processor modified the main memory contents lead to cache content obsolete .

14、Accordin　　This article through to the memory system Cache ( Cache ) and the concept of main storage describe between consistency and at present there are some problems. And analysis in multi

15、processor system , main memory with the processor Cache between the private and private Cache of inconsistency between data. To solve the inconsistency method: surveillance bus agreement, the Cache directory bas

16、ed on consistency agreement, software control method of detailed qualitative analysis , 　　Key Words: Memory , The main memory , Cache , The consistency　　目　錄

17、　　1 引　言1　　2 研究的背景和意義2　　2.1 研究的背景2　　2.1.1 主-輔存存儲層次2　　2.1.2 Cache-主存存儲層次3

18、;　　2.1.3 存儲器分層結構3　　2.2 研究的意義5　　3 數據一致性問題的提出7　　4 基于不同原因的寫策略解決方案9　　4.1 基于原因1的解決辦法9　　4.1.1 寫直達9<p

19、>　　4.1.2 寫回發(fā)9　　4.2 基于原因2的解決辦法9　　4.2.1 總線監(jiān)視法9　　4.2.2 硬件監(jiān)視法10　　4.2.3 劃出不可高速緩存存儲區(qū)法10　　4.2.4 Cache清除法10</p&

20、gt;　　4.3 基于原因3的解決辦法10　　4.4 基于目錄的Cache一致性協議10　　5 數據一致性問題的發(fā)展與展望13　　6 結束語15　　參考文獻16&l

21、t;/p>　　致謝18　　1 引　言　　高速緩沖存儲器是存在于主存與CPU之間的一級存儲器，由靜態(tài)存儲芯片(SRAM)組成，容量比較小但速度比主存高得多，接近于CPU的速度。在計算機存儲系統(tǒng)的層次結構中，是介于中央處理器和主存儲器之間的高速小

22、容量存儲器。它和主存儲器一起構成一級的存儲器。高速緩沖存儲器和主存儲器之間信息的調度和傳送是由硬件自動進行的。　　高速緩沖存儲器的容量一般只有主存儲器的幾百分之一，但它的存取速度能與中央處理器相匹配。根據程序局部性原理，正在使用的主存儲器某一單元鄰近的那些單元將被用到的可能性很大。因而，當中央處理器存取主存儲器某一單元時，計算機硬件就自動地將包括該單元在內的那一組單元內容調入高速緩沖存儲器，中央

23、處理器即將存取的主存儲器單元很可能就在剛剛調入到高速緩沖存儲器的那一組單元內。于是，中央處理器就可以直接對高速緩沖存儲器進行存取。在整個處理過程中，如果中央處理器絕大多數存取主存儲器的操作能為存取高速緩沖存儲器所代替，計算機系統(tǒng)處理速度就能顯著提高。　　當然，計算機存儲系統(tǒng)中，高速緩沖存儲器系統(tǒng)的引入雖然為計算機系統(tǒng)處理數據的速度帶來了顯著地提高，但是隨之而來的Cache（高速緩存）與主存間數據

24、一致性問題也是日益凸顯出來。　　存儲器中的一致性問題，是伴隨著存儲器結構的概念而提出的，又一直是困擾著計算機設計者的一個重要問題，也是很多從事計算機體系結構研究的人們所共同面對的一個熱門研究課題。特別是近年來出現的多處理系統(tǒng)，超并行機系統(tǒng)，超大規(guī)模計算機系統(tǒng)等采用DSM（Distributed Shared Memory）-分布式共享存儲器技術的大型系統(tǒng)中，都采用了多級Cache的存儲器層次結構

25、。在Cache的數據一致性問題上，就更顯突出了。如在DSM多處理機系統(tǒng)結構中，相鄰層之間和同一層之內可能會出現數據不一致性。通過存儲器的共享數據，進程在同一算法下并行工作。為了減少內存訪問延時和內存總線的擁塞，要求Cache與每個處理器相關。這樣同一數據在不同的Cache中有多個副本。當處理機對共享存儲器某個單元在其本地Cache中的拷貝要進行維護時，只要對該單元的本地拷貝進行修改，這就有可能引起存儲器的全局不一致性等等。所以如何在維護

26、一致性情況下又保證處理機代價最小是這本論文討論的主要問題。　　本文將在對計算機存儲系統(tǒng)存儲進行介紹的前提下，對高速緩存系統(tǒng)中Cache（高速緩存）與主存這兩部分的數據一致性問題產生的各種原因進行充分的分析和研究，并針對不同的原因，給予適當各種維護策略下的保證一致性的可行方案。　　2 研究的背景和意義<b&g

27、t;　　2.1 研究的背景　　存儲器是具有“記憶”功能的部件，它在計算機系統(tǒng)中占有十分重要的地位。存儲器的基本功能是存放以二進制形式表示的程序與數據。如何設計容量大、速度快且造價低的存儲器，一直是計算機發(fā)展中的關鍵問題，目前還沒有哪一種存儲器功能完全滿足計算機系統(tǒng)對存儲器的需求。因此，計算機系統(tǒng)通常配備分層結構的存儲系統(tǒng)，以滿足容量、速度和造價等方面的要求。

28、;　　衡量存儲器有三個指標：容量、速度和價格/位。一般地說，速度高的存儲器，每位價格也高，因此容量不能太大。所以存儲器設計的約束有容量、速度和價格。容量似乎沒有限制，不管容量多大，總要開發(fā)出應用程序來使用。為了獲得更好的性能，存儲器的速度必須能夠跟上CPU，即當CPU執(zhí)行指令時，不想讓他停下來等待指令或操作數。價格問題也必須考慮，對于實用的系統(tǒng)，存儲器的價格必須相對于其他部件是合理的。因此三個指標之間需要進行權衡。

29、　　2.1.1 主-輔存存儲層次　　由于計算機主存容量相對于程序員所需要的容量來說總是太小，程序與數據從輔存調入主存是由程序員自己安排的，程序員必須花費很大精力和時間把大程序預先分成塊，確定好這些程序塊在輔存中的位置和裝入主存的地址，而且還要預先安排好程序運行時各塊如何和何時調入調出，因此存在存儲空間的分配問題。操作系統(tǒng)的形成和發(fā)展使得程序員盡可能擺脫主

30、、輔存之間的地址定位，同時形成了支持這些功能的“輔助硬件”，通過軟件、硬件的結合，把主存和輔存統(tǒng)一成了一個整體，如圖2-1所示。這時，由主存、輔存形成了一個存儲層次，即存儲系統(tǒng)。從整體看，其速度接近于主存的速度，其容量則接近于輔存的容量，而每位的平均價格也接近于廉價的慢速的輔存平均價格。這種系統(tǒng)不斷發(fā)展和完善，就逐步形成了現在廣泛使用的虛擬存儲系統(tǒng)。在系統(tǒng)中，應用程序員可用機器指令地址碼對整個程序統(tǒng)一編址，如同程序員具有對應這個地址碼寬

31、度的全部虛存空間一樣。該空間可以比主存實際空間大得多，以致可以存得下整個程序。這種指令地址碼稱為虛地址（虛存地址、虛擬地址）或邏輯地址，其對應的存儲容量稱為虛存容量或虛存空間；而把實際主存的地址稱為物理地址、實（存）地址，其對應的存儲容量稱　　圖2-1 主-輔存存儲層次　　2.1.2 CACHE-主存存儲層次

32、當用虛地址訪問主存時，機器自動地把它經輔助軟件、硬件變換成主存實地址。察看這個地址所對應的單元內容是否已經裝入主存，如果在主存就進行訪問，如果不在主存內就經輔助軟件、硬件把它所在的那塊程序和數據由輔存調入主存，而后進行訪問。這些操作都不必由程序員來安排，也就是說，對應用程員員是透明的。　　主-輔存層次解決了存儲器大容量要求和低成本之間的矛盾。　　在速度方

33、面，計算機的主存和CPU直保持了大約一個數量級的差距。顯然這個差距限制了CPU速度潛力的發(fā)揮。為了彌合這個差距，僅采用一種工藝的單一存儲器是行不通的，必須進一步從計算機系統(tǒng)結構和組織上去研究。設置高速緩沖存儲器（Cache）是解決存取速度的重要方法。在CPU和主存中間設置高速緩沖存儲器，構成高速緩存（Cache）-主存層次，要求Cache在速度上能跟得上CPU的要求。Cache-主存間的地址映象和調度吸取了比它較早出現的主-輔存存儲層次

34、的技術，不同的是因其速度要求高，不是由軟、硬件結合而完全由硬件來實現，如圖2-2所示。　　圖2-2 Cache-主存存儲層次　　2.1.3 存儲器分層結構　　從CPU的角度看，Cache-主存層次的速度接近于Cache，容量與每位價格接近于主存，因此，解決了速度與成本之間的矛盾。<p

35、>　　綜上所述，計算機的存儲系統(tǒng)是采用了存儲器的分層結構，而不只是依賴單一的存儲部件或技術。圖2-3給出了一個通用分層結構，圖中從上到下出現情況如下：　　1>每位的價格降低；　　2>容量增大；　　3>存取時間增大；

36、　　4>CPU存取存儲器的頻度降低。　　圖2-3 存儲器分層結構　　因此，較小、較貴、較快的存儲器可作為較大、較便宜、較慢的存儲器的補充。這個結構成功的關鍵是最后一項，即存取頻度降低。　　如果能夠根據以上的1>到3>項來組織存儲器，而且數據和指令能夠根據

37、4>分布在存儲器中，很顯然，這個方案在保證給定的性能水平的情況下能降低總體價格。下面用一個簡單的例子來說明這一點。　　假設CPU能夠存取二級的存儲器，第1級包含1000個字并有1微秒的存取時間，第2級包含1000000個字并有10微秒的存取時間。假設要存取的一個字在第1級，那么CPU能直接存取它；假設它在第2級，則這個字首先傳到第1級，然后再由CPU存取它。為了簡化，不考慮CPU確定這個字

38、在第1級還是在第2級所需的時間。圖2-4表示了平均總存取時間和在第1級中存取字所需的時間占總的百分比的函數關系。可見，第1級存取百分比高時，平均總的存取時間接近于第1級的存取時間。此例說明了這種策略工作的原理。如果條件1>到4>都滿足，則它能工作。　　圖2-4 簡單的兩級存儲性能　　條件4>有效的基礎是訪問局部性原理。在程序執(zhí)行過程中，

39、處理器訪問存儲器中的指令和數據傾向于成塊進行。程序通常包含許多迭代循環(huán)的子程序，一旦進入了一個循環(huán)或子程序，則需重復訪問一小組指令。同樣，對于表和數組的操作，包含存取一塊塊的數據字。在一長段時間內，使用的塊是變化的，而在一小段時間內，處理器主要訪問存儲器中的固定塊。　　因此，通過分層結構組織數據，有可能使存取較低層的存取時間百分比低于存取高層的百分比。根據上面給出的二級例子，讓第2級的存儲器包含

40、所有程序的指令和數據，當前的塊臨時放在第1級，第1級某些塊回不時地交換回第2級。然而，多數是對第1級中的指令和數據的訪問。　　這個原理可以應用到兩級以上的存儲器?？紤]如圖2-3所示的分層結構，最快、最小和最貴的存儲器是處理器的內部存儲器。通常一個處理器包含幾十個寄存器，雖然有些機器包含幾百個寄存器。向下跳二層是主存儲器。主存儲器通常用一個速度更快、容量更小的高速緩存來擴充。高速緩存是透明的，它在

41、主存和處理器寄存器之間傳送數據以提高性能。　　2.2 研究的意義　　高速緩沖存儲器是存在于主存與CPU之間的一級存儲器，由靜態(tài)存儲芯片(SRAM)組成，容量比較小但速度比主存高得多，接近于CPU的速度。在計算機存儲系統(tǒng)的層次結構中，介于中央處理器和主存儲器之間的高速小容量存儲器。它和主存儲器一起構成一級的存儲器。

42、高速緩沖存儲器和主存儲器之間信息的調度和傳送是由硬件自動進行的。　　高速緩沖存儲器的容量一般只有主存儲器的幾百分之一，但它的存取速度能與中央處理器相匹配。根據程序局部性原理，正在使用的主存儲器某一單元鄰近的那些單元將被用到的可能性很大。因而，當中央處理器存取主存儲器某一單元時，計算機硬件就自動地將包括該單元在內的那一組單元內容調入高速緩沖存儲器，中央處理器即將存取的主存儲器單元很可能就在剛剛調入

43、到高速緩沖存儲器的那一組單元內。于是，中央處理器就可以直接對高速緩沖存儲器進行存取。在整個處理過程中，如果中央處理器絕大多數存取主存儲器的操作能為存取高速緩沖存儲器所代替，計算機系統(tǒng)處理速度就能顯著提高。　　在由主存和高速緩存組成的存儲器層次結構中，主存是多處理機共享，而高速緩存是每個處理機私有的。主存和高速緩存都以塊為單位進行劃分，以映射的方式來檢索。映射的方法有直接映射、組關聯映射、區(qū)段關聯

44、映射和全相聯映射。在主存和高速緩存之間，是以塊為單位進行搬送。主存中保存有各高速緩存的副本，高速緩存的目錄中，存放相應主存的塊號及一些標志。通過對目錄的檢索來尋找高速緩存中的數據。當處理機發(fā)出一個訪問主存地址時，如果包含這個地址在內的模塊在高速緩存中，則稱之為命中，該高速緩存可以使用。如果不在高速緩存中，則稱之為未命中（或Cache失效），這時，必須把這個模塊從主存搬到高速緩存中，叫做塊搬送。如果高速緩存已滿，則必須按一定的置換算法挑出

45、一個模塊搬出高速緩存到主存，這叫置換。置換算法有FIFO算法，URL算法等。　　計算機高速緩存系統(tǒng)的發(fā)展為計算機設計者提出了一個重要課題：數據在Cache（高速緩沖存儲器）和主存之間交換時必須滿足數據一致的要求，隨著多任務系統(tǒng)的采用，數據一致性問題越來越突出，以往關于這方面的著述具有了很大的局限性，例如，對于486以上機種出現的第二級托片Cache、第三級托片Cache如何保存數據一致的問題尚未

46、見于專門的論述。為了探索更適合于當前計算機發(fā)展的趨勢，必須適時追溯數據一致性問題出現和發(fā)展的歷史軌跡，步入多任務系統(tǒng)的解決方案。　　因此高速緩存系統(tǒng)中能否確保高速緩沖存儲器和主存內容一致性，這個問題直接關系到整個計算機系統(tǒng)的性能。對于計算機整體性能的提升有十分重要的意義。　　3 數據一致性問題的提出　　高速緩存是

47、旨在改善存儲器平均響應時間的小型快速存儲器，它在系統(tǒng)中位于微處理器和主存之間，使得系統(tǒng)從CPU看具有Cache的速度，主存的容量。圖3-1為一高速緩沖存儲器系統(tǒng)框圖，它將微處理器頻繁向主存請求的代碼和數據予以拷貝。　　圖3-1 高速緩存框圖　　Cachc的操作與存儲器一樣具有讀/寫兩種模式，其中讀操作主要局限在不命中時更新Cache內容，只影響存儲系統(tǒng)工

48、作速度。寫操作不僅工作時間比讀操作長，而且更新主存內容，直接影響機器性能，據李學干、蘇東莊在《計算機系統(tǒng)結構》一書中借典型程序的統(tǒng)計可知，所有訪存中約有10%~34%甚至更多的是寫操作。寫操作是直接導致數據一致性問題產生的原因。　　在一個系統(tǒng)中，同一個數據的多個拷貝可以同時存在，如果一個拷貝改變了而其它的沒變，那么兩組不同的數據便與主存的同一地址有關。Cache必須包含一個更新系統(tǒng)以防止老數據(

49、陳舊數據)被使用，即解決一致性問題。分析產生數據一致性問題的原因主要有三個：　　1> 同樣一個數據可能既存于Cache中，也存于主存中，這樣可能前者己更新，后者未更新，造成數據丟失。　　2> 在有DMA系統(tǒng)或多處理器系統(tǒng)中，有多個部件可以訪問主存，這時可能其中有些部件是直接訪問主存，也可能每個DMA部件和每個處理器配一個Cache，這樣主存的

50、一塊區(qū)域可能對應于多個Cache中的各1個塊區(qū)，產生主存中的數據被某個總線主控部件更新過，而某個Cache中的內容未更新，造成Cache中數據過時。　　3> 當主存中同時有多道程序運行時，Cache中均有相應的數據副本與每道程序相對應；對于共享數據，每道程序都有各自的Cache數據與主存數據相一致。當某道更新了其相應的Cache數據和主存數據，而其它程序的Cache數據也有此頁內容.則其內

51、容不會改變(例如寫直達法約束)。這道程序再次讀到的內容就會因是原先的內容而出錯。　　寫策略是Cache使用的保證數據一致性的方法，保持系統(tǒng)主存更新，處理陳舊數據。　　高速緩存一致性是指要求同一個信息項與后繼存儲器層次上的副本是一致的。如果在高速緩存中的一個字被修改過，那么在所有更高層上該字的副本也必須立即或最后加以修改。對于多處理機系統(tǒng)的存儲器層次結構，

52、相鄰層之間和同層之間可能會出現數據不一致性。比如某個處理機修改了該處理機的Cache的某個數據，則該數據塊可能在別的處理機上有相同的拷貝，由于該數據塊得到了最新的修改，所以如果其它相同的拷貝不及時得到修改的話，被其它處理機訪問以后，可能出現錯誤。這也就是所謂的Cache不一致性。我們用圖3-2一致性定義圖來直觀的表示：　　圖3-2 一致性定義圖　　但是這

53、種只對本地拷貝進行修改的方法就可能導致存儲器的全局不一致性，也就是這些拷貝并不一致。如何能夠讓處理器訪問不會出錯，并且維護一致性的代價最小是研究高速緩存一致性和同步機制的主要研究課題。　　4 基于不同原因的寫策略解決方案　　4.1 基于原因1的解決辦法　　原因1導致的數據一致性問題是建立在Cache內容與主存內容

54、一一對應基礎上，不能相關更新造成的數據丟失，解決方法首先解決Cache與主存的相關動作。　　4.1.1 寫直達　　它利用Cache-主存貯層次在處理機和主存之間的直接通路，每當處理機寫入Cache的同時，也通過此通路直接寫入主存。從而主存隨時跟蹤Cache的最新版本，也就不會有主存將數據丟失的問題但缺點也顯而易見，它

55、把開銷花費在每次寫Cache時就有對主存的寫入，造成總線活動繁忙。　　4.1.2 寫回發(fā)　　這種方法是在CPU執(zhí)行寫操作時，信息只寫入Cache，僅當需要被替換時，才將已被寫入過的Cache塊先送回主存，然后再調入新塊。Cache-主存的地址映象表中需對Cache中每個塊設置一個“修改位”，作為該塊裝入Cache后是

56、否被修改過的標志，只要修改過，就使該標志位置成“1”。它的開銷花在每次需要替換時，增加了Cache的復雜性。　　以上兩種解決方法的采用沒有嚴格約束，從可靠性講寫直達法優(yōu)于寫回法，Cache出錯時可由主存來糾錯。而寫回法因有效塊只在Cache中，故需在Cache中采用糾錯碼，增力了冗余信息；從成本上講，寫回法低于寫直達法，寫直達法要花費大量緩沖器和其它輔助邏輯。所以方法的采用主要山應用場合決定，單

57、處理機系統(tǒng)以節(jié)省成本為主，多采用寫直達法。對共享主存的多處理系統(tǒng)，以可靠性為主，多采用寫直達法。　　4.2 基于原因2的解決辦法　　原因2是由于主存區(qū)塊更新而Cache未更新產生的數據過時錯誤，解決方法應首重主存內容的約束。　　4.2.1 總線監(jiān)視法　　在這種方法中，由C

58、ache控制器隨時監(jiān)視系統(tǒng)的地址總線，如其它部件將數據寫到主存，并且寫入的主存區(qū)塊正好是Cache中的區(qū)塊對應的位置，那么Cache控制器會自動將Cache中的區(qū)塊標為“無效”。　　4.2.2 硬件監(jiān)視法　　如果把主存映象到Cache的區(qū)塊稱為已映象區(qū)塊，硬件監(jiān)視法就是通過外加硬件電路，使Cache本身能觀察到主存中已映象區(qū)塊的所有存取操作。解決辦法是所

59、有部件對主存的存取都通過同一個Cache完成或每個部件配備各自的Cache，當一個Cache有寫操作時，新數據既拷貝到主存，也拷貝到其它Cache(播寫法)。　　4.2.3 劃出不可高速緩存存儲區(qū)法　　這種方法是控制某些共享信息(如信號燈或作業(yè)隊等)不得進入Cache。即要在主存中劃出一個區(qū)域作為各部件共享區(qū)，CPU對此區(qū)域的訪問必須是直接的，避免了主存

60、中1個區(qū)塊映象到多個Cache。的情況。　　4.2.4 CACHE清除法　　這種方法是將Cache中所有己更新的數據寫回到主存時，由專用硬件自動地將Cache內對應此區(qū)域的副本作廢，或清除Cache中的所有數據，使Cache內容取決于內存內容的變動，保持Cache的透明性。　　當然以上幾種方法并不是全部解決措施，

61、還有目錄表法等應用。無論何利，萬法，本質上的要求都是透明性要求，視具體應用場合采取適當措施。　　4.3 基于原因3的解決辦法　　原因3本質上是原因2的補充，前述解決了Cache數據過時引起數據不一致的問題，而對于多任務系統(tǒng)仍存在著主存內容過時引起的數據不一致性。只寫存儲器方式就是這樣的一種解決方案。　　在這種方式

62、中，進行寫操作時，把數據只寫入到主存儲器的對應位置上，同時通過查頁表，如果發(fā)現Cache中有與主存被修改頁面相同的頁號，則清除Cache中對應數據的有效位，即使某頁作廢。這樣在下次進行此頁數據的讀操作時，由于Cache中對應的有效位無效，處于不命中狀態(tài)，CPU肯定要從主存儲器讀寫數據，同時把數據交換進Cache中，保證了數據的一致性。　　4.4 基于目錄的CACHE一致性協議

63、　　基于目錄的協議用于網絡連接的處理機系統(tǒng)。當某臺處理機采用寫無效協議正在更新一個變量并且其他的處理機也試圖讀該變量時，則會發(fā)生讀缺失并可能導致總線的流量大大增加。另外，寫更新協議可以更新遠程高速緩存中的數據，而其他處理機可能永遠也不會使用這些數據。因此，這些問題使采用總線來構造大型多處理機系統(tǒng)受到限制。當用多級網絡來構造有數百臺處理機的大型系統(tǒng)時，就必須修改高速緩存的監(jiān)聽協議以適應網絡的性能。由于在多級網絡上實現

64、廣播功能的代價很大，所以把一致性命令只發(fā)給存放塊拷貝的高速緩存。這樣就產生了用于網絡連接的多處理機系統(tǒng)的基于目錄的協議。　　由共享存儲器的控制器來管理狀態(tài)信息，當需要維持數據一致時，檢索這些狀態(tài)，直接使有關的Cache中的模塊無效化，并在共享主存中建立一個目錄，就叫目錄法。　　在多級網絡中，用高速緩存目錄存放有關高速緩存塊拷貝駐留在哪里的信息，從而支持高

65、速緩存一致性。各種基于目錄協議的不同之處主要是目錄如何維護信息和存放什么信息。Tang（1976）提出了第一個目錄方案，用一個中心目錄存放所有高速緩存目錄的拷貝。中心目錄能提供為保證一致性所需要的所有信息。因此，它的容量非常大而且必須采用聯想方法來檢索，這和單個高速緩存的目錄類似。在大型處理機系統(tǒng)采用中心目錄將存在出現沖突和檢索時間長兩個缺點。　　Censier和Feautrier（1978）提

66、出分布式目錄方案。每個存儲器模塊維護各自的目錄，目錄中記錄著每個存儲塊的狀態(tài)和當前的信息。狀態(tài)信息是本地的，但當前的信息指明哪些高速緩存才有該存儲器塊的拷貝。不用廣播的高速緩存一致性協議必須將所有高速緩存中每個共享數據塊拷貝的地址存儲起來。這張高速緩存地址表，不管它是集中的還是分布的，都稱為高速緩存目錄。每個數據塊的目錄項包含大量的指針，用來指明塊拷貝的地址。每個目錄項還包含一個重寫位，用來說明高速緩存允許把有關的數據塊寫入。</

67、p>　　不同類型的目錄協議可分為三類：全映射（full-map）目錄、有限（limited）目錄和鏈式（chained）目錄。全映射目錄存放與全局存儲器中每個塊有關的數據。這樣，系統(tǒng)中的每個高速緩存可以同時存儲任何數據塊的拷貝，即每個目錄項包含N個指針，N是系統(tǒng)中處理機的數目。　　有限目錄與全映射目錄不同之處是不管系統(tǒng)規(guī)模有多大，它的每個目錄項含有固定數目的指針。鏈式

68、目錄將目錄分布都各個高速緩存，其余與全映射目錄相同。對三種高速緩存目錄的討論詳見Chaiken，Fields，Kwihara和Agarwal（1990）文獻。　　4.5軟件控制法　　軟件解決Cache數據一致性問題的方法是以通過編譯進行事先分析的辦法為主流。最簡單的方法是：可寫的共享數據都不放在Cache中，但這樣對

69、很多數據來講，就失去了Cache的意義。隨著編譯分析技術的發(fā)展，把程序分成計算單位，每個參數上都附上Cache可與Cache不可的標志。編譯識別這些標志，再給模塊附上狀態(tài)，由硬件來檢查這些狀態(tài)，進行一致性處理。但這種方法給用戶和編譯帶來麻煩。另外還有循環(huán)分割法等，這些方法都是使Cache整體無效化，但有效的數據也全被無效了。于是又提出只把的確要無效化的模塊（或參數）無效化。把每一個參數的層次進一步細分為Post（寫回），Invalida

70、te（無效化）和Flush（兩方）等的Cache控制，與寫回Cache控制組合起來，進行更細的控制。還有采用通過編譯來分析共享存儲器的讀信息，注意這時Cache中的數據的有效性，分別判斷是從Cache中讀出，還是從共享主存中讀出。這種方法是用硬件來幫助由編譯分析不出來的地方。這樣一來，使用Cache中的數據的機會就增多了。同樣為幫助編譯進行分析，而給每個參數都帶上新編號，運行時對此進行管理，也需要復雜的硬件開銷。除了編譯</p&g

71、t;　　5 數據一致性問題的發(fā)展與展望　　隨著計算機吞吐能力的增強，單靠在CPU與主存之間增加一級Cache已遠遠滿足不了工作需要，從486機種開始出現了二級Cache結構，即第一級Cache與CPU集成在一起成為在片Cache，另外單獨在中央處理器與主存之間增加第二級脫片Cache，而目前已發(fā)展到三級Cache結構，將第一、二級Cache均集成在中央處理器內，另增設第三級

72、脫片Cache，從而數據一致性問題又有了新的發(fā)展.這二級(三級)Cache與主存之間如何保持數據的協調一致呢？　　1> 穿透LOOK THROUGH；　　2> 旁視LOOK ASIDE　　穿透結構的優(yōu)點是減少對DRAM系統(tǒng)主存的請求數目，只有在Cache未命中情況下，來自微處理器的存諸器請求才從Cac

73、he送往主存；旁視結構的優(yōu)點是來自微處理器的存儲器請求同時送到Cache與主存，訪問時微處理器若在Cache中命中則訪問Caehe，同時取消送往主存的存儲器請求，若未命中，那么Cache便不工作，由系統(tǒng)主存完成該存儲器請求。如圖3-3 Cache讀結構。　　圖3-3 Cache讀結構　　這兩種Cache讀結構其實也就是Cache的組織結構，可做如下設想：

74、二級Cache結構中第一級Cache。采用穿透結構，規(guī)模增大，采用交叉與多口結構聯系第二級Cache與主存，配置超級流水線和預取支持。第二級Cache采用旁視結構，容量有限制增長，負責對第一級Cache的預取操作，實質上數據一致性問題即成為第二級Cache與主存之間的問題了，解決辦法就可借用前文提到的各種辦法：三級Cache結構將第二級Cache也移入CPU，出現第三級脫片Cache，當微處理從第二級Cache仍取不到數據時，由第三級脫

75、片Cache的預取操作彌補二級Cache結構中第一級Cache直接從主存提取的操作，以提高效率，故第一級Cache仍采用穿透結構，第二、三級Cache均采用旁視結構，到第三級的預取仍不能滿足命中時才與主存交換信息，這樣數據一致性問題成了第二、三級Cache與主存之間的問題了，而第二、三級Cache結構完全一致，動作很容易協調，所以我們可以把它們看作一個整體。數據一致性問題的解決仍是借助前文論述的各種方法加以實現。

76、　　6 結束語　　隨著半導體技術、通訊技術等計算機相關技術的發(fā)展，存儲系統(tǒng)的發(fā)展呈現出了新的層次結構和典型的金字塔模型?，F今有關處理器內部的高速緩存的層次結構的前沿研究，主要集中在最后一級高速緩存的有效利用上。同時，多核技術帶來了計算機性能的飛速提升，為計算機的存儲結構帶來了許多的機遇和挑戰(zhàn)，也為程序的快速運行提供了更多的途徑和可能。<

77、;/p>　　通過以上的分析可以看出：用硬件的方法不影響編譯和用戶程序，也不必意識到Cache的存在。但硬件變復雜了，同時要增加通信開銷和時間延遲。軟件的辦法，編譯負擔太重。由于程序的不確定性，分析的保守性，會造成不必要的Cache不命中。如果硬件變得簡單些，各處理機可以單單進行無效化，通信開銷就可大大減小了。還可以不依賴處理機臺數和通信方式。而在硬件方法中，總線型多機系統(tǒng)用監(jiān)視法好，而交叉開關和多級互連網絡的

78、多機系統(tǒng)中，還是目錄法好。到底作何取舍，每個設計者將根據自身的需求做一個合適的選擇。軟件和硬件相結合的方法，可能是解決Cache不一致性問題的更有效的方法。　　目前，關于Cache一致性的研究還在繼續(xù)，主要方向有三個。一是如何實現這些維護一致性的方法，因為一些方法迄今為止還停留在建議的階段，要評價它們必須在實際實現中才是有效的。二是由于并行處理領域還不成熟，大型多處理機的實際應用還很少，難以在實

79、際情況下評價這些方法。三是多處理機Cache的設計空間很大，而且涉及復雜的平橫。　　高速緩存系統(tǒng)數據一致性問題是基于透明性要求產生的。隨著計算機系統(tǒng)結構的發(fā)展，Cache經歷了一級、二級、三級多次變革，每一次都帶來了新的問題，但解決方案的核心仍是寫策略，圍繞Cache與主存一致動作，及時更新Cache中過時數據和及時更新主存中過時數據三個方向發(fā)展。由于輔助硬件的使用寫策略也可以影響系統(tǒng)的性能，所

80、以高速緩存寫策略應本著以下三個目標加以采用：　　(1)維持存儲器的相關性。　　(2)令微處理器存儲在寫主存上的等待態(tài)數目最少。　　(3)令存儲器寫周期數最少。　　當然，由于此課題本身較難，資料有限，再加上條件和自身水平的限制，而且本人學習存儲器系統(tǒng)一致性問題的時間也不是太

81、長，所以本文所講述的內容還不能說是一個完整的體系。本文只是就此問題的提出、發(fā)展、以及解決方案和展望進行了初步探討，很多方面還需要進一步完善。因此今后還需要在存儲器系統(tǒng)一致性方面繼續(xù)學習，以便更好的進行研究。　　參考文獻　　[1] Guang R Gao，Vivek Sarkar. Location Consisten

82、cy–A New Memory Model and Cache Consistency Protocol[J].IEEE Transactions on Computer,2000,49(8). 　　[2] CWallace，GTremblay，JNAmaral. The Location Consistency memory modeland cache protocol: Specicati

83、on and verication [C]. Technical Report 01-01,ComputerScienceDepartment,MichiganTechnological University.2001.17.　　[3] Stenstrom. A Survey of CacheCoherenceSchemes for Multiprocessors[J].IEEE Compute

84、r,1990,23(6):12-24.　　[4] TomMiller.Managed DirectX(r)9 KickStart:Graphics and Game Programming.　　[5] RSimoni,MHorowitz.DynamicPointer Allocationfor Scalable Cache Coherhence Dire

85、ctories[J].Pro of Intl Sympon Shared Memory Multiprocessing(ISSMM), Tokyo,1991,72-81.　　[6] David Mosberger. Memory consistency models[J]. Operating Systems Review, 1993,7(1):18-26.<p&g

86、t;　　[7] Andrew S Tanenbaum.分布式操作系統(tǒng)[M].陸麗娜，等，校譯.北京：電子工業(yè)出版社，1999.　　[8] 齊家月.CACHE結構設計.微型機與應用，1995,(4).　　[9] 戴梅，史嘉權.高速緩存系統(tǒng)的組成結構和數據一致性問題的解決.微型機與應用，1997，（3）.　　[10]

87、劉永軍.CACHE寫入方法的一點補充.中國電腦報，1998-01-21 .　　[11] 薛勝軍.計算機組成原理[M].武漢：華中科技大學出版社，2000.　　[12] 白中英.計算機組成原理[M].北京：科學版社，2001.　　[13] 尹朝慶.計算機組成原理[M].武漢：華中科技大學出版社，2000. <

88、;/p>　　[14] 唐塑飛.計算機組成原理[M].北京：高等教育出版社，2000.　　[15] 壟沛曾，陸慰民，楊志強編.《Visual Basic 程序設計簡明教程》.高等教育出版社.　　[16] Kai Hwang.高等計算機系統(tǒng)結構------并行性、可擴展性、可編程性[M].北京：清華大學出版社，1999.</

89、p>　　[17] 肖金立.微型計算機原理與應用.電子工業(yè)出版社.　　[18] 周明德.微型計算機硬件軟件及應用.電子工業(yè)出版社.　　[19] 張新榮，楊潔，張剛.計算機組成原理.天津大學出版社.　　[20] 王愛英.計算機組成與結構.清華大學出版社.<p&

90、gt;　　致謝　　四年的讀書生涯在這個季節(jié)即將劃上句號，而于我的人生卻僅僅只是一個逗號，我也將面對人生的又一次征程?；厥淄簦刑嗟氖伦屛译y以忘懷，有太多的人讓我感動……　　首先感謝我的導師楊成衛(wèi)教授，我不是您最出色的學生，而您卻是我最尊敬的老師。身為一位老教授的您治學嚴謹，學識淵博，思想深邃，視野雄闊，為我營

91、造了一種良好的精神氛圍。授人以魚不如授人以漁，置身其間，耳濡目染，潛移默化間，使我不僅接受了全新的思想觀念，更樹立了宏偉的學術目標，領會了基本的思考方式。從論文題目的選定到論文寫作的指導經由您悉心的點撥，再經思考后的領悟，常常讓我有種“山重水復疑無路，柳暗花明又一村”的感覺。在此，再次感謝楊老師在學習、生活等各個方面的關心和指導，在以后的時間里，我會繼續(xù)努力，不辜負您的期望。　　四年的求學生涯在

92、師長、親友的大力支持下，走得辛苦卻也收獲滿囊。　　感謝08級計科一班的所有兄弟姐妹們，和他們相處的日子，我感到非常開心、快樂，也從他們身上學到了很多東西。希望在以后的日子里，大家能經常聯系，相互幫助，共同進步，體現出我們08級計科一班的風采來。　　感謝我601的所有兄弟，四年來，有風有雨，但我們共同走過，謝謝他們對我的關心、信任和鼓勵。我會滿懷信心，闖出

93、一片天空！　　感謝我所有的老師，感謝他們在我求學的道路上給我的關心和幫助，是他們教會了我知識，教會了我成長。　　也要特別感謝我的父親母親，焉得諼草，言樹之背，養(yǎng)育之恩，無以回報，你們永遠健康快樂是我最大的心愿。　　同時也感謝學院為我提供良好的做畢業(yè)論文的環(huán)境。<b&

眾賞文庫> 全部分類> 畢業(yè)設計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內容的表現方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

本科生畢業(yè)論文cache(高速緩存)與主存一致性

文檔簡介

溫馨提示

最新文檔

評論

本科生畢業(yè)論文cache(高速緩存)與主存一致性

文檔簡介

溫馨提示

最新文檔

評論

免費下載