2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩33頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、<p><b>  本科畢業(yè)設(shè)計(jì)</b></p><p><b> ?。?0 屆)</b></p><p>  私有云的架構(gòu)技術(shù)研究與方案設(shè)計(jì)</p><p>  所在學(xué)院 </p><p>  專業(yè)班級(jí) 通信工程

2、 </p><p>  學(xué)生姓名 學(xué)號(hào) </p><p>  指導(dǎo)教師 職稱 </p><p>  完成日期 年 月 </p><p><b>  摘 要</b>&

3、lt;/p><p>  私有云是指企業(yè)單位不對(duì)公眾開(kāi)放,為自身提供云服務(wù)(IT資源)的數(shù)據(jù)中心,它是相對(duì)公共云而言的,是云計(jì)算的一種。雖然公共云的概念更具革新意義,但在2012年之前,IT部門投資私有云計(jì)算相關(guān)金額將超過(guò)公共云計(jì)算,所以對(duì)私有云的研究具有現(xiàn)實(shí)意義。</p><p>  把私有云環(huán)境設(shè)定為萬(wàn)里學(xué)院,以IBM“藍(lán)云”計(jì)算平臺(tái)為依據(jù),根據(jù)萬(wàn)里學(xué)院的自身需求和特點(diǎn)進(jìn)行硬件選型和對(duì)關(guān)鍵技

4、術(shù)的選擇,得出一個(gè)合理的架構(gòu)方案,并衍射到一般企業(yè)中。</p><p>  從存儲(chǔ)、計(jì)算、管理三方面對(duì)私有云架構(gòu)的關(guān)鍵技術(shù)進(jìn)行研究分析。</p><p>  數(shù)據(jù)存儲(chǔ)技術(shù)主要介紹GFS,編程模型主要介紹MapReduce,數(shù)據(jù)管理技術(shù)主要介紹BigTable,這三者都是Google開(kāi)發(fā)的技術(shù)。</p><p>  安全性一直是用戶很關(guān)心的問(wèn)題,某種程度上,這也是當(dāng)前

5、人們較公共云更傾向于私有云投資的原因之一。對(duì)架構(gòu)中的安全性問(wèn)題進(jìn)行分析,對(duì)照安全性需求給出相應(yīng)的技術(shù)解決手段。</p><p>  關(guān)鍵詞:私有云;架構(gòu);關(guān)鍵技術(shù)</p><p><b>  Abstract</b></p><p>  Private Cloud is relatively to Public Cloud, it’s not

6、open to the public enterprises, only provide for their own Cloud services (IT resources).Although the concept of Public Cloud is more revolutionary, but before 2012, the IT investment in the Private Cloud Computing will

7、be more than the Public Cloud Computing, so the research on the Private Cloud is practical significance.</p><p>  The Environment of the private cloud is set to Wanli University, take the IBM “Blue Cloud” co

8、mputing platform as the basis, according to the Wanli University’s characteristics and own needs to make the choice of the hardware models and key technologies, to arrive at a reasonable framework for the program, and di

9、ffraction to the general enterprises.</p><p>  Users have always been very concerned about the security, to some extent; this is one of the reasons that currently people are more interested in the Private Cl

10、oud than the Public Cloud. Analyze the security issues in the structure, given the appropriate technical solution means.</p><p>  Finally, from the hardware, software, automated deployment, production effici

11、ency and systems management five aspects, analyzed the return on investment of structure, Judge the feasibility of Private Cloud architecture.</p><p>  Key Words: Private clouds; structure; key technology<

12、;/p><p><b>  目 錄</b></p><p><b>  1 引言1</b></p><p>  2 私有云的定義2</p><p>  3 構(gòu)建私有云的目標(biāo)和意義3</p><p>  4 私有云架構(gòu)的關(guān)鍵技術(shù)6</p><p

13、>  4.1 數(shù)據(jù)存儲(chǔ)技術(shù)6</p><p>  4.2 編程模型7</p><p>  4.2.1 MapReduce運(yùn)行模型8</p><p>  4.2.2 MapReduce實(shí)現(xiàn)機(jī)制9</p><p>  4.3 數(shù)據(jù)管理技術(shù)11</p><p>  4.3.1 BigTable數(shù)據(jù)模型11&

14、lt;/p><p>  4.3.2 BigTable系統(tǒng)架構(gòu)12</p><p>  4.4 安全管理技術(shù)13</p><p>  4.4.1 用戶認(rèn)證與授權(quán)14</p><p>  4.4.2 數(shù)據(jù)隔離14</p><p>  4.4.3 數(shù)據(jù)加密14</p><p>  4.4.4 數(shù)

15、據(jù)保護(hù)15</p><p>  4.4.5 分級(jí)安全控制15</p><p>  4.4.6 網(wǎng)絡(luò)隔離15</p><p>  4.4.7 災(zāi)備管理16</p><p>  5 私有云架構(gòu)的方案設(shè)計(jì)17</p><p>  5.1 私有云參考架構(gòu)17</p><p>  5.2 硬

16、件選型18</p><p>  5.2.1 服務(wù)器18</p><p>  5.2.2 存儲(chǔ)設(shè)備19</p><p>  5.2.3 網(wǎng)絡(luò)設(shè)備19</p><p>  5.3 關(guān)鍵技術(shù)選擇20</p><p>  5.3.1 虛擬化技術(shù)20</p><p>  5.3.2 存儲(chǔ)體系結(jié)

17、構(gòu)20</p><p>  5.4內(nèi)部云架構(gòu)實(shí)例21</p><p>  5.4.1 架構(gòu)組成22</p><p>  5.4.2 硬件23</p><p>  5.4.3 軟件(關(guān)鍵技術(shù))24</p><p>  5.4.3 架構(gòu)成本估算25</p><p><b>  

18、6 結(jié)論27</b></p><p>  致 謝錯(cuò)誤!未定義書(shū)簽。</p><p><b>  參考文獻(xiàn)28</b></p><p>  附錄1 私有云參考架構(gòu)30</p><p><b>  1 引言</b></p><p>  “云計(jì)算”是20

19、10年IT行業(yè)最火的詞匯之一,多家業(yè)界分析公司都將云計(jì)算列為10大戰(zhàn)略技術(shù)之首。</p><p>  云計(jì)算的優(yōu)勢(shì)在于能輕松取代現(xiàn)有IT架構(gòu)與處理程序,但事實(shí)上未來(lái)(至少在相當(dāng)長(zhǎng)的一段時(shí)間內(nèi))IT部門的形態(tài)可能兩者兼具;企業(yè)仍需設(shè)置IT部門來(lái)管理與調(diào)度IT資源,其中有部分即可能屬于私有云計(jì)算;IT部門還必須肩負(fù)起分配IT服務(wù)的責(zé)任,以決定是否尋求外部服務(wù)商協(xié)助或進(jìn)行內(nèi)部調(diào)度。</p><p&g

20、t;  國(guó)際研究暨顧問(wèn)機(jī)構(gòu)Gartner指出,盡管公共云計(jì)算服務(wù)較符合規(guī)模經(jīng)濟(jì)原則,但在可預(yù)見(jiàn)的未來(lái),私有云計(jì)算將在公共云計(jì)算服務(wù)成熟之前大行其道;Gartner預(yù)測(cè),2012年之前,IT部門投資私有云計(jì)算相關(guān)金額將超過(guò)公共云計(jì)算。[1]</p><p>  企業(yè)投資私有云計(jì)算,等于是為未來(lái)進(jìn)階公共云計(jì)算預(yù)做準(zhǔn)備;這些投資代表的不只是技術(shù)的改變,也是企業(yè)在程序、文化與商業(yè)接口上的變革;企業(yè)若能提早預(yù)做準(zhǔn)備,不但有

21、利于云計(jì)算資源相關(guān)決策,未來(lái)轉(zhuǎn)換到公用云計(jì)算架構(gòu)的過(guò)程,也可能因此更為順利。</p><p><b>  2 私有云的定義</b></p><p>  何謂私有云?這是相對(duì)公有云和混合云來(lái)說(shuō)的。</p><p>  根據(jù)云計(jì)算服務(wù)的部署方式和服務(wù)對(duì)象范圍可以將云分為3類:公共云,私有云和混合云。三者之間的關(guān)系如圖2。</p>&

22、lt;p>  私有云也稱為內(nèi)部云或?qū)僭?,它是指企業(yè)單位不對(duì)公眾開(kāi)放,只為自身提供云服務(wù)(IT資源)的數(shù)據(jù)中心。私有云可部署在企業(yè)數(shù)據(jù)中心的防火墻內(nèi),也可部署在一個(gè)信任的服務(wù)器托管場(chǎng)所。前者,私有云的用戶完全擁有整個(gè)云中心設(shè)施,可以控制哪些應(yīng)用程序在哪里運(yùn)行,并且決定哪些用戶使用云服務(wù)。對(duì)于后者,則由像Sun,IBM這樣的云計(jì)算提供商安裝、配置和運(yùn)營(yíng)基礎(chǔ)設(shè)施,以支持企業(yè)內(nèi)專用云的運(yùn)作。由于私有云的服務(wù)提供對(duì)象是針對(duì)企業(yè)內(nèi)部,私有云

23、上的服務(wù)可以更少地受到在公共云中必須考慮的諸多限制,比如帶寬、安全和法規(guī)遵從性等。而且,通過(guò)用戶范圍控制和網(wǎng)絡(luò)限制等手段,私有云可以提供更多的安全和私密等專屬性保證[2]。</p><p>  當(dāng)云以服務(wù)方式提供給大眾時(shí),稱為“公共云”,公共云由云提供商運(yùn)行,為用戶提供從應(yīng)用程序、軟件運(yùn)行環(huán)境,到物理基礎(chǔ)設(shè)施等方方面面的IT資源的安裝、管理、部署和維護(hù)。用戶選擇不同的服務(wù)模式獲得自己想要的IT資源,且按照即付即用

24、(pay-as-you-go)的方式付費(fèi),用多少,付多少。</p><p>  混合云則是把“公共云”和“私有云”結(jié)合到了一起的方式。企業(yè)用戶可以通過(guò)一種可控的方式部分獨(dú)占,部分與他人共享。利用公共云的成本優(yōu)勢(shì),將非關(guān)鍵的應(yīng)用運(yùn)行在公共云上,同時(shí)將安全性要求更高,關(guān)鍵性更強(qiáng)的主要應(yīng)用通過(guò)內(nèi)部的私有云提供服務(wù)[3, 4]。</p><p>  3 構(gòu)建私有云的目標(biāo)和意義</p>

25、<p>  對(duì)于企業(yè)來(lái)說(shuō),建立高性能計(jì)算平臺(tái),并不僅僅是搭建一臺(tái)高性能計(jì)算機(jī)這么簡(jiǎn)單,企業(yè)的目標(biāo)是建立一個(gè)高水平、低成本的公共服務(wù)平臺(tái),實(shí)現(xiàn)網(wǎng)絡(luò)環(huán)境下的計(jì)算資源、存儲(chǔ)資源和數(shù)據(jù)資源的有效共享,給用戶提供方便、有效的服務(wù)。</p><p>  一般的數(shù)據(jù)中心,服務(wù)器的真實(shí)利用率低于20%。數(shù)據(jù)中心需要按照峰值準(zhǔn)備資源,以便能夠應(yīng)付高峰期,但資源在非高峰期時(shí)間難免閑置。峰值越高,浪費(fèi)越多。</p&

26、gt;<p>  傳統(tǒng)方式需要幾個(gè)星期的時(shí)間來(lái)增加或減少一臺(tái)服務(wù)器,而云計(jì)算能夠在幾分鐘之內(nèi)完成,因而更好按需分配資源。傳統(tǒng)數(shù)據(jù)中心因?yàn)樾枰獛字懿拍芡瓿尚略O(shè)備的申請(qǐng)和安裝,唯一的辦法就是提前預(yù)備資源設(shè)備以便應(yīng)付峰值。然而即使峰值預(yù)測(cè)正確,也會(huì)存在浪費(fèi),如圖3-1所示。如果我們高估了峰值,則浪費(fèi)更多,如圖3-2所示。而如果低估了需求的峰值,則會(huì)使用戶無(wú)法正常訪問(wèn),得不到服務(wù),影響工作效率,如圖3-3所示。</p>

27、<p>  無(wú)論對(duì)于大型企業(yè)還是中小企業(yè),云計(jì)算彈性能力的價(jià)值就體現(xiàn)出來(lái)了。沒(méi)有彈性的情況下,因?yàn)橘Y源閑置,單位時(shí)間內(nèi)成本更高,過(guò)高的估計(jì)峰值,也會(huì)導(dǎo)致同樣的狀況,而在低估峰值的情況下,資源配置不足,流失客戶,也導(dǎo)致成本上升(由于一部分客戶永久離開(kāi),固定費(fèi)用保持不變,但現(xiàn)在攤銷在較少的用戶身上)。這說(shuō)明了非彈性資源在面對(duì)任何突發(fā)的工作量的根本限制,而構(gòu)架云計(jì)算能很好的解決這類問(wèn)題[5]。</p><p&

28、gt;  私有云的主要應(yīng)用場(chǎng)景是基礎(chǔ)架構(gòu)云,也就是把傳統(tǒng)企業(yè)數(shù)據(jù)中心進(jìn)行改造,變成一個(gè)以云計(jì)算模式運(yùn)行的云平臺(tái),服務(wù)于企業(yè)內(nèi)部的不同應(yīng)用和業(yè)務(wù)系統(tǒng)。簡(jiǎn)單地說(shuō),企業(yè)私有云從技術(shù)手段來(lái)講等同于虛擬化+自動(dòng)化+服務(wù)管理[6]。</p><p><b>  預(yù)期目標(biāo):</b></p><p>  通過(guò)云計(jì)算來(lái)搭建新的高性能計(jì)算平臺(tái),統(tǒng)一管理軟硬件資源,以虛擬化和自動(dòng)化的方式動(dòng)

29、態(tài)部署資源,用來(lái)統(tǒng)一提供服務(wù),從而提供良好的擴(kuò)展性,支持按需變化的運(yùn)算模式。通過(guò)該平臺(tái)將計(jì)算、存儲(chǔ)資源以及數(shù)據(jù)和應(yīng)用作為服務(wù)通過(guò)網(wǎng)絡(luò)提供給用戶,給用戶提供靈活、個(gè)性化、多元和簡(jiǎn)單的應(yīng)用和服務(wù),從而能夠非常好地實(shí)現(xiàn)企業(yè)對(duì)計(jì)算平臺(tái)的需求。</p><p>  4 私有云架構(gòu)的關(guān)鍵技術(shù)</p><p>  4.1 數(shù)據(jù)存儲(chǔ)技術(shù)</p><p>  為保證高可用、高可靠和

30、經(jīng)濟(jì)性,私有云計(jì)算采用分布式存儲(chǔ)的方式來(lái)存儲(chǔ)數(shù)據(jù),采用冗余存儲(chǔ)的方式來(lái)保證存儲(chǔ)數(shù)據(jù)的可靠性,即為同一份數(shù)據(jù)存儲(chǔ)多個(gè)副本。</p><p>  另外,私有云系統(tǒng)需要同時(shí)滿足大量用戶的需求,并行地為大量用戶提供服務(wù)。因此,云計(jì)算的數(shù)據(jù)存儲(chǔ)技術(shù)必須具有高吞吐率和高傳輸率的特點(diǎn)。</p><p>  云計(jì)算的數(shù)據(jù)存儲(chǔ)技術(shù)主要有谷歌的非開(kāi)源GFS(Google File System)[7]和Had

31、oop開(kāi)發(fā)團(tuán)隊(duì)開(kāi)發(fā)的GFS的開(kāi)源實(shí)現(xiàn)HDFS(Hadoop Distributed File System)。</p><p>  以GFS為例。GFS是一個(gè)管理大型分布式數(shù)據(jù)密集型計(jì)算的可擴(kuò)展的分布式文件系統(tǒng)。它使用廉價(jià)的商用硬件搭建系統(tǒng)并向大量用戶提供容錯(cuò)的高性能的服務(wù)。</p><p>  GFS和普通的分布式文件系統(tǒng)有以下區(qū)別,如表4-1所示。</p><p&g

32、t;  GFS系統(tǒng)由一個(gè)Master和大量塊服務(wù)器構(gòu)成。Master存放文件系統(tǒng)的所有元數(shù)據(jù),包括名字空間、存取控制、文件分塊信息、文件塊的位置信息等。GFS中的文件切分為64MB的塊進(jìn)行存儲(chǔ)。</p><p>  在GFS文件系統(tǒng)中,采用冗余存儲(chǔ)的方式來(lái)保證數(shù)據(jù)的可靠性。每份數(shù)據(jù)在系統(tǒng)中保存3個(gè)以上的備份。為了保證數(shù)據(jù)的一致性,對(duì)于數(shù)據(jù)的所有修改需要在所有的備份上進(jìn)行,并用版本號(hào)的方式來(lái)確保所有備份處于一致的狀

33、態(tài)。</p><p>  客戶端不通過(guò)Master讀取數(shù)據(jù),避免了大量讀操作使Master成為系統(tǒng)瓶頸??蛻舳藦腗aster獲取目標(biāo)數(shù)據(jù)塊的位置信息后,直接和塊服務(wù)器交互進(jìn)行讀操作。</p><p>  GFS的寫(xiě)操作將寫(xiě)操作控制信號(hào)和數(shù)據(jù)流分開(kāi),如圖4-1[8]。</p><p>  即客戶端在獲取Master的寫(xiě)授權(quán)后,將數(shù)據(jù)傳輸給所有的數(shù)據(jù)副本,在所有的數(shù)據(jù)副

34、本都受到修改的數(shù)據(jù)后,客戶端才發(fā)出寫(xiě)請(qǐng)求控制信號(hào)。在所有的數(shù)據(jù)副本更新完數(shù)據(jù)后,由主副本向客戶端發(fā)出寫(xiě)操作完成控制信號(hào)。</p><p><b>  4.2 編程模型</b></p><p>  為了使用戶能更輕松地享受云計(jì)算帶來(lái)的服務(wù),讓用戶能利用該編程模型編寫(xiě)簡(jiǎn)單的程序來(lái)實(shí)現(xiàn)特定的目的,云計(jì)算上的編程模型必須十分簡(jiǎn)單。必須保證后臺(tái)復(fù)雜的并行執(zhí)行和任務(wù)調(diào)度向用戶和編

35、程人員透明。</p><p>  MapReduce是一種處理海量數(shù)據(jù)的并行編程模式,與傳統(tǒng)的分布式程序設(shè)計(jì)相比,MapReduce封裝了并行處理、容錯(cuò)處理、本地化計(jì)算、負(fù)載均衡等細(xì)節(jié),還提供了一個(gè)簡(jiǎn)單而強(qiáng)大的接口。通過(guò)這個(gè)接口,可以把大尺度的計(jì)算自動(dòng)地并發(fā)和分布執(zhí)行,從而使編程變得非常容易。還可以通過(guò)有普通PC構(gòu)成的巨大集群來(lái)達(dá)到極高的性能。另外,MapReduce也具有較好的通用性,大量不同的問(wèn)題都可以簡(jiǎn)單地

36、通過(guò)MapReduce來(lái)解決。</p><p>  4.2.1 MapReduce運(yùn)行模型</p><p>  MapReduce的運(yùn)行模型如圖4-2[9]所示。圖中有M個(gè)Map操作和R個(gè)Reduce操作。</p><p>  簡(jiǎn)單地說(shuō),一個(gè)Map函數(shù)就是對(duì)一部分原始數(shù)據(jù)進(jìn)行指定的操作。每個(gè)Map函數(shù)都針對(duì)不同的原始數(shù)據(jù),因此Map與Map之間是互相獨(dú)立的,這就使得

37、它們可以充分并行化。一個(gè)Reduce操作就是對(duì)每個(gè)Map所產(chǎn)生的一部分中間結(jié)果進(jìn)行合并操作,每個(gè)Reduce所處理的Map中間結(jié)果是互不交叉,所有Reduce產(chǎn)生的最終結(jié)果經(jīng)過(guò)簡(jiǎn)單連接就形成了完整的結(jié)果集,因此Reduce也可以在并行環(huán)境下執(zhí)行。</p><p>  在編程的時(shí)候,開(kāi)發(fā)者需要編寫(xiě)兩個(gè)主要函數(shù):</p><p>  Map:(in_key,in_value)→{(keyj,v

38、aluej) | j=1…k}</p><p>  Reduce:(key,[value1,…,valuem])→(key,final_value)</p><p>  Map和Reduce的輸入?yún)?shù)和輸出結(jié)果根據(jù)應(yīng)用的不同而有所不同。Map的輸入?yún)?shù)是in_key和in_value,它指明了Map需要處理的原始數(shù)據(jù)是哪些。Map的輸出結(jié)果是一組<key,value>對(duì),這是經(jīng)

39、過(guò)Map操作后所產(chǎn)生的中間結(jié)果。在進(jìn)行Reduce操作之前,系統(tǒng)已經(jīng)將所有Map產(chǎn)生的中間結(jié)果進(jìn)行了歸類處理,使得相同key對(duì)應(yīng)的一系列value能夠集結(jié)在一起提供給一個(gè)Reduce進(jìn)行歸并處理,也就是說(shuō),Reduce的輸入?yún)?shù)是(key,[value1,…,valuem])。Reduce的工作是需要對(duì)這些對(duì)應(yīng)相同key的value值進(jìn)行歸并處理,最終形成(key,final_value)的結(jié)果。這樣,一個(gè)Reduce處理了一個(gè)Key,

40、所有Reduce的結(jié)果并在一起就是最終結(jié)果。</p><p>  4.2.2 MapReduce實(shí)現(xiàn)機(jī)制</p><p>  實(shí)現(xiàn)MapReduce操作的執(zhí)行流程圖如圖4-3[9]所示。</p><p>  當(dāng)用戶程序調(diào)用MapReduce函數(shù),就會(huì)引起如下操作(圖中的數(shù)字標(biāo)示和下面的數(shù)字標(biāo)示相同)。</p><p>  用戶程序中的MapR

41、educe函數(shù)庫(kù)首先把輸入文件分成M塊,每塊大概16M~64M(可以通過(guò)參數(shù)決定),接著在集群的機(jī)器上執(zhí)行處理程序。</p><p>  這些分派的執(zhí)行程序中有一個(gè)程序比較特別,它是主控程序Master。剩下的執(zhí)行程序都是作為Master分派工作的Worker(工作機(jī))。總共有M個(gè)Map任務(wù)和R個(gè)Reduce任務(wù)需要分派,Master選擇空閑的Worker來(lái)分配這些Map或者Reduce任務(wù)。</p>

42、<p>  一個(gè)分配了Map任務(wù)的Worker讀取并處理相關(guān)的輸入塊。它處理輸入的數(shù)據(jù),并且將分析出<key,value>對(duì)傳遞給用戶定義的Map函數(shù)。Map函數(shù)產(chǎn)生的中間結(jié)果<key,value>對(duì)暫時(shí)緩沖到內(nèi)存。</p><p>  這些緩沖到內(nèi)存的中間結(jié)果將被定時(shí)寫(xiě)到本地硬盤,這些數(shù)據(jù)通過(guò)分區(qū)函數(shù)分成R個(gè)區(qū)。中間結(jié)果在本地硬盤的位置信息將被發(fā)送回Master,然后Mas

43、ter負(fù)責(zé)把這些位置信息傳遞給Reduce Worker。</p><p>  當(dāng)Master通知Reduce的Worker關(guān)于中間<key,value>對(duì)的位置時(shí),它調(diào)用遠(yuǎn)程過(guò)程來(lái)從Map Worker的本地硬盤上讀取緩沖的中間數(shù)據(jù)。當(dāng)Reduce Worker讀到所有的中間數(shù)據(jù),它就使用中間key進(jìn)行排序,這樣可以使得相同key的值都在一起。因?yàn)橛性S多不同key的Map都對(duì)應(yīng)相同的Reduce任務(wù)

44、,所以,排序是必須的。如果中間結(jié)果集過(guò)于龐大,那么就需要使用外排序。</p><p>  Reduce Worker根據(jù)每一個(gè)唯一中間key來(lái)遍歷所有的排序后的中間數(shù)據(jù),并且把key和相關(guān)的中間結(jié)果值集合傳遞給用戶定義的Reduce函數(shù)。Reduce函數(shù)的結(jié)果輸出到一個(gè)最終的輸出文件。</p><p>  當(dāng)所有的Map任務(wù)和Reduce任務(wù)都已經(jīng)完成的時(shí)候,Master激活用戶程序。此時(shí)

45、MapReduce返回用戶程序的調(diào)用點(diǎn)。</p><p>  MapReduce具有很強(qiáng)的容錯(cuò)性。在Master中,會(huì)周期性地設(shè)置檢查點(diǎn)(checkpoint),并導(dǎo)出Master的數(shù)據(jù)。一旦某個(gè)任務(wù)失效了,就可以從最近的一個(gè)檢查點(diǎn)恢復(fù)并重新執(zhí)行。不過(guò)由于只有一個(gè)Master在運(yùn)行,如果Master失效了,則只能終止整個(gè)MapReduce程序的運(yùn)行并重新開(kāi)始。相對(duì)于Master失效而言,Worker失效算是一種常

46、見(jiàn)的狀態(tài)。Master會(huì)周期性地給Worker發(fā)送ping命令,如果沒(méi)有Worker的應(yīng)答,則Master認(rèn)為Worker失效,終止對(duì)這個(gè)Worker的任務(wù)調(diào)度,把失效Worker的任務(wù)調(diào)度到其他Worker上重新執(zhí)行。</p><p>  4.3 數(shù)據(jù)管理技術(shù)</p><p>  云計(jì)算系統(tǒng)對(duì)大數(shù)據(jù)集進(jìn)行處理、分析,向用戶提供高效的服務(wù)。因此,數(shù)據(jù)管理技術(shù)必須能夠高效地管理大數(shù)據(jù)集。其次

47、,如何在規(guī)模巨大的數(shù)據(jù)中找到特定的數(shù)據(jù),也是云計(jì)算數(shù)據(jù)管理技術(shù)所必須解決的問(wèn)題。</p><p>  云計(jì)算的特點(diǎn)是對(duì)海量的數(shù)據(jù)存儲(chǔ)、讀取后進(jìn)行大量的分析,數(shù)據(jù)的讀操作頻率遠(yuǎn)大于數(shù)據(jù)的更新頻率,云中的數(shù)據(jù)管理是一種讀優(yōu)化的數(shù)據(jù)管理。因此,云系統(tǒng)的數(shù)據(jù)管理往往采用數(shù)據(jù)庫(kù)領(lǐng)域中列存儲(chǔ)的數(shù)據(jù)管理模式。將表按列劃分后存儲(chǔ)。</p><p>  云計(jì)算的數(shù)據(jù)管理技術(shù)中最著名的是谷歌開(kāi)發(fā)的BigTab

48、le[10]。</p><p>  4.3.1 BigTable數(shù)據(jù)模型</p><p>  BigTable是一個(gè)分布式多維映射表,表中的數(shù)據(jù)是通過(guò)一個(gè)行關(guān)鍵字(Row Key)、一個(gè)列關(guān)鍵字(Column Key)以及一個(gè)時(shí)間戳(Time Stamp)進(jìn)行索引的。BigTable對(duì)存儲(chǔ)在其中的數(shù)據(jù)不做任何解析,一律看做字符串,具體數(shù)據(jù)結(jié)構(gòu)的實(shí)現(xiàn)需要用戶自行處理。BigTable的存儲(chǔ)邏

49、輯可以表示為:</p><p>  (row:string,column:string,time:int64)→string</p><p>  BigTable數(shù)據(jù)的存儲(chǔ)格式如圖4-4所示。</p><p><b>  1.行</b></p><p>  BigTable的行關(guān)鍵字可以是任意的字符串,但是大小不能夠超過(guò)

50、64KB。表中的數(shù)據(jù)都是根據(jù)行關(guān)鍵字進(jìn)行排序的,排序使用的是詞典序。圖4-4是Bigtable數(shù)據(jù)模型的一個(gè)典型實(shí)例,其中com.cnn.www就是一個(gè)行關(guān)鍵字。不直接存儲(chǔ)網(wǎng)頁(yè)地址而將其倒排是Bigtable的一個(gè)巧妙設(shè)計(jì),這樣同一地址域的網(wǎng)頁(yè)會(huì)被存儲(chǔ)在表中的連續(xù)位置,有利于用戶查找和分析,而且倒排也便于數(shù)據(jù)壓縮,可以大幅提高壓縮率。</p><p><b>  2.列</b></p&

51、gt;<p>  BigTable并不是簡(jiǎn)單地存儲(chǔ)所有的列關(guān)鍵字,而是將其組織成所謂的列族(Column Family),每個(gè)族中的數(shù)據(jù)都屬于同一個(gè)類型,并且同族的數(shù)據(jù)會(huì)被壓縮在一起保存。引入了列族的概念之后,列關(guān)鍵字就采用下述的語(yǔ)法規(guī)則來(lái)定義:</p><p>  族名:限定詞(family:qualifier)</p><p>  族名必須有意義,限定詞則可以任意選定。在

52、圖4-4中,內(nèi)容(Contents)、錨點(diǎn)(Anchor,就是HTML中的鏈接)都是不同的族。而cnnsi.com和my.look.ca則是錨點(diǎn)族中不同的限定詞。通過(guò)這種方式組織的數(shù)據(jù)結(jié)構(gòu)清晰秒了,含義也很清楚。</p><p><b>  3.時(shí)間戳</b></p><p>  很多需要保存不同時(shí)間的數(shù)據(jù)必須通過(guò)時(shí)間戳來(lái)區(qū)分。圖4-4中內(nèi)容列的t3、t5和t6表明其

53、中保存了在t3、t5和t6這三個(gè)時(shí)間獲取的網(wǎng)頁(yè)。BigTable中的時(shí)間戳是64位整形數(shù)。</p><p>  4.3.2 BigTable系統(tǒng)架構(gòu)</p><p>  BigTable在執(zhí)行時(shí)需要三個(gè)主要的組件:客戶端程序庫(kù)(Client Library)、一個(gè)主服務(wù)器(Master Server)和多個(gè)子表服務(wù)器(Tablet Server),這三個(gè)部分在圖4-5中都有相應(yīng)的表示。從圖

54、4-5中可以看出,客戶需要訪問(wèn)BigTable服務(wù)時(shí)首先利用其庫(kù)函數(shù)執(zhí)行Open()操作來(lái)打開(kāi)一個(gè)鎖(實(shí)際上就是獲取了文件目錄),鎖打開(kāi)以后客戶端就可以和子表服務(wù)器進(jìn)行通信了。和許多具有單個(gè)主節(jié)點(diǎn)的分布式系統(tǒng)一樣,客戶端主要與子表服務(wù)器通信,幾乎不和主服務(wù)器進(jìn)行通信,這使得主服務(wù)器的負(fù)載大大降低。主服務(wù)主要進(jìn)行一些元數(shù)據(jù)的操作以及子表服務(wù)器之間的負(fù)載調(diào)度問(wèn)題,實(shí)際的數(shù)據(jù)是存儲(chǔ)在子表服務(wù)器上的。</p><p> 

55、 4.4 安全管理技術(shù)</p><p>  很多人對(duì)云計(jì)算存在著疑慮就是因?yàn)樵朴?jì)算的安全性問(wèn)題,私有云的架構(gòu)某種程度上解決了這個(gè)問(wèn)題,但并不意味著就完全沒(méi)有問(wèn)題。</p><p>  按照云計(jì)算的需求,可以對(duì)照表5-1采取相應(yīng)的安全手段。</p><p>  4.4.1 用戶認(rèn)證與授權(quán)</p><p>  用戶認(rèn)證與授權(quán)管理旨在授權(quán)合法用戶進(jìn)

56、入系統(tǒng)和訪問(wèn)數(shù)據(jù),同時(shí)保護(hù)這些資產(chǎn)免受非授權(quán)的訪問(wèn)。隨著云計(jì)算的使用客戶及其業(yè)務(wù)流程和應(yīng)用向越來(lái)越多的員工、終端客戶和業(yè)務(wù)伙伴放開(kāi),安全威脅不僅來(lái)自外部互聯(lián)網(wǎng),也來(lái)自內(nèi)部的安全隱患。這種互通性向云計(jì)算系統(tǒng)提出了新的挑戰(zhàn)——如何經(jīng)濟(jì)高效地管理這些用戶以及他們的系統(tǒng)訪問(wèn)。</p><p>  同構(gòu)集中化的身份和訪問(wèn)管理,云計(jì)算的使用客戶能夠以一種基于標(biāo)準(zhǔn)的方法保護(hù)那些影響生產(chǎn)效率的資產(chǎn)和信息,并且使企業(yè)能夠滿足安全需

57、要,降低成本,改善用戶體驗(yàn),提高效率和避免風(fēng)險(xiǎn)。</p><p>  4.4.2 數(shù)據(jù)隔離</p><p>  數(shù)據(jù)的隔離是大家都比較關(guān)心的問(wèn)題。私有云架構(gòu)的一個(gè)核心技術(shù)是虛擬化,這意味著不同用戶的數(shù)據(jù)可能存放在共享的物理存儲(chǔ)之上。</p><p>  云計(jì)算系統(tǒng)對(duì)于客戶數(shù)據(jù)的存放可采用兩種方式實(shí)現(xiàn):提供統(tǒng)一共享的存儲(chǔ)設(shè)備,或者提供單獨(dú)的存儲(chǔ)設(shè)備。</p>

58、;<p>  當(dāng)客戶選擇共享存儲(chǔ)設(shè)備存放數(shù)據(jù)時(shí),通過(guò)存儲(chǔ)自身的安全措施,比如映射等功能可以確保數(shù)據(jù)的隔離性,其優(yōu)點(diǎn)為:節(jié)約存儲(chǔ)空間;統(tǒng)一管理,可節(jié)省管理相關(guān)的費(fèi)用;存儲(chǔ)整合,便于管理,便于備份及容災(zāi)的實(shí)現(xiàn);提供足夠、有效地安全措施保護(hù)數(shù)據(jù)。</p><p>  當(dāng)客戶選擇單獨(dú)的數(shù)據(jù)存儲(chǔ)設(shè)備時(shí),從物理層面隔離保護(hù)了客戶重要數(shù)據(jù)。其優(yōu)點(diǎn)為可有效保護(hù)用戶數(shù)據(jù),但缺點(diǎn)是存儲(chǔ)無(wú)法有效利用,當(dāng)用戶規(guī)模擴(kuò)大時(shí),無(wú)

59、法實(shí)現(xiàn)對(duì)分布的獨(dú)立的存儲(chǔ)進(jìn)行有效管理,從而將使整個(gè)云的成本和可用性大打折扣。</p><p>  4.4.3 數(shù)據(jù)加密</p><p>  數(shù)據(jù)加密的目的是防止他人拿到數(shù)據(jù)的原始文件后進(jìn)行數(shù)據(jù)的竊取。在云計(jì)算環(huán)境中,數(shù)據(jù)的隔離機(jī)制已經(jīng)可以防止其他用戶對(duì)數(shù)據(jù)的訪問(wèn),因此,數(shù)據(jù)加密的主要用途是防止“內(nèi)鬼”,即避免服務(wù)提供者對(duì)數(shù)據(jù)進(jìn)行竊取。數(shù)據(jù)加密在云計(jì)算中的具體應(yīng)用形式為:數(shù)據(jù)在用戶側(cè)使用用戶

60、密鑰進(jìn)行加密,然后上傳至云計(jì)算環(huán)境中,之后使用時(shí)再實(shí)時(shí)解密,避免將解密后的數(shù)據(jù)存放在任何物理介質(zhì)上。</p><p>  4.4.4 數(shù)據(jù)保護(hù)</p><p>  數(shù)據(jù)保護(hù)安全措施能對(duì)客戶所有的數(shù)據(jù)和信息——結(jié)構(gòu)化、非結(jié)構(gòu)化的和半結(jié)構(gòu)化的數(shù)據(jù),提供全面的保護(hù)功能。對(duì)存放于完全不同的存儲(chǔ)格式中的數(shù)據(jù)進(jìn)行發(fā)現(xiàn)、歸類、保護(hù)和監(jiān)控,并提供對(duì)關(guān)鍵的知識(shí)產(chǎn)權(quán)和敏感的企業(yè)信息的保護(hù)。</p>

61、<p>  對(duì)于存儲(chǔ)在云計(jì)算平臺(tái)的數(shù)據(jù),可采用快照、備份和容災(zāi)等重要保護(hù)手段確??蛻糁匾獢?shù)據(jù)的安全。即便受到黑客、病毒等邏輯層面的攻擊或者地震、火災(zāi)等物理層面的災(zāi)害,也都可以有效恢復(fù)客戶數(shù)據(jù)。</p><p>  4.4.5 分級(jí)安全控制</p><p>  分級(jí)安全控制也是用來(lái)規(guī)范服務(wù)提供商的一種方式,使得用戶數(shù)據(jù)不至于通過(guò)提供商的某一個(gè)人就能獲取,從而來(lái)提升服務(wù)運(yùn)維的安全

62、性。云計(jì)算平臺(tái)的構(gòu)建涉及機(jī)房、物理資源、虛擬資源和應(yīng)用軟件等多個(gè)層次,系統(tǒng)的運(yùn)維需要多種運(yùn)維管理人員的介入。對(duì)于這些不同的角色,需要規(guī)范他們的權(quán)限,將安全風(fēng)險(xiǎn)降到最低。</p><p>  對(duì)于機(jī)房的安全及日常維護(hù),有機(jī)房管理及維護(hù)人員對(duì)各種訪問(wèn)和變更等進(jìn)行嚴(yán)格審計(jì),需要完善的管理機(jī)制。機(jī)房/網(wǎng)絡(luò)的管理人員不能越權(quán)管理提供服務(wù)的物理服務(wù)器。</p><p>  這對(duì)于物理服務(wù)器和存儲(chǔ)的管理

63、尤為關(guān)鍵,一方面需要對(duì)所有的管理工作進(jìn)行審計(jì),另一方面要限制管理員對(duì)上面應(yīng)用的可見(jiàn)性,也就是使他無(wú)法判斷一個(gè)具體用戶的數(shù)據(jù)是存儲(chǔ)在哪一臺(tái)服務(wù)器或者存儲(chǔ)設(shè)備之上,而只能進(jìn)行硬件級(jí)別的維護(hù)。</p><p>  4.4.6 網(wǎng)絡(luò)隔離</p><p>  網(wǎng)絡(luò)隔離提供數(shù)據(jù)傳輸?shù)陌踩裕@種機(jī)制在網(wǎng)絡(luò)銀行、電子支付等金融領(lǐng)域已經(jīng)運(yùn)用得比較廣泛?;A(chǔ)架構(gòu)云可通過(guò)多種網(wǎng)絡(luò)技術(shù)保證網(wǎng)絡(luò)的安全性和隔離性。

64、</p><p>  1.VLAN:主要用在數(shù)據(jù)中心內(nèi)部,用于隔離不同的應(yīng)用和客戶程序,確保一個(gè)客戶無(wú)法獲取到其他用戶的網(wǎng)絡(luò)數(shù)據(jù),但是網(wǎng)絡(luò)的管理員還是可以看到所有的網(wǎng)絡(luò)數(shù)據(jù)。因此,這種方法只有隔離性,不能保證私密性。</p><p>  2.VPN:又稱虛擬專有網(wǎng)絡(luò),是將多臺(tái)分布的計(jì)算機(jī)用一個(gè)私有的經(jīng)過(guò)加密的網(wǎng)絡(luò)連接起來(lái),形成一個(gè)用戶私有的網(wǎng)絡(luò)。采用這種功能方式可以徹底保證用戶數(shù)據(jù)的傳輸安

65、全性,即使是云計(jì)算后臺(tái)的網(wǎng)絡(luò)管理員也無(wú)法竊取數(shù)據(jù)。</p><p>  3.HTTPS/SSL:這是一種常見(jiàn)的傳輸安全技術(shù),主要用在瀏覽器和服務(wù)器之間的通信上,它比較適合點(diǎn)對(duì)點(diǎn)的安全保障[11]。</p><p>  4.4.7 災(zāi)備管理</p><p>  信息系統(tǒng)的容災(zāi)備份是災(zāi)難發(fā)生時(shí)確保業(yè)務(wù)連續(xù)性和數(shù)據(jù)可用性的重要手段。</p><p>

66、;  遇到云計(jì)算中心機(jī)房失火、地震等極端情況造成的數(shù)據(jù)丟失和業(yè)務(wù)停止,云計(jì)算平臺(tái)可以切換到其他備用站點(diǎn)以繼續(xù)提供服務(wù)。</p><p>  云災(zāi)備有3個(gè)關(guān)鍵技術(shù):重復(fù)數(shù)據(jù)刪除技術(shù)、云存儲(chǔ)安全技術(shù)和操作系統(tǒng)虛擬化。[12]前兩者解決數(shù)據(jù)級(jí)云災(zāi)備中的效率和安全性問(wèn)題,后者解決系統(tǒng)級(jí)云災(zāi)備的靈活性問(wèn)題。</p><p>  5 私有云架構(gòu)的方案設(shè)計(jì)</p><p>  

67、一般企業(yè)想靠自身能力來(lái)架構(gòu)和運(yùn)維一個(gè)私有內(nèi)部云是不現(xiàn)實(shí)的,所以我們依托云計(jì)算提供商提供云計(jì)算平臺(tái)。</p><p>  IBM的“藍(lán)云”計(jì)劃推出面向企業(yè)的云計(jì)算解決方案,“藍(lán)云”計(jì)算平臺(tái)是基于IBM系統(tǒng)、軟件和服務(wù)的云計(jì)算管理平臺(tái),它可以統(tǒng)一管理各種軟硬件資源并以IaaS/PaaS/SaaS形式提供服務(wù),幫助企業(yè)實(shí)現(xiàn)硬件和軟件資源的統(tǒng)一管理、統(tǒng)一分配、統(tǒng)一部署、統(tǒng)一監(jiān)控和統(tǒng)一備份,是個(gè)不錯(cuò)的選擇。</p&g

68、t;<p>  5.1 私有云參考架構(gòu)</p><p>  從圖4-1可以看出:私有云架構(gòu)主要分為以下幾層:</p><p>  第一層:私有云的架構(gòu)的最底層就是一個(gè)數(shù)據(jù)中心,數(shù)據(jù)中心是構(gòu)建企業(yè)私有云的基礎(chǔ),它包括服務(wù)器、存儲(chǔ)和網(wǎng)絡(luò)設(shè)施等。</p><p>  第二層:虛擬化。數(shù)據(jù)中心之上就是虛擬化軟件了,通過(guò)對(duì)物理基礎(chǔ)設(shè)施的虛擬化,可以獲得一個(gè)相對(duì)靈

69、活的環(huán)境。</p><p>  第三層:操作系統(tǒng)?,F(xiàn)在很多虛擬化的廠商都在提供云計(jì)算操作系統(tǒng)。</p><p>  第四層:數(shù)據(jù)庫(kù)和運(yùn)行環(huán)境。</p><p>  第五層:中間件和面向服務(wù)的架構(gòu)。</p><p>  第六層:自助服務(wù)管理軟件。</p><p>  這六層[13]包括硬件和軟件,共同構(gòu)成了一個(gè)私有云環(huán)境

70、,為企業(yè)提供專用的計(jì)算環(huán)境,企業(yè)可以將自身的應(yīng)用程序運(yùn)行在自由云上,這樣企業(yè)便能完全擁有數(shù)據(jù)和程序的控制權(quán)。</p><p><b>  5.2 硬件選型</b></p><p>  在架構(gòu)方案的設(shè)計(jì)過(guò)程當(dāng)中,首先需要考慮的就是硬件。一方面,我們希望硬件自身可以做到高可用、高擴(kuò)展;另一方面,我們也希望它有很好的性價(jià)比,具備一定的經(jīng)濟(jì)性,能夠?qū)崿F(xiàn)大規(guī)模部署。</p

71、><p><b>  5.2.1 服務(wù)器</b></p><p>  云計(jì)算中心采用的服務(wù)器應(yīng)該從縱向擴(kuò)展性、能耗指標(biāo)和服務(wù)器類型等幾個(gè)方面去進(jìn)行考慮。</p><p>  縱向擴(kuò)展性指的是單一物理服務(wù)器擴(kuò)展自身能力的特性。比如一臺(tái)可以擴(kuò)展到96個(gè)內(nèi)核的服務(wù)器,其擴(kuò)展性就要比只能擴(kuò)展到8個(gè)內(nèi)核的要好。目前的虛擬化技術(shù)依然不能實(shí)現(xiàn)虛擬機(jī)跨越物理節(jié)點(diǎn),

72、所以在云計(jì)算中心能夠創(chuàng)建的單臺(tái)虛擬機(jī),其所使用的計(jì)算資源不可能超過(guò)單臺(tái)物理服務(wù)器的資源上限。比如我們有100臺(tái)服務(wù)器,每臺(tái)有4GB內(nèi)存,那么我們就不可能創(chuàng)建出具有8GB物理內(nèi)存的虛擬機(jī)。這就要求我們?cè)谶x擇物理服務(wù)器時(shí),應(yīng)該在較高性價(jià)比的基礎(chǔ)上,盡可能采用配置(比如處理器和內(nèi)存的擴(kuò)展能力)較高的服務(wù)器。我們建議采用中高端的服務(wù)器,這樣可以將多個(gè)應(yīng)用系統(tǒng)集中到單臺(tái)物理服務(wù)器上,進(jìn)行資源共享,以達(dá)到更好的資源利用;而且,在單個(gè)虛擬機(jī)需要擴(kuò)展時(shí)

73、也能夠獲得需要的計(jì)算資源,滿足用戶需要。我們建議云計(jì)算中物理服務(wù)器的最低配置為:8個(gè)內(nèi)核和8GB內(nèi)存。推薦這個(gè)配置有兩個(gè)方面的原因:其一,這是市場(chǎng)上的主流配置,性價(jià)比高;其二,內(nèi)核數(shù)目較多,較適合進(jìn)行虛擬化[14]。</p><p>  能耗指標(biāo)很容易理解,就是機(jī)器是否耗電。</p><p>  服務(wù)器類型跟用戶需求相關(guān)。目前虛擬化技術(shù)對(duì)于操作系統(tǒng)的支持還無(wú)法做到完全與硬件無(wú)關(guān)。比如IBM

74、的小型機(jī)上就無(wú)法運(yùn)行Windows,而IBM的AIX操作系統(tǒng)也無(wú)法運(yùn)行在Intel服務(wù)器上。因此,如果用戶需要不同的操作系統(tǒng),則云計(jì)算中心就需要采用x86和小型機(jī)的一個(gè)組合來(lái)搭建硬件環(huán)境。一般來(lái)講,x86服務(wù)器具有良好的性價(jià)比,而小型機(jī)則具有很高的縱向擴(kuò)展能力。</p><p>  目前市場(chǎng)上比較新的服務(wù)器基本都支持虛擬化。如果要利用已有硬件,則需要去評(píng)估這些服務(wù)器是否適合放到云計(jì)算環(huán)境中去,因?yàn)橛行┛赡懿恢С痔?/p>

75、擬化,而有些資源太少,即使支持虛擬化也無(wú)法發(fā)揮較大的作用。</p><p>  5.2.2 存儲(chǔ)設(shè)備</p><p>  云計(jì)算中采用的存儲(chǔ)設(shè)備應(yīng)該具有高可擴(kuò)展性,能夠?qū)崿F(xiàn)海量存儲(chǔ)。從目前的存儲(chǔ)技術(shù)來(lái)看,我們可以通過(guò)兩種方式來(lái)實(shí)現(xiàn)。</p><p>  一種是采用存儲(chǔ)虛擬化設(shè)備。如IBM的SVC產(chǎn)品,能夠支持幾乎所有廠商,各種不同型號(hào)的存儲(chǔ)設(shè)備的集中虛擬化,形成存儲(chǔ)

76、資源池,而且還可以帶來(lái)存儲(chǔ)性能的提升和異地容災(zāi)備份等附加的價(jià)值。采用這種方式,用戶可以獲得存儲(chǔ)管理的靈活性,隨著業(yè)務(wù)的擴(kuò)展,可以不斷增加存儲(chǔ)資源池的容量。</p><p>  另一種是采用新的高可擴(kuò)展的存儲(chǔ)設(shè)備,有些廠商稱之為“云存儲(chǔ)”。傳統(tǒng)的存儲(chǔ)設(shè)備,其擴(kuò)展性和性能都會(huì)受到存儲(chǔ)控制器的約束。因?yàn)閭鹘y(tǒng)的存儲(chǔ)設(shè)備只有較少的存儲(chǔ)控制器,當(dāng)管理的磁盤數(shù)量上升時(shí),其存儲(chǔ)性能會(huì)受到存儲(chǔ)控制器性能的限制,其存儲(chǔ)帶寬和I/O吞

77、吐量的擴(kuò)展性都有一定局限。目前新一代的“云存儲(chǔ)”,借用了網(wǎng)格化管理的思想,采用矩陣式控制器和磁盤架構(gòu),完全打破了傳統(tǒng)的RAID架構(gòu)。隨著磁盤數(shù)增加,I/O吞吐量隨之上升,可以得到近乎線性的擴(kuò)展能力。</p><p>  5.2.3 網(wǎng)絡(luò)設(shè)備</p><p>  網(wǎng)絡(luò)的建設(shè)也是從兩個(gè)方面去考慮:一個(gè)是管理的便利性,另一個(gè)是性能擴(kuò)展能力。</p><p>  隨著云計(jì)算

78、中心的不斷發(fā)展,將會(huì)有非常多的物理服務(wù)器,每臺(tái)物理服務(wù)器上又會(huì)有許多的虛擬機(jī),所需要的網(wǎng)絡(luò)端口和網(wǎng)絡(luò)帶寬都會(huì)非常大,一個(gè)復(fù)雜的網(wǎng)絡(luò)環(huán)境需要有便利、集中地網(wǎng)絡(luò)管理工具,才能夠確保在復(fù)雜的網(wǎng)絡(luò)中不出錯(cuò)。同時(shí),單個(gè)端口的網(wǎng)絡(luò)帶寬也需要足夠大,可以考慮采用萬(wàn)兆網(wǎng)絡(luò)[3]。</p><p>  5.3 關(guān)鍵技術(shù)選擇</p><p>  5.3.1 虛擬化技術(shù)</p><p>

79、  目前服務(wù)器虛擬化有幾種主流的技術(shù):在86平臺(tái)上,有微軟的HyperV、VMware的ESX,以及開(kāi)源的Xen/KVM等;在小型機(jī)平臺(tái)上,IBM有PowerVM,HP有vPar,Sun則有Logical Domain和Solaris Container。[3]具體選用什么技術(shù),與以下因素有關(guān)。</p><p>  1.使用成本。商用的虛擬化軟件一般功能會(huì)更強(qiáng),技術(shù)支持會(huì)更好,但是價(jià)格昂貴。對(duì)于大規(guī)模部署來(lái)說(shuō),這

80、顯然是一個(gè)不小的投入。開(kāi)源的軟件一般來(lái)說(shuō)沒(méi)有購(gòu)買成本,但缺點(diǎn)是功能不如商業(yè)版本強(qiáng)大,支持有限。從技術(shù)上看,各種虛擬化技術(shù)都能實(shí)現(xiàn)類似的功能,比如虛擬機(jī)隔離、遷移和高可用等,這對(duì)于提供云計(jì)算服務(wù)來(lái)說(shuō)已經(jīng)足夠了。[15]舉例來(lái)說(shuō),亞馬遜EC2服務(wù)使用的就是Xen,而一些較小的服務(wù)提供商,有的使用VMware的產(chǎn)品。</p><p>  2.硬件類型。[16]在x86上,可以在多種技術(shù)之間選擇。而在小型機(jī)上,由于各個(gè)廠

81、商的虛擬機(jī)技術(shù)并不通用,因此使用哪個(gè)廠商的硬件就必須使用哪個(gè)廠商的虛擬化引擎。</p><p>  5.3.2 存儲(chǔ)體系結(jié)構(gòu)</p><p>  在設(shè)計(jì)云計(jì)算平臺(tái)的存儲(chǔ)體系結(jié)構(gòu)時(shí),不僅僅是需要考慮存儲(chǔ)容量的問(wèn)題。實(shí)際上,隨著硬盤容量的不斷擴(kuò)充以及硬盤價(jià)格的不斷下降,可以通過(guò)組合多個(gè)磁盤獲得很大的磁盤容量。相對(duì)于磁盤的容量,在云計(jì)算平臺(tái)的存儲(chǔ)中,磁盤數(shù)據(jù)的讀寫(xiě)速度是一個(gè)更重要的問(wèn)題,因此需要

82、對(duì)多個(gè)磁盤進(jìn)行同時(shí)讀寫(xiě)。這種方式要求將數(shù)據(jù)分配到多個(gè)節(jié)點(diǎn)的多個(gè)磁盤當(dāng)中。為達(dá)到這一目的,存儲(chǔ)技術(shù)有兩個(gè)選擇,一個(gè)是使用類似于Google File System的集群文件系統(tǒng),另一個(gè)是基于塊設(shè)備的存儲(chǔ)區(qū)域網(wǎng)絡(luò)SAN系統(tǒng)。</p><p>  在本計(jì)算平臺(tái)上,與藍(lán)云計(jì)算平臺(tái)類似,SAN系統(tǒng)與分布式文件系統(tǒng)(例如Google File System)并不是相互對(duì)立的系統(tǒng),SAN提供的是塊設(shè)備接口,需要在此基礎(chǔ)上構(gòu)建文

83、件系統(tǒng),才能被上層應(yīng)用程序所使用。而Google File System正好是一個(gè)分布式的文件系統(tǒng),能夠建立在SAN之上。兩者都能提供可靠性、可擴(kuò)展性,至于如何使用還需要由建立在云計(jì)算平臺(tái)上的應(yīng)用程序來(lái)決定,這也體現(xiàn)了計(jì)算平臺(tái)與上層應(yīng)用相互協(xié)作的關(guān)系。</p><p>  5.4內(nèi)部云架構(gòu)實(shí)例</p><p>  建立一個(gè)數(shù)據(jù)中心,需要進(jìn)行硬件選擇和采購(gòu),并對(duì)現(xiàn)有硬件進(jìn)行評(píng)估和分類,找出合

84、適的資源。同時(shí)根據(jù)自身需求和特點(diǎn)選擇IBM提供的技術(shù)和平臺(tái),構(gòu)架出一個(gè)合理的內(nèi)部云。我們不妨以萬(wàn)里學(xué)院為背景,嘗試架構(gòu)一個(gè)萬(wàn)里內(nèi)部私有云。</p><p>  5.4.1 架構(gòu)組成</p><p>  如圖4-2,給出了萬(wàn)里學(xué)院私有云的架構(gòu)方案,此平臺(tái)依照“藍(lán)云”計(jì)算平臺(tái)架構(gòu),由一個(gè)數(shù)據(jù)中心、IBM Tivoli部署管理軟件(Tivoli provisioning manager)、IBM

85、 Tivoli監(jiān)控軟件(IBM Tivoli monitoring)、IBM WebSphere應(yīng)用服務(wù)器、IBM DB2數(shù)據(jù)庫(kù)以及一些開(kāi)源信息處理軟件和虛擬化軟件共同組成[7]。</p><p>  TPM(Tivoli Provisioning Manager)負(fù)責(zé)數(shù)據(jù)中心資源自動(dòng)化管理,它可以自動(dòng)完成服務(wù)器、存儲(chǔ)器、網(wǎng)絡(luò)設(shè)備、操作系統(tǒng)、中間件、應(yīng)用程序的部署和配置任務(wù)。TPM通過(guò)工作流(Workflow)來(lái)

86、完成系統(tǒng)資源的部署,它使用預(yù)先構(gòu)建的“行業(yè)最佳實(shí)踐”工作流來(lái)提供對(duì)主要廠商的產(chǎn)品的控制和配置。同樣,TPM可以通過(guò)工作流方式進(jìn)行虛擬化平臺(tái)、虛擬機(jī)、虛擬部件的部署。對(duì)于部署包含虛擬化平臺(tái)的操作系統(tǒng),TPM的插件TPM for OS Deployment(TPM OSD)能夠通過(guò)網(wǎng)絡(luò)將包含Xen、VMware等虛擬化平臺(tái)的操作系統(tǒng)鏡像部署到裸機(jī)上。如圖4-3是TPM部署虛擬器件的示意圖。</p><p>  在運(yùn)行

87、時(shí)管理階段,最主要的兩個(gè)工作是監(jiān)控和操作。IBM在數(shù)據(jù)中心資源監(jiān)控方面的產(chǎn)品是ITM(IBM Tivoli Monitoring)服務(wù)器。該產(chǎn)品能夠提供統(tǒng)一的解決方案來(lái)監(jiān)控?cái)?shù)據(jù)中心中的所有關(guān)鍵資源,檢測(cè)瓶頸和潛在的問(wèn)題,在嚴(yán)重的情況下進(jìn)行自動(dòng)恢復(fù),不需要系統(tǒng)管理員手動(dòng)解決問(wèn)題。圖4-4是ITM監(jiān)控虛擬化環(huán)境的示意圖[17]。</p><p>  DB2是一種關(guān)系型數(shù)據(jù)庫(kù)系統(tǒng),具有較好的可伸縮性,提供高層次的數(shù)據(jù)利

88、用性、完整性、安全性、可恢復(fù)性,以及小規(guī)模到大規(guī)模應(yīng)用程序的執(zhí)行能力。</p><p>  WAS(IBM WebSphere Application Server)是IBM WebSphere軟件平臺(tái)的基礎(chǔ)和面向服務(wù)的體系結(jié)構(gòu)的關(guān)鍵構(gòu)件,WebSphere的其他所有產(chǎn)品都在它之上運(yùn)行。WebSphere Application Server提供了一個(gè)豐富的應(yīng)用程序部署環(huán)境,其中具有全套的應(yīng)用程序服務(wù),包括用于事

89、物管理、安全性、群集、性能、可用性、連接性和可伸縮性的功能。它與Java EE兼容,并為可與數(shù)據(jù)庫(kù)交互并提供動(dòng)態(tài)Web內(nèi)容的Java組件、XML和Web服務(wù)提供了可移植的Web部署平臺(tái)。</p><p><b>  5.4.2 硬件</b></p><p>  在購(gòu)買服務(wù)器時(shí),我們盡量選擇CPU核心多的服務(wù)器,在提高整合率的同時(shí),還可以大大節(jié)省VMware的CPU許可

90、費(fèi)用(CPU許可是按照物理CPU來(lái)計(jì)算的,因此核心越多,在同一CPU資源級(jí)別上核數(shù)越多的越省錢)。</p><p>  為服務(wù)器配置盡量多的內(nèi)存,根據(jù)實(shí)踐經(jīng)驗(yàn),在虛擬化應(yīng)用中遇到最多的問(wèn)題就是內(nèi)存不足,而不用過(guò)于追求CPU的主頻,通常以一個(gè)核心分配2-4GB的內(nèi)存來(lái)計(jì)算較適宜[18]。</p><p>  在預(yù)算許可的前提下,盡量使用刀片服務(wù)器。硬件平臺(tái)環(huán)境與一般的x86服務(wù)器集群類似,使

91、用刀片的方式增加了計(jì)算密度。萬(wàn)里學(xué)院場(chǎng)地有限,不可能為高性能計(jì)算中心或者網(wǎng)絡(luò)中心蓋專門的建筑,因此只能在現(xiàn)有的教學(xué)樓或者實(shí)驗(yàn)室里物色;其次是電力,高性能計(jì)算中心對(duì)電力的要求非常高,往往需要數(shù)百千伏安甚至更高。而刀片服務(wù)器占用空間少,對(duì)電力的要求也比機(jī)架服務(wù)器要低,還有維護(hù)方便、系統(tǒng)部署便捷等優(yōu)點(diǎn)。</p><p>  5.4.3 軟件(關(guān)鍵技術(shù))</p><p>  軟件平臺(tái)的特點(diǎn)主要體現(xiàn)

92、在虛擬機(jī)以及對(duì)于大規(guī)模數(shù)據(jù)處理軟件Apache Hadoop的使用上。Hadoop是開(kāi)源版本的Google File System軟件和MapReduce編程規(guī)范。</p><p>  虛擬化的方式有兩個(gè)級(jí)別,一個(gè)是在硬件級(jí)別上實(shí)現(xiàn)虛擬化,另一個(gè)是通過(guò)軟件實(shí)現(xiàn)虛擬化。</p><p>  硬件級(jí)別的虛擬化可以使用IBM p系列的服務(wù)器,獲得硬件的邏輯分區(qū)LPAR(logic partiti

93、on)。邏輯分區(qū)的CPU資源能夠通過(guò)IBM Enterprise Workload Manager來(lái)管理。通過(guò)這樣的方式加上在實(shí)際使用過(guò)程中的資源分配策略,能夠使相應(yīng)的資源合理地分配到各個(gè)邏輯分區(qū)。P系列系統(tǒng)的邏輯分區(qū)最小粒度是1/10顆中央處理器(CPU)。動(dòng)態(tài)邏輯分區(qū)技術(shù)實(shí)現(xiàn)了硬件資源的按需分配,它可以在無(wú)需重啟分區(qū)操作系統(tǒng)的情況下,動(dòng)態(tài)分配CPU、內(nèi)存和其他資源。采用POWER 5處理器的p系列服務(wù)器還擁有微分區(qū)(Micro Pa

94、rtitioning)功能,微分區(qū)是一種芯片級(jí)的虛擬化,它使動(dòng)態(tài)邏輯分區(qū)的資源調(diào)整功能不但能夠調(diào)整物理資源,還可移動(dòng)、增刪虛擬資源。微分區(qū)允許多個(gè)分區(qū)共享一組物理處理器的計(jì)算能力,以1/10的物理處理器為單位為分區(qū)分配資源[17]。</p><p>  VMware則是軟件級(jí)別上的虛擬化,能夠在一臺(tái)機(jī)器上同時(shí)運(yùn)行二個(gè)或更多Windows、DOS、Linux系統(tǒng)。與“多啟動(dòng)”系統(tǒng)相比,VMware采用了完全不同的概

95、念,多啟動(dòng)系統(tǒng)在一個(gè)時(shí)刻只能運(yùn)行一個(gè)系統(tǒng),在系統(tǒng)切換時(shí)需要重新啟動(dòng)機(jī)器,而VMware是真正“同時(shí)運(yùn)行”,多個(gè)操作系統(tǒng)在主系統(tǒng)的平臺(tái)上,就像標(biāo)準(zhǔn)Windows應(yīng)用系統(tǒng)那樣切換。</p><p>  存儲(chǔ)設(shè)備的選擇只要可靠、夠用即可,不需要盲目追求高端產(chǎn)品。存儲(chǔ)體系結(jié)構(gòu)包含類似于Google File System的集群文件系統(tǒng)以及基于塊設(shè)備方式的存儲(chǔ)區(qū)域網(wǎng)絡(luò)SAN[19]。</p><p>

96、;  5.4.3 架構(gòu)成本估算</p><p>  1.服務(wù)器。萬(wàn)里西校區(qū)有13000人左右,按最高峰30%來(lái)算,有3900個(gè)需求點(diǎn),根據(jù)不完全標(biāo)準(zhǔn)的虛擬化參數(shù),1邏輯CPU可提供10個(gè)虛擬機(jī)為標(biāo)準(zhǔn),服務(wù)器邏輯CPU需要390個(gè),如果采用8核CPU需要49個(gè)物理CPU,最高處理頻率為2.266GHz,而如果采用4核CPU則需要98個(gè)物理CPU,最高處理頻率為2.13GHz。</p><p>

97、;  內(nèi)存按每個(gè)虛擬機(jī)2G內(nèi)存配置需要7.8T(1000G商用參數(shù))的內(nèi)存。以IBM的服務(wù)器來(lái)說(shuō),單臺(tái)X3950服務(wù)器最大支持1.5T的內(nèi)存,則需配備服務(wù)器6臺(tái)。</p><p>  服務(wù)器還得具備高性能網(wǎng)卡,或者采用光纖接口,暫以4G的網(wǎng)卡計(jì)算。</p><p>  IBMX3950支持4個(gè)物理CPU可擴(kuò)展到8個(gè),考慮到穩(wěn)定性和冗余度,服務(wù)器可以采用13臺(tái)X3950,4路8核心CPU,1

98、024G的內(nèi)存。1個(gè)8核心至強(qiáng)7555,至少是3萬(wàn),49枚就是147萬(wàn),X3950在IBM的標(biāo)配下,估計(jì)20W/臺(tái),這樣服務(wù)器差不多花費(fèi)400萬(wàn)元人民幣。</p><p>  2.存儲(chǔ)設(shè)備。采用2個(gè)10T的存儲(chǔ)柜,一個(gè)光纖存儲(chǔ),用于直連物理主機(jī);一個(gè)網(wǎng)絡(luò),用于網(wǎng)絡(luò)數(shù)據(jù)存儲(chǔ)。這里成本預(yù)留20萬(wàn)元人民幣。</p><p>  3.虛擬軟件。按VMware vSphere 4.0 Enterpr

99、ise Plus(支持12CPU,無(wú)限內(nèi)存容量)+View 4(全組件)+vCenter的配置。</p><p>  vSphere按邏輯CPU數(shù)據(jù)來(lái)授權(quán),單個(gè)授權(quán)在3萬(wàn)左右,49個(gè)物理CPU,差不多147萬(wàn)人民幣。</p><p>  View4按點(diǎn)數(shù)計(jì)算,3900個(gè)虛擬桌面,按照每點(diǎn)150美元來(lái)算,需要3900×150×6.5=380萬(wàn)人民幣。</p>

100、<p>  軟件的費(fèi)用和硬件差不多,就算VMware捆綁能優(yōu)惠些,軟件成本保守估計(jì)也要500萬(wàn)人民幣。</p><p>  4.網(wǎng)絡(luò)環(huán)境。局域網(wǎng)至少也得需要千兆,機(jī)房的供電散熱設(shè)備,網(wǎng)絡(luò)交換機(jī)設(shè)備,光纖設(shè)備,這么一套弄下來(lái)花費(fèi)50萬(wàn)人民幣左右。</p><p>  其他的如外部安全服務(wù)器,防火墻設(shè)備,人力成本,后期運(yùn)維成本等暫不考慮到前期成本里。</p><

101、p>  按照前期成本=服務(wù)器硬件成本(400萬(wàn))+虛擬化軟件成本(500萬(wàn))+存儲(chǔ)設(shè)備成本(20萬(wàn))+網(wǎng)絡(luò)環(huán)境成本(50萬(wàn)),計(jì)算下來(lái)需要花費(fèi)970萬(wàn)人民幣。這個(gè)數(shù)目還是不小的,架構(gòu)起碼要維持20年的時(shí)間正常服務(wù),不然投入收入效益比可能為負(fù)的。</p><p><b>  6 結(jié)論</b></p><p>  本設(shè)計(jì)方案按照任務(wù)書(shū)的要求對(duì)私有云的幾個(gè)關(guān)鍵技術(shù)進(jìn)

102、行了詳細(xì)研究,給出了私有云的一般架構(gòu)以及以萬(wàn)里學(xué)院為背景的具體架構(gòu)。</p><p>  但由于研究條件的不足,架構(gòu)方案只是對(duì)IBM“藍(lán)云”平臺(tái)的一個(gè)改進(jìn),沒(méi)有進(jìn)行實(shí)際測(cè)試,硬件選型和關(guān)鍵技術(shù)選擇也都是處于一個(gè)理論階段,有待在以后的工作學(xué)習(xí)中不斷進(jìn)步。</p><p>  個(gè)人覺(jué)得私有云是個(gè)不錯(cuò)的概念,但被夸大的成分和炒作的嫌疑。事實(shí)上,采用何種架構(gòu)取決于你的需求:私有云、公共云、混合云或

103、者根本不使用云。在很多情況下,公共云是最具成本效益的解決方案,你并不需要先擁有私有云。</p><p><b>  參考文獻(xiàn)</b></p><p>  [1] 許翠英.私有云服務(wù)將在2012年前大行其道[J].通訊世界,2009,12,(179):53.</p><p>  [2] 云計(jì)算的網(wǎng)絡(luò)規(guī)劃——私有云[EB/OL],[2010-10-

104、23].</p><p>  http://www.searchnetworking.com.cn/showcontent_39904.htm</p><p>  [3] 朱近之等.智慧的云計(jì)算[M].北京:電子工業(yè)出版社,2010,3.</p><p>  [4] 百度百科.私有云[EB/OL],[2010-10-19].</p><p>

105、  http://baike.baidu.com/view/4000912.htm.</p><p>  [5] Michael Armburst, Armando Fox, Rean Griffith, et al. A View of Cloud Computing[J].Communications of the ACM,Volume 53 Issue 4,April 2010:50~57.</p&g

106、t;<p>  [6] 全面解析構(gòu)建私有云的兩大核心架構(gòu)組件[EB/OL],[2011-1-10].</p><p>  http://www.searchcloudcomputing.com.cn/showcontent_39605.htm</p><p>  [7] GHEMAWAT S GOBIOFFH, LEUNG P T. The Google file syste

107、m[C].Proceedings of the 19th ACM Symposium on Operating Systems Principles, New York: 2003:29-43.</p><p>  [8] YUY, ISARDM, FETTERLY D, et al.DryadLINQ. A system for genera purpose distributed data parallel

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論