2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩20頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、<p><b>  摘 要</b></p><p>  視頻壓縮的目標是在盡可能保證視覺效果的前提下減少視頻數(shù)據(jù)率。因此編碼是要消除數(shù)據(jù)中冗余部分。視頻壓縮比一般指壓縮后的數(shù)據(jù)量與壓縮前的數(shù)據(jù)量之比。由于視頻是連續(xù)的靜態(tài)圖像,因此其壓縮編碼算法與靜態(tài)圖像的壓縮編碼算法有某些共同之處,但是運動的視頻還有其自身的特性,因此在壓縮時還應考慮其運動特性才能達到高壓縮的目標。</p&g

2、t;<p>  數(shù)字視頻壓縮編碼是數(shù)字電視廣播系統(tǒng)中非常重要的環(huán)節(jié),主要解決電視信號數(shù)字化后所帶來的海量數(shù)據(jù)量如何能夠有效地存儲和傳輸?shù)膯栴}。近20年來,視頻/音頻壓縮編碼技術一直處于快速發(fā)展之中,新技術和新標準不斷涌現(xiàn),現(xiàn)代視頻/音頻壓縮編碼技術已經比較成熟,可以在保持較好圖像質量前提下,達到較高的壓縮比。</p><p>  數(shù)字視頻壓縮機理主要來源于數(shù)字視頻數(shù)據(jù)中存在大量的數(shù)據(jù)冗余而且人眼的視

3、覺系統(tǒng)特性也會帶來較大的冗余,所以本設計將以冗余信息為依據(jù),對視頻圖像進行壓縮編碼。</p><p>  關鍵詞:數(shù)字視頻,編碼,解碼</p><p><b>  目 錄</b></p><p><b>  1 緒 論1</b></p><p>  1.1 數(shù)字電視的發(fā)展1</p>

4、;<p>  1.2 數(shù)字電視的特點及組成2</p><p>  2 數(shù)字視頻壓縮編碼3</p><p>  2.1 視頻壓縮編碼的基本概念3</p><p>  2.2視頻壓縮編碼的標準4</p><p>  2.3視頻壓縮編碼的方法5</p><p>  2.3.1 預測編碼5</p

5、><p>  2.2.2 正交變換編碼6</p><p>  2.2.3 變字長編碼7</p><p>  3 信號源編碼器與解碼器9</p><p>  3.1 編碼器設計9</p><p>  3.1.1 MPEG-2編碼簡述9</p><p>  3.1.2 I、B、P幀編碼10&

6、lt;/p><p>  3.1.3 MPEG-2編碼器工作原理11</p><p>  3.2 解碼器設計13</p><p>  3.2.1 視頻基本碼流結構13</p><p>  3.2.2 MPEG-2解碼14</p><p><b>  總 結16</b></p>

7、<p><b>  致 謝17</b></p><p><b>  參考文獻18</b></p><p><b>  1 緒論</b></p><p>  1.1 數(shù)字電視的發(fā)展</p><p>  數(shù)字電視系統(tǒng)(Digatle Television)就是電視信

8、號的拍攝、編輯、發(fā)射、傳輸、接收、處理顯示等全過程都使用數(shù)字技術的電視系統(tǒng),數(shù)字電是未來家庭的數(shù)字多媒體處理和顯示終端。數(shù)字電視是一個大家庭,按照清晰度分為:高清晰度數(shù)字電視HDTV(HighDefinitionrrv)增強清晰度數(shù)字電視EDTV、標準清晰度數(shù)字電視SDTV和普通清晰度數(shù)字電視PDTV。HDT是目前數(shù)字電視的最高級別,不同清晰度級別的數(shù)字電視之間具有向下兼容性,高端產品可以兼容低端產品。</p><p

9、>  數(shù)字電視的圖像格式主要有兩種:高清晰度電視和標準清晰度電視,其名稱均包含著相應的技術要求。它是是現(xiàn)代文明的一個重要標志。在與人們工作生活密切相關的電腦、手機和電視三大信息平臺中,電腦和手機已實現(xiàn)了數(shù)字化和網(wǎng)絡化,為人們帶來了多姿多彩的資訊和娛樂服務,也為相關企業(yè)帶來了巨額利潤。數(shù)字電視將帶來數(shù)字生活方式的又一場驚天動地的革命。其中高清晰度電視的含義主要包括:</p><p> ?。?)圖像取樣格式不低

10、于1920×1080i(隔行)或1280×720P(逐行),圖像水平清晰度大于700線,重放效果相當于16nun電影膠片圖像質量水平。</p><p> ?。?)圖像幅型比為16:9,彩色顯像管蔭罩節(jié)距應小于0.6ram(以81cm彩色顯像管為例)。</p><p> ?。?)圖像、伴音信號傳輸方式為數(shù)字方式,并采用國際通用的數(shù)字電視信號壓縮、編碼、調制、解調方式。&l

11、t;/p><p> ?。?)聲音信號為獨立多聲道環(huán)繞立體聲。</p><p> ?。?)具有符合高清晰度顯示的掃描格式或行掃描頻率達28KHz以上。</p><p> ?。?)具備足夠的視頻信號帶寬,要求達到30MHz以上。</p><p>  標準清晰度電視的含義主要包括:</p><p> ?。?)圖像取樣格式為720

12、×576i,圖像水平清晰度大于500線,重放效果相當于DVD激光視盤機的質量水平。</p><p> ?。?)圖像幅型比為4:3(即傳統(tǒng)CRT型彩色電視幅型比)。</p><p> ?。?)圖像、伴音信號編碼傳輸方式為數(shù)字方式,并采用國際通用的數(shù)字電視信號壓縮、編碼、調制、解調方式。</p><p> ?。?)聲音信號為獨立多聲道環(huán)繞立體聲,目前暫以雙聲道

13、為主。目前,我國各個省、市、自治區(qū)試播數(shù)字電視節(jié)目只在個別有線電視網(wǎng)內試播。試播的電視節(jié)目,大多為標清晰度電視節(jié)目,其清晰度、圖像質量、伴音質量與DVD激光視盤機相同。因此,只在有試播任務的有線電視網(wǎng)內才能收看數(shù)字電視節(jié)目。</p><p>  1.2 數(shù)字電視的特點及組成</p><p>  數(shù)字電視系統(tǒng)由三部分組成:數(shù)字前端系統(tǒng)、雙向傳輸網(wǎng)絡和用戶終端系統(tǒng)。</p>&l

14、t;p>  其數(shù)字前端系統(tǒng)通常劃分為信源處理、信息處理和傳輸處理三部分,完成節(jié)目的數(shù)字化、加擾、授權和認證等功能;雙向傳輸網(wǎng)絡主要通過衛(wèi)星、Cable、地面發(fā)射、MMDS等方式將節(jié)目傳送到用戶家中,回傳可采用HFC回傳通道、PSTN和其它網(wǎng)絡;用戶終端系統(tǒng)采用機頂盒(STB)收看數(shù)字電視節(jié)目或實現(xiàn)交互式功能,如收看付費電視、實現(xiàn)Internet瀏覽、遠程教育等。</p><p>  因為傳統(tǒng)模擬電視傳送的圖

15、像信號和聲音信號是連續(xù)變化的電壓和電流,圖像的亮暗變化、聲音的大小都是以連續(xù)變化的電壓、電流大小來表征,而數(shù)字電視傳送的是不連續(xù)的“0”“1”脈沖信號,傳輸時首先要把連續(xù)變化的模擬信號經取樣、量化、壓縮編碼后,變?yōu)椴贿B續(xù)的二進制脈沖信號,其中包含著圖像亮暗和聲音大小的信息。所以數(shù)字電視具有非常明顯的優(yōu)點:</p><p> ?、贁?shù)字電視信號的噪波、失真與信號連續(xù)處理的次數(shù)無關,不會產生噪波、失真的累積。同時,數(shù)字

16、電視信號很容易實現(xiàn)檢錯與糾錯,抗干擾能力強,圖像、伴音信號傳輸質量很高。標準清晰度的數(shù)字電視(SDTV),圖像的清晰程度即達到DVD水平,伴音也達到環(huán)繞立體聲效果。</p><p> ?、跀?shù)字電視信號很容易實現(xiàn)存儲、控制與處理,存儲時間與信號特性無關,并可實現(xiàn)數(shù)字特技效果。例如凍結、放大、縮小、快放、慢放等特技處理。</p><p> ?、蹟?shù)字電視信號可以合理利用頻譜資源。在一個8MHz的

17、模擬電視頻道內,可以傳送一套頻譜達27MHz的高清晰度電視節(jié)目或傳送46套頻譜為6MHz的標準清晰度電視節(jié)目。也就是說,在現(xiàn)行750MHz的有線電視網(wǎng)絡中,傳送模擬電視最多只能容納70—80套節(jié)目,而用于傳送數(shù)字電視,節(jié)目容量可以超過500套,大大提高了用戶對電視節(jié)目多樣化、高質量的需求。</p><p> ?、軘?shù)字電視信號很容易實現(xiàn)信號的加密、解密,便于實現(xiàn)電視節(jié)目的條件接收。例如:付費電視、專用數(shù)據(jù)業(yè)務傳送等

18、。</p><p> ?、輸?shù)字電視系統(tǒng)具有可擴展性、可分級性和可操作性,便于實現(xiàn)各種交互式多媒體應用,能夠為用戶提供多元化資訊和數(shù)字增值服務。例如:視頻點播(VOD)、股市行情實時查詢及交易、互聯(lián)網(wǎng)接人、網(wǎng)頁瀏覽、電子郵件、網(wǎng)上購物等。</p><p> ?、迶?shù)字電視系統(tǒng)可以傳輸多聲道環(huán)繞立體聲伴音信號,提高了聲音信號的立體感、空間環(huán)繞感,使收聽者有身臨其境的視聽效果。數(shù)字電視系統(tǒng)的音頻信

19、號信噪比高、失真小、動態(tài)范圍大、頻響寬,是高質量的電視伴音。</p><p>  2 數(shù)字視頻壓縮編碼</p><p>  2.1 視頻壓縮編碼的基本概念</p><p>  視頻壓縮的目標是在盡可能保證視覺效果的前提下減少視頻數(shù)據(jù)率。由于視頻是連續(xù)的靜態(tài)圖像,因此其壓縮編碼算法與靜態(tài)圖像的壓縮編碼算法有某些共同之處,但是運動的視頻還有其自身的特性,因此在壓縮時還應

20、考慮其運動特性才能達到高壓縮的目標。在視頻壓縮中常需用到以下的一些基本概念:</p><p> ?。?)有損和無損壓縮:</p><p>  在視頻壓縮中有損(Lossy )和無損(Lossless)的概念與靜態(tài)圖像中基本類似。無損壓縮也即壓縮前和解壓縮后的數(shù)據(jù)完全一致。多數(shù)的無損壓縮都采用RLE行程編碼算法。有損壓縮意味著解壓縮后的數(shù)據(jù)與壓縮前的數(shù)據(jù)不一致。在壓縮的過程中要丟失一些人眼和

21、人耳所不敏感的圖像或音頻信息,而且丟失的信息不可恢復。幾乎所有高壓縮的算法都采用有損壓縮,這樣才能達到低數(shù)據(jù)率的目標。丟失的數(shù)據(jù)率與壓縮比有關,壓縮比越小,丟失的數(shù)據(jù)越多,解壓縮后的效果一般越差。此外,某些有損壓縮算法采用多次重復壓縮的方式,這樣還會引起額外的數(shù)據(jù)丟失。</p><p> ?。?)幀內和幀間壓縮:</p><p>  幀內(Intraframe)壓縮也稱為空間壓縮(Spat

22、ial compression)。當壓縮一幀圖像時,僅考慮本幀的數(shù)據(jù)而不考慮相鄰幀之間的冗余信息,這實際上與靜態(tài)圖像壓縮類似。幀內一般采用有損壓縮算法,由于幀內壓縮時各個幀之間沒有相互關系,所以壓縮后的視頻數(shù)據(jù)仍可以以幀為單位進行編輯。幀內壓縮一般達不到很高的壓縮。采用幀間(Interframe)壓縮是基于許多視頻或動畫的連續(xù)前后兩幀具有很大的相關性,或者說前后兩幀信息變化很小的特點。也即連續(xù)的視頻其相鄰幀之間具有冗余信息,根據(jù)這一特性

23、,壓縮相鄰幀之間的冗余量就可以進一步提高壓縮量,減小壓縮比。幀間壓縮也稱為時間壓縮(Temporal compression),它通過比較時間軸上不同幀之間的數(shù)據(jù)進行壓縮。幀間壓縮一般是無損的。幀差值(Frame differencing)算法是一種典型的時間壓縮法,它通過比較本幀與相鄰幀之間的差異,僅記錄本幀與其相鄰幀的差值,這樣可以大大減少數(shù)據(jù)量。</p><p> ?。?)對稱和不對稱編碼:</p&g

24、t;<p>  對稱性(symmetric)是壓縮編碼的一個關鍵特征。對稱意味著壓縮和解壓縮占用相同的計算處理能力和時間,對稱算法適合于實時壓縮和傳送視頻,如視頻會議應用就以采用對稱的壓縮編碼算法為好。而在電子出版和其它多媒體應用中,一般是把視頻預先壓縮處理好,爾后再播放,因此可以采用不對稱(asymmetric)編碼。不對稱或非對稱意味著壓縮時需要花費大量的處理能力和時間,而解壓縮時則能較好地實時回放,也即以不同的速度進

25、行壓縮和解壓縮。一般地說,壓縮一段視頻的時間比回放(解壓縮)該視頻的時間要多得多。例如,壓縮一段三分鐘的視頻片斷可能需要10多分鐘的時間,而該片斷實時回放時間只有三分鐘。</p><p>  2.2視頻壓縮編碼的標準</p><p>  視頻編碼標準主要由ITU-T和ISO/IEC開發(fā)。前者已經發(fā)布了視頻會議標準H.261、 H.262、 H.263,并且準備進行遠期編碼標準H.263L的

26、開發(fā),以期望獲得更大的編碼效率。ISO/IEC的標準系列包括:</p><p> ?、費PEG-1(1988~1992),可以提供最高達1.5Mbps的數(shù)字視頻,只支持逐行掃描。</p><p> ?、贛PEG-2(1990~1994),支持的帶寬范圍從2Mbps到超過20Mbps,MPEG-2后向兼容MPEG-1,但增加了對隔行掃描的支持,并有更大的伸縮性和靈活性。</p>

27、<p> ?、跰PEG-4(1994~1998),支持逐行掃描和隔行掃描,是基于視頻對象的編碼標準,通過對象識別提供了空間的可伸縮性。 </p><p>  ④MPEG-7(1996~2000),是多媒體內容描述接口,與前述標準集中在音頻/視頻內容的編碼和表示不同,它集中在對多媒體內容的描述。 除了上述通用標準外,還存在很多專用格式,比較流行的有:C-Cube的M-JPEG、Intel的IVI(tm

28、)(Indeo Video Interactive)、Apple的QuickTime(tm)、Microsoft的 Media Player(tm)和RealNetworks的RealPlayer(tm)。</p><p>  2.3視頻壓縮編碼的方法</p><p>  2.3.1 預測編碼</p><p>  預測編碼是通過消去統(tǒng)計相關冗余來實現(xiàn)數(shù)據(jù)壓縮的重要手

29、段之一,它建立在現(xiàn)代統(tǒng)計學和控制論的理論基礎上。由于電視圖像信號無論在空間域或時間域都存在很大的相關性,而且這些相關性使信源的條件熵大為降低。如何消去這些 冗余,使各像素之間得統(tǒng)計獨立性是預測編碼的首要任務。通過預測編碼,配合后邊的量化器與熵編碼器,可以有效地消除冗余,達到壓縮數(shù)碼率的目的。 </p><p>  預測編碼的基本方法是先利用某種數(shù)學模式對以前已知的相關數(shù)據(jù)進行運算,得出一個與當前實際傳送值相接近的

30、預測 值,進而把實際要傳送的數(shù)值減去預測值,得到一個誤差值,將這個誤差值編碼后傳送出去,故預測編碼也稱差值編碼或Δ編碼。預測編碼的關鍵是如何選用一種數(shù)學模式,使運算出的預測值盡可能與當前實際值相接近。但無論怎樣,要做到預測值與當前值總是相等是不可能的。盡管如此,預測值越接近將要發(fā)出的實際值,其差值越小,而且小差值出現(xiàn)的概率也越高,通過熵編碼后整個傳送系統(tǒng)的效率也越高,即壓縮效果越好。 如下圖1所示為預測編碼系統(tǒng)框圖。</p>

31、<p>  假設輸入樣值為Xn(即代表tn時刻的樣值),預測值為^nx(即代表tn時刻之前根據(jù)相關樣值x1、x2……xn-16所預測的樣值),令en為xn與^nx的差值信號,即</p><p><b>  en=xn—^nx</b></p><p>  又令enˊ為en量化之后的輸出信號。若量化誤差為Δx,則有</p><p>&

32、lt;b>  enˊ=xn+Δx</b></p><p>  收信端輸出的信號樣值為xnˊ,得到</p><p>  xnˊ=enˊ+^nx=en+Δx+^nx==^nx+Δx+^nx=xn+Δx</p><p>  式中,Δx為量化器產生的量化誤差,若不考慮量化器的影響,則有xnˊ=xn即表示收信端信號與發(fā)信端信號完全相同,為信息保持型編碼解碼器

33、。應當指出,發(fā)信端收信端所用的預測器組成形式是完全相同的,而且所有參與預測的相關樣值都是以前發(fā)出的并被保留在發(fā)、收兩端預測寄存器中的樣值,它們也是完全相同的,因而產生的預測值x也完全相同。所謂當前值,對發(fā)信端而言是指已經輸入和即將發(fā)出的樣值;對收信端而言則是指將要收到的未來值。在滿足信息保持的條件下,兩者應完全相同。</p><p>  2.2.2 正交變換編碼</p><p>  變換編

34、碼是指先對信號進行某種函數(shù)變換,從一種信號(空間)變換到另一種(空間),然后再對信號進行編碼。如將時域信號變換到頻域,因為聲音、圖像大部分信號都是低頻信號,在頻域中信號的能量較集中,再進行采樣、編碼,那么可以肯定能夠壓縮數(shù)據(jù)。變換編碼系統(tǒng)中壓縮數(shù)據(jù)有變換、變換域采樣和量化三個步驟。變換本身并不進行數(shù)據(jù)壓縮,它只把信號映射到另一個域,使信號在變換域里容易進行壓縮,變換后的樣值更獨立和有序。這樣,量化操作通過比特分配可以有效地壓縮數(shù)據(jù)。在變

35、換編碼系統(tǒng)中,用于量化一組變換樣值的比特總數(shù)是固定的,它總是小于對所有變換樣值用固定長度均勻量化進行編碼所需的總數(shù),所以量化使數(shù)據(jù)得到壓縮,是變換編碼中不可缺少的一步。在對量化后的變換樣值進行比特分配時,要考慮使整個量化失真最小。變換編碼是一種間接編碼方法。它是將原始信號經過數(shù)學上的正交變換后,得到一系列的變換系數(shù),再對這些系數(shù)進行量化、編碼、傳輸。</p><p>  目前常用的正交變換有:傅立葉 (Fouri

36、es)變換、沃爾什(Walsh)變換、哈爾(Haar)變換、斜(Slant)變換、余弦變換、正弦變換、K-L(Karhunen-Loeve)變換等。如下圖2所示為變換編碼系統(tǒng)框圖。  </p><p>  圖2 變換編碼系統(tǒng)框圖</p><p>  其中常用的是離散余弦變換(DCT),二維離散余弦變換的正反變換核相同,即</p><p>  (u=1,2,…M-1;

37、 v=1,2,…N-1)</p><p>  對應離散余弦變換為:</p><p>  (u=1,2,…M-1; v=1,2,…N-1)</p><p><b>  離散余弦逆變換為:</b></p><p>  (x=1,2,…M-1; y=1,2,…N-1)</p><p>  二維離散

38、余弦變換的變換核是可分離的,因而可通過兩次一維變換實現(xiàn)一個二維變換。</p><p>  2.2.3 變字長編碼</p><p>  變字長編碼(VLC)是將輸入的待編碼的符號映射成一系列可變字長的碼字,并且根據(jù)符號發(fā)送概率的不同而分配以不同的碼長的碼字,對于出項概率大的符號給以短碼,對于概率小的符號給你長碼,通過大量的編碼后,平均碼長小于按其他方法編碼得到的平均碼長,可以使總碼率降低,達

39、到去除數(shù)據(jù)的統(tǒng)計冗余,壓縮碼率的目的。VLC編碼的方法有很多,如哈夫曼編碼,游程編碼,算術編碼等。其中哈夫曼編碼是在數(shù)字電視壓縮編碼中常用的一種高效,簡單的方法,下面以Huffman為例介紹。</p><p>  哈夫曼編碼是常用的無損編碼方法,廣泛應用于圖像壓縮技術。JPEG標準中的基準模式采用的就是哈夫曼編碼。哈夫曼編碼是不定長編碼,即代表各元素的碼字長度不等。該編碼是基于不同符號的概率分布,對出現(xiàn)次數(shù)較多的

40、符號(碼值)賦予較短的代碼(碼字),對出現(xiàn)次數(shù)較少的符號賦予較長的代碼。在這里舉個例子說明如何生成哈夫曼。假設對由1、2、3、4、5、6、7、8八個數(shù)字組成的原信息進行哈夫曼編碼。首先應對信息中各數(shù)字出現(xiàn)的次數(shù)進行統(tǒng)計,得出各數(shù)字出現(xiàn)的相對概率。假設各數(shù)字出現(xiàn)的次數(shù)及概率如表1所示。</p><p>  表1 數(shù)字該量表        

41、;                         </p><p>  則根據(jù)表一生成的哈夫曼樹如圖3所示。</p><p>  圖3 哈夫曼樹結構圖

42、</p><p>  具體過程是這樣的,先將所有數(shù)字排成一行構成8個最底層節(jié)點。首先將這些節(jié)點中最小兩個概率值相加:0.05+0.1=0.15,   得到新的節(jié)點,這時擁有的概率值為0.2, 0.1, 0.1, 0.15, 0.15, 0.15, 0.15。再將兩個最小的概率值相加得到新的節(jié)點... ... 直到得到根節(jié)點概率為1.0為止。相加時,對于概率值相等的多個節(jié)點,可以任意選

43、取。除根節(jié)點外,設節(jié)點左邊分支為0,右邊分支為1(也可以反過來),對于各值(碼值)的代碼(碼字)就是從根節(jié)點出發(fā)到底層節(jié)點所經歷的分支序列。如4的代碼(碼字)為00,6的代碼為111... ...通常4和6等稱為碼值,00和111等稱為碼字。進行壓縮編碼時,只要將碼值用碼字代替即可。如果概率統(tǒng)計十分不準確,則壓縮效率會很低。甚至起不到壓縮效果。將所有碼值和碼字的關系整理成一張表,為了整字節(jié)輸出碼字,表中還含有各碼字的長度。這種表就稱為哈

44、夫曼表。本例哈夫曼表如表2所示。</p><p><b>  表2 哈夫曼表</b></p><p>  可見Huffman 編碼構造出的碼不唯一;Huffman 編碼字長參差不齊;Huffman編碼在信源編碼概率分布不均勻時效率高;效率比較均勻時,效率低,不用Huffman編碼;對出現(xiàn)頻率較高的碼分配短碼字;對出現(xiàn)頻率較低的碼分配長碼字。</p>&l

45、t;p>  3 信號源編碼器與解碼器</p><p><b>  3.1 編碼器設計</b></p><p>  3.1.1 MPEG-2編碼簡述</p><p>  MPEG是運動圖像專家組(Moving Picture Experts Group)的簡稱,其實質上的名稱為國際標準化組織(ISO)和國際電工委員會(IEC)聯(lián)合技術委員會

46、(JTC)1的第29 分委員會的第11工作組,即ISO/IEC JTC1/SC29/WG11,成立于1988年。其任務是制定世界通用的視音頻編碼標準。因為,廣播電視數(shù)字化所產生的海量數(shù)據(jù)對存儲容量、傳輸帶寬、處理能力及頻譜資源利用率提出了不切合實際的要求,使數(shù)字化難以實現(xiàn)。為此,該專家組基于幀內圖像相鄰像素間及相鄰行間的空間相關性和相鄰幀間運動圖像的時間相關性,采用壓縮編碼技術,將那些對人眼視覺圖像和人耳聽覺聲音不太重要的東西及冗余成分

47、拋棄,從而縮減了存儲、傳輸和處理的數(shù)據(jù)量,提高了頻譜資源利用率,制定了一系列MPEG標準,使數(shù)字化正在變?yōu)楝F(xiàn)實。其中,MPEG-2是一組用于視音頻壓縮編碼及其數(shù)據(jù)流格式的國際標準。它定義了編解碼技術及數(shù)據(jù)流的傳輸協(xié)議;制定了MPEG-2解碼器之間的共同標準(MPEG-2編碼器之間尚無共同標準)。</p><p>  MPEG-2視訊原始的主要目標是希望在位元率介于4到9Mbit/s間時,能對一般標準電視解析度的交

48、錯式視訊(Interlaced Video)提供一種新的編碼壓縮方法以得到更好的畫質。然而,MPEG-2的最終目標并未僅只于此,它也可以支援如HDTV等更高畫面解析度的視訊應用,以及各種畫面解析度下的交錯式視訊。如同其它MPEG標準,MPEG-2的視訊標準僅僅定義了資料的語義及語法,并未規(guī)定資料編碼及解碼的實作方法,因此這之間還有不少編解碼技術空間可以發(fā)揮。一個簡單的MPEG-2 Non-scalable視訊編解碼器(Codec),MP

49、EG-2視訊編碼器(Encoder)包含Inter Frame/Field離散馀弦變換(Discrete Cosine Transform,DCT)編碼器、Frame/Field動態(tài)估計及補償器(Motion Estimator and Compensator)、以及可變長度編碼器(Variable Length Encoder,VLE)。離散馀弦變換編碼器主要是利用空間上的冗馀(Spatial Redundancies),而動態(tài)估計及

50、補償器則是利用時間上的</p><p>  MPEG-2采用亮度色度的色彩表示格式,Y表示亮度值(Luminance),Cr及Cb表示色度值(Chrominance),并且從降低色度取樣來減少訊號量。MPEG-2中定義了4:2:0、4:2:2及4:4:4采樣格式。4:2:0表示四個Y取一個Cr一個Cb;4:2:2表示四個Y取兩個Cr兩個Cb;而4:4:4表示四個Y取四個Cr四個Cb,即不做任何的采度取樣減少。減少

51、色度采樣可以在盡量降低對視覺的影響下達到較大的資料縮減效果。 </p><p>  3.1.2 I、B、P幀編碼</p><p>  MPEG-2定義了三種畫面壓縮模式,I畫面、P畫面、B畫面?! ?lt;/p><p>  I畫面(Intra Coded Pictures):當大區(qū)塊僅使用本身的畫面資料進行空間的冗馀去除,并沒有參考其他畫面的資料,我們稱為Intra模式

52、大區(qū)塊(Intra Mode Macro-block)。在I畫面中,所有的大區(qū)塊皆為Intra模式大區(qū)塊。I畫面可以做為視訊資料流中的索引點,也是提供隨機存取能力的主要來源。I畫面通常在視訊序列或畫面群組的第一張,解碼時I畫面可獨立解碼,并做為P及B畫面的參考影像的來源。由于不須參考其他畫面,因此無法得到消除時間上冗馀的好處,因此壓縮率較差。   </p><p>  P畫面(Predictive Coded P

53、ictures):在編碼及解碼時,會使用參考畫面(Reference Picture),這些參考畫面可為該畫面前面最近的I畫面或P畫面。編碼時,在P畫面中的大區(qū)塊,若能在參考畫面上找到相對應的大區(qū)塊,則用動態(tài)補償方式做預測編碼(Predictive Coding);若找不到,則以Intra模式做編碼。由于加入消除時間上冗馀的技術,因此其編碼效率較高。   </p><p>  B畫面(Bi-directional

54、ly Predicted Pictures):在解碼及編碼時,會使用到前面及后面兩個方向參考畫面的資料。如同 P 畫面一樣,編碼時,在B畫面中的大區(qū)塊,若能在參考畫面上找到相對應的大區(qū)塊,則用動態(tài)補償方式做雙向預測編碼(Bi-directionally Predictive Coding);若找不到,則以Intra模式做編碼。B畫面擁有最高的編碼效率,然畫質最差,故本身不再做為其他預測編碼用。 如下圖4所示為I、B、P幀編碼預測示意圖。

55、</p><p>  圖4 I、B、P幀編碼預測示意圖</p><p>  3.1.3 MPEG-2編碼器工作原理</p><p>  編碼是MPEG-2標準的核心內容之一,其涉及到MPEG-2視頻流層結構、MPEG-2幀間編碼結構、MPEG-2的類與級、MPEG-2運動估值等技術。如下圖5所示為MPEG-2壓縮編碼原理框圖。</p><p>

56、;  圖5 MPEG-2 壓縮編碼原理框圖</p><p>  為了提高壓縮比及圖像質量,MPEG-2視頻編碼采用運動補償預測(時間預測+內插)消除時間冗余和不隨時間變化的圖像細節(jié);采用二維DCT(圖像像素+量化傳輸系數(shù))分解相鄰像素,消除觀眾不可見、不重要的圖像細節(jié);采用熵值編碼(已量化參數(shù)+編碼參數(shù)的熵),使bit數(shù)減少到理論上的最小值。MPEG-2:有逐行掃描方式,可以采用基于幀的圖像預測;有隔行掃描方式,

57、也可以采用基于場的圖像預測。因此,MPEG-2編碼器要對每個圖像先判斷是幀模式壓縮還是場模式壓縮。在隔行掃描方式下:運動少的場景時,采用基于幀的圖像預測,因為基于幀的圖像兩相鄰行間幾乎沒有位移,幀內相鄰行間相關性強于場內相關性,從整個幀中去除的空間冗余度比從個別場中去除得多;劇烈運動的場景時,采用基于場的圖像預測,因為基于幀的相鄰兩行間存在1場延遲時間,相鄰行像素間位移較大,幀內相鄰行間相關性會有較大下降,基于場的圖像兩相鄰行間相關性強

58、于幀內相鄰行間相關性,在1幀內,場間運動有很多高頻分量,從場間去除的高頻分量比從整個幀中去除的多。由上述可見,選擇基于幀的圖像預測還是基于場的圖像預測的關鍵是行間相關性。所以,在進行DCT之前,要作幀DCT編</p><p><b>  3.2 解碼器設計</b></p><p>  3.2.1 視頻基本碼流結構</p><p>  在數(shù)字電視

59、系統(tǒng)中,模擬視音頻信號按照MPEG-2的標準,經過抽樣、量化及壓縮編碼形成基本碼流ES,基本碼流ES是不分段的連續(xù)碼流。把基本碼流分割成段,并加上相應的頭文件打包形成的打包基本碼流PES,PES包和包之間可以是不連續(xù)的。如下圖6所示為視頻基本碼流結構。</p><p>  圖6 視頻基本碼流結構</p><p>  在傳輸時將PES包再分段打成有固定長度188B的傳送碼流TS或可變長度的節(jié)

60、目流包(PS包)。PES只是PS轉換為TS或TS轉換為PS的中間步驟或橋梁,時MPEG-2數(shù)據(jù)流互換的邏輯結構。TS和PS這兩種碼流分別適應于不同的場合應用,節(jié)目流PS適合在相對出錯較少的環(huán)境下使用,其長度是變化的,而傳送流TS能夠把多個節(jié)目在基于一個或多個時間標識的基礎上構成一個流,傳送流適合于出錯較多的場合下使用。用數(shù)據(jù)包傳輸?shù)膬?yōu)點是:網(wǎng)絡中信息可占用不同的連接線路和簡單暫存。通過數(shù)據(jù)包交織把多個數(shù)據(jù)流復用成一個新的數(shù)據(jù)流。便于解碼

61、器按照相應順序對數(shù)據(jù)包進行靈活的整理,從而,為數(shù)據(jù)流同步和復用奠定了基礎。MPEG-2的結構可分為壓縮層和系統(tǒng)層,其中ES屬于壓縮層,PES和TS/PS屬于系統(tǒng)層。在PES層,主要是在PES包頭信息中加入PTS(顯示時間標簽)和DTS(解碼時間標簽)用于視頻、音頻同步。而在TS流中,TS包頭加入了PCR(節(jié)目時鐘參考),用于解碼器的系統(tǒng)時鐘恢復。在節(jié)目流PS包頭中加入SCR,它的作用與PCR域相似。 ES是編碼視頻數(shù)據(jù)流或音頻數(shù)據(jù)流,每

62、個ES都由若干個存取單元(AU)組成,每個視頻</p><p>  3.2.2 MPEG-2解碼</p><p>  MPEG-2解碼是從編碼的比特流中重建圖像幀。MPEG-2解碼方框圖如下圖7所示。</p><p>  圖7 MPEG-2 解碼框圖</p><p>  由圖7可知,接收到的碼流經過TS流解復用和視頻PES包解復用后輸出視頻基

63、本流ES和運動矢量MV。ES經過反量化IQ和反DCT后輸出重建的宏塊差值ΔMB。輸入的PES stream先經過PES層的同步和視頻層的同步,然后進入前解析過程,將PES stream頭信息放于PES stream buffer中,將視頻、音頻碼流置于基本流Buffer中.再經解析過程,對從緩存器中讀出的碼流進行解析,分開用戶數(shù)據(jù)(user data)、頭信息,并將編碼數(shù)據(jù)送到IDCT單元等. 解碼電路框圖中沒有復雜的運動估計電

64、路,它直接用碼流中傳輸來的運動矢量(MV)進行運動補償,從幀存儲器中的讀出匹配宏塊MB,在加法器中與宏塊差值ΔMB相加,還原出相應的P、B圖像塊。在幀重排內得到一組GOP解碼圖像后,重排成編碼時輸入顯示圖像的原始序列。由于編解碼器中都有幀重排,結果使顯示圖像比原始圖像產生一定的延時,相對于聲音編解碼會導致畫面滯后于聲音,故需要相應的延時補償。</p><p>  MPEFG-2中編碼與解碼電路不是一一對應的,編碼

65、復雜,解碼簡單,因為解碼所需要的許多參數(shù)如運動預測值和量化值矩陣等都在傳輸碼流中以規(guī)定的句法元素格式提供給接收端,由解碼器直接使用就可以了。因此,不同廠家可以設計出不同特點的編碼器。然而,任何一個解碼器應對任何編碼器給出的碼流都能正確地解碼。</p><p><b>  總 結</b></p><p>  經過此次電視機課程設計使我對數(shù)字電視的概念有了更清晰的認識,了

66、解了數(shù)字電視的優(yōu)點和發(fā)展概況,掌握了數(shù)字電視的基本組成;熟悉了視頻壓縮編碼的各種方法,掌握MPEG-2編碼器原理;尤其對于MPEG-2的編解碼原理有了更進一步的認識,雖然以前上課老師也講述了該部分的內容和知識,但感覺自己還是迷迷糊糊的,但是這次課程設計卻讓收獲頗大,不僅是這塊的知識,而且對于整個數(shù)字電視機的認識,可以說是有了質的的飛躍。</p><p>  誠然,在此次課程設計中我也遇到了許多問題,但是通過查閱資

67、料我都得到了解決,這為我以后的學習工作會帶來借鑒,雖然里面的有一些原理我還是不太熟練,沒有牢牢掌握,但是在今后的學習中我會更加注重這一方面的補充。</p><p><b>  致 謝</b></p><p>  通過近兩周的努力,終于將電視機課程設計完成了,在完成課程設計的這兩周中,xx老師給予了我很大的幫助。她不僅是指導我完成了設計,還教會了我做設計的一般步驟、設計

68、思想和設計方法。尤其是在對其中涉及到編碼器工作原理時,她不辭辛勞的給我講解,讓我對電視機信號源的編碼解碼方法有了本質的認識,同時學會了高效率的查閱資料的方法,使我在很短的時間就能把握全局,寫出設計大綱,而且當我對此課程設計無從下手的時候,xx老師專心地為我講解,為我解決了很多實際存在的困難和問題。她在實驗室里為我們梳理流程,講解原理,使我對此次的課程設計能圓滿完成增添了很多信心,真正的從心理和解決實際問題上為我樹立了很好的榜樣,我為能有

69、這樣的好老師而感覺到驕傲,在此我衷心的感謝一直不辭辛勞為我指明方向的xx老師,也要感謝教會我知識的學校為我提供實踐的場所和實踐器材。通過這次的課程設計,不僅使我學到了很多專業(yè)方面的知識,也讓我明白了不畏困難、勇于攀登艱難的重要性,這對我未來的學習和生活產生很大的影響。</p><p><b>  參考文獻</b></p><p>  【1】 蔣秀華.現(xiàn)代電視機原理[M

70、]. 北京高等教育出版社,2008. </p><p>  【2】 李海霞.電視機原理實驗指導書[M]. 鄭州黃河科技學院,2008. </p><p>  【3】 裴昌辛.電視原理與現(xiàn)代電視系統(tǒng)[M].西安電子科技大學出版,1997. </p><p>  【4】 趙堅勇.電視原

71、理與接收技術[M]. 北京:國防工業(yè)出版社,2007. </p><p>  【5】劉達.數(shù)字電視技術[M]. 北京:電子工業(yè)出版社,2007. </p><p>  【6】解玉琢.MPEG-2運動圖像編碼國家標準及MPEG的新進展[M].清華大學出 版社

72、,2002. </p><p>  【7】GB/T 14857-1993,演播室數(shù)字電視編碼參數(shù)規(guī)范(等效ITU-R BT601) </p><p>  【8】GB/T 17975.2-2000,信息技術“運動圖像及伴音信息的通用編碼”第2部分視頻(等效ISO/IEC 13818-2)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論