基于3d小波的可伸縮性立體圖像編碼研究【畢業(yè)論文】_第1頁
已閱讀1頁,還剩44頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、<p><b>  本科畢業(yè)設(shè)計</b></p><p><b> ?。?0 屆)</b></p><p>  基于3D小波的可伸縮性立體圖像編碼研究</p><p>  所在學(xué)院 </p><p>  專業(yè)班級 電子

2、信息工程 </p><p>  學(xué)生姓名 學(xué)號 </p><p>  指導(dǎo)教師 職稱 </p><p>  完成日期 年 月 </p><p><b>  摘 要</b>

3、</p><p>  隨著Internet網(wǎng)絡(luò)、無線通信技術(shù)以及交互式多媒體技術(shù)的飛速發(fā)展,數(shù)據(jù)、語音、多媒體業(yè)務(wù)的需求在不斷增加,人們對于這些業(yè)務(wù)的服務(wù)質(zhì)量的期望也越來越高。因為立體圖像具有相當(dāng)大的數(shù)據(jù)量,給信息的存儲和傳輸造成了極大的阻礙,因此,必須采取有效的編碼技術(shù)來降低數(shù)據(jù)量。近年來,小波理論方面的研究的不斷深入,基于小波變換的圖像編碼技術(shù)已經(jīng)得到普遍地采用。其中,基于3D小波的視頻圖像編碼技術(shù)已經(jīng)引起廣

4、泛關(guān)注,并且表現(xiàn)出其優(yōu)異的性能和良好的發(fā)展前景。</p><p>  本文主要研究一種嵌入式最優(yōu)切斷塊編碼技術(shù)(3D-EBCOT)。先對輸入圖像進行三維小波變換(3D-DWT),變換后形成不同頻率子帶,再把不同的子帶分割成不同的碼塊。然后提出一種3D-EBCOT小波編碼器,該編碼器對不同碼塊運用相同的編碼算法。此編碼器產(chǎn)生的碼流具有分辨率可伸縮性,信噪比可伸縮性等優(yōu)點,同時可以實現(xiàn)比特精確控制,滿足定速率傳輸應(yīng)用

5、的需要。這種編碼技術(shù)無需運動補償估計,降低計算負(fù)荷和時間延遲。因為提供分辨率、時域和質(zhì)量上的可伸縮性,易于在互聯(lián)網(wǎng)上傳輸。實驗結(jié)果表明,此圖像編碼可以很好的保證圖像恢復(fù)的質(zhì)量并能夠把圖像中不重要的信息進行剔除,使圖像傳輸過程中的數(shù)據(jù)量得到有效壓縮。</p><p>  關(guān)鍵詞:EBCOT算法;小波變換;立體圖像編碼;碼塊</p><p><b>  Abstract</b&

6、gt;</p><p>  With the development of Internet network, wireless communication, and interactive multimedia, the demand of data, voice and multimedia business is increasing, and people’s expectation on the bus

7、iness’s quality of service is becoming higher. But the data quantity of stereo images is so large that it is necessary to be reduced due to the difficulty for storage and transmission. Nowadays, Image coding based on wa

8、velet transform has been used in all areas of image coding. Video coding based on thre</p><p>  In this thesis, we research the technology of image coding based on Embedded Block Coding with Optimized Trunca

9、tion algorithm (3D-EBCOT). First, we need to make a 3d-wavelet transform (3D-DWT) for the putting image. It becomes some sub-bands which have different frequency. Different sub-bands divided into different code-block .Th

10、en an improved 3D-EBCOT coder is developed based on the EBCOT coding algorithm and the encoder can be full use of the same coding algorithm to encoding for different cod</p><p>  Key Words: EBCOT algorithm;

11、wavelet transform; stereo image coding; code-block</p><p><b>  目 錄</b></p><p>  1 引 言- 1 -</p><p>  2 基于小波變換的立體圖像編碼原理分析- 3 -</p><p>  2.1小波變換原理- 3 -<

12、/p><p>  2.1.1連續(xù)小波變換- 3 -</p><p>  2.1.2 離散小波變換- 5 -</p><p>  2.2 小波的分解與重構(gòu)- 5 -</p><p>  2.3 圖像的小波變換編碼- 8 -</p><p>  2.3.1 DCT+矢量量化的壓縮- 8 -</p>

13、<p>  2.3.2 嵌入式零樹編碼EZW- 9 -</p><p>  2.3.3 基于等級樹集合分割編碼SPIHT- 10 -</p><p>  2.3.4 嵌入式最優(yōu)切斷塊編碼EBCOT- 10 -</p><p>  3 基于三維小波的圖像分解- 12 -</p><p>  3.1 二維小波變換- 12 -

14、</p><p>  3.2 三維小波變換- 13 -</p><p>  4 基于3D-EBCOT的立體圖像編碼- 16 -</p><p>  4.1 基于3D小波可伸縮性立體圖像編碼系統(tǒng)- 16 -</p><p>  4.2 質(zhì)量層- 16 -</p><p>  4.3 位平面編碼- 17 -&l

15、t;/p><p>  4.4 MQ熵編碼- 18 -</p><p>  5 實 驗 結(jié) 果- 20 -</p><p>  6 結(jié)論與展望- 22 -</p><p>  6.1全文總結(jié)- 22 -</p><p>  6.2工作展望- 22 -</p><p>  致謝錯誤!未定

16、義書簽。</p><p>  附錄 1 算法源程序- 26 -</p><p>  附錄 2 科研論文- 36 -</p><p><b>  1 引 言</b></p><p>  計算機、網(wǎng)絡(luò)技術(shù)和通信為核心的信息技術(shù)已成為現(xiàn)代社會的主流,推動著社會從工業(yè)經(jīng)濟時代向信息潮流時代發(fā)展,人們越來越多的借助數(shù)字技術(shù)與計

17、算機技術(shù)來獲取和利用圖像信息。因數(shù)字化后的立體圖像[1]具有龐大的數(shù)據(jù)量,這與計算機硬件的存儲設(shè)備和網(wǎng)絡(luò)寬帶之間存在著很大的不對等。因此,這使得圖像信息的存儲和傳輸成為人們有效、正確的獲取這些信息的一個瓶頸。如何對立體圖像進行有效、高質(zhì)量的編碼已經(jīng)成為今天一個重要技術(shù)。</p><p>  在多媒體、高清晰度電視、可視電話、視頻會議等視頻通信服務(wù)中,視頻編碼技術(shù)起著不可估量的作用,具有廣闊的應(yīng)用前景和巨大的市場價

18、值。在對圖像編碼的過程中,一方面要保證有較高的圖像恢復(fù)質(zhì)量,另一方面又要求在傳輸過程中能夠盡可能的降低碼率。因此,對于能夠兼具兩者特性的編碼方案一直是研究者追求的最終目標(biāo)。通過不斷的改進理論和大量的實踐運用,基于小波變換方法開始被采用。由于小波變換具有DCT變換所不具有的時頻局部性等特性,將小波變換應(yīng)用于圖像處理等領(lǐng)域可取得比傳統(tǒng)的DCT變換更好的效果,尤其是在數(shù)字圖像編碼領(lǐng)域,基于小波變換的壓縮技術(shù)可取得比基于DCT變換更高壓縮比。隨

19、著對于小波變換研究的不斷深入,在近年來的編碼研究中,基本于三維小波變換的編碼算法[3]得到廣泛的關(guān)注。這不僅是因為它具有局部時頻特性,更能捕捉圖像的非平穩(wěn)信息,可以獲得更高的壓縮比,更重要的它支持可伸縮性編碼,且它的可分級編碼能力有效的避免了動運估計,降低了復(fù)雜度,有效地防止了誤碼傳遞問題。在眾多基于三維小波變換的圖像編碼技術(shù)中,嵌入式最優(yōu)切斷塊編碼(EBCOT)技術(shù)以其簡單、高效的性能、良好的嵌入式碼流特性被學(xué)術(shù)界公認(rèn)為是一種非常&l

20、t;/p><p>  2 基于小波變換的立體圖像編碼原理分析</p><p>  在很長的一段時間里,研究者對于信號分析的主要運用工具是Fourier變換。但隨著不斷的深入研究,F(xiàn)ourier變換逐漸暴露了它在某些方面的局限性。Fourier變換作為一種純頻域的分析方法,它只能從信號的時域和頻域分別觀察,無法把兩者有機的結(jié)合在一起,這造成了時域和頻域的局部化矛盾,這對于分析非平穩(wěn)信號是非常不利

21、的。在今天的理論研究和應(yīng)用技術(shù)研究中,研究者已經(jīng)把重心投入到小波分析這個最新的領(lǐng)域。小波分析具有優(yōu)良的時頻局部化能力,它可以把每個信號表示成一個或有限個性質(zhì)良好的信號經(jīng)過平移和伸縮所得到信號的疊加,且伸縮特性可以決定信號的不同分辨率。還可以根據(jù)平移和伸縮得到的改變決定了這種表示可以聚焦于不同時刻,且這種方式對高頻分量采用取漸近式精細(xì)化的時域采樣步長,從而可以聚焦到信號的任意細(xì)節(jié)。小波變換[6][7]的這些突出優(yōu)點,必將使其廣泛的應(yīng)用于社

22、會的各個科技領(lǐng)域。原由上講,傳統(tǒng)上使用Fourier變換,都可以用小波變換來代替。</p><p><b>  2.1小波變換原理</b></p><p>  2.1.1連續(xù)小波變換</p><p>  所謂上波(Wavelet),即存在于一個較小區(qū)域的波。小波函數(shù)就是對這些小波的數(shù)學(xué)定義。小波函數(shù)的數(shù)學(xué)定義是:設(shè) 錯誤!未找到引用源。為一平方

23、可積函數(shù),即 錯誤!未找到引用源。,若其傅立葉變換 錯誤!未找到引用源。滿足條件,公式(2-1):</p><p>  錯誤!未找到引用源。 (2-1)</p><p>  則稱 錯誤!未找到引用源。為一個基本小波或小波母函數(shù),并稱上式是小波函數(shù)的可容許條件。根據(jù)可容許條件可知 錯誤!未找到引用源。,小波具有正負(fù)交替的波動性。</p><p

24、>  將小波線函數(shù) 錯誤!未找到引用源。進行伸縮和平移,設(shè)其伸縮因子為a,因為伸縮性體現(xiàn)了一種尺度的變化,所以我們也把伸縮因子稱為尺度因子,平移因子為 錯誤!未找到引用源。,并記平移伸縮后的函數(shù)為 錯誤!未找到引用源。,公式(2-2):</p><p><b>  (2-2)</b></p><p>  并稱 錯誤!未找到引用源。為參數(shù)為a和 錯誤!未找到引用源

25、。的小波基函數(shù)。由于a和 錯誤!未找到引用源。均取連續(xù)變化的值,因此又稱之為連續(xù)小波基函數(shù),它們是由同一個母函數(shù) 錯誤!未找到引用源。經(jīng)伸縮和平移后得到的一組函數(shù)系列。</p><p>  將 錯誤!未找到引用源??臻g的任意函數(shù) 錯誤!未找到引用源。在小波基下進行展開,稱其為函數(shù) 錯誤!未找到引用源。的連續(xù)小波變換CWT,變換式為,公式(2-3):</p><p><b> ?。?/p>

26、2-3)</b></p><p>  當(dāng)所有小波的容許性條件成立時,其逆變換存在,公式(2-4):</p><p><b>  (2-4)</b></p><p>  根據(jù)CWT的定義可知,小波變換同傅立葉變換一樣,也是一種積分變換,稱 錯誤!未找到引用源。為小波變換系數(shù)。由于小波基具有尺度和位移兩個參數(shù),因此將小波基展開意味著將一

27、個時間函數(shù)投影到二維的時間-尺度相平面上,函數(shù)投影到小波變換域后,有利于提取某些特征。圖2-1直觀地體現(xiàn)了,連續(xù)小波變換伸縮性和平移性:</p><p>  圖2-1連續(xù)小波變換過程</p><p>  2.1.2 離散小波變換</p><p>  連續(xù)上波變換中的伸縮因子和平移因子都是連續(xù)變化的實數(shù),在應(yīng)用中需計算連續(xù)積分,在處理數(shù)字信號時很不方便。在實際問題中,

28、我們常采用離散小波變換(DWT),即對連續(xù)小波基函數(shù)進行離散化,這可以減少小波變換系數(shù)的冗余度。通常取 錯誤!未找到引用源。,相應(yīng)位移間隔取 錯誤!未找到引用源。,得到離散小波函數(shù),公式(2-5):</p><p><b> ?。?-5)</b></p><p>  把t軸用 錯誤!未找到引用源。歸一化,就可以得到,公式(2-6):</p><p&

29、gt;<b> ?。?-6)</b></p><p>  對于任意函數(shù) 錯誤!未找到引用源。的離散小波變換DWT為,公式(2-7):</p><p><b>  (2-7)</b></p><p>  從對離散小波的理論研究中,可以證明從連續(xù)小波變換到離散小波變換,信號的基本信息并不會有所丟失,反而通過離散變換消除了因冗余

30、度造成的關(guān)聯(lián)性。同時,還減少了計算的誤差。</p><p>  2.2 小波的分解與重構(gòu)</p><p>  小波變換所得的小波系數(shù)仍含有大量的冗余性,從數(shù)值計算和數(shù)據(jù)壓縮的角度來看,希望得到一組正交小波基。如何構(gòu)成一個正交基,可以通過多分辨率分析方法來實現(xiàn)。</p><p>  多分辨率分析(Multi-resolution Analysis MRA)又稱多尺度

31、分析,這是建立在函數(shù)空間概念的理論。MRA不僅為正交小波基的構(gòu)造提供了簡單的方法,而且為正交小波變換的快速算法提供了理論依據(jù)。</p><p>  定義函數(shù) 錯誤!未找到引用源。為尺度函數(shù),若整數(shù)位移系列 錯誤!未找到引用源。滿足正交關(guān)系,公式(2-8):</p><p><b> ?。?-8)</b></p><p>  定義由 錯誤!未找到

32、引用源。在 錯誤!未找到引用源。空間張成的空間為 錯誤!未找到引用源。,稱為零尺度空間。對于 錯誤!未找到引用源??臻g的任意 錯誤!未找到引用源。,公式(2-9):</p><p><b>  (2-9)</b></p><p>  若將尺度函數(shù) 錯誤!未找到引用源。同時進行位移和尺度伸縮,得到一個函數(shù)集合,公式(2-10):</p><p>

33、<b> ?。?-10)</b></p><p>  把 錯誤!未找到引用源。 在 錯誤!未找到引用源??臻g張成的空間為j的尺度空間,對于 錯誤!未找到引用源??臻g的任意 錯誤!未找到引用源。,公式(2-11):</p><p><b> ?。?-11)</b></p><p>  因為每一個子空間之間是互補,能夠形成嵌套

34、序列,給予了多分辨率分析非常豐富的特性:</p><p><b>  單調(diào)性:</b></p><p>  …… 錯誤!未找到引用源?!?(2-12)</p><p><b>  逼近性:</b></p><p><b> ?。?-13)</b></

35、p><p><b>  位移不變性:</b></p><p><b>  (2-14)</b></p><p><b>  伸縮性</b></p><p><b> ?。?-15)</b></p><p><b>  正交基存

36、在性:</b></p><p>  存在 錯誤!未找到引用源。,使得 錯誤!未找到引用源。 (2-16)</p><p>  我們把公式(2-16)中的 錯誤!未找到引用源。,稱為多分辨率的尺度函數(shù)。</p><p>  多分辨率分析理論讓我們在討論信號的局部信息的時候 ,提供了一個相當(dāng)直觀的框架,這對非平穩(wěn)信號的處理十分重要。因非平穩(wěn)信號的頻

37、率隨時間而變化,我們把這種變化分成兩個部分:變化緩慢和變化快速。變化緩慢的部分針對信號的低頻部分,用于表示信號的主要信息;而變化快速的部分針對信號的高頻部分,用于表示信號的細(xì)節(jié)。研究者Mallat經(jīng)過深入的分析,提出了著名的塔式算法,即</p><p><b> ?。?-17)</b></p><p><b> ?。?-18)</b></p

38、><p>  公式中的 錯誤!未找到引用源。、 錯誤!未找到引用源。是由尺度函數(shù)和小波函數(shù)決定的,稱為濾波器系數(shù)。其中, 錯誤!未找到引用源。相當(dāng)于低通濾波器, 錯誤!未找到引用源。相當(dāng)于高通濾波器。</p><p><b>  重構(gòu)公式:</b></p><p><b> ?。?-19)</b></p><

39、;p>  由塔式算法可以得出離散序列的多分辨率電路結(jié)構(gòu)圖,如圖2-2所示:</p><p>  圖2-2 三次分解電路結(jié)構(gòu)</p><p>  由分解電路結(jié)構(gòu)分析,這里把 錯誤!未找到引用源??醋鞒跏茧x散序列,在分解過程中相當(dāng)于對這個序列進行雙通道濾波。因 錯誤!未找到引用源。具有低通性質(zhì),從中可知輸出為離散信號的概貌,而 錯誤!未找到引用源。具在高通性質(zhì),從中可知輸出為離散信號的

40、高頻細(xì)節(jié)。</p><p>  同樣,我們可從重建公式中得出重建電路結(jié)構(gòu),如圖2-3所示:</p><p>  圖2-3 三次重建電路結(jié)構(gòu)圖</p><p>  2.3 圖像的小波變換編碼</p><p>  圖像信號經(jīng)過小波多分辨率分解之后被分解成了不同頻率的信號帶,根據(jù)這一特性,研究者提出了多種基于小波變換的編碼算法。其中,嵌入式零樹

41、編碼EZW算法、基于分層集分割編碼SPIHT算法[3][4]、DCT+矢量量化的壓縮算法和嵌入式最優(yōu)切斷塊EBCOT算法被普遍采用。而本文我們要研究是嵌入式最優(yōu)切斷塊編碼EBCOT算法,將在第三章節(jié)中詳細(xì)分析。</p><p>  2.3.1 DCT+矢量量化的壓縮</p><p>  經(jīng)過小波多分辨率分解之后,得到的低頻部分仍保持原圖像的概貌,因此可以使用JPEG的ADCT進行編碼。對

42、于高頻部分,可以得到3個方向的子帶各自包含了原圖像中在水平、垂直和對角線方向的高頻分量。但大部分區(qū)域變化幅度較低,且能量較低,而能量高,變化大的區(qū)域集中在圖像內(nèi)物體的邊緣部分,并保持著物體的結(jié)構(gòu)特征,針對高頻帶內(nèi)的分布特點這里采用高效的矢量量化方法進行編碼。</p><p>  2.3.2 嵌入式零樹編碼EZW</p><p>  根據(jù)小波系數(shù)的統(tǒng)計分布規(guī)律,提出了嵌入式零樹小波EZW算法

43、。什么是嵌入式編碼?指編碼器將待編碼的比特流按重要性的不同進行排序,根據(jù)目標(biāo)碼率或失真度大小要求隨時結(jié)束編碼。此編碼包括三部分:小波多分辨率分解、零樹編碼、比特面逐步近似量化。</p><p><b>  小波多分辨率分解</b></p><p>  利用小波多分辨率分解,將原始圖像變換為一個低頻帶 錯誤!未找到引用源。和 錯誤!未找到引用源。個高頻帶部分。</

44、p><p><b>  零樹編碼</b></p><p>  首先用四杈樹建立不同分辨率下子帶系數(shù)的父子關(guān)系。對變換系數(shù)量化后,出現(xiàn)零樹的可能性很大,可以產(chǎn)生四類不同的系數(shù):零樹根、正值、復(fù)值和孤立零值,如圖2-4所示:</p><p>  圖2-4 三級二維小波變換后的小波變換系數(shù)及樹型關(guān)系</p><p><b&

45、gt;  比特面逐步近似量化</b></p><p>  為了得到嵌入式碼流,用類似于比特面的編碼傳輸,按2的冪次遞減的次序?qū)Ω髯訋У淖儞Q系數(shù)進行掃描量化。根據(jù)作用的不同,分別進行主掃描和從掃描。同時,為提高編碼效率,采用自適應(yīng)算術(shù)編碼對掃描輸出符號進行編碼。</p><p>  2.3.3 基于等級樹集合分割編碼SPIHT</p><p>  根據(jù)比特

46、面編碼等逐漸傳輸圖像編碼的原理和EZW的基礎(chǔ)上,提出了一種改進的逐漸傳輸方法來傳送多分辨率分解后的變換圖像,即SPIHT算法[5]。主要分成兩個基本步驟:</p><p>  根據(jù)系數(shù)的大小進行排序</p><p>  首先傳送每個系數(shù)的二進制表示中的高有效位(MSB)</p><p>  設(shè)圖像像素為 錯誤!未找到引用源。,根據(jù)每個像素系數(shù)所需的最少有效比特數(shù),對

47、其進行排序后得到一個結(jié)果 錯誤!未找到引用源。,k代表 錯誤!未找到引用源。的各個比特,并知道接收端落在區(qū)間 錯誤!未找到引用源。內(nèi)系數(shù)的個數(shù) 錯誤!未找到引用源。。</p><p><b>  具體的算法:</b></p><p><b> ?、?初始化:</b></p><p>  輸出 錯誤!未找到引用源。,發(fā)送給解

48、碼端</p><p><b> ?、诜诸惻c細(xì)化:</b></p><p>  分類:輸出 錯誤!未找到引用源。,接著輸出相應(yīng) 錯誤!未找到引用源。個像素的坐標(biāo)和值的符號,必須要滿足:</p><p>  細(xì)化:輸出所有絕對值大于 錯誤!未找到引用源。的系數(shù)的第n位比特,比特輸出的順序與分類時各像素標(biāo)的順序相同。</p><p

49、><b> ?、踤減1,轉(zhuǎn)至②</b></p><p>  2.3.4 嵌入式最優(yōu)切斷塊編碼EBCOT</p><p>  該算法是一種對小波變換產(chǎn)生的子帶系數(shù)進行量化和編碼的方法。對每一個子帶所具有的小波變換系數(shù)分成不同的碼塊,每一個碼塊都采用相同的編碼算法。對碼塊進行編碼的過程中,不涉及其它碼塊信息。每一個碼塊可被截斷成不同的位流,有效的做到了對位速率的控制

50、。圖像的最終碼塊位流以質(zhì)量層的形式組織,每一層都包含每一個碼塊對圖像質(zhì)量的貢獻。在編碼的過程中,要充分的考慮到位速率失真的問題,選取最佳的位速率失真值。在圖像恢復(fù)的時候,盡最大可能保證圖像恢復(fù)的質(zhì)量。</p><p>  3 基于三維小波的圖像分解</p><p>  3.1 二維小波變換</p><p>  一維小波變換我們可以通過數(shù)字濾波器實現(xiàn),來完成對圖像信

51、號的分解。對于二維圖像信號,可以用分別在水平和垂直方向進行濾波的方法實現(xiàn)二維小波多分辨率的分解,如圖3-1所示:</p><p>  圖3-1 一級二維小波分解電路結(jié)構(gòu)</p><p>  圖3-2 一級二維小波分解子帶劃分結(jié)構(gòu)</p><p>  二維小波變換,每經(jīng)過一級分解,當(dāng)前頻帶的 錯誤!未找到引用源。被分解為4個子帶 錯誤!未找到引用源。、 錯

52、誤!未找到引用源。、 錯誤!未找到引用源。和 錯誤!未找到引用源。。其中低頻帶 錯誤!未找到引用源。反映了圖像的概貌,其余3個子帶分別反映圖像在水平、垂直和對角線方向的高頻細(xì)節(jié)信息,如上圖3-2所示。</p><p>  二維小波變換之后,要讓分解后的圖像信號進行重組,如何有效的對信號進行重組,關(guān)系到信號恢復(fù)之后的質(zhì)量問題,如圖3-3、圖3-4所示:</p><p>  圖3-3 一

53、級二維小波重建電路結(jié)構(gòu)</p><p>  圖3-4 一級二維小波子帶重構(gòu)</p><p>  3.2 三維小波變換</p><p>  將二維小波變換[8][9]在時間軸上進行擴展就可以得三維小波變換。對于立體圖像而言,時間軸上的擴展即為在視點方向上的擴展。本文先對三維小波變換做深入地分析,先續(xù)文章會具體介紹三維小波變換在立體圖像編碼中的具體運用。我

54、們可以說三維小波變換,是圖像組幀間的一維小波變換和幀內(nèi)的二維小波變換。根據(jù)這種情況可以把三維小波變換分成二種類型:一種先對幀圖像作幀內(nèi)二維小波變換,然后對變換后的圖像信號沒時間軸方向作一維小波變換。另一種是先進行時間軸方向的一維小波變換,然后再作幀內(nèi)的二維小波變換。這兩種方式通過實驗數(shù)據(jù)證明沒有明顯的區(qū)別,本方的三維小波變換主要針對第二種方法。</p><p>  三維小波變換可以清除圖像信號在空間和時間方向上的

55、相關(guān)性[10][11]。三維小波變換把圖像序列以 錯誤!未找到引用源。幀為一組進行劃分,即對圖像組先進行時間軸方向小波分解,再針對低頻圖像組進行空間方向小波分解,依次循環(huán)進行。經(jīng)過三維小波分解后得到變換域中不同子帶的小波系數(shù)[12]。低頻子帶的系數(shù)幅值較大,能量較高,而高頻各子帶系數(shù)幅值小,能量也較小。根據(jù)這一特殊性質(zhì),在編碼時,通過舍棄高頻子帶中那些幅值小的不重要系數(shù),從而消除冗余。</p><p>  一組序

56、列幀數(shù)為L(假設(shè)L=8),每幀的像素點數(shù)M*N,經(jīng)過三級三維小波變換分解結(jié)構(gòu)圖,如圖3-5所示:</p><p>  圖3-5 三級三維小波分解子帶結(jié)構(gòu)</p><p>  對于一個L*M*N幀的圖像組,經(jīng)過三級三維小波變換之后可以形成22個子帶,結(jié)果如圖3-6所示:</p><p>  圖3-6 三級三維小波變換之后形成的子帶種類</p>&l

57、t;p>  上面給出了三維小波變換對圖像序列幀的變換原理,那么對于立體圖像而言,三維小波變換又是如何實現(xiàn)的呢?在立體圖像的三維小波變換中,其原理是大致相同的。只是針對時間軸方向的小波變換,轉(zhuǎn)換成為在左、右圖像中視點方向的一維小波變換,然后在對其形成的低頻圖像進行二維的小波變換,從而實現(xiàn)三維的小波變換。圖3-7所示為立體圖像經(jīng)過一級三維小波變換之后的分解結(jié)構(gòu)。</p><p>  圖3-7 立體圖像一級三維小

58、波變換分解結(jié)構(gòu)</p><p>  4 基于3D-EBCOT的立體圖像編碼</p><p>  3D-EBCOT是EBCOT算法[1][2]的三維擴展,對每組圖像在時間和空間上的相關(guān)性有著更好的處理效果,產(chǎn)生的碼流具有著可伸縮性等特征。3D-EBCOT還可以對速率進行控制,并且擁有較高的壓縮特性。</p><p>  4.1 基于3D小波可伸縮性立體圖像編碼系統(tǒng)&

59、lt;/p><p>  該編碼系統(tǒng)總體有兩部分組成:三維小波變換和3D-EBCOT編碼器。針對兩幅左右視圖地輸入,先進行一維小變變換,然后再進行空間二維小波變換,最后利用3D-EBCOT編碼算法進行編碼。其解碼器的解碼則是執(zhí)行對稱逆過程,整個系統(tǒng)結(jié)構(gòu)如圖4-1所示:</p><p>  圖4-1 三維小波編碼總體系統(tǒng)圖</p><p><b>  4.2 質(zhì)

60、量層</b></p><p>  為了使碼塊編碼之后形成的碼流具有“失真率可伸縮性”,有EBCOT算法中引入了“質(zhì)量層”的概念。圖像的最終碼塊位流以質(zhì)量層的形式存在,每一層都包含每一個碼塊對圖像質(zhì)量的貢獻度。特別需要強調(diào)的是一些編碼塊在某一層中可以為“空”。由質(zhì)量層構(gòu)成的碼流,使編碼后的壓縮數(shù)據(jù)具有漸進傳輸?shù)男再|(zhì)。</p><p>  3D-EBCOT算法包含兩種不同的編碼器:

61、T1和T2編碼器[2]。該算法用T1編碼器處理經(jīng)過三維小波變換之后圖像的小波變換系統(tǒng),并在碼塊中嵌入截斷點。而T2編碼器則把來自T1編碼器的零碎碼塊放入到不同的質(zhì)量層中,與不同的位速率對應(yīng),同時生成實際的壓縮位流和文件。對3D-EBCOT的核心算法思想,我們可以做以下簡潔的概括:EBCOT算法的核心組成是T1獨立塊編碼和T2碼流組裝,對三維小波變換后的各子帶,分割成大小固定的碼塊,把碼塊作為基本處理單元。對碼塊所具有的系數(shù)進行量化處理,

62、并按照二進制位分層。從最高有效位平面開始,依次對每個位平面上的所有小波變換系數(shù)進行位平面編碼。通過位平面編碼,可以生成上下文和0,1符號對,然后針對上下文和符號對,進行MQ算術(shù)編碼,形成碼塊碼流,此時即可完成T1編碼過程。最后根據(jù)某些參數(shù)指標(biāo)如失真度等,按率失真最優(yōu)原則對碼塊碼流重新組裝,形成最終的壓縮碼流,完成T2碼流組裝過程。</p><p><b>  4.3 位平面編碼</b><

63、;/p><p>  位平面編碼是3D-EBCOT中的T1編碼器中的兩大組成部分之一。輸入是以符號-幅度格式表示小波變換子帶系數(shù),并提供給MQ二進制算術(shù)編碼器進行熵壓縮的數(shù)據(jù)位和對應(yīng)的內(nèi)容,結(jié)構(gòu)如圖4-2所示:</p><p>  圖4-2 位平面編碼器在T1編碼器中的位置</p><p>  每個編碼塊獨立使用熵編碼,這個編碼是基于上下文、二進制、位平面算術(shù)編碼來實現(xiàn)

64、的。將量化后的編碼塊當(dāng)作有符號的整數(shù)矩陣,則來自每個小波變換系數(shù)的一位組成的一系列二進制矩陣。第一個矩陣包含了所有數(shù)的MSB(最高位)。第二個矩陣包含所有數(shù)的下一個MSB,依此類推最后的矩陣包含了所有數(shù)的最低位。每一個位平面編碼須要構(gòu)成3個通道,有的資料中把這3個通道稱為子位平面。這三個通道分別為:重要性傳播通道、幅度精練通道和清理通道。編碼塊中每一個位平面都以一種特殊方式進行掃描。對與有些部分的位平面編碼我們會采用3通道編碼方式來實現(xiàn)

65、。圖4-3是位平面編碼流程圖:</p><p>  圖4-3 位平面編碼流程圖</p><p><b>  4.4 MQ熵編碼</b></p><p>  MQ(Multiple Quantization多路量化)編碼是一種用于二進制數(shù)據(jù)的自適應(yīng)算術(shù)編碼。MQ編碼器是在Q編碼器的基礎(chǔ)上,改進了符號概率估計系統(tǒng)。MQ二進制算術(shù)編碼基于Elias編

66、碼的概率區(qū)間遞歸劃分。當(dāng)MQ編碼器收到一個二進制符號時,先將當(dāng)前的概率區(qū)間分割為兩個子區(qū)間,同時選擇兩個子區(qū)間中的某一個子區(qū)間,作為新的概率區(qū)間。然后,利用MPS(大概率符號)或LPS(小概率符號)來對子區(qū)間進行分辨。若符號是MPS,則給予代碼串附加LPS子區(qū)間,并設(shè)概率區(qū)間寬度為MPS子區(qū)間;若符號是LPS,則不改變代碼串,設(shè)概率區(qū)間寬度為LPS子區(qū)間。按判決輸入將此處理遞歸地重復(fù)下去。</p><p>  圖

67、4-4 MQ編碼器在T1編碼器中的位置</p><p>  圖4-5是MQ編碼流程圖:</p><p>  圖4-5 MQ編碼流程圖</p><p>  5 實 驗 結(jié) 果</p><p>  為了驗證3D-EBCOT算法可以做到對立體圖像的有效壓縮以及在圖像恢復(fù)過程中,可以保證圖像恢復(fù)的質(zhì)量。本文基于VC6.0軟件平臺,對多幅灰度圖

68、像進行了仿真,以下給出部分實驗過程中得到的結(jié)果。對輸入house圖像的左圖像和右圖像進行編碼和解碼實驗。圖5-1(a)、圖5-1(b)、圖5-1(c)反映了,在去除小波變換后的高頻成分下,圖像的恢復(fù)質(zhì)量情況。實驗結(jié)果中,我們可以得出一個結(jié)論:在對圖像進行解碼恢復(fù)的時候,須要根據(jù)圖像恢復(fù)的需求,來對圖像中高頻成分進行選擇性的剔除。如果選擇的不合適就會造成圖像恢復(fù)之后某些細(xì)節(jié)方面的模糊或者出現(xiàn)“馬賽克”效應(yīng)。</p><

69、p>  圖5-1原左圖像 圖5-2 原右圖像</p><p>  圖5-1(a)去除HH重構(gòu)圖 圖5-2(a)去除HH重構(gòu)圖 </p><p>  圖5-1(b)去除HH、HL、LH重構(gòu)圖 圖5-2(b)去除HH、HL、LH重構(gòu)圖</p><p>  圖5-

70、1(c) 重構(gòu)圖 圖5-2(c) 重構(gòu)圖</p><p><b>  6 結(jié)論與展望</b></p><p><b>  6.1全文總結(jié)</b></p><p>  本文主要圍繞基于三維小波變換的EBCOT編碼算法的研究。本全文重點講述了三維小波變換的原理和實現(xiàn)過程。文中我們

71、采用了視頻圖像組幀間的一維小波變換來消除幀間在時間上的相關(guān)性。同時,對視頻圖像組幀內(nèi)運用二維小波變換來消除幀內(nèi)在空間上的相關(guān)性。三維小波變換很好的做到了對冗余信息的消除作用。三維小波變換之后,圖像被分割成了不同頻率的子帶,文中我們運用了EBCOT算法對子帶進行編碼壓縮。首先,把不同的小波變換系數(shù)分割成不同的碼塊,對每一個碼塊進行量化處理之后,運用相同的編碼算法對其進行編碼。在EBCOT編碼器中T1編碼器有效的實現(xiàn)了對圖像信息的壓縮,并能

72、夠控制位速率的選擇。從實驗的結(jié)果中,我們可以很明顯的看出,EBCOT算法具有分辨率可伸縮性和信噪比可伸縮性等特性,但任何一種編碼算法都不會達(dá)到完美的程度,在實驗過程中我還是發(fā)現(xiàn)了該編碼算法的一些不足之處,有待以后我們的改進。</p><p><b>  6.2工作展望</b></p><p>  隨著人們對視覺享受要求的不斷提高,從過去的黑白圖像發(fā)展到現(xiàn)在的彩色圖像,

73、又從原有的平面視覺發(fā)展到現(xiàn)有的立體視覺。目前,針對于立體視覺方面的立體顯示技術(shù)已日益成熟,由于立體圖像能提供深度信息,在機器視覺、遠(yuǎn)程控制、遠(yuǎn)程教學(xué)等方面有著巨大的實際應(yīng)用價值。在不遠(yuǎn)的將來立體成像系統(tǒng)有望取代在工業(yè)、商業(yè)、教育和娛樂領(lǐng)域的二維成像系統(tǒng)??梢姡谌S小波變換的編碼算法將會在更多的視頻壓縮中運用。</p><p>  在以后的工作中,我們要做的就是不斷的對算法的改進。就本文中所涉及到的算法,我們可

74、以做以下的改進:本文中的EBCOT算法沒有考慮人的視覺感知特性,對整張圖像采用相同的編碼策略,從而使各個對象的壓縮精度基本相同,在有些場合就難以發(fā)揮最高的編碼效率,因此,今后的我們的研究重點可以轉(zhuǎn)向?qū)χ矫娴膬?yōu)化。</p><p><b>  參考文獻</b></p><p>  [1] 趙偉強. JPEG2000的核心算法研究[J]. 電子學(xué)報,2006,2,23

75、(1):51~52.</p><p>  [2] 楊方洲, 劉銳. JPEG2000中的EBCOT算法簡介[J]. 信息技術(shù),2004,5:38~42.</p><p>  [3] 張勇東, 李桂苓. 基于3D-SPIHT的立體視頻圖像壓縮編碼[J]. 電子與信息學(xué)報, 2002, 24(10):1310~1315.</p><p>  [4] 史文婷. 基于

76、三維小波變換的3D-SPIHT視頻編碼技術(shù)研究[D]. 南京郵電大學(xué),2009.</p><p>  [5] 侯穎. 基于3D-SPIHT視頻編碼算法概述[C]. 陜西省科學(xué)技術(shù)協(xié)會. 中國科協(xié)第五屆青年學(xué)術(shù)年會陜西衛(wèi)星會議文集, 西安: 西安地圖出版社,2005,1:351~353.</p><p>  [6] 粘永健,吳樂華,何世彪. 基于三維小波變換的視頻圖像編碼研究[J]. 影

77、像技術(shù),2006, 2,12(2):26~28. [7] 伍鵬,張妙蘭,李像霖. 基于分塊三維小波變換的視頻圖像序列編碼方法的研究[J]. 電子與信息學(xué)報,2001.2,23(2):125~133.</p><p>  [8] 榮憲偉,張偉光,于曉艷,安麗娜. 基于小波變換的立體圖像編碼[J].哈爾濱師范大學(xué)自然科學(xué)學(xué)報,2009,25(4):48~51.</p><p>  [9]

78、 張宗平,劉貴忠,侯興松. 一種改進的三維小波視頻編碼[J]. 西安交通大學(xué)學(xué)報,2001.6,35(6):595~599.</p><p>  [10] 羅一平. 真正三維小波變換技術(shù)及在視頻圖像編碼中的應(yīng)用[J]. 光電工程,2002, 2,29(2):55~58.</p><p>  [11] 朱仲杰,陳偕雄,吳訓(xùn)威等. 立體視頻編碼中的關(guān)鍵技術(shù)研究[D]. 浙江大學(xué),2003.&l

79、t;/p><p>  [12] 郭大波,盧朝陽,何華君,焦衛(wèi)東. 一種新的立體視差估計算法[J]. 西安電子科技大學(xué)學(xué)報,2007,6,34(3):337~341.</p><p>  [13] Ashraf A.Kassim,Eng Hong Tan,Wei Siong Lee.3D Color Set Partitioning in Hierarchical Tree[J].Circuit

80、s Syst Signal Process,2009,2,28 (2):41~53.</p><p>  [14] Yann Gaudeau,Jean-Marie Moureaux. Lossy compression of volumetric medical images with 3D dead-zone lattice vector quantization[J].Ann.Telecommun,2009,

81、6,64(3):359~367.</p><p>  附錄 1 算法源程序</p><p><b>  主函數(shù):</b></p><p>  void main()</p><p><b>  {</b></p><p>  unsigned char *Image0, *I

82、mage1;</p><p>  unsigned char Fheadg[54],unsigdata;</p><p>  char Pallette[1024];</p><p>  int Row,Col,K,N,i,j;</p><p>  long Index;</p><p>  FILE *input,*

83、output,*inter;</p><p>  Image0=(unsigned char *)calloc (720*720,sizeof(unsigned char));</p><p>  Image1=(unsigned char *)calloc (720*720,sizeof(unsigned char)); </p><p>  if ((input

84、 = fopen("c2.raw","rb")) == NULL)</p><p>  {printf("cannot open file\n");</p><p><b>  return;</b></p><p><b>  }</b></p>

85、<p>  if((output = fopen("97wave.raw","wb+")) == NULL)</p><p>  {printf("cannot open file\n");</p><p><b>  return;</b></p><p><b&

86、gt;  }</b></p><p>  if(!ReadGrayImage("house.bmp",&Row,&Col,Image,Fheadg,Pallette))</p><p>  { printf("cannot open file\n");</p><p><b>

87、  return;</b></p><p><b>  }</b></p><p>  Scanf(“%d”,&N)</p><p>  for(i = 0;i<Row;i++)</p><p>  for(j = 0;j<Col;j++)</p><p>  {

88、 Index=i*Col+j;</p><p>  fread(&unsigdata, 1,1,input);</p><p>  if(Image1[Index]==N)</p><p>  Buffer[i+8][j+8] = (float) unsigdata;</p><p>  else Buffer[i+8][j+

89、8] =0;</p><p><b>  }</b></p><p><b>  //DC變換</b></p><p>  for(i = 0;i<Row;i++)//行</p><p><b>  {</b></p><p>  for(j =

90、 0;j<Col;j++)//列</p><p>  {Index=i*Col+j;</p><p>  if(Image1[Index]==N)</p><p>  Buffer[i+8][j+8] = (Buffer[i+8][j+8]-128);</p><p><b>  }</b></p>

91、<p><b>  }</b></p><p>  decode_allsubband(Region_bufferout,Row,Col,N,Image1);</p><p>  for(i=0;i<(Row>>3);i++)</p><p>  for(j=0;j<(Col>>3);j++)&

92、lt;/p><p>  Interleave[i+8][j+8]=(float)(Region_bufferout[i][j]-0.5);</p><p><b>  EBCOT編碼:</b></p><p>  #include <stdio.h></p><p>  #include "mq_cod

93、e.h"</p><p>  #define inline</p><p>  typedef struct</p><p>  //上下文狀態(tài)的相關(guān)信息</p><p><b>  {</b></p><p>  unsigned char I; //values in the r

94、ange 0..46</p><p>  unsigned char MPS; //MPS(either 0 or 1)</p><p>  } ArithEncContext;</p><p>  //算術(shù)編碼器所需要的狀態(tài)信息 </p><p>  static unsigned long int C; //下

95、限寄存器</p><p>  static unsigned long int A; //間隔長度寄存器</p><p>  static long int CT; //向下計數(shù)器</p><p>  static unsigned char B; </p><p>  static int fir

96、stByte; </p><p><b>  //本文件模塊。</b></p><p>  // The array of allowable context states </p><p>  #define MAXCONTEXT 18</p><p>  static ArithEncContex

97、t contexts[MAXCONTEXT+1];//19個(I,MPS)</p><p>  #define RUNLENGTH_CX 17</p><p>  #define UNIFORM_CX 18</p><p>  static unsigned long int Qe[47] =</p><p>  {//Qe值的十六進制表示&

98、lt;/p><p>  0x5601UL, 0x3401UL, 0x1801UL, 0x0ac1UL, 0x0521UL, 0x0221UL, 0x5601UL,</p><p>  0x5401UL, 0x4801UL, 0x3801UL, 0x3001UL, 0x2401UL, 0x1c01UL, 0x1601UL,</p><p>  0x5601UL, 0x54

99、01UL, 0x5101UL, 0x4801UL, 0x3801UL, 0x3401UL, 0x3001UL,</p><p>  0x2801UL, 0x2401UL, 0x2201UL, 0x1c01UL, 0x1801UL, 0x1601UL, 0x1401UL,</p><p>  0x1201UL, 0x1101UL, 0x0ac1UL, 0x09c1UL, 0x08a1UL,

100、0x0521UL, 0x0441UL,</p><p>  0x02a1UL, 0x0221UL, 0x0141UL, 0x0111UL, 0x0085UL, 0x0049UL, 0x0025UL,</p><p>  0x0015UL, 0x0009UL, 0x0005UL, 0x0001UL, 0x5601UL</p><p><b>  };<

101、/b></p><p>  static unsigned char SWITCH[47] =</p><p><b>  {</b></p><p>  1, 0, 0, 0, 0, 0,</p><p>  1, 0, 0, 0, 0, 0, 0, 0,</p><p>  1, 0,

102、0, 0, 0, 0, 0, 0,</p><p>  0, 0, 0, 0, 0, 0, 0, 0,</p><p>  0, 0, 0, 0, 0, 0, 0, 0,</p><p>  0, 0, 0, 0, 0, 0, 0, 0,</p><p><b>  0</b></p><p>&

103、lt;b>  };</b></p><p>  static unsigned char NMPS[47] =</p><p><b>  {</b></p><p>  1 , 2 , 3 , 4 , 5 , 38 ,</p><p>  7 , 8 , 9 , 10 , 11 , 12 , 13 ,

104、 29 ,</p><p>  15 , 16 , 17 , 18 , 19 , 20 , 21 , 22 ,</p><p>  23 , 24 , 25 , 26 , 27 , 28 , 29 , 30 ,</p><p>  31 , 32 , 33 , 34 , 35 , 36 , 37 , 38 ,</p><p>  39 , 4

105、0 , 41 , 42 , 43 , 44 , 45 , 45 ,</p><p><b>  46</b></p><p><b>  };</b></p><p>  static unsigned char NLPS[47] =</p><p><b>  {</b>&l

106、t;/p><p>  1 , 6 , 9 , 12 , 29 , 33 ,</p><p>  6 , 14 , 14 , 14 , 17 , 18 , 20 , 21 ,</p><p>  14 , 14 , 15 , 16 , 17 , 18 , 19 , 19 ,</p><p>  20 , 21 , 22 , 23 , 24 , 25

107、 , 26 , 27 ,</p><p>  28 , 29 , 30 , 31 , 32 , 33 , 34 , 35 ,</p><p>  36 , 37 , 38 , 39 , 40 , 41 , 42 , 43 ,</p><p><b>  46</b></p><p><b>  };</b

108、></p><p>  void ArithEncInit()</p><p><b>  {</b></p><p><b>  int i;</b></p><p>  A = 0x8000u;</p><p><b>  C = 0;</b>

109、</p><p>  B = 0; // Assume that the byte prior to starting is 0</p><p>  CT = 12;//表示在寄存器中有三個隔離比特,他們需要在達(dá)到字節(jié)被移開的區(qū)域之前被填入</p><p>  if(B==0XFF) CT=13;</p><p>  firstByte =

110、1;//1 if the current byte is the first output byte</p><p>  //初始化所有的上下文狀態(tài)</p><p>  for (i = 0; i <= MAXCONTEXT; i++)//18</p><p><b>  {</b></p><p>  conte

111、xts[i].I = 0;</p><p>  contexts[i].MPS = 0;</p><p><b>  }</b></p><p><b>  } </b></p><p>  static inline void ByteOutRight(int J)</p><

112、p><b>  {</b></p><p>  if (!firstByte)//不是第一個輸出的字節(jié)標(biāo)志</p><p>  TransmitByte(B,J);</p><p>  else//the current byte is the first output byte</p><p>  firstBy

113、te = 0;</p><p>  B = (unsigned char)((C >> 20) & 0xFF);//B是C寄存器中的7個b 和進位位c </p><p>  C = C & 0xFFFFF;</p><p><b>  CT = 7;</b></p><p&

114、gt;<b>  } </b></p><p>  static inline void ByteOutLeft(int J)</p><p><b>  {</b></p><p>  if (!firstByte)</p><p>  TransmitByte(B,J);</p>

115、<p>  else//the current byte is the first output byte</p><p>  firstByte = 0;</p><p>  B = (unsigned char)((C >> 19) & 0xFF);</p><p>  C = C & 0x7FFFF;</p>

116、<p><b>  CT = 8;</b></p><p><b>  }</b></p><p>  static inline void ByteOut(int J)</p><p><b>  {</b></p><p>  /* This test sequ

117、ence might speed up process */</p><p>  if (B != 0xFF)</p><p><b>  {</b></p><p>  if (C < 0x8000000)</p><p>  ByteOutLeft(J);</p><p><b&g

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論