

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、<p><b> 本科畢業(yè)設(shè)計(jì)論文</b></p><p> 題 目 數(shù)字圖像縮放技術(shù)研究 </p><p> 專業(yè)名稱 電子信息工程 </p><p> 學(xué)生姓名 </p><
2、;p> 指導(dǎo)教師 </p><p> 畢業(yè)時(shí)間 2006年7月 </p><p><b> 畢業(yè) 任務(wù)書</b></p><p><b> 一、題目</b></p><p> 數(shù)字圖像縮放技術(shù)研
3、究</p><p> 二、指導(dǎo)思想和目的要求</p><p> 數(shù)字圖像分辨率放大和縮小技術(shù)是數(shù)字電視的關(guān)鍵技術(shù)之一。本題目要求:</p><p> 學(xué)習(xí)數(shù)字圖像處理知識(shí), 重點(diǎn)學(xué)習(xí)用于數(shù)字圖像縮放的插值算法。</p><p> 學(xué)習(xí)MATLAB仿真計(jì)算環(huán)境,學(xué)會(huì)MATLAB編程。</p><p> 搜集并研
4、究目前國(guó)際上主流的圖像放大/縮小技術(shù),用MATLAB進(jìn)行編程和實(shí)驗(yàn),對(duì)比其中重要算法的性能和運(yùn)算量;</p><p> 通過學(xué)習(xí)和完成本題目,使學(xué)生掌握較深的圖像處理專業(yè)知識(shí)并鍛煉和提高獨(dú)立科研能力。</p><p><b> 三、主要技術(shù)指標(biāo)</b></p><p> 總結(jié)當(dāng)前數(shù)字電視的視頻格式,圖像分辨率;</p>&l
5、t;p> 研究用于圖像放大/縮小技術(shù)的三種經(jīng)典插值算法,并編寫MATLAB程序?qū)崿F(xiàn)所有算法;</p><p> 搜集并研究目前國(guó)際上主流的圖像放大/縮小技術(shù),研究其中幾種主要的插值算法,并編寫MATLAB程序?qū)崿F(xiàn)這幾種算法;</p><p> 對(duì)MATLAB程序進(jìn)行圖像縮放實(shí)驗(yàn),對(duì)比這幾種算法的性能和運(yùn)算量;</p><p><b> 四、進(jìn)
6、度和要求</b></p><p> 第1-3周:學(xué)習(xí)數(shù)字圖像處理知識(shí), 重點(diǎn)學(xué)習(xí)用于數(shù)字圖像縮放的插值算法,查閱相關(guān)資料。</p><p> 第3-6周:搜集目前國(guó)際上主流的圖像放大/縮小技術(shù),學(xué)習(xí)MATLAB仿真計(jì)算環(huán)境。</p><p> 1/2畢設(shè)時(shí)間:研究用于圖像放大/縮小技術(shù)的經(jīng)典插值算法和主要的改進(jìn)算法,用MATLAB編寫程序,進(jìn)行數(shù)
7、據(jù)試驗(yàn),最后進(jìn)行幾種算法的性能和運(yùn)算量對(duì)比分析。</p><p> 第15-18周:撰寫論文并答辯。</p><p> 五、主要參考書及參考資料</p><p> 章毓晉,《圖像處理與分析》,清華大學(xué)出版社 2004年7月</p><p> [日]田村秀行 著,《計(jì)算機(jī)圖像處理》,科學(xué)出版社 2004年6月</p>&l
8、t;p> 閆敬文,《數(shù)字圖像處理技術(shù)與圖像圖形學(xué)基本教程》,科學(xué)出版社 2002年6月</p><p> 孫兆林,《MATLAB6.X數(shù)字圖像處理》,清華大學(xué)出版社2002年5月</p><p> 陳貴明,張明照等,《應(yīng)用MATLAB語言處理數(shù)字信號(hào)與數(shù)字圖像》,科學(xué)出版社 2000年1月</p><p> 張志涌,《精通MATLAB6.5》, 北航電
9、子版,2002年12月</p><p> 學(xué)生 ___________ 指導(dǎo)教師 ___________ 系主任 ___________</p><p><b> 目 錄</b></p><p><b> 摘 要I</b></p><p> ABSTRACTII</p>
10、;<p><b> 第一章 緒 論1</b></p><p> 1.1 什么是數(shù)字電視1</p><p> 1.2 數(shù)字電視的視頻格式特點(diǎn)1</p><p> 1.3 研究意義和論文內(nèi)容安排2</p><p> 第二章 數(shù)字圖像處理理論基礎(chǔ)3</p><p>
11、2.1 數(shù)學(xué)插值介紹3</p><p> 2.1.1 生產(chǎn)實(shí)踐上的插值問題3</p><p> 2.1.2 數(shù)學(xué)上常見的插值類型3</p><p> 2.2 數(shù)字圖像(image)數(shù)字圖像處理基本知識(shí)介紹3</p><p> 2.2.1 什么是數(shù)字圖像3</p><p> 2.2.2 數(shù)字圖像在計(jì)算
12、機(jī)內(nèi)的處理3</p><p> 2.2.3 數(shù)字圖像處理概述3</p><p> 2.2.4 數(shù)字圖像文件格式3</p><p> 2.3 MATLAB基本知識(shí)介紹3</p><p> 2.3.1 MATLAB概述3</p><p> 2.3.2 MATLAB的特點(diǎn)3</p><
13、;p> 2.3.3 MATLAB的主要功能3</p><p> 2.3.4 MATLAB在圖象處理中的應(yīng)用3</p><p> 第三章 傳統(tǒng)數(shù)字圖像縮放技術(shù)3</p><p> 3.1 數(shù)字圖像縮放技術(shù)概述3</p><p> 3.1.1 什么是數(shù)字圖像縮放3</p><p> 3.1.2
14、數(shù)字圖像縮放的算法概述3</p><p> 3.2 傳統(tǒng)的數(shù)字圖像縮放技術(shù)3</p><p> 3.2.1最近鄰插值(Nearest Neighbor Interpolation)3</p><p> 3.2.2雙線性插值(Bilinear Interpolation)3</p><p> 3.2.3 雙三次插值(Bicubi
15、c Interpolation)3</p><p> 第四章 當(dāng)今主流數(shù)字圖像縮放技術(shù)的算法3</p><p> 4.1 基于近臨插值與鄰域取平均的圖像縮小算法3</p><p> 4.1.1問題引入3</p><p> 4.1.2 算法實(shí)現(xiàn)3</p><p> 4.1.3 算法評(píng)價(jià)3</p
16、><p> 4.2 基于Ferguson曲面插值的圖像縮放方法3</p><p> 4.2.1 問題引入3</p><p> 4.2.2 算法實(shí)現(xiàn)3</p><p> 4.2.3 算法評(píng)價(jià)3</p><p> 4.3 帶系數(shù)自適應(yīng)插值算法及其改進(jìn)3</p><p> 4.3.1
17、 問題引出3</p><p> 4.3.2 數(shù)學(xué)推導(dǎo)與算法實(shí)現(xiàn)3</p><p> 4.4 基于數(shù)字圖像邊緣提取的插值算法3</p><p> 4.4.1 問題引入3</p><p> 4.4.2 圖像定向插值的一般實(shí)現(xiàn)方法3</p><p> 4.4.3 圖像定向插值的簡(jiǎn)化算法3</p&g
18、t;<p> 4.4.4 算法評(píng)價(jià)3</p><p> 4.5 基于多幀圖像融合的提高圖像分辨率的方法3</p><p> 4.5.1 引言3</p><p> 4.5.2 提高分辨率圖像融合的關(guān)鍵技術(shù)3</p><p> 4.5.3 基于共軛梯度算法的圖像融合3</p><p>
19、第五章 縮放算法處理結(jié)果及比較3</p><p><b> 5.1 概述3</b></p><p> 5.2 傳統(tǒng)圖像縮放算法處理結(jié)果3</p><p> 5.3 基于近鄰插值與鄰域取平均的圖像縮小算法性能分析3</p><p> 5.4 基于Ferguson曲面插值的圖像縮放方法分析3</p&g
20、t;<p> 5.5 帶系數(shù)自適應(yīng)插值算法及其改進(jìn)分析3</p><p> 5.6 基于數(shù)字圖像邊緣提取的插值算法分析3</p><p><b> 第六章 總 結(jié)3</b></p><p> 6.1 論文總結(jié)3</p><p> 6.2 數(shù)字圖象縮放技術(shù)展望3</p>&l
21、t;p><b> 致 謝3</b></p><p><b> 參考文獻(xiàn)3</b></p><p><b> 畢業(yè)設(shè)計(jì)小結(jié)3</b></p><p><b> 摘 要</b></p><p> 本文先對(duì)當(dāng)今數(shù)字電視的視頻格式特點(diǎn)做了一
22、個(gè)總結(jié),以數(shù)字電視的視頻格式變換為基礎(chǔ),引出了數(shù)字圖像縮放這一很重要的技術(shù)。接著在數(shù)學(xué)上從生產(chǎn)實(shí)踐上遇到的插值問題出發(fā),對(duì)插值技術(shù)做了一個(gè)必要的介紹,指明了目前數(shù)學(xué)的常見的插值類型。為了對(duì)算法進(jìn)行實(shí)現(xiàn),性能與運(yùn)算量做一個(gè)分析,引入了MATLAB這個(gè)功能強(qiáng)大的數(shù)學(xué)運(yùn)算軟件,對(duì)其功能、用途以及在數(shù)字圖像處理上常用的函數(shù)做了介紹。</p><p> 數(shù)字圖像縮放技術(shù)主要基于插值算法。本文在介紹插值算法時(shí)首先介紹了最近
23、鄰插值、雙線性插值和雙三次差值三種傳統(tǒng)插值算法,并從數(shù)學(xué)形態(tài)上分析其插值核函數(shù)引起的計(jì)算量和處理效果的不同。在此基礎(chǔ)上研究了當(dāng)今比較流行的幾種縮放算法,指出它們均是在傳統(tǒng)算法上的改進(jìn)算法。然后對(duì)三種傳統(tǒng)算法和四種改進(jìn)算法編寫MATLAB程序進(jìn)行了數(shù)據(jù)實(shí)驗(yàn),對(duì)四種改進(jìn)算法分別進(jìn)行必要的運(yùn)算量與性能分析,并進(jìn)行對(duì)比。最后,對(duì)文中所述插值算法做了總結(jié)。</p><p> 關(guān)鍵詞:圖像縮放,插值技術(shù),分辨率變換,數(shù)字電
24、視,圖像處理</p><p><b> ABSTRACT</b></p><p> This paper researches on image scaling technology in HDTV. Firstly, popular HDTV video formats and interpolation algorithms are summarized br
25、iefly. Then, MATLAB, a powerful mathematical software, is introduced.</p><p> Base on introduction of related technologies, three kinds of traditional interpolation algorithms and features of their kernel f
26、unction are analyzed, including Nearest Neighbor Interpolation, Bilinear Interpolation and Bicubic Interpolation.. After that, four popular image scaling algorithms are researched, and all mentioned algorithms are progra
27、mmed on MATLAB. Performances of each algorithm are compared after data experiments on MATLAB. Finally, interpolation algorithms used in image scaling ar</p><p> KEY WORDS: image scaling, interpolation techn
28、iques, resolution transform,</p><p> HDTV, digital image processing</p><p><b> 第一章 緒 論</b></p><p> 隨著信息化時(shí)代的到來,數(shù)字化成為其中的主角,可以說信息化的實(shí)現(xiàn)是以信息化為前提的。從計(jì)算機(jī),互聯(lián)網(wǎng),數(shù)碼相機(jī),到數(shù)字電視無一例外的在演
29、繹著這場(chǎng)數(shù)字化風(fēng)暴。尤其是數(shù)字電視,正在經(jīng)歷一場(chǎng)數(shù)字化的革命。但不管是數(shù)字電視,還是計(jì)算機(jī)都在利用數(shù)字化的視頻聲音與圖像等多媒體因素來沖擊人們的感官神經(jīng)。數(shù)字圖像的處理便成了其中的不可或缺的技術(shù),數(shù)字電視接收各種圖像信號(hào),包括標(biāo)清信號(hào),高清信號(hào)等,最終把這些不同分辨率的視頻信號(hào)轉(zhuǎn)化為同一種分辨率的視頻信號(hào)進(jìn)行播放。因此,數(shù)字圖像分辨率放大和縮小技術(shù)是所有數(shù)字顯示設(shè)備的關(guān)鍵技術(shù)之一。</p><p> 1.1 什
30、么是數(shù)字電視</p><p> 數(shù)字電視,即HDTV, 全稱High Definition Television,直譯即為“高清晰度電視”,現(xiàn)一般簡(jiǎn)稱“高清電視”。與當(dāng)前采用模擬信號(hào)傳輸?shù)膫鹘y(tǒng)電視系統(tǒng)不同,HDTV采用數(shù)字信號(hào)傳輸。由于HDTV從電視節(jié)目的采集、制作到電視節(jié)目的傳輸以及用戶終端的接收全部實(shí)現(xiàn)數(shù)字化,因此HDTV可以帶給我們極高的清晰度,其分辨率最高可達(dá)1920×1080,幀速率高達(dá)60
31、fps,視角也由原先的4:3變成了16:9,同時(shí)全面應(yīng)用了數(shù)字技術(shù),其信號(hào)抗噪能力也大大加強(qiáng)。</p><p> 1.2 數(shù)字電視的視頻格式特點(diǎn)</p><p> 電視機(jī)的圖像分辨率可以用它的固有分辨率來表示,固有分辨率是指電視機(jī)或其他顯示設(shè)備無需采用行倍頻、行內(nèi)插或其他形式的分辨率變換手段而本身就能做到的圖像分辨率。它通常用水平方向像素和垂直方向像素兩者相乘來表示。例 如1027*
32、768對(duì)于如等離子電視、液晶顯示電視或數(shù)字光處理電視等一類固定像素的顯示器來說固有分辨率與它們的實(shí)際像素排列結(jié)構(gòu)相同。</p><p> 電視的畫面清晰度是以水平清晰度作為單位。通俗地說,我們可以把電視機(jī)上的畫面以水平方向分割成很多很多掃描線,分得越細(xì),這些畫面就越清楚。而水平線數(shù)的掃描線數(shù)量也就越多。清晰度的單位是電視行(TV line)也稱線意思是從水平方向上看相當(dāng)于每行掃描線豎立起來,然后乘上)4:3 或
33、者16:9的寬高比,構(gòu)成水平方向的總線數(shù)。</p><p> 數(shù)字電視常見的視頻格式有[1]:</p><p> 1)1080i格式,是標(biāo)準(zhǔn)數(shù)字電視顯示模式1125條水平掃描線1080條可見水平掃描線,16:9,分辨率為1920*1080隔行/60Hz,行頻為33.75KHz。</p><p> 2)720P格式,是標(biāo)準(zhǔn)數(shù)字電視顯示模式。750條水平掃描線,7
34、20條可見水平掃描線,16:9,分辨率為1280*720逐行/60Hz,行頻為45kHz。</p><p> 3)1080P格式,是標(biāo)準(zhǔn)數(shù)字電視顯示模式,1125條水平掃描線,1080條可見水平掃描線,16:9分辨率為 1920*1080逐行掃描,專業(yè)格式。</p><p> 以上標(biāo)準(zhǔn)中i表示隔行P表示逐行TDTV標(biāo)準(zhǔn)是高品質(zhì)視頻信號(hào)標(biāo)準(zhǔn)包括1080i,720P,1080P。需要注意的
35、是,對(duì)于電視機(jī)處理能力(例如帶寬)的要求則是1080i<720P。數(shù)字高清電視的720P,1080I和1080P是由美國(guó)電影電視工程師協(xié)會(huì)確定的高清標(biāo)準(zhǔn)格式。其中1080P被稱為目前數(shù)字電視的頂級(jí)顯示格式。這種格式的電視在逐行掃描下能夠達(dá)到1920*1080的分辨率。目前世界上只有60英寸以上的顯示屏才能夠顯示出1920*1080的信號(hào)。 目前市場(chǎng)上出現(xiàn)的所謂1080P高清數(shù)字電視并不能真正給消費(fèi)者帶來1920*1080的圖像。
36、這些彩電只是能夠接收和處理1920*1080格式的信號(hào)而已。</p><p> 1.3 研究意義和論文內(nèi)容安排</p><p> 無論是何種視頻格式的終端顯示設(shè)備,其高清信號(hào)源都是同樣的分辨率。而當(dāng)今數(shù)字電視信號(hào)終端顯示設(shè)備又是各種各樣的,從普通的CRT,到高檔的液晶,等離子,其顯示方式和大小不盡相同,隨著3G技術(shù)的逐漸成熟,越來越多的手機(jī)可以接收數(shù)字電視信號(hào),在小小的屏幕上顯示。這些
37、都需要終端設(shè)備具備數(shù)字圖像的分辨率變換功能,因此數(shù)字圖像縮放技術(shù)顯得越來越重要,本文正是從這個(gè)背景出發(fā),來對(duì)傳統(tǒng)的以及當(dāng)今主流的縮放技術(shù)做了一個(gè)系統(tǒng)研究。第一章總結(jié)了數(shù)字電視的視頻格式特點(diǎn);第二章介紹了圖像縮放的數(shù)學(xué)基礎(chǔ);第三章和第四章是論文主要內(nèi)容詳盡介紹傳統(tǒng)插值于主流插值算法并進(jìn)行算法實(shí)現(xiàn);第五章對(duì)論文所研究算法做了性能與運(yùn)算量的對(duì)比最后是對(duì)算法的技術(shù)展望。</p><p> 第二章 數(shù)字圖像處理理論基礎(chǔ)&
38、lt;/p><p> 2.1 數(shù)學(xué)插值介紹</p><p> 2.1.1 生產(chǎn)實(shí)踐上的插值問題[2]</p><p> 在生產(chǎn)和科研中遇到的函數(shù),不能直接寫出表達(dá)式,而只能給定了在區(qū)間[a,b]中互異的n+1個(gè)點(diǎn),,處的函數(shù)值。實(shí)際中,常常希望找到這種函數(shù)的近似解析表達(dá)式,以便計(jì)算在諸之外的點(diǎn)處的函數(shù)值,函數(shù)的導(dǎo)數(shù)或積分,一種常用的辦法就是某個(gè)性質(zhì)優(yōu)良,便于計(jì)算的
39、函數(shù)類中選出一個(gè)函數(shù),使。尋找的方法就是插值法。下面介紹插值法中涉及的一些感念和基本問題。</p><p><b> 1.插值問題</b></p><p> 設(shè)為區(qū)間[a,b]上的連續(xù)函數(shù),且已知點(diǎn)上的值為</p><p> 若存在一個(gè)簡(jiǎn)單函數(shù),使</p><p><b> ?。?.1)</b>
40、;</p><p> 則稱為的插值函數(shù),點(diǎn)稱為插值節(jié)點(diǎn),條件(2.1)稱為插值條件,所在區(qū)間[a,b]稱為插值區(qū)間,稱為被插值函數(shù)。求插值函數(shù)的問題(方法)成為插值問題(方法)。</p><p> 如果插值函數(shù)類是代數(shù)多項(xiàng)式,則相應(yīng)的插值問題成為代數(shù)插值,如果是三角函數(shù),則相應(yīng)的插值問題成為三角插值。在數(shù)字圖像縮放技術(shù)中運(yùn)用的插值,一般均為代數(shù)插值。</p><p&
41、gt; 2..代數(shù)插值的幾何意義</p><p> 代數(shù)插值的幾何意義就是通過n+1個(gè)點(diǎn)做一條代數(shù)曲線使其近似于代數(shù)曲線y = f(x)。 3.插值余項(xiàng)</p><p> 由插值法的定義可知,在區(qū)間[a,b]上用y = f(x)時(shí),在節(jié)點(diǎn)上有,而在其他點(diǎn)x處一般會(huì)有誤差。令</p><p><b> (2.2)</b></
42、p><p> 它表示用近似f(x)的截?cái)嗾`差,常成為插值多項(xiàng)式的插值余項(xiàng)或截?cái)嗾`差。一般地,越小,則近似程度越好。</p><p> 2.1.2 數(shù)學(xué)上常見的插值類型[3]</p><p> 數(shù)學(xué)上常見的插值類型有:拉格朗日插值(Lagrange),牛頓插值(Newton),埃爾米特插值(Hermite),分段低次插值與三次樣條插值(B-spline).有關(guān)插值詳
43、細(xì)問題基本在每本數(shù)值分析書上都有,有興趣的讀者可以參閱《數(shù)值分析》。</p><p> 2.2 數(shù)字圖像(image)數(shù)字圖像處理基本知識(shí)介紹</p><p> 2.2.1 什么是數(shù)字圖像</p><p> 所謂數(shù)字圖像就是把傳統(tǒng)圖像的畫面分割成如圖2.1所示的被成為像素(picture element, 簡(jiǎn)稱pixel。有時(shí)候也用pel這一簡(jiǎn)寫詞)的小的離散
44、點(diǎn),各像素的灰度值也是用離散值即整數(shù)值來表示的。數(shù)字圖像(digital imagine)和傳統(tǒng)的圖像即模擬圖像(picture)是有差別的。</p><p><b> 圖2.1 數(shù)字圖像</b></p><p> 為了從一般的照片,景物等模擬圖像中得到數(shù)字圖像,需要對(duì)傳統(tǒng)的模擬圖像進(jìn)行采樣與量化兩種操作(二者統(tǒng)稱為數(shù)字化)[5]。</p><
45、p><b> 采樣</b></p><p> 采樣(sampling)就是把在時(shí)間上和空間上連續(xù)的圖像變成離散點(diǎn)(采樣點(diǎn),即像素)的集合的一種操作。</p><p> 圖像基本上是在二維平面上連續(xù)分布的信息形式要把它輸入到計(jì)算機(jī)中,首先要把二維信號(hào)變成一維信號(hào),因此要進(jìn)行掃描(scanning)。最常用的掃描方法是在二維平面上按一定間隔順序地從上方順序地沿
46、水平方向的直線(掃描線)掃描,從而取出濃淡值(灰度值)的線掃描(Laster掃描)。對(duì)于由此得到的一維信號(hào),通過求出每一特定間隔的值,可以得到離散的信號(hào)。對(duì)于運(yùn)動(dòng)圖像除進(jìn)行水平,垂直兩個(gè)方向的掃描以外,還有進(jìn)行時(shí)間軸上的掃描。</p><p> 通過采樣,如設(shè)橫向的像素?cái)?shù)為M,縱向的像素?cái)?shù)為N,則畫面的大小可以表示為“M*N”個(gè)像素。</p><p><b> 量化</
47、b></p><p> 經(jīng)過采樣,圖像被分解成在時(shí)間上和空間上離散分布的像素,但是像素的值(灰度值)還是連續(xù)值。像素的值,是指白色-灰色-黑色的濃淡值,有時(shí)候也指光的強(qiáng)度(亮度)值或灰度值。把這些連續(xù)的濃淡值或灰度值變?yōu)殡x散的值(整數(shù)值)的操作就是量化。</p><p> 如果把這些連續(xù)變化的值(灰度值)量化為8bit,則灰度值被分成0-2552的256個(gè)級(jí)別,分別對(duì)應(yīng)于各個(gè)灰度
48、值的濃淡程度,叫做灰度等級(jí)或灰度標(biāo)度。</p><p> 在0-255的值對(duì)應(yīng)于白-黑的時(shí)候,有以0為白,255為黑的方法,也有以0為黑,255為白0的方法,這取決于圖像的輸入方法以及用什么樣的觀點(diǎn)對(duì)圖像進(jìn)行處理等,這是在編程時(shí)應(yīng)特別注意的問題。但在只有黑白二值的二值圖像的情形,一般設(shè)0為白,1為黑。</p><p> 對(duì)連續(xù)的灰度值賦予量化級(jí)的,即灰度值方法有:均勻量化(unifor
49、m quantization),線性量化(liner quantization),對(duì)數(shù)量化,MAX量化,錐形量化(tapered quantization)等。</p><p> 3. 采樣、量化和圖像細(xì)節(jié)的關(guān)系</p><p> 上面的數(shù)字化過程,需要確定數(shù)值N和灰度級(jí)的級(jí)數(shù)K。在數(shù)字圖像處理中,一般都取成2的整數(shù)冪,即:</p><p><b>
50、 (2.3)</b></p><p><b> (2.4)</b></p><p> 一幅數(shù)字圖像在計(jì)算機(jī)中所占的二進(jìn)制存儲(chǔ)位數(shù)b為:</p><p><b> (2.5)</b></p><p> 例如,灰度級(jí)為256級(jí)(m=8)的512×512的一幅數(shù)字圖像,需要大
51、約210萬個(gè)存儲(chǔ)位。隨著N和m的增加,計(jì)算機(jī)所需要的存儲(chǔ)量也隨之迅速增加。</p><p> 由于數(shù)字圖像是連續(xù)圖像的近似,從圖像數(shù)字化的過程可以看到。這種近似的程度主要取決于采樣樣本的大小和數(shù)量(N值)以及量化的級(jí)數(shù)K(或m值)。N和K的值越大,圖像越清晰。</p><p> 2.2.2 數(shù)字圖像在計(jì)算機(jī)內(nèi)的處理</p><p> 設(shè)一幅圖像f(x,y),我
52、們?nèi)魧?duì)它作等間隔的采樣,在x,y方向上都取N個(gè)采樣點(diǎn),總共為N×N個(gè)圖像點(diǎn)。每一像素f (i, 1=0,1,2, …N-1)就是點(diǎn)的灰度值。形成離散化了的坐標(biāo)和灰度值可以用一個(gè)矩陣來表示,其行和列的交點(diǎn)標(biāo)出圖像的每個(gè)像素,該數(shù)字圖像矩陣可表示為圖2.2</p><p> 圖2.2 數(shù)字圖像矩陣</p><p> 在計(jì)算機(jī)中對(duì)數(shù)字圖像進(jìn)行處理時(shí),實(shí)質(zhì)上就是在對(duì)量化后的矩陣進(jìn)行
53、處理。</p><p> 從原理上將,傳統(tǒng)的彩色圖像分析是基于RGB色彩空間的,但是RGB空間是顏色顯示空間,并不適合人的視覺特性,對(duì)目標(biāo)物體的顏色模式描述復(fù)雜,各個(gè)分量之間冗余信息多,計(jì)算量大,而HSV空間通過對(duì)RGB顏色進(jìn)行變換,能體現(xiàn)人眼辨別顏色特點(diǎn)。在HSV空間,圖像特征明顯,易于進(jìn)行邊緣檢測(cè),分割和目標(biāo)識(shí)別處理。</p><p> 顏色可用明度、色調(diào)和飽和度來描述,人眼看到的
54、任一顏色都是這三個(gè)特性的綜合效果。明度是光作用于人眼時(shí)所引起的明亮程度的感覺,它與被觀察物體的發(fā)光強(qiáng)度有關(guān),由于其強(qiáng)度不同,看起來可能亮一些或暗一些。色調(diào)是當(dāng)人眼看到一種或多種波長(zhǎng)的光時(shí)所產(chǎn)生的彩色感覺,不同的波長(zhǎng)產(chǎn)生不同的顏色感覺,如紅、橙、黃、綠、青、藍(lán)、紫等。色調(diào)是彩色的最重要的屬性,是彩色光在“質(zhì)”方面的特征。如某物體在白光下呈現(xiàn)綠色,是因?yàn)樗鼉H反射了綠色光分量。飽和度是指顏色的純度,即摻入白色光的程度,飽和度的高低決定于彩色光
55、中混入的白色光數(shù)量,白色光愈少,飽和度越高。飽和度是彩色光在“量”的方面的特征。人眼大概能識(shí)別128種不同的色調(diào)和130種不同的色澤(色飽和度級(jí))。</p><p> 2.2.3 數(shù)字圖像處理概述[5]</p><p> 數(shù)字圖像處理的英文名稱是”Digital Image Processing”。通常所說的數(shù)字處理是指用計(jì)算進(jìn)行的處理,因此也稱計(jì)算機(jī)圖像處理(Computer Im
56、age Processing)。總的來說,數(shù)字圖像處理包括以下幾項(xiàng)內(nèi)容:</p><p><b> (1)點(diǎn)運(yùn)算</b></p><p> 點(diǎn)運(yùn)算主要是針對(duì)圖像的象素進(jìn)行加、減、乘、除等運(yùn)算。圖像的點(diǎn)運(yùn)算可以有效的改善圖像的直方圖分布,這對(duì)提高圖像的分辨率以及圖像的均衡都是非常有益的。</p><p><b> (2)幾何處理&
57、lt;/b></p><p> 幾何處理主要包括圖像的坐標(biāo)變換、圖像的移動(dòng)、縮小、放大、旋轉(zhuǎn)、多個(gè)圖像的配準(zhǔn)以及圖像的扭曲校正等。幾何處理是最常見的圖像處理手段,幾乎任何圖像處理軟件都提供了最基本的圖像縮放功能。</p><p><b> (3)圖像增強(qiáng)</b></p><p> 圖像增強(qiáng)的作用最主要是突出圖像中最重要的信息,同時(shí)減
58、弱或除去不重要的信息。常用的方法有直方圖增強(qiáng)和偽彩色增強(qiáng)等。</p><p><b> (4)圖像復(fù)原</b></p><p> 圖像復(fù)原的主要目的是去除干擾和模糊,從而恢復(fù)圖像的本來面目。例如去除噪聲復(fù)原處理。</p><p> (5)圖像形態(tài)學(xué)處理</p><p> 圖像形態(tài)學(xué)是數(shù)學(xué)形態(tài)學(xué)的延伸,是一門獨(dú)立的
59、研究學(xué)科。利用圖像形態(tài)學(xué)技術(shù),可以實(shí)現(xiàn)圖像的腐蝕、細(xì)化和分割等效果。</p><p><b> (6)圖像編碼</b></p><p> 圖像編碼研究屬于信息論中信源編碼的范疇,其主要宗旨是利用圖像信息的統(tǒng)計(jì)特性及人類的視覺特性對(duì)圖像進(jìn)行高效編碼,從而達(dá)到壓縮圖像的目的。</p><p><b> (7)圖像重建</b&g
60、t;</p><p> 圖像重建是一門新興的數(shù)字圖像處理技術(shù),主要是利用采集的數(shù)據(jù)來重建出圖像。其主要算法有代數(shù)法、迭代法、傅立葉反投影法和使用最廣泛的卷積反投影法等。</p><p><b> (8)模式識(shí)別</b></p><p> 模式識(shí)別也是數(shù)字圖像處理的一個(gè)新的研究方向。當(dāng)今的模式識(shí)別方法通常有三種:統(tǒng)計(jì)識(shí)別法、句法結(jié)構(gòu)模式識(shí)別
61、法和模糊識(shí)別法。</p><p> 本文所討論的數(shù)字圖像縮放技術(shù)主要是圖像分辨率的變換,屬于數(shù)字圖像的幾何處理的范疇。</p><p> 2.2.4 數(shù)字圖像文件格式[6]</p><p> 計(jì)算機(jī)圖像常用文件格式</p><p> PCX(Windows Paintbrush)格式??商幚?,4,8,16,24位等圖像數(shù)據(jù)。文件內(nèi)容
62、包括:文件頭(128字節(jié)),圖像數(shù)據(jù)擴(kuò)展調(diào)色板數(shù)據(jù)。</p><p> BMP(Windows Bitmap)格式。有1,4,8,24位非壓縮圖像,8位RLE(Run-length Encoded )圖像。文件內(nèi)容包括:文件頭(一個(gè)BITMAP FILEHEADER數(shù)據(jù)結(jié)構(gòu)),位圖信息數(shù)據(jù)塊(位圖信息頭BITMAP INFOHEADER和一個(gè)顏色表)和圖像數(shù)據(jù)。</p><p> HD
63、F(Hierarchical Data Format)格式。有8位,24位光柵數(shù)據(jù)集。</p><p> JPEG(Joint Photographic Experts Group)格式,是一種成為聯(lián)合圖像專家組的圖像壓縮格式。</p><p> TIFF(Tagged Image File Format)格式。處理1,4,8,24位非壓縮圖像,1,4,8,24位packbit壓縮圖像
64、,一位CCITT壓縮圖像等。文件內(nèi)容包括:文件頭,參數(shù)指針表與參數(shù)域,參數(shù)數(shù)據(jù)表和圖象數(shù)據(jù)四部分。</p><p> XWD(X Windows Dump)格式。1,8位Zpixmaps,XYbitmaps,1位XYpixmaps。</p><p> TGA格式。處理1,4,8,16,24位非壓縮圖像和行程編碼(RLE)圖像。文件由5個(gè)固定長(zhǎng)度字段和3個(gè)可變長(zhǎng)度字段組成。</p&
65、gt;<p> MATLAB圖像處理工具箱支持的四種基本圖像類型:</p><p><b> 索引圖像</b></p><p> 索引圖像包括圖像矩陣與顏色圖數(shù)組,其中,顏色圖是按圖像中顏色值進(jìn)行排序后的數(shù)組。對(duì)于每個(gè)像素,圖像矩陣包含一個(gè)值,這個(gè)值就是顏色圖中的索引。顏色圖為m*3雙精度值矩陣,各行分別指定紅綠藍(lán)(RGB)單色值。Colormap
66、=[R,G, B],R,G,B為值域?yàn)閇0,1]的實(shí)數(shù)值。</p><p> 圖像矩陣與顏色圖的關(guān)系依賴于圖像矩陣是雙精度型還是uint8(無符號(hào)8位整型)類型。如果圖像矩陣為雙精度類型,第一點(diǎn)的值對(duì)應(yīng)于顏色圖的第一行,第二點(diǎn)對(duì)應(yīng)于顏色圖的第二行,依次類推。如果圖像矩陣是uint8,有一個(gè)偏移量,第0點(diǎn)值對(duì)應(yīng)于顏色圖的第一行,第一點(diǎn)對(duì)應(yīng)于第二行,依次類推;uint8長(zhǎng)用于圖形文件格式,它支持256色。</
67、p><p><b> 灰度圖像</b></p><p> 在MATLAB中,灰度圖像是保存在一個(gè)矩陣中的,矩陣中的每一個(gè)元素代表一個(gè)像素點(diǎn)。矩陣可以是雙精度類型,其值域?yàn)閇0,1];也可以為uint8類型,其數(shù)據(jù)范圍為[0,255]。矩陣的每個(gè)元素代表不同的亮度或灰度級(jí)。</p><p><b> 二進(jìn)制圖像</b>&l
68、t;/p><p> 二進(jìn)制圖像中,每個(gè)點(diǎn)為兩離散值中的一個(gè),這兩個(gè)值代表開或關(guān)。二進(jìn)制圖像保存在一個(gè)由二維的由0(關(guān))和1(開)組成的矩陣中。從另一個(gè)角度講,二進(jìn)制圖像可以看成為一個(gè)僅包括黑與白的灰度圖像,也可以看作只有兩種顏色的索引圖像。</p><p> 二進(jìn)制圖像可以保存為雙精度或uint8類型的雙精度數(shù)組,顯然使用uint8類型更節(jié)省空間。在圖像處理工具箱中,任何一個(gè)返回二進(jìn)制圖像
69、的函數(shù)都是以u(píng)int8類型邏輯數(shù)組來返回的。</p><p><b> RGB圖像</b></p><p> 與索引圖像一樣,RGB圖像分別用紅,綠,藍(lán)三個(gè)亮度值為一組,代表每個(gè)像素的顏色。與索引圖像不同的是,這些亮度值直接存在圖像數(shù)組中,而不是存放在顏色圖中。圖像數(shù)組為M*N*3,M,N表示圖像像素的行列數(shù)。</p><p> 2.3
70、MATLAB基本知識(shí)介紹 </p><p> 2.3.1 MATLAB概述[8]</p><p> MATLAB 最初是作為矩陣實(shí)驗(yàn)室 (Matrix Labora2tory) 用來提供通往 LINPACK和EISPACK矩陣軟件包接口的。后來,它逐漸發(fā)展成為通用科技計(jì)算和圖視交互系統(tǒng)的程序語言,其數(shù)據(jù)的基本單元是矩陣。它的指令表達(dá)與數(shù)學(xué)、工程中常用的習(xí)慣形式十分相似,從而使許多用 C
71、 或 Fortran 實(shí)現(xiàn)起來十分復(fù)雜費(fèi)時(shí)的問題用 MATLAB 就可以輕松地解決。MATLAB 的典型應(yīng)用包括 :數(shù)學(xué)計(jì)算、算法研究、數(shù)據(jù)分和計(jì)算結(jié)果可視化、建模與仿真等。</p><p> 2.3.2 MATLAB的特點(diǎn)</p><p> MATLAB 有三大特點(diǎn) :一是功能強(qiáng)大。主要包括數(shù)值計(jì)算和符號(hào)計(jì)算、計(jì)算結(jié)果和編程可視化、數(shù)學(xué)和文字統(tǒng)一處理、離線和在線計(jì)算。二是界面友好,編
72、程效率高。MATLAB 是一種以矩陣為基本單元的可視化程序設(shè)計(jì)語言,語法結(jié)構(gòu)簡(jiǎn)單,數(shù)據(jù)類型單一,指令表達(dá)與標(biāo)準(zhǔn)教科書的數(shù)學(xué)表達(dá)式相近。三是開放性強(qiáng)。MATLAB有很好的可擴(kuò)充性可以把它當(dāng)成一種更高級(jí)的語言去使用。使用它很容易編寫各種通用或?qū)S脩?yīng)用程序。</p><p> 2.3.3 MATLAB的主要功能</p><p> MATLAB 之所以成為世界頂級(jí)的科學(xué)計(jì)算與數(shù)學(xué)應(yīng)用軟件 ,是
73、因?yàn)樗S著版本的升級(jí)與不斷完善而具有愈來愈強(qiáng)大的功能。</p><p> (1) 數(shù)值計(jì)算功能。MATLAB 出色的數(shù)值計(jì)算功能是使之優(yōu)于其他數(shù)學(xué)應(yīng)用軟件的決定性因素之一。</p><p> (2) 符號(hào)計(jì)算功能。MATLAB 符號(hào)運(yùn)算的獨(dú)特之處:無須事先對(duì)變量賦值,而所得的結(jié)果以標(biāo)準(zhǔn)的符號(hào)形式表達(dá) ,符號(hào)計(jì)算的整個(gè)過程以字符進(jìn)行。</p><p> (3)
74、數(shù)據(jù)分析功能。MATLAB 可以給計(jì)算數(shù)據(jù)以二維、三維乃至四維的圖形表現(xiàn)。這不僅使數(shù)據(jù)間的關(guān)系清晰明了 ,而且對(duì)于揭示其內(nèi)在本質(zhì)有著非常重要的作用。</p><p> (4) 動(dòng)態(tài)仿真功能。MATLAB 提供了一個(gè)模擬動(dòng)態(tài)系統(tǒng)的交互程序 SIMULINK,用戶通過簡(jiǎn)單的鼠標(biāo)操作 ,就可建立起直觀的系統(tǒng)模型 ,并進(jìn)行仿真。</p><p> (5) 圖形文字統(tǒng)一處理功能。MATLAB N
75、otebook成功地將Microsoft Word 與 MATLAB 集成為一個(gè)整體 ,為文字處理、科學(xué)計(jì)算、工程設(shè)計(jì)營(yíng)造了一個(gè)完美統(tǒng)一的工作環(huán)境。它既擁有 Word 強(qiáng)大的文字處理功能 ,又能從 Word 訪問MATLAB 的數(shù)據(jù)計(jì)算和可視化結(jié)果。</p><p> 2.3.4 MATLAB在圖象處理中的應(yīng)用[8]</p><p> 圖像處理工具包是由一系列支持圖像處理操作的函數(shù)組成
76、的。所支持的圖像處理操作有:圖像的幾何操作、鄰域和區(qū)域操作、圖像變換、圖像恢復(fù)與增強(qiáng)、線性濾波和濾波器設(shè)計(jì)、變換(DCT變換等) 、圖像分析和統(tǒng)計(jì)、二值圖像操作等。下面就MATLAB 在圖像處理中各方面的應(yīng)用分別進(jìn)行介紹。</p><p> (1) 圖像文件格式的讀寫和顯示。MATLAB 提供了圖像文件讀入函數(shù) imread(),用來讀取如:bmp,tif、tiff、pcx 、jpg 、gpeg 、hdf、xw
77、d等格式圖像文;圖像寫出函數(shù) imwrite() ,還有圖像顯示函數(shù) image()、imshow()等等。</p><p> (2) 圖像處理的基本運(yùn)算。MATLAB 提供了圖像的和、差等線性運(yùn)算 ,以及卷積、相關(guān)、濾波等非線性算。例如,conv2(I,J)實(shí)現(xiàn)了I,J兩幅圖像的卷積。</p><p> (3) 圖像變換。MATLAB 提供了一維和二維離散傅立葉變換(DFT) 、快速
78、傅立葉變換(FFT) 、離散余弦變換 (DCT) 及其反變換函數(shù),以及連續(xù)小波變換(CWT)、離散小波變換(DWT)及其反變換。</p><p> (4) 圖像的分析和增強(qiáng)。針對(duì)圖像的統(tǒng)計(jì)計(jì)算MATLAB 提供了校正、直方圖均衡、中值濾波、對(duì)比度調(diào)整、自適應(yīng)濾波等對(duì)圖像進(jìn)行的處理。</p><p> (5) 圖像的數(shù)學(xué)形態(tài)學(xué)處理。針對(duì)二值圖像,MATLAB 提供了數(shù)學(xué)形態(tài)學(xué)運(yùn)算函數(shù);蝕
79、(Erode)、膨脹(Dilate)算子,以及在此基礎(chǔ)上的開 (Open)、閉(Close)算子、厚化 (Thicken) 、薄化 (Thin) 算子等豐富的數(shù)學(xué)形態(tài)學(xué)運(yùn)算。</p><p> 以上所提到的 MATLAB在圖像中的應(yīng)用都是由相應(yīng)的MATLAB函數(shù)來實(shí)現(xiàn)的,使用時(shí),只需按照函數(shù)的調(diào)用語法正確輸入?yún)?shù)即可。具體的用法可參考MATLAB豐富的幫助文檔。圖像邊緣對(duì)圖像識(shí)別和計(jì)算機(jī)分析十分有用,在MATL
80、AB中,函數(shù) edge()用于灰度圖像邊緣的提取,它支持六種不同的邊緣提取方法,即Sobel方法、Prewitt 方法、Robert 方法,Laplacian2Gaussian方法、過零點(diǎn)方法和Canny方法。</p><p> 第三章 傳統(tǒng)數(shù)字圖像縮放技術(shù)</p><p> 3.1 數(shù)字圖像縮放技術(shù)概述</p><p> 3.1.1 什么是數(shù)字圖像縮放<
81、;/p><p> 一般來說,數(shù)字圖像縮放就是指圖像分辨率的變換。包括由高分辨率圖像轉(zhuǎn)變?yōu)榈追直媛蕡D像和有低分辨率圖像轉(zhuǎn)變?yōu)楦叻直媛蕡D像。數(shù)字圖像縮放是圖像處理領(lǐng)域里非常常見的操作,屬于數(shù)字圖像的幾何變換范疇。隨著信息科技的發(fā)展,圖像縮放技術(shù)的應(yīng)用范圍越來越廣,包括計(jì)算機(jī)圖像處理軟件中的應(yīng)用,互聯(lián)網(wǎng)上的多媒體瀏覽,數(shù)字電視視頻傳輸與顯示領(lǐng)域,天文與氣象觀測(cè)領(lǐng)域,軍事領(lǐng)域,醫(yī)學(xué)圖像應(yīng)用領(lǐng)域及數(shù)碼照片拍攝與處理領(lǐng)域??傊?/p>
82、只要有視頻多媒體的地方,有圖像處理的地方,都會(huì)有數(shù)字圖像縮放技術(shù)的身影。隨著數(shù)字化時(shí)代的到來,該技術(shù)會(huì)越來越多的得到應(yīng)用。本文主要針對(duì)于數(shù)字電視領(lǐng)域圖像縮放,因此在算法上有較強(qiáng)的針對(duì)性,對(duì)于一些在數(shù)字電視領(lǐng)域難以實(shí)現(xiàn)的算法不做過多研究。</p><p> 3.1.2 數(shù)字圖像縮放的算法概述</p><p> 就目前來說,數(shù)字圖像縮放技術(shù)主要是應(yīng)用數(shù)學(xué)上的插值理論,使用插值(Interp
83、olation)算法。傳統(tǒng)的圖像插值算法有最近鄰插值(Nearest Neighbor Interpolation),雙線性插值(Bilinear Interpolation),雙三次插值(Bicubic Interpolation)。傳統(tǒng)插值算法在MATLAB中都有相應(yīng)的工具函數(shù),屬于比較成熟的算法。在當(dāng)今流行的插值算法多是對(duì)傳統(tǒng)插值算法的改進(jìn),包括基于近臨插值與鄰域取平均的圖像縮小算法,基于Ferguson曲面插值的圖像縮放方法,帶
84、系數(shù)自適應(yīng)插值算法及其改進(jìn),基于數(shù)字圖像邊緣提取的插值算法及改進(jìn),基于圖像增強(qiáng)技術(shù)提高圖像分辨率方法,隨著小波技術(shù)的發(fā)展,還有越來越多的基于小波的圖像插值算法。但本人覺得由于基于圖像增強(qiáng)技術(shù)提高圖像分辨率方法和基于小波的圖像插值算法計(jì)算量過大,加上當(dāng)今硬件處理速度的限制,很難應(yīng)用于數(shù)字電視的視頻處理領(lǐng)域,達(dá)到實(shí)時(shí)處理的要求。隨著硬件技術(shù)的發(fā)展有望應(yīng)用于數(shù)字電視視頻處理領(lǐng)域。</p><p> 3.2 傳統(tǒng)的數(shù)字
85、圖像縮放技術(shù)[7]</p><p> 由于圖像像素的灰度值是離散的,因此一般的處理方法是對(duì)原來在整數(shù)點(diǎn)坐標(biāo)上的像素值進(jìn)行插值生成連續(xù)的曲線(面),然后在插值曲線(面)上重新采樣以獲得放大或縮小圖像像素的灰度值。以一維空間像素的灰度插值為例,圖3.1所示的是將原圖的5個(gè)像素縮小為4個(gè)像素的過程:先根據(jù)~這五個(gè)像素的灰度值采用選定的插值算法生成插值曲線,再對(duì)該曲線進(jìn)行重采樣得到縮小后的四個(gè)像素~,從而實(shí)現(xiàn)圖像的縮放
86、。下面簡(jiǎn)要介紹目前常用的三種插值采樣方法。</p><p> 圖3.1圖像縮放中的插值和重采樣</p><p> 3.2.1最近鄰插值(Nearest Neighbor Interpolation)</p><p> 1.近鄰插值數(shù)學(xué)概述</p><p><b> 插值核函數(shù)為:</b></p>&
87、lt;p><b> 其頻域變換為:</b></p><p> 其核函數(shù)及對(duì)應(yīng)的傅立葉變換頻譜圖如圖3.2為:</p><p> 圖 3.2 近鄰插值核函數(shù)及其傅立葉變換頻譜圖</p><p><b> 2.實(shí)現(xiàn)方法</b></p><p> 將目的圖像的某個(gè)坐標(biāo)通過計(jì)算得到一個(gè)浮點(diǎn)坐
88、標(biāo),對(duì)其進(jìn)行簡(jiǎn)單的取整處理就得到一個(gè)對(duì)應(yīng)原照片圖像的整數(shù)坐標(biāo),目的照片圖像坐標(biāo)的像素值。具體算法為:設(shè)處理的目的圖像的坐標(biāo)為,圖像的縮放比例為m ,則對(duì)應(yīng)原圖像的浮點(diǎn)坐標(biāo)為( x/ m , y/ m) ,對(duì)該坐標(biāo)取整得到對(duì)應(yīng)原照片圖像的整數(shù)坐標(biāo),目的照片圖像在該坐標(biāo)的像素值。顯然該方法就是取該浮點(diǎn)坐標(biāo)最鄰近的左上角對(duì)應(yīng)的像素值。</p><p><b> 3 算法評(píng)價(jià)</b></p&
89、gt;<p> 對(duì)于二維圖像。該法是“取待采樣點(diǎn)周圍4個(gè)相鄰像素點(diǎn)中距離最近的1個(gè)鄰點(diǎn)的灰度值作為該點(diǎn)的灰度值”。此算法雖然計(jì)算簡(jiǎn)單,但由于僅用對(duì)該采樣點(diǎn)影響最大的(即最近的)像素的灰度值作為該點(diǎn)的值,而沒有考慮其他相鄰像素的影響(相關(guān)性),因此重新采樣后的圖像灰度值有明顯的不連續(xù)性,像質(zhì)損失較大。</p><p> 3.2.2雙線性插值(Bilinear Interpolation)</
90、p><p> 1.線性插值數(shù)學(xué)概述</p><p><b> 插值核函數(shù):</b></p><p><b> 其頻域變換為:</b></p><p> 其核函數(shù)及對(duì)應(yīng)的傅立葉變換頻譜圖如圖3.3所示:</p><p> 圖 3.3雙線性插值核函數(shù)及其傅立葉變換頻譜圖&l
91、t;/p><p><b> 2.實(shí)現(xiàn)方法</b></p><p> 雙線性內(nèi)插法通過線性插值的方式來得到目的圖像的像素值。我們通過近鄰取樣法知道,對(duì)于一個(gè)的像素,其坐標(biāo)通過反向變換可得到一個(gè)浮點(diǎn)坐標(biāo),我們可令其為( i + u, j + v) ,其中 i 和j 均為負(fù)整數(shù), u 和v 為[0,1]區(qū)間的浮點(diǎn)數(shù),則這個(gè)目的像素的值可由原圖像中坐標(biāo)為( i , j) ,
92、( i+1,j) , (i ,j +1) , (i +1,j +1)所對(duì)應(yīng)的值的線性插值來決定,即= (1 - u) (1 - v) f ( i ,j) + (1 - u) vf ( i , j +1) + u(1 - v) f ( i +1, j) + uvf ( i +1,j +1)。其示意圖如圖3.4所示:</p><p> 圖 3.4雙線性插值算法實(shí)現(xiàn)示意圖</p><p>&l
93、t;b> 3.算法評(píng)價(jià)</b></p><p> 與最鄰近法相比。雙線性內(nèi)插法由于考慮了待采樣點(diǎn)周圍四個(gè)直接鄰點(diǎn)對(duì)待采樣點(diǎn)的影響,因此基本克服了前者灰度不連續(xù)的缺點(diǎn),但其代價(jià)是計(jì)算量有所增大。但進(jìn)一步看,由于此方法僅考慮四個(gè)直接鄰點(diǎn)灰度值的影響,而未考慮到各鄰點(diǎn)間灰度值變化率的影響,因此具有低通濾波器的性質(zhì),使縮放后圖像的高頻分量受到損失,圖像的輪廓變得較模糊。用此方法縮放后的圖像與原圖像相
94、比,仍然存在由于計(jì)算模型考慮不周而產(chǎn)生的圖像質(zhì)量退化與精度降低的問題。</p><p> 3.2.3 雙三次插值(Bicubic Interpolation)</p><p> 3.2.3.1 雙三次插值的數(shù)學(xué)概述</p><p><b> 插值核函數(shù):</b></p><p><b> 其頻域變換為:
95、</b></p><p> 其核函數(shù)及對(duì)應(yīng)的傅立葉變換頻譜圖如圖3.5所示:</p><p> 圖 3.5雙三次插值插值核函數(shù)及其傅立葉變換頻譜圖</p><p><b> 2.實(shí)現(xiàn)方法</b></p><p> 對(duì)雙線性內(nèi)插法的改進(jìn),即不僅考慮到四個(gè)直接鄰點(diǎn)灰度值的影響,還考慮到各鄰點(diǎn)間灰度值變化率
96、的影響,立方卷積法利用了待采樣點(diǎn)周圍更大鄰域內(nèi)像素的灰度值作三次插值(4*4=16個(gè)像素點(diǎn))。利用上述插值核函數(shù)提供的公式進(jìn)行插值。計(jì)算時(shí)取周圍的16個(gè)像素點(diǎn),其示意圖如圖3.6所示:</p><p> 圖 3.6 雙三次插值算法實(shí)現(xiàn)示意圖</p><p> 該像素的灰度值f(x,y)為: 式中各矩陣含義如下:</p><p><b> 3.算法評(píng)價(jià)
97、</b></p><p> 雙線性內(nèi)插法相比,立方卷積法不僅考慮了直接鄰點(diǎn)的灰度值對(duì)待采樣點(diǎn)</p><p> 的影響,還考慮了鄰點(diǎn)間灰度值變化率的影響,因此后者所求得的待采樣點(diǎn)灰度值更接近原(采樣)值。此方法用進(jìn)一步增大計(jì)算量來換取待采樣點(diǎn)精度的進(jìn)一步提高,因此并不是最佳的插值算法。</p><p> 第四章 當(dāng)今主流數(shù)字圖像縮放技術(shù)的算法<
98、;/p><p> 4.1 基于近臨插值與鄰域取平均的圖像縮小算法</p><p><b> 4.1.1問題引入</b></p><p> 傳統(tǒng)的圖像縮放算法中,有的有的失真較小但是算法復(fù)雜,如雙三次插值;有的運(yùn)算量小但得到的圖像失真較大,如最近鄰插值和雙線性插值。在對(duì)圖像進(jìn)行縮小的時(shí)候存在著圖像信息的損失 ,而且縮小的比例越大,損失越大,從而
99、導(dǎo)致圖像的失真較大,最主要的是在對(duì)圖像進(jìn)行縮小的時(shí)候顯然會(huì)出現(xiàn)原圖像的多個(gè)像素對(duì)應(yīng)同一個(gè)像素點(diǎn)從而會(huì)產(chǎn)生像素躍越現(xiàn)象。</p><p> 如何合適的選取目的圖像的像素值是圖像縮小的最關(guān)鍵的問題。我們可以通過反向變換法來實(shí)現(xiàn)。反向變換法從目的圖像出發(fā),對(duì)于一個(gè)目的像素 ,通過縮放變換的逆變換 ,找到這個(gè)目的像素的原坐標(biāo)點(diǎn)。但是,存在這樣一個(gè)問題 ,即將目的像素的整數(shù)坐標(biāo)通過反向變換后將得到浮點(diǎn)坐標(biāo)。</p&
100、gt;<p> 通常對(duì)于一個(gè)浮點(diǎn)坐標(biāo),其對(duì)應(yīng)的點(diǎn)的周圍將有最鄰近的四個(gè)或八個(gè)像素。取哪一個(gè)像點(diǎn)的像素值來作為這個(gè)目的像素的值呢?從實(shí)質(zhì)上來講,就是怎樣通過鄰近的像素值來計(jì)算出一個(gè)新的像素值,這個(gè)新值就是目的像素的值。傳統(tǒng)三種算法在進(jìn)行縮小時(shí)候,圖像縮小的比例越大,像素躍越現(xiàn)象越明顯,顯然會(huì)產(chǎn)生高頻干擾。因此要使得圖像不失真必須采用低通濾波的方式將這些高頻干擾去除。實(shí)際上我們處理的時(shí)候是將做反變換和濾波同時(shí)進(jìn)行,這樣做的效
101、果更好于是我們運(yùn)算量與運(yùn)算結(jié)果上都做了考慮得到此種兼顧運(yùn)算速度與運(yùn)算質(zhì)量的圖像縮小算法。</p><p> 4.1.2 算法實(shí)現(xiàn)</p><p> 設(shè)原圖像的坐標(biāo)為,該點(diǎn)的像素值為,目標(biāo)圖像的坐標(biāo)為(x,y),該點(diǎn)的像素值為??s小的比例為k, k 在(0,1)區(qū)間取值。則通過反變得到的一個(gè)浮點(diǎn)坐標(biāo)為(x/ k,y/k),對(duì)該坐標(biāo)取整得到一個(gè)整數(shù)坐標(biāo)。這種取得原圖像坐標(biāo)方法實(shí)際和近鄰取樣
102、法完全相同。但是我們不直接利用該點(diǎn)的像素值,而是取該點(diǎn)的周圍的某些點(diǎn)的平均值來作為目標(biāo)點(diǎn)的像素值。這樣做實(shí)際上就是一個(gè)低通濾波的過程。我們就稱這種算法為近鄰取樣和鄰域平均相結(jié)合的算法。鄰域平均算法為:令被討論像素的像素值為,以其為中心,窗口像素組成的點(diǎn)集以 A 表示,集內(nèi)像素個(gè)數(shù)以L表示。經(jīng)鄰域平均濾波后,像素對(duì)應(yīng)的輸出為:,用窗口像素的平均值代替原來的像素值。鄰域的選取通常有兩種方式:以單位距離為半徑,為一菱形窗口或單位距離的倍為半徑
103、,為一矩形窗口,在本文中我們采取了菱形窗口。具體編程的時(shí)候我們使用了如下模板(以距離為5個(gè)像素為例)。模板取法如圖4.1所示:</p><p> 圖 4.1 鄰域平均5×5 模板</p><p> 實(shí)際該模板為一個(gè)5×5的矩陣,使用步驟為:</p><p> (1) 將模板中心和通過近鄰取樣法得到的像素點(diǎn)位置重合;</p>&
104、lt;p> (2) 將模板上系數(shù)與模板下對(duì)應(yīng)像素值相乘;</p><p> (3) 將所有的乘積相加;</p><p> (4) 將和除以模板各系數(shù)之和得到目的圖像對(duì)應(yīng)點(diǎn)像素值。</p><p> 在有些情況下,我們還可以使用權(quán)值不相同的模板。如我們認(rèn)為距離中心像素遠(yuǎn)的點(diǎn)對(duì)目的像素的影響小,我們就可以將他們的權(quán)值設(shè)小一些,相反距離中心像素近的點(diǎn)對(duì)目的像
105、素的影響大,就可以將他們的權(quán)值設(shè)大一些。下面是一個(gè)權(quán)值和距離成反比的5×5模板:</p><p><b> 總的算法流程為:</b></p><p> (1) 讀入原圖像,得到圖像的高度和寬度;</p><p> (2) 通過縮放比例得到目的圖像的高度和寬度,建立空白目的圖像;</p><p> (3)
106、 從上到下,從左往右的順序掃描目的圖像;</p><p> (4) 掃描過程中對(duì)每一個(gè)目的圖像的坐標(biāo) ,利用近鄰法取樣法在原圖像中找到模板中心位置;</p><p> (5) 利用設(shè)定的模板進(jìn)行鄰域平均得到目的圖像掃描點(diǎn)的像素值,如果模板覆蓋在原圖像的邊界,要進(jìn)行邊界處理;</p><p> (6) 掃描完成,圖像的縮小處理也就完成了。</p>
107、<p> 圖4.2 權(quán)值和距離成反比的5×5模板</p><p> 4.1.3 算法評(píng)價(jià)</p><p> 本文討論的近鄰取樣和鄰域平均相結(jié)合的方法對(duì)圖像進(jìn)行縮小處理,具有算法簡(jiǎn)單,失真較小的特點(diǎn)。尤其在處理細(xì)節(jié)單調(diào),背景和物體之間區(qū)別明顯的圖像,而且縮小比例較大的時(shí)候 ,處理效果較好,比較適合處理人的頭像。但是在處理輪廓很細(xì)的圖像的時(shí)候,輪廓的顏色失真較大,這方
108、面有待于進(jìn)一步提高。</p><p> 4.2 基于Ferguson曲面插值的圖像縮放方法</p><p> 4.2.1 問題引入</p><p> 在傳統(tǒng)的插值方法中,鄰近點(diǎn)插值不能保證插值曲面連續(xù),插值后圖像會(huì)出現(xiàn)塊狀化(Jaggies)現(xiàn)象,圖像視覺效果不佳,因而在實(shí)際的應(yīng)用極少采用;雙線性插值只能達(dá)到連續(xù),在插值處只能保證灰度值連續(xù),不能保證導(dǎo)數(shù)值連續(xù)
109、,因此,在某些要求較高的場(chǎng)合仍不能滿足要求。B樣條插值方法可以達(dá)到連續(xù),在插值處可以保證灰度值和直到二階導(dǎo)數(shù)值連續(xù),因而對(duì)一些細(xì)節(jié)豐富的圖像應(yīng)用雙三次樣條插值可以得到更好的視覺效果.但由于需要求解線性方程組,其計(jì)算時(shí)間較長(zhǎng),尤其是在放大倍數(shù)很大時(shí),尤為明顯.本文將計(jì)算機(jī)圖形學(xué)中的Ferguson曲面插值應(yīng)用于圖像縮放中,提出了一種基于Ferguson雙三次曲面插值的圖像縮放算法.這種方法介于雙線性插值和雙三次樣條插值方法之間,是一種插值
110、方法,插值處灰度值和導(dǎo)數(shù)都連續(xù),細(xì)節(jié)表現(xiàn)清楚,因此,從理論上講該法優(yōu)于鄰近點(diǎn)插值方法和雙線性插值方法.由于它是一種局部插值方法,不需要求解線性方程組,因而計(jì)算速度比雙三次樣條插值要快得多.</p><p> 4.2.2 算法實(shí)現(xiàn)</p><p> 1.Ferguson雙三次曲面</p><p> 給定雙三次參數(shù)曲面 4個(gè)角點(diǎn)處的幾何信息:位置矢量(i,j=0,
111、1),沿向的切矢,以及四個(gè)角點(diǎn)處的扭矢,則滿足以上幾何條件的雙三次曲面可表示為:</p><p><b> ?。?.1)</b></p><p><b> 其中:,</b></p><p> 由公式(4.1)定義的曲面稱為Coons雙三次曲面.在實(shí)際計(jì)算時(shí),4個(gè)角點(diǎn)處扭矢不容易確定.如果令上述公式中4個(gè)扭矢為零,即令&
112、lt;/p><p> 此時(shí)由公式(4.1)定義的曲面就稱為Ferguson雙三次曲面.</p><p> 2.Ferguson雙三次曲面插值</p><p> 對(duì)于給定的原始圖像,在本文的算法中,插值曲面由M*N張F(tuán)erguson雙三次曲面片組成。</p><p><b> (4.2)</b></p>
113、<p> 其中,,,的含義同上。</p><p><b> ?。?.3)</b></p><p> 整張插值曲面按如下方式定義:當(dāng)時(shí)令</p><p><b> ?。?.4)</b></p><p> 在矩陣(4.3)中,左上角代表像素的灰度值,均已知。左下角代表在4個(gè)角點(diǎn)處灰度值關(guān)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 數(shù)字圖像縮放技術(shù)研究 畢業(yè)論文3
- 數(shù)字圖像縮放及圖像質(zhì)量評(píng)價(jià)關(guān)鍵技術(shù)研究.pdf
- 醫(yī)學(xué)數(shù)字圖像畢業(yè)論文
- 畢業(yè)論文---數(shù)字圖像處理
- 數(shù)字圖像處理畢業(yè)論文
- 數(shù)字圖像處理畢業(yè)論文
- 數(shù)字圖像處理畢業(yè)論文
- 畢業(yè)論文數(shù)字圖像處理論文
- 畢業(yè)論文外文翻譯-數(shù)字圖像處理
- 畢業(yè)論文(論文)數(shù)字圖像去霧算法研究
- 畢業(yè)設(shè)計(jì)----數(shù)字圖像處理技術(shù)研究
- 數(shù)字圖像處理論文數(shù)字圖像處理技術(shù)論文.
- 數(shù)字圖像處理與分析畢業(yè)論文
- 數(shù)字圖像處理-圖像縮放的vc++實(shí)現(xiàn)
- 數(shù)字圖像分割的多種算法研究-畢業(yè)論文
- 數(shù)字圖像篡改的檢測(cè)方法研究【畢業(yè)論文】
- 基于matlab的數(shù)字圖像處理畢業(yè)論文
- 數(shù)字圖像縮放及其質(zhì)量評(píng)價(jià)方法研究.pdf
- 圖像縮放合成處理畢業(yè)論文
- 畢業(yè)論文——基于matlab數(shù)字圖像增強(qiáng)處理
評(píng)論
0/150
提交評(píng)論