傳感器數(shù)字表頭圖像的數(shù)據(jù)讀取與利用畢業(yè)論文_第1頁
已閱讀1頁,還剩42頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、<p><b>  學(xué)位論文原創(chuàng)性聲明</b></p><p>  本人鄭重聲明:所呈交的論文是本人在導(dǎo)師的指導(dǎo)下獨立進(jìn)行研究所取得的研究成果。除了文中特別加以標(biāo)注引用的內(nèi)容外,本論文不包括任何其他個人或集體已經(jīng)發(fā)表或撰寫的成果作品。本人完全意識到本聲明的法律后果由本人承擔(dān)。</p><p>  作者簽名: </p>

2、<p><b>  年 月 日</b></p><p>  學(xué)位論文版權(quán)使用授權(quán)書</p><p>  本學(xué)位論文作者完全了解學(xué)校有關(guān)保障、使用學(xué)位論文的規(guī)定,同意學(xué)校保留并向有關(guān)學(xué)位論文管理部門或機(jī)構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱。本人授權(quán)省級優(yōu)秀學(xué)士論文評選機(jī)構(gòu)將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)進(jìn)行檢索,可以采用影印、縮印或

3、掃描等復(fù)制手段保存和匯編本學(xué)位論文。</p><p>  本學(xué)位論文屬于1、保密囗,在 年解密后適用本授權(quán)書</p><p><b>  2、不保密囗 。</b></p><p>  作者簽名: </p><p>  年 月 日</p><p>  導(dǎo)師簽名: &

4、lt;/p><p>  年 月 日</p><p><b>  摘 要 </b></p><p>  隨著計算機(jī)軟硬件技術(shù)的高速發(fā)展,計算機(jī)數(shù)字圖像處理技術(shù)在各個領(lǐng)域得到了廣泛的應(yīng)用,如計算機(jī)圖像識別、圖像檢索、圖像工業(yè)化應(yīng)用等。尤其是計算機(jī)識別技術(shù),通過數(shù)字圖像處理中的模式識別技術(shù),可以將人眼無法識別的圖像進(jìn)行分類處理,可以快速準(zhǔn)確的

5、檢索、匹配和識別出各種東西。而本文研究基于數(shù)字顯示表頭圖像的數(shù)字讀取方法,以利于無線傳感網(wǎng)絡(luò)中的傳輸與終端分析。本此設(shè)計的主要研究內(nèi)容是選取車牌、電表等實用標(biāo)識、計量標(biāo)牌或表頭的數(shù)字照片,利用數(shù)字圖像處理技術(shù)快速得到準(zhǔn)確度高的數(shù)字信息,用于無線傳感網(wǎng)絡(luò)的傳輸和終端處理。</p><p>  本次設(shè)計的過程分為5個步驟:圖像采集、圖像預(yù)處理、圖像分割、輪廓跟蹤、圖像辨別。采集圖像的設(shè)備選取了自己的手機(jī)攝像頭,通過直

6、接拍照進(jìn)行圖像采集。而后面的進(jìn)行圖像處理的過程都是以VC++作為平臺完成的。通過圖像平滑、圖像增強等進(jìn)行圖像預(yù)處理,再用二值化處理進(jìn)行圖像分割,最后利用輪廓跟蹤的相關(guān)算法實現(xiàn)對數(shù)字圖像的特征進(jìn)行圖像辨別來確定數(shù)字信號,通過MFC模塊反映出來。在經(jīng)過不斷調(diào)試和改善之后,設(shè)計能成功地將采集到的車牌號和液晶顯示屏讀取出來,實現(xiàn)了數(shù)字圖像的數(shù)據(jù)讀取與利用的相關(guān)功能。</p><p>  關(guān)鍵詞:數(shù)字圖像處理;圖像辨別;二

7、值化處理;輪廓跟蹤</p><p><b>  Abstract</b></p><p>  With the rapid development of computer hardware and software technology, computer digital image processing technology in various fields ha

8、s been widely used, such as image recognition, image retrieval, and other industrial applications. Especially computer recognition technology, through digital image processing pattern recognition technology, the human ey

9、e can not recognize the image classification, can quickly and accurately search, match and identify a variety of things. In this paper, based </p><p>  The design process is divided into five steps: image ac

10、quisition, image pre-processing, image segmentation, contour tracking, image identification. Image acquisition devices selected his cell phone camera, image acquisition through direct camera. The image processing procedu

11、re are behind VC + + as a platform to complete. Performed by the image smoothing, and other image pre-processing image enhancement, and then binarizing the image segmentation, contour tracking algorithms Finally, the rea

12、lizat</p><p>  Key Words:digital image processing;graphic distinguish;binarizing;contour tracking</p><p><b>  目 錄</b></p><p><b>  第1章 緒論1</b></p>&l

13、t;p>  1.1 課題研究的背景及意義1</p><p>  1.2 國內(nèi)外研究現(xiàn)狀分析1</p><p>  1.3 研究內(nèi)容與具體安排2</p><p>  第2章 數(shù)字圖像處理及開發(fā)工具VC++的介紹4</p><p>  2.1 數(shù)字圖像處理4</p><p>  2.1.1 數(shù)字圖像處理的簡

14、介4</p><p>  2.1.2 圖像格式介紹4</p><p>  2.1.3 數(shù)字圖像處理中的基本圖像類型5</p><p>  2.2 基于計算機(jī)視覺處理圖像的簡單介紹6</p><p>  2.2.1視覺技術(shù)的研究6</p><p>  2.2.2 計算機(jī)視覺研究的對象與方法6</p>

15、;<p>  2.2.3 計算機(jī)視覺的應(yīng)用領(lǐng)域7</p><p>  2.3數(shù)字圖像處理方法介紹9</p><p>  2.3.1 圖像預(yù)處理9</p><p>  2.3.2 圖像分割介紹11</p><p>  2.3.3 模板匹配12</p><p>  2.3.4 輪廓跟蹤13<

16、/p><p>  2.3.5 輪廓跟蹤與模板匹配比較14</p><p>  2.4VC++與MFC功能模塊的介紹14</p><p>  2.4.1VC++平臺簡介14</p><p>  2.4.2 MFC模塊的功能介紹15</p><p>  第3章 數(shù)字圖像處理的實現(xiàn)過程及算法17</p>

17、<p>  3.1 圖像采集17</p><p>  3.2 圖像預(yù)處理方法——圖像平滑17</p><p>  3.3 圖像分割——二值化處理18</p><p>  3.4 輪廓跟蹤算法實現(xiàn)19</p><p>  3.5 基于輪廓跟蹤的圖像辨別算法20</p><p>  第4章 實驗結(jié)果及結(jié)

18、論22</p><p>  4.1 實驗結(jié)果22</p><p>  4.2 遇到的問題和解決方案23</p><p><b>  4.3 結(jié)論23</b></p><p><b>  第5章 總結(jié)25</b></p><p><b>  參考文獻(xiàn)27&

19、lt;/b></p><p><b>  附錄27</b></p><p>  附1 圖像預(yù)處理的算法程序28</p><p>  附2 圖像分割的算法程序30</p><p>  附3 輪廓跟蹤的算法程序33</p><p>  附4 圖像辨別的算法程序36</p>

20、<p><b>  致謝38</b></p><p><b>  第1章 緒論</b></p><p>  1.1 課題研究的背景及意義</p><p>  論文研究的是獲得傳感器數(shù)字表頭圖像的數(shù)據(jù)讀取高效方法,提供無線傳感網(wǎng)等應(yīng)用所需要的準(zhǔn)確、集約的圖像隱含的數(shù)字信息。</p><p&g

21、t;  傳感器數(shù)字表頭圖像的數(shù)據(jù)讀取與利用這個課題所運用的主要知識就是數(shù)字圖像處理這門學(xué)科。而數(shù)字圖像處理是指利用計算機(jī)對圖像進(jìn)行各種處理的一門技術(shù)。20世紀(jì)20年代,圖象處理首次得到應(yīng)用,60年代末,圖象處理技術(shù)不斷完善,逐漸成為一個新興的學(xué)科。利用數(shù)字圖象處理主要是為了修改圖形,改善圖象質(zhì)量,或是從圖像中提起有效信息,還有利用數(shù)字圖象處理可以對圖像進(jìn)行體積壓縮,便于傳輸和保存。</p><p>  數(shù)字圖像處

22、理在各個領(lǐng)域都有著非常重要的應(yīng)用,隨著數(shù)字時代的到來,視頻領(lǐng)域的數(shù)字化也必將到來,視頻圖像的處理技術(shù)也將會發(fā)生日新月異的變化。在多媒體技術(shù)的各個領(lǐng)域中,視頻處理技術(shù)占有非常重要的地位,被廣泛的應(yīng)用于智能交通、汽車電子、網(wǎng)絡(luò)多媒體通信、實時監(jiān)視系統(tǒng)、高清晰度數(shù)字電視等諸多方面。因此,現(xiàn)今對該技術(shù)領(lǐng)域的應(yīng)用研究已日趨活躍和繁榮。而這其中的圖像辨別更是有著重要的應(yīng)用。研究此課題,不僅可以明白 VC++在圖像處理中的應(yīng)用,而且還可以明確圖像辨別

23、的重要應(yīng)用意義。</p><p>  1.2 國內(nèi)外研究現(xiàn)狀分析</p><p>  數(shù)字圖像處理作為一門新興學(xué)科,它的發(fā)展非常迅速。數(shù)字圖像處理作為一門學(xué)科大約形成于20世紀(jì)60年代初期。早期的圖像處理的目的是改善圖像的質(zhì)量,它以人為對象,以改善人的視覺效果為目的。圖像處理中,輸入的是質(zhì)量低的圖像,輸出的是改善質(zhì)量后的圖像,常用的圖像處理方法有圖像增強、復(fù)原、編碼、壓縮等。首次獲得實際成

24、功應(yīng)用的是美國噴氣推進(jìn)實驗室(JPL)。他們對航天探測器徘徊者7號在1964年發(fā)回的幾千張月球照片使用了圖像處理技術(shù),由計算機(jī)成功地繪制出月球表面地圖,獲得了巨大的成功。隨后又對探測飛船發(fā)回的近十萬張照片進(jìn)行更為復(fù)雜的圖像處理,以致獲得了月球的地形圖、彩色圖及全景鑲嵌圖,獲得了非凡的成果,為人類登月創(chuàng)舉奠定了堅實的基礎(chǔ),也推動了數(shù)字圖像處理這門學(xué)科的誕生。在以后的宇航空間技術(shù),如對火星、土星等星球的探測研究中,數(shù)字圖像處理技術(shù)都發(fā)揮了巨

25、大的作用。數(shù)字圖像處理取得的另一個巨大成就是在醫(yī)學(xué)上獲得的成果。1972年英國EMI公司工程師Housfield發(fā)明了用于頭顱診斷的X射線計算機(jī)斷層攝影裝置,也就是我們通常所說的CT(Computer Tomograph)。CT的基本方法是根據(jù)人的頭部截</p><p>  本次畢業(yè)設(shè)計,我主要的研究方向是對車牌號的識別。國外的研究人員對于車牌識別的研究工作開展較早,研究方向主要是分析車牌圖像,提取車牌信息,確定

26、車牌號?,F(xiàn)如今,國外在車牌檢測、識別方面的研究已取得一些令人矚目的成績,開發(fā)出了很多技術(shù)成熟的車牌識別產(chǎn)品。例如英國IPI公司研究開發(fā)的RTVNPR系統(tǒng),它是一款便攜式的設(shè)備,可以應(yīng)用在道路收費站、交通檢測口等場所;新加坡Optasia公司自行研發(fā)的車牌識別系統(tǒng)IMPS,可以在各種天氣條件和光照環(huán)境下準(zhǔn)確定位識別,給出和車牌一致的處理結(jié)果。另外,日本、加拿大、德國、意大利等各發(fā)達(dá)國家都有適合于本國車牌的識別系統(tǒng)。</p>

27、<p>  我國對車牌識別技術(shù)的研究工作開始于20世紀(jì)90年代,當(dāng)前比較成熟的產(chǎn)品有:北京漢王公司采用DSP芯片作為識別算法的運行硬件平臺的“漢王眼”;深圳吉通電子有限公司的“車牌通";上海高德威智能交通系統(tǒng)有限公司的汽車牌照識別器;川大智勝軟件股份有限公司的zTZ000車牌自動識別系統(tǒng)等等。這些產(chǎn)品都達(dá)到了較好的識別效果。除此之外,上海交通大學(xué)計算機(jī)科學(xué)和工程系、西安交通大學(xué)的圖像處理和識別研究室、浙江大學(xué)的自動化

28、系、清華大學(xué)人工智能國家重點實驗室等也都在進(jìn)行類似的研究[2]。</p><p>  而對車牌識別的研究,應(yīng)用最為廣泛的技術(shù)是傳統(tǒng)的模式識別技術(shù)。20世紀(jì)90年代初期A.S.johnson等學(xué)者使用了數(shù)字圖像處理技術(shù)、計算機(jī)圖形視覺技術(shù)并結(jié)合模式識別基本理論,研發(fā)出了可以應(yīng)用到實際領(lǐng)域的車輛牌照識別系統(tǒng)。此系統(tǒng)大致分成①圖像分割;②特征提??;⑨模板構(gòu)造;④字符識別等四個部分。由于相異閾值所對應(yīng)的直方圖結(jié)果是不同的

29、,車牌區(qū)域圖像直方圖的閾值區(qū)間可以經(jīng)過大量的統(tǒng)計學(xué)實驗來確定,進(jìn)而依據(jù)特定閾值所代表的直方圖將車牌圖像進(jìn)行分割,最后通過預(yù)先編輯好的漢字、數(shù)字模板逐一進(jìn)行模式匹配,從而識別出車牌字符。20世紀(jì)末,R.A.Lotfo等學(xué)者采用了視覺分析的字符識別算法分析輸入到自動識別的的車牌圖像,其主要步驟如下:①車牌圖像進(jìn)行二值化并將車牌區(qū)域定位;②根據(jù)邊界跟蹤算法及相關(guān)技術(shù)手段獲得車牌字符的特征;③使用統(tǒng)計最相鄰分類器與字符模板庫中的字符進(jìn)行比較,推

30、斷出幾個準(zhǔn)車牌號碼結(jié)果并檢查這些準(zhǔn)車牌號碼,最終得出一個實際存在正確的車牌號碼。總而言之,20世紀(jì)末期車牌自動識別系統(tǒng)的字符識別正確率有所提高,但另一方面,由于算法和技術(shù)尚未完善的原因車牌自動識別系統(tǒng)的實時性較差,車牌字符識別的速</p><p>  1.3 研究內(nèi)容與具體安排</p><p>  數(shù)字圖像的提取與利用就是要將所需圖像采集并通過計算機(jī)應(yīng)用相應(yīng)的算法把圖像反映在電腦上。<

31、;/p><p>  本次設(shè)計我利用C語言在MFC模塊中編寫相應(yīng)程序,最終生成一個可執(zhí)行文件,根據(jù)攝像頭采取不同圖像,如:車牌號、液晶顯示屏,然后將不同的數(shù)字圖形在 PC 機(jī)上進(jìn)行辨別,實現(xiàn)圖形的分辨,最后將生成圖形保存。</p><p>  數(shù)字圖像信息的提取及利用實現(xiàn)的算法:圖像采集,圖像預(yù)處理,圖像分割,輪廓跟蹤,圖像辨別五個部分。而在設(shè)計過程中所研究的核心就是圖像辨別算法的實現(xiàn)。模式識別

32、是現(xiàn)今使用非常廣泛的圖像辨別方法,基于模式識別的相關(guān)算法也很多,而且每種算法都有各自特點,要根據(jù)不同的實際圖形的特點選擇恰當(dāng)?shù)乃惴ā1驹O(shè)計所采用的是基于圖形邊緣特征的角度判別得算法,此種算法是通過對圖形輪廓進(jìn)行跟蹤、提取邊緣的特征,判斷圖形角度的大小,來分辨不同圖像[4]。</p><p><b>  具體結(jié)構(gòu)安排如下:</b></p><p>  第一章:緒論,介紹

33、了課題研究目的及意義和國內(nèi)外研究現(xiàn)狀。</p><p>  第二章:數(shù)字圖像處理和開發(fā)工具VC++的介紹,不僅介紹了數(shù)字圖像處理的基本知識以及處理方法,也對基于計算機(jī)視覺圖像處理進(jìn)行了簡單分析,最后介紹了VC++與MFC功能模塊。</p><p>  第三章:數(shù)字圖像處理的實現(xiàn)過程及算法,詳細(xì)地介紹了整個設(shè)計的原理和思路,并闡述了相關(guān)的算法及程序。</p><p>

34、  第四章:實驗結(jié)果及結(jié)論,采集了清晰、蒙塵的車牌號以及液晶顯示器進(jìn)行實驗成功實現(xiàn)了設(shè)計的功能,得出了實驗的結(jié)論,并敘述了設(shè)計過程中遇到的問題及解決方案。</p><p>  第五章:總結(jié)。總結(jié)了整個設(shè)計的思路、過程及實現(xiàn)的功能以及通過本次設(shè)計的收獲和不足。</p><p>  第2章 數(shù)字圖像處理及開發(fā)工具VC++的介紹</p><p>  2.1 數(shù)字圖像處理&

35、lt;/p><p>  2.1.1 數(shù)字圖像處理的簡介</p><p>  數(shù)字圖像處理就是利用計算機(jī)對圖像信息進(jìn)行加工,以滿足人的視覺心理或者應(yīng)用需求的行為。實質(zhì)上它是一段能夠被計算機(jī)還原顯示和輸出為一幅圖像的數(shù)字碼。當(dāng)今是一個充滿信息的時代,圖像作為人類感知世界的視覺基礎(chǔ),是人類獲取信息、表達(dá)信息和傳遞信息的重要手段[5]。</p><p>  圖像處理技術(shù)的主要內(nèi)

36、容包括圖像壓縮,增強和復(fù)原,匹配、描述和識別3 個部分。常見的處理有圖像數(shù)字化、圖像編碼、圖像增強、圖像復(fù)原、圖像分割和圖像分析等。圖像處理一般指數(shù)字圖像處理,雖然某些處理也可以用光學(xué)方法或模擬技術(shù)實現(xiàn),但它們遠(yuǎn)不及數(shù)字圖像處理那樣靈活和方便,因而數(shù)字圖像處理成為圖像處理的主要方面。以圖片分析和理解為目的的分割、描述和識別將用于各種自動化的系統(tǒng),如字符和圖形識別、用機(jī)器人進(jìn)行產(chǎn)品的裝配和檢驗、自動軍事目標(biāo)識別和跟蹤、指紋識別、X 光照片

37、和血樣的自動處理等。在這類應(yīng)用中,往往需綜合應(yīng)用模式識別和計算機(jī)視覺等技術(shù),圖像處理更多的是作為前置處理而出現(xiàn)的[6]。</p><p>  隨著計算機(jī)的高速發(fā)展,處理器的處理速度的提高和存儲器存儲容量的增大,圖像處理系統(tǒng)的發(fā)展十分迅速,圖像處理技術(shù)也得到了空前的發(fā)展和應(yīng)用。目前,圖像處理技術(shù)已經(jīng)廣泛應(yīng)用于工業(yè)、農(nóng)業(yè)、醫(yī)學(xué)、交通、軍事等各個領(lǐng)域。因此,可以說圖像處理技術(shù)正逐漸成為其他科學(xué)技術(shù)領(lǐng)域中不可缺少的一項重

38、要工具,它已經(jīng)成為了信息技術(shù)相關(guān)領(lǐng)域的核心。</p><p>  圖像處理在各個方面都有著很重要的應(yīng)用,而圖像識別技術(shù)在基于圖像處理的基礎(chǔ)上可以應(yīng)用于農(nóng)業(yè)上,如用計算機(jī)視覺的方法進(jìn)行果形識別;基于數(shù)學(xué)形態(tài)學(xué)和神經(jīng)網(wǎng)絡(luò)的方法對番茄病害果進(jìn)行識別;采用機(jī)器視覺的方法辨別黃花梨果形識別;當(dāng)然還可以加 以改進(jìn)應(yīng)用于視頻監(jiān)控的物體辨別等等。</p><p>  2.1.2 圖像格式介紹</p&

39、gt;<p>  數(shù)字化圖像數(shù)據(jù)有兩種存儲方式:位圖存儲和矢量存儲。我們平常是以圖像分辨率和顏色數(shù)來描述數(shù)字圖象的。</p><p><b>  1.位圖方式</b></p><p>  位圖方式是將圖像的每一個象素點轉(zhuǎn)換為一個數(shù)據(jù),比如:8個象素點的數(shù)據(jù)就占據(jù)一個字節(jié)(一個字節(jié)就是8個二進(jìn)制數(shù),1個二進(jìn)制數(shù)存放象素點)。位圖方式能夠制作出色彩和色調(diào)變化

40、豐富的圖像,可以逼真地表現(xiàn)自然界的景象,同時也可以很容易地在不同軟件之間交換文件,這就是位圖圖像的優(yōu)點;而其缺點則是它無法制作真正的3D圖像,并且圖像縮放和旋轉(zhuǎn)時會產(chǎn)生失真的現(xiàn)象,同時文件較大,對內(nèi)存和硬盤空間容量的需求也較高。</p><p><b>  2.矢量圖像</b></p><p>  矢量圖像存儲的是圖像信息的輪廓部分,而不是圖像的每一個象素點。該存儲方

41、式的缺點是經(jīng)常耗費大量的時間做一些復(fù)雜的分析演算工作,圖像的顯示速度較慢;但圖像縮放不會失真;圖像的存儲空間也要小得多。所以,矢量圖比較適合存儲各種圖表和工程設(shè)計圖[7]。</p><p>  2.1.3 數(shù)字圖像處理中的基本圖像類型</p><p>  在計算機(jī)中,按照顏色和灰度的多少可以將圖像分為:二值圖像、灰度圖像、索引圖像和真彩色 RGB 圖像四種基本類型。目前,大多數(shù)圖像處理軟件

42、都支持這四種類型的圖像。</p><p><b>  1.二值圖像</b></p><p>  一幅二值圖像的二維矩陣僅由 0、1 兩個值構(gòu)成,“0”代表黑色,“1”代白色。由于每一像素(矩陣中每一元素)取值僅有 0、1 兩種可能,所以計算機(jī)中二值圖像的數(shù)據(jù)類型通常為 1 個二進(jìn)制位。二值圖像通常用于文字、線條圖的掃描識別(OCR)和掩膜圖像的存儲。</p>

43、;<p><b>  2.灰度圖像</b></p><p>  灰度圖像矩陣元素的取值范圍通常為[0,255]。因此其數(shù)據(jù)類型一般為 8 位無符號整數(shù)的,這就是人們經(jīng)常提到的 256 灰度圖像?!?”表示純黑色,“255”表示純白色,中間的數(shù)字從小到大表示由黑到白的過渡色。二值圖像可以看成是灰度圖像的一個特例。</p><p><b>  3.

44、索引圖像</b></p><p>  索引圖像的文件結(jié)構(gòu)比較復(fù)雜,除了存放圖像的二維矩陣外,還包括一個稱之為顏色索引矩陣MAP的二維數(shù)組。MAP的大小由存放圖像的矩陣元素值域決定,它的每一行的三個元素分別指定該行對應(yīng)顏色的紅、綠、藍(lán)單色值。索引圖像一般用于存放色彩要求比較簡單的圖像。</p><p>  4.真彩色 RGB 圖像</p><p>  RG

45、B 圖像分別用紅(R)、綠(G)、藍(lán)(B)三原色的組合來表示每個像素的顏色。RGB 圖像每一個像素的顏色值(由RGB三原色表示)直接存放在圖像矩陣中。RGB圖像的數(shù)據(jù)類型一般為8位無符號整形,通常用于表示和存放真彩色圖像,當(dāng)然也可以存放灰度圖像[8]。</p><p>  2.2 基于計算機(jī)視覺處理圖像的簡單介紹</p><p>  近年來,圖像技術(shù)受到人們廣泛的關(guān)注。在人類接收的信息中有

46、80 %來自視覺即圖像(Image)信息,這是人類最有效和最重要的信息獲取、交流方式。隨著計算機(jī)的普及,人們越來越多地利用計算機(jī)幫助人類獲取與處理視覺(圖像) 信息。圖像技術(shù)就是對視覺圖像獲取與加工處理技術(shù)的總稱。根據(jù)抽象程度和處理方法的不同,圖像技術(shù)可分為三個層次:圖像處理、圖像分析和圖像理解。這三個層次的有機(jī)結(jié)合也稱為圖像工程[9]。圖像處理是較低層的操作,主要在圖像象素級上進(jìn)行處理。比較狹義的圖像處理主要包括對圖像分割以改善視覺效

47、果,或?qū)D像壓縮編碼以減少傳輸時間或存儲容量。圖像分析則是進(jìn)入中層的操作,分割和特征提取是把原來以象素描述的圖像轉(zhuǎn)變成簡潔的非圖形形式的符號描述。即圖像分析是一個圖像進(jìn)而數(shù)據(jù)出的處理,數(shù)據(jù)可以是對某一特征測量所得的結(jié)果,或是基于測量的符號表示。圖像理解也經(jīng)常被稱為計算機(jī)視覺,主要是高層操作。圖像理解進(jìn)一步研究圖像中的目標(biāo)和它們之間的聯(lián)系,其處理過程和方法與人類的思維推理有不少類似之處[10]。</p><p> 

48、 2.2.1視覺技術(shù)的研究</p><p>  人類很多研究都是以延伸人類能力為目的的,早期的工作是在體力上延伸,計算機(jī)發(fā)明以來,就拓展到對人類腦力和感知能力的延伸上。對人類視覺感知能力的計算機(jī)模擬導(dǎo)致了計算機(jī)視覺的產(chǎn)生。計算機(jī)視覺也經(jīng)常被稱為圖像理解,是指研究完成一項任務(wù)所需的視覺信息及如何從圖像中獲取這些信息的研究領(lǐng)域。其基本目的有三個:</p><p>  (1) 根據(jù)一幅或多幅二維

49、投影圖像計算出觀察點到目標(biāo)物體的距離;</p><p>  (2) 根據(jù)一幅或多幅二維投影圖像計算出觀察點到目標(biāo)物體的運動參數(shù);</p><p>  (3) 根據(jù)一幅或多幅二維投影圖像計算出觀察點到目標(biāo)物體的表面物理特性。</p><p>  要達(dá)到的最終目的是實現(xiàn)對于三維景物世界的理解,即實現(xiàn)人的視覺系統(tǒng)的某些功能。也就是利用二維投影圖像來重構(gòu)三維物體的可視部分。

50、</p><p>  2.2.2 計算機(jī)視覺研究的對象與方法</p><p>  1.以模型世界為主要對象的視覺基本方法研究</p><p>  這個階段以Roberts的開創(chuàng)性工作為標(biāo)志。在Roberts的工作中引入了三維物體與二維成像的關(guān)系,采用了一些簡單的邊緣特征提取方法并引入了組合線段的方法。這些早期的工作對視覺的發(fā)展起了促進(jìn)作用,但對于稍微復(fù)雜的景物便難于

51、奏效。因為他對三維關(guān)系的分析僅僅是靠簡單的邊緣線段的約束關(guān)系,并沒有充分考慮人類或其他動物視覺系統(tǒng)感知三維空間關(guān)系的方式[11]。</p><p>  2.以計算理論為核心的視覺模型研究</p><p>  20世紀(jì)70年代開始,對計算機(jī)視覺的研究進(jìn)入更為理性化的階段,主要集中于各種本征特性的恢復(fù),包括三維形狀、運動、光源等的恢復(fù)。主要出發(fā)點是從生理學(xué)、光學(xué)和射影幾何的方法出發(fā),研究成像及

52、其逆問題。在這一階段中,以Marr為代表的一些研究者提出了以表示為核心、以算法為中間轉(zhuǎn)換過程的一般性視覺處理模型。在其理論中強調(diào)表示的重要性以及從不同層次上去研究信息處理問題,在計算理論和算法實現(xiàn)上又特別強調(diào)計算理論的重要性。在三維信息的感知方面,根據(jù)人類感知深度的不同提出了一系列Shape from X 的方法。這一階段有代表性的工作包括:</p><p>  (1) 對視覺知覺現(xiàn)象中側(cè)抑制現(xiàn)象的模擬。主要是通

53、過采用不同尺度的LOG算子實現(xiàn)對不同尺度邊緣信息的感知;</p><p>  (2) 對雙眼深度線索的分析導(dǎo)致對立體視覺的研究;</p><p>  (3) 對單眼深度線索的分析導(dǎo)致了Shape from X技術(shù)的出現(xiàn)(這里X 包括陰影、紋理、遮擋、聚焦、線條透視等) ;</p><p>  (4) 對運動物體成像過程的研究導(dǎo)致光流計算以及從運動恢復(fù)結(jié)構(gòu)等技術(shù)的出現(xiàn)

54、。</p><p>  3.以應(yīng)用為目標(biāo)的計算機(jī)視覺方法</p><p>  進(jìn)入20世紀(jì)90年代之后,隨著關(guān)于人工智能研究的反思,在計算機(jī)視覺的研究方面也開始考慮過去的方法是否正確,同時研究的方向開始從單純的理論框架研究轉(zhuǎn)入結(jié)合軀干運動、結(jié)合應(yīng)用的研究。在以往的研究中,生物視覺的一些重要特點沒有得到足夠的重視,如主動性、視覺系統(tǒng)中的高分辨率中央凹陷與外圍視覺的結(jié)合等。因此在80 年代末、

55、90 年代初先后提出了主動視覺、定性視覺等新方法、新思路。利用主動視覺方法使得一些本來復(fù)雜的計算得到簡化,一些病態(tài)問題可以轉(zhuǎn)化為良性態(tài)問題,從而得到圓滿解決[12]。</p><p>  2.2.3 計算機(jī)視覺的應(yīng)用領(lǐng)域</p><p>  計算機(jī)視覺的應(yīng)用領(lǐng)域主要包括對照片、視頻資料如航空照片、衛(wèi)星照片、視頻片段等的解釋、精確制導(dǎo)、移動機(jī)器人視覺導(dǎo)航、醫(yī)學(xué)輔助診斷、工業(yè)機(jī)器人的手眼系統(tǒng)、

56、地圖繪制、物體三維形狀分析與識別及智能人機(jī)接口等。早期進(jìn)行數(shù)字圖像處理的目的之一就是要通過采用數(shù)字技術(shù)提高照片的質(zhì)量,輔助進(jìn)行航空照片和衛(wèi)星照片的讀取判別與分類。由于需要判讀的照片數(shù)量很多,于是希望有自動的視覺系統(tǒng)進(jìn)行判讀解釋,在這樣的背景下,產(chǎn)生了許多航空照片和衛(wèi)星照片判讀系統(tǒng)與方法。自動判讀的進(jìn)一步應(yīng)用就是直接確定目標(biāo)的性質(zhì),進(jìn)行實時的自動分類,并與制導(dǎo)系統(tǒng)相結(jié)合。目前常用的制導(dǎo)方式包括激光制導(dǎo)、電視制導(dǎo)和圖像制導(dǎo),在導(dǎo)彈系統(tǒng)中常常

57、將慣性制導(dǎo)與圖像制導(dǎo)結(jié)合,利用圖像進(jìn)行精確的末制導(dǎo)[13]。</p><p>  工業(yè)機(jī)器人的手眼系統(tǒng)是計算機(jī)視覺應(yīng)用最為成功的領(lǐng)域之一,由于工業(yè)現(xiàn)場的諸多因素,如光照條件、成像方向均是可控的,因此使得問題大為簡化,有利于構(gòu)成實際的系統(tǒng)。與工業(yè)機(jī)器人不同,對于移動機(jī)器人而言,由于它具有行為能力,于是就必須解決行為規(guī)劃問題,即是對環(huán)境的了解。隨著移動式機(jī)器人的發(fā)展,越來越多地要求提供視覺能力,包括道路跟蹤、回避障礙

58、、特定目標(biāo)識別等。目前移動機(jī)器人視覺系統(tǒng)研究仍處于實驗階段,大多采用遙控和遠(yuǎn)視方法。</p><p>  在醫(yī)學(xué)上采用的圖像處理技術(shù)大致包括壓縮、存儲、傳輸和自動/ 輔助分類判讀,此外還可用于醫(yī)生的輔助訓(xùn)練手段。與計算機(jī)視覺相關(guān)的工作包括分類、判讀和快速三維結(jié)構(gòu)的重建等方面。長期以來,地圖繪制是一件耗費人力、物力和時間的工作。以往的做法是人工測量,現(xiàn)在更多的是利用航測加上立體視覺中恢復(fù)三維形狀的方法繪制地圖,大大

59、提高了地圖繪制的效率。同時,通用物體三維形狀分析與識別一直是計算機(jī)視覺的重要研究目標(biāo),并在景物的特征提取、表示、知識的存儲、檢索以及匹配識別等方面都取得了一定的進(jìn)展,構(gòu)成了一些用于三維景物分析的系統(tǒng)。</p><p>  近年來,基于生物特征的鑒別技術(shù)得到了廣泛重視,主要集中在對人臉、虹膜、指紋、聲音等特征上,這其中大多都與視覺信息有關(guān)。與生物特征識別密切相關(guān)的另一個重要應(yīng)用是用于構(gòu)成智能人機(jī)接口?,F(xiàn)在計算機(jī)與人

60、的交流還是機(jī)械式的,計算機(jī)無法識別用戶的真實身份,除鍵盤、鼠標(biāo)外,其他輸入手段還不成熟。利用計算機(jī)視覺技術(shù)可以使計算機(jī)檢測到用戶是否存在、鑒別用戶身份、識別用戶的體勢。此外,這種人機(jī)交互方式還可推廣到一切需要人機(jī)交互的場合,如入口安全控制、過境人員的驗放等。在計算機(jī)視覺的研究過程中,應(yīng)考慮將功能模擬與認(rèn)知模擬相結(jié)合。人類延伸其他能力的過程中,功能模擬起到了主要作用,但視覺是涉及心理和生理兩方面的過程,因此必須在功能模擬的同時重視認(rèn)知模擬

61、。計算理論的進(jìn)步與感知手段的改進(jìn)有助于計算機(jī)視覺的研究。在計算機(jī)視覺中計算理論占有十分重要的地位,計算理論的進(jìn)步,新的計算模型的提出可以解決以往一些困難的問題;另一方面,感知手段的進(jìn)步也可以起到同樣的作用。采用主動視覺可從另一個側(cè)面去處理面對的視覺問題。要實現(xiàn)完整的視覺系統(tǒng),視覺知識的獲取、管理和利用是必不可少的。一個相對完備的視覺系統(tǒng)同時也是一個知識管理系統(tǒng),在</p><p>  2.3數(shù)字圖像處理方法介紹&

62、lt;/p><p>  2.3.1 圖像預(yù)處理</p><p>  在圖像分析中,對輸入圖像進(jìn)行特征抽取、分割和匹配前所進(jìn)行的處理。圖像預(yù)處理的主要目的是消除圖像中無關(guān)的信息,恢復(fù)有用的真實信息,增強有關(guān)信息的可檢測性和最大限度地簡化數(shù)據(jù),從而改進(jìn)特征抽取、圖像分割、匹配和識別的可靠性。預(yù)處理過程一般有數(shù)字化、幾何變換、歸一化、平滑、復(fù)原和增強等步驟。</p><p>

63、  特別是對于車牌號的識別,圖像預(yù)處理顯得更加重要。對于一些存在污跡或磨損褪色的車牌號,必須經(jīng)過圖像增強、圖像復(fù)原等預(yù)處理手段才能進(jìn)行準(zhǔn)確的識別。</p><p><b>  1. 數(shù)字化</b></p><p>  一幅原始照片的灰度值是空間變量(位置的連續(xù)值)的連續(xù)函數(shù)。在M×N點陣上對照片灰度采樣并加以量化(歸為2b個灰度等級之一),可以得到計算機(jī)能夠

64、處理的數(shù)字圖像。為了使數(shù)字圖像能重建原來的圖像,對M、N和b值的大小就有一定的要求。在接收裝置的空間和灰度分辨能力范圍內(nèi),M、N和b的數(shù)值越大,重建圖像的質(zhì)量就越好。當(dāng)取樣周期等于或小于原始圖像中最小細(xì)節(jié)周期的一半時,重建圖像的頻譜等于原始圖像的頻譜,因此重建圖像與原始圖像可以完全相同。由于M、N和b三者的乘積決定一幅圖像在計算機(jī)中的存儲量,因此在存儲量一定的條件下需要根據(jù)圖像的不同性質(zhì)選擇合適的M、N和b值,以獲取最好的處理效果。&l

65、t;/p><p><b>  2.幾何變換</b></p><p>  用于改正圖像采集系統(tǒng)的系統(tǒng)誤差和儀器位置的隨機(jī)誤差所進(jìn)行的變換。對于衛(wèi)星圖像的系統(tǒng)誤差,如地球自轉(zhuǎn)、掃描鏡速度和地圖投影等因素所造成的畸變,可以用模型表示,并通過幾何變換來消除。隨機(jī)誤差如飛行器姿態(tài)和高度變化引起的誤差,難以用模型表示出來,所以一般是在系統(tǒng)誤差被糾正后,通過把被觀測的圖和已知正確幾何位

66、置的圖相比較,用圖中一定數(shù)量的地面控制點解雙變量多項式函數(shù)組而達(dá)到變換的目的。</p><p><b>  3.歸一化</b></p><p>  使圖像的某些特征在給定變換下具有不變性質(zhì)的一種圖像標(biāo)準(zhǔn)形式。圖像的某些性質(zhì),例如物體的面積和周長,本來對于坐標(biāo)旋轉(zhuǎn)來說就具有不變的性質(zhì)。在一般情況下,某些因素或變換對圖像一些性質(zhì)的影響可通過歸一化處理得到消除或減弱,從而可

67、以被選作測量圖像的依據(jù)。例如對于光照不可控的遙感圖片,灰度直方圖的歸一化對于圖像分析是十分必要的。灰度歸一化、幾何歸一化和變換歸一化是獲取圖像不變性質(zhì)的三種歸一化方法。</p><p><b>  4.平滑</b></p><p>  消除圖像中隨機(jī)噪聲的技術(shù)。對平滑技術(shù)的基本要求是在消去噪聲的同時不使圖像輪廓或線條變得模糊不清。常用的平滑方法有中值法、局部求平均法和

68、 k 近鄰平均法。局部區(qū)域大小可以是固定的,也可以是逐點隨灰度值大小變化的。此外,有時應(yīng)用空間頻率域帶通濾波方法。</p><p><b>  5.復(fù)原</b></p><p>  校正各種原因所造成的圖像退化,使重建或估計得到的圖像盡可能逼近于理想無退化的像場。在實際應(yīng)用中常常發(fā)生圖像退化現(xiàn)象。例如大氣流的擾動,光學(xué)系統(tǒng)的像差,相機(jī)和物體的相對運動都會使遙感圖像發(fā)生

69、退化?;镜膹?fù)原技術(shù)是把獲取的退化圖像 g(x,y)看成是退化函數(shù) h(x,y)和理想圖像 f(x,y)的卷積。它們的傅里葉變換存在關(guān)系</p><p><b>  (2.1)</b></p><p>  根據(jù)退化機(jī)理確定退化函數(shù)后,就可從此關(guān)系式求出 F(u,v),再用傅里葉反變換求出 f(x,y)。通常把 稱為反向濾波器。實際應(yīng)用時,由于 H(u,v)隨離開 uv

70、 平面原點的距離增加而迅速下降,為了避免高頻范圍內(nèi)噪聲的強化,當(dāng) u2+v2 大于某一界限值 W 時,使 M(u,v)等于 1。W0 的選擇應(yīng)使 H(u,v)在 u2+v2≤W 范圍內(nèi)不會出現(xiàn)零點。圖像復(fù)原的代數(shù)方法是以最小二乘法最佳準(zhǔn)則為基礎(chǔ)。尋求一估值弮,使優(yōu)度準(zhǔn)則函數(shù)值最小。這種方法比較簡單,可推導(dǎo)出最小二乘法維納濾波器。當(dāng)不存在噪聲時,維納濾波器成為理想的反向濾波器。</p><p><b> 

71、 6.增強</b></p><p>  對圖像中的信息有選擇地加強和抑制,以改善圖像的視覺效果,或?qū)D像轉(zhuǎn)變?yōu)楦m合于機(jī)器處理的形式,以便于數(shù)據(jù)抽取或識別。例如一個圖像增強系統(tǒng)可以通過高通濾波器來突出圖像的輪廓線,從而使機(jī)器能夠測量輪廓線的形狀和周長。圖像增強技術(shù)有多種方法,反差展寬、對數(shù)變換、密度分層和直方圖均衡等都可用于改變圖像灰調(diào)和突出細(xì)節(jié)。</p><p>  2.3.

72、2 圖像分割介紹</p><p>  圖像分割就是指把圖像分成各具特性的區(qū)域并提取出感興趣目標(biāo)的技術(shù)和過程,此處特性可以是像素的灰度、顏色、紋理等預(yù)先定義的目標(biāo)可以對應(yīng)單個區(qū)域,也可以對應(yīng)多個區(qū)域。</p><p>  圖像分割是由圖像處理到圖像分析的關(guān)鍵步驟,在圖像工程中占據(jù)重要的位置。一方面,它是目標(biāo)表達(dá)的基礎(chǔ),對特征測量有重要的影響;另一方面,因為圖像分割及其基于分割的目標(biāo)表達(dá)、特征

73、抽取和參數(shù)測量的將原始圖像轉(zhuǎn)化為更抽象更緊湊的形式,使得更高層的圖像分析和理解成為可能。</p><p>  圖像分割是圖像理解的基礎(chǔ),而在理論上圖像分割又依賴圖像理解,彼此是緊密關(guān)聯(lián)的。圖像分割在一般意義下是十分困難的問題,目前的圖像分割一般作為圖像的前期處理階段,是針對分割對象的技術(shù),是與問題相關(guān)的,如最常用到的利用閾值化處理進(jìn)行的圖像分割。</p><p>  圖像分割有三種不同的途

74、徑,其一是將各象素劃歸到相應(yīng)物體或區(qū)域的象素聚類方法即區(qū)域法,其二是通過直接確定區(qū)域間的邊界來實現(xiàn)分割的邊界方法,其三是首先檢測邊緣象素再將邊緣象素連接起來構(gòu)成邊界形成分割。</p><p><b>  1.閾值與圖像分割</b></p><p>  閾值是在分割時作為區(qū)分物體與背景象素的門限,大于或等于閾值的象素屬于物體,而其它屬于背景。這種方法對于在物體與背景之間

75、存在明顯差別(對比)的景物分割十分有效。實際上,在任何實際應(yīng)用的圖像處理系統(tǒng)中,都要用到閾值化技術(shù)。為了有效地分割物體與背景,人們發(fā)展了各種各樣的閾值處理技術(shù),包括全局閾值、自適應(yīng)閾值、最佳閾值等等。</p><p><b>  2.梯度與圖像分割</b></p><p>  當(dāng)物體與背景有明顯對比度時,物體的邊界處于圖像梯度最高的點上,通過跟蹤圖像中具有最高梯度的點

76、的方式獲得物體的邊界,可以實現(xiàn)圖像分割。這種方法容易受到噪聲的影響而偏離物體邊界,通常需要在跟蹤前對梯度圖像進(jìn)行平滑等處理,再采用邊界搜索跟蹤算法來實現(xiàn)。</p><p>  3.邊界提取與輪廓跟蹤</p><p>  為了獲得圖像的邊緣人們提出了多種邊緣檢測方法,如Sobel, Canny edge, LoG。在邊緣圖像的基礎(chǔ)上,需要通過平滑、形態(tài)學(xué)等處理去除噪聲點、毛刺、空洞等不需要的

77、部分,再通過細(xì)化、邊緣連接和跟蹤等方法獲得物體的輪廓邊界。</p><p>  4. Hough 變換</p><p>  對于圖像中某些符合參數(shù)模型的主導(dǎo)特征,如直線、圓、橢圓等,可以通過對其參數(shù)進(jìn)行聚類的方法,抽取相應(yīng)的特征。</p><p><b>  5.區(qū)域增長</b></p><p>  區(qū)域增長方法是根據(jù)同

78、一物體區(qū)域內(nèi)象素的相似性質(zhì)來聚集象素點的方法,從初始區(qū)域(如小鄰域或甚至于每個象素)開始,將相鄰的具有同樣性質(zhì)的象素或其它區(qū)域歸并到目前的區(qū)域中從而逐步增長區(qū)域,直至沒有可以歸并的點或其它小區(qū)域為止。區(qū)域內(nèi)象素的相似性度量可以包括平均灰度值、紋理、顏色等信息。區(qū)域增長方法是一種比較普遍的方法,在沒有先驗知識可以利用時,可以取得最佳的性能,可以用來分割比較復(fù)雜的圖像,如自然景物。但是,區(qū)域增長方法是一種迭代的方法,空間和時間開銷都比較大。

79、</p><p>  2.3.3 模板匹配</p><p>  模板匹配是最早出現(xiàn),也是最簡單的模式識別方法之一,匹配是模式識別的一種分類操作,主要是判斷同一類的兩個實體(如點、曲線、形狀等)之間的相似性。要進(jìn)行模板匹配,首先需要存儲一些已知模板,然后考慮所有可能的變化,將待識別模板與已知模板相比較,從而得出二者之間的相似性度量。為保證模板的通用性,已知模板一般是通過訓(xùn)練得到的。</

80、p><p>  依照此系統(tǒng)的要求所實現(xiàn)模板匹配的算法如下:先要確定模板的形式,如3×3或4×4的模板如圖(2-1)所示。然后將目標(biāo)圖形放到確定的模板中去,通過以圖形包括的模板中點的不同,找出圖形之間的差異,從而實現(xiàn)分辨圖形的目的,典型圖形(三角形,矩形,圓形)模板匹配示意圖,見圖(2-2)。通過圖(2-2)可以看出模板越大、點數(shù)月多,判別的信息就越多,準(zhǔn)確性越高。</p><p

81、>  圖2-1 3×3,4×4的模板</p><p>  圖2-2 典型圖形(三角形,矩形,圓形)模板匹配示意圖</p><p>  具體算法描述為:先找圖形的中心點坐標(biāo),方法有:</p><p> ?。?)找到圖像的各頂點,使其坐標(biāo)做差,算出頂點到圖形中心的距離,從而得到圖形的中心坐標(biāo);</p><p> ?。?)

82、通過對分割后的圖像的所用坐標(biāo)求和,在用圖形總共像素數(shù)取平均。</p><p>  然后根據(jù)圖形的中心點與模板其它點之間的距離,得到這些點在圖像上的實際坐標(biāo),然后判斷這些點是否被圖形包含,從而判斷是否實現(xiàn)模板匹配。對于一個圖形的辨別還要考慮到其圖形的大小的問題,模板匹配算法可以簡單的實現(xiàn)對于大小變化圖形的識別。方法是:建立圖形中心點到某一端點的距離同模板相對應(yīng)的點與中心點間距離的比例系數(shù)關(guān)系,從而實現(xiàn)訓(xùn)練模板使之能

83、適應(yīng)圖形大小的變化。</p><p>  2.3.4 輪廓跟蹤</p><p><b>  1.輪廓跟蹤介紹</b></p><p>  輪廓跟蹤是現(xiàn)今一種發(fā)展成熟的邊緣提取算法,它是根據(jù)提取圖像中有序邊緣點的邊緣序列實現(xiàn)輪廓特征的提取。所謂輪廓(contour)就是把邊緣連接起來。輪廓可以是斷開的,也可以是封閉的。封閉輪廓對應(yīng)于區(qū)域的邊界,而

84、區(qū)域內(nèi)的像素可以通過填充算法來填滿。斷開的輪廓可能是區(qū)域邊界的一部分,也可能是圖像線條特征,如手寫體筆畫、圖畫中的線條等。區(qū)域之間的對比度太弱或邊緣檢測閾值設(shè)置太高都有可能產(chǎn)生間斷的輪廓。而根據(jù)輪廓跟蹤算法描述,此系統(tǒng)處理的是封閉的輪廓。</p><p><b>  2.輪廓編碼與存儲</b></p><p>  對于輪廓的表示此系統(tǒng)采用鏈碼方式。鏈碼一種邊界的編碼表

85、示法,它規(guī)定了邊緣表中每一個邊緣點所對應(yīng)的輪廓方向,其中的輪廓方向被量化為 4-鄰接鏈碼或 8-鄰接鏈碼中的一個,如圖(2-3)所示。圖(2-3)(b)是 8-鄰接鏈碼的表示法,8-鄰接鏈碼從邊緣表中第一個邊緣開始,沿著輪廓按逆時針方向行走,行走方向用八鏈碼中的一個表示。本次統(tǒng)采用的就是這種 8-鄰接鏈碼的表示法。鏈碼是一種非常重要的曲線描述方法,主要是因為它節(jié)省存儲空間。</p><p> ?。╝)

86、 (b)</p><p>  圖 2-3 連接邊緣點方向的鏈碼示意圖,(a)4-鄰接鏈碼,(b) 8-鄰接鏈碼</p><p>  2.3.5 輪廓跟蹤與模板匹配比較</p><p>  對比模板匹配與基于輪廓跟蹤的角度判別算法,本系統(tǒng)采用的是基于輪廓跟蹤的角度判別算法,原因輪廓跟蹤對于圖形的旋轉(zhuǎn)很敏感。解決此問題的方法有:</

87、p><p> ?。?)使模板也旋轉(zhuǎn)同圖形旋轉(zhuǎn)一樣的角度,但此法難以實現(xiàn),因為在判別圖像前根本不知道圖像是否有旋轉(zhuǎn),若提供算法對任何圖形都采用統(tǒng)一的模板旋轉(zhuǎn)算法是非常難以實現(xiàn)的。如考慮圖形定點分布情況,則圓形和矩形就很難分辨,因為對于圖像查找來說,理論上都會找出四個定點,就還得根據(jù)圖像邊的走向進(jìn)一步判斷。</p><p> ?。?)加大模板的大小,增加更多的模板信息來區(qū)分圖形,此種方法雖然實現(xiàn)上

88、不存在什么問題,但是此法會使判斷的算法復(fù)雜,加大處理負(fù)擔(dān)。</p><p>  相比下基于輪廓跟蹤的角度判別算法,它只跟圖形的輪廓信息判斷,對圖像的大小與旋轉(zhuǎn)都不敏感。雖然基于輪廓跟蹤的角度判別算法對于圖像輪廓噪聲敏感,但對于此系統(tǒng)來說采集的圖像比較標(biāo)準(zhǔn),且采集的精確度在允許范圍內(nèi),對于噪聲的影響不是非常嚴(yán)重,可以用算法減少噪聲的干擾。</p><p>  2.4VC++與MFC功能模塊的

89、介紹</p><p>  2.4.1VC++平臺簡介</p><p>  VC++是Microsoft公司推出的開發(fā)Win32應(yīng)用程序(Windows95/98/2000/XP/NT)的面向?qū)ο蟮目梢暬晒ぞ?。隨著VC++所提供的Microsoft基礎(chǔ)類庫(Microsoft Foundation Class Library,簡寫為MFC),對Windows95/NT所用的Win32應(yīng)

90、用程序接口(Win 32 Application Programming Interface-API)進(jìn)行了徹底的封裝,從而可以使用完全的面向?qū)ο蟮姆椒▉磉M(jìn)行Win 32應(yīng)用程序的開發(fā),這樣大大縮短了應(yīng)用程序開發(fā)周期,降低了開發(fā)成本,也將程序員從大量的復(fù)雜勞動中解放出來。 </p><p>  VC++ Developer Studio包含有編寫程序代碼的文本編輯器、設(shè)計用戶界面(菜單、對話框、圖標(biāo)等)

91、的資源編輯器,建立項目配置的項目管理器、檢查程序錯誤的集成調(diào)試器等工具,同時它還提供了功能強大的應(yīng)用程序向?qū)Чぞ逜ppWizard和類向?qū)Чぞ逤lassWizard。AppWizard用于生成各種不同類型的具有Windows界面風(fēng)格的應(yīng)用程序的基本框架,在生成應(yīng)用程序框架后,使用ClassWizard便可輕松完成創(chuàng)建新類、定義消息處理函數(shù)、重載虛擬函數(shù)等操作。 </p><p>  VC++的資源編輯器

92、能以所見所得的形式直接編輯應(yīng)用程序用戶界面,為所有資源分配ID標(biāo)識號。ClassWizard能把對話框模板與自動生成的類定義或與已有的類代碼連接起來,為菜單項、控件等資源生成空的處理函數(shù)模板,創(chuàng)建自消息映射的編程工作便簡化為用資源編輯器直觀的設(shè)計界面,完善對話框類代碼。在空的處理模板出填寫響應(yīng)用戶操作的代碼,是一種完善的可視化編程方法。</p><p>  2.4.2 MFC模塊的功能介紹</p>

93、<p>  MFC(Microsoft Foundation Classes),是微軟公司提供的一個類庫(class libraries),以C++類的形式封裝了Windows的API,并且包含一個應(yīng)用程序框架,以減少應(yīng)用程序開發(fā)人員的工作量。其中包含的類包含大量Windows句柄封裝類和很多Windows的內(nèi)建控件和組件的封裝類。但是并不需要將所有的類都記住,只需要了解以下比較重要的類:</p><p&g

94、t;  CWnd:窗口,它是大多數(shù)“看得見的東西”的父類(Windows里幾乎所有看得見的東西都是一個窗口,大窗口里有許多小窗口),比如視圖CView、框架窗口CFrameWnd、工具條CToolBar(現(xiàn)為CMFCToolBar)、對話框CDialog、按鈕CButton等等;一個例外是菜單(CMenu)不是從窗口派生的。該類很大,一開始也不必學(xué),知道就行了。</p><p>  CDocument文檔,負(fù)責(zé)內(nèi)

95、存數(shù)據(jù)與磁盤的交互。最重要的是OnOpenDocument(讀入),OnSaveDocument(寫盤),Serialize(序列化讀寫)。</p><p>  CView視圖,負(fù)責(zé)內(nèi)存數(shù)據(jù)與用戶的交互。包括數(shù)據(jù)的顯示、用戶操作的響應(yīng)(如菜單的選取、鼠標(biāo)的響應(yīng)等等)。最重要的是OnDraw(重畫窗口),通常用CWnd::Invalidate()來啟動它。另外,它通過消息映射表處理菜單、工具條、快捷鍵和其他用戶消息

96、。你自己的許多功能都要加在里面,你打交道最多的就是它。</p><p>  CDC設(shè)備文本。無論是顯示器還是打印機(jī),都是畫圖給用戶看。這圖就抽象為CDC。CDC與其他GDI(圖形設(shè)備接口)一起,完成文字和圖形、圖像的顯示工作。把CDC想象成一張紙,每個窗口都有一個CDC相聯(lián)系,負(fù)責(zé)畫窗口。CDC有個常用子類CClientDC(窗口客戶區(qū)),畫圖通常通過CClientDC完成。</p><p&g

97、t;  CDialog對話框</p><p>  CWinApp應(yīng)用程序類。似于C中的main函數(shù),是程序執(zhí)行的入口和管理者,負(fù)責(zé)程序建立、消滅,主窗口和文檔模板的建立。最常用函數(shù)InitInstance():初始化。</p><p>  CGdiObject及子類,用于向設(shè)備文本畫圖。它們都需要在使用前選的DC。</p><p><b>  CPen筆,

98、畫線。</b></p><p>  CBrush刷子,填充。</p><p>  CFont字體,控制文字輸出的字體。</p><p><b>  CBitmap位圖</b></p><p>  CPalette調(diào)色板</p><p>  CRgn區(qū)域,指定一塊區(qū)域可以用于做特殊處理。

99、</p><p>  CFile文件。最重要的不外是Open(打開),Read(讀入),Write(寫)。</p><p>  CString字符串。封裝了C中的字符數(shù)組,非常實用。</p><p>  CPoint點,就是(x,y)對。</p><p>  CRect矩形,就是(left,top,right,bottom)。</p&g

100、t;<p>  CSize大小,就是(cx,cy)對(寬、高)。</p><p>  第3章 數(shù)字圖像處理的實現(xiàn)過程及算法</p><p>  一個數(shù)字圖像處理的系統(tǒng)一般分為:圖像采集,圖像預(yù)處理,圖像分割,輪廓跟蹤,圖像辨別五個部分。總系統(tǒng)實現(xiàn)框圖,如圖3-1所示。</p><p>  圖 3-1 總的系統(tǒng)實現(xiàn)框圖</p><p&

101、gt;  圖像采集實現(xiàn)是,通過對視頻數(shù)據(jù)的獲取,將連續(xù)的圖像信息按固定的采集頻率變成離散圖像,并通過對信號幅度離散分層的量化處理,將圖像保存以待后續(xù)處理。</p><p>  圖像預(yù)處理指的是,圖像平滑,它實現(xiàn)去除或衰減圖像上的噪聲和假輪廓,即衰減高頻分量,增強低頻分量。</p><p>  圖像分割指的是,將圖像劃分為一些區(qū)域,在同一區(qū)域內(nèi),圖像的特征相近,而不同的區(qū)域,圖形特征相差較遠(yuǎn)

102、,本系統(tǒng)的圖像特征指的是圖像本身的像素灰度值,它實現(xiàn)的是將圖形從背景中分離出來。</p><p>  輪廓跟蹤是,根據(jù)輪廓跟蹤算法實現(xiàn)對圖形輪廓信息的提取與存儲,為后續(xù)的圖像辨別算法提供信息。</p><p>  圖像辨別實現(xiàn)的是,通過數(shù)學(xué)運算對圖形的輪廓信息,進(jìn)行邊緣曲率計算,通過判斷角度大小,判斷是否是拐角,再通過拐角的數(shù)目實現(xiàn)圖形辨別。</p><p><

103、;b>  3.1 圖像采集</b></p><p>  圖像采集是圖像處理的先決條件,沒有圖像就根本談不上圖像處理。而且圖像采集效果的好壞也直接影響圖像處理的后續(xù)部分,因為如果圖像采集的非常好,其各種不良因素:如噪聲,假輪廓等因素的影響是不會很明顯的,這會使圖像的后續(xù)處理效果更好。</p><p>  本次設(shè)計我是使用手機(jī)攝像頭對物體圖像進(jìn)行采集。首先選取好合適的圖像采集

104、對象,再選取一個正對著的方向,近距離進(jìn)行實物拍攝。拍攝好設(shè)計所需的研究對象的照片之后,將采集的圖像上傳到電腦上面并以bmp格式保存好照片文件。之后利用VC++6.0里的 MFC板塊建立好相關(guān)的工程,然后獲取保存好的照片文件進(jìn)行讀取圖像處理。這樣就完成了圖像采集的工作。</p><p>  3.2 圖像預(yù)處理方法——圖像平滑</p><p>  一個圖形處理過程首先是要經(jīng)過預(yù)處理的。通過采集

105、設(shè)備獲取到待識別圖形或物體的平面圖像,為了避免一些外界干擾信息,在做這些預(yù)處理時,把待識別圖形或物體平鋪在白色背景的紙上。使得到的圖片盡量保持待識別圖形或物體的完整形狀。圖像的預(yù)處理工作有很多,除噪聲,抗干擾等等,因此首先我們得對圖像進(jìn)行一些必要的預(yù)處理,以免為后面的工作帶來不必要的麻煩,預(yù)處理的好壞直接影響到圖像處理工作,當(dāng)然最好的預(yù)處理就是沒有預(yù)處理。</p><p>  本次設(shè)計,我采用的圖像平滑主要的實現(xiàn)

106、方法是中值濾波法。其基本原理是把圖像或序列中心點位置的值用該域的中值替代,具有運算簡單、速度快、除噪效果好等優(yōu)點。</p><p>  具體方法是取某種結(jié)構(gòu)的二維滑動模板,將板內(nèi)像素按照像素值的大小進(jìn)行排序,生成單調(diào)上升(或下降)的為二維數(shù)據(jù)序列。二維中值濾波輸出為</p><p><b>  (3.1)</b></p><p>  其中,f(

107、x,y),g(x,y)分別為原始圖像和處理后圖像。W為二維模板,通常為2*2,3*3區(qū)域。</p><p>  在DIBAPI中定義Template()函數(shù),該函數(shù)用指定的模板(任意大小)來對圖像進(jìn)行操作,參數(shù)iTempH指定模板的高度,參數(shù)iTempW指定模板的寬度,參數(shù)iTempMX和iTempMY指定模板的中心元素坐標(biāo),參數(shù)fpArray指定模板元素,fCoef指定系數(shù)。實現(xiàn)相關(guān)功能的程序見附錄中附1。&l

108、t;/p><p>  3.3 圖像分割——二值化處理</p><p>  圖像分割是圖像處理中關(guān)鍵的步驟,因為它去除了圖像中大量的無用信息如背景等。為后續(xù)圖像處理減少了負(fù)擔(dān)。</p><p>  而要將圖像進(jìn)行分割就必須先將圖像進(jìn)行二值化處理。圖像的二值化處理就是將圖像上的點的灰度置為0或255,也就是將整個圖像呈現(xiàn)出明顯的黑白效果。即將256個亮度等級的灰度圖像通過適

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論