畢業(yè)設計----bp神經網絡方法對車牌照字符的識別(含外文翻譯)_第1頁
已閱讀1頁,還剩68頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、<p><b>  摘 要</b></p><p>  為了對車牌字符的識別,本文將BP神經網絡應用于汽車車牌的自動識別,在車牌圖像進行預處理后的基礎上,重點討論了用BP神經網絡方法對車牌照字符的識別。 首先將訓練樣本做圖像預處理,對車牌上的字符進行分割,得到單個字符。對大小不一的字符做歸一化后,對字符進行特征提取,把長為15,寬為25的歸一化后的圖像中的字符信息提取出來,圖像中

2、白點置為0,圖像中的黑點置為1,這樣就得到了15×25的特征向量,這個特征向量記錄的就是字符的特征。把這個特征向量送到BP網絡中進行訓練,得到了訓練好的權值,把他保存到“win.dat”和“whi.dat”中。然后打開要識別的圖片(即車牌),對圖像進行預處理后就可以識別了。識別率也在90%以上,表明該方法的有效性。</p><p>  關鍵字:車牌識別;LPR;字符識別;特征提取; BP神經網絡;Abs

3、tract</p><p>  For the discernment to the number plate character, this text applies BP neural network to the automatic discernment of the automobile number plate, on the basis that the number plate picture g

4、oes on in advance treated , is it use BP neural network method to car discernment , license plate of character to discuss especially. Will train samples to do the pretreatment of the picture at first, character in number

5、 plate cut apart, get the individual character. After making normalization to the charac</p><p>  Key word:The number plate discerning;The character discerning;</p><p>  LPR;The characteristic i

6、s drawn;BP neural network;目 錄</p><p><b>  摘要Ⅰ</b></p><p>  ABSTRACTⅡ</p><p><b>  概述1</b></p><p>  1.1 基本概念1</p><p>  1.2 字符識

7、別簡介2</p><p>  1.2.1字符識別發(fā)展概況2</p><p>  1.2.2字符識別系統(tǒng)用到的方法3</p><p>  1.2.3字符識別原理4</p><p>  1.3 國內外研究現(xiàn)狀和發(fā)展趨勢5</p><p>  1.4 基于神經網絡的字符識別系統(tǒng)6</p><

8、;p>  1.4.1 系統(tǒng)簡介6</p><p>  1.4.2 系統(tǒng)的基本技術要求7</p><p>  1.4.3系統(tǒng)的軟硬件平臺7</p><p>  字符識別系統(tǒng)中的關鍵技術8</p><p>  2.1 特征提取8</p><p>  2.1.1 基本概念8</p><

9、p>  2.1.2 區(qū)域內部的數(shù)字特征10</p><p>  2.1.3 基于邊界的形狀特征13</p><p>  2.2 神經網絡18</p><p>  2.2.1 人工神經元18</p><p>  2.2.2 人工神經網絡構成22</p><p>  2.2.3 人工神經網絡的學習規(guī)

10、則23</p><p>  2.2.4 BP神經網絡24</p><p>  第三章 系統(tǒng)的實現(xiàn)31</p><p>  3.1 系統(tǒng)流程圖31</p><p>  3.2 程序實現(xiàn)31</p><p>  3.3 程序的總體框架36</p><p>  第四章 系統(tǒng)

11、使用說明、測試及注意事項37</p><p>  4.1 系統(tǒng)使用說明37</p><p>  4.2 系統(tǒng)測試39</p><p>  4.2.1 數(shù)字識別39</p><p>  4.2.2 字母識別40</p><p>  4.2.3 漢字識別40</p><p> 

12、 4.2.4 車牌識別41</p><p>  4.3 注意事項41</p><p>  第五章 結論和展望42</p><p><b>  致謝43</b></p><p><b>  參考文獻44</b></p><p>  外文原文與譯文46<

13、/p><p><b>  外文原文46</b></p><p><b>  譯文57</b></p><p>  第一章 概 述</p><p><b>  1.1 基本概念</b></p><p>  隨著21世紀經濟全球化和信息時代的到來,

14、計算機技術、通信技術和計算機網絡技術迅猛發(fā)展,自動化的信息處理能力和水平不斷提高,并在人們社會活動和生活的各個領域得到廣泛應用。高速度、高效率的生活節(jié)奏,使汽車普及成為必然趨勢,交通管理自動化越來越成為亟待解決的問題。在這種情況下,作為信息來源的自動檢測、圖像識別技術越來越受到人們的重視。目前指紋識別、視網膜識別技術已經到了實用階段;聲音識別技術發(fā)展也相當快,而對汽車牌照等相關信息的自動采集和管理對于交通車輛管理、園區(qū)車輛管理、停車場管

15、理、交警稽查等方面有著十分重要的意義,成為信息處理技術的一項重要研究課題。</p><p>  車輛牌照識別(License Plate Recognition, LPR)技術作為交通管理自動化的重要手段,其任務是分析、處理汽車監(jiān)控圖像,自動識別汽車牌號,并進行相關智能化數(shù)據庫管理。LPR系統(tǒng)可以廣泛應用于高速公路電子收費站、出入控制、公路流量監(jiān)控、失竊車輛查詢、停車場車輛管理、公路稽查、監(jiān)測黑牌機動車、監(jiān)控違章

16、車輛的電子警察等需要車牌認證的重要場合,尤其在高速公路收費系統(tǒng)中,實現(xiàn)不停車收費技術可提高公路系統(tǒng)的運行效率,LPR系統(tǒng)更具有不可替代的作用,因而對LPR車牌識別技術的研究和應用系統(tǒng)開發(fā)具有重要的現(xiàn)實意義。</p><p>  LPR系統(tǒng)中的兩個關鍵子系統(tǒng)是車牌定位系統(tǒng)和車牌字符分割識別系統(tǒng)。</p><p>  關于車牌識別技術及定位系統(tǒng)研究,國內外學者已經作了大量工作,但實際效果并不理

17、想,對輔助光源要求高,很難有效解決復雜背景下多車牌識別的技術難題,如:車牌圖像的傾斜、車牌表面污穢或磨損、光線干擾等都會影響定位的準確性。傳統(tǒng)車牌識別一般僅支持單一車輛,背景比較簡單。而當今許多實際應用場合,如在繁忙交通路口臨時對欠稅費報廢掛失等車輛的稽查,則監(jiān)視區(qū)域比較復雜,現(xiàn)有識別方法無法直接應用,一般同時出現(xiàn)多輛汽車,背景有廣告牌、樹木、建筑物、斑馬線以及各種背景文字等。</p><p>  車牌定位與識別

18、方法,總體來說是圖像處理技術與車牌本身特點的有機結合,當然也包括小波分析、神經網絡、數(shù)學形態(tài)學、模糊理論等數(shù)學知識的有效運用。一個車牌定位與識別系統(tǒng)基本包括:圖像預處理、車牌搜索、車牌定位、車牌校正、車牌字符分割和字符識別結果的輸出。本系統(tǒng)主要是在對汽車圖像進行細致分析,從而研究車牌定位與識別的算法問題。</p><p>  1.2 字符識別簡介</p><p>  1.2.1 字符識別

19、發(fā)展概況</p><p>  字符識別發(fā)展可分為三個階段:第一個階段為初級階段,在這一階段中,技術上是應用一維圖像的處理方法完成二維圖像的識別任務。這樣萌芽了一個基本思想—抽取特征向量的構造和它的相關函數(shù)。現(xiàn)在此法仍不失為一種重要的匹配方法。第二個階段為基礎理論研究階段。提出了表示邊界的鏈碼法,用于結構分析的細化思想,以及一些離散圖形上的拓撲性研究,形成了不僅能抽取局部特征, 而且能抽取大范圍的凹凸區(qū)域、連通性、

20、孔等特征的算法,完成了作為基礎理論核心的“特征抽取理論”,及所謂的K-L展開法工作。第三個階段為發(fā)展階段。這一階段的研究工作是技術和實際相結合,針對實際系統(tǒng)的要求和設備可能提供的條件,提出了更為復雜的技術。但就多種方法分類來說為二大方法:相關法和構造解析法。在這兩類方法的基礎上,已研究出了不同類各具特色的實用系統(tǒng)。字符識別系統(tǒng)根據輸入設備的不同有如下分類[19],如圖1.1所示:</p><p>  目前開展比較

21、多,并進入實用階段的是光學字符識別系統(tǒng) (OCR系統(tǒng))。日本雖說起步不是最早,但因投入了大量的人力和物力,目前處于世界領先地位。七五年日本擁有650臺光學字符識別機,進入了實用階段。到一九七八年,能閱讀英文字母、數(shù)字、片假名和平假名等118 種OCRT0300上市。之后,其研究方向轉向了漢字識別。</p><p>  我國是從七十年代開始字符研究的。一九七八年,中科院自動化研究所等合作研制出了“倍函自動化分檢機”

22、,可識別0~9個數(shù)字;一九八七年清華大學研制的漢字識別系統(tǒng)通過了技術鑒定,可識別國家二級漢字庫6000多字,識別率可達99%,速度為1字/4秒;一九八七年十二月,西安交大人工智能和機器人研究所研制的漢字識別系統(tǒng)也通過了技術鑒定,同樣可識別漢字6000多,識別速度可達1字/1秒,識別率達98%以上,處于國內領先地位。這都為字符識別的實際應用提供了廣闊的前景。</p><p>  1.2.2 字符識別系統(tǒng)用到的方法

23、</p><p>  字符識別系統(tǒng)用到的方法很多。下面以表格的形式,其用到的方法作一簡單的介紹和比較。</p><p>  本系統(tǒng)中主要用到的是基于神經網絡的字符識別方法。</p><p>  1.2.3 字符識別原理</p><p>  近年來,字符識別逐漸成為模式識別領域內的一個重要分支。和其他模式識別的應用一樣,字符識別的基本思想也是

24、匹配判別。抽取代表未知字符模式本質的表達形式 (如各種特征) 和預先存儲在機器中的標準字符模式表達形式的集合 (稱為字典) 逐一匹配,用一定的準則進行判別,在機器存儲的標準字符模式表達形式的集合中,找出最接近輸入字符模式的表達形式,該表達形式對應的字就是識別結果。字符識別的原理框圖如圖1.2。</p><p>  字符識別的原理如上圖所示。文字經光電掃描,模數(shù)轉換為帶灰度值的數(shù)字信號送至預處理環(huán)節(jié)。預處理的內容和

25、要求取決于識別方法,一般包括行字切分,二值化,規(guī)范化等。經過預處理,字符模式成為規(guī)范化的二值數(shù)字點陣信息。對該二值化漢字點陣,抽取一定的表達形式后,與存儲在字典中已知的標準字符表達形式匹配判別,就可識別出輸入的未知字符。圖1.3中點劃線以下是識別系統(tǒng)的學習部分。學習是根據多個未知字樣抽取出模式表達形式,自動構造或修改充實字典,不斷提高系統(tǒng)識別率。字符的模式表達形式和相應的字典形式有多種,每種形式又可以選擇不同的特征,每種特征又有不同的抽

26、取方法。這些就使得判別方法和準則以及所用的數(shù)學工具不同,形成了種類繁多,形式各異的字符識別方法。</p><p>  1.3 國內外研究現(xiàn)狀和發(fā)展趨勢</p><p>  車牌識別技術自1988年以來,人們就對它進行了廣泛的研究,目前國內外已經有眾多的算法,一些實用的LPR技術也開始用于車流監(jiān)控、出入控制、電子收費、移動稽查等場合。然而,無論是LPR算法還是LPR產品幾乎都存在一定的局限

27、性,都需要適應新的要求而不斷完善,如現(xiàn)有系統(tǒng)幾乎都無法有效解決復雜背景下的多車牌圖像分割定位與有效識別的技術障礙,另外也很難適應全天候復雜環(huán)境及高速度的要求。</p><p>  車牌字符識別實際上是依附在車牌上的印刷體文字的識別,能否正確識別不僅是文字識別技術的問題,還是考慮其載體——車牌區(qū)域的影響。車牌字符識別技術是文字識別技術與車牌圖像自身因素協(xié)調兼顧的綜合性技術。由于攝像機的性能、車牌的整潔度、光照條件、

28、拍攝時的傾斜角度及車輛運動等因素的影響使牌照中的字符可能出現(xiàn)比較嚴重的模糊、歪斜、缺損或污跡干擾,這些都給字符識別帶來了難度。盡管如此,我國依然有大量的學者從事車牌字符識別研究,文獻給出了基于神經網絡的車牌識別方法,對于解析度較高和圖像比較清晰的車牌,這些方法能有效識別車牌中的字符,但對于較低解析度和較為模糊的車牌無能為力,因為這些方法只有在車牌中的每個字符被獨立分割出來的前提下才能完成識別工作。而獨立分割車牌取得字符,對較低解析度和較

29、為模糊的車牌來說是非常困難的。車牌字符識別的研究在技術上已經取得了一定突破,然而離復雜多變的實際應用要求還有一定差距,許多新方法僅停留在理論和文章上或者限定在比較狹窄的約束范圍內,并不能以產品的形式大范圍投入使用。因而車牌字符識別的實用化研究仍然有很長的路要走。</p><p>  目前的車牌識別方法主要是針對車輛自動緩停收費、停車場管理等場合,所監(jiān)視的區(qū)域一般只有單一車輛,背景也比較簡單。而如今的許多實際應用場

30、合,監(jiān)視區(qū)域比較復雜,現(xiàn)有的方法無法直接應用。比如在移動交警稽查、高速公路的監(jiān)視與監(jiān)控、城市交通要道的監(jiān)視與監(jiān)控,所監(jiān)控的區(qū)域一般會同時出現(xiàn)多輛汽車,背景也比較復雜,有廣告牌、樹木、建筑物、斑馬線以及各種背景文字等。所以本課題針對這種情況創(chuàng)新性的提出了一種復雜背景下多車牌定位分割與識別方法,并考慮了彩色分割與ColorLP算法,這也是當前車牌圖像識別的發(fā)展趨勢。</p><p>  當然,車牌識別系統(tǒng)的具體應用發(fā)

31、展也很迅猛,從原來的停車靜止拍攝場景應用,如收費站、停車場等,發(fā)展到移動公路車輛稽查、違章自動報警、超載闖紅燈等實時監(jiān)控場合應用,增加神經網絡自適應識別學習訓練功能,對于系統(tǒng)響應的速度、網絡化、智能化、識別成功率等實用化要求也越來越高。隨著上述核心技術的研究發(fā)展,應用領域和功能等也獲得大幅提高。</p><p>  1.4 基于神經網絡的字符識別系統(tǒng)</p><p>  1.4.1 系

32、統(tǒng)簡介</p><p>  該系統(tǒng)是為了辨認識別圖像中的字符而設計的,它通過對圖片的一系列處理,最后識別得出圖片中顯示的字符。 系統(tǒng)即可以單獨使用,也可以把它作為一個識別系統(tǒng)的軟件核心應用到車牌識別系統(tǒng)中去。</p><p>  1.4.2 系統(tǒng)的基本技術要求</p><p>  下面是系統(tǒng)具體要達到的基本技術要求</p><p>  1.

33、輸入圖片中可以含有多個字符;</p><p>  2.字符的識別準確率大于90%;</p><p>  3.每張圖片的處理時間(識別時間)不能大于1S;</p><p>  4.對圖片噪聲具有較強的適應性;</p><p>  5.系統(tǒng)要能長時間無故障的運行;</p><p>  6.系統(tǒng)的操作要求簡單;</p&

34、gt;<p>  1.4.3 系統(tǒng)的軟硬件平臺</p><p>  (1).系統(tǒng)的軟件平臺</p><p>  因為系統(tǒng)運行的過程當中,主要進行的都是圖象處理,在這個過程當中要進行大量的數(shù)據處理,所以處理器和內存要求比較高,CUP要求主頻在600HZ及其以上,內存在128MB及其 以上。</p><p>  (2).系統(tǒng)的軟件平臺</p>

35、<p>  系統(tǒng)可以運行于Windows 98, Windows2000, Windows XP或者Windows 2003操作系統(tǒng)下。程序調試時,需要使用Microsoft Visual C++ 6.0(SP6)。</p><p>  第二章 字符識別系統(tǒng)中的關鍵技術</p><p><b>  2.1 特征提取</b></p><

36、;p>  圖像處理的高級階段是數(shù)字圖像分析(也對以稱為圖像理解),主要使用計算機系統(tǒng),從圖像中提取有用的數(shù)據或信息,生成非圖像的描述或表示,如數(shù)值、符號等,即抽取圖像特征,從而識別視覺圖像。為了能讓計算機系統(tǒng)認識圖像,人們首先必須尋找出算法,分析圖像的特征,然后將其特征用數(shù)學的辦法表示出來并教會計算機也能讀懂這些特征。這樣,計算機才能具有認識或者識別圖像的本領,稱圖像模式識別,也叫圖像識別。要使計算機具有識別的本領,首先要得到圖像

37、的各種特征,即特征提取。</p><p>  圖像特征是指圖像的原始特性或屬性。每一幅圖像都有其本身的特征,其中有些是視覺直接感受到的自然特征,如亮度、邊緣的輪廓、紋理或色彩等;有些是需要通過變換或測量才能得到的人為特征,如譜、直方圖等。</p><p>  圖像特征提取的結果給出了某一具體的圖像中與其他圖像相區(qū)別的特征。例如,描述物體表面灰度變化的紋理特征,描述物體外形的形狀特征等。&l

38、t;/p><p>  2.1.1 特征提取基本概念</p><p>  圖像識別是根據一定的圖像特征進行的,顯然這些特征的選擇很重要,它強烈地影響到圖像識別分類器的設計、性能及其識別結果的準確性。特征選擇錯誤,分類就個能分得準確,甚至無法分類。因此,特征選擇是圖像識別中的一個關鍵問題。由于實際問題中常常不容易找到那些最重要的特征,或者某些圖像特征還會隨著環(huán)境的變化而發(fā)生變化,這就使得特征的選

39、擇和提取復雜化。</p><p>  特征選擇和提取的基本任務是如何從眾多特征中找出那些最有效的特征。在樣本數(shù)量不是很多的情況下,用很多特征進行分類器設計,從計算復雜程度和分類器性能來看都是不適宜的。因此研究如何把高維特征寧間壓縮到低維特征空間以便有效地識別圖像成為一個重要的課題,例如手寫體文字識別的特征選擇的研究已將近半個世紀,但依然是一個研究的難點和熱點。</p><p>  為了進行

40、識別,需要把圖像從測量空間變換到維數(shù)大大減少的特征空間,被識別的圖像在這個特征空中就是由一個特征向量來表示。為了方便起見,對幾個經常用道的有關名詞作一些說明。</p><p><b>  1. 特征形成 </b></p><p>  根據待識別的圖像,通過計算機產生一維原始特征,稱之為特征形成。</p><p><b>  2. 特征

41、提取</b></p><p>  原始特征的數(shù)量很大,或者說圖像本身處于一個高維空間中,通過映射(或變換)的方法可以用低維空間來表示樣本,這個過程叫做特征提取。映射后的特征是原始特征某種組合。所謂特征提取在廣義上說是一種變換。</p><p><b>  3. 特征提取</b></p><p>  從一組特征中挑選出一些最有效的特征

42、以達到降低特征空間維數(shù)的目的,這個過程叫做特征選擇。</p><p>  目前幾乎沒有解析的方法能夠知道特征的選擇,很多情況下,憑直覺的引導可以列出一些可能的特征表,然后用特征排序的方法計算不同特征的識別效率。利用其結果對表進行刪減,從而選出若干最好的特征。</p><p>  良好的特征應具備以下4個特點:</p><p>  (1) 可區(qū)別性。對屬于不同類的圖像

43、來說,他們的特征應具備明顯的差異。</p><p>  (2) 可靠性。對于不同類型的圖像,特征值應該比較接近。例如,雜志封面的文字圖像的分割中,顏色是一個不好的特征。因為,封面文字的顏色可以是各種色彩,盡管它們都屬于文字圖像。</p><p>  (3) 獨立性好。所選擇的特征之間彼此不相關。例如細胞的曲徑和細胞的面積高度相關,因為面積大致與直徑的平方成正比。這兩個特征基本上反映的是相同

44、的屬性,即細胞的大小。但是,有時相關性很高的特征組合起來可以減少噪聲干擾,它們一般不作為單獨的特征使用。</p><p>  (4) 數(shù)量少。圖像識別系統(tǒng)的復雜程度隨著系統(tǒng)維數(shù)(特征的個數(shù))迅速增長。尤為重要的是用來訓練分類器和測試結果的圖像樣本隨特征數(shù)量呈指數(shù)關系增長。而且,增加帶噪聲的特征或與現(xiàn)存特征相關性高的特征實際上會使識別系統(tǒng)的性能下降。</p><p>  實際應用中特征提取過

45、程往往包括:先測試一組自覺上合理的特征,然后減少成數(shù)目合適的滿意集。通常符合上述要求的理想特征是很少甚至沒有的。</p><p>  對計算機圖像識別系統(tǒng)而言,物體的形狀是一個賴以識別的重要特征。一個圖像形狀和結構特征有兩種形式,一種是數(shù)字特征主要包括幾何屬性(如長短、面積、距離和凹凸特性等),統(tǒng)計屬性(如黑色像素點在垂直方向的投影)和拓撲屬性(如連通、歐拉數(shù));另一種是由字符串和圖等所表示的句法語言。它可以刻畫

46、某一圖像不同部分之間的相互關系(如文字識別中的筆劃關系),也可以描述不同目標間的關系。</p><p>  由于感興趣的是圖像的形狀和結構特征,所以其灰度信息往往可以忽略,只要能將它與其他目標或背景區(qū)分開來即可。常用的一種技術是二值化圖像,即將感興趣的部分(區(qū)域或邊界)標以最大灰度級,把背景(也包括其他任何不感興趣的部分)標以最小灰度級,通常為零。二值化圖像在形狀和結構分析中占有很重要的地位,本節(jié)討論的算法如沒有

47、特別說明都是基于二值化圖像的。</p><p>  2.1.2 區(qū)域內部的數(shù)字特征</p><p><b>  1. 矩</b></p><p>  給定二維連續(xù)函數(shù)f(x,y),下式定義了其pq階矩:</p><p><b>  (2.1)</b></p><p>  矩

48、在文字識別中作為有效統(tǒng)計特征而被廣泛運用,它之所以能被用來表征一幅二維圖像是基于下面的帕普利斯(Papoulis)惟一性定理:如果f(x,y)是分段連續(xù)的,只在xy平面的有限部分中有非零值,則所有各階矩皆存在,并且矩序列{Mpq}此才惟一地被f(x,y)所確定,反之{Mpq}也唯一地確正f(x,y)。</p><p>  對一幅二值圖像{ f(x,y):i,j=0,1,2…N-1}來說,上述條件無疑可被滿足。因此

49、,可定義其pq階矩為:</p><p>  Mpq=∑∑f(i,j)ipjq (2.2)</p><p>  不同p、q值下可以得到不同的圖像矩Mpq。,常用的區(qū)域矩特征有以下幾個:</p><p><b>  (1) 質心</b></p><p><b>  

50、(2.3)</b></p><p>  (2) 中心矩 </p><p><b>  (2.4)</b></p><p>  (3) Hu矩組 </p><p>  Hu矩組是{mpq}個矩的函數(shù),它滿足平移、旋轉不變性,因而可被廣泛地應用于區(qū)域形狀識別中。</p><p&

51、gt;  M1=m20+m02</p><p>  M2=(m20-m02)2+4m112</p><p>  M3=(m30-3m12)2+(3m21+ m03)2</p><p>  M4=(m30+m12)2+(m21+ m03)2</p><p>  M5=( m30-m12)( m30+m12) (m30+m12)2-3(m21+

52、 m03)2 +( 3m12-m03) </p><p>  (m21+ m03) 3(m30+m12)2-(m21+ m03)2 </p><p>  M6=(m20-m02) (m30+m12) 2 -(m21+ m03)2 +4m11 (m30+m12)(m21+ m03) </p><p>  M7=(3m

53、12-m30)( m30+m12) (m30+m12) 2 -3(m21+ m03)2 +</p><p>  (3m21-m30)( m21+m30) (m03+m12) 2 -3(m12+ m03)2 </p><p>  如果上述的7個Hu矩中的mpq用來代替,則得到的矩還可以滿足尺度不變性。特別地,M7滿足鏡像對稱不變性。</p><p&g

54、t;<b>  (4) 面積</b></p><p>  區(qū)域的面積定義為區(qū)域中的像素點數(shù):</p><p><b>  (2.5) </b></p><p>  其中 max為一位圖像的最大灰度級。</p><p><b>  (5) 扁度</b></p>&l

55、t;p>  扁度定義為區(qū)域的長短軸之比:</p><p><b>  (2.6) </b></p><p>  根據帕普利斯的定理,將要無窮多的mpq序列才能確定f(x,y)。在實際應用中,這是不可能實現(xiàn)的,通常取前幾階矩即可,但是這會帶來誤差。</p><p><b>  2. 投影</b></p>

56、<p>  投影的示意圖如圖2-1所示。圖像的數(shù)為{f (x,y)}。S為投影方向,t為與其垂直的方向,t與x軸夾角為?,則{f (x,y)}沿著S的投影定義為:</p><p><b>  (2.7)</b></p><p>  當?固定時,p(t, ?)為t的函數(shù),亦即一個一維波形。不斷地從0~2∏變換?,可得到在不同方向上{f (x,y)}的投影。&l

57、t;/p><p>  S y </p><p>  (x,y) t</p><p><b>  ?</b></p><p><b>  ?</b></p><p>  ? x</p&g

58、t;<p>  圖2.1 坐標投影(t,s)與原坐標系(x,y)間的對應關系</p><p>  由投影定理,對滿足一定條件的{f (x,y)}, 如果知道全部方向上的{p(t, ?)},就可以唯一地恢復{f (x,y)},然而統(tǒng)矩方法一樣,獲得所有方向上的投影在實際應用中是行不通的。通常取若干個特定方向上的投影作為以{f (x,y)}形狀特征度量,特別地,在x軸和y軸上的投影定義為:</p&

59、gt;<p><b>  (2.8)</b></p><p><b>  (2.9)</b></p><p>  應用投影定理,可以把二維圖像的問題轉變?yōu)橐痪S的曲線波形的問題。</p><p><b>  3.歐拉數(shù)</b></p><p>  圖像的歐拉數(shù)是圖像

60、的一中拓撲性質度量,它表明了圖的連通性。歐拉數(shù)定義為一個圖中或一個區(qū)域中的孔數(shù)H和連接部分數(shù)C的差:E=C-H。</p><p>  對數(shù)字降像而言,如果圖像的背景用0標記,目標物體用1記,則歐拉數(shù)可用下式計算:</p><p><b>  (2.10)</b></p><p>  n(1)表明圖像中像素點均數(shù)目, 表示二位圖像中具有垂直相鄰兩

61、個 1標記的狀態(tài)記數(shù),n(1 1) 表示具有水平相鄰1標記的狀態(tài)記數(shù),表示4個1標記相鄰的狀態(tài)記數(shù)。</p><p><b>  4.幾何特征</b></p><p><b>  (1) 面積和周長</b></p><p>  面積S和周長L是描述區(qū)域大小的基本特征。計算圖像中某個區(qū)域的面積以及該區(qū)域的周長,根據它們的比值

62、可以分析或提取該區(qū)域所代表的圖像形狀特征。</p><p>  粗略地說,圖像中的區(qū)域面積S就是圖像中相同標記的像素數(shù)目。由于連續(xù)圖像采用離散的像素點描述時,產生了誤差。例如一個包含50個像素的對角線比一個50個像素的水平直線要長。因此,在計算血積的過程中對每一個不同像素模式加上不同的權值,以減少誤差。</p><p>  區(qū)域的周長二用區(qū)域中相鄰邊緣點間的距離之和來表示,同樣存在誤差補償

63、的問題。</p><p><b>  (2) 圓形度R</b></p><p>  圓形度用來表示目標物體形狀接近圓形的程度,其計算公式為:</p><p><b>  (2.11)</b></p><p>  式中S為區(qū)域的面積,L為周長,R的取值范圍為0〈R≤1,R越人,則區(qū)域越接近圓形。以連續(xù)

64、的圓形,正方形和正三角形為例,它們的圓形度R分別為:圓形R=1,正方形R=0.79,正三角形R=0.60。</p><p><b>  (3) 凹凸特性</b></p><p>  凹凸特性時區(qū)域的基本特性之一。區(qū)域的凹凸性可以通過以下方法進行判別:區(qū)域內任意兩像素間的連線穿過區(qū)域外的像素,則此區(qū)域為凹形。相反,區(qū)域內任意兩像素間的連線不穿過區(qū)域外的像素,則稱為凸形。

65、在粘連字符的切分和文字識別等領域,經常利用宇符輪廓的凹凸特性分析其特征,</p><p>  2.1.3 基于邊界的形狀特征</p><p><b>  1.傅立葉描繪子</b></p><p>  對于邊界來說,最重要的是組成邊界的點的位置信息?;叶刃畔⑼耆梢院雎浴R虼丝梢詫⑦吔缈闯墒侵苯亲鴺讼碌狞c集構成的曲線y=f (x,y),其中x是

66、橫坐標,y是縱坐標??衫酶盗⑷~變換描述y=f (x,y),這一方法稱為傅立葉描繪子。</p><p>  (1) Zahn描繪子</p><p>  若以y=f (x,y)直接進行傅立葉交換,則變換的結果將與具體的x和y坐標值有關,不能滿足平移和旋轉的不變性要求。為了解決這個問題,引入封閉曲線本身的內稟參量構造曲線方程,再做傅立葉交換。</p><p>  由于邊

67、界通常是封閉曲線。設r是順時針方向的封閉曲線。引入曲線本身的內稟參量即曲線弧長l構造曲線方程,它的參數(shù)表達式為</p><p>  z(l)=(x(l),y(l)) (2.12)</p><p>  式中0≤l≤L,L是曲線全長。曲線的初始點為l=0,?(l)是曲線弧長為l的點的切線方向。定義:</p><

68、p>  φ(l)= ?(l)-?(0) (2.13)</p><p>  則φ(l)的變化規(guī)律可以描述封閉曲線的形狀,很明顯它是平移和旋轉不變的。由于φ(l)不是一個周期函數(shù),為將其變換為周期函數(shù)引入另一個變量</p><p>  則t?[0,2Π]??啥x為:</p><p>  φ*(t)= φ(

69、tL/2Π)+t t?[0,2Π] (2.14)</p><p>  則φ*(t)是[0,2Π]的周期函數(shù),而且它對封閉曲線r的平移、旋轉和尺度都是不變的。構造r->φ*(t)間的對應關系是一對一的,即介尺度變化下是相似的,如果反演φ*(t)->r,則可得出一組相似的封閉曲線。</p><p>  由于φ*(

70、t)是周期函數(shù),因此可用它的傅立葉系數(shù)來描述它,在[0,2Π]上展成傅立葉級數(shù)為:</p><p><b>  (2.15)</b></p><p><b>  其中:</b></p><p><b>  (2.16)</b></p><p><b>  (2.17)

71、</b></p><p><b>  (2.18)</b></p><p>  其中n=1,2,…。</p><p><b>  φ0</b></p><p><b>  V1</b></p><p><b>  Vm=V0<

72、/b></p><p><b>  V2</b></p><p>  △lm </p><p>  Vm-1 φ1</p><p><b>  V3</b></p><p><b&

73、gt;  φ2</b></p><p>  圖2.2 數(shù)字圖像下的多邊形邊界</p><p>  數(shù)了圖像中,封閉曲線r通常是由折線構成的多邊形或可用多邊形來近似。設多邊形頂為v0,v1, …, vm-1, 邊vi-1vi的長度為△li(I=1,2,…,m),如圖2.2所示。其中△lm是邊界vm-1 v0之長。在每邊vi-1vi上,φ(l)為常數(shù),設φi-1, 定義,<

74、/p><p><b>  則:</b></p><p><b>  (2.19)</b></p><p><b>  (2.20)</b></p><p><b>  (2.21)</b></p><p>  其中n=1,2,…。這樣,

75、區(qū)域邊界r就可用序列{a0,a1,b1,a2,b2,…}進行描述可刻畫。</p><p>  (2) Person—Fu傅立葉描繪子</p><p>  上面求an和bn時,已經指出對數(shù)了圖像而言,φ(l)是分段連續(xù)的,即在(vk-1,vk)邊上是常數(shù),而在端點上是不連續(xù)的,存在跳變。這會導致傅立葉變換中產生高頻分量,因而在用Zahn描述時,常要較多的傅立葉級數(shù),以保證信息不會有大的丟失。

76、</p><p>  Person和Fu將r與下面的復參量對應:u(l)=x(l)+iy(l)。其中l(wèi)仍然是弧長,x(l)和y(l)分別是曲線上點的橫坐標及縱坐標。相應的傅立葉變換為:</p><p><b>  (2.22)</b></p><p><b>  (2.23)</b></p><p>

77、;  其中,vk是多邊形第k個頂點的復數(shù)坐標。</p><p>  經過同Zahn方法類似的歸一化處理,{an}對廣的平移、旋轉和尺度變換具有不變性。適當?shù)厝an}的前幾項就可在信息損失較小的前提下描述邊界r。</p><p>  (a) 邊界的8種走向和對應的方向碼 (b) 邊界產生的方向鏈碼</p><p><b>  圖 2.3&

78、lt;/b></p><p><b>  2..鏈碼</b></p><p>  對于離散的數(shù)字圖像,區(qū)域的邊界輪廓可理解為相鄰邊界像素點之問的單元連線逐段相連而成??紤]數(shù)字圖像像素點(x,y)的一個8鄰域,顯然在該點處的邊界只能在以下幾個方向:正東、東北、正北、西北、正面、西南、正南和東南,如圖2.3(a)所示。對于每一種方向賦以一種碼表示,如上面 8個方向分

79、別對應于 0、1、2、3、4、5、6和 7,這些碼稱為方向碼。</p><p>  假設從某一個起點開始,將邊界的走向按上面的編碼方式記錄下來,可形成如下的序列a1 a2 a3…an。a1~ an取值為0~7,這一序列稱為鏈碼的方向鏈。再加上一些標識碼,即可構成鏈碼。從圖2-3(b)可知,偶數(shù)鏈碼段為垂自或水平方向的代碼段,奇數(shù)鏈碼段為對角線段。對圖2-3(b)所示的一個圖像區(qū)域,若以S點為出發(fā)點,按逆時針的方向

80、進行,所構成的邊界鏈碼應為556570700122333。當然,也可以按順時針方向進行,所構成的邊界鏈碼完全不同逆時針方向行進的情況。因此,邊界鏈碼具有行進的方向性,在具體應用時必須加以注意。</p><p>  有了鏈碼的方向鏈后,再加上一些標識碼,即可構成鏈碼。常用的標識碼有兩種:</p><p>  (1) 加上特殊專用的鏈碼結束標志。如采用“!”作為結束標志,則圖2-3(b)的鏈碼

81、應為556570700122333!。</p><p>  (2) 標上起始點的坐標。如圖圖2-3(b)的鏈碼為556570700122333xyz,xyz為起始點S的坐標,用3位8進制數(shù)表示。</p><p>  從鏈碼可以得出邊界的許多形狀特征:</p><p><b>  (1) 鏈的長度</b></p><p>

82、<b>  (2.24)</b></p><p>  其中。表示方向鏈中偶數(shù)碼的數(shù)目,此表示奇數(shù)碼的個數(shù)。奇數(shù)的用人的權重修正后,邊界的長度檢測時可以彌補圖像離散化的誤差。</p><p>  (2) 邊界所表示區(qū)域的寬度和高度</p><p>  設方向鏈為{a1 a2 a3…an},定義ai在x軸上的分量為aix,在y軸上的分量為aiy則:

83、</p><p>  ai=0時,aix=1,aiy=0</p><p>  ai=1時,aix=1,aiy=1</p><p>  ai=2時,aix=0,aiy=1</p><p>  ai=3時,aix=-1,aiy=1</p><p>  ai=4時,aix=-1,aiy=0</p><p&

84、gt;  ai=5時,aix=-1,aiy=-1</p><p>  ai=6時,aix=0,aiy=-1</p><p>  ai=7時,aix=1,aiy=-1</p><p>  設x0和y0是起始點的坐標,則: </p><p><b>  (2.25)</b></p><p><b

85、>  (2.26)</b></p><p>  (3) 鏈碼所包圍的區(qū)域面積:</p><p><b>  (2.27)</b></p><p><b>  (2.28)</b></p><p>  (4) 假如兩個像素點可由方向鏈聯(lián)接{a1 a2 a3…an},則這兩點的距離為:

86、</p><p><b>  (2.29)</b></p><p>  上述的區(qū)域特征用鏈碼來計算,計算比較簡單。但是在描述形狀時,信息并不完全,這些數(shù)值特征與具體的形狀之間并不—一對應。因此,不能只用這些數(shù)值進行形狀識別,必須與其他特征信息相結合使用,作為補充信息,卻能大大提高系統(tǒng)的識別性能。</p><p>  2.2 神經網絡

87、 </p><p>  2.2.1 人工神經元</p><p>  生物神經網絡(BNN)信息傳遞過程為多輸入單輸出(MISO)系統(tǒng),信號為脈沖,當脈沖到達突觸前膜時,前膜釋放化學物質,結果在突觸后產生突觸后電位,其大小與脈沖密度有關(時間總合效應),并且各通道都對電位產生影響(空間總合效應)。ANN等效模擬電壓近似BNN脈沖密度,僅有空間累加無時間累加(可認為時間累加

88、己隱含于等效模擬電壓之中)。</p><p><b>  1.神經元模型</b></p><p>  神經元是人工神經網絡的基本處理單元,它一般是一個多輸入/多輸出的非線性元件。神經元輸出除受輸入信號的影響之外,同時也受到神經元內部其他因素的影響,所以在人工神經元的建模中,常常還加有一個額外輸入信號,稱為偏差(Bats), 有時也稱為閥值或門限值。見圖2.4。<

89、/p><p>  圖2.4 基本神經元模型</p><p>  上圖a=f(wp)是不加偏差的輸入輸出關系,其中w是權重,p是輸入;a=f(wp+b)是帶偏差的輸入輸出關系,w、p意義同上,b是偏差,f是所謂的作用函數(shù)。</p><p>  經過抽象,可得到數(shù)學表達式如下:</p><p><b>  (2.30)</b>&

90、lt;/p><p><b>  (2.31)</b></p><p>  ωi: 數(shù)值(Weigthts);</p><p>  θ:閥值(Threshold);</p><p>  б(s):作用函數(shù)(Activated Transfer Function)。</p><p>  作用函數(shù)的基本作用

91、是:</p><p>  (1) 控制輸人對輸出的激活作用;</p><p>  (2) 對輸入、輸出進行函數(shù)轉換;</p><p>  (3) 將可能無限域的輸入變換成指定的有限范圍內的輸出。</p><p>  2.幾種常用的作用函數(shù)</p><p>  包括閥值型(硬限制型)、線性型、S型函數(shù)(Sigmoid)、

92、輻射基函數(shù)等。</p><p>  下面各圖形中的 n(W*P十b)是輸入,a是輸出。 (1).閥值型(硬限制型)</p><p>  有兩種形式,第一種是:</p><p><b>  (2.32)</b></p><p>  當輸入大于0時,輸出為1;輸入小于0時,輸出

93、為0。見圖2.5。</p><p>  圖2.5 閾值型作用函數(shù)一</p><p><b>  第二種是:</b></p><p><b>  (2.33)</b></p><p>  也就是當輸入大于0時,輸出為1;反之為-1。見圖2.6。</p><p>  圖2.6 閾

94、值型作用函數(shù)二</p><p><b>  (2).線性型</b></p><p>  也有兩種情況,全線性型和正線性型,如下:</p><p><b> ?、?全線性</b></p><p>  A=f (W*P+b)=W*p+b

95、 (2.34)</p><p>  此時輸出與輸入成正比關系。見圖2.7。</p><p>  圖2.7 全線性作用函數(shù)</p><p><b> ?、冢孕?</b></p><p><b>  (2.35)</b></p><p>  當輸入大于0時,輸出

96、與輸入成正比關系;反之,輸出恒為0;見圖2.8。</p><p>  圖2.8 正線性作用函數(shù)</p><p>  (3).S型函數(shù)(Sigmoid)</p><p>  也有兩種可能的函數(shù)類型。</p><p><b>  對數(shù)正切</b></p><p>  y=1/(e-n+1)

97、 (2.36)</p><p>  輸出與輸入成對數(shù)正切關系,見圖2.9。</p><p>  圖2.9 S型函數(shù)(對數(shù)正切)</p><p><b> ?、?雙曲正切</b></p><p>  y=tanh(n)

98、 (2.37)</p><p>  輸入與輸出成雙曲正切關系,見圖2.10。</p><p>  圖2.10 S型函數(shù)(雙曲正切)</p><p><b>  (4).輻射基函數(shù)</b></p><p><b> ?、?高斯函數(shù)&l

99、t;/b></p><p>  函數(shù)的形狀見圖2.11。</p><p>  圖2.11 輻射基函數(shù)(高斯函數(shù))</p><p><b> ?、?三角波函數(shù)</b></p><p>  函數(shù)的形狀見圖2.12。</p><p>  圖 2.12 輻射基函數(shù)(三角波函數(shù))</p>

100、<p>  2.2.2 人工神經網絡構成</p><p>  人工神經網絡有很多構成形式,比如基本型、前向型、回歸型以及互聯(lián)型等,下面我們列出一些前兩種神經網絡構成形式。</p><p><b>  1.基本模型</b></p><p>  人工神經網絡的基本模型如圖2.13所示。</p><p>  圖2

101、.13 人工神經網絡基本模型 </p><p>  圖中,輸入經過神經元之間的連接值和作用函數(shù),得到輸出,再與目標值相比較,根據其差值信息,反饋回來進行神經元之間連接值的調整。</p><p><b>  2. 前向網絡</b></p><p>  結構如圖2.14 所示。</p><p>  圖2.14 前向網絡結構&

102、lt;/p><p>  其中,x1,x2,…,xn是輸入,y1,y2,…,yn是輸出。</p><p>  前向網絡的特點如下:</p><p>  (1) 神經元分層排列,可又多層;。</p><p>  (2) 層間無連接;</p><p>  (3) 方向由入到出.</p><p>  感知網

103、絡(Perceptron即為此),應用最為廣泛。</p><p>  2.2.3 人工神經網絡的學習規(guī)則</p><p>  ANN中的核心問題就是如何決定網絡連接的加權系數(shù)(Weight)。這一小節(jié)介紹M些常用的學習規(guī)則。</p><p>  1.Hebb學習規(guī)則</p><p>  1949年,D.O.Hebb基于生理學和心理學的研究,

104、對生物神經細胞如何進行學習的問題,剔除了一個直覺得假說:“當兩個神經元都處于興奮狀態(tài)時,連接這兩個神經元的權值將得到加強”,公式表示如下:</p><p><b>  (2.38)</b></p><p>  上式中,△Wij是連接權值的變化,Vi、Vj是兩個神經元的活化水平,α是學習系數(shù)。</p><p><b>  2.δ學習規(guī)則

105、</b></p><p>  也稱為誤差校正規(guī)則或者剃度方法,著名的BP方法即為其中一種。</p><p><b>  (2.39)</b></p><p><b>  (2.40)</b></p><p>  上式中,△Wij為權值的改變,α為學習系數(shù),Vi是當前神經元的興奮度,δ是實

106、際輸出與期望輸出的偏差。</p><p>  2.2.4 BP神經網絡</p><p>  BP網絡是應用中經常碰到的,這一節(jié)將詳細介紹一下BP網絡。</p><p><b>  1.BP網絡模型</b></p><p>  BP神經網絡模型見圖2.15</p><p>  圖2.15 BP神經

107、網絡結構</p><p>  可以看出,BP網絡一般情況下有一個輸入層,一個隱藏層(有時是兩個或更多),一個輸出層。</p><p><b>  2.輸入輸出關系</b></p><p>  I->H(輸入層到隱藏層)</p><p>  (2.41)

108、

109、

110、 </p><p><b>  (2.42)</b></p><p>  H->O(隱藏層導輸出層)

111、

112、 </p><p><b>  (2.43)</b></p><

113、p>  其中,輸人層神經元個數(shù)為 n,隱含層神經元個數(shù)為n1,輸出層神經元個數(shù)為S2。</p><p><b>  3.網絡學習訓練</b></p><p>  前面已經說過,神經網絡的關鍵問題之一是權值的確定。下面,討論一下BP網絡中的權值確定方法。</p><p>  我們假定輸入q組本p1,p2,…,pq,piRn,</p&g

114、t;<p>  期望輸出為T1,T2,…,Tq,這里TRs2,</p><p>  網絡的實際輸出為a21,a22,…,a2q,a2 Rs2。</p><p>  評價的準則是誤差最小,所以網絡訓練的實質轉化為一個優(yōu)化問題。這里考慮用梯度法(Gradient)來找出誤差與加權系數(shù)的關系,以得到加權系數(shù)改變的規(guī)律。</p><p><b>  

115、定義誤差函數(shù)為:</b></p><p><b>  (2.44)</b></p><p>  我們利用剃度下降法求權值的變化及誤差的反向傳播。</p><p>  (1).輸出層的權值變化</p><p>  從第i個輸入到第k個輸出的權值改變有:</p><p><b>

116、  (2.45)</b></p><p><b>  同理可得:</b></p><p>  (2.46) </p><p>  (2).隱含層權值變化</p><p><b>  (2.47)</b></p><p>  其中,

117、</p><p><b>  同理可得,。</b></p><p><b>  (3).解釋</b></p><p>  輸出層誤差 ej(j=1-S2)</p><p>  隱含層誤差 ei(i=1-n2),</p><p>  這里,可以認為ei是由ej加權組合形成的

118、,由于作用函數(shù)的存在,ej的等效作用為δji=ejf ‘()。</p><p>  4.BP網絡的設計問題</p><p>  在進行BP網絡的設計時,一般應從網絡的層數(shù),每層中的神經元個數(shù)和激活函數(shù)、初始值以及學習速率等幾個方面來進行考慮。下面討論各自的選取原則。</p><p><b>  (1).網絡的層數(shù)</b></p>

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論