2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩44頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、<p> 本科畢業(yè)設(shè)計(論文)</p><p><b>  摘要</b></p><p>  近些年由于人們的生活節(jié)奏快,工作壓力大,因疲勞問題而引起的事故時有發(fā)生,疲勞駕駛而釀成的慘劇更是使我們警鐘長鳴。為了解決這個問題,本次畢業(yè)設(shè)計著重討論一種基于ASM模型的人臉識別算法和一種疲勞駕駛的面部特征判定標準。本文的主要內(nèi)容是:</p><

2、p>  首先,簡要介紹此次研究的課題意義,再介紹人臉識別和疲勞檢測的一些相關(guān)的背景知識,由于此次課題是疲勞駕駛的檢測,所以介紹的重點是關(guān)于疲勞駕駛的檢測研究。</p><p>  其次,討論疲勞的判定方法,這一部分主要是對疲勞特征的選擇研究,涉及到人眼睛和嘴的形狀的疲勞特征分析,然后進行疲勞分析的綜合。</p><p>  然后,詳細介紹ASM模型的定義,在這一部分中還介紹了ASM的

3、算法、區(qū)域收斂方法以及判定收斂的依據(jù),另外,在這部分中將給出算法實現(xiàn)步驟的流程圖。</p><p>  再后,主要內(nèi)容是圖像處理與識別,其中包括圖像的預(yù)處理和手工描點方法所需要確定的參量,以及如何用matlab程序得到這些參量。程序的流程圖也在這一章展示。</p><p>  關(guān)鍵詞 人臉識別;疲勞檢測;疲勞特征;動態(tài)形狀模型</p><p><b>  

4、Abstract</b></p><p>  Recently as the fast pace of life and heavy work pressure, accidents caused by fatigue happened frequently. Traffic accident disaster is causing the bells to ring. To solve this p

5、roblem, the graduation project focused on a face recognition algorithm based on ASM model and a facial features determination standards of fatiguedriving. The main contents are:</p><p>  First, there is a br

6、ief introduction of the research, the relevant background knowledge of face recognition and fatigue testing will be given later. as it is the detection of fatiguedriving that we are taking care of, we will mainly focus o

7、n the it.</p><p>  Secondly, we will learn the judging methods of fatigue, the part choice of the fatigue characteristics is studied here, the fatigue characteristics of eyes and mouth is analyzed, then we w

8、ill comprehensively analysis them.</p><p>  Then, the principle and method of ASM person face recognition technology is studied. In this section, we will describe the ASM algorithm, the covergence metho

9、d and the basis of determining convergence.The flow chart of algorithm will also be given flow chart in this part.</p><p>  Finally, we will show picture pre-treatment methods and picture recognition, t

10、his part includes the image pre-processing, the needed parameters and how to use the matlab program to get the parameters. The idea and flow chart of the main program will be given. </p><p>  Keywo

11、rds Face Recognition; Fatigue Detection; Fatigue Characteristics; Active Shape models</p><p><b>  目 錄</b></p><p><b>  摘要I</b></p><p>  AbstractII</p>

12、<p><b>  第1章 緒論1</b></p><p>  1.1 課題背景和意義1</p><p>  1.2 研究現(xiàn)狀3</p><p>  1.3 本文主要研究內(nèi)容6</p><p>  第2章 疲勞分析和疲勞檢測8</p><p>  2.1 疲勞駕

13、駛特征綜述8</p><p>  2.2 具體特征分析9</p><p>  2.2.1 疲勞駕駛眼部特征分析9</p><p>  2.2.2 疲勞駕駛嘴的特征分析10</p><p>  2.2.3 原始數(shù)據(jù)的獲取12</p><p>  2.3 眼睛和嘴特征的綜合分析13</p>

14、<p>  2.4 本章小結(jié)14</p><p>  第3章 ASM人臉識別算法15</p><p>  3.1 ASM模型的定義15</p><p>  3.2 ASM人臉識別的優(yōu)勢15</p><p>  3.2.1 ASM搜索算法的特點15</p><p>  3.2.2 幾種

15、識別方式對比分析16</p><p>  3.3 ASM的模型建立17</p><p>  3.4 ASM模型的搜索算法19</p><p>  3.5 流程設(shè)計思路22</p><p>  3.6 本章小結(jié)23</p><p>  第4章 圖像處理和識別24</p><p&g

16、t;  4.1 圖像預(yù)處理的必要性24</p><p>  4.2 常用光照預(yù)處理技術(shù)24</p><p>  4.2.1 基于直方圖的預(yù)處理方法25</p><p>  4.2.2 線性變換25</p><p>  4.2.3 對數(shù)變換26</p><p>  4.2.4 指數(shù)變換27<

17、/p><p>  4.2.5 光照預(yù)處理方法選擇27</p><p>  4.3 圖片選取策略28</p><p>  4.4 圖像手工描點的實現(xiàn)28</p><p>  4.4.1 要確定的要素分析28</p><p>  4.4.2 要素值的確定方法29</p><p>  

18、4.5 選點策略33</p><p>  4.6 程序流程圖33</p><p>  4.7 收斂過程和識別結(jié)果34</p><p>  4.8 本章小結(jié)35</p><p><b>  結(jié)論36</b></p><p><b>  參考文獻37 </b>

19、</p><p><b>  第1章 緒論</b></p><p>  1.1 課題背景和意義</p><p>  駕駛疲勞是指駕駛員由于睡眠不足或長時間持續(xù)駕駛造成的反應(yīng)能力下降,這種下降表現(xiàn)在駕駛員困倦、打瞌睡、駕駛操作失誤或完全喪失駕駛能力。駕駛疲勞反映在生理與心理兩個方面,生理反映包括神經(jīng)系統(tǒng)的功能、血液和眼睛的變化;心理反映包括反

20、應(yīng)時延長、注意力分散、動作不協(xié)調(diào)。美國印第安那大學(xué)對交通事故原因的調(diào)查研究發(fā)現(xiàn)85%的事故與駕駛員有關(guān),車輛和環(huán)境因素只占15%[1]。駕駛員在事故發(fā)生前一瞬間的行為和故障直接導(dǎo)致了事故的發(fā)生,這些行為包括知覺的延遲、對環(huán)境的決策錯誤、對危險情況的處理不當?shù)取T谒械鸟{駛員錯誤中,最常見的是知覺延遲和決策錯誤,這些錯誤會產(chǎn)生注意力不集中、反映遲鈍、操作不當?shù)?,產(chǎn)生這些錯誤的根本原因就是駕駛疲勞。由于司機疲勞駕駛導(dǎo)致警惕性水平的下降,從而

21、造成交通事故的增長,這已成為了社會普遍關(guān)注的一個熱點。如果司機疲勞駕駛,那么他的觀察、識別和車輛控制能力都會顯著下降,嚴重威脅自身的安全和其他人的生命。隨著交通運輸業(yè)的發(fā)展,交通事故已成為當前各國所面臨的嚴重問題。據(jù)世界衛(wèi)生組織統(tǒng)計,全世界每年有120多萬人死于交通事故,數(shù)百萬人受傷或致殘。全球每年交通事故造成的經(jīng)濟損失高達5180</p><p>  近年來,我國惡性道路交通事故呈上升趨勢。我國交通事故死亡人數(shù)

22、己連續(xù)10多年居世界第一。我國因車禍喪生的人數(shù),十幾年間己從每年5萬多人增長到10多萬人,是交通事故死亡人數(shù)居世界第二位國家的兩倍。其中,駕駛員疲勞造成交通事故的占總數(shù)的20%左右,大約占特大交通事故的40%[3]以上。所以進行疲勞檢測技術(shù)的研究是十分必要的,且有其深遠的意義。</p><p>  同樣,在國外情況也差不多。美國國家公路交通安全管理局也就是所謂的NHTSA(NmionMHighway Traffi

23、c Safety Administration,NHTSA) [4]最近幾年的調(diào)查顯示:每年平均有56000起車禍與疲勞駕駛相關(guān)[5],造成76000人受傷,1544人死亡(占交通事故死亡總?cè)藬?shù)的3.7%),調(diào)查還顯示有27%</p><p>  的受訪者表示有過開車打磕睡的經(jīng)歷。2004年美國國家交通安全委員會NTSB(The National Transportation Safety Board,NTSB)

24、檢查了107起由駕駛員造成的卡車交通事故,表明有58%的交通事故與駕駛員疲勞駕駛有關(guān)。美國汽車聯(lián)合會 (American Automobile Association)的交通安全部初步估計41%~59%的重型卡車交通事故與疲勞駕駛有關(guān)。英國交通研究實驗室認為駕駛疲勞導(dǎo)致的路面交通事故大約占全部交駕駛員通事故率的10%。法國國家警察總署事故報告表明,因疲勞瞌睡而發(fā)生的車禍,占人身傷害事故的14.9%,占死亡事故的20.6%。德國保險公司協(xié)

25、會估計,在德國境內(nèi)的高速公路上,大約25%導(dǎo)致人員傷亡的交通事故都是由疲勞駕駛引發(fā)。澳大利亞聯(lián)邦議會統(tǒng)計:在2000年,司機疲勞駕駛造成的交通事故占所有交通事故的20%到30%;專家認為這只是保守統(tǒng)計,實際所占的比例可能更大。日本的事故統(tǒng)計揭示,因疲勞產(chǎn)生的事故約占1.0%~1.5%[6]。</p><p>  近期關(guān)于疲勞特征,疲勞后的主要現(xiàn)有[7]:</p><p>  反應(yīng)時間顯著增

26、長,注意力分散,判斷能力下降,主動性降低,注意力分配不均衡且轉(zhuǎn)移速度降低,經(jīng)常丟失重要的信息;感覺器官的功能減退或紊亂,如視覺模糊、聽力下降、判斷遲緩;駕駛動作不靈活,操作能力下降,節(jié)律失調(diào);記憶和思考能力下降,判斷失誤增多;駕駛員的信心、決心、耐性和自我控制能力減退,缺乏堅持不懈的精神,易于激動、急躁和開快車;</p><p>  過度疲勞會使駕駛員在行車途中產(chǎn)生困倦,甚至打瞌睡。</p><

27、;p>  駕駛疲勞導(dǎo)致事故的形成過程通常是:大腦供氧不足葉中樞神經(jīng)疲勞感覺下降、知覺遲鈍肌肉收縮的調(diào)節(jié)機能惡化感覺刺激中斷認識遲緩、判斷失誤、操作失誤、打瞌睡等交通事故??梢?,疲勞駕駛會引起大量的交通事故。如果建立一套疲勞檢測系統(tǒng)能夠切實有效的工作,必定可以大大減少由疲勞駕駛所引起的交通事故,不但能減少人員傷亡,而且能避免因此產(chǎn)生的經(jīng)濟損失。</p><p>  疲勞是有其可以識別的特征的。由于司機駕駛疲勞

28、會產(chǎn)生神經(jīng)系統(tǒng)</p><p>  功能、循環(huán)機能、血液、眼睛、呼吸機能、體溫等生理變化,這些變化通過駕駛員的自覺癥狀和他覺癥狀反映出來。所以可以通過衡量方向盤的微調(diào),腦波,心率,頭手的位移,眼瞼的閉合程度或眨動速率等一些有特異性和可量化的指標,通過大量實驗確定駕駛疲勞的評價標準,以量化的閾值加以表示,來判斷駕駛員是否已經(jīng)疲勞。</p><p>  可見,疲勞駕駛會引起大量的交通事故。如果

29、建立一套疲勞檢測系統(tǒng)能夠切實有效的工作,必定可以大大減少由疲勞駕駛所引起的交通事故,不但能減少人員傷亡,而且能避免因此產(chǎn)生的經(jīng)濟損失。正因如此,研究出一套疲勞檢測的系統(tǒng)是極有現(xiàn)實意義的。</p><p><b>  1.2 研究現(xiàn)狀</b></p><p>  由于疲勞駕駛導(dǎo)致的車禍數(shù)量的劇增,漸漸引起國內(nèi)外學(xué)者的關(guān)注,各種針對疲勞駕駛檢測科研都在積極進行種。<

30、;/p><p>  利用心跳特征制成的心跳速度檢測儀。2002年,日本先鋒公司開發(fā)出防止駕駛員開車打瞌睡的系統(tǒng)。該系統(tǒng)的核心技術(shù)之一是貼在轉(zhuǎn)向盤上的紙狀心跳感應(yīng)器。一般說來,人在打瞌睡之前,心跳速度下降,感應(yīng)器每隔15 s檢測一次駕駛員的心跳速度,一旦確認駕駛員有睡意襲來,就通過改變音樂節(jié)奏等方式給以警示[8]。</p><p>  頭部位置檢測儀。該預(yù)警系統(tǒng)由澳大利亞人于2003年設(shè)計和開發(fā)

31、,主要是通過監(jiān)視駕駛員在行駛過程中頭部的位移情況來判斷其是否在打瞌睡[9]。</p><p>  轉(zhuǎn)向盤監(jiān)測系統(tǒng)1999年,美國Electronic Safety Products公司開發(fā)的轉(zhuǎn)向盤監(jiān)測系統(tǒng)S.A.M(steering atention monitor)是一種檢測轉(zhuǎn)向盤運動的傳感器裝置,適用于各種車輛[10]。當駕駛員疲勞時,反應(yīng)能力變慢,操作轉(zhuǎn)向盤的動作也會減緩;當系統(tǒng)檢測到轉(zhuǎn)向盤正常運動時傳感器

32、裝置不報警,若轉(zhuǎn)向盤持續(xù)4 s不運動,系統(tǒng)報警。</p><p>  Driving Research Center研發(fā)的了PERCLOS系,該系統(tǒng)檢測單位時間內(nèi)眼睛閉合程度超過80%以上的時間占總時間的百分比,并與預(yù)先設(shè)定的閾值進行比較,從而提醒駕駛員注意行車安全[11]。</p><p>  車道偏離報警系統(tǒng)DAS2000。當駕駛員駕駛疲勞時,往往出現(xiàn)精神萎靡、注意力分散、反應(yīng)遲鈍等現(xiàn)

33、象,且最容易無意識地駛出中線或者偏離車道。2004年,美國Ellison Research Labs實驗室研制的DAS2000型路面警告系統(tǒng),通過車的軌跡對疲勞駕駛進行監(jiān)測[12]。</p><p>  這些測量方法都在一定程度上實現(xiàn)了對疲勞特征的跟蹤和監(jiān)測,但是這些檢測方要么實時性不高,要么精度不高,經(jīng)常出現(xiàn)誤報警現(xiàn)象。其實當人疲勞時,面部的疲勞特征是十分明顯的,若是能對面部特征進行監(jiān)測,則可以很好地對疲勞進行

34、監(jiān)控。</p><p>  近些年計算機技術(shù)的發(fā)展給人臉識別提供了可能。人臉識別研究引起了學(xué)術(shù)界越來越多的關(guān)注。主要的研究方向有以下幾點[13]:</p><p>  (1)膚色區(qū)域分割與人臉驗證方法。通常情況下,我們對于彩色圖像的圖像處理,首先是在確定膚色模型之后,對膚色進行膚色像素檢測;然后在檢測出膚色像素后,按照膚色像素在空間上的相關(guān)性和色度上的相似性上,分割出可能存在的人臉區(qū)域,然

35、后根據(jù)被測區(qū)域的灰度、幾何特征等參數(shù),對是否是人臉進行判斷,以區(qū)分具有類似膚色的其他物體。</p><p>  (2)基于人工神經(jīng)網(wǎng)的方法。人工神經(jīng)網(wǎng)方法主要是通過神經(jīng)網(wǎng)的結(jié)構(gòu)和參數(shù)來表示模型的統(tǒng)計特征,由于人臉的外部輪廓較為復(fù)雜,無法用數(shù)學(xué)模型進行描述,所以基于人工神經(jīng)網(wǎng)的方法在人臉特征識別中具有獨特的優(yōu)勢。</p><p>  (3)基于啟發(fā)式模型的方法?;趩l(fā)式模型的方法主要是通過

36、抽取灰度、紋理、幾何形狀等特征進行檢測,以判斷其是否符合人臉特征。由于</p><p>  人臉區(qū)域內(nèi)的各個器官具有較為恒定的模式,因此對雙眼、鼻子、嘴等局部特征進行檢測,然后根據(jù)人體五官的相對位置關(guān)系判斷被測物體是否為人臉。對于較強約束條件下的人臉檢測,利用人臉的輪廓、對稱性等少量特征的方法比較適用。</p><p>  人臉因人而異,絕無相同。雖然在表情、年齡或發(fā)型等發(fā)生一些變化的情況

37、下,人類仍可以毫不困難地確定出一個人的身份,但要建立一個能夠完全自動進行人臉識別的系統(tǒng)卻是非常困難的。它涉及到模式識別、圖像處理、計算機視覺、生理學(xué)、心理學(xué)以及認知科學(xué)等方面的諸多知識,并與基于其他生物特征的身份鑒別方法以及計算機人機感知交互領(lǐng)域都有密切聯(lián)系。20世紀90年代以來,隨著安全領(lǐng)域各種應(yīng)用需求的增加,人臉識別技術(shù)成為一個熱門的研究課題。雖然已經(jīng)取得了一些可喜的成果,但在實際應(yīng)用中仍面臨著許多嚴峻的問題。人臉的表情、姿態(tài)、發(fā)型

38、以及化妝等多種影響因素都給識別帶來了困難。要讓計算機像人一樣準確地識別出不同的人臉,尚需不同研究領(lǐng)域的研究人員共同不懈的努力。人臉識別(Face Recognition)一般可描述為[14]:對給定的靜止圖像或動態(tài)視頻,利用己有的人臉數(shù)據(jù)庫來確認圖像中的一個或多個人。從廣義上講,其研究內(nèi)容包括以下五個方面:</p><p>  (1)人臉檢測(Face Detection) 即從各種不同的場景中檢測出人臉的存&

39、lt;/p><p>  在并確定其位置。這一任務(wù)主要受光照、噪聲、頭部傾斜度以及各種遮擋的影響。</p><p>  (2)人臉描述(Face Representation) 即采用某種方式表示檢測出的人臉和數(shù)據(jù)庫中的人臉。通常的表示方法包括幾何特征(如歐氏距離、曲率、角度等)、代數(shù)特征(如矩陣特征矢量)、固定特征模板、特征臉、云紋圖等。</p><p>  (3)人

40、臉鑒別(Face Identification) 即透常所說的人臉識別,就是將待識別的人臉與數(shù)據(jù)庫中的己知入臉比較,得出相關(guān)信息。這一過程的核心是選擇適當?shù)娜四槺硎痉绞脚c匹配策略。</p><p>  (4)表情分析(Facial Expression Analysis) 即對待識別人臉的表情進行分析,并對其加以分類。</p><p>  (5)物理分類(Physical Classi

41、fication) 即對待識別人臉的物理特征進行分類,得出其年齡、性別、種族等相關(guān)信息。</p><p>  一般的人臉識別系統(tǒng)構(gòu)成,包括人臉檢測、人臉預(yù)處理、特征提取、人臉特征庫、相似性匹配、結(jié)果輸出等部分。目前,國外大學(xué)和研究機構(gòu)已研制出一些較好的人臉識別系統(tǒng)。一些較成熟的商業(yè)人臉識別系統(tǒng),如德國的Cognitee,美國的Eyematie,Indentix等也已投入應(yīng)用。對一些安全性要求很高的應(yīng)用,可采用多

42、生物特征融合的識別技術(shù)[15],如DCSAG公司的BioID系統(tǒng),通過數(shù)字攝像頭和麥克風,采集一個人的面貌、聲音以及嘴唇運動等三種生物特征,通過生物特征融合技術(shù),在一秒鐘內(nèi)快速完成身份識別。另外,由美國首先發(fā)起[16]的FERET(Face Recongnition Technology)和FRVT(Face Recognition Vendor Test)人臉識別測試活動也大大推動了人臉識別技術(shù)的研究和應(yīng)用。</p>&

43、lt;p>  我國在國家自然科學(xué)基金和863計劃等資助下,清華大學(xué)、哈工大、中科院、南京理工大學(xué),上海交大等很多單位展開了人臉識別技術(shù)的研究[17]。北京工業(yè)大學(xué)(信號與信息處理研究室)也在人臉檢測方面取得了較好的研究成果和澳大利亞的新南威爾士大學(xué)聯(lián)合提出的人臉檢測技術(shù)已經(jīng)被國際MPEG-7接受作為標準。為了推動人臉識別研究的發(fā)展,國內(nèi)已舉行過四屆生物識別學(xué)術(shù)會議,中國科學(xué)院自動化研究所也發(fā)起成立了中國生物認證產(chǎn)業(yè)聯(lián)盟。據(jù)國際生物

44、識別產(chǎn)業(yè)協(xié)會估計,我國生物識別技術(shù)的軟件和硬件市場,有望在10年內(nèi)達到每年20億美元的規(guī)模。但是,目前國內(nèi)的研究水平仍低于國際水平,許多核心技術(shù)被國外大公司掌握。因此,研究開發(fā)具有自主知識產(chǎn)權(quán)的人臉識別技術(shù)是一個新的挑戰(zhàn)。</p><p>  研究最多的是關(guān)于人臉正面模式的研究[18],主要可以分為三個發(fā)展階段:第一階段是對人臉識別所需要的面部特征進行研究。這個階段主要是將一個簡單命令語句與數(shù)據(jù)庫中某一張臉聯(lián)系在

45、一起,并采用與指紋分析技術(shù)相結(jié)合的方法,由被測實驗來看取得了較好的識別效果。但是為了提高臉部識別率,操作人員的操作貫穿于整個識別過程,而并未采用自動識別系統(tǒng)進行操作。第二階段是人機交互式識別階段??蒲腥藛T在這一階段對人臉正面圖像主要采用幾何特征參數(shù)來表示,并且將人臉面部特征采用特征矢量來表示,而且針對這種特征表示方法,設(shè)計了相應(yīng)的識別系統(tǒng)。不過這個階段仍然需要利用操作員的某些經(jīng)驗知識,還是需要工作人員的參與。第三階段是自動識別階段,近幾

46、年的人臉模式識別方法,隨著計算機計算速度的加快,有了較大的突破,幾種全自動機器識別系統(tǒng)已經(jīng)被應(yīng)用。</p><p>  根據(jù)人臉表征方式的不同,可以分三種人臉自動識別方法,即基于連接機制的識別方法、基于幾何特征的識別方法和基于代數(shù)特征的識別方法。早在80年代,我國就已經(jīng)著手于人臉自動識別的研究。我國許多研究機構(gòu)、大專院校已經(jīng)在圖像處理和模態(tài)分析等方面都取得了較多的研究成果,對包括人臉識別在內(nèi)的人體生物特征識別技術(shù)

47、的基礎(chǔ)研究和應(yīng)用開發(fā)工作進行了大量的研究。</p><p>  1.3 本文主要研究內(nèi)容</p><p>  本文的主要研究內(nèi)容是基于人臉識別的疲勞駕車檢測,首先要分析人臉上各器官與疲勞駕駛有關(guān)的特征,然后設(shè)計一種有效的疲勞分析方法,最后應(yīng)用ASM模型設(shè)計對人臉進行識別的方法。</p><p>  第2章 疲勞分析和疲勞檢測</p><p&g

48、t;  2.1 疲勞駕駛特征綜述 </p><p>  所謂駕駛疲勞是指駕駛員在作業(yè)或行車中,由于駕駛車輛的動作反復(fù)連續(xù)且重復(fù)的次數(shù)太多,使其生理上和心理上發(fā)生某種變化,在客觀上出現(xiàn)駕駛機能低落的現(xiàn)象[19]。一般認為駕駛疲勞是同時涉及腦力和體力的技術(shù)性疲勞。由于駕駛員動作反復(fù)、連續(xù),且重復(fù)的次數(shù)太多,使其生理上、心理上發(fā)生某種變化,在客觀上出現(xiàn)駕駛機能低落的現(xiàn)象。疲勞的表現(xiàn)可分為身體癥狀、精神癥狀和神經(jīng)癥狀。

49、身體癥狀表現(xiàn)在身體有倦怠、沉重、硬板的感覺,下車后彎腰感到困難,以及周身疼痛、手腳和小腿發(fā)脹等;精神癥狀表現(xiàn)為思考不周全、記憶力減退、精神渙散、焦慮、急躁等;神經(jīng)癥狀主要表現(xiàn)在動作失調(diào)、臉部的其它肌肉顫動、手腳發(fā)抖、精神不振等。</p><p>  駕駛員在駕駛過程中,頻繁發(fā)生信息接收與處理的過程中產(chǎn)生了駕駛疲勞,使駕駛員工作能力下降、生理和心理發(fā)生變化、出現(xiàn)疲勞感。目前在機器視覺領(lǐng)域,駕駛員的疲勞狀態(tài)可通過面部

50、視覺圖像進行判斷,在疲勞時駕駛員眼睛部位的形狀將會發(fā)生明顯的變化。這些特征是明顯的,也是可以被檢測到的,駕駛員精力充沛時,眼睛睜開;進入輕度疲勞時,眼睛睜開變??;特別疲勞以至于睡眠時,眼睛經(jīng)常會出現(xiàn)完全合上的狀況。通過圖像處理與模式識別算法識別和判斷上述駕駛員的行為和狀態(tài),并對駕駛員疲勞違章駕駛行為和狀態(tài)發(fā)出報警信號,從而提醒駕駛員注意駕駛安全。駕駛員頻繁地處于打哈欠狀態(tài)時,很可能處于疲勞駕駛狀態(tài)。駕駛員長時間地處于說話張嘴狀態(tài),很可能

51、與他人說話或者打手機通話,這都會導(dǎo)致駕駛精神分散。這兩種駕駛員狀態(tài)很容易導(dǎo)致交通事故。僅僅依靠眼睛部位的信息,容易產(chǎn)生誤報警。因為不同的人眼的全睜開的面積是不一樣的,例如,對于眼睛比較小的或者眼睛處于半睜半閉狀態(tài)時,單純用眼睛信息就會比較困難,進而會產(chǎn)生誤報警或漏報警。但在加入嘴部信息后,綜合利用嘴部和眼睛信息來計算疲勞程度可以更加準確地獲取疲勞信息。</p><p>  所以在本文中將會從眼睛和嘴部這兩個人臉中

52、比較容易檢測到器官進行疲勞特征的分析,疲勞判定研究,但是在最后還會進行兩種疲勞檢測方法的綜合。</p><p>  2.2 具體特征分析</p><p>  2.2.1 疲勞駕駛眼部特征分析</p><p>  為眼睛閉合與事故發(fā)生的是時間關(guān)系,由此可見,眼睛閉合時間在事故前比事故后要長,眼睛閉合時間的長短與疲勞程度有密切的關(guān)系,駕駛員眼睛閉合的時間越長,疲勞程

53、度越嚴重。因此通過測量眼睛閉合時間的長短就能夠確定疲勞駕駛的程度。 </p><p>  圖2-1 眼睛閉合時間與事故發(fā)生前后的時間關(guān)系</p><p>  測量在一定的時間內(nèi)眼睛閉合時間所占的比例。根據(jù)眼睛閉合時間的長短與疲勞程度之間有著密切關(guān)系,駕駛員眼睛閉合的時間越長,疲勞程度越嚴重的現(xiàn)象。現(xiàn)在給出下列定義[23]:</p><p>  P70: 指眼瞼遮住瞳

54、孔的面積超過70%就計為眼睛閉合,統(tǒng)計在一定時間內(nèi)眼睛閉合時所占的時間比例。</p><p>  P80: 指眼瞼遮住瞳孔的面積超過80%就計為眼睛閉合,統(tǒng)計在一定時間內(nèi)眼睛閉合時所占的時間比例。</p><p>  EM: 指眼瞼遮住瞳孔的面積超過一半就計為眼睛閉合,統(tǒng)計在一定時間內(nèi)眼睛閉合時所占的時間比例。</p><p>  美國國家公路交通安全局對該方法作了

55、實驗,實驗結(jié)果表明該方法中的P80與疲勞發(fā)展程度的相關(guān)性較好,其他研究人員也得出了類似的結(jié)論。P80的測量方法:用攝像機獲取駕駛員的臉部圖像,通過圖像處理得眼睛圖像,經(jīng)過眼睛狀態(tài)識別確定眼睛是睜開還是閉合的;定義眼瞼遮住瞳孔的面積超過80%就計為眼睛閉合,但是在實際中瞳孔的閉合程度不容易測量,可行的簡化方法是計算眼睛的閉合百分比。</p><p><b>  的計算公式如下:</b><

56、/p><p><b>  (2-1)</b></p><p>  式中 ——當前的人眼睜開高度:</p><p>  ——人眼睜開最大高度,</p><p>  對于人眼睜開時的大小的定義是存在難度的,因為這個數(shù)據(jù)是因人而異的,經(jīng)過統(tǒng)計可以得到一個估值,雖然不可能對每一個人都適用,但是仍然是有一定的使用度的。亞洲人人眼睜開

57、時的平均高度為7.5 mm[21]。又由于亞洲人的平均瞳孔直徑是2.5~4 mm,按照P80的標準來計算,當瞳孔遮蔽為80%時,就認為人眼閉合,那么計算出來的閉合度為89.3%~93.3%,所以取89%,當閉合百分比大于89%時就認為眼睛處于閉合狀態(tài)。</p><p>  然后對一個測量周期進行分析,選擇5s為一個測量周期,每秒的監(jiān)視頻率為12幀,也就是一個測量周期會選取60張圖片。 </p>&l

58、t;p>  統(tǒng)計在一定時間內(nèi)眼睛閉合時所占的時間比例。P80大于0.4,也就是一個測量周期中有超過20張圖片被判定為閉合狀態(tài)時,則認為駕駛員處于疲勞狀態(tài);當P80處在0.1和0.4之間時,判定為精神不飽滿狀態(tài);當P80處在0.1以下時,判定其為精神飽滿狀態(tài)。 </p><p>  2.2.2 疲勞駕駛嘴的特征分析</p><p>  駕

59、駛員頻繁地處于打哈欠狀態(tài)時,很可能處于疲勞駕駛狀態(tài)。駕駛員長時間地處于說話張嘴狀態(tài),很可能與他人說話或者打手機通話,這都會導(dǎo)致駕駛精神分散,使反應(yīng)速度降低。這兩種駕駛員狀態(tài)都很容易導(dǎo)致交通事故通過實時監(jiān)測駕駛員嘴部的運動狀態(tài),可以識別駕駛員的以上兩種狀態(tài),而這兩種狀態(tài)就可以作為判斷駕駛員是否處于疲勞狀態(tài)的一個依據(jù)。</p><p>  我們知道每一幀圖像駕駛員嘴部的狀態(tài),即嘴閉合、普通張嘴(說話)和張大嘴(打哈欠

60、)。疲勞駕駛狀態(tài)和駕駛精神分散狀態(tài)是一個連續(xù)累積的過程,因此不能只根據(jù)當前一幀駕駛員嘴部的狀態(tài)來判斷駕駛員的狀態(tài),這是因為人不說話時,偶爾也會張開嘴,而且人在說話時嘴也是時張時閉。為了減少駕駛員狀態(tài)報警的誤警率,提高系統(tǒng)撒警的準確性,需要根據(jù)駕駛員嘴部狀態(tài)的連續(xù)時問系列數(shù)據(jù)統(tǒng)訓(xùn)規(guī)律統(tǒng)訓(xùn)決定駕駛員的狀態(tài)。</p><p>  如果用“0”表示嘴閉合狀態(tài),用“1”表示普通張嘴狀態(tài),用“2”表示張大嘴狀態(tài)。那么駕駛員嘴

61、部狀態(tài)就是由“0”、“1”、“2”組成的一個時間狀態(tài)系列。本文將根據(jù)這時間狀態(tài)系列來判斷駕駛員的狀態(tài)。</p><p>  駕駛員在正常駕駛過程中,其嘴基本上處于閉合狀態(tài)。當駕駛員處于打哈欠狀態(tài)時,其嘴張開很大。資料表明,人在打哈欠時張大嘴的平均時間至少持續(xù)5秒以上。根據(jù)這一原則,以5秒作為計算周期,系統(tǒng)監(jiān)測頻率為12幀/秒。如果5秒內(nèi)統(tǒng)計駕駛員嘴部連續(xù)處于張大嘴狀態(tài),即60幀中駕駛員嘴部狀態(tài)在狀態(tài)時間系中“2”

62、連續(xù)且其次數(shù)超過60次,則可以判斷駕駛員處于打哈欠的疲勞狀態(tài),檢測系統(tǒng)給予疲勞駕駛警告信號。</p><p>  嘴部區(qū)域的形狀可以由上下嘴唇的形狀來表示。如圖2-3所示,本文選取如下各個嘴部區(qū)域特征點:A點為嘴部圖像右嘴角點,B為嘴部圖像左嘴角點,C點為嘴部圖像上嘴唇中心最上點,D點為嘴部圖像下嘴唇中心最下點,我們定義如下幾個嘴部區(qū)域的幾何特征值:</p><p>  圖2-3 人嘴形

63、狀</p><p>  (1)嘴部區(qū)域的最大寬度</p><p>  嘴部圖像右嘴角點A到左嘴角點B的距離,即線段AB的長度。</p><p><b>  (2-2)</b></p><p>  (2)嘴部區(qū)域的最大高度</p><p>  嘴部圖像上嘴唇中心最上點C到下嘴唇中心最下點D的距離,即

64、線段CD的長度。</p><p><b>  (2-3)</b></p><p>  針對不同的人嘴圖像,根據(jù)該方法通過大量實驗得出表2-1[22]所示數(shù)據(jù)。由表可知嘴閉合狀態(tài)下,與之比約為4:2,普通張嘴狀態(tài)下,與之比約為4:3,張大嘴狀態(tài)下,與之比約為4:4。實際應(yīng)用時,可根據(jù)這三者之間比值的情況來確定駕駛員嘴唇狀態(tài)[21]。</p><p&g

65、t;  表2-1 人嘴圖像和的對應(yīng)關(guān)系</p><p>  2.2.3 原始數(shù)據(jù)的獲取</p><p>  應(yīng)用這種方法進行疲勞檢測時,只能對固定的距離分析,雖然這個距離是因車和攝像頭的安裝而異的,但是對于某一輛車而言,車輛駕駛中駕駛員和攝像頭的距離是相對固定的,所以原始數(shù)據(jù)的獲取方法,也就是駕駛員的眼睛正常睜開的高度的測量和駕駛員的嘴的各個參數(shù)的測量都可以通過定制的方式獲得。</

66、p><p>  駕駛員在第一次使用這個系統(tǒng)時,選取該系統(tǒng)的原始數(shù)據(jù)采集選項,然后在精神飽滿的狀態(tài)下出現(xiàn)在攝像頭之前一段時間,然后系統(tǒng)會記錄下該駕駛員的特征,比如該駕駛員的眼睛正常睜開時的高度是多少,該駕駛員的嘴的寬度,嘴在閉合時嘴唇的寬度等信息,并以此為標準對今后該駕駛員進行檢測。</p><p>  特別要注意的是,在啟動原始數(shù)據(jù)采集收集選項時,駕駛員一定要確保當前的精神狀態(tài)良好,因為原始數(shù)

67、據(jù)的采集對于精確度地保證是至關(guān)重要的,后面的疲勞分析就是依據(jù)這個數(shù)據(jù)進行的,只有保證該數(shù)據(jù)的準確性才能更好的提高整個系統(tǒng)的精度。</p><p>  但是當駕駛員沒有時間進行原始數(shù)據(jù)的采集或不能保證當前駕駛狀態(tài)時,啟動陌生人駕駛模式。由于人臉上的各器官在放縮中是成比例,則有:</p><p><b>  (2-4)</b></p><p>  

68、式中 ——人眼的真實張開高度;</p><p><b>  ——兩眼真實距離;</b></p><p>  ——人眼在圖片中張開高度;</p><p>  ——兩眼在圖片中的距離,</p><p><b>  所以有:</b></p><p><b>  (2-5

69、)</b></p><p>  給定亞洲人平均兩眼間的距離為3.233 cm,而和均可測,就可以算出,結(jié)合人眼張開高度7.5 mm,可以計算出人眼的閉合程度,但是這種方法由于用到了比例近似和人面部特征估計,所以并不精確,只能用在緊急情況下作為應(yīng)急策略。</p><p>  2.3 眼睛和嘴特征的綜合分析</p><p>  眼睛和嘴唇都包含著駕駛員是否

70、疲勞的信息,本系統(tǒng)綜合檢測兩者的狀態(tài)作出疲勞狀態(tài)判斷,并將二者信息進行綜合分析,從而為得出最終結(jié)論提供依據(jù)。</p><p>  表2-2 疲勞狀志判定規(guī)則表</p><p>  表2-2所示的疲勞判定規(guī)則是統(tǒng)計大量的實驗數(shù)據(jù)[23]得到的。顯然,當駕駛員長時間閉眼而嘴唇閉合時,系統(tǒng)需要判定駕駛員為疲勞狀態(tài);或者當駕駛員眼睛保持睜開而嘴巴長時間張開時系統(tǒng)也需要作出疲勞判斷。而當眼睛和嘴唇狀

71、態(tài)處于睜開和閉合的中間狀態(tài)時,單純地依靠眼睛或者嘴唇信息去判斷駕駛員的狀態(tài),就容易出現(xiàn)問題。這就需要綜合眼睛閉合度和嘴唇張開信息,建立一個合理的規(guī)則共同決定駕駛員狀態(tài),而表2-2正好解決了這個問題,通過疲勞特征的綜合分析,檢測準確度顯著提高。</p><p><b>  2.4 本章小結(jié)</b></p><p>  本章主要是進行疲勞特征的分析,在本章中介紹了人臉的

72、兩個可以用于疲勞分析的器官,即眼睛和嘴巴,并分別對其與疲勞駕駛有關(guān)系的疲勞特征進行了分析,還討論了原始數(shù)據(jù)在現(xiàn)實中的獲取方法,以方便準確地得駕駛員的人臉器官特征,在最后還進行了疲勞的綜合分析。</p><p>  第3章 ASM人臉識別算法</p><p>  3.1 ASM模型的定義</p><p>  主動形狀模型(ASM)是一種物體形狀描述技術(shù),最早Coo

73、tes[24,25,26,27]等人提出的。它的基本思想是選取一組訓(xùn)練樣本,用一組特征點來描述樣本的形狀,然后對各樣本的形狀進行配準(使得形狀盡可能地相似),對這些配準后的形狀向量利用主分量分析方法進行統(tǒng)計建模得到物體形狀的統(tǒng)計學(xué)描述,最后利用建立的模型在新的圖像中搜索物體輪廓,從而定位出目標物體。</p><p>  3.2 ASM人臉識別的優(yōu)勢</p><p>  3.2.1 AS

74、M搜索算法的特點</p><p>  主動統(tǒng)計對象模型通過訓(xùn)練的方法得到對象的統(tǒng)計知識,從而建立對象的統(tǒng)計模型。統(tǒng)計對象模型的優(yōu)點在于能夠?qū)Ω鞣N形狀的對象進行建模,因為關(guān)于對象的知識可以從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)得到,所以它非常適合于形狀復(fù)雜的對象分割。訓(xùn)練過程需要手工標定對象的形狀,這雖然比較耗時費力,然而它卻能夠?qū)Ω鞣N形狀進行建模,特別是不規(guī)則的形狀(如鼻子、眉毛等)。因此人臉定位主要采用主動統(tǒng)計對象模型。主動統(tǒng)計對象

75、模型和變形模板的主要區(qū)別在于統(tǒng)計模型中的各個參數(shù)是從數(shù)據(jù)中學(xué)習(xí)而來,是統(tǒng)計參數(shù),參數(shù)之間的相互關(guān)系明確,而變形模板中的參數(shù)是人為設(shè)計的,參數(shù)之間的關(guān)系不明確,在設(shè)計能量函數(shù)的時候如何對它們進行權(quán)衡是非常困難的事情。同時,主動統(tǒng)計對象模型的匹配過程也通過統(tǒng)計學(xué)習(xí)得到,它往往沒有明確的能量函數(shù)。ASM模型是典型的自頂向下圖像理解的策略,它用全局的模型在圖像解釋的過程中去約束指導(dǎo)我們。而僅用內(nèi)力的Snake方法是數(shù)據(jù)驅(qū)動的或自下向上的策略,從

76、低層次的圖像的梯度紋理等信息出發(fā),通過啟發(fā)式的局部信息的合成來辨認感興趣的目標區(qū)域,這是很困難的。主動統(tǒng)計對象模型有優(yōu)秀的性質(zhì),這種方法的優(yōu)點主要體現(xiàn)在[28]:</p><p>  其具有廣泛的適用性,同一套算法可以被應(yīng)用于許多不同的問題,區(qū)別僅僅在于提供不同的訓(xùn)練集;模型給出了一個簡潔的表達方式,它允許一定范圍內(nèi)的變化,但是有足夠的能力排除訓(xùn)練集得到的變化范圍以外的任何變化;除了從訓(xùn)練集學(xué)習(xí)到的特征,系統(tǒng)不需

77、要標定的對象特征的其他任何先驗假設(shè),比如模型中不需要類似邊界光滑度的一些參數(shù)。ASM模型主要包括兩部分:模型的建立和目標搜索,下面將詳細介紹。</p><p>  由于是基于統(tǒng)計的模型,所以在進行處理之前要先在程序中預(yù)存一些訓(xùn)練圖片,這些訓(xùn)練圖片要進行標定特征點,勾勒出其所要識別器官的輪廓,這一步很重要,所以訓(xùn)練圖片越多,特征點選取越多,特征點選取的越精確,最后的識別精度也就越高,但是要注意,所選的特征點不能過多

78、,否則會使計算強度過大,使計算速度減慢,從而無法實現(xiàn)動態(tài)識別。</p><p>  為擬合出人臉輪廓,首先在平均模板基礎(chǔ)上生成一個初始形狀估計,然后根據(jù)一定的搜索策略調(diào)整標記點位置,讓初始形狀在待識別的圖像不斷地變形,直至收斂,最終擬合出人臉的輪廓。初始形狀估計和搜索策略的選擇對算法的搜索效率至關(guān)重要。</p><p>  3.2.2 幾種識別方式對比分析</p><

79、p>  在第一章中介紹了人臉識別的三種主要研究方向,現(xiàn)進行對比分析,見表3-1[29]:</p><p>  表3-1 識別方式特點比較</p><p>  由表可以看出,在對實時性要求比較高的駕駛疲勞檢測中,基于啟發(fā)式的模型方法是有優(yōu)勢的,而ASM模型這是基于這一思路的,也是對灰度和紋理特點進行分析,所以該模型是合適的。</p><p>  與現(xiàn)在比較流行的

80、Adaboost人臉檢測方法進行比較,ASM模型在反應(yīng)速度上和精度上都都較易達到較高要求。</p><p>  3.3 ASM的模型建立</p><p>  ASM中的一個核心部分是用統(tǒng)計的方法建立所考察對象的形狀模型。通常用一系列的坐標點來定義某類目標的形狀。這樣的定義方法是可以推廣的,例如可以用點的2-D坐標,也可以用其3-D坐標,還可以加上時間軸的坐標等。</p>&

81、lt;p>  通常在2-D圖像中,假定目標的形狀可以用一系列(手工標定的)點的坐標來表示,即</p><p>  (3-1) </p><p>  為了建立統(tǒng)計模型,需要有大量的類似數(shù)據(jù)作訓(xùn)練樣本。同樣在這些訓(xùn)練標本上需要仔細地標定好上述用來表征目標形狀的點,這些點的選取精度和樣本的豐富性直接影響所建立的形狀模型的應(yīng)用性能。同時還應(yīng)注意到,在對上

82、述樣本作統(tǒng)計分析之前,必須保證這些點在同一個參考幀坐標系下,即需要做一個樣本標準化的過程。標準化是為了保證所有樣本具有相同的尺度意義、相同的旋轉(zhuǎn)方向,并去除掉簡單的剛性變化的影響,使模型能一致地對感興趣的特征進行建模。標準化過程通常是經(jīng)過一個簡單的迭代過程來實現(xiàn)的,這個過程可用以下流程描述[30]:(原點,,形狀標準化配準)</p><p>  (1)將每個樣本位移到它的中心處。</p><p

83、>  (2)選取某個樣本作為初始的平均形狀的估計值,它的尺度設(shè)成,并將該初始估值設(shè)為默認的參考幀。</p><p>  (3)將所有的樣本向當前的平均形狀作對齊(向量,與向量對齊,即將進行面內(nèi)旋轉(zhuǎn)、坐標平移、尺度縮放得到,定義距離,并使其最小)。</p><p>  (4)重新計算新的樣本平均值。</p><p>  (5)將新的平均值按照默認的參考幀標準化。

84、</p><p>  (6)如果新的平均變化小于某個閾值,認為收斂,否則跳轉(zhuǎn)到步驟(3)繼續(xù)迭代直至收斂。</p><p>  得到調(diào)整好的訓(xùn)練樣本后,就可以對訓(xùn)練集統(tǒng)計分析與建模,所得到的樣本集可看作是一堆點的集合。現(xiàn)在的任務(wù)是尋找這樣一個參數(shù)模型,其中是模型的參數(shù)向量。如果給一個參數(shù),應(yīng)能用該模型生成一個,并且這樣的是有意義的。如果還能進一步的到模型的參數(shù)分布,用該模型解出適當?shù)膮?shù),

85、進而完成對原始圖像的解釋。</p><p>  圖3-1 形狀對齊過程 </p><p>  下面是利用利用PCA方法進行形狀模型建模的流程:</p><p>  (1)計算樣本的均值。</p><p>  (3-2) </p><p>

86、;  (2)計算樣本的協(xié)方差矩陣。</p><p><b>  (3-3)</b></p><p>  (3)計算協(xié)方差矩陣的特征值,并按特征值從大到小排序,即大的在最前面,小的在最后面,為對應(yīng)的特征向量。</p><p>  (4)令,,在主要分析中,將特征向量稱為這組數(shù)據(jù)的主要成分,稱為這組數(shù)據(jù)的主要成分矩陣。如上建立的模型可以表示成:&l

87、t;/p><p><b>  (3-4)</b></p><p>  對于任何一個形狀向量都可由參數(shù)確定,即</p><p><b>  (3-5)</b></p><p>  向量即是所得到的模型參數(shù),通過變化參數(shù),可以變化形狀向量以得到期望的結(jié)果。</p><p>  通常假

88、定參數(shù)的分布是獨立同分布的且都是高斯分布的,則每一個參數(shù)則都滿足如下分布:</p><p><b>  (3-6)</b></p><p>  為了從參數(shù)得到有效的形狀,應(yīng)對參數(shù)作如下的限制:</p><p><b>  (3-7)</b></p><p><b>  亦即</b&g

89、t;</p><p><b>  (3-8)</b></p><p>  更簡單的形式是參數(shù)滿足:</p><p><b>  (3-9)</b></p><p>  上式表明每一個特征值實際上在假設(shè)參數(shù)是獨立同分布的高斯分布時是參數(shù)的方差。為了保證模型生成的例子同原來的訓(xùn)練樣本一致,上面的約束條件

90、是必要的。</p><p>  3.4 ASM模型的搜索算法</p><p>  主動形狀模型的搜索過程是一個啟發(fā)的迭代搜索,其過程如下:</p><p>  (1)由模板的形狀系數(shù)和式(3-4)重構(gòu)出歸一化的形狀,再由幾何變換參數(shù)生成當前的特征點集。</p><p>  (2)如圖3-1所示,對特征點集中的每一個點,根據(jù)局部特征模型沿著發(fā)

91、現(xiàn)方向在一定范圍內(nèi)尋找最佳的匹配點,這些最佳匹配點的集合就是更新后的特征點集。搜索的步長和采樣間距相同。</p><p>  (3)把更新后的特征點集與基準特征集合對齊,得到新的集合參數(shù)和,使用式(3-5)可以得到形狀系數(shù)。</p><p>  圖3-2 ASM搜索示意圖</p><p>  (4)使用先驗?zāi)P图s束更新后的形狀。</p><p&g

92、t;<b>  (5)循環(huán)至收斂。</b></p><p>  在主動形狀模型算法中,如果特征點搜索的最佳匹配點和當前點的距離不大于采樣間距時,認為這個點是收斂的。當收斂的特征點數(shù)目達到總數(shù)的</p><p>  圖3-3 目標搜索策略</p><p>  90%時,認為整個算法收斂。</p><p>  在求局部紋理模

93、型時個點的灰度表達式:</p><p><b>  (3-10)</b></p><p><b>  灰度梯度表達式:</b></p><p><b>  (3-11)</b></p><p><b>  灰度值標準化:</b></p>&l

94、t;p><b>  (3-12)</b></p><p>  標準灰度梯度的均值:</p><p><b>  (3-13)</b></p><p>  N幅圖標準灰度的協(xié)方差:</p><p><b>  (3-14)</b></p><p>&

95、lt;b>  馬氏距離求法:</b></p><p><b>  (3-15)</b></p><p>  在擬合算法中,標記點采用不同的搜索策略,得到的搜索結(jié)果也不同。</p><p>  在此,采用三種常用的搜索策略[31]:</p><p>  (1)基于像素鄰域最大梯度值的搜索策略 計算圖像梯

96、度場,在當前形狀模型的每個標記點的一個7×7的鄰域內(nèi),取梯度值最大的點作為當前標記點的替代點。采用這種搜索策略,算法速度快,效率也比較高,大體上可以定位出輪廓的,但是標記點的變化沒有方向性,容易受到其它邊緣的干擾,比如衣領(lǐng),耳朵等。</p><p>  (2)基于輪廓曲線法線方向的搜索策略 沿著當前形狀曲線的法線所在直線上,以標記點為中心在順著發(fā)現(xiàn)方向和逆著發(fā)現(xiàn)方向各取3個像素,選擇的梯度值最大的點為

97、當前標記點的替代點。針對不同的器官,選擇一些關(guān)鍵的標記點,只調(diào)整這些關(guān)鍵標記點,而其它標記點則根據(jù)ASM模型的形狀配準算法來求出。</p><p>  (3)基于方向場的輪廓搜索策略 由于圖像的場具有凸顯圖像凹陷部分的特性,人臉圖像的這種凹陷正好可以勾勒出人臉部分的輪廓。根據(jù)不同器官的輪廓特點,選取了一些的關(guān)鍵標記點。然后沿著當前標記點的向量場方向移動一個像素,在順著該像素的向量場方向移動至下一個像素,如此循環(huán)

98、,直到碰到凹陷的像素點或者移動像素數(shù)達到最大為止,把最后一個像素點作為當前標記點的替代點。而其它非關(guān)鍵標記點的位置則根據(jù)形狀配準算法計算得到。</p><p>  對這三種策略進行了多組比較實驗,發(fā)現(xiàn)有以下問題:第一種搜索方法在搜索時不具備連續(xù)性,時常發(fā)生跳變,對于人臉輪廓的搜索易受衣領(lǐng)等的干擾;第二種方法在對眼睛的搜索和上嘴唇的搜索時表現(xiàn)較好,然而對于鼻子,下嘴唇和輪廓都易于產(chǎn)生跳變,使圖像不連續(xù),對于人臉輪廓

99、的搜索易受衣領(lǐng)等的干擾;第三種方法對于鼻子,下嘴唇和人臉輪廓的搜索上變現(xiàn)出良好的性質(zhì),而且輪廓一般都具有比較好的邊界連續(xù)性。而對于眼睛和上嘴唇的搜索,易于收斂成一個點。</p><p>  在我的畢業(yè)設(shè)計中,我選擇第二種思路,我認為選取幾個重要的特征點,然后再進行收斂,并以這幾個點的收斂效果判斷其收斂是否完成時十分有效的,也是簡便易行的。</p><p>  3.5 流程設(shè)計思路<

100、/p><p>  圖3-4 人臉識別實現(xiàn)流程圖</p><p>  我的設(shè)計思路是建立在對ASM實現(xiàn)的基本步驟的認識的基礎(chǔ)上的,由于ASM人臉識別的實現(xiàn)步驟是特征點的建立、學(xué)習(xí)過程、搜索匹配過程三步,所以在流程中也是要基本上按照這個步驟進行。</p><p>  首先在程序中預(yù)存一些有特點的圖片,對這些圖片進行處理,進行手工描點,同時建立與圖片相對應(yīng)的數(shù)據(jù)存儲文件,然后

101、使用編輯好的matlab程序進行處理,由于ASM模型是基于統(tǒng)計的模型,所以這項工作是十分必要的,經(jīng)過這一步之后,程序也就學(xué)習(xí)了人臉的劇本面部器官特征,然后生成一個大致的人臉模型,再對所要處理的圖片進行大致選擇,之后程序自動對人臉器官進行收斂處理,得出人臉的識別圖,再通過數(shù)據(jù)生成函數(shù)來生成人臉識別模型。</p><p><b>  3.6 本章小結(jié)</b></p><p&

102、gt;  在本章中,主要介紹了ASM模型的特點和優(yōu)勢,進而介紹了ASM模型的算法和搜索過程,比較詳細的說明了ASM的工作原理和工作步驟,并介紹了通過PCA建立ASM統(tǒng)計模型的方法和局部特征模型的收斂方法,這兩個方法是ASM模型的核心算法。還給出了程序設(shè)計的流程圖。ASM模型在本文中充當著橋梁的作用,因為課題是駕駛的疲勞檢測,所以必須要定位和分析出人臉,而ASM模型正是為完成這項任務(wù)為引入的。</p><p>  

103、第4章 圖像處理和識別</p><p>  4.1 圖像預(yù)處理的必要性</p><p>  圖像識別系統(tǒng)的處理流程一般可分為圖像預(yù)處理、特征提取和識別分析三個階段,其中圖像的預(yù)處理階段尤為重要,成功的預(yù)處理可以提高人臉檢測、特征點定位以及識別的成功率,如果這階段處理不好,后面的工作將無法有效展開。所以圖像的預(yù)處理是確保整個系統(tǒng)準確工作的基礎(chǔ),沒有這個可靠的基石就無法順利完成后面龐大的識

104、別過程。</p><p>  在實際應(yīng)用中,預(yù)處理的主要作用有兩方面:其一,由于受噪聲、光照等方面的影響,系統(tǒng)獲取的圖像的質(zhì)量不高,所以需要進行預(yù)處理,以有利于提取大家感興趣的信息。這種情況下,要根據(jù)系統(tǒng)的不足或環(huán)境的影響(如光照),采取有針對性的措施。其二,獲取的圖像信息不符合后續(xù)操作的具體要求,這時也需要對圖像按照一定的要求進行預(yù)處理,例如,尺寸,角度方面的要求??傊?,預(yù)處理是一個承上啟下的過程。需要全面考慮

105、整個系統(tǒng)的性能。</p><p>  圖像預(yù)處理方式的選擇應(yīng)該因地制宜,不同的系統(tǒng)需要根據(jù)自身特點設(shè)計適合的預(yù)處理模塊。如果預(yù)處理功能不能成功達到彌補系統(tǒng)不足的要求,勢必影響整個系統(tǒng)運行的正確率;如果預(yù)處理算法過于繁雜,運算量過大,勢必影響整個系統(tǒng)的實時性,所以預(yù)處理模塊的設(shè)計要兼顧正確性與實時性。在基于嵌入式的人臉識別系統(tǒng)中,由于系統(tǒng)的實時性要求比較高,圖像的預(yù)處理只是系統(tǒng)的一個前期階段,而且ASM算法在建立局

106、部紋理模型時,已經(jīng)考慮到光照的影響,所以在預(yù)處理階段光照補償采用了常用的直方圖均衡化方法。</p><p>  4.2 常用光照預(yù)處理技術(shù)</p><p>  光照問題是圖像處理中比較關(guān)鍵而且難以解決的問題,尤其在入臉識別或檢測系統(tǒng)中,一般的識別或檢測算法是假定待檢測圖像是在均勻光照下獲得的。而實際上受周圍環(huán)境的影響,光照往往不是均勻的,這會導(dǎo)致人臉檢測的正確率大大降低,所以有必要對光照

107、進行補償。</p><p>  光照預(yù)處理的基本思想是:對輸入圖像做各種圖像處理操作或信號變換,將非標準光照情況下的圖像變換為標準光照情況下的圖像,其表達式如下:</p><p>  (4-1) </p><p>  其中是原始圖像,是變換規(guī)則,是經(jīng)過變換后的圖像。變換規(guī)則不同,對應(yīng)著不同的預(yù)處理算法。</

108、p><p>  目前常用的光照預(yù)處理算法有直方圖均衡化、線性變換、對數(shù)變換、指數(shù)變換等[32~36],下面將對這些方法進行詳細介紹。</p><p>  4.2.1 基于直方圖的預(yù)處理方法</p><p>  在圖像處理中,灰度直方圖(圖4-1)是一種函數(shù),它表示圖像中每一灰度級與該灰度級出現(xiàn)的頻率之間的對應(yīng)關(guān)系。假設(shè)一幅數(shù)字化的圖像中總的像素數(shù)目為,某一灰度級為的像

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論