2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩44頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、<p> 本科畢業(yè)設(shè)計(jì)(論文)</p><p><b>  摘要</b></p><p>  近些年由于人們的生活節(jié)奏快,工作壓力大,因疲勞問題而引起的事故時(shí)有發(fā)生,疲勞駕駛而釀成的慘劇更是使我們警鐘長鳴。為了解決這個(gè)問題,本次畢業(yè)設(shè)計(jì)著重討論一種基于ASM模型的人臉識別算法和一種疲勞駕駛的面部特征判定標(biāo)準(zhǔn)。本文的主要內(nèi)容是:</p><

2、p>  首先,簡要介紹此次研究的課題意義,再介紹人臉識別和疲勞檢測的一些相關(guān)的背景知識,由于此次課題是疲勞駕駛的檢測,所以介紹的重點(diǎn)是關(guān)于疲勞駕駛的檢測研究。</p><p>  其次,討論疲勞的判定方法,這一部分主要是對疲勞特征的選擇研究,涉及到人眼睛和嘴的形狀的疲勞特征分析,然后進(jìn)行疲勞分析的綜合。</p><p>  然后,詳細(xì)介紹ASM模型的定義,在這一部分中還介紹了ASM的

3、算法、區(qū)域收斂方法以及判定收斂的依據(jù),另外,在這部分中將給出算法實(shí)現(xiàn)步驟的流程圖。</p><p>  再后,主要內(nèi)容是圖像處理與識別,其中包括圖像的預(yù)處理和手工描點(diǎn)方法所需要確定的參量,以及如何用matlab程序得到這些參量。程序的流程圖也在這一章展示。</p><p>  關(guān)鍵詞 人臉識別;疲勞檢測;疲勞特征;動(dòng)態(tài)形狀模型</p><p><b>  

4、Abstract</b></p><p>  Recently as the fast pace of life and heavy work pressure, accidents caused by fatigue happened frequently. Traffic accident disaster is causing the bells to ring. To solve this p

5、roblem, the graduation project focused on a face recognition algorithm based on ASM model and a facial features determination standards of fatiguedriving. The main contents are:</p><p>  First, there is a br

6、ief introduction of the research, the relevant background knowledge of face recognition and fatigue testing will be given later. as it is the detection of fatiguedriving that we are taking care of, we will mainly focus o

7、n the it.</p><p>  Secondly, we will learn the judging methods of fatigue, the part choice of the fatigue characteristics is studied here, the fatigue characteristics of eyes and mouth is analyzed, then we w

8、ill comprehensively analysis them.</p><p>  Then, the principle and method of ASM person face recognition technology is studied. In this section, we will describe the ASM algorithm, the covergence metho

9、d and the basis of determining convergence.The flow chart of algorithm will also be given flow chart in this part.</p><p>  Finally, we will show picture pre-treatment methods and picture recognition, t

10、his part includes the image pre-processing, the needed parameters and how to use the matlab program to get the parameters. The idea and flow chart of the main program will be given. </p><p>  Keywo

11、rds Face Recognition; Fatigue Detection; Fatigue Characteristics; Active Shape models</p><p><b>  目 錄</b></p><p><b>  摘要I</b></p><p>  AbstractII</p>

12、<p><b>  第1章 緒論1</b></p><p>  1.1 課題背景和意義1</p><p>  1.2 研究現(xiàn)狀3</p><p>  1.3 本文主要研究內(nèi)容6</p><p>  第2章 疲勞分析和疲勞檢測8</p><p>  2.1 疲勞駕

13、駛特征綜述8</p><p>  2.2 具體特征分析9</p><p>  2.2.1 疲勞駕駛眼部特征分析9</p><p>  2.2.2 疲勞駕駛嘴的特征分析10</p><p>  2.2.3 原始數(shù)據(jù)的獲取12</p><p>  2.3 眼睛和嘴特征的綜合分析13</p>

14、<p>  2.4 本章小結(jié)14</p><p>  第3章 ASM人臉識別算法15</p><p>  3.1 ASM模型的定義15</p><p>  3.2 ASM人臉識別的優(yōu)勢15</p><p>  3.2.1 ASM搜索算法的特點(diǎn)15</p><p>  3.2.2 幾種

15、識別方式對比分析16</p><p>  3.3 ASM的模型建立17</p><p>  3.4 ASM模型的搜索算法19</p><p>  3.5 流程設(shè)計(jì)思路22</p><p>  3.6 本章小結(jié)23</p><p>  第4章 圖像處理和識別24</p><p&g

16、t;  4.1 圖像預(yù)處理的必要性24</p><p>  4.2 常用光照預(yù)處理技術(shù)24</p><p>  4.2.1 基于直方圖的預(yù)處理方法25</p><p>  4.2.2 線性變換25</p><p>  4.2.3 對數(shù)變換26</p><p>  4.2.4 指數(shù)變換27<

17、/p><p>  4.2.5 光照預(yù)處理方法選擇27</p><p>  4.3 圖片選取策略28</p><p>  4.4 圖像手工描點(diǎn)的實(shí)現(xiàn)28</p><p>  4.4.1 要確定的要素分析28</p><p>  4.4.2 要素值的確定方法29</p><p>  

18、4.5 選點(diǎn)策略33</p><p>  4.6 程序流程圖33</p><p>  4.7 收斂過程和識別結(jié)果34</p><p>  4.8 本章小結(jié)35</p><p><b>  結(jié)論36</b></p><p><b>  參考文獻(xiàn)37 </b>

19、</p><p><b>  第1章 緒論</b></p><p>  1.1 課題背景和意義</p><p>  駕駛疲勞是指駕駛員由于睡眠不足或長時(shí)間持續(xù)駕駛造成的反應(yīng)能力下降,這種下降表現(xiàn)在駕駛員困倦、打瞌睡、駕駛操作失誤或完全喪失駕駛能力。駕駛疲勞反映在生理與心理兩個(gè)方面,生理反映包括神經(jīng)系統(tǒng)的功能、血液和眼睛的變化;心理反映包括反

20、應(yīng)時(shí)延長、注意力分散、動(dòng)作不協(xié)調(diào)。美國印第安那大學(xué)對交通事故原因的調(diào)查研究發(fā)現(xiàn)85%的事故與駕駛員有關(guān),車輛和環(huán)境因素只占15%[1]。駕駛員在事故發(fā)生前一瞬間的行為和故障直接導(dǎo)致了事故的發(fā)生,這些行為包括知覺的延遲、對環(huán)境的決策錯(cuò)誤、對危險(xiǎn)情況的處理不當(dāng)?shù)?。在所有的駕駛員錯(cuò)誤中,最常見的是知覺延遲和決策錯(cuò)誤,這些錯(cuò)誤會產(chǎn)生注意力不集中、反映遲鈍、操作不當(dāng)?shù)?,產(chǎn)生這些錯(cuò)誤的根本原因就是駕駛疲勞。由于司機(jī)疲勞駕駛導(dǎo)致警惕性水平的下降,從而

21、造成交通事故的增長,這已成為了社會普遍關(guān)注的一個(gè)熱點(diǎn)。如果司機(jī)疲勞駕駛,那么他的觀察、識別和車輛控制能力都會顯著下降,嚴(yán)重威脅自身的安全和其他人的生命。隨著交通運(yùn)輸業(yè)的發(fā)展,交通事故已成為當(dāng)前各國所面臨的嚴(yán)重問題。據(jù)世界衛(wèi)生組織統(tǒng)計(jì),全世界每年有120多萬人死于交通事故,數(shù)百萬人受傷或致殘。全球每年交通事故造成的經(jīng)濟(jì)損失高達(dá)5180</p><p>  近年來,我國惡性道路交通事故呈上升趨勢。我國交通事故死亡人數(shù)

22、己連續(xù)10多年居世界第一。我國因車禍喪生的人數(shù),十幾年間己從每年5萬多人增長到10多萬人,是交通事故死亡人數(shù)居世界第二位國家的兩倍。其中,駕駛員疲勞造成交通事故的占總數(shù)的20%左右,大約占特大交通事故的40%[3]以上。所以進(jìn)行疲勞檢測技術(shù)的研究是十分必要的,且有其深遠(yuǎn)的意義。</p><p>  同樣,在國外情況也差不多。美國國家公路交通安全管理局也就是所謂的NHTSA(NmionMHighway Traffi

23、c Safety Administration,NHTSA) [4]最近幾年的調(diào)查顯示:每年平均有56000起車禍與疲勞駕駛相關(guān)[5],造成76000人受傷,1544人死亡(占交通事故死亡總?cè)藬?shù)的3.7%),調(diào)查還顯示有27%</p><p>  的受訪者表示有過開車打磕睡的經(jīng)歷。2004年美國國家交通安全委員會NTSB(The National Transportation Safety Board,NTSB)

24、檢查了107起由駕駛員造成的卡車交通事故,表明有58%的交通事故與駕駛員疲勞駕駛有關(guān)。美國汽車聯(lián)合會 (American Automobile Association)的交通安全部初步估計(jì)41%~59%的重型卡車交通事故與疲勞駕駛有關(guān)。英國交通研究實(shí)驗(yàn)室認(rèn)為駕駛疲勞導(dǎo)致的路面交通事故大約占全部交駕駛員通事故率的10%。法國國家警察總署事故報(bào)告表明,因疲勞瞌睡而發(fā)生的車禍,占人身傷害事故的14.9%,占死亡事故的20.6%。德國保險(xiǎn)公司協(xié)

25、會估計(jì),在德國境內(nèi)的高速公路上,大約25%導(dǎo)致人員傷亡的交通事故都是由疲勞駕駛引發(fā)。澳大利亞聯(lián)邦議會統(tǒng)計(jì):在2000年,司機(jī)疲勞駕駛造成的交通事故占所有交通事故的20%到30%;專家認(rèn)為這只是保守統(tǒng)計(jì),實(shí)際所占的比例可能更大。日本的事故統(tǒng)計(jì)揭示,因疲勞產(chǎn)生的事故約占1.0%~1.5%[6]。</p><p>  近期關(guān)于疲勞特征,疲勞后的主要現(xiàn)有[7]:</p><p>  反應(yīng)時(shí)間顯著增

26、長,注意力分散,判斷能力下降,主動(dòng)性降低,注意力分配不均衡且轉(zhuǎn)移速度降低,經(jīng)常丟失重要的信息;感覺器官的功能減退或紊亂,如視覺模糊、聽力下降、判斷遲緩;駕駛動(dòng)作不靈活,操作能力下降,節(jié)律失調(diào);記憶和思考能力下降,判斷失誤增多;駕駛員的信心、決心、耐性和自我控制能力減退,缺乏堅(jiān)持不懈的精神,易于激動(dòng)、急躁和開快車;</p><p>  過度疲勞會使駕駛員在行車途中產(chǎn)生困倦,甚至打瞌睡。</p><

27、;p>  駕駛疲勞導(dǎo)致事故的形成過程通常是:大腦供氧不足葉中樞神經(jīng)疲勞感覺下降、知覺遲鈍肌肉收縮的調(diào)節(jié)機(jī)能惡化感覺刺激中斷認(rèn)識遲緩、判斷失誤、操作失誤、打瞌睡等交通事故??梢?,疲勞駕駛會引起大量的交通事故。如果建立一套疲勞檢測系統(tǒng)能夠切實(shí)有效的工作,必定可以大大減少由疲勞駕駛所引起的交通事故,不但能減少人員傷亡,而且能避免因此產(chǎn)生的經(jīng)濟(jì)損失。</p><p>  疲勞是有其可以識別的特征的。由于司機(jī)駕駛疲勞

28、會產(chǎn)生神經(jīng)系統(tǒng)</p><p>  功能、循環(huán)機(jī)能、血液、眼睛、呼吸機(jī)能、體溫等生理變化,這些變化通過駕駛員的自覺癥狀和他覺癥狀反映出來。所以可以通過衡量方向盤的微調(diào),腦波,心率,頭手的位移,眼瞼的閉合程度或眨動(dòng)速率等一些有特異性和可量化的指標(biāo),通過大量實(shí)驗(yàn)確定駕駛疲勞的評價(jià)標(biāo)準(zhǔn),以量化的閾值加以表示,來判斷駕駛員是否已經(jīng)疲勞。</p><p>  可見,疲勞駕駛會引起大量的交通事故。如果

29、建立一套疲勞檢測系統(tǒng)能夠切實(shí)有效的工作,必定可以大大減少由疲勞駕駛所引起的交通事故,不但能減少人員傷亡,而且能避免因此產(chǎn)生的經(jīng)濟(jì)損失。正因如此,研究出一套疲勞檢測的系統(tǒng)是極有現(xiàn)實(shí)意義的。</p><p><b>  1.2 研究現(xiàn)狀</b></p><p>  由于疲勞駕駛導(dǎo)致的車禍數(shù)量的劇增,漸漸引起國內(nèi)外學(xué)者的關(guān)注,各種針對疲勞駕駛檢測科研都在積極進(jìn)行種。<

30、;/p><p>  利用心跳特征制成的心跳速度檢測儀。2002年,日本先鋒公司開發(fā)出防止駕駛員開車打瞌睡的系統(tǒng)。該系統(tǒng)的核心技術(shù)之一是貼在轉(zhuǎn)向盤上的紙狀心跳感應(yīng)器。一般說來,人在打瞌睡之前,心跳速度下降,感應(yīng)器每隔15 s檢測一次駕駛員的心跳速度,一旦確認(rèn)駕駛員有睡意襲來,就通過改變音樂節(jié)奏等方式給以警示[8]。</p><p>  頭部位置檢測儀。該預(yù)警系統(tǒng)由澳大利亞人于2003年設(shè)計(jì)和開發(fā)

31、,主要是通過監(jiān)視駕駛員在行駛過程中頭部的位移情況來判斷其是否在打瞌睡[9]。</p><p>  轉(zhuǎn)向盤監(jiān)測系統(tǒng)1999年,美國Electronic Safety Products公司開發(fā)的轉(zhuǎn)向盤監(jiān)測系統(tǒng)S.A.M(steering atention monitor)是一種檢測轉(zhuǎn)向盤運(yùn)動(dòng)的傳感器裝置,適用于各種車輛[10]。當(dāng)駕駛員疲勞時(shí),反應(yīng)能力變慢,操作轉(zhuǎn)向盤的動(dòng)作也會減緩;當(dāng)系統(tǒng)檢測到轉(zhuǎn)向盤正常運(yùn)動(dòng)時(shí)傳感器

32、裝置不報(bào)警,若轉(zhuǎn)向盤持續(xù)4 s不運(yùn)動(dòng),系統(tǒng)報(bào)警。</p><p>  Driving Research Center研發(fā)的了PERCLOS系,該系統(tǒng)檢測單位時(shí)間內(nèi)眼睛閉合程度超過80%以上的時(shí)間占總時(shí)間的百分比,并與預(yù)先設(shè)定的閾值進(jìn)行比較,從而提醒駕駛員注意行車安全[11]。</p><p>  車道偏離報(bào)警系統(tǒng)DAS2000。當(dāng)駕駛員駕駛疲勞時(shí),往往出現(xiàn)精神萎靡、注意力分散、反應(yīng)遲鈍等現(xiàn)

33、象,且最容易無意識地駛出中線或者偏離車道。2004年,美國Ellison Research Labs實(shí)驗(yàn)室研制的DAS2000型路面警告系統(tǒng),通過車的軌跡對疲勞駕駛進(jìn)行監(jiān)測[12]。</p><p>  這些測量方法都在一定程度上實(shí)現(xiàn)了對疲勞特征的跟蹤和監(jiān)測,但是這些檢測方要么實(shí)時(shí)性不高,要么精度不高,經(jīng)常出現(xiàn)誤報(bào)警現(xiàn)象。其實(shí)當(dāng)人疲勞時(shí),面部的疲勞特征是十分明顯的,若是能對面部特征進(jìn)行監(jiān)測,則可以很好地對疲勞進(jìn)行

34、監(jiān)控。</p><p>  近些年計(jì)算機(jī)技術(shù)的發(fā)展給人臉識別提供了可能。人臉識別研究引起了學(xué)術(shù)界越來越多的關(guān)注。主要的研究方向有以下幾點(diǎn)[13]:</p><p>  (1)膚色區(qū)域分割與人臉驗(yàn)證方法。通常情況下,我們對于彩色圖像的圖像處理,首先是在確定膚色模型之后,對膚色進(jìn)行膚色像素檢測;然后在檢測出膚色像素后,按照膚色像素在空間上的相關(guān)性和色度上的相似性上,分割出可能存在的人臉區(qū)域,然

35、后根據(jù)被測區(qū)域的灰度、幾何特征等參數(shù),對是否是人臉進(jìn)行判斷,以區(qū)分具有類似膚色的其他物體。</p><p>  (2)基于人工神經(jīng)網(wǎng)的方法。人工神經(jīng)網(wǎng)方法主要是通過神經(jīng)網(wǎng)的結(jié)構(gòu)和參數(shù)來表示模型的統(tǒng)計(jì)特征,由于人臉的外部輪廓較為復(fù)雜,無法用數(shù)學(xué)模型進(jìn)行描述,所以基于人工神經(jīng)網(wǎng)的方法在人臉特征識別中具有獨(dú)特的優(yōu)勢。</p><p>  (3)基于啟發(fā)式模型的方法?;趩l(fā)式模型的方法主要是通過

36、抽取灰度、紋理、幾何形狀等特征進(jìn)行檢測,以判斷其是否符合人臉特征。由于</p><p>  人臉區(qū)域內(nèi)的各個(gè)器官具有較為恒定的模式,因此對雙眼、鼻子、嘴等局部特征進(jìn)行檢測,然后根據(jù)人體五官的相對位置關(guān)系判斷被測物體是否為人臉。對于較強(qiáng)約束條件下的人臉檢測,利用人臉的輪廓、對稱性等少量特征的方法比較適用。</p><p>  人臉因人而異,絕無相同。雖然在表情、年齡或發(fā)型等發(fā)生一些變化的情況

37、下,人類仍可以毫不困難地確定出一個(gè)人的身份,但要建立一個(gè)能夠完全自動(dòng)進(jìn)行人臉識別的系統(tǒng)卻是非常困難的。它涉及到模式識別、圖像處理、計(jì)算機(jī)視覺、生理學(xué)、心理學(xué)以及認(rèn)知科學(xué)等方面的諸多知識,并與基于其他生物特征的身份鑒別方法以及計(jì)算機(jī)人機(jī)感知交互領(lǐng)域都有密切聯(lián)系。20世紀(jì)90年代以來,隨著安全領(lǐng)域各種應(yīng)用需求的增加,人臉識別技術(shù)成為一個(gè)熱門的研究課題。雖然已經(jīng)取得了一些可喜的成果,但在實(shí)際應(yīng)用中仍面臨著許多嚴(yán)峻的問題。人臉的表情、姿態(tài)、發(fā)型

38、以及化妝等多種影響因素都給識別帶來了困難。要讓計(jì)算機(jī)像人一樣準(zhǔn)確地識別出不同的人臉,尚需不同研究領(lǐng)域的研究人員共同不懈的努力。人臉識別(Face Recognition)一般可描述為[14]:對給定的靜止圖像或動(dòng)態(tài)視頻,利用己有的人臉數(shù)據(jù)庫來確認(rèn)圖像中的一個(gè)或多個(gè)人。從廣義上講,其研究內(nèi)容包括以下五個(gè)方面:</p><p>  (1)人臉檢測(Face Detection) 即從各種不同的場景中檢測出人臉的存&

39、lt;/p><p>  在并確定其位置。這一任務(wù)主要受光照、噪聲、頭部傾斜度以及各種遮擋的影響。</p><p>  (2)人臉描述(Face Representation) 即采用某種方式表示檢測出的人臉和數(shù)據(jù)庫中的人臉。通常的表示方法包括幾何特征(如歐氏距離、曲率、角度等)、代數(shù)特征(如矩陣特征矢量)、固定特征模板、特征臉、云紋圖等。</p><p>  (3)人

40、臉鑒別(Face Identification) 即透常所說的人臉識別,就是將待識別的人臉與數(shù)據(jù)庫中的己知入臉比較,得出相關(guān)信息。這一過程的核心是選擇適當(dāng)?shù)娜四槺硎痉绞脚c匹配策略。</p><p>  (4)表情分析(Facial Expression Analysis) 即對待識別人臉的表情進(jìn)行分析,并對其加以分類。</p><p>  (5)物理分類(Physical Classi

41、fication) 即對待識別人臉的物理特征進(jìn)行分類,得出其年齡、性別、種族等相關(guān)信息。</p><p>  一般的人臉識別系統(tǒng)構(gòu)成,包括人臉檢測、人臉預(yù)處理、特征提取、人臉特征庫、相似性匹配、結(jié)果輸出等部分。目前,國外大學(xué)和研究機(jī)構(gòu)已研制出一些較好的人臉識別系統(tǒng)。一些較成熟的商業(yè)人臉識別系統(tǒng),如德國的Cognitee,美國的Eyematie,Indentix等也已投入應(yīng)用。對一些安全性要求很高的應(yīng)用,可采用多

42、生物特征融合的識別技術(shù)[15],如DCSAG公司的BioID系統(tǒng),通過數(shù)字?jǐn)z像頭和麥克風(fēng),采集一個(gè)人的面貌、聲音以及嘴唇運(yùn)動(dòng)等三種生物特征,通過生物特征融合技術(shù),在一秒鐘內(nèi)快速完成身份識別。另外,由美國首先發(fā)起[16]的FERET(Face Recongnition Technology)和FRVT(Face Recognition Vendor Test)人臉識別測試活動(dòng)也大大推動(dòng)了人臉識別技術(shù)的研究和應(yīng)用。</p>&

43、lt;p>  我國在國家自然科學(xué)基金和863計(jì)劃等資助下,清華大學(xué)、哈工大、中科院、南京理工大學(xué),上海交大等很多單位展開了人臉識別技術(shù)的研究[17]。北京工業(yè)大學(xué)(信號與信息處理研究室)也在人臉檢測方面取得了較好的研究成果和澳大利亞的新南威爾士大學(xué)聯(lián)合提出的人臉檢測技術(shù)已經(jīng)被國際MPEG-7接受作為標(biāo)準(zhǔn)。為了推動(dòng)人臉識別研究的發(fā)展,國內(nèi)已舉行過四屆生物識別學(xué)術(shù)會議,中國科學(xué)院自動(dòng)化研究所也發(fā)起成立了中國生物認(rèn)證產(chǎn)業(yè)聯(lián)盟。據(jù)國際生物

44、識別產(chǎn)業(yè)協(xié)會估計(jì),我國生物識別技術(shù)的軟件和硬件市場,有望在10年內(nèi)達(dá)到每年20億美元的規(guī)模。但是,目前國內(nèi)的研究水平仍低于國際水平,許多核心技術(shù)被國外大公司掌握。因此,研究開發(fā)具有自主知識產(chǎn)權(quán)的人臉識別技術(shù)是一個(gè)新的挑戰(zhàn)。</p><p>  研究最多的是關(guān)于人臉正面模式的研究[18],主要可以分為三個(gè)發(fā)展階段:第一階段是對人臉識別所需要的面部特征進(jìn)行研究。這個(gè)階段主要是將一個(gè)簡單命令語句與數(shù)據(jù)庫中某一張臉聯(lián)系在

45、一起,并采用與指紋分析技術(shù)相結(jié)合的方法,由被測實(shí)驗(yàn)來看取得了較好的識別效果。但是為了提高臉部識別率,操作人員的操作貫穿于整個(gè)識別過程,而并未采用自動(dòng)識別系統(tǒng)進(jìn)行操作。第二階段是人機(jī)交互式識別階段??蒲腥藛T在這一階段對人臉正面圖像主要采用幾何特征參數(shù)來表示,并且將人臉面部特征采用特征矢量來表示,而且針對這種特征表示方法,設(shè)計(jì)了相應(yīng)的識別系統(tǒng)。不過這個(gè)階段仍然需要利用操作員的某些經(jīng)驗(yàn)知識,還是需要工作人員的參與。第三階段是自動(dòng)識別階段,近幾

46、年的人臉模式識別方法,隨著計(jì)算機(jī)計(jì)算速度的加快,有了較大的突破,幾種全自動(dòng)機(jī)器識別系統(tǒng)已經(jīng)被應(yīng)用。</p><p>  根據(jù)人臉表征方式的不同,可以分三種人臉自動(dòng)識別方法,即基于連接機(jī)制的識別方法、基于幾何特征的識別方法和基于代數(shù)特征的識別方法。早在80年代,我國就已經(jīng)著手于人臉自動(dòng)識別的研究。我國許多研究機(jī)構(gòu)、大專院校已經(jīng)在圖像處理和模態(tài)分析等方面都取得了較多的研究成果,對包括人臉識別在內(nèi)的人體生物特征識別技術(shù)

47、的基礎(chǔ)研究和應(yīng)用開發(fā)工作進(jìn)行了大量的研究。</p><p>  1.3 本文主要研究內(nèi)容</p><p>  本文的主要研究內(nèi)容是基于人臉識別的疲勞駕車檢測,首先要分析人臉上各器官與疲勞駕駛有關(guān)的特征,然后設(shè)計(jì)一種有效的疲勞分析方法,最后應(yīng)用ASM模型設(shè)計(jì)對人臉進(jìn)行識別的方法。</p><p>  第2章 疲勞分析和疲勞檢測</p><p&g

48、t;  2.1 疲勞駕駛特征綜述 </p><p>  所謂駕駛疲勞是指駕駛員在作業(yè)或行車中,由于駕駛車輛的動(dòng)作反復(fù)連續(xù)且重復(fù)的次數(shù)太多,使其生理上和心理上發(fā)生某種變化,在客觀上出現(xiàn)駕駛機(jī)能低落的現(xiàn)象[19]。一般認(rèn)為駕駛疲勞是同時(shí)涉及腦力和體力的技術(shù)性疲勞。由于駕駛員動(dòng)作反復(fù)、連續(xù),且重復(fù)的次數(shù)太多,使其生理上、心理上發(fā)生某種變化,在客觀上出現(xiàn)駕駛機(jī)能低落的現(xiàn)象。疲勞的表現(xiàn)可分為身體癥狀、精神癥狀和神經(jīng)癥狀。

49、身體癥狀表現(xiàn)在身體有倦怠、沉重、硬板的感覺,下車后彎腰感到困難,以及周身疼痛、手腳和小腿發(fā)脹等;精神癥狀表現(xiàn)為思考不周全、記憶力減退、精神渙散、焦慮、急躁等;神經(jīng)癥狀主要表現(xiàn)在動(dòng)作失調(diào)、臉部的其它肌肉顫動(dòng)、手腳發(fā)抖、精神不振等。</p><p>  駕駛員在駕駛過程中,頻繁發(fā)生信息接收與處理的過程中產(chǎn)生了駕駛疲勞,使駕駛員工作能力下降、生理和心理發(fā)生變化、出現(xiàn)疲勞感。目前在機(jī)器視覺領(lǐng)域,駕駛員的疲勞狀態(tài)可通過面部

50、視覺圖像進(jìn)行判斷,在疲勞時(shí)駕駛員眼睛部位的形狀將會發(fā)生明顯的變化。這些特征是明顯的,也是可以被檢測到的,駕駛員精力充沛時(shí),眼睛睜開;進(jìn)入輕度疲勞時(shí),眼睛睜開變小;特別疲勞以至于睡眠時(shí),眼睛經(jīng)常會出現(xiàn)完全合上的狀況。通過圖像處理與模式識別算法識別和判斷上述駕駛員的行為和狀態(tài),并對駕駛員疲勞違章駕駛行為和狀態(tài)發(fā)出報(bào)警信號,從而提醒駕駛員注意駕駛安全。駕駛員頻繁地處于打哈欠狀態(tài)時(shí),很可能處于疲勞駕駛狀態(tài)。駕駛員長時(shí)間地處于說話張嘴狀態(tài),很可能

51、與他人說話或者打手機(jī)通話,這都會導(dǎo)致駕駛精神分散。這兩種駕駛員狀態(tài)很容易導(dǎo)致交通事故。僅僅依靠眼睛部位的信息,容易產(chǎn)生誤報(bào)警。因?yàn)椴煌娜搜鄣娜犻_的面積是不一樣的,例如,對于眼睛比較小的或者眼睛處于半睜半閉狀態(tài)時(shí),單純用眼睛信息就會比較困難,進(jìn)而會產(chǎn)生誤報(bào)警或漏報(bào)警。但在加入嘴部信息后,綜合利用嘴部和眼睛信息來計(jì)算疲勞程度可以更加準(zhǔn)確地獲取疲勞信息。</p><p>  所以在本文中將會從眼睛和嘴部這兩個(gè)人臉中

52、比較容易檢測到器官進(jìn)行疲勞特征的分析,疲勞判定研究,但是在最后還會進(jìn)行兩種疲勞檢測方法的綜合。</p><p>  2.2 具體特征分析</p><p>  2.2.1 疲勞駕駛眼部特征分析</p><p>  為眼睛閉合與事故發(fā)生的是時(shí)間關(guān)系,由此可見,眼睛閉合時(shí)間在事故前比事故后要長,眼睛閉合時(shí)間的長短與疲勞程度有密切的關(guān)系,駕駛員眼睛閉合的時(shí)間越長,疲勞程

53、度越嚴(yán)重。因此通過測量眼睛閉合時(shí)間的長短就能夠確定疲勞駕駛的程度。 </p><p>  圖2-1 眼睛閉合時(shí)間與事故發(fā)生前后的時(shí)間關(guān)系</p><p>  測量在一定的時(shí)間內(nèi)眼睛閉合時(shí)間所占的比例。根據(jù)眼睛閉合時(shí)間的長短與疲勞程度之間有著密切關(guān)系,駕駛員眼睛閉合的時(shí)間越長,疲勞程度越嚴(yán)重的現(xiàn)象?,F(xiàn)在給出下列定義[23]:</p><p>  P70: 指眼瞼遮住瞳

54、孔的面積超過70%就計(jì)為眼睛閉合,統(tǒng)計(jì)在一定時(shí)間內(nèi)眼睛閉合時(shí)所占的時(shí)間比例。</p><p>  P80: 指眼瞼遮住瞳孔的面積超過80%就計(jì)為眼睛閉合,統(tǒng)計(jì)在一定時(shí)間內(nèi)眼睛閉合時(shí)所占的時(shí)間比例。</p><p>  EM: 指眼瞼遮住瞳孔的面積超過一半就計(jì)為眼睛閉合,統(tǒng)計(jì)在一定時(shí)間內(nèi)眼睛閉合時(shí)所占的時(shí)間比例。</p><p>  美國國家公路交通安全局對該方法作了

55、實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明該方法中的P80與疲勞發(fā)展程度的相關(guān)性較好,其他研究人員也得出了類似的結(jié)論。P80的測量方法:用攝像機(jī)獲取駕駛員的臉部圖像,通過圖像處理得眼睛圖像,經(jīng)過眼睛狀態(tài)識別確定眼睛是睜開還是閉合的;定義眼瞼遮住瞳孔的面積超過80%就計(jì)為眼睛閉合,但是在實(shí)際中瞳孔的閉合程度不容易測量,可行的簡化方法是計(jì)算眼睛的閉合百分比。</p><p><b>  的計(jì)算公式如下:</b><

56、/p><p><b>  (2-1)</b></p><p>  式中 ——當(dāng)前的人眼睜開高度:</p><p>  ——人眼睜開最大高度,</p><p>  對于人眼睜開時(shí)的大小的定義是存在難度的,因?yàn)檫@個(gè)數(shù)據(jù)是因人而異的,經(jīng)過統(tǒng)計(jì)可以得到一個(gè)估值,雖然不可能對每一個(gè)人都適用,但是仍然是有一定的使用度的。亞洲人人眼睜開

57、時(shí)的平均高度為7.5 mm[21]。又由于亞洲人的平均瞳孔直徑是2.5~4 mm,按照P80的標(biāo)準(zhǔn)來計(jì)算,當(dāng)瞳孔遮蔽為80%時(shí),就認(rèn)為人眼閉合,那么計(jì)算出來的閉合度為89.3%~93.3%,所以取89%,當(dāng)閉合百分比大于89%時(shí)就認(rèn)為眼睛處于閉合狀態(tài)。</p><p>  然后對一個(gè)測量周期進(jìn)行分析,選擇5s為一個(gè)測量周期,每秒的監(jiān)視頻率為12幀,也就是一個(gè)測量周期會選取60張圖片。 </p>&l

58、t;p>  統(tǒng)計(jì)在一定時(shí)間內(nèi)眼睛閉合時(shí)所占的時(shí)間比例。P80大于0.4,也就是一個(gè)測量周期中有超過20張圖片被判定為閉合狀態(tài)時(shí),則認(rèn)為駕駛員處于疲勞狀態(tài);當(dāng)P80處在0.1和0.4之間時(shí),判定為精神不飽滿狀態(tài);當(dāng)P80處在0.1以下時(shí),判定其為精神飽滿狀態(tài)。 </p><p>  2.2.2 疲勞駕駛嘴的特征分析</p><p>  駕

59、駛員頻繁地處于打哈欠狀態(tài)時(shí),很可能處于疲勞駕駛狀態(tài)。駕駛員長時(shí)間地處于說話張嘴狀態(tài),很可能與他人說話或者打手機(jī)通話,這都會導(dǎo)致駕駛精神分散,使反應(yīng)速度降低。這兩種駕駛員狀態(tài)都很容易導(dǎo)致交通事故通過實(shí)時(shí)監(jiān)測駕駛員嘴部的運(yùn)動(dòng)狀態(tài),可以識別駕駛員的以上兩種狀態(tài),而這兩種狀態(tài)就可以作為判斷駕駛員是否處于疲勞狀態(tài)的一個(gè)依據(jù)。</p><p>  我們知道每一幀圖像駕駛員嘴部的狀態(tài),即嘴閉合、普通張嘴(說話)和張大嘴(打哈欠

60、)。疲勞駕駛狀態(tài)和駕駛精神分散狀態(tài)是一個(gè)連續(xù)累積的過程,因此不能只根據(jù)當(dāng)前一幀駕駛員嘴部的狀態(tài)來判斷駕駛員的狀態(tài),這是因?yàn)槿瞬徽f話時(shí),偶爾也會張開嘴,而且人在說話時(shí)嘴也是時(shí)張時(shí)閉。為了減少駕駛員狀態(tài)報(bào)警的誤警率,提高系統(tǒng)撒警的準(zhǔn)確性,需要根據(jù)駕駛員嘴部狀態(tài)的連續(xù)時(shí)問系列數(shù)據(jù)統(tǒng)訓(xùn)規(guī)律統(tǒng)訓(xùn)決定駕駛員的狀態(tài)。</p><p>  如果用“0”表示嘴閉合狀態(tài),用“1”表示普通張嘴狀態(tài),用“2”表示張大嘴狀態(tài)。那么駕駛員嘴

61、部狀態(tài)就是由“0”、“1”、“2”組成的一個(gè)時(shí)間狀態(tài)系列。本文將根據(jù)這時(shí)間狀態(tài)系列來判斷駕駛員的狀態(tài)。</p><p>  駕駛員在正常駕駛過程中,其嘴基本上處于閉合狀態(tài)。當(dāng)駕駛員處于打哈欠狀態(tài)時(shí),其嘴張開很大。資料表明,人在打哈欠時(shí)張大嘴的平均時(shí)間至少持續(xù)5秒以上。根據(jù)這一原則,以5秒作為計(jì)算周期,系統(tǒng)監(jiān)測頻率為12幀/秒。如果5秒內(nèi)統(tǒng)計(jì)駕駛員嘴部連續(xù)處于張大嘴狀態(tài),即60幀中駕駛員嘴部狀態(tài)在狀態(tài)時(shí)間系中“2”

62、連續(xù)且其次數(shù)超過60次,則可以判斷駕駛員處于打哈欠的疲勞狀態(tài),檢測系統(tǒng)給予疲勞駕駛警告信號。</p><p>  嘴部區(qū)域的形狀可以由上下嘴唇的形狀來表示。如圖2-3所示,本文選取如下各個(gè)嘴部區(qū)域特征點(diǎn):A點(diǎn)為嘴部圖像右嘴角點(diǎn),B為嘴部圖像左嘴角點(diǎn),C點(diǎn)為嘴部圖像上嘴唇中心最上點(diǎn),D點(diǎn)為嘴部圖像下嘴唇中心最下點(diǎn),我們定義如下幾個(gè)嘴部區(qū)域的幾何特征值:</p><p>  圖2-3 人嘴形

63、狀</p><p>  (1)嘴部區(qū)域的最大寬度</p><p>  嘴部圖像右嘴角點(diǎn)A到左嘴角點(diǎn)B的距離,即線段AB的長度。</p><p><b>  (2-2)</b></p><p>  (2)嘴部區(qū)域的最大高度</p><p>  嘴部圖像上嘴唇中心最上點(diǎn)C到下嘴唇中心最下點(diǎn)D的距離,即

64、線段CD的長度。</p><p><b>  (2-3)</b></p><p>  針對不同的人嘴圖像,根據(jù)該方法通過大量實(shí)驗(yàn)得出表2-1[22]所示數(shù)據(jù)。由表可知嘴閉合狀態(tài)下,與之比約為4:2,普通張嘴狀態(tài)下,與之比約為4:3,張大嘴狀態(tài)下,與之比約為4:4。實(shí)際應(yīng)用時(shí),可根據(jù)這三者之間比值的情況來確定駕駛員嘴唇狀態(tài)[21]。</p><p&g

65、t;  表2-1 人嘴圖像和的對應(yīng)關(guān)系</p><p>  2.2.3 原始數(shù)據(jù)的獲取</p><p>  應(yīng)用這種方法進(jìn)行疲勞檢測時(shí),只能對固定的距離分析,雖然這個(gè)距離是因車和攝像頭的安裝而異的,但是對于某一輛車而言,車輛駕駛中駕駛員和攝像頭的距離是相對固定的,所以原始數(shù)據(jù)的獲取方法,也就是駕駛員的眼睛正常睜開的高度的測量和駕駛員的嘴的各個(gè)參數(shù)的測量都可以通過定制的方式獲得。</

66、p><p>  駕駛員在第一次使用這個(gè)系統(tǒng)時(shí),選取該系統(tǒng)的原始數(shù)據(jù)采集選項(xiàng),然后在精神飽滿的狀態(tài)下出現(xiàn)在攝像頭之前一段時(shí)間,然后系統(tǒng)會記錄下該駕駛員的特征,比如該駕駛員的眼睛正常睜開時(shí)的高度是多少,該駕駛員的嘴的寬度,嘴在閉合時(shí)嘴唇的寬度等信息,并以此為標(biāo)準(zhǔn)對今后該駕駛員進(jìn)行檢測。</p><p>  特別要注意的是,在啟動(dòng)原始數(shù)據(jù)采集收集選項(xiàng)時(shí),駕駛員一定要確保當(dāng)前的精神狀態(tài)良好,因?yàn)樵紨?shù)

67、據(jù)的采集對于精確度地保證是至關(guān)重要的,后面的疲勞分析就是依據(jù)這個(gè)數(shù)據(jù)進(jìn)行的,只有保證該數(shù)據(jù)的準(zhǔn)確性才能更好的提高整個(gè)系統(tǒng)的精度。</p><p>  但是當(dāng)駕駛員沒有時(shí)間進(jìn)行原始數(shù)據(jù)的采集或不能保證當(dāng)前駕駛狀態(tài)時(shí),啟動(dòng)陌生人駕駛模式。由于人臉上的各器官在放縮中是成比例,則有:</p><p><b>  (2-4)</b></p><p>  

68、式中 ——人眼的真實(shí)張開高度;</p><p><b>  ——兩眼真實(shí)距離;</b></p><p>  ——人眼在圖片中張開高度;</p><p>  ——兩眼在圖片中的距離,</p><p><b>  所以有:</b></p><p><b>  (2-5

69、)</b></p><p>  給定亞洲人平均兩眼間的距離為3.233 cm,而和均可測,就可以算出,結(jié)合人眼張開高度7.5 mm,可以計(jì)算出人眼的閉合程度,但是這種方法由于用到了比例近似和人面部特征估計(jì),所以并不精確,只能用在緊急情況下作為應(yīng)急策略。</p><p>  2.3 眼睛和嘴特征的綜合分析</p><p>  眼睛和嘴唇都包含著駕駛員是否

70、疲勞的信息,本系統(tǒng)綜合檢測兩者的狀態(tài)作出疲勞狀態(tài)判斷,并將二者信息進(jìn)行綜合分析,從而為得出最終結(jié)論提供依據(jù)。</p><p>  表2-2 疲勞狀志判定規(guī)則表</p><p>  表2-2所示的疲勞判定規(guī)則是統(tǒng)計(jì)大量的實(shí)驗(yàn)數(shù)據(jù)[23]得到的。顯然,當(dāng)駕駛員長時(shí)間閉眼而嘴唇閉合時(shí),系統(tǒng)需要判定駕駛員為疲勞狀態(tài);或者當(dāng)駕駛員眼睛保持睜開而嘴巴長時(shí)間張開時(shí)系統(tǒng)也需要作出疲勞判斷。而當(dāng)眼睛和嘴唇狀

71、態(tài)處于睜開和閉合的中間狀態(tài)時(shí),單純地依靠眼睛或者嘴唇信息去判斷駕駛員的狀態(tài),就容易出現(xiàn)問題。這就需要綜合眼睛閉合度和嘴唇張開信息,建立一個(gè)合理的規(guī)則共同決定駕駛員狀態(tài),而表2-2正好解決了這個(gè)問題,通過疲勞特征的綜合分析,檢測準(zhǔn)確度顯著提高。</p><p><b>  2.4 本章小結(jié)</b></p><p>  本章主要是進(jìn)行疲勞特征的分析,在本章中介紹了人臉的

72、兩個(gè)可以用于疲勞分析的器官,即眼睛和嘴巴,并分別對其與疲勞駕駛有關(guān)系的疲勞特征進(jìn)行了分析,還討論了原始數(shù)據(jù)在現(xiàn)實(shí)中的獲取方法,以方便準(zhǔn)確地得駕駛員的人臉器官特征,在最后還進(jìn)行了疲勞的綜合分析。</p><p>  第3章 ASM人臉識別算法</p><p>  3.1 ASM模型的定義</p><p>  主動(dòng)形狀模型(ASM)是一種物體形狀描述技術(shù),最早Coo

73、tes[24,25,26,27]等人提出的。它的基本思想是選取一組訓(xùn)練樣本,用一組特征點(diǎn)來描述樣本的形狀,然后對各樣本的形狀進(jìn)行配準(zhǔn)(使得形狀盡可能地相似),對這些配準(zhǔn)后的形狀向量利用主分量分析方法進(jìn)行統(tǒng)計(jì)建模得到物體形狀的統(tǒng)計(jì)學(xué)描述,最后利用建立的模型在新的圖像中搜索物體輪廓,從而定位出目標(biāo)物體。</p><p>  3.2 ASM人臉識別的優(yōu)勢</p><p>  3.2.1 AS

74、M搜索算法的特點(diǎn)</p><p>  主動(dòng)統(tǒng)計(jì)對象模型通過訓(xùn)練的方法得到對象的統(tǒng)計(jì)知識,從而建立對象的統(tǒng)計(jì)模型。統(tǒng)計(jì)對象模型的優(yōu)點(diǎn)在于能夠?qū)Ω鞣N形狀的對象進(jìn)行建模,因?yàn)殛P(guān)于對象的知識可以從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)得到,所以它非常適合于形狀復(fù)雜的對象分割。訓(xùn)練過程需要手工標(biāo)定對象的形狀,這雖然比較耗時(shí)費(fèi)力,然而它卻能夠?qū)Ω鞣N形狀進(jìn)行建模,特別是不規(guī)則的形狀(如鼻子、眉毛等)。因此人臉定位主要采用主動(dòng)統(tǒng)計(jì)對象模型。主動(dòng)統(tǒng)計(jì)對象

75、模型和變形模板的主要區(qū)別在于統(tǒng)計(jì)模型中的各個(gè)參數(shù)是從數(shù)據(jù)中學(xué)習(xí)而來,是統(tǒng)計(jì)參數(shù),參數(shù)之間的相互關(guān)系明確,而變形模板中的參數(shù)是人為設(shè)計(jì)的,參數(shù)之間的關(guān)系不明確,在設(shè)計(jì)能量函數(shù)的時(shí)候如何對它們進(jìn)行權(quán)衡是非常困難的事情。同時(shí),主動(dòng)統(tǒng)計(jì)對象模型的匹配過程也通過統(tǒng)計(jì)學(xué)習(xí)得到,它往往沒有明確的能量函數(shù)。ASM模型是典型的自頂向下圖像理解的策略,它用全局的模型在圖像解釋的過程中去約束指導(dǎo)我們。而僅用內(nèi)力的Snake方法是數(shù)據(jù)驅(qū)動(dòng)的或自下向上的策略,從

76、低層次的圖像的梯度紋理等信息出發(fā),通過啟發(fā)式的局部信息的合成來辨認(rèn)感興趣的目標(biāo)區(qū)域,這是很困難的。主動(dòng)統(tǒng)計(jì)對象模型有優(yōu)秀的性質(zhì),這種方法的優(yōu)點(diǎn)主要體現(xiàn)在[28]:</p><p>  其具有廣泛的適用性,同一套算法可以被應(yīng)用于許多不同的問題,區(qū)別僅僅在于提供不同的訓(xùn)練集;模型給出了一個(gè)簡潔的表達(dá)方式,它允許一定范圍內(nèi)的變化,但是有足夠的能力排除訓(xùn)練集得到的變化范圍以外的任何變化;除了從訓(xùn)練集學(xué)習(xí)到的特征,系統(tǒng)不需

77、要標(biāo)定的對象特征的其他任何先驗(yàn)假設(shè),比如模型中不需要類似邊界光滑度的一些參數(shù)。ASM模型主要包括兩部分:模型的建立和目標(biāo)搜索,下面將詳細(xì)介紹。</p><p>  由于是基于統(tǒng)計(jì)的模型,所以在進(jìn)行處理之前要先在程序中預(yù)存一些訓(xùn)練圖片,這些訓(xùn)練圖片要進(jìn)行標(biāo)定特征點(diǎn),勾勒出其所要識別器官的輪廓,這一步很重要,所以訓(xùn)練圖片越多,特征點(diǎn)選取越多,特征點(diǎn)選取的越精確,最后的識別精度也就越高,但是要注意,所選的特征點(diǎn)不能過多

78、,否則會使計(jì)算強(qiáng)度過大,使計(jì)算速度減慢,從而無法實(shí)現(xiàn)動(dòng)態(tài)識別。</p><p>  為擬合出人臉輪廓,首先在平均模板基礎(chǔ)上生成一個(gè)初始形狀估計(jì),然后根據(jù)一定的搜索策略調(diào)整標(biāo)記點(diǎn)位置,讓初始形狀在待識別的圖像不斷地變形,直至收斂,最終擬合出人臉的輪廓。初始形狀估計(jì)和搜索策略的選擇對算法的搜索效率至關(guān)重要。</p><p>  3.2.2 幾種識別方式對比分析</p><

79、p>  在第一章中介紹了人臉識別的三種主要研究方向,現(xiàn)進(jìn)行對比分析,見表3-1[29]:</p><p>  表3-1 識別方式特點(diǎn)比較</p><p>  由表可以看出,在對實(shí)時(shí)性要求比較高的駕駛疲勞檢測中,基于啟發(fā)式的模型方法是有優(yōu)勢的,而ASM模型這是基于這一思路的,也是對灰度和紋理特點(diǎn)進(jìn)行分析,所以該模型是合適的。</p><p>  與現(xiàn)在比較流行的

80、Adaboost人臉檢測方法進(jìn)行比較,ASM模型在反應(yīng)速度上和精度上都都較易達(dá)到較高要求。</p><p>  3.3 ASM的模型建立</p><p>  ASM中的一個(gè)核心部分是用統(tǒng)計(jì)的方法建立所考察對象的形狀模型。通常用一系列的坐標(biāo)點(diǎn)來定義某類目標(biāo)的形狀。這樣的定義方法是可以推廣的,例如可以用點(diǎn)的2-D坐標(biāo),也可以用其3-D坐標(biāo),還可以加上時(shí)間軸的坐標(biāo)等。</p>&

81、lt;p>  通常在2-D圖像中,假定目標(biāo)的形狀可以用一系列(手工標(biāo)定的)點(diǎn)的坐標(biāo)來表示,即</p><p>  (3-1) </p><p>  為了建立統(tǒng)計(jì)模型,需要有大量的類似數(shù)據(jù)作訓(xùn)練樣本。同樣在這些訓(xùn)練標(biāo)本上需要仔細(xì)地標(biāo)定好上述用來表征目標(biāo)形狀的點(diǎn),這些點(diǎn)的選取精度和樣本的豐富性直接影響所建立的形狀模型的應(yīng)用性能。同時(shí)還應(yīng)注意到,在對上

82、述樣本作統(tǒng)計(jì)分析之前,必須保證這些點(diǎn)在同一個(gè)參考幀坐標(biāo)系下,即需要做一個(gè)樣本標(biāo)準(zhǔn)化的過程。標(biāo)準(zhǔn)化是為了保證所有樣本具有相同的尺度意義、相同的旋轉(zhuǎn)方向,并去除掉簡單的剛性變化的影響,使模型能一致地對感興趣的特征進(jìn)行建模。標(biāo)準(zhǔn)化過程通常是經(jīng)過一個(gè)簡單的迭代過程來實(shí)現(xiàn)的,這個(gè)過程可用以下流程描述[30]:(原點(diǎn),,形狀標(biāo)準(zhǔn)化配準(zhǔn))</p><p>  (1)將每個(gè)樣本位移到它的中心處。</p><p

83、>  (2)選取某個(gè)樣本作為初始的平均形狀的估計(jì)值,它的尺度設(shè)成,并將該初始估值設(shè)為默認(rèn)的參考幀。</p><p>  (3)將所有的樣本向當(dāng)前的平均形狀作對齊(向量,與向量對齊,即將進(jìn)行面內(nèi)旋轉(zhuǎn)、坐標(biāo)平移、尺度縮放得到,定義距離,并使其最小)。</p><p>  (4)重新計(jì)算新的樣本平均值。</p><p>  (5)將新的平均值按照默認(rèn)的參考幀標(biāo)準(zhǔn)化。

84、</p><p>  (6)如果新的平均變化小于某個(gè)閾值,認(rèn)為收斂,否則跳轉(zhuǎn)到步驟(3)繼續(xù)迭代直至收斂。</p><p>  得到調(diào)整好的訓(xùn)練樣本后,就可以對訓(xùn)練集統(tǒng)計(jì)分析與建模,所得到的樣本集可看作是一堆點(diǎn)的集合?,F(xiàn)在的任務(wù)是尋找這樣一個(gè)參數(shù)模型,其中是模型的參數(shù)向量。如果給一個(gè)參數(shù),應(yīng)能用該模型生成一個(gè),并且這樣的是有意義的。如果還能進(jìn)一步的到模型的參數(shù)分布,用該模型解出適當(dāng)?shù)膮?shù),

85、進(jìn)而完成對原始圖像的解釋。</p><p>  圖3-1 形狀對齊過程 </p><p>  下面是利用利用PCA方法進(jìn)行形狀模型建模的流程:</p><p>  (1)計(jì)算樣本的均值。</p><p>  (3-2) </p><p>

86、;  (2)計(jì)算樣本的協(xié)方差矩陣。</p><p><b>  (3-3)</b></p><p>  (3)計(jì)算協(xié)方差矩陣的特征值,并按特征值從大到小排序,即大的在最前面,小的在最后面,為對應(yīng)的特征向量。</p><p>  (4)令,,在主要分析中,將特征向量稱為這組數(shù)據(jù)的主要成分,稱為這組數(shù)據(jù)的主要成分矩陣。如上建立的模型可以表示成:&l

87、t;/p><p><b>  (3-4)</b></p><p>  對于任何一個(gè)形狀向量都可由參數(shù)確定,即</p><p><b>  (3-5)</b></p><p>  向量即是所得到的模型參數(shù),通過變化參數(shù),可以變化形狀向量以得到期望的結(jié)果。</p><p>  通常假

88、定參數(shù)的分布是獨(dú)立同分布的且都是高斯分布的,則每一個(gè)參數(shù)則都滿足如下分布:</p><p><b>  (3-6)</b></p><p>  為了從參數(shù)得到有效的形狀,應(yīng)對參數(shù)作如下的限制:</p><p><b>  (3-7)</b></p><p><b>  亦即</b&g

89、t;</p><p><b>  (3-8)</b></p><p>  更簡單的形式是參數(shù)滿足:</p><p><b>  (3-9)</b></p><p>  上式表明每一個(gè)特征值實(shí)際上在假設(shè)參數(shù)是獨(dú)立同分布的高斯分布時(shí)是參數(shù)的方差。為了保證模型生成的例子同原來的訓(xùn)練樣本一致,上面的約束條件

90、是必要的。</p><p>  3.4 ASM模型的搜索算法</p><p>  主動(dòng)形狀模型的搜索過程是一個(gè)啟發(fā)的迭代搜索,其過程如下:</p><p>  (1)由模板的形狀系數(shù)和式(3-4)重構(gòu)出歸一化的形狀,再由幾何變換參數(shù)生成當(dāng)前的特征點(diǎn)集。</p><p>  (2)如圖3-1所示,對特征點(diǎn)集中的每一個(gè)點(diǎn),根據(jù)局部特征模型沿著發(fā)

91、現(xiàn)方向在一定范圍內(nèi)尋找最佳的匹配點(diǎn),這些最佳匹配點(diǎn)的集合就是更新后的特征點(diǎn)集。搜索的步長和采樣間距相同。</p><p>  (3)把更新后的特征點(diǎn)集與基準(zhǔn)特征集合對齊,得到新的集合參數(shù)和,使用式(3-5)可以得到形狀系數(shù)。</p><p>  圖3-2 ASM搜索示意圖</p><p>  (4)使用先驗(yàn)?zāi)P图s束更新后的形狀。</p><p&g

92、t;<b>  (5)循環(huán)至收斂。</b></p><p>  在主動(dòng)形狀模型算法中,如果特征點(diǎn)搜索的最佳匹配點(diǎn)和當(dāng)前點(diǎn)的距離不大于采樣間距時(shí),認(rèn)為這個(gè)點(diǎn)是收斂的。當(dāng)收斂的特征點(diǎn)數(shù)目達(dá)到總數(shù)的</p><p>  圖3-3 目標(biāo)搜索策略</p><p>  90%時(shí),認(rèn)為整個(gè)算法收斂。</p><p>  在求局部紋理模

93、型時(shí)個(gè)點(diǎn)的灰度表達(dá)式:</p><p><b>  (3-10)</b></p><p><b>  灰度梯度表達(dá)式:</b></p><p><b>  (3-11)</b></p><p><b>  灰度值標(biāo)準(zhǔn)化:</b></p>&l

94、t;p><b>  (3-12)</b></p><p>  標(biāo)準(zhǔn)灰度梯度的均值:</p><p><b>  (3-13)</b></p><p>  N幅圖標(biāo)準(zhǔn)灰度的協(xié)方差:</p><p><b>  (3-14)</b></p><p>&

95、lt;b>  馬氏距離求法:</b></p><p><b>  (3-15)</b></p><p>  在擬合算法中,標(biāo)記點(diǎn)采用不同的搜索策略,得到的搜索結(jié)果也不同。</p><p>  在此,采用三種常用的搜索策略[31]:</p><p>  (1)基于像素鄰域最大梯度值的搜索策略 計(jì)算圖像梯

96、度場,在當(dāng)前形狀模型的每個(gè)標(biāo)記點(diǎn)的一個(gè)7×7的鄰域內(nèi),取梯度值最大的點(diǎn)作為當(dāng)前標(biāo)記點(diǎn)的替代點(diǎn)。采用這種搜索策略,算法速度快,效率也比較高,大體上可以定位出輪廓的,但是標(biāo)記點(diǎn)的變化沒有方向性,容易受到其它邊緣的干擾,比如衣領(lǐng),耳朵等。</p><p>  (2)基于輪廓曲線法線方向的搜索策略 沿著當(dāng)前形狀曲線的法線所在直線上,以標(biāo)記點(diǎn)為中心在順著發(fā)現(xiàn)方向和逆著發(fā)現(xiàn)方向各取3個(gè)像素,選擇的梯度值最大的點(diǎn)為

97、當(dāng)前標(biāo)記點(diǎn)的替代點(diǎn)。針對不同的器官,選擇一些關(guān)鍵的標(biāo)記點(diǎn),只調(diào)整這些關(guān)鍵標(biāo)記點(diǎn),而其它標(biāo)記點(diǎn)則根據(jù)ASM模型的形狀配準(zhǔn)算法來求出。</p><p>  (3)基于方向場的輪廓搜索策略 由于圖像的場具有凸顯圖像凹陷部分的特性,人臉圖像的這種凹陷正好可以勾勒出人臉部分的輪廓。根據(jù)不同器官的輪廓特點(diǎn),選取了一些的關(guān)鍵標(biāo)記點(diǎn)。然后沿著當(dāng)前標(biāo)記點(diǎn)的向量場方向移動(dòng)一個(gè)像素,在順著該像素的向量場方向移動(dòng)至下一個(gè)像素,如此循環(huán)

98、,直到碰到凹陷的像素點(diǎn)或者移動(dòng)像素?cái)?shù)達(dá)到最大為止,把最后一個(gè)像素點(diǎn)作為當(dāng)前標(biāo)記點(diǎn)的替代點(diǎn)。而其它非關(guān)鍵標(biāo)記點(diǎn)的位置則根據(jù)形狀配準(zhǔn)算法計(jì)算得到。</p><p>  對這三種策略進(jìn)行了多組比較實(shí)驗(yàn),發(fā)現(xiàn)有以下問題:第一種搜索方法在搜索時(shí)不具備連續(xù)性,時(shí)常發(fā)生跳變,對于人臉輪廓的搜索易受衣領(lǐng)等的干擾;第二種方法在對眼睛的搜索和上嘴唇的搜索時(shí)表現(xiàn)較好,然而對于鼻子,下嘴唇和輪廓都易于產(chǎn)生跳變,使圖像不連續(xù),對于人臉輪廓

99、的搜索易受衣領(lǐng)等的干擾;第三種方法對于鼻子,下嘴唇和人臉輪廓的搜索上變現(xiàn)出良好的性質(zhì),而且輪廓一般都具有比較好的邊界連續(xù)性。而對于眼睛和上嘴唇的搜索,易于收斂成一個(gè)點(diǎn)。</p><p>  在我的畢業(yè)設(shè)計(jì)中,我選擇第二種思路,我認(rèn)為選取幾個(gè)重要的特征點(diǎn),然后再進(jìn)行收斂,并以這幾個(gè)點(diǎn)的收斂效果判斷其收斂是否完成時(shí)十分有效的,也是簡便易行的。</p><p>  3.5 流程設(shè)計(jì)思路<

100、/p><p>  圖3-4 人臉識別實(shí)現(xiàn)流程圖</p><p>  我的設(shè)計(jì)思路是建立在對ASM實(shí)現(xiàn)的基本步驟的認(rèn)識的基礎(chǔ)上的,由于ASM人臉識別的實(shí)現(xiàn)步驟是特征點(diǎn)的建立、學(xué)習(xí)過程、搜索匹配過程三步,所以在流程中也是要基本上按照這個(gè)步驟進(jìn)行。</p><p>  首先在程序中預(yù)存一些有特點(diǎn)的圖片,對這些圖片進(jìn)行處理,進(jìn)行手工描點(diǎn),同時(shí)建立與圖片相對應(yīng)的數(shù)據(jù)存儲文件,然后

101、使用編輯好的matlab程序進(jìn)行處理,由于ASM模型是基于統(tǒng)計(jì)的模型,所以這項(xiàng)工作是十分必要的,經(jīng)過這一步之后,程序也就學(xué)習(xí)了人臉的劇本面部器官特征,然后生成一個(gè)大致的人臉模型,再對所要處理的圖片進(jìn)行大致選擇,之后程序自動(dòng)對人臉器官進(jìn)行收斂處理,得出人臉的識別圖,再通過數(shù)據(jù)生成函數(shù)來生成人臉識別模型。</p><p><b>  3.6 本章小結(jié)</b></p><p&

102、gt;  在本章中,主要介紹了ASM模型的特點(diǎn)和優(yōu)勢,進(jìn)而介紹了ASM模型的算法和搜索過程,比較詳細(xì)的說明了ASM的工作原理和工作步驟,并介紹了通過PCA建立ASM統(tǒng)計(jì)模型的方法和局部特征模型的收斂方法,這兩個(gè)方法是ASM模型的核心算法。還給出了程序設(shè)計(jì)的流程圖。ASM模型在本文中充當(dāng)著橋梁的作用,因?yàn)檎n題是駕駛的疲勞檢測,所以必須要定位和分析出人臉,而ASM模型正是為完成這項(xiàng)任務(wù)為引入的。</p><p>  

103、第4章 圖像處理和識別</p><p>  4.1 圖像預(yù)處理的必要性</p><p>  圖像識別系統(tǒng)的處理流程一般可分為圖像預(yù)處理、特征提取和識別分析三個(gè)階段,其中圖像的預(yù)處理階段尤為重要,成功的預(yù)處理可以提高人臉檢測、特征點(diǎn)定位以及識別的成功率,如果這階段處理不好,后面的工作將無法有效展開。所以圖像的預(yù)處理是確保整個(gè)系統(tǒng)準(zhǔn)確工作的基礎(chǔ),沒有這個(gè)可靠的基石就無法順利完成后面龐大的識

104、別過程。</p><p>  在實(shí)際應(yīng)用中,預(yù)處理的主要作用有兩方面:其一,由于受噪聲、光照等方面的影響,系統(tǒng)獲取的圖像的質(zhì)量不高,所以需要進(jìn)行預(yù)處理,以有利于提取大家感興趣的信息。這種情況下,要根據(jù)系統(tǒng)的不足或環(huán)境的影響(如光照),采取有針對性的措施。其二,獲取的圖像信息不符合后續(xù)操作的具體要求,這時(shí)也需要對圖像按照一定的要求進(jìn)行預(yù)處理,例如,尺寸,角度方面的要求??傊?,預(yù)處理是一個(gè)承上啟下的過程。需要全面考慮

105、整個(gè)系統(tǒng)的性能。</p><p>  圖像預(yù)處理方式的選擇應(yīng)該因地制宜,不同的系統(tǒng)需要根據(jù)自身特點(diǎn)設(shè)計(jì)適合的預(yù)處理模塊。如果預(yù)處理功能不能成功達(dá)到彌補(bǔ)系統(tǒng)不足的要求,勢必影響整個(gè)系統(tǒng)運(yùn)行的正確率;如果預(yù)處理算法過于繁雜,運(yùn)算量過大,勢必影響整個(gè)系統(tǒng)的實(shí)時(shí)性,所以預(yù)處理模塊的設(shè)計(jì)要兼顧正確性與實(shí)時(shí)性。在基于嵌入式的人臉識別系統(tǒng)中,由于系統(tǒng)的實(shí)時(shí)性要求比較高,圖像的預(yù)處理只是系統(tǒng)的一個(gè)前期階段,而且ASM算法在建立局

106、部紋理模型時(shí),已經(jīng)考慮到光照的影響,所以在預(yù)處理階段光照補(bǔ)償采用了常用的直方圖均衡化方法。</p><p>  4.2 常用光照預(yù)處理技術(shù)</p><p>  光照問題是圖像處理中比較關(guān)鍵而且難以解決的問題,尤其在入臉識別或檢測系統(tǒng)中,一般的識別或檢測算法是假定待檢測圖像是在均勻光照下獲得的。而實(shí)際上受周圍環(huán)境的影響,光照往往不是均勻的,這會導(dǎo)致人臉檢測的正確率大大降低,所以有必要對光照

107、進(jìn)行補(bǔ)償。</p><p>  光照預(yù)處理的基本思想是:對輸入圖像做各種圖像處理操作或信號變換,將非標(biāo)準(zhǔn)光照情況下的圖像變換為標(biāo)準(zhǔn)光照情況下的圖像,其表達(dá)式如下:</p><p>  (4-1) </p><p>  其中是原始圖像,是變換規(guī)則,是經(jīng)過變換后的圖像。變換規(guī)則不同,對應(yīng)著不同的預(yù)處理算法。</

108、p><p>  目前常用的光照預(yù)處理算法有直方圖均衡化、線性變換、對數(shù)變換、指數(shù)變換等[32~36],下面將對這些方法進(jìn)行詳細(xì)介紹。</p><p>  4.2.1 基于直方圖的預(yù)處理方法</p><p>  在圖像處理中,灰度直方圖(圖4-1)是一種函數(shù),它表示圖像中每一灰度級與該灰度級出現(xiàn)的頻率之間的對應(yīng)關(guān)系。假設(shè)一幅數(shù)字化的圖像中總的像素?cái)?shù)目為,某一灰度級為的像

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論