非接觸視覺識(shí)別系統(tǒng)研究畢業(yè)論文_第1頁
已閱讀1頁,還剩39頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、<p>  畢業(yè)設(shè)計(jì)(論文)原創(chuàng)性聲明和使用授權(quán)說明</p><p><b>  原創(chuàng)性聲明</b></p><p>  本人鄭重承諾:所呈交的畢業(yè)設(shè)計(jì)(論文),是我個(gè)人在指導(dǎo)教師的指導(dǎo)下進(jìn)行的研究工作及取得的成果。盡我所知,除文中特別加以標(biāo)注和致謝的地方外,不包含其他人或組織已經(jīng)發(fā)表或公布過的研究成果,也不包含我為獲得 及其它教育機(jī)構(gòu)的學(xué)

2、位或?qū)W歷而使用過的材料。對(duì)本研究提供過幫助和做出過貢獻(xiàn)的個(gè)人或集體,均已在文中作了明確的說明并表示了謝意。</p><p>  作 者 簽 名:       日  期:        </p><p>  指導(dǎo)教師簽名:        日  期:        </p><p><b>  使用授權(quán)說明</b&g

3、t;</p><p>  本人完全了解XX大學(xué)關(guān)于收集、保存、使用畢業(yè)設(shè)計(jì)(論文)的規(guī)定,即:按照學(xué)校要求提交畢業(yè)設(shè)計(jì)(論文)的印刷本和電子版本;學(xué)校有權(quán)保存畢業(yè)設(shè)計(jì)(論文)的印刷本和電子版,并提供目錄檢索與閱覽服務(wù);學(xué)??梢圆捎糜坝 ⒖s印、數(shù)字化或其它復(fù)制手段保存論文;在不以贏利為目的前提下,學(xué)??梢怨颊撐牡牟糠只蛉?jī)?nèi)容。</p><p>  作者簽名:        日

4、  期:       </p><p><b>  第一章 緒論</b></p><p>  1.1研究的背景和意義</p><p>  隨著社會(huì)的發(fā)展和科學(xué)技術(shù)的不斷進(jìn)步,人們對(duì)于快速、便捷、有效的身份識(shí)別技術(shù)有著日益增長(zhǎng)的需求。傳統(tǒng)的方法諸如密碼、印章、證件等因易忘記、易偽造、易丟失,常常給人們的生活和社會(huì)的管理帶來不便。因此,近年來,

5、生物識(shí)別技術(shù)日益引起人們的關(guān)注,并逐步滲透到大家的日常生活和工作中。和指紋、視網(wǎng)膜、虹膜、基因、掌形等其他人體生物特征識(shí)別系統(tǒng)相比,人臉識(shí)別系統(tǒng)更加直接、友好,使用者無任何心理障礙,并且通過人臉的表情姿態(tài)分析,還能獲得其他識(shí)別系統(tǒng)難以得到的一些信息。</p><p>  顯然,用戶的可接受性在很大程度上決定了一個(gè)產(chǎn)品的應(yīng)用范圍和市場(chǎng)前景。簡(jiǎn)單、自然、盡可能少的用戶參與,會(huì)使一個(gè)生物識(shí)別系統(tǒng)顯得更為友好和方便,因此

6、,盡管人臉識(shí)別系統(tǒng)目前的性能還不如指紋識(shí)別系統(tǒng),但人臉特征很可能是未來最常用的生物識(shí)別特征[1]。人臉識(shí)別系統(tǒng)除了可以應(yīng)用于其它生物識(shí)別系統(tǒng)應(yīng)用的場(chǎng)合,比如在需要用戶專門配合的法庭舉證、持證人核對(duì)、計(jì)算機(jī)登陸、網(wǎng)絡(luò)訪問、重要建筑物和邊境口岸的進(jìn)出控制等,它還可用于無需用戶刻意配合的視頻監(jiān)控、視頻流的自動(dòng)剪輯等領(lǐng)域,在罪犯緝拿、視頻檢索等許多方面都有廣泛的應(yīng)用前景。</p><p>  現(xiàn)在主要基于疲勞駕駛的研究,

7、所以對(duì)基于人臉系統(tǒng)研究的人眼狀態(tài)識(shí)別則顯得尤為重要。人們不禁要問,究竟是什么原因造成如此大量的事故頻繁出現(xiàn)?有沒有行之有效的安全措施能夠遏制這些惡性交通事故發(fā)生?于是,各國科學(xué)家,研究人員對(duì)此問題展開了大量積極并富有建設(shè)性質(zhì)的研究活動(dòng),尋找事故背后的原因。他們發(fā)現(xiàn),從道路交通事故的成因來看,在全球范圍內(nèi),駕駛員疲勞駕駛汽車,是導(dǎo)致各種交通安全事故發(fā)生的重要原因之一[2]。因?yàn)轳{駛員長(zhǎng)時(shí)間駕駛車輛,特別是在夜間,很容易導(dǎo)致過于疲勞困乏、注

8、意力不集中,隨時(shí)有可能入睡,甚至在短暫失去知覺后經(jīng)過一段時(shí)間再醒來,這大大降低了駕駛員自身對(duì)外界發(fā)生異常事件的反應(yīng)能力。更為嚴(yán)重的是,很多時(shí)候,已經(jīng)處于疲勞駕駛狀態(tài)的駕駛員本人甚至不知道自己已經(jīng)處在瞌睡的危險(xiǎn)狀態(tài)之中,顯然這種情形是非常危險(xiǎn)的。一旦行駛在路面窄、車速快的地區(qū),常常一不注意,就釀成大禍,引發(fā)重大惡性交通事故。</p><p>  科學(xué)家們還發(fā)現(xiàn)由駕駛員疲勞因素造成的交通事故,僅僅通過對(duì)駕駛行為 &l

9、t;/p><p>  的規(guī)范和對(duì)駕駛員的培訓(xùn)教育是難以有效地克服的。必須通過先進(jìn)的技術(shù)手段,監(jiān)控駕駛員的駕駛行為。在發(fā)現(xiàn)駕駛員出現(xiàn)駕駛疲勞狀態(tài)時(shí),采取自動(dòng)告警或者代替駕駛員操作,避免發(fā)生交通事故。于是世界上很多國家特別是美英日德加發(fā)達(dá)國家的大學(xué)和著名汽車公司廣泛開展了針對(duì)駕駛員疲勞駕駛或駕駛注意力不集中方面的研究,提出汽車安全輔助駕駛技術(shù),來解決上述問題。因此研究視覺識(shí)別有至關(guān)重要的作用。</p>&l

10、t;p>  眼睛作為一個(gè)重要的信息傳遞功能組織,它不僅把外界的各種信息反映給大腦,同時(shí)也把人的內(nèi)在精神狀態(tài)形象地表達(dá)出來。正常狀態(tài)時(shí),眼睛睜得很開;疲勞時(shí),眼睛睜得很小;睡眠時(shí),眼睛會(huì)完全合上。而且眼睛區(qū)域在以上三種情況下的外形有明顯區(qū)別。所以,利用駕駛員眼睛的狀態(tài)信息來判斷疲勞狀況是一種可行的方法。本文基于“疲勞駕駛狀態(tài)監(jiān)控裝置及方法”,根據(jù)駕駛員在正常駕駛狀態(tài)與疲勞駕駛狀態(tài)下的眼睛張開程度有一定區(qū)別的特點(diǎn),給出了一種對(duì)駕駛員眼

11、睛狀態(tài)進(jìn)行準(zhǔn)確識(shí)別的技術(shù)方法。實(shí)驗(yàn)證明,該方法對(duì)眼睛狀態(tài)的識(shí)別具有實(shí)時(shí)性強(qiáng)準(zhǔn)確率高和抗干擾能力較強(qiáng)的特點(diǎn)。</p><p>  1.2 疲勞駕駛檢測(cè)技術(shù)的研究現(xiàn)狀</p><p>  1.2.1疲勞駕駛檢測(cè)方法的研究現(xiàn)狀</p><p>  早期的駕駛疲勞評(píng)價(jià)主要從醫(yī)學(xué)角度出發(fā),借助醫(yī)療器械進(jìn)行。1935年美國交通部管轄的州際商業(yè)協(xié)會(huì)ICC(The intersta

12、te commerce commission)要求公共衛(wèi)生署(The United States public health service)對(duì)城市商業(yè)機(jī)動(dòng)車駕駛員服務(wù)時(shí)間管理?xiàng)l例的合理性進(jìn)行調(diào)查。實(shí)質(zhì)性的研究工作始于20世紀(jì)80年代,美國國會(huì)批準(zhǔn)交通部研究商業(yè)機(jī)動(dòng)車駕駛和交通安全的關(guān)系。20世紀(jì)90年代隨著計(jì)算機(jī)和集成電路制造技術(shù)的提高,疲勞程度測(cè)量方法研究有了很大的進(jìn)展。</p><p>  1.2.2國外研

13、究具有代表性的產(chǎn)品有:</p><p>  1、2005年,VOLVO汽車公司推出的“駕駛員警示系統(tǒng)”。該系統(tǒng)不斷監(jiān)測(cè)車輛的行駛中的運(yùn)動(dòng)過程,記錄下司機(jī)的駕駛行為,并能判斷車輛是處于有效控制狀態(tài),還是處于失控狀態(tài),在司機(jī)進(jìn)入睡眠狀態(tài)之前及時(shí)給予警示。沃爾沃的疲勞駕駛警示器設(shè)計(jì)者認(rèn)為,他們之所以選擇監(jiān)督車的方式,是因?yàn)樗麄冋J(rèn)為人的不可控因素太多。</p><p>  2、2002年,美國研制

14、的打瞌睡駕駛員偵探系統(tǒng)DDDS(The Drowsy Driver Detection System)[3]。該技術(shù)采用多普勒雷達(dá)和復(fù)雜的信號(hào)處理來測(cè)量駕駛員打瞌睡或睡著的活動(dòng),包括不安煩躁的情緒活動(dòng)、眨眼頻率、眨眼的持續(xù)時(shí)間和眼皮的活動(dòng)。該系統(tǒng)的特點(diǎn)是通過耗能低的多普勒雷達(dá)系統(tǒng)(Doppler radar system)非接觸式地采集正常駕駛時(shí)駕駛員的活動(dòng)和眼皮的活動(dòng)行為所表示的疲勞數(shù)據(jù)。并且該系統(tǒng)能夠做成外形較小的儀器,固定在駕駛室

15、內(nèi)駕駛員頭頂上方。</p><p>  3、轉(zhuǎn)向操作監(jiān)視器S.A.M(steering attention monitor)是一種監(jiān)測(cè)方向盤非正常運(yùn)動(dòng)的傳感器裝置,適用于各種車輛。如果方向盤4秒鐘不運(yùn)動(dòng),該監(jiān)視器發(fā)出聲音報(bào)警,直到方向盤繼續(xù)正常運(yùn)動(dòng)為止[4]。方向盤繼續(xù)正常運(yùn)動(dòng)時(shí)監(jiān)視器不發(fā)出聲音報(bào)警。S.A.M被固定在車內(nèi)錄音機(jī)的旁邊,在方向盤下面的桿上有一條磁性帶用來測(cè)量方向盤的運(yùn)動(dòng)。S.A.M的作用就是:提醒

16、駕駛員不要在駕駛時(shí)瞌睡。</p><p>  4、1997年10月約翰·霍普金斯大學(xué)應(yīng)用物理實(shí)驗(yàn)室對(duì)世界各大汽車廠商在安全問題的調(diào)查顯示[5]:三菱公司(Mitsubishi Drowsy Driver Warning System)通過檢測(cè)方向盤的運(yùn)動(dòng)來監(jiān)視駕駛員的疲勞和注意力,如果駕駛員產(chǎn)生疲勞,座椅產(chǎn)生振動(dòng)來刺激駕駛員以減輕駕駛疲勞,并且給出警告信號(hào)。日產(chǎn)(Nissan Drowsy Driver

17、 Warning System)在儀表盤用攝像機(jī)監(jiān)視駕駛員面部的表情來識(shí)別駕駛員早期疲勞狀態(tài),當(dāng)駕駛員疲勞時(shí),它誘發(fā)告警聲音。該系統(tǒng)試圖通過把薄荷醇?xì)馕兜睦淇諝忉尫旁隈{駛室中來清醒疲勞的駕駛員,如果駕駛員疲勞狀態(tài)得不到改善,該系統(tǒng)會(huì)使用聲光報(bào)警,并且自動(dòng)停車。</p><p>  5、DAS2000型路面警告系統(tǒng)(The DAS 2000 Road Alert System)是一種設(shè)置在高速公路上用計(jì)算機(jī)控制的紅

18、外線監(jiān)測(cè)裝置,當(dāng)行駛車輛擺過道路中線或路肩時(shí),向駕駛員發(fā)出警告[6]。</p><p>  6、電子“清醒帶”,使用時(shí)用一根可以調(diào)整的松緊帶固定在駕駛員頭部,“清醒帶”的電源插頭插入汽車內(nèi)的香煙自動(dòng)點(diǎn)火器的插座內(nèi),裝在帶子里的半導(dǎo)體溫差電偶,就使平展在前額部位的鋁片變涼,使駕駛員睡意消除,精神振作。據(jù)說戴上這種“清醒帶”,足足可以消除睡意24小時(shí)?!扒逍褞А笔褂玫碾妷菏?2V-14V,電流是500mA,十分安全。

19、</p><p>  1.2.3國內(nèi)研究具有代表性的產(chǎn)品有:</p><p>  1、中國軍事醫(yī)學(xué)科學(xué)院陳信[7]等利用腦電圖、讀數(shù)試驗(yàn)、唾液分泌、閃光融合頻率測(cè)試來判別飛行員疲勞。他們對(duì)117名飛行員進(jìn)行研究,發(fā)現(xiàn)人體疲勞與腦電波的α(1-4HZ)節(jié)律有關(guān)系,認(rèn)為正常人腦波的α節(jié)律是有規(guī)律而且豐富多彩的。α腦波變化慢會(huì)產(chǎn)生飛行疲勞。</p><p>  2、199

20、1年哈爾濱工業(yè)大學(xué)郭德文[8]指出疲勞是一種自然性保護(hù)反應(yīng),它不但與勞動(dòng)強(qiáng)度有關(guān),而且還與心情、健康程度、環(huán)境、興趣和工作績(jī)效有關(guān)。從生理角度看,疲勞可分為體力疲勞和腦力疲勞。腦力疲勞用誘發(fā)電位的方法:肌肉表面上固定好表面電極,肌電信號(hào)經(jīng)表面電極傳導(dǎo)到肌電圖記錄儀,可以看出,EMG(electro-myography)的頻率隨著疲勞的產(chǎn)生和加深呈現(xiàn)下降趨勢(shì),而EMG的幅值增大則疲勞增大。</p><p>  3、

21、北京醫(yī)科大學(xué)王生[9]教授在肌肉疲勞過程肌電變化實(shí)驗(yàn)觀察中對(duì)20名受試者在實(shí)驗(yàn)室取坐姿,手持不同負(fù)荷,記錄和分析肌肉疲勞過程肌電變化情況,結(jié)果表明隨著負(fù)荷增加,肌電的積分值IEMG(integral of electro-myography)增加,隨著時(shí)間延長(zhǎng),IEMG的值先升高,后下降,實(shí)驗(yàn)結(jié)束時(shí)IEMG降至最低值,受試者感覺疲勞程度逐漸增加,分析認(rèn)為IEMG值低于初始值時(shí)出現(xiàn)疲勞,疲勞時(shí)肌電功率譜左移。并且強(qiáng)調(diào)疲勞是一種十分復(fù)雜的現(xiàn)

22、象。肌肉疲勞是體力勞動(dòng)過程中造成作業(yè)能力下降和引起損傷或疾病的重要原因,但是疲勞一直沒有較好的評(píng)價(jià)方法。嘗試在實(shí)驗(yàn)條件下,采用肌電技術(shù),觀察疲勞過程中肌電變化情況,探討肌電技術(shù)作為判斷肌肉疲勞的一個(gè)客觀指標(biāo)。</p><p>  4、閻淑芳[10]等人在機(jī)動(dòng)車駕駛員操作技能分析中,從宏觀上指出交通事故與人、車、路、環(huán)境等因素有關(guān),而人是主要因素。駕駛員控制車輛的運(yùn)行操作信息90%以上是通過視覺得來的,剩余信息靠聽

23、覺、位覺、動(dòng)覺等得來。在駕駛操作過程中信息是不斷變化的,必須選擇與行車有關(guān)的道路環(huán)境信息,通過感覺器官傳入大腦,經(jīng)過加工判斷支配軀體做出相應(yīng)的動(dòng)作去操作車輛的各控制機(jī)構(gòu)。這一系列的信息、動(dòng)作、信息的反饋和動(dòng)作相應(yīng)的變化,就組成了駕駛員的駕駛技能,以及所呈現(xiàn)的駕駛技能水平,機(jī)動(dòng)車操作動(dòng)作的速度、準(zhǔn)確、協(xié)調(diào)、注意力的敏銳是評(píng)價(jià)操作技能的重要指標(biāo)。通過分析機(jī)動(dòng)車駕駛員操作技能,依據(jù)駕駛過程和環(huán)境,測(cè)出駕駛員的反應(yīng)能力、方向盤的控制能力,手、腳

24、的配合能力、遇有危急情況所采取的措施情況以及對(duì)干擾信息的屏蔽能力等。測(cè)試指標(biāo)包括反應(yīng)時(shí)間、判斷時(shí)間、行駛軌跡、操作正確與錯(cuò)誤次數(shù)、速度判斷等。</p><p>  5、上海交通大學(xué)石堅(jiān)和卓斌[11]通過傳感器測(cè)量駕駛員駕駛時(shí)方向盤、踏板等一些參數(shù)來判別駕駛員的安全因素。駕駛員方向盤的操縱情況與駕駛員的安全具有一定的聯(lián)系。當(dāng)方向盤較長(zhǎng)時(shí)間不動(dòng),說明駕駛員在打瞌睡。研究表明:當(dāng)方向盤產(chǎn)生幅度15°以上,0.

25、4Hz以下的低頻率轉(zhuǎn)動(dòng),說明駕駛員操作的閉環(huán)反應(yīng)較遲鈍,即開始疲勞。駕駛員安全的主觀評(píng)價(jià)值SED(Subjective Evaluation of Drowsiness)與方向盤的轉(zhuǎn)角和角速度參數(shù)的關(guān)系最密切,并給出主動(dòng)安全性的定量指標(biāo)。</p><p>  在過去的幾十年中,人們對(duì)駕駛疲勞進(jìn)行了很多的研究,主要集中在兩個(gè)方向上:</p><p>  (l)駕駛疲勞的生理學(xué)機(jī)理理解和疲勞程

26、度的檢測(cè);(2)在第一個(gè)方向成果的基礎(chǔ)上,開發(fā)出用于商業(yè)運(yùn)輸中的駕駛疲勞監(jiān)測(cè)設(shè)備。</p><p>  1.2.4疲勞駕駛檢測(cè)技術(shù)的研究難點(diǎn)</p><p>  當(dāng)前,疲勞駕駛檢測(cè)技術(shù)的研究是國內(nèi)外研究的前沿和熱點(diǎn),其難點(diǎn)主要包括以下幾方面[12]:</p><p>  (l)對(duì)駕駛員駕駛疲勞的心理、生理屬性不是特別清楚。駕駛員在疲勞狀態(tài)下,其心理和生理特征等與正常

27、狀態(tài)下有較大不同,而目前反映這些特征變化的數(shù)據(jù)很難客觀獲得。</p><p>  (2)疲勞狀態(tài)下的變化規(guī)律很難總結(jié)歸納。盡管目前人們發(fā)現(xiàn)了一些疲勞狀態(tài)下的變化規(guī)律,但這些規(guī)律均是建立在駕駛員清醒狀態(tài)的基礎(chǔ)上,而在疲勞出現(xiàn)后,存在著認(rèn)知能力下降的情況,即這些規(guī)律只能粗略地反映疲勞的狀態(tài)。況且駕駛員個(gè)體在性別、年齡、性格、膚色、體質(zhì)、情緒等多方面存在著差異性,這一切都阻礙了疲勞檢測(cè)方法評(píng)價(jià)指標(biāo)的客觀量化。</

28、p><p>  (3)疲勞駕駛檢測(cè)方法的評(píng)價(jià)標(biāo)準(zhǔn)還在探索中。究竟采用何種標(biāo)準(zhǔn)來客觀準(zhǔn)確地評(píng)價(jià)駕駛疲勞是一個(gè)富有挑戰(zhàn)性的問題。</p><p>  (4)現(xiàn)有的大多數(shù)駕駛疲勞檢測(cè)算法因其檢測(cè)條件的限制和復(fù)雜環(huán)境的影響,不能準(zhǔn)確完整地提取駕駛員的疲勞信息,導(dǎo)致目前開發(fā)的疲勞駕駛檢測(cè)裝置難以快速對(duì)疲勞狀態(tài)做出正確判斷與響應(yīng),檢測(cè)靈敏度低,可靠性差。</p><p>  (5)

29、目前國內(nèi)外關(guān)于疲勞駕駛檢測(cè)的研究還停留在理論和方法的探索上,沒有系統(tǒng)的標(biāo)準(zhǔn)和完善的解決方案,尤其是在如何提高檢測(cè)方法的精度和具體的實(shí)現(xiàn)上最具爭(zhēng)議。</p><p>  (6)現(xiàn)今的疲勞駕駛檢測(cè)裝置或檢測(cè)效果不理想,或成本太高,難以獲得廣泛的應(yīng)用。因此,如何通過改進(jìn)疲勞駕駛檢測(cè)方法來提高檢測(cè)裝置的性價(jià)比是一個(gè)亞待解決的問題。</p><p>  (7)為驗(yàn)證現(xiàn)有疲勞駕駛檢測(cè)方法而設(shè)計(jì)和開發(fā)的

30、檢測(cè)仿真軟件非常有限。目前,在駕駛員已發(fā)生疲勞的條件下,通過大量反復(fù)的人體實(shí)車試驗(yàn)來驗(yàn)證檢測(cè)方法的有效性和可靠性是非常危險(xiǎn)的,而方便、安全、可靠的疲勞駕駛檢測(cè)仿真軟件有待進(jìn)一步研究。</p><p>  1.3研究?jī)?nèi)容以及論文結(jié)構(gòu)的安排</p><p>  本文重點(diǎn)研究了基于照片圖像處理的人臉檢測(cè)、眼睛定位、特征提取和狀態(tài)分析。</p><p>  論文的主要內(nèi)容安

31、排如下:</p><p>  第一章:緒論。簡(jiǎn)要介紹了疲勞駕駛行為的研究背景和意義,總結(jié)了疲勞駕駛檢測(cè)技術(shù)的研究現(xiàn)狀,對(duì)基于視覺的疲勞駕駛檢測(cè)關(guān)鍵技術(shù)作了簡(jiǎn)單介紹,為后續(xù)研究作準(zhǔn)備。</p><p>  第二章:識(shí)別系統(tǒng)的總體結(jié)構(gòu)。本章主要介紹該系統(tǒng)的總體結(jié)構(gòu)以及各個(gè)主要部件的基礎(chǔ)理論。</p><p>  第三章:人臉檢測(cè)。對(duì)人臉檢測(cè)進(jìn)行了初步的概述,以及幾種常用

32、人臉檢測(cè)方法作了簡(jiǎn)要介紹,本文采用了基于膚色檢測(cè)和形態(tài)學(xué)的處理方法來進(jìn)行人臉檢測(cè)。最后結(jié)合人臉結(jié)構(gòu)特征,通過投影來確定面部區(qū)域。</p><p>  第四章:眼睛定位。介紹了多種正面人臉中快速定位眼睛的算法,并選取基于灰度投影的方法和變形模板法對(duì)眼睛進(jìn)行精確定位。灰度投影首先利用灰度投影投影確定眼眉區(qū)域,再結(jié)合水平投影函數(shù)精確定位眼睛。變形模板法則是通過給選定的模板,然待定人臉圖像與模板進(jìn)行匹配,最后能過定位人眼

33、。</p><p>  第五章:眼睛特征提取與狀態(tài)識(shí)別。分別介紹了基于上下眼瞼的方法對(duì)眼睛的開閉狀態(tài)進(jìn)行識(shí)別,并最終選擇了基于眼睛二值化水平投影的識(shí)別方法。通過對(duì)人眼的二值化水平垂直投影曲線最終確定人眼的狀態(tài),進(jìn)而實(shí)現(xiàn)了對(duì)各種眼睛狀態(tài)的識(shí)別。</p><p>  第六章:總結(jié)與展望。對(duì)本文所做的工作進(jìn)行總結(jié),分析了研究過程中存在的不足,并對(duì)未來的研究做了展望。</p><

34、;p>  第二章 識(shí)別系統(tǒng)總體分析</p><p>  2.1 論文結(jié)構(gòu)的總流程 </p><p>  圖1 人眼定位識(shí)別總流程</p><p><b>  2.2 人臉檢測(cè)</b></p><p>  人臉檢測(cè)[13] (Face Detection)是指使用計(jì)算機(jī)在輸入圖像

35、中確定所有人臉(如果存在)的位置與大小的過程。人臉檢測(cè)系統(tǒng)的輸入是可能包含人臉的圖像,輸出是關(guān)于圖像中是否存在人臉以及人臉的數(shù)目、位置、尺度、位姿等信息的參數(shù)化描述。具體地說,就是根據(jù)一定的算法確定輸入圖像是否存在人臉,如果存在的話,標(biāo)出人臉的位置作為人臉檢測(cè)系統(tǒng)的輸出。人臉檢測(cè)的研究受到重視,不僅因?yàn)樗诨谌四樀纳矸蒡?yàn)證、視覺監(jiān)測(cè)以及基于內(nèi)容的檢索等方面有著重要的應(yīng)用,從學(xué)術(shù)的觀點(diǎn)來看,人臉檢測(cè)是物體(模式)檢測(cè)中的一個(gè)典型問題。在

36、智能監(jiān)控、人機(jī)交互、基于對(duì)象的編碼等領(lǐng)域也有著廣泛的應(yīng)用。計(jì)算機(jī)檢測(cè)人臉的困難之處在于:背景、表情、光照、成像角度、成像距離等影響,而且從二維圖像重建三維人臉是病態(tài)過程,目前尚無很好的描述人臉的三維模型。此外,人臉檢測(cè)還涉及圖像處理、模式識(shí)別、以及神經(jīng)網(wǎng)絡(luò)等多學(xué)科。如果用于實(shí)時(shí)處理,還要加上計(jì)算速度的要求。這些因素使得高質(zhì)量的人臉檢測(cè)仍為一項(xiàng)極富</p><p>  挑戰(zhàn)性的課題,受到研究者的關(guān)注。 </p

37、><p><b>  2.3 人眼定位</b></p><p>  眼睛定位是指在輸入的圖像中檢測(cè)出眼睛的位置,它是判斷眼睛狀態(tài)的前提,因此如何準(zhǔn)確、快速地定位人眼是實(shí)現(xiàn)駕駛疲勞狀態(tài)監(jiān)控的關(guān)鍵。目前其中人眼定位的方法主要有霍夫變換法,對(duì)稱變換法,變形模板法,邊緣特征分析法等。</p><p><b>  2.4人眼狀態(tài)識(shí)別</b&g

38、t;</p><p>  眼睛狀態(tài)識(shí)別是駕駛員疲勞檢測(cè)的非常重要的一個(gè)環(huán)節(jié),為了對(duì)眼部狀態(tài)進(jìn)行有效的識(shí)別,本文提出一種人眼狀態(tài)識(shí)別的新方法,該方法利用二值化水平投影人眼狀態(tài)識(shí)別,快速、實(shí)時(shí)、有效地識(shí)別出駕駛員疲勞時(shí)眼部狀態(tài)。</p><p><b>  2.5總述</b></p><p>  本文是主要采用空間變換和膚色檢測(cè)以及形態(tài)學(xué)的處理方法

39、來進(jìn)行人臉檢測(cè)的,而后再采用邊緣特征分析法和變形模板法的方法兩種方法來對(duì)人眼進(jìn)行定位。邊緣特征分析法在檢測(cè)出人臉的基礎(chǔ)上,在人臉上半部區(qū)域采用人提出的灰度圖投影算法檢測(cè)出駕駛員正常狀態(tài)下睜開的眼睛。把檢測(cè)出的眼睛與眉毛一起分割出來作為睜開狀態(tài)的眼睛模板。然后重復(fù)以上步驟,如果沒有檢測(cè)到眼睛,把眼睛睜開狀態(tài)模板與未檢測(cè)到眼睛位置的人臉上半部圖像進(jìn)行匹配,當(dāng)該圖像最大相似度小于某設(shè)定閾值時(shí)認(rèn)為眼睛睜得很小或閉合狀態(tài),否則認(rèn)為眼睛睜得正常。而

40、變形模板法則主要是模板的選擇,根據(jù)所選模板的維數(shù)可分為二維可變形模板和三維可變形模板,有已知模板和待測(cè)圖像進(jìn)行匹配定位人眼。最后,使用二值化水平投影法進(jìn)行對(duì)人眼狀態(tài)進(jìn)行識(shí)別。</p><p><b>  第三章 人臉檢測(cè)</b></p><p>  3.1人臉檢測(cè)的概述</p><p>  在理論上講,人臉檢測(cè)是一項(xiàng)極具意義的研究領(lǐng)域。人臉識(shí)

41、別是一種特定內(nèi)容的模式識(shí)別問題。人臉識(shí)別從廣義上講包括兩個(gè)過程[14]:(1)人臉檢測(cè);(2)人臉分類。第一個(gè)過程,人臉檢測(cè)是指在圖像上檢測(cè)有無人臉,若有應(yīng)判別出人臉的位置和大小。這是一種根據(jù)人臉樣本模式的共性特征進(jìn)行模式識(shí)別的操作:它將圖像內(nèi)待檢的任意一個(gè)子區(qū)域劃分為兩類模式:人臉和非人臉。第二個(gè)過程,人臉分類(亦即狹義上的人臉識(shí)別)是指對(duì)當(dāng)前人臉模式進(jìn)行比較判別,區(qū)分它們的臉型、眼型、口型、表情、性別、年齡、種族和身份等。這是一種根

42、據(jù)人臉樣本模式的個(gè)性特征進(jìn)行模式識(shí)別的操作:它將特定人臉上的有關(guān)特征或特征點(diǎn)提取和檢測(cè)出來并與已知類別的標(biāo)準(zhǔn)樣本特征相配,從而描述和刻畫人臉。</p><p>  3.1.2人臉檢測(cè)研究現(xiàn)狀</p><p>  人臉檢測(cè)技術(shù)的研究最早可追溯到19世紀(jì)法國人Alotn[15]的工作。現(xiàn)代研究始于20世紀(jì)60年代末70年代初,并隨著科學(xué)技術(shù)而發(fā)展。自90年代以來一直是研究熱點(diǎn),各種算法層出不窮

43、,相關(guān)雜志上發(fā)表的有關(guān)論文數(shù)以千計(jì)。目前國內(nèi)外針對(duì)人臉檢測(cè)問題的研究很多,比如著名的MIT、CMU等,而且MpEG7標(biāo)準(zhǔn)組織已經(jīng)建立了人臉識(shí)別草案小組,人臉檢測(cè)算法也是征集內(nèi)容之一。國外對(duì)人臉檢測(cè)問題的研究很多,許多國家展開了人臉檢測(cè)的研究,主要是美國、歐洲國家、日本、新加坡、韓國等,著名的研究機(jī)構(gòu)有美國MIT的MediaIab、AI!ab,CMU的Human一Computer Interface Institute,Microsoft

44、 Research,英國的Department of Engineering in University of Cambridge等。方法主要集中在以下幾個(gè)方面:早期的有模板匹配、基于特征的方法(空域),中期主要是示例學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、統(tǒng)計(jì)模型、彩色信息、形狀分析等方法,近期主要集中在彩色信息、頻域中的特征提取、新分類方法的應(yīng)用,例如支持向量機(jī)、多模態(tài)信息融學(xué)習(xí)方法。隨著人臉檢測(cè)</p><p>  國內(nèi)在這方面的

45、研究起步于20世紀(jì)80年代,有清華大學(xué)、北京工業(yè)大學(xué)、中科院計(jì)算技術(shù)研究所等,受到了國家863計(jì)劃的大力扶持,發(fā)展很快。2000年以來,每年一屆的“中國生物識(shí)別學(xué)術(shù)會(huì)議”極大地推動(dòng)了包括人臉識(shí)別在內(nèi)的生物識(shí)別技術(shù)水平的發(fā)展?,F(xiàn)在,國內(nèi)也已建成世界上較全面、規(guī)模最大的東方人臉圖像數(shù)據(jù)庫[16]。哈爾濱工業(yè)大學(xué)的研究者實(shí)現(xiàn)了一個(gè)復(fù)雜背景下的多級(jí)結(jié)構(gòu)的人臉檢測(cè)與跟蹤系統(tǒng),其中采用了模板匹配、特征子臉、彩色信息等人臉檢測(cè)技,能夠檢測(cè)平面內(nèi)多姿態(tài)

46、正面人臉,并可以跟蹤任意姿態(tài)的運(yùn)動(dòng)的人臉。北京工業(yè)大學(xué)的研究人員提出了人臉重心模板這一新技術(shù)并運(yùn)用這一技術(shù)建立了一個(gè)于復(fù)雜背景中檢測(cè)人臉的系統(tǒng)。</p><p>  3.2 人臉檢測(cè)幾種方法</p><p>  人臉檢測(cè)問題所包含的內(nèi)容十分廣泛,從不同的角度有不同的分類方法。本文介紹的方法主要是針對(duì)靜態(tài)圖像中的人臉檢測(cè)。目前已有的人臉檢測(cè)方法種類繁多,大致可分四類:基于知識(shí)的人臉檢測(cè)方法、

47、基于統(tǒng)計(jì)模型的人臉檢測(cè)方法、基于特征的人臉檢測(cè)方法和基于模板匹配的人臉檢測(cè)方法。本文采用基于上述方法利用matlab自己編寫的程序,最終實(shí)現(xiàn)人臉的檢測(cè),主要采用了空間變換,形態(tài)學(xué)的某些處理,以及圖像的邊緣處理。</p><p>  3.2.1基于知識(shí)的方法</p><p>  基于知識(shí)的方法是基于規(guī)則的人臉檢測(cè)方法,規(guī)則來源于研究者關(guān)于人臉的先驗(yàn)知識(shí)。一般比較容易提出簡(jiǎn)單的規(guī)則來描述人臉特

48、征和它們的相互關(guān)系,如在一幅圖像中出現(xiàn)的人臉,通常具有互相對(duì)稱的兩只眼睛、一個(gè)鼻子和一張嘴。特征之間的相互關(guān)系可以通過它們的相對(duì)距離和位置來描述。在輸入圖像中首先提取面部特征,確定基于編碼規(guī)則的人臉候選區(qū)域。</p><p>  這種方法存在的問題是很難將人類知識(shí)轉(zhuǎn)換為明確定義的規(guī)則。如果規(guī)則是詳細(xì)的(嚴(yán)格的),由于不能通過所有的規(guī)則,檢測(cè)可能失敗;如果規(guī)則太概括(通用),可能會(huì)有較高的錯(cuò)誤接收率。此外,很難將這

49、種方法擴(kuò)展到在不同的位姿下檢測(cè)人臉,因?yàn)榱信e所有的情況是一項(xiàng)很困難的工作。</p><p>  3.2.2基于統(tǒng)計(jì)模型的方法</p><p>  由于人臉圖像的復(fù)雜性,顯式地描述人臉特征具有一定困難,因此另一類方法—基于統(tǒng)計(jì)模型的方法越來越受到重視。此類方法將人臉區(qū)域看作一類模式,即模板特征,使用大量的“人臉”與“非人臉”樣本訓(xùn)練、構(gòu)造分類器,通過判別圖像中所有可能區(qū)域?qū)儆谀念惸J降姆椒▽?shí)

50、現(xiàn)人臉的檢測(cè)。實(shí)際上,人臉檢測(cè)問題被轉(zhuǎn)化為統(tǒng)計(jì)模式識(shí)別的二分類問題。</p><p>  基于特征空間的方法。</p><p>  此類方法將人臉區(qū)域圖象變換到某一特征空間,根據(jù)其在特征空間中的分布規(guī)律劃分“人臉”與“非人臉”兩類模式。主元分析(PCA,principal---Component Analysis)是一種常用的方法。它根據(jù)圖像的統(tǒng)計(jì)特性進(jìn)行的正交變換(K一

51、L變換),以消除原有向量各個(gè)分量間的相關(guān)性。變換得到對(duì)應(yīng)特征值依次遞減的特征向量,即特征臉。</p><p>  (2)基于人工神經(jīng)網(wǎng)的方法</p><p>  人工神經(jīng)網(wǎng)(ANN) [17]方法是把模式的統(tǒng)計(jì)特性隱含在ANN的結(jié)構(gòu)和參</p><p>  臉這類復(fù)雜的、難以顯式描述的模式,基于N的方法具有獨(dú)的勢(shì)。</p><p>  3.2

52、.3基于特征的方法</p><p>  基于特征的方法不僅可以從已有的面部特征而且可以從它們的幾何關(guān)系進(jìn)行人臉檢測(cè)。與基于知識(shí)的方法相反,它是尋找人臉的不變特征用于人臉檢測(cè)。人們己經(jīng)提出了許多先檢測(cè)人臉面部特征,后推斷人臉是否存在的方法。面部特征,如眉毛、眼睛、鼻子、嘴和發(fā)際,一般利用邊緣檢測(cè)器提取,根據(jù)提取的特征,建立統(tǒng)計(jì)模型描述特征之間的關(guān)系并確定存在的人臉。基于特征的算法存在的問題是,由于光照、噪聲和遮擋等

53、使圖像特征被嚴(yán)重地破壞,人臉的特征邊界被弱化,陰影可能引起很強(qiáng)的邊緣,而這些邊緣可能使得算法難以使用。</p><p>  3.2.4基于模板匹配的人臉檢測(cè)方法</p><p>  在機(jī)器識(shí)別事物的過程中,常需把不同傳感器或同一傳感器在不同時(shí)間和不同成像條件下對(duì)同一景物獲取的兩幅或多幅圖像在空間上對(duì)準(zhǔn),或根據(jù)已知模式在另一幅圖中尋找相應(yīng)的模式,這就叫匹配。早期基于模板匹配[18]的檢測(cè)方法

54、是這樣做的:首先建立一個(gè)標(biāo)準(zhǔn)的人臉模板,由包含局部人臉特征的子模板構(gòu)成,然后對(duì)一幅輸入圖像進(jìn)行全局搜索,對(duì)應(yīng)不同尺度大小的圖像窗口,計(jì)算與標(biāo)準(zhǔn)人臉模板中不同部分的相關(guān)系數(shù),通過預(yù)先設(shè)置的閉值來判斷該圖像窗口中是否包含人臉。</p><p>  3.3 基于膚色檢測(cè)和形態(tài)學(xué)處理的人臉檢測(cè)</p><p>  3.3.1色彩空間的選取</p><p>  為了把人臉區(qū)域

55、從非人臉區(qū)域分割出來,需要使用適合不同膚色和不同光照條件的可靠的膚色模型,高效膚色模型的建立首先要選取一種合適的色彩空間。色彩空間又稱為色彩坐標(biāo)系,在機(jī)器視覺中一般稱為色彩模型,是顏色在三維空間中的排列方式。目前人臉定位[19]主要使用的色彩空間有RGB色彩空間、Hls色彩空間、YcbCr色彩空間等。</p><p><b>  RGB色彩空間</b></p><p>

56、;  RGB色彩空間也稱為紅、綠、藍(lán)基色模型。為標(biāo)準(zhǔn)化起見,CIE(國際照明委員會(huì))在1931年選擇紅色(波長(zhǎng)A==700.0nm),綠色(波長(zhǎng)A=546.1nm),藍(lán)色(波長(zhǎng)A=435.8nm)三種單色光作為表色系統(tǒng)的三基色,這就是RGB色彩空間,它也是最常見的色彩空間。由于彩色圖像是多光譜圖像的一種特殊情況,對(duì)應(yīng)于人類視覺的三基色,即紅、綠、藍(lán)三個(gè)波段,是對(duì)人眼的光譜量化性質(zhì)的近似。因此利用R、G、B三基色這三個(gè)分量來表征顏色是很自

57、然的一種格式。而且多數(shù)的圖像采集設(shè)備都是以CCD(電荷藕合器件)技術(shù)為核心,直接感知色彩的R、G、B三個(gè)分量,這也使得 RGB模型成為圖像成像、顯示、打印等設(shè)備的基礎(chǔ),具有十分重要的作用。</p><p><b>  HIS色彩空間</b></p><p>  HIS色彩空間,即色度、飽和度、亮度模型,反映了人類觀察色彩的方式,同時(shí)也有利于圖像的處理。優(yōu)點(diǎn)在它將亮度與

58、反映色彩本質(zhì)特性的色度、飽和度分開。我們提取物體在色彩方面的特性時(shí),經(jīng)常需要了解其在某一色彩空間的聚類特性,而這一聚類特性往往體現(xiàn)在色彩的本質(zhì)特性上,并且經(jīng)常受到光照明暗等條件的影響。光照明暗給物體顏色帶來的直接影響就是亮度分量,所以若能將亮度分量從色彩中提取出去,而只用反映色彩本質(zhì)特性的色度、飽和度來進(jìn)行聚類分析,會(huì)獲得比較好的效果。這也正是HIS格式在色彩圖像處理和計(jì)算機(jī)視覺的研究中經(jīng)常被使用的原因。</p><

59、p><b>  YcbCr色彩空間</b></p><p>  YCbcr[10] (也稱為YUV)是被歐洲電視系統(tǒng)采用的一種顏色編碼方法,主要用于優(yōu)化彩色視頻信號(hào)的傳輸,使其向后兼容老式黑白電視。與RGB視頻信號(hào)傳輸相比,它最大的優(yōu)點(diǎn)在于只需占用極少的帶寬(RGB要求三個(gè)獨(dú)立的視頻信號(hào)同時(shí)傳輸)。在YUV空間中,Y表示明亮度(Luminance),也就是灰階值;而U和V表示的則是色度

60、(Chrominance或Cbroma),作用是描述影像色彩及飽和度,用于指定像素的顏色。亮度是通過RGB輸入信號(hào)來創(chuàng)建的,方法是將RGB信號(hào)的特定部分疊加到一起。色度則定義了顏色的兩個(gè)方面:色調(diào)與飽和度,分別用Cr和Cb來表示。其中,Cr反映RGB輸入信號(hào)紅色部分與RGB信號(hào)亮度值之間的差異,而Cb反映RGB輸入信號(hào)藍(lán)色部分與RGB信號(hào)亮度值之同的差異。</p><p>  YcbCr空間可以直接由RGB空間通

61、過線性變換得到,轉(zhuǎn)換公式如下:</p><p>  (3.1) 研究表明[21]:雖然不同人的皮膚顏色可能相差很大,但它們?cè)谏壬系牟町愐h(yuǎn)遠(yuǎn)小于亮度上的差異。也就是說,不同人的膚色在色度上往往是相近的,但在亮度上有較大差異。因此,對(duì)于以顏色特征來檢測(cè)人臉的系統(tǒng)而言,需要顏色空間的聚類效果好,基本不受亮度影響。我們知道RGB空間中的三個(gè)分量都分別包含亮度信息和色度信息,這樣膚色分割的結(jié)果就容易受光照的影響

62、,所以選用一個(gè)把亮度信息作為單獨(dú)分量的色彩空間更為合適。本文選擇YCbCr空間對(duì)膚色分布進(jìn)行研究。</p><p>  3.3.2形態(tài)學(xué)處理</p><p>  (1)二值圖像的膨脹腐蝕運(yùn)算</p><p>  設(shè)A為圖像集合,B為結(jié)構(gòu)元素,數(shù)學(xué)形態(tài)學(xué)運(yùn)算是用B對(duì)A進(jìn)行操作。其中A,B中的元素都是邏輯值0或1組成。</p><p>  膨脹:

63、用B來膨脹A記做:A⊕B。定義為:</p><p>  A⊕B={x︱∩A≠} (3.2)</p><p>  代表先對(duì)B作關(guān)于原點(diǎn)的映射,再將其映像平移x。</p><p>  用B來膨脹A得到的集合是B的位移與A至少有一個(gè)非零元素相交時(shí)B的原點(diǎn)位置的集合。</p><p>  腐

64、蝕:用B來腐蝕A記做:AB。定義為:</p><p>  AB={x︱A} (3.3)</p><p>  代表將B平移x。B腐蝕A的結(jié)果是所有x的集合,其中B平移x后還在A中。即結(jié)果是B完全包含在A中時(shí)B的原點(diǎn)位置的集合。</p><p><b>  開運(yùn)算與閉運(yùn)算</b&g

65、t;</p><p>  膨脹和腐蝕并不是互為逆運(yùn)算,所以可以級(jí)聯(lián)結(jié)合使用。開運(yùn)算和閉運(yùn)算就是基于腐蝕膨脹兩種順序不同的級(jí)聯(lián)運(yùn)算。</p><p>  開運(yùn)算是先腐蝕后膨脹,其定義為:</p><p>  AB=(AB)⊕B (3.4)</p><p>  閉運(yùn)算是先膨脹后腐蝕,

66、其定義為:</p><p>  AB=(A⊕B)B (3.5)</p><p>  開運(yùn)算與閉運(yùn)算[22]無論運(yùn)用于二值圖像還是灰度圖像上都可以去除比結(jié)構(gòu)元素小的特點(diǎn)圖像細(xì)節(jié)并起到平滑的效果,同時(shí)保證不產(chǎn)生全局的幾何失真。開運(yùn)算可以把比結(jié)構(gòu)元素小的凸刺濾掉,切斷細(xì)長(zhǎng)搭接從而起到分離作用。閉運(yùn)算可以把比結(jié)構(gòu)元素小的缺口或孔填充上

67、,搭接短的間斷從而起到鏈接的作用[23]。</p><p>  3.3.3 人臉檢測(cè)</p><p>  有了上述工作作為基礎(chǔ),我們就可以對(duì)一幅彩色圖像進(jìn)行人臉檢測(cè)了。具體流程圖如下:</p><p>  圖2 人臉檢測(cè)流程圖</p><p>  圖3 原圖像 圖4 人臉檢測(cè)</p><

68、p>  圖5 最優(yōu)二值化圖 圖6 膨脹 </p><p>  圖7 邊緣檢測(cè)圖8 圖像去噪</p><p><b>  圖9 人臉定位 </b></p><p>  3.3.4 實(shí)現(xiàn)人臉檢測(cè)程序如下:</p><p>  clear; %清空工作區(qū)變量</p><p>  I

69、mage=imread('z1.jpg'); %讀取圖像文件</p><p>  imshow(Image);</p><p>  Iycbcr=rgb2ycbcr(Image); %顏色空間轉(zhuǎn)換</p><p>  [m,n,k]=size(Image);</p><p>  for i=1:1:m

70、 %根據(jù)CbCr的閾值生成二值圖像</p><p>  for j=1:1:n</p><p>  if(Iycbcr(i,j,2)<125&&Iycbcr(i,j,2)>90&&Iycbcr(i,j,3)<170&&Iycbcr(i,j,3)>133)</p><

71、p>  Ibw(i,j)=255;</p><p><b>  else</b></p><p>  Ibw(i,j)=0;</p><p><b>  end</b></p><p><b>  end</b></p><p><b>

72、  end</b></p><p>  figure,imshow(Ibw); %繪圖IbW</p><p>  SE = strel('square',3);</p><p>  Ibwopen=imopen(Ibw,SE); %開運(yùn)算(即先腐蝕再膨脹),消除雜散點(diǎn)</p&g

73、t;<p>  %figure,imshow(Ibwopen);</p><p>  Ibwoc=imclose(Ibwopen,SE); %閉運(yùn)算,去掉由于開運(yùn)算引入的許多缺口</p><p>  %figure,imshow(Ibwoc);</p><p>  imf=imfill(Ibwoc,'holes');

74、 %填充孔洞</p><p>  %figure,imshow(imf);</p><p>  Iedged=edge(imf,'Roberts'); %邊緣檢測(cè)</p><p>  %figure,imshow(Iedged);</p><p>  [Ilabeled regionnum]=bwlabel(Iedge

75、d,8); %連通區(qū)域標(biāo)記</p><p>  %regloc是一個(gè)二維數(shù)組,第1維:region編號(hào),第2維:1234分別代表top、left、right、bottom值</p><p>  for i=1:1:regionnum</p><p>  regloc(i,1)=n;</p><p>  regloc(i,2)=m;&l

76、t;/p><p>  regloc(i,3)=0;</p><p>  regloc(i,4)=0;</p><p><b>  end</b></p><p>  %通過對(duì)圖像的象素級(jí)搜索得出各個(gè)連通區(qū)域的regloc值,為畫框作準(zhǔn)備</p><p>  for i=1:1:m</p>

77、<p>  for j=1:1:n</p><p>  if(Ilabeled(i,j)~=0)</p><p>  num=Ilabeled(i,j);</p><p>  if(i<regloc(num,1))</p><p>  regloc(num,1)=i;</p><p><b>

78、;  end</b></p><p>  if(j<regloc(num,2))</p><p>  regloc(num,2)=j;</p><p><b>  end</b></p><p>  if(j>regloc(num,3))</p><p>  regloc(

79、num,3)=j;</p><p><b>  end</b></p><p>  if(i>regloc(num,4))</p><p>  regloc(num,4)=i;</p><p><b>  end</b></p><p><b>  end&l

80、t;/b></p><p><b>  end</b></p><p><b>  end</b></p><p><b>  hold on;</b></p><p>  for num=1:1:regionnum</p><p>  if(re

81、gloc(num,4)>(regloc(num,1)+(regloc(num,3)-regloc(num,2))*1.2)) %人臉長(zhǎng)寬比限制</p><p>  regloc(num,4)=regloc(num,1)+(regloc(num,3)-regloc(num,2))*1.2;</p><p><b>  end</b></p>

82、<p>  x=[regloc(num,2);regloc(num,2);regloc(num,3);regloc(num,3);regloc(num,2)];</p><p>  y=[regloc(num,1);regloc(num,4);regloc(num,4);regloc(num,1);regloc(num,1)];</p><p>  plot(x,y);

83、 %畫框</p><p><b>  end </b></p><p><b>  3.4 本章小結(jié)</b></p><p>  這一章首先介紹了幾種常用的人臉檢測(cè)方法,并對(duì)它們各自的優(yōu)缺點(diǎn)進(jìn)行了比較,選擇了實(shí)時(shí)性能較好的基于膚色檢測(cè)和形態(tài)學(xué)處理的人臉檢測(cè)算法。其次,對(duì)幾種主要的色彩空間以及膚色在YcbCr色彩空間中的聚類

84、特性作了說明,但膚色在YCbC泡彩空間中的聚類區(qū)域受光照影響較大,后經(jīng)過一系列的處理,最后結(jié)合人臉結(jié)構(gòu)特征,定位人臉。</p><p><b>  第四章 人眼定位</b></p><p><b>  4.1 引言</b></p><p>  研究表明,駕駛員疲勞主要表現(xiàn)在眼睛上,眼睛狀態(tài)能可靠地反映駕駛員是否疲勞。眼睛

85、定位[24]是指在輸入的圖像中檢測(cè)出眼睛的位置,它是判斷眼睛狀態(tài)的前提,因此如何準(zhǔn)確、快速地定位人眼是實(shí)現(xiàn)駕駛疲勞狀態(tài)監(jiān)控的關(guān)鍵。</p><p>  本章主要介紹了在定位駕駛員面部區(qū)域之后,如何對(duì)人眼進(jìn)行識(shí)別和定位,并將一種實(shí)時(shí)跟蹤眼睛的算法融合到實(shí)驗(yàn)中,獲得了良好的眼睛定位與跟蹤效果。在人臉圖像中定位眼睛是一個(gè)重要的研究課題。在人臉的特征抽取、人臉圖像的校準(zhǔn)以及表情識(shí)別等應(yīng)用中眼睛常常是關(guān)鍵部位,因此定位眼睛

86、是這些研究領(lǐng)域中必須解決的問題。</p><p>  4.2正面人臉中的眼睛定位方法</p><p>  鑒于駕駛這一特殊環(huán)境條件下所獲取的基本為正面人臉,并且駕駛過程中人臉一般正視前方,所以本節(jié)首先討論正面端正人臉中的眼部區(qū)域定位。</p><p>  目前正面人臉中快速定位眼睛的算法主要有[25]: 霍夫變換法,對(duì)稱變換法,變形模板法,邊緣特征分析法等。本文結(jié)合

87、人臉的膚色和幾何特征最終采取變形模板的方法來定位人眼。</p><p>  4.2.1常用的幾種眼睛定位算法</p><p>  (1) 霍夫變換法[26]</p><p>  假設(shè)經(jīng)預(yù)處理已經(jīng)得到包含眼球的圖像Ep,為了節(jié)省檢測(cè)眼球的時(shí)間并避免鏡片反光點(diǎn)邊緣產(chǎn)生的干擾,先用小灰度聚類法粗定眼球中心點(diǎn),以此縮小檢測(cè)范圍,聚類的過程是將圖像Ep中灰度值最小的n個(gè)像素,

88、按列遞增的順序排序,若相鄰的列數(shù)差值都未超過預(yù)先設(shè)定的門限T1,說明只有一個(gè)聚類中心,求出這些像素行列的平均值就是要找的眼球中心點(diǎn);若超過了門限T1,說明這n個(gè)像素可以聚成兩類,對(duì)左眼,因?yàn)殛幱?、鏡腳集中在左邊,所以取右邊那類的平均值;對(duì)右眼,則取左邊那類的平均值;n的選擇可根據(jù)圖像Ep的總像素?cái)?shù)目及眼球占圖像的大致百分比決定。</p><p>  在用霍夫變換檢測(cè)眼球前,先用Canny算法提取邊緣。對(duì)于比較細(xì)長(zhǎng)

89、的眼睛,由于眼球的上半部分較多地被眼皮覆蓋,所以改用檢測(cè)下半圓,這樣更可靠且省時(shí)。設(shè)圖像空間為(i,j),i和j分別表示行和列,三維變換空間為(ie,je,R),其中ie、je分別代表眼球圓心的行和列,R為半徑。下半圓表達(dá)式為:</p><p><b> ?。?.1)</b></p><p>  對(duì)于變換空間的每一個(gè)坐標(biāo)點(diǎn)(,,R),在圖像空間都對(duì)應(yīng)一個(gè)半圓,在這個(gè)半

90、圓上存在的邊緣點(diǎn)數(shù)就是變換空間上坐標(biāo)點(diǎn)(,,R)對(duì)應(yīng)的值。變換空間上的峰值點(diǎn)坐標(biāo)即為所求的眼球半圓參數(shù)。實(shí)驗(yàn)證明,霍夫變換確實(shí)具有抗干擾能力強(qiáng)的優(yōu)點(diǎn)。當(dāng)眼球與眼白的對(duì)比度較低時(shí),提取出來的邊緣是斷裂或不很規(guī)則的,即使如此,仍能根據(jù)變換空間中的峰值點(diǎn)準(zhǔn)確地定位眼球圓心。</p><p><b>  (2).對(duì)稱變換法</b></p><p>  近年來,計(jì)算機(jī)視覺研究領(lǐng)

91、域中的一些方法被用于人臉器官的定位和特征提取,其中比較引人注目的是廣義對(duì)稱變換GST(Generalized symmetry Transform)。廣義對(duì)稱變換[27]用以描述物體的點(diǎn)對(duì)稱,可應(yīng)用于人臉器官中具有很強(qiáng)點(diǎn)對(duì)稱性的眼睛、嘴巴、鼻子的定位和特征提取。</p><p>  所謂對(duì)稱變換[28]:就是通過特定的算子將數(shù)字圖像I(P)映射到另一個(gè)空間</p><p>  F(P)上。

92、對(duì)于F空間的任一元素來說,F(xiàn)(,) =(對(duì)稱值,對(duì)稱角度)。特定算子可以根據(jù)應(yīng)用的不同要求而自行定義。對(duì)稱變換多用于檢測(cè)圖像中感興趣的區(qū)域,因此算子的定義要考慮感興趣區(qū)域的特點(diǎn)。</p><p>  基于改進(jìn)對(duì)稱變換的眼睛定位算法將眼睛劃分為環(huán)形對(duì)稱區(qū)和橢圓對(duì)稱區(qū),充分利用了整個(gè)眼部的梯度信息,對(duì)于成像質(zhì)量較差的人臉圖像具有更強(qiáng)的魯棒性。</p><p><b> ?。?)變形模

93、板法</b></p><p>  模板匹配法主要是模板的選擇,根據(jù)所選模板的維數(shù)可分為二維可變形模板和三維可變形模板。本文將模板都變成二維的圖形,用變形模板對(duì)眼睛進(jìn)行定位,通過設(shè)定不同的權(quán)值并利用梯度下山法使能量函數(shù)最小化,彈性模板被“拖”到人眼附近;而后逐步完成尺寸、偏轉(zhuǎn)角度以及位置和形狀上的微調(diào),得到模板參數(shù)的最佳值,即為最后眼睛模板的位置。</p><p>  這種方法雖

94、然能夠較為精確地定位眼睛,但是模板法在實(shí)際應(yīng)用中最大的缺點(diǎn)是時(shí)間代價(jià)太大,無法保證實(shí)時(shí)性。</p><p> ?。?)邊緣特征分析法</p><p>  此算法[29]所處理的圖像為單人灰度圖像,是利用圖像的垂直灰度投影曲線,根據(jù)凸峰寬度確定人臉的左右邊界,然后利用人臉區(qū)域的水平灰度投影曲線確定頭頂及鼻子中部形成的上下邊界。利用預(yù)測(cè)法先確定人眼在眉眼區(qū)域的大概位置,通過檢測(cè)眉眼部位的邊緣及

95、邊緣分組,確定雙眼的坐標(biāo)位置。</p><p>  該算法的優(yōu)勢(shì)在于首先通過灰度投影曲線確定眉眼區(qū)域,使數(shù)據(jù)量大大減少,然后在有效的邊緣檢測(cè)之后,使用了高效的邊緣分組策略,在保證正確率的基礎(chǔ)上,提高了算法速度。此算法的定位錯(cuò)誤出現(xiàn)在頭部?jī)A斜度過大,以及側(cè)光太強(qiáng),還有頭部在圖像中所占區(qū)域過小的情況。</p><p>  本文將采用后兩種方法進(jìn)行人眼定位,這兩種方法各有優(yōu)缺點(diǎn)。</p&g

96、t;<p>  4.3邊緣分析法定位人眼實(shí)現(xiàn)</p><p>  4.3.1 邊緣分析的幾種常見的算子</p><p> ?。?)Roberts邊緣檢測(cè)算子</p><p>  Roberts邊緣檢測(cè)算子是一種利用局部差分算子尋找邊緣的算子。它由下式給出:</p><p> ?。?.2) 其中f(x,y)是具有整數(shù)像素

97、坐標(biāo)的輸入圖像,平方根運(yùn)算使該處理類似于在人類視覺系統(tǒng)中發(fā)生的過程。</p><p>  (2)Sobel邊緣算子</p><p>  下圖所示的兩個(gè)卷積核形成了Sobel邊緣算子,圖像中的每個(gè)點(diǎn)都用這兩個(gè)核做卷積,一個(gè)核對(duì)通常的垂直邊緣響應(yīng)最大,而另一個(gè)對(duì)水平邊緣響應(yīng)最大。兩個(gè)卷積的最大值作為該點(diǎn)的輸出位。運(yùn)算結(jié)果是一幅邊緣幅度圖像。</p><p>  圖10

98、Sobel邊緣算子</p><p> ?。?)Prewitt邊緣算子</p><p>  兩個(gè)卷積核形成了Prewitt邊緣算子。和使用Sobel算子的方法一</p><p>  樣,圖象中的每個(gè)點(diǎn)都用這兩個(gè)核進(jìn)行卷積,取最大值作為輸出。Prewitt算子也產(chǎn)生一幅邊緣幅度圖像。 </p><p>  圖11 Prewitt邊緣算子</

99、p><p>  4.3.2邊緣檢測(cè)實(shí)現(xiàn) </p><p>  圖 12 原圖 圖13 Sobel邊緣檢測(cè)</p><p>  圖14Roberts邊緣檢測(cè) 圖15 Prewitt邊緣算子 圖16 canny邊緣檢測(cè)</p><p><b>  實(shí)現(xiàn)程序 :</b>

100、</p><p>  a=imread('009.jpg');%讀入圖像</p><p>  I=rgb2gray(a); % 圖像二值化</p><p>  figure,imshow(I);%顯示圖像</p><p>  BW1=edge(I,'sobel'); %邊緣檢測(cè)</p><

101、;p>  BW2=edge(I,'roberts');</p><p>  BW3=edge(I,'prewitt'); </p><p>  BW5=edge(I,'canny'); </p><p>  BW6=edge(I,'canny');</p><p>  su

102、bplot(2,3,1), imshow(BW1);%顯示邊緣檢測(cè)結(jié)果</p><p>  title('sobel edge check');</p><p>  subplot(2,3,2), imshow(BW2);</p><p>  title('roberts edge check');</p><p&

103、gt;  subplot(2,3,3), imshow(BW3);</p><p>  title('prewitt edge check');</p><p>  subplot(2,3,4), imshow(BW5);</p><p>  title('canny edge check');</p><p>

104、;  4.3.3. 人眼定位實(shí)現(xiàn)</p><p>  觀察不同單人臉圖像的垂直灰度投影曲線,可以發(fā)現(xiàn)人臉?biāo)趨^(qū)域?qū)⑹勾怪被叶韧队扒€形成一個(gè)具有一定寬度的凸峰。這個(gè)凸峰的左右邊界大致代表了人臉的左右邊界。當(dāng)人臉的左右邊界確定之后,取左右邊界之間的人臉區(qū)域作為研究對(duì)象,作該圖像的水平灰度投影曲線,觀察人臉區(qū)域圖像的水平投影曲線可以發(fā)現(xiàn),此曲線的第一個(gè)極小值點(diǎn)對(duì)應(yīng)人的頭頂,因?yàn)轭^發(fā)的低灰度產(chǎn)生了水平投影曲線的低谷,而

105、曲線的最大值點(diǎn)和次最大值點(diǎn)分別對(duì)應(yīng)人的額頭部位和人的鼻中部,這樣就可以輕易地求得人眼所處的大致水平位置。</p><p>  在邊緣檢測(cè)前先對(duì)眉眼區(qū)域進(jìn)行去噪、增強(qiáng)處理,使圖像平滑,這是保證下面邊緣檢測(cè)獲得較好效果的關(guān)鍵步驟。然后用Canny算子求出眉眼區(qū)域的邊緣圖像[30],求解時(shí)閾值取得較高,使得邊緣點(diǎn)僅由眉毛和眼睛的強(qiáng)邊緣以及瞳孔產(chǎn)生的強(qiáng)邊緣組成,而不會(huì)包含由鼻子的輪廓產(chǎn)生的弱邊緣。隨后將邊緣點(diǎn)進(jìn)行分組,可

106、以得到幾組分離的邊緣,其中位于下面的兩組分別為左右兩眼產(chǎn)生的邊緣,取這兩個(gè)邊緣組的中心作為人眼的中心。邊緣分組算法[31]中,將分別包含每個(gè)邊緣分組的最小矩形作為人眼檢出,最先檢出的兩個(gè)分組分別對(duì)應(yīng)左眼和右眼。當(dāng)出現(xiàn)兩個(gè)分組后算法立即結(jié)束,提高了執(zhí)行效率。</p><p>  圖17 原圖 圖18 灰度圖</p><p>  圖19 水平投影

107、 圖20 垂直投影 </p><p>  圖 21 眼眉區(qū) 圖22 canny邊緣檢測(cè)</p><p>  圖22 人眼定位 圖23 人眼定位2</p><p><b>  程序?qū)崿F(xiàn):</b></p><p>  i=imread('009.jpg');%讀入

108、圖像</p><p>  im=rgb2gray(i);</p><p>  figure,imshow(im)%顯示圖像</p><p>  n=imadjust(im,stretchlim(im),[0,1])%調(diào)整圖像的像素值,改變對(duì)比度和顏色</p><p>  s = size(n);%計(jì)算n的圖像信息</p><

109、;p>  vertical = zeros(s(1));%創(chuàng)建矩陣</p><p>  horizental = zeros(s(2));</p><p>  for j = 1:s(1)%灰度垂直投影</p><p>  vertical(j) = vertical(j) + sum(im(j,: ));</p><p><b&

110、gt;  end</b></p><p>  for k = 1:s(2)%灰度水平投影</p><p>  horizental(k) = horizental(k) + sum(im(:, k));</p><p><b>  end</b></p><p>  figure; %顯示圖像投

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論