大規(guī)模亞洲人臉數(shù)據(jù)集的構(gòu)建.pdf_第1頁
已閱讀1頁,還剩64頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、近年來,深度學(xué)習(xí)的蓬勃發(fā)展,帶動越來越多的科研人員及互聯(lián)網(wǎng)團隊投身到這一領(lǐng)域。卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡稱CNN)的提出對計算機視覺這一研究領(lǐng)域產(chǎn)生了非常大的影響。隨著深度學(xué)習(xí)方法的應(yīng)用,人臉識別的準確率得到了突破性地提高,并逐漸成為非常實用的方法?;谏疃葘W(xué)習(xí)的人臉識別方法準確率的提升主要依賴于兩個方面:網(wǎng)絡(luò)模型優(yōu)化和訓(xùn)練數(shù)據(jù)集增強。但是,目前被公開的可用于訓(xùn)練深度網(wǎng)絡(luò)的人臉訓(xùn)練數(shù)據(jù)集資

2、源有限,且絕大部分是基于歐美人臉的圖片,而基于亞洲人臉的深度網(wǎng)絡(luò)模型的訓(xùn)練數(shù)據(jù)集非常稀缺。眾所周知,西方人臉相比于東方人臉存在眉骨較高、眼窩深陷、顴骨突出等直觀差別,基于WebFace數(shù)據(jù)集訓(xùn)練的深度網(wǎng)絡(luò)模型在LFW測試集上的準確率已超過99%,但根據(jù)本文的實驗,該模型在測試亞洲人臉時準確率卻明顯降低,因此,構(gòu)建一個可用于訓(xùn)練的亞洲人臉數(shù)據(jù)集非常必要且有意義。本文的研究目標就是構(gòu)建一個大規(guī)模高質(zhì)量的亞洲人臉數(shù)據(jù)集。為實現(xiàn)該目標,本文需要

3、研究相關(guān)構(gòu)建方法,提升構(gòu)建效率,降低構(gòu)建成本,所涉及的主要工作內(nèi)容包括;
  1)實現(xiàn)了構(gòu)建人臉數(shù)據(jù)集的完整處理過程,可通過自動計算和人工干預(yù)結(jié)合的方法完成人臉數(shù)據(jù)獲取、數(shù)據(jù)自動化處理和人工審核等環(huán)節(jié)的處理過程。此外,鑒于深度學(xué)習(xí)所需要的數(shù)據(jù)集規(guī)模較大且對質(zhì)量有較高要求,人臉圖像數(shù)據(jù)獲取和人工審核這兩個過程中工作量和成本較大,本文開發(fā)實現(xiàn)了相應(yīng)的應(yīng)用管理系統(tǒng),對互聯(lián)網(wǎng)人臉圖像爬取以及后期人工審核標注任務(wù)進行管理,使得數(shù)據(jù)獲取和標注

4、審核能夠更有效率地進行。在數(shù)據(jù)自動化處理階段,本文研究實現(xiàn)了對圖像數(shù)據(jù)評分的機制,以實現(xiàn)大量圖像數(shù)據(jù)的自動標注和篩選,極大降低了人工工作量,提升了數(shù)據(jù)集的構(gòu)建效率;
  2)利用上述系統(tǒng)和處理方法構(gòu)建了一個包含超過5千名亞洲明星人臉數(shù)據(jù)集,圖像規(guī)模超過50萬張。該數(shù)據(jù)集覆蓋了各性別年齡段的亞洲明星,并且每個明星內(nèi)包含的臉部圖像也盡量保持差異化,以利于深度網(wǎng)絡(luò)模型的訓(xùn)練。實驗證明在相同結(jié)構(gòu)的網(wǎng)絡(luò)模型上,基于亞洲人臉數(shù)據(jù)集訓(xùn)練的深度網(wǎng)

5、絡(luò)模型,比較基于WebFace(歐美人臉為主)訓(xùn)練的深度網(wǎng)絡(luò)模型,在亞洲人臉識別上具有更高的準確率。本文還研究使用CenterLoss等方法提升識別效果,并取得了較好的結(jié)果。此外,本文還利用訓(xùn)練的深度網(wǎng)絡(luò)開發(fā)了簡單的人臉識別應(yīng)用系統(tǒng),體現(xiàn)了該深度網(wǎng)絡(luò)模型的實用性。
  總之,本文構(gòu)建了一個完整的人臉識別訓(xùn)練數(shù)據(jù)集的構(gòu)建系統(tǒng),并實際創(chuàng)建了一個大規(guī)模的高質(zhì)量亞洲人臉數(shù)據(jù)集,體現(xiàn)了系統(tǒng)的有效性。實驗結(jié)果表明,基于本文構(gòu)建的亞洲明星數(shù)據(jù)集

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論