基于卷積神經(jīng)網(wǎng)絡(luò)的景物標記.pdf_第1頁
已閱讀1頁,還剩67頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、本文研究卷積神經(jīng)網(wǎng)絡(luò)在人臉-背景二分類識別、手寫數(shù)字識別、多類圖像分類識別和景物標記中的應(yīng)用。本文采用具有不同特征抽取過濾層的卷積神經(jīng)網(wǎng)絡(luò)與其他優(yōu)化模型相結(jié)合的方法,獲得相同圖像在不同尺度卷積核的圖像信息。探究了基于多尺度卷積神經(jīng)網(wǎng)絡(luò)模型的多景物圖像標記問題,同時將改進后的多尺度卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于Stanford Background數(shù)據(jù)集與SIFT Flow數(shù)據(jù)集的景物標記實驗中,提高了景物標記的正確率。本文的主要工作如下:
 

2、 (1)采用具有不同特征抽取過濾層的卷積神經(jīng)網(wǎng)絡(luò)方法分別進行了人臉-背景二分類實驗、手寫數(shù)字識別實驗和多類圖像分類實驗,同時和其他訓練模型的結(jié)果作對比,還探究了一下卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)特征。其中,人臉-背景二分類實驗所得的平均分類正確率達到了99.785%;手寫數(shù)字識別實驗中,在各種結(jié)構(gòu)下的訓練模型中卷積神經(jīng)網(wǎng)絡(luò)與隨機梯度下降法的組合平均分類正確率最高達到了96.7%,比平均正確率次高的雙層神經(jīng)網(wǎng)絡(luò)與隨機梯度下降法的組合提升了8.1%;多

3、類圖像分類實驗中,在各結(jié)構(gòu)下的訓練模型中卷積神經(jīng)網(wǎng)絡(luò)與隨機梯度下降法的組合平均分類正確率最高達到了66.7%,比平均正確率次高的雙層神經(jīng)網(wǎng)絡(luò)與隨機梯度下降法的組合提升了52.3%。同時在此實驗中還探究了線性校對單元與池化方式分別對卷積神經(jīng)網(wǎng)絡(luò)提取圖像特征的影響。
  (2)針對圖像的景物標記問題,本文探究了一種多尺度卷積神經(jīng)網(wǎng)絡(luò),即使用不同尺度的卷積核來提取圖像特征,以獲得相同圖像在不同尺度卷積核下的圖像信息并將這些圖像特征用于對

4、測試集圖像的景物標記。在Stanford Background數(shù)據(jù)集的景物標記實驗中,運用多尺度預(yù)處理圖像與卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法將景物標記的正確率提高了33.5%。后將改進后的多尺度卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于SIFTFlow數(shù)據(jù)集的景物標記實驗中,將景物標記的正確率提高了36.3%。實驗驗證了卷積神經(jīng)網(wǎng)絡(luò)在解決圖像標記問題時可以通過提取圖像特征的不同尺度來達到提高訓練正確率的效果。實驗還驗證了線性校正單元與Dropout對卷積神經(jīng)網(wǎng)絡(luò)訓練的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論