版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、在深度卷積神經網絡(Convolutional Neural Networks,CNNs)中,池化是一個關鍵機制,有利于CNNs獲得具有平移不變性的特征。大量的經驗和理論研究表明,池化能夠有效的提升CNNs的性能。傳統(tǒng)的池化操作一般是基于激活值的。本文提出一種基于序的池化機制。提出這種池化方法的動機是,在池化域內,激活值的序只與激活值的大小關系有關,而與其實際大小無關?;诩せ钪档男蛴嬎愠鼗敵鲇欣讷@得更加魯棒的特征。此外,通過合理的
2、使用激活值的序能夠有效地避免基于值的方法所面臨的數(shù)據尺度問題。
基于序的池化方法可以視為一種加權池化,也就是將池化域內所有激活值的加權和作為池化輸出。根據加權方式的不同,本文提出三種新的池化操作:基于序的平均池化、基于序的加權池化和基于序的隨機池化。作為另外一個重要貢獻,本文引入判別熵的概念,提出一種評估池化方法判別能力的準則。
在圖像識別和人群計數(shù)兩個計算機視覺任務上評價提出的方法。在圖像識別任務上,四個標準數(shù)據集
3、(MNIST、CIFAR-10、CIFAR-100和NORB)上的實驗結果表明,提出的基于序的池化方法相比于已有方法有更好的識別表現(xiàn)。為了進一步展示提出方法的優(yōu)越性,將基于序的隨機池化方法與NIN(Network-in-Network)網絡結合,在CIFAR-10和CIFAR-100數(shù)據集上獲得了更加優(yōu)異的識別效果。在人群計數(shù)任務上,針對攝像機透視效果、圖像背景、人群密度分布不均勻和行人遮擋等問題,提出一種基于序的空間金字塔池化網絡的人
4、群計數(shù)方法。該方法將原圖像分成多個具有相同透視范圍的子區(qū)域并在各個子區(qū)域分別取不同尺度的子圖像塊,采用基于序的空間金字塔池化網絡估計子圖像塊人數(shù),然后相加所有子圖像塊人數(shù)得出原圖像人數(shù)。提出的圖像分塊方法有效地消除了攝像機透視效果和人群密度分布不均勻對計數(shù)的影響。提出的基于序的空間金字塔池化不僅能夠處理多種尺度的子圖像塊,而且解決了傳統(tǒng)池化方法易損失大量重要信息和易過擬合的問題。在UCSD標準數(shù)據集上的實驗結果表明,本文方法相比于傳統(tǒng)方
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于深度卷積神經網絡的熟料顆粒方法研究.pdf
- 基于多尺度池化的卷積神經網絡人臉識別方法研究.pdf
- 基于深度卷積神經網絡的腦組織分割方法研究.pdf
- 基于深度卷積神經網絡的車型識別.pdf
- 基于深度卷積神經網絡的目標跟蹤.pdf
- 基于FPGA的深度卷積神經網絡加速研究.pdf
- 基于免疫卷積神經網絡的深度學習研究.pdf
- 基于深度卷積神經網絡的場景分類研究.pdf
- 基于深度卷積神經網絡的人臉識別研究.pdf
- 基于深度卷積神經網絡的圖像分類方法研究及應用.pdf
- 基于深度卷積神經網絡的智能車輛目標檢測方法研究.pdf
- 基于深度卷積神經網絡的語義圖像檢索研究.pdf
- 基于深度卷積神經網絡的圖像檢索算法研究.pdf
- 基于Caffe深度學習框架的卷積神經網絡研究.pdf
- 基于深度卷積神經網絡的離線筆跡鑒別研究.pdf
- 基于深度卷積神經網絡的顏值計算研究.pdf
- 基于深度卷積神經網絡的表單中手寫簽名位置定位方法.pdf
- 基于深度卷積神經網絡的實體關系抽取.pdf
- 基于深度卷積神經網絡的人體姿勢估計研究.pdf
- 基于深度卷積神經網絡的毫米波圖像目標檢測方法研究.pdf
評論
0/150
提交評論