基于卷積神經(jīng)網(wǎng)絡的行人檢測和識別研究.pdf_第1頁
已閱讀1頁,還剩60頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、一直以來,行人檢測都是計算機視覺領域的重要研究課題之一。行人檢測通過圖像處理、計算機視覺相關算法以及機器學習等技術對行人進行識別和追蹤。行人檢測技術首先進行圖像、視頻的采集以及預處理,然后對行人檢測和行人跟蹤識別,在民用和軍事等的許多領域中對行人檢測技術的需求越來越多。行人識別技術在無人駕駛汽車、智能視覺監(jiān)控等領域中均有重要應用。近年來,以卷積神經(jīng)網(wǎng)絡為代表的深度學習方法在目標分類和檢測問題上取得了巨大成果,引起了眾多研究者的關注,成為

2、計算機視覺領域的研究熱點之一
  基于卷積神經(jīng)網(wǎng)絡的行人檢測方法已經(jīng)越來越快速和準確,但大多數(shù)檢測方法仍受網(wǎng)絡深度和參數(shù)過多的影響,在低性能的計算機上運行緩慢。YOLO(You Only Look Once)實時物體檢測方法是目前最先進的實時目標檢測網(wǎng)絡之一,其檢測速度和準確率都有較高表現(xiàn)。針對低配置的計算機,論文基于YOLO模型設計了一種基于深度殘差網(wǎng)絡的快速目標檢測方法,其擁有20層卷積神經(jīng)網(wǎng)絡設計,并且融合了深度殘差網(wǎng)絡的瓶

3、頸設計,有效減少訓練參數(shù),并采用預激活機制,保證了網(wǎng)絡性能和準確率。
  在上述模型基礎上進一步設計了一種新的行人檢測方法。首先為了降低行人誤檢率,采用了更深的深度殘差網(wǎng)絡模型,在此基礎上針對行人在圖像上橫向表達較少,縱向表達相對較多的特性,增加了特征圖橫向特征維度,增加橫向維度的表達;其次為了提高網(wǎng)絡性能,采用了混合數(shù)據(jù)集訓練,使用PASCAL VOC行人數(shù)據(jù)增強INRIA數(shù)據(jù)集訓練;最后針對新的數(shù)據(jù)集使用維度聚類的方法初選了先

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論