版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、一般物體識別(General Object Recognition)是視覺(Vision)領域的一個相當困難和根本的問題。目前為止,雖然針對特定物體的識別任務(如人臉檢測及識別)已有較為成熟的方法進行處理,但如何設計出一套適用于一般環(huán)境一般物體的通用系統,從而接近甚至達到人腦視覺系統的性能,仍然非常具有挑戰(zhàn)性。視覺研究本身是一個跨學科領域的問題,涉及到計算機視覺及神經生物學這兩個截然不同的學科。本文主要從計算機視覺這一角度出發(fā)進行闡述,
2、側重于數學模型與解模算法設計。內容上,本論文就近年來在此領域內的進展作一綜述,并重點分析基于小塊(patch)的算法方案;而后以計算機視覺的語言詳細解析基于特征組合的仿生學計算模型HMAX,指出其與計算機視覺的緊密關聯;接著,本文提出了兩種較新的局部改進方案,并完成了相關實驗。實驗結果表明了這兩種改進方案的可行性。本論文的主要工作和創(chuàng)新點包括以下幾個方面:1)對于視覺皮層計算模型HMAX,本文詳細分析了其四層結構(S1,C1,S2,C2
3、)的算法步驟,并建立它在計算機視覺上的功能對應,即“分塊直方圖”(S1+C1)級聯“直方圖”(S2+C2)的結構。在此基礎上,本文得到這樣的結論:若以“分塊直方圖”作為組合層數的標尺,HMAX事實上是“一層半”的(有監(jiān)督的)特征組合模型。2)本文對HMAX的一些算法部件做了改進:針對HMAX中8 £ 8的固定區(qū)域劃分,本文提出了非均勻劃分方案;針對HMAX中隨機選取小塊(patch)的局部訓練方法,本文提出了從整體出發(fā)在同類圖片中自動選
4、取共同區(qū)域的算法。與純機器學習上的改進不同,本論文更著重于視覺建模的特質,即建模二維圖像的結構關系。3)本論文給出了這兩個方案的詳細解模過程。對于方案a),本文就其一維和二維的情況分別展開分析,一維情況下可以用動態(tài)規(guī)劃(Dynamic Programming)精確快速求解;二維情況下則沒有這樣好的性質,然而可以利用依坐標下降的優(yōu)化策略求解。對于方案b),本文以生成模型建模此問題,并用經典的EM算法求解之。對于這兩個方案,本文分別實現了上
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 一般物體識別的整體特征組合與分析.pdf
- 基于2D和3D SIFT特征融合的一般物體識別算法研究.pdf
- 基于卷積神經網絡的一般物體識別研究及應用.pdf
- 指紋識別相關算法的改進研究.pdf
- 基于組合特征的人臉表情識別算法研究.pdf
- 橫向框架內力組合(一般組合).xls
- 現在完成時和一般過去時的區(qū)別相關練習
- 基于特征匹配的物體識別研究.pdf
- 識別摻假食品的一般知識
- 橫向框架內力組合(一般組合).xls
- 車牌識別相關技術的研究.pdf
- 基于一般物體識別的移動機器人立體視覺導航方法.pdf
- 基于組合特征的網頁主題塊識別算法.pdf
- 基于輪廓的物體識別算法研究.pdf
- 基于圖像的物體識別算法研究.pdf
- 指紋與人臉識別相關圖像處理算法研究.pdf
- 鐵路貨車車號自動識別相關算法的研究.pdf
- 簡單多數規(guī)則的一般特征.pdf
- 說話人識別相關技術的研究.pdf
- 市場經濟的一般特征
評論
0/150
提交評論