形狀的部分結(jié)構(gòu)解析和識別.pdf_第1頁
已閱讀1頁,還剩137頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、大量的心理學研究表明,人眼視覺是基于部分的,許多視覺行為能夠通過基于部分的表達方式進行解釋。這意味著在人眼視覺系統(tǒng)中,形狀的分解和其它視覺任務,如物體的檢索、表達、識別和解析有密不可分的關(guān)系。因此,對于計算機視覺系統(tǒng)來說,如何將物體形狀分解并得到和人的認知相一致的結(jié)果,成為涉及許多視覺任務的重要問題。但是,由于自然圖像存在大量的類內(nèi)和類間差異,分解成為計算機視覺領(lǐng)域中一個非常有挑戰(zhàn)性的任務。最主要的挑戰(zhàn)和困難集中在以下幾個方面:1)人眼

2、視覺涉及各種與部分相關(guān)的因素,怎樣對它們的作用及其之間交互機制進行建模,2)如何得到有判別力的特征,以及怎樣估計模型的結(jié)構(gòu)和參數(shù),3)在給定的模型下,如何快速得到分解結(jié)果,并使分解結(jié)果符合人的認知?
  本文擬將優(yōu)化問題和統(tǒng)計模型的理論引入分解,對形狀的分解和部分結(jié)構(gòu)的解析進行建模、推理和學習。重點研究以下問題:1)如何將和部分有關(guān)的視覺因素在統(tǒng)一的分解框架下表達出來,2)用什么樣的方式有效地表達一類物體的部分結(jié)構(gòu),3)如何從訓練

3、數(shù)據(jù)中得到部分結(jié)構(gòu)模型,并提取具有判別力的特征,4)如何設(shè)計快速準確的解析方法,得到和人的認知相符合的部分結(jié)構(gòu),5)部分結(jié)構(gòu)的解析和形狀的識別有怎樣的關(guān)系?
  本文的工作緊緊圍繞形狀的部分結(jié)構(gòu)解析和識別這一核心命題展開。為回答以上問題,從以下四個方面展開研究:
  (1)人眼視覺處理分解的機制相當復雜,涉及曲率、對稱、部分顯著度、分割線長度、認知等,最終的分解結(jié)果取決于這些因素間復雜的互相影響。本文設(shè)計了一種有效地融合了各

4、種和部分相關(guān)的視覺因素的表達方法,并在統(tǒng)一的分解框架下對物體進行分解。本文用求解二元規(guī)劃問題的過程模擬人眼視覺中這些因素的復雜交互,以達到和人眼視覺相一致的分解結(jié)果。本文的方法不僅綜合考慮了各種視覺因素,還實現(xiàn)了分解框架和視覺因素的分離,使得該方法在視覺因素的選擇上具有很強的可擴展性。
  (2)由于自然界的物體千變?nèi)f化,再加上二維圖像的信息損失以及形狀的遮擋、扭曲等非線性形變,導致物體的部分結(jié)構(gòu)具有很大的可變性。現(xiàn)有的心理學研究

5、成果僅能定性地解釋人眼視覺分解的某些方面,而不能從根本機制上全面的描述人眼視覺是如何根據(jù)少量不完整的信息處理如此豐富的視覺模式。本文不以心理學研究成果為惟一的理論基礎(chǔ),而是將統(tǒng)計模型引入形狀解析的領(lǐng)域。通過對訓練樣本的學習,確定模型的結(jié)構(gòu)和參數(shù),并選擇最具判別力的特征。該模型建立在與或圖上,具有層次化結(jié)構(gòu)并定義了概率分布,能夠表達部分的層次、空間位置、鄰接關(guān)系以及部分輪廓的變化,并支持可變結(jié)構(gòu)。
  (3)考慮到人眼視覺的分解的特

6、點:高效性、多尺度性、不確定性,以及受到認知的影響,本文設(shè)計出一種用于部分結(jié)構(gòu)解析的高效推理算法。該算法使底層信息(曲率、面積、顯著度等)和中高層信息(部分輪廓的變化模式、部分的出現(xiàn)頻率、狀態(tài)變量的分布)互相補充,大大提高了分解算法的靈活性和處理能力。在推理的過程中,本文充分利用了與或圖的結(jié)構(gòu),用遞歸的算法迭代的進行從頂向下和從底向上的遍歷。最終的分解結(jié)果也具有概率形式,支持多尺度分解,并且更加準確和穩(wěn)定。
  (4)對于人眼視覺

7、來說,部分結(jié)構(gòu)的解析和形狀的識別具有緊密的聯(lián)系,識別的過程可看作獲取物體的各部分及其組織方式的過程。受這種思想的啟發(fā),本文提出了一種基于部分結(jié)構(gòu)解析的形狀識別方法。本文將分解的模型從一類物體擴展到多類,并調(diào)整了學習和推理的目標函數(shù),以達到分類的目的。本文的識別方法不僅得到了類號,還得到了部分結(jié)構(gòu)以及部分結(jié)構(gòu)之間的對應關(guān)系,因此這種識別方法是符合人眼視覺系統(tǒng)的行為方式的。該方法結(jié)合了基于骨架和基于輪廓的形狀識別方法的優(yōu)點,在具有明顯部分結(jié)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論