基于分割的機器學(xué)習(xí)方法以及在圖像分類和目標(biāo)檢測方面應(yīng)用.pdf_第1頁
已閱讀1頁,還剩116頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、圖像中包括哪些類別的對象?對象的具體位置在哪里?每一類的對象有幾個?對象有什么姿勢動作?它們之間的關(guān)系又是怎樣?如果讓人們回答這些問題,是一件很容易的事情。但普遍意義上的計算機理解圖像內(nèi)容,仍然是一個未解的難題。朝著這個最終目標(biāo),圖像分類與目標(biāo)檢測這兩個基礎(chǔ)問題,受到了機器視覺領(lǐng)域的廣泛重視,有著大量深入的研究。圖像分類問題需要回答某一類或某幾類對象是否存在于給定的圖像中,但不需要給出對象的具體位置。而目標(biāo)檢測問題更為困難,除了要回答圖

2、像中存在哪些類別的對象,同時還要給出對象的具體位置。這兩個問題既不同又相關(guān)。不同之處在于是否需要給出對象具體位置。相關(guān)之處在于能夠處理目標(biāo)檢測的方法也自然能夠完成圖像分類,但是這樣加大了問題的難度,事實上目標(biāo)檢測的正確率遠(yuǎn)遠(yuǎn)不如只作圖像分類;但是圖像畢竟還是按照目標(biāo)對象是否存在而分類,圖像的類別還是主要由對象所在的區(qū)域而決定。
   本論文同時考慮了問題之間的差異性與相關(guān)性,并將這兩者統(tǒng)一看成區(qū)域選擇問題。假設(shè)測試圖像中所有對象

3、的范圍都被標(biāo)注清楚,那么無論是圖像分類還是目標(biāo)檢測,剩下的工作就只是對范圍之內(nèi)的區(qū)域做類別區(qū)分。由此可見,這兩個問題的特殊之處就在于區(qū)域的選擇。從區(qū)域選擇的角度也可以解釋目前主要的研究工作與研究難點。
   圖像分類的優(yōu)秀方法常常用到各種不同層次不同種類的圖像特征合并,有些復(fù)雜的方法甚至先采用目標(biāo)檢測得到重點區(qū)域,然后再特別加入重點區(qū)域中的特征。這些方法雖然沒有得到精確的對象區(qū)域,但隱含的盡量選擇了對象可能存在區(qū)域的特征。如何排

4、除掉明顯無關(guān)的區(qū)域,盡量用對象所在區(qū)域決定圖像類別正是這個問題的難點。
   目標(biāo)檢測的兩大流派分別是基于分割的方法和滑動窗口方法。前者先將圖像預(yù)先分割成若干區(qū)域,然后判斷每個區(qū)域是否屬于目標(biāo)類別,這相當(dāng)于是對區(qū)域區(qū)域做了選擇。此類方法的缺點是檢測結(jié)果容易受到分割錯誤的影響,如果區(qū)域本身就存在錯誤,如果區(qū)域本身既不是整個對象,也不是對象的某個有效部位,那么無論模型怎么分類,也得不到有意義的檢測結(jié)果。這時區(qū)域選擇的難點是如何得到盡

5、量正確的區(qū)域。后者將檢測窗口置于圖像中的每個位置,然后判斷窗口內(nèi)部是否包含目標(biāo)對象,這種區(qū)域選擇的方式就更為直接。此類方法雖然檢測精確度較高,但檢測速度較慢,而且還需要后處理方法壓縮多個重合的檢測窗口。此時的難點是如何盡量減少窗口搜索的區(qū)域。如果能有一種方法提供較為穩(wěn)定準(zhǔn)確的對象出現(xiàn)的位置,就可以只將窗口置于提供的那些位置上進行檢測。
   本論文從區(qū)域選擇這個統(tǒng)一的角度出發(fā),并根據(jù)具體問題與難點的不同,提出不同的圖像分解方法,

6、以及對分解得到的區(qū)域選擇利用的方法。
   針對圖像分類的區(qū)域選擇難點,本論文提出一種新的機器學(xué)習(xí)框架-分解學(xué)習(xí)。它同時利用了有類別和無類別的數(shù)據(jù),以類似于子空間聚類的方式搜索圖像原始輸入空間中的有效區(qū)域。每個區(qū)域被看作類別概念的子概念,單個基礎(chǔ)分類器在每個區(qū)域中獨立訓(xùn)練,其輸出將作為新特征空間的一個高層特征。在重建的新特征空間中訓(xùn)練最終分類器。實驗在MNIST手寫數(shù)字?jǐn)?shù)據(jù)集和Caltech101圖像分類數(shù)據(jù)集上進行,分解學(xué)習(xí)在

7、不采用任何與機器視覺相關(guān)的特征提取方法的情況下,仍然有效的提高了分類的正確率。
   針對基于分割的目標(biāo)檢測方法的區(qū)域選擇難點,本論文提出一種最大化間隔分割選擇方法。每張圖像經(jīng)過多種互補的分割方法預(yù)處理,得到多包區(qū)域,其中存在一包相對較好的對象分割結(jié)果。分割選擇的目標(biāo)是將每張圖像的最佳分割結(jié)果選擇出來,將其中的區(qū)域拿出組成訓(xùn)練集?!胺指钸x擇+分類”被統(tǒng)一建模為最大化間隔問題,目標(biāo)函數(shù)被表示為二次規(guī)劃的形式。此目標(biāo)函數(shù)經(jīng)過推導(dǎo)轉(zhuǎn)化

8、,得到其最終的對偶形式,并通過模擬煺火解法得到近似最優(yōu)解。實驗在PASCAL VOC2007數(shù)據(jù)集上進行,在絕大部分類別上,分割選擇方法的檢測精確度超過了單一分割方法。
   針對滑動窗口目標(biāo)檢測方法的區(qū)域選擇難點,本論文提出一種區(qū)域位置提示的可變形模型候選點檢測算法。我們延續(xù)了上面的研究工作,通過仔細(xì)觀察采樣圖像的分割結(jié)果,發(fā)現(xiàn)一個有趣的事實:雖然幾乎每張圖里都存在分割錯誤,但是在大多數(shù)情況下總會有某個區(qū)域的邊角與對象真實位置

9、的邊角很接近。由此,如果重用之前的分割結(jié)果,檢測窗口只需要置于這些邊角位置,就可以避免大量不必要位置上的窮舉搜索。可變形部分模型保證了檢測器本身的精確性,而分割位置提示保證了檢測的效率,同時避免了后處理操作。實驗仍然在PASCAL VOC2007數(shù)據(jù)集上進行,候選點檢測算法在一半類別上超過了窮舉搜索方法。
   除了以上難點之外,目標(biāo)檢測在具體訓(xùn)練時還有容易被忽視的地方。目標(biāo)檢測的訓(xùn)練數(shù)據(jù)由少量的目標(biāo)對象和大量的其他對象或背景組

10、成。這是典型的不平衡數(shù)據(jù)集,目標(biāo)類別在其中只占一小部分。不平衡數(shù)據(jù)集往往會降低分類的性能,尤其是作為目標(biāo)對象的少數(shù)類容易被忽略。針對此問題,本論文提出了一種處理不平衡數(shù)據(jù)的支持向量機-IISVM,并將其引入到最大化間隔分割選擇的訓(xùn)練中,進一步提高了目標(biāo)檢測的結(jié)果。
   本論文的最后對研究工作進行了總結(jié),說明了幾種區(qū)域選擇利用方式之間的發(fā)展過程。另外,本文還從人類檢測圖像物體的角度闡述了目前這兩個問題無法徹底解決的原因,以及今后

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論