基于主題模型和圖核模型的圖像分類算法的研究與應用.pdf_第1頁
已閱讀1頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、圖像分類技術是計算機視覺領域重要的研究內容。圖像分類性能的優(yōu)劣對醫(yī)學圖像研究、生物數據分析、軍事交通研究有至關重要的意義。伴隨著機器學習的熱潮,圖像分類技術得到了迅速發(fā)展并成為計算機視覺領域研究的熱點。
  主題模型是機器學習領域新興的算法,它的出現為圖像分類研究開辟了新的天空。主題模型是一種概率生成模型,主要應用在對文本信息進行處理中。相對于其他分類算法,其優(yōu)勢在于對語義信息的挖掘上。Latent Dirichlet Alloc

2、ation(LDA)模型是在Probabilistic LatentSemantic Analysis(PLSA)模型的基礎上提出的一種廣泛應用在文本信息分類的主題模型。該算法采用了詞袋(bag of words)思想,視每篇文檔為一個詞頻向量。一篇文檔代表了一些主題所構成的概率分布,而每一個主題又代表了很多單詞所構成的概率分布。LDA通過這種方式把文本信息轉化為易于建模的數字信息并挖掘數據集潛在的語義信息。隨著LDA模型的發(fā)展和改進,

3、它已經成功地應用在圖像分類、檢索等領域。
  但是,LDA算法使用的詞袋模型把圖像看作無序的單詞而忽略了圖像的空間結構信息,圖核是一種計算圖結構之間相似性的模型。本文提取了圖像的空間結構信息并結合了主題模型和圖核模型,分別從語義信息和空間結構信息的角度對圖像進行處理。通過對這兩種模型進行研究我們發(fā)現其中還存在可改進之處。本文首先對LDA的詞袋模型進行改進,提高其分類效果,同時提出了使用帶權重的最小生成樹圖核進行圖像分類,并對最小生

4、成樹圖核進行了改進,最后結合了兩個模型的優(yōu)勢并應用于圖像分類中,主要工作如下:
  1)利用傳統(tǒng)LDA模型進行圖像分類研究。在對圖像進行處理時,使用SIFT算法檢測特征點形成詞典、計算詞頻,并根據LDA思想進行分類。文中利用Gibbs采樣對參數進行估計,通過訓練出來的參數對新圖像進行分類預測。其次文中對這種傳統(tǒng)方法進行改進,加入圖像的色彩信息,利用RGB SIFT算法檢測特征點,形成了信息更為豐富的描述子。
  2)本文對圖

5、核模型進行研究,并應用在圖像分類中。首先綜合考慮了常用的幾種核,根據其優(yōu)劣性,提出使用最小生成樹算法計算圖像之間相似性。其次在計算圖結構相似性時,對最小生成樹核進行改進,考慮了圖結構中節(jié)點的權重信息。在利用帶權重的最小生成樹圖核進行分類時,我們首先利用RGB SIFT算法得到圖像的視覺單詞以及空間坐標信息,通過構建四叉樹把圖像表示為圖結構的數據,根據圖來生成最小生成樹并計算圖像之間的相似性。為了利用相似性矩陣對圖像進行分類,我們使用訓練

6、集中的相似性矩陣及其所屬的類別對支持向量機(Support Vector Machine)即SVM進行訓練,得到相應的分類器。其中支持向量機的核函數使用了最小生成樹核。通過對測試集數據的分類預測驗證了改進模型的優(yōu)越性。
  3)結合LDA模型和圖核模型的優(yōu)缺點,將兩種方法進行結合,使用余弦相似性得到LDA模型中圖像的相似矩陣,并與圖核中的相似性矩陣以一定的權值進行結合,最后利用SVM對相似性矩陣進行處理,成功對圖像進行分類。該課題

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論