基于視覺詞袋模型的圖像標(biāo)注研究.pdf_第1頁
已閱讀1頁,還剩79頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、在現(xiàn)代社會信息化程度不斷提高的同時,計算機及各種信息處理設(shè)備與技術(shù)的發(fā)展也日新月益。在這一進(jìn)程中,人們對數(shù)字圖像的需求呈現(xiàn)出爆炸式的增長,而如何有效地對數(shù)字圖像進(jìn)行檢索也因此成為了人們關(guān)注的熱點。按照人類的認(rèn)知習(xí)慣,根據(jù)數(shù)字圖像所包含的語義內(nèi)容對其進(jìn)行語義關(guān)鍵字的標(biāo)注,從而將對數(shù)字圖像的檢索轉(zhuǎn)化為成熟的文本檢索,是對數(shù)字圖像實現(xiàn)高效檢索的必要手段。
  如何利用計算機自動地識別圖像的語義內(nèi)容并進(jìn)行標(biāo)注,是近年來計算機視覺和多媒體研

2、究領(lǐng)域中一個亟待解決的難點。由于數(shù)字圖像本身存在非結(jié)構(gòu)性、語義復(fù)雜性、含糊性等特點使得低層視覺特征和高層語義之間存在著“語義鴻溝”。如何利用計算機技術(shù)填平語義鴻溝,具有巨大的挑戰(zhàn)性。
  視覺詞袋模型(Bag-of-Visual-Word,BoVW)作為計算機視覺研究領(lǐng)域的通用的建模方法,具有良好的適用性和實現(xiàn)的簡潔性、高效性,在圖像標(biāo)注的應(yīng)用研究中廣泛使用并有出色的表現(xiàn)。但由于BoVW模型的基礎(chǔ)性問題存在,其距離實際應(yīng)用還有相當(dāng)

3、的差距。
  本文針對視覺單詞的量化誤差、映射損失等問題進(jìn)行了研究并提出相應(yīng)的改進(jìn)算法,為基于BoVW的圖像標(biāo)注研究提供了有意義的探索。
  本文的成果和創(chuàng)新之處包括以下幾點:
  1.針對BoVW模型建模圖像標(biāo)注的量化誤差與視覺單詞含糊性等缺點,提出了一種基于BoVW的視覺單詞模糊計權(quán)與映射方案FWS(Fuzzy Weighting Scheme)。FWS在訓(xùn)練樣本集的預(yù)聚類基礎(chǔ)上,逐聚類訓(xùn)練單類支持向量機OC-SV

4、M并得到視覺單詞映射函數(shù)。根據(jù)樣本特征與聚類超球球心的距離函數(shù)及聚類超球的空間分布確定視覺單詞映射及權(quán)重,并以此提高視覺單詞的表達(dá)力、區(qū)別力。基于兩個不同圖像實驗集的實驗結(jié)果不僅驗證了FWS的良好泛化性能,而且圖像標(biāo)注準(zhǔn)確性相比TF和VWA分別有從16%到34%和從17%到30%的提高。
  2.提出了一種基于改進(jìn)的視覺詞袋模型BoVW的圖像標(biāo)注方法--多尺度空間優(yōu)化視覺詞袋模型Msso-BoVW(Multiple scale s

5、pace optimization Bag-of-Visual-Word)。針對傳統(tǒng)BoVW模型對尺度變化較為敏感的問題,Msso-BoVW在圖像的內(nèi)容分析時引入了圖像的多尺度特征信息。Msso-BoVW對圖像數(shù)據(jù)進(jìn)行線性多尺度變換,并依尺度構(gòu)建多個層次化的視覺詞匯表;最終將圖像表示為不同尺度的特征直方圖。依據(jù)各尺度特征的區(qū)別力,結(jié)合多核學(xué)習(xí)的方法優(yōu)化各尺度特征直方圖的相應(yīng)權(quán)重,從而獲取針對分類的、最具區(qū)別力的視覺特征表示。在Calte

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論