基于視覺注意機制與支持向量機自動圖像標注.pdf_第1頁
已閱讀1頁,還剩61頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、最近幾十年,隨著數(shù)碼技術和互聯(lián)網(wǎng)技術不斷發(fā)展,每天都有海量的數(shù)字圖像出現(xiàn)在網(wǎng)絡上,隨之而來的問題是,人們想要在網(wǎng)絡中比較精確快速地找到自己需要的圖片也變得越來越難,圖片檢索技術正是為了解決人們檢索圖片的需求而誕生的。但是,專業(yè)性的圖片檢索工具對于大部分普通用戶來說,操作比較繁雜,而且往往需要用戶提供與查詢需求相似的圖片,這大大增加了用戶的工作量。自動圖像標注技術將圖像檢索過程間接轉化為了文本檢索,即用戶只需要輸入查詢關鍵詞,系統(tǒng)就將返回

2、與關鍵詞相關的圖片結果,這非常符合當前絕大部分用戶的使用習慣,且文本搜索技術要比圖片搜索技術成熟許多。因此,自動圖像標注成為了圖片檢索領域一項重要的研究課題,只要能對圖像進行精確的標注,就能返回給用戶很好的結果。
  影響圖像自動標注結果的因素主要有以下幾方面:第一,能否將圖像進行準確的分割,把圖像中有意義的區(qū)域和用戶感興趣的區(qū)域識別出來。第二,對圖像特征(顏色、紋理、形狀等)的提取和表示方法。第三,對圖像和關鍵詞進行訓練的模型的

3、選?。壳爸饕谢诜诸惖哪P秃突诟怕实哪P蛢纱箢惙椒ǎ?。第四,在對圖像標注完成后對標注結果的改善。
  目前對自動圖像標注算法的研究,或者沒有對圖像進行分割,以整幅圖像來提取特征;或者在對圖像進行分割時,都沒有考慮圖像各部分區(qū)域對于用戶是否具有不同的重要性。針對這些問題,本文提出了一種基于視覺注意機制和支持向量機的圖像自動標注算法,首先將視覺注意機制引入圖像標注過程中,在前期處理中先提取出圖像顯著區(qū)域和非顯著區(qū)域,并分別計算得

4、到其特征向量。在標注時,先通過顯著與非顯著區(qū)域的加權特征向量和標注模型以及詞與詞之間的概率模型得到圖像的全局標注詞,然后再通過提出的顯著詞分離模型從全局標注詞中分離出顯著詞。最后,將標注結果反饋于詞與詞之間的概率模型,并對概率模型進行動態(tài)更新,從而提高圖像自動標注的精確性。
  通過在標準數(shù)據(jù)集Core15K圖片庫上進行訓練和對測試圖片進行標注,與基于支持向量機的標注算法結果進行比較,表明本文提出的方法能夠得到滿意的實驗結果。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論