Research on Automatic Images Annotation Based on Scene Analysis.pdf_第1頁
已閱讀1頁,還剩49頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、我們?nèi)缃裆钤谝粋€全球化的時代,能非常容易的訪問大量信息,尤其是“圖像”。如果我們能夠分類所有的數(shù)據(jù),這會使得訪問變得更加容易和快速。這便是“計算機視覺”這個經(jīng)典問題的起源。分類圖像數(shù)據(jù)最重要的事情是重定義這些圖像。有大量關(guān)于此問題的研究,即:圖像分類,圖像檢索,以及圖像標注。有大量關(guān)于“圖像標注”的研究,這些研究在對圖像視區(qū)和高級語意字之間的聯(lián)系起著非常重要的作用。
   圖像標注有3種類型:手工,半手工,和自動圖像標注(AI

2、A)。此研究主要是針對AIA開發(fā)。AIA作為自動系統(tǒng)有效的節(jié)省了我們的時間。然而,相較于手工和半手工來說它的準確性是三種之中最低的。因此,找到一種好的辦法開發(fā)此系統(tǒng)是很難的。
   此研究主要是基于PLSA&GMM模型并對其進行改進從而得到“SC&GMM”。在自然語言處理領(lǐng)域,相比較于其它模型PLSA模型能夠更好的標注關(guān)鍵字。SC&GMM是基于場景分析的原則,并包含兩個階段。第一個階段是訓(xùn)練過程,目的是將訓(xùn)練數(shù)據(jù)集分類到特征空間

3、。第二個階段是對測試圖像數(shù)據(jù)標注關(guān)鍵字。SC&GMM算法通過使用PLSA聚類從組語意場景開始運行。然后,通過計算語意特征提取來找到場景中圖像標注的關(guān)鍵字,其中每個圖像有374維。
   之后,計算所有訓(xùn)練圖像對之間的視覺特征提取距離(每張圖像在每個分段區(qū)域有36D)方式Earth Mover’s Distance(EMD),創(chuàng)建一個距離向量。然后,把這些數(shù)據(jù)通過運用分層聚類分發(fā)到視覺場景中。當?shù)玫秸Z意場景和視覺場景之后,對相似場

4、景中的每個圖像進行比較。如果它們相似,把語意場景和視覺場景結(jié)合在一起,結(jié)合方式是擁較少圖像的場景融合到圖像元素多的場景里。然后,對無相似剩余視覺場景計算注釋關(guān)鍵字。對所有場景通過運用GMM來創(chuàng)建向量空間。
   接下來是通過對各個特征空間圖與像數(shù)據(jù)視覺特征的比較來給測試圖像數(shù)據(jù)從而標注關(guān)鍵字。此過程是通過本征場景來找出視覺特征的秘密。如果它們相似,通過運用GMM把它們放在一起。然后,給引用場景的圖像注釋關(guān)鍵字。
   在

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論