![](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/14/17/fe5a2e54-6443-40f6-aebd-db332c17c86b/fe5a2e54-6443-40f6-aebd-db332c17c86bpic.jpg)
![基于上下文的圖像標(biāo)注研究.pdf_第1頁(yè)](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/14/17/fe5a2e54-6443-40f6-aebd-db332c17c86b/fe5a2e54-6443-40f6-aebd-db332c17c86b1.gif)
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、計(jì)算視覺(jué)中一個(gè)基本的任務(wù)是通過(guò)統(tǒng)計(jì)建模來(lái)預(yù)測(cè)靜態(tài)圖像中的未知特性。如果圖像中的這些未知特性能夠被描述成一系列離散的隨機(jī)變量,那么對(duì)應(yīng)的視覺(jué)問(wèn)題就可以歸結(jié)為圖像標(biāo)注或者圖像理解。由于自然圖像中的物體存在大量的類(lèi)內(nèi)和類(lèi)間差異,導(dǎo)致計(jì)算機(jī)視覺(jué)中的圖像理解和標(biāo)注成為一個(gè)非常具有挑戰(zhàn)性的任務(wù)。最主要的挑戰(zhàn)和困難集中在以下三個(gè)方面:1)自然圖像中存在的各種復(fù)雜視覺(jué)模式,如何對(duì)其進(jìn)行建模是首先需要研究的問(wèn)題;2)對(duì)不同類(lèi)別的物體如何學(xué)習(xí)得到最有判別力
2、的特征以及對(duì)模型參數(shù)進(jìn)行估計(jì)是第二個(gè)需要研究的問(wèn)題;3)在給定的學(xué)習(xí)模型下,如何通過(guò)優(yōu)化算法計(jì)算得到最優(yōu)解。本論文基于統(tǒng)計(jì)學(xué)的理論,對(duì)場(chǎng)景標(biāo)注與理解進(jìn)行建模、學(xué)習(xí)和推理,重點(diǎn)研究了計(jì)算機(jī)視覺(jué)中的以下問(wèn)題:1)如何有效地對(duì)圖像中有明顯紋理特性和結(jié)構(gòu)特性的物體進(jìn)行建模?2)什么樣的上下文信息能夠有效的表達(dá)圖像中各類(lèi)物體之間的相互關(guān)系?3)如何從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)得到圖像的模型以及對(duì)圖像上下文信息的表達(dá)?4)如何設(shè)計(jì)一種快速的推理算法得到最終的圖
3、像標(biāo)注結(jié)果,并同時(shí)保證得到的結(jié)果是解空間中的全局最優(yōu)解?5)圖像標(biāo)注與物體識(shí)別之間存在怎樣的關(guān)系?
本文的工作緊緊圍繞場(chǎng)景標(biāo)注與理解這一核心命題展開(kāi)。為回答以上提出的問(wèn)題,從以下四個(gè)方面展開(kāi)研究:
(1)一般而言,圖像中的底層信息(如紋理和顏色)也可以用來(lái)識(shí)別物體類(lèi)別(如水、天空和樹(shù)木等)。作為中層視覺(jué)的主要特性,形狀信息對(duì)于自然場(chǎng)景中包含的結(jié)構(gòu)類(lèi)物體(如馬、牛和車(chē)等)而言是一種非常魯棒的表達(dá)方式?;谛螤钅0鍖?duì)圖像
4、對(duì)應(yīng)的區(qū)域進(jìn)行語(yǔ)義分割不僅能夠約束對(duì)應(yīng)的像素具有一致的語(yǔ)義標(biāo)簽,還能提高對(duì)抗噪聲的魯棒性。除此之外,圖像中的上下文信息可進(jìn)一步提高標(biāo)注系統(tǒng)的性能。這類(lèi)信息往往約束高層語(yǔ)義之間的共生關(guān)系和約束關(guān)系。因此,本文設(shè)計(jì)了一種有效,靈活和魯棒的概率標(biāo)注模型――動(dòng)態(tài)混合馬爾科夫隨機(jī)場(chǎng)模型,結(jié)合不同層次上的圖像特征。這些特征彼此約束,互為補(bǔ)充,以達(dá)到對(duì)輸入圖像產(chǎn)生一致性標(biāo)注輸出的結(jié)果。
(2)眾所周知,圖像中不同類(lèi)別的物體往往具有不一致的特
5、征屬性。即使是使用不同圖像特征來(lái)建模物體,這些特征在物體的識(shí)別過(guò)程中往往具有不同的重要程度,即判別力的高低。本文提出一種自動(dòng)的學(xué)習(xí)算法能夠區(qū)分不同特征的重要性,并且在建立物體模型的過(guò)程中優(yōu)先選取判別力高的特征。與此同時(shí),通過(guò)更新模型中特征的權(quán)重系數(shù)使得當(dāng)前模型與真實(shí)模型具有相同的邊緣分布。隨著一系列特征的引入與相應(yīng)特征系數(shù)的更新,使得學(xué)習(xí)得到的模型逼近每類(lèi)物體的真實(shí)分布。
(3)學(xué)習(xí)場(chǎng)景標(biāo)注模型一般通過(guò)離線學(xué)習(xí)的方式,而用學(xué)習(xí)
6、得到的模型來(lái)推理得到場(chǎng)景標(biāo)注的結(jié)果一般使用在線推理的方式。這需要設(shè)計(jì)高效的推理算法,既能夠滿足大尺度數(shù)據(jù)集標(biāo)注的需要,也能滿足實(shí)際標(biāo)注系統(tǒng)的應(yīng)用需求。本文在動(dòng)態(tài)混合馬爾科夫隨機(jī)場(chǎng)模型的基礎(chǔ)上,設(shè)計(jì)了一種高效的推理算法――組合采樣算法。除此之外,本文還證明了在保證獲得很好的標(biāo)注性能的前提下,組合采樣算法能夠收斂到全局最優(yōu)解,即對(duì)應(yīng)后驗(yàn)概率最大的標(biāo)注結(jié)果。
(4)上下文特征不僅僅用于約束圖像標(biāo)記之間的共生關(guān)系和約束關(guān)系,還具有多尺
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于上下文信息的Web圖像標(biāo)注研究.pdf
- 基于圖像與標(biāo)注語(yǔ)義上下文的圖像自動(dòng)標(biāo)注算法研究.pdf
- 基于語(yǔ)義上下文建模的圖像語(yǔ)義自動(dòng)標(biāo)注研究.pdf
- 基于圖像特征及上下文的圖像標(biāo)注算法研究與實(shí)現(xiàn).pdf
- 基于上下文的音視頻標(biāo)注研究.pdf
- 基于上下文的視頻多語(yǔ)義標(biāo)注研究及實(shí)現(xiàn).pdf
- 基于上下文的圖像理解算法研究.pdf
- 基于上下文信息的語(yǔ)義圖像分類(lèi)研究.pdf
- 基于上下文分類(lèi)的圖像壓縮方法研究.pdf
- 基于上下文相關(guān)的圖像檢索方法研究.pdf
- 基于上下文語(yǔ)義的圖像編輯.pdf
- 基于上下文的圖像插值方法.pdf
- 基于上下文的圖像插值方法(1)
- 基于形狀上下文的圖像內(nèi)容檢索方法研究.pdf
- 基于上下文的靜止圖像和極光圖像壓縮.pdf
- 基于上下文的隱喻理解研究.pdf
- 基于社會(huì)上下文約束和物品上下文約束的協(xié)同推薦.pdf
- 基于上下文的低碼率圖像可重用技術(shù)的研究.pdf
- 基于圖像視覺(jué)上下文的多元IB聚類(lèi)算法.pdf
- 基于稀疏表示及上下文信息的PolSAR圖像分類(lèi).pdf
評(píng)論
0/150
提交評(píng)論