2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩113頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、隨著現(xiàn)代信息社會的不斷發(fā)展,人們獲得的多媒體信息日益增加。因此,對各種多媒信息的處理技術(shù)就變成了相關(guān)領(lǐng)域內(nèi)學(xué)者的重要研究任務(wù)。在這些多媒體中,視覺信息因其形象、生動和直觀的特點而更為人們所關(guān)注,但同時視覺信息巨大的數(shù)據(jù)量給傳輸、存儲、處理帶來了挑戰(zhàn)。因此對視覺信息尤其是視頻信息的各種處理技術(shù)研究就從來沒有停止過。 為了更有效地存儲、傳輸和使用視頻數(shù)據(jù),必須進行視頻壓縮。MPEG組織提出了第二代視頻壓縮標(biāo)準(zhǔn)MPEG-4。相比與第一

2、壓縮標(biāo)準(zhǔn),MPEG-4最顯著的特點之一就是提出了基于對象的編碼方式。要實現(xiàn)基于對象的視頻編碼,首行要進行視頻對象分割。視頻對象分割是指在時空域上將視頻分割為一些視頻語義對象的組合,也就是將每一個視頻幀分割為一些不同語義對象區(qū)域。同時為視頻數(shù)據(jù)檢索服務(wù)的MPEG-7標(biāo)準(zhǔn)則提出了對各種媒體對象進行統(tǒng)一和規(guī)范化的描述。而一些計算機視覺等也需要基于對象的各種功能。因此,基于對象的視頻信息描述方式已成為多媒體信息處理技術(shù)中的一種巨大需求。

3、 然而,由于視視對象分割是相當(dāng)困難的問題,MPEG-4盡管引入了視頻對象的概念,但它并沒有指定從視頻序列獲取視頻對象的具體方法。視頻對象分割的困難性主要體現(xiàn)在兩方面:(1)現(xiàn)實世界中視頻場景極度復(fù)雜和多樣,很難用一種方法進行統(tǒng)一的分割;(2)視頻對象的定義是一種基于高級語義的描述,很難用低層次的視覺描述方式如邊緣、顏色、運動等特征來描述,而目前的圖象分析技術(shù)又遠遠不足以將高層次語義對象用機器語言來準(zhǔn)確的定義和描述。 盡管困難重重

4、,但由于廣泛的應(yīng)用前景,近幾年對視頻對象分割技術(shù)的研究就從來沒有停止過。本論文研究了視頻對象分割中的一些技術(shù)難點和重點,包括如何提高自動視頻運動對象分割的準(zhǔn)確性,如何對視頻分割中的難點問題如遮擋等進行處理,以及如何在多種復(fù)雜運動情況下進行對象分割。研究目標(biāo)既有單視頻對象,又有多視頻對象,重點對多視頻對象分割進行了研究。具體地,本論文的主要工作和創(chuàng)新點包括: 針對視頻對象分割準(zhǔn)確性不高的問題,提出了一種基于區(qū)域多重選擇的視頻運動對

5、象分割提取方法:首先利用一種有效的方法在空間域(幀內(nèi))進行區(qū)域劃分,得到基于區(qū)域表示的空間圖;然后利用改進的幀差法計算序列時間域(幀間)信息,對所有區(qū)域進行分類選擇,區(qū)域內(nèi)運動屬性非常明顯的確定為對象區(qū)域,非常不明顯的為背景區(qū)域,而介于兩者中間的區(qū)域為候選區(qū)域;為了對候選區(qū)域進行分類選擇,建立時空區(qū)域能量模型,進一步選擇;最后利用馬爾可夫模型和標(biāo)記的方法對所得到的對象區(qū)域進行后處理,得到完整的對象掩模,通過映射,即可獲得運動的視頻對象。

6、 針對視頻對象分割中存在的背景與對象之間的遮擋問題,提出了一種利用背景重建技術(shù)進行視頻對象提取的方法。首先提出一種新的噪聲參數(shù)估計方法,運用變化檢測技術(shù)得到表示視頻對象運動區(qū)域的二進制變化檢測掩模(CDM),針對CDM紋理性差的特點,以鄰域最大值法來修補邊緣并填補空洞,經(jīng)數(shù)學(xué)形態(tài)學(xué)濾波后得到完整的二進制掩模;然后利用二進制掩模映射獲得本幀背景圖象,通過多幀背景圖象相互補充可得到較為完整的重構(gòu)背景圖象;最后用當(dāng)前隕和重構(gòu)的背景圖象

7、相減的辦法消除背景遮擋的影響,得到初始的視頻對象,經(jīng)數(shù)學(xué)形態(tài)學(xué)邊緣修正后,獲得準(zhǔn)確的視頻對象。 針對多視頻對象的分割問題,提出了一種基于貝葉斯框架的時空標(biāo)記場最大后驗概率的多視頻對象分割算法,根據(jù)視頻序列幀間(時間域)和幀內(nèi)(空間域)信息的不同特點,建立基于多個對象分割標(biāo)記場的最大后驗概率公式,并導(dǎo)出其最小能量函數(shù),通過求解最小能量使其分割標(biāo)記的后驗概率達到最大,得到具有不同標(biāo)記的多個視頻對象。最小能量的求解過程用優(yōu)化方法—迭代

8、條件模式(ICM)方法,初始分割標(biāo)記場用矢量直方圖法得到。提出的算法是不僅對單獨運動的多對象分割是有效的,而還能處理對象間的部分遮擋問題。 針對具有復(fù)雜運動的多視頻對象,提出了一種基于時空曲線演化的多視頻對象自動分割方法,首先根據(jù)視頻序列幀間(時間域)和幀內(nèi)(空間域)信息的不同特點,建立基于全局和局部特征的能量模型,并由此導(dǎo)出基于levelsets方法的曲線演化方程;然后用視頻序列的連繼兩幀幀差得到初始的視頻對象,分別進行時間和

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論