多媒體語義提取方法及其在視頻水印中的應用研究.pdf_第1頁
已閱讀1頁,還剩56頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、隨著計算機和網(wǎng)絡技術(shù)的飛速發(fā)展,視頻和圖像等多媒體數(shù)據(jù)呈幾何級數(shù)增長,同時人們對這些視覺媒體內(nèi)容的需求也越來越多,越來越廣泛,因此如何從浩如煙海的數(shù)據(jù)資源中實現(xiàn)信息檢索逐漸成為目前的研究熱點。但是現(xiàn)有的檢索技術(shù)多是基于底層視覺特征的檢索,與人們所能理解的高層語義概念相去甚遠,這嚴重地影響檢索的實際效果。多媒體數(shù)據(jù)所包含的語義內(nèi)容無法用底層視覺特征來準確表述,即在底層視覺特征和包含的語義之間存在著“語義鴻溝(Semantic Gap)”,

2、如何跨越“語義鴻溝”,有效的提取語義信息,已經(jīng)成為多媒體研究領域中一個亟待解決的問題。 首先,論文闡述了基于內(nèi)容的信息檢索技術(shù)(Content Based Information Retrieval,CBIR)的研究和發(fā)展現(xiàn)狀,介紹了語義提取研究的相關(guān)理論及當前常用的語義提取方法,包括基于機器學習的語義提取方法、基于反饋學習的語義提取方法和結(jié)合特定領域的語義提取方法等。論文研究并實現(xiàn)了兩種典型的基于機器學習的圖像語義提取方法,包括基于支

3、持向量機(Support Vector Machine,SVM)的語義提取和基于一致語言模型(Coherent Language Model,CLM)的語義提取。實驗結(jié)果表明,這兩種方法對圖像有較好的語義提取效果。
   其次,論文提出了一種基于模糊關(guān)聯(lián)分類的視頻語義提取方法,該方法引入模糊概念,解決了關(guān)聯(lián)規(guī)則挖掘“邊界過硬”問題;把關(guān)聯(lián)分類規(guī)則挖掘看作約束優(yōu)化問題,通過構(gòu)造自適應懲罰親和度函數(shù),以提高評估抗體優(yōu)劣程度的準確性;

4、采用混合雙變異算子,以獲得更好的全局和局部搜索能力;采用老化算子,在保證種群多樣性的同時減小了計算復雜度。論文將該方法用于視頻運動語義和紋理語義提取,取得了令人滿意的實驗結(jié)果。
   最后,論文將高層語義應用到視頻數(shù)字水印中,提出了一種基于視頻語義的AVS(Audio Video coding standard)壓縮域魯棒水印方法,該方法利用獲得的視頻運動語義,在線生成動態(tài)語義水印;根據(jù)運動語義自適應確定感興趣鏡頭,根據(jù)紋理語義

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論