視頻信息內(nèi)容管理關(guān)鍵問(wèn)題研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩146頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、隨著網(wǎng)絡(luò)通訊和多媒體技術(shù)的迅猛發(fā)展,視頻信息近年來(lái)呈現(xiàn)出爆炸式的增長(zhǎng)態(tài)勢(shì)。相應(yīng)地,以視頻信息為中心的應(yīng)用也層出不窮,如網(wǎng)絡(luò)電視,3G視頻通信、視頻點(diǎn)播和視頻分享等。由此引發(fā)了視頻信息獲取和傳播方式的深刻變革——傳統(tǒng)意義上單一、被動(dòng)的信息獲取模式正在被多元化、互動(dòng)式的媒體交互業(yè)務(wù)所取代。與此同時(shí),視頻信息數(shù)量的膨脹和應(yīng)用模式的擴(kuò)展也逐漸顯現(xiàn)出諸多技術(shù)和社會(huì)問(wèn)題。一方面,人們對(duì)視頻信息組織、利用、版權(quán)管理和內(nèi)容認(rèn)證等需求日益增強(qiáng)。另一方面,

2、傳統(tǒng)的索引、檢索和信息安全等技術(shù)又難以直接應(yīng)用于視頻信息。因此,如何針對(duì)視頻信息的特性,研究完善、高效的視頻信息內(nèi)容管理機(jī)制已經(jīng)成為當(dāng)前學(xué)術(shù)界和多媒體產(chǎn)業(yè)界所廣泛關(guān)注的熱點(diǎn)問(wèn)題。
  本文從視頻信息的基本特性出發(fā),圍繞視頻信息應(yīng)用過(guò)程中所顯現(xiàn)出的需求,對(duì)視頻信息管理中的關(guān)鍵問(wèn)題進(jìn)行研究。本文的研究工作旨在通過(guò)設(shè)計(jì)有效的內(nèi)容管理機(jī)制來(lái)提高視頻信息的可利用性以及可信任性。研究?jī)?nèi)容主要涉及視頻結(jié)構(gòu)解析、視頻摘要、視頻內(nèi)容識(shí)別以及視頻內(nèi)容

3、認(rèn)證。
  本文的研究工作和創(chuàng)新點(diǎn)在于:
  (1)提出一種快速的鏡頭邊界檢測(cè)通用框架,以解決現(xiàn)有鏡頭邊界檢測(cè)算法運(yùn)算復(fù)雜度高的弊端。本文工作并不拘泥于特定的切變或漸變檢測(cè)算法,而是致力于提出一種能夠提高鏡頭檢測(cè)效率、并具有普遍適用性的通用框架。該框架采用多項(xiàng)預(yù)處理技術(shù)初步剔除非鏡頭區(qū)域并預(yù)測(cè)鏡頭邊界的屬性。另一方面,提出一種并行于視頻編碼的快速鏡頭檢測(cè)算法。算法通過(guò)有效地利用視頻編碼過(guò)程中產(chǎn)生的邊帶信息來(lái)輔助鏡頭檢測(cè)。仿真

4、實(shí)驗(yàn)表明,本文算法在顯著提高鏡頭檢測(cè)效率的同時(shí),還可以達(dá)到理想的檢測(cè)準(zhǔn)確度。
 ?。?)提出基于視覺(jué)注意力模型和在線聚類的視頻摘要算法。在詳盡分析注意力形成過(guò)程的視神經(jīng)生理學(xué)機(jī)制的基礎(chǔ)上,將注意力模型引入關(guān)鍵幀提取過(guò)程。通過(guò)模擬視覺(jué)系統(tǒng)各功能單元在注意力形成過(guò)程中的作用機(jī)理來(lái)自動(dòng)檢測(cè)幀內(nèi)的關(guān)鍵目標(biāo),并以此作為關(guān)鍵幀提取的依據(jù)。為了保證關(guān)鍵幀的簡(jiǎn)潔性、降低存儲(chǔ)需求并實(shí)現(xiàn)實(shí)時(shí)的摘要顯示,算法提出針對(duì)感興趣區(qū)域特征的在線聚類方案。仿真實(shí)

5、驗(yàn)表明,本文算法具有內(nèi)容自適應(yīng)性,所提取的關(guān)鍵幀集合在一定程度上能夠較好地與主觀觀察結(jié)果相吻合。
  (3)提出基于時(shí)空域顯著點(diǎn)的視頻識(shí)別算法,以 Harris顯著點(diǎn)檢測(cè)器和運(yùn)動(dòng)軌跡跟蹤技術(shù)為基礎(chǔ),對(duì)顯著點(diǎn)的空域顯著性和時(shí)域穩(wěn)定性進(jìn)行衡量,最終選取最穩(wěn)定的時(shí)空域顯著點(diǎn)作為視頻識(shí)別特征。算法將Hausdorff距離引入特征匹配,以應(yīng)對(duì)顯著點(diǎn)的無(wú)序性。此外,本文還提出基于非負(fù)矩陣分解的視頻識(shí)別算法,推導(dǎo)了Euclidean范數(shù)準(zhǔn)則下的

6、非負(fù)矩陣分解算法。在此基礎(chǔ)上,利用非負(fù)矩陣分解提取能夠綜合反映視頻信息時(shí)空內(nèi)容本質(zhì)的基圖像,以基圖像作為視頻識(shí)別的切入點(diǎn)。實(shí)驗(yàn)結(jié)果表明,本文提出的兩種算法可以實(shí)現(xiàn)精確的視頻識(shí)別,性能優(yōu)于同比算法。此外,時(shí)空域顯著點(diǎn)可以有效地抵御幾何失真對(duì)視頻識(shí)別的影響。
 ?。?)對(duì)魯棒哈希函數(shù)在視頻內(nèi)容認(rèn)證中的應(yīng)用進(jìn)行了研究,闡述了哈希函數(shù)概念和應(yīng)用領(lǐng)域的拓展。提出了基于隨機(jī) Gabor濾波和抖動(dòng)格型矢量量化的魯棒哈希函數(shù)。通過(guò)構(gòu)造具有旋轉(zhuǎn)不變

7、性的Gabor濾波器來(lái)增強(qiáng)魯棒哈希對(duì)旋轉(zhuǎn)操作的抵御能力。為了保證特征提取的安全性,提出依賴于密鑰的隨機(jī)Gabor濾波方案,并探討了魯棒哈希函數(shù)中安全性和隨機(jī)性之間關(guān)系。針對(duì)現(xiàn)有量化器的局限性,算法提出基于抖動(dòng)格型矢量量化的量化方案,并通過(guò)理論分析和實(shí)驗(yàn)驗(yàn)證對(duì)該量化方案的有效性進(jìn)行論述。實(shí)驗(yàn)和分析結(jié)果表明,本文算法在魯棒性和區(qū)分性方面都有良好的表現(xiàn),尤其是在對(duì)旋轉(zhuǎn)操作的魯棒性方面明顯優(yōu)于代表性算法。此外,針對(duì)視頻信息的特性,提出一種基于視

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論