版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、視頻廣告已經(jīng)成為當(dāng)今人類社會(huì)最為流行的一種商業(yè)媒介,為人們的現(xiàn)代生活帶來了不可或缺的商業(yè)信息,時(shí)時(shí)刻刻都在潛移默化的影響著人們的工作和生活方式。每年世界各國(guó)的企業(yè)都會(huì)花費(fèi)上億美元的資金,生產(chǎn)、投放成千上萬條的視頻廣告并在各國(guó)電視臺(tái)循環(huán)不斷的播出,在向民眾推介各種各樣新穎的商品及服務(wù)的同時(shí),也帶動(dòng)了相關(guān)產(chǎn)業(yè)的迅速發(fā)展。
同時(shí),隨著數(shù)字化浪潮的發(fā)展,人們已經(jīng)可以通過各種手段錄制海量的視頻廣告以便隨時(shí)獲取重要的商業(yè)咨詢。但是,由于缺
2、少有效的廣告內(nèi)容自動(dòng)分析技術(shù),錄制廣告數(shù)量的爆炸性增長(zhǎng)導(dǎo)致了不同用戶群對(duì)于視頻廣告自動(dòng)濾除、采集以及索引等多方面的迫切需求。如何針對(duì)他們各具特色的需求,開發(fā)一系列有效的視頻廣告內(nèi)容分析與理解技術(shù),從而快速有效的監(jiān)視、分析、存儲(chǔ)、查詢視頻廣告的內(nèi)容、播出時(shí)間、質(zhì)量等已經(jīng)成為當(dāng)前多媒體內(nèi)容分析領(lǐng)域的一個(gè)熱點(diǎn)問題。
針對(duì)當(dāng)前視頻廣告內(nèi)容分析與理解技術(shù)中存在的不足,本文嘗試和探索從視頻廣告各種潛在語義特性的分析入手,借助計(jì)算機(jī)視覺、機(jī)
3、器學(xué)習(xí)以及多媒體處理技術(shù),跨媒體挖掘視頻廣告中存在的各種語義概念,構(gòu)造中層描述子,實(shí)現(xiàn)不同媒體模態(tài)下的信息交互融合,提出行之有效的解決方案。本文主要成果和創(chuàng)新之處包括以下幾個(gè)方面:
1)視頻廣告識(shí)別技術(shù)中的由粗及細(xì)匹配策略
為提高視頻廣告識(shí)別技術(shù)的效率,通過將局部敏感哈希函數(shù)(Locality SensitiveHash,LSH)與精細(xì)尺度連續(xù)濾除技術(shù)(Fine Granularity Successive Elim
4、ination,F(xiàn)GSE)進(jìn)行有機(jī)的融合,提出一種由粗及細(xì)的匹配策略。在粗匹配階段,利用LSH加快初始檢索速度,大量過濾無關(guān)內(nèi)容,得到全局近似的查詢結(jié)果;在精匹配階段,引入 FGSE技術(shù)解決粗匹配過程中的沖突問題,通過逐層分解匹配特征,快速尋找局部差異,獲得精確匹配結(jié)果,實(shí)現(xiàn)對(duì)于視頻廣告的快速識(shí)別。
2)基于協(xié)同學(xué)習(xí)的視頻廣告文本檢測(cè)
視頻廣告中的文本是一種重要的語義信息。為實(shí)現(xiàn)對(duì)這類復(fù)雜文本的有效定位,提出一種基于
5、協(xié)同學(xué)習(xí)的視頻廣告文本檢測(cè)方法。通過將文本檢測(cè)視為一種特殊紋理的分類問題,引入?yún)f(xié)同學(xué)習(xí)機(jī)制,采用兩種相對(duì)獨(dú)立的視角強(qiáng)化對(duì)于文本區(qū)域特性的描述。針對(duì)協(xié)同學(xué)習(xí)機(jī)制中容易引入噪聲樣本的問題,結(jié)合Bootstrap思想,提出一種改進(jìn)的協(xié)同學(xué)習(xí)算法,在兩個(gè)相對(duì)獨(dú)立的視角中交互選擇典型樣本,提高分類器的泛化能力。
3)融合視覺一音頻一文本模態(tài)信息的視頻廣告段落檢測(cè)
提出一種基于視覺、音頻以及文本模態(tài)交互式融合的廣告段落檢測(cè)方法。
6、通過充分挖掘廣告各模態(tài)中本質(zhì)的播放特性,首次在視頻廣告的文本模態(tài)中,結(jié)合視頻文本區(qū)域在時(shí)空域隨機(jī)變化的特性,提出一個(gè)全面的文本描述子,同廣告音視頻模態(tài)特征構(gòu)成完整的描述空間。此外,為解決現(xiàn)有融合方式中,簡(jiǎn)單將各模態(tài)信息進(jìn)行疊加的不足,提出一種交互集成式學(xué)習(xí)算法Tri-AdaBoost,交互挖掘各種模態(tài)的中級(jí)描述子所蘊(yùn)含的互補(bǔ)信息,實(shí)現(xiàn)這些模態(tài)的有機(jī)融合,從而提升分類器的性能。
4)視頻廣告段落分割技術(shù)中跨媒體特性分析與融合研究
7、
通過融合廣告視覺、音頻以及文本模態(tài),提出一種有效的視頻廣告段落分割方法。為了加強(qiáng)對(duì)于廣告分割具有重要作用的描述子--產(chǎn)品信息幀(FrameMarked with Product Information,F(xiàn)MPI)檢測(cè)的魯棒性,首次將文本模態(tài)與一些重要的視覺特性引入FMPI的構(gòu)造過程,并結(jié)合音頻模態(tài)描述子形成一個(gè)對(duì)于廣告邊界特性的完整描述空間。此外,利用不同模態(tài)下描述子之間時(shí)域的上下文信息,實(shí)現(xiàn)各模態(tài)的有效融合,自動(dòng)分割廣告段
8、落。
5)基于稀疏視覺詞包描述的廣告語義分類方法
為提高傳統(tǒng)視覺詞包的描述能力,利用更加符合人類理解圖像方式的稀疏學(xué)習(xí)技術(shù),提出一種基于稀疏視覺詞包描述的廣告語義分類方法。基于對(duì)于大量廣告中視覺語義單元共生規(guī)律之間的分析,將不同類別廣告中出現(xiàn)的各具特色的語義單元映射為一種過完備化的視覺詞典表示,并利用這個(gè)詞典中基本元素的稀疏線性組合描述廣告中潛在的語義,在不同類別廣告中蘊(yùn)含的語義信息與稀疏視覺詞包描述之間建立潛在的映
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 黃頁廣告內(nèi)容分析.pdf
- 國(guó)內(nèi)綠色廣告的內(nèi)容分析.pdf
- 平面電腦廣告的內(nèi)容分析.pdf
- 家用視頻內(nèi)容分析方法研究.pdf
- 面向視頻挖掘的視覺內(nèi)容分析.pdf
- 20年來藥品廣告內(nèi)容分析.pdf
- 基于RVM的視頻內(nèi)容分析研究與實(shí)現(xiàn).pdf
- 房地產(chǎn)報(bào)紙廣告內(nèi)容分析.pdf
- 基于結(jié)構(gòu)化信息的圖像內(nèi)容分析與理解.pdf
- 基于內(nèi)容分析的圖像視頻編碼研究.pdf
- 初中語文微視頻的內(nèi)容分析.pdf
- 體育視頻的內(nèi)容分析技術(shù)研究.pdf
- 初中語文微視頻的內(nèi)容分析
- 針對(duì)新聞視頻的內(nèi)容分析研究.pdf
- 金融服務(wù)業(yè)報(bào)紙廣告內(nèi)容分析.pdf
- 中國(guó)報(bào)紙媒體廣告報(bào)道的內(nèi)容分析.pdf
- 《北京晚報(bào)》手機(jī)報(bào)紙廣告內(nèi)容分析.pdf
- 基于視頻內(nèi)容分析的鐵路入侵檢測(cè)研究.pdf
- 足球視頻主題建模及內(nèi)容分析方法研究.pdf
- 視頻對(duì)象檢測(cè)及其在視頻語義內(nèi)容分析中的應(yīng)用.pdf
評(píng)論
0/150
提交評(píng)論