版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著信息通信技術(shù)、多媒體技術(shù)的蓬勃發(fā)展和網(wǎng)絡(luò)寬帶的迅速普及,互聯(lián)網(wǎng)進(jìn)入讀圖時(shí)代,人們渴望用一種最簡(jiǎn)單直接的方式來(lái)看世界,由于音視頻視聽(tīng)兼容、聲像并茂,承載信息量大,具有表達(dá)直觀、立體形象、現(xiàn)場(chǎng)感強(qiáng)烈等特點(diǎn),進(jìn)而能夠加速信息流通和信息的充分表達(dá)。其中在農(nóng)業(yè)領(lǐng)域,農(nóng)業(yè)生產(chǎn)知識(shí)類音視頻,使用音視頻動(dòng)畫,生動(dòng)形象展示生產(chǎn)流程,提供了重要的科技信息指導(dǎo)農(nóng)業(yè)生產(chǎn),提高效益,在農(nóng)業(yè)科技信息的傳播中起著重要的作用。
以農(nóng)業(yè)知識(shí)類音視頻合成文件
2、(以下簡(jiǎn)稱視頻)為研究對(duì)象,針對(duì)當(dāng)前知識(shí)類視頻檢索粗糙、視頻資源分散、缺乏統(tǒng)一的共享機(jī)制等問(wèn)題,本文基于自然語(yǔ)言處理得到視頻中所表達(dá)的文本內(nèi)容,并利用Mapreduce分布式計(jì)算模型設(shè)計(jì)實(shí)現(xiàn)面向農(nóng)業(yè)音視頻合成文件的索引系統(tǒng),進(jìn)而在此基礎(chǔ)上,為用戶提供檢索界面,實(shí)現(xiàn)基于語(yǔ)義的農(nóng)業(yè)知識(shí)視頻檢索服務(wù)。隨著計(jì)算機(jī)視覺(jué)、人工智能和語(yǔ)音識(shí)別的發(fā)展,對(duì)視頻檢索研究逐漸向視頻的低層特征信息和高層語(yǔ)義信息相結(jié)合的方向發(fā)展。本文在充分分析農(nóng)業(yè)知識(shí)類音視頻文
3、件具有“音頻為主,視頻為輔”以及視頻鏡頭切換少,所講授知識(shí)具有陳述性、程序性等特點(diǎn)的基礎(chǔ)上,主要進(jìn)行以下幾個(gè)方面的研究:
(1)基于語(yǔ)音識(shí)別進(jìn)行視頻文本內(nèi)容的提取。首先利用FFmpeg技術(shù)進(jìn)行視頻中音頻的提取,然后基于自然語(yǔ)言、語(yǔ)音識(shí)別對(duì)視頻內(nèi)容進(jìn)行語(yǔ)義文本標(biāo)注,形成了上GB的視頻內(nèi)容文本文件。為了提高語(yǔ)音識(shí)別的正確率,最大程度的保留完整的語(yǔ)義單元,在語(yǔ)音識(shí)別中對(duì)音頻文件做了音頻分割和靜音檢測(cè)以及擴(kuò)展農(nóng)業(yè)專業(yè)詞匯表工作。為了驗(yàn)
4、證語(yǔ)音識(shí)別的正確率和探究基于自然語(yǔ)言處理、語(yǔ)義標(biāo)注對(duì)視頻索引的可行性,本文對(duì)100個(gè)視頻樣本分別進(jìn)行機(jī)器標(biāo)注和人工標(biāo)注,對(duì)標(biāo)注后的文本進(jìn)行詞頻統(tǒng)計(jì),通過(guò)對(duì)比計(jì)算兩者高頻主題詞匯,得出兩者相似度達(dá)到98.4%的結(jié)論,進(jìn)而可以說(shuō)明語(yǔ)音識(shí)別達(dá)到了很好的效果且基于自然語(yǔ)言處理、機(jī)器標(biāo)注視頻進(jìn)行索引具有可行性。
(2)針對(duì)(1)得到的視頻內(nèi)容文本文件,在分布式計(jì)算環(huán)境下,并行構(gòu)建倒排索引表。利用Mapreduce并行計(jì)算模型并基于TF-
5、IDF算法,根據(jù)索引詞出現(xiàn)的位置不同而設(shè)置不同的權(quán)重系數(shù)來(lái)計(jì)算rank值;依據(jù)業(yè)務(wù)邏輯對(duì)Mapreduce框架進(jìn)行性能調(diào)優(yōu),為了使數(shù)據(jù)盡量分散開(kāi),避免大數(shù)據(jù)傾斜,將業(yè)務(wù)邏輯寫成多個(gè)Mapreduce串;從減少數(shù)據(jù)傳輸過(guò)程中網(wǎng)絡(luò)流量的角度,在數(shù)據(jù)量大的情況下,開(kāi)啟了可插拔的Combiner。并在此基礎(chǔ)上,采用同樣的詞庫(kù)和分詞算法,對(duì)單機(jī)和集群環(huán)境下構(gòu)建索引的效率進(jìn)行了對(duì)比分析,得出在隨著數(shù)據(jù)量的增長(zhǎng),單機(jī)執(zhí)行效率急劇增長(zhǎng),而集群的執(zhí)行效率
6、呈一定的線性增長(zhǎng)的結(jié)論。
(3)對(duì)系統(tǒng)進(jìn)行了架構(gòu)設(shè)計(jì)和原型系統(tǒng)開(kāi)發(fā)。架構(gòu)設(shè)計(jì)主要包括離線的視頻數(shù)據(jù)處理和在線的視頻檢索服務(wù)。其中離線的視頻數(shù)據(jù)處理包括數(shù)據(jù)預(yù)處理模塊和并行構(gòu)建倒排索引模塊;在線的視頻檢索主要基于Web Api為用戶提供檢索界面,構(gòu)建分布式檢索系統(tǒng),為用戶提供基于語(yǔ)義的實(shí)時(shí)的、準(zhǔn)確的檢索服務(wù)。
本文通過(guò)對(duì)自然語(yǔ)言處理得到的視頻內(nèi)容文本文件構(gòu)建分布式的索引系統(tǒng)和分布式檢系統(tǒng),對(duì)整合分散的農(nóng)業(yè)知識(shí)類視頻資源
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 分布式面向?qū)ο笪募到y(tǒng)研究.pdf
- 音視頻接口知識(shí)
- 視頻文件音視頻不同步的調(diào)整
- 面向海量郵件存儲(chǔ)的分布式文件系統(tǒng)研究.pdf
- 面向音視頻解碼的SoC平臺(tái)設(shè)計(jì).pdf
- 基于Sip的Android音視頻通信系統(tǒng)研究與設(shè)計(jì).pdf
- 基于RTSP的音視頻傳輸系統(tǒng)研究與實(shí)現(xiàn).pdf
- 音視頻相結(jié)合的廣告檢測(cè)系統(tǒng)研究與實(shí)現(xiàn).pdf
- 分布式面向?qū)ο笪募到y(tǒng)提取研究.pdf
- 遠(yuǎn)程分布式視頻監(jiān)控系統(tǒng)研究.pdf
- 面向服務(wù)的分布式協(xié)同系統(tǒng)研究.pdf
- 基于IP的一類音視頻處理系統(tǒng)的研究.pdf
- 基于MPI的分布式搜索引擎系統(tǒng)研究.pdf
- 數(shù)字音視頻
- 音視頻格式
- 分布式面向?qū)ο笪募到y(tǒng)提取研究(1)
- 面向音視頻應(yīng)用的專用芯片設(shè)計(jì)與研究.pdf
- 無(wú)反饋分布式視頻編碼系統(tǒng)研究.pdf
- 音視頻 ,螺絲和線纜基本知識(shí)
- 音視頻技術(shù)方案
評(píng)論
0/150
提交評(píng)論