版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著多媒體技術(shù)的飛速發(fā)展和計(jì)算機(jī)處理的不斷增長(zhǎng),人們面臨著一個(gè)巨大的數(shù)字化“信息海洋”,如何對(duì)這些信息進(jìn)行快速準(zhǔn)確地檢索已經(jīng)成為人們的迫切需要。在這樣的條件下,多媒體信息檢索技術(shù)于20世紀(jì)90年代開(kāi)始蓬勃發(fā)展起來(lái),成為信息檢索技術(shù)研究的一個(gè)重要分支。開(kāi)始階段,研究的注意力主要集中在基于內(nèi)容的圖像檢索和視頻檢索兩個(gè)方面,而往往忽視了音頻數(shù)據(jù)中所蘊(yùn)含的豐富語(yǔ)義,加上原始的音頻數(shù)據(jù)的非結(jié)構(gòu)化特性,因此,音頻檢索相對(duì)滯后。隨著音頻數(shù)據(jù)的大量出現(xiàn)
2、,基于內(nèi)容的音頻檢索也逐漸成為多媒體信息檢索技術(shù)的一個(gè)研究熱點(diǎn)。 本文在認(rèn)真總結(jié)了前人研究成果的基礎(chǔ)上,對(duì)基于內(nèi)容的音頻信息檢索中的若干問(wèn)題進(jìn)行了相關(guān)探討,著重研究了音頻特征的分析、分類(lèi)器設(shè)計(jì)和語(yǔ)音信息檢索這幾方面的問(wèn)題。 本文的主要工作和研究成果包括以下幾個(gè)方面: (1)音頻特征分類(lèi)方法的研究音頻分類(lèi)主要以一些主觀或者客觀的音頻特征為基礎(chǔ),音頻特征的選取要能夠充分體現(xiàn)出音頻在時(shí)域和頻域中的重要分類(lèi)特性。因此,音
3、頻特征的分析與提取也就成為音頻分類(lèi)問(wèn)題的基礎(chǔ)和重點(diǎn)。如何有效地提取音頻特征,并保持特征間相互獨(dú)立,減少信息冗余就是需要進(jìn)一步解決的重要問(wèn)題。 本文在音頻特征分析中,引入獨(dú)立分量分析算法,用來(lái)提取音頻最為關(guān)鍵并高維獨(dú)立的特征,提高特征的可分性。同時(shí),在此基礎(chǔ)上,利用支持向量機(jī)良好的分類(lèi)性能,對(duì)各類(lèi)音頻數(shù)據(jù)的特征進(jìn)行分類(lèi),即提出一種將獨(dú)立分量分析和支持向量機(jī)結(jié)合而構(gòu)成的混合模型用于音頻特征分類(lèi)問(wèn)題,收到較好的效果。 (2)音
4、頻分類(lèi)器的設(shè)計(jì)與實(shí)現(xiàn)基于內(nèi)容的音頻檢索就是要針對(duì)連續(xù)的音頻信號(hào)進(jìn)行分類(lèi)。因此,如何構(gòu)造一個(gè)分類(lèi)器,使其能較好地表征音頻的時(shí)間統(tǒng)計(jì)特性,同時(shí)又具有一定的類(lèi)別區(qū)分能力是一個(gè)值得研究的問(wèn)題。 本文在結(jié)合課題組在語(yǔ)音識(shí)別研究中已完成的研究基礎(chǔ)之上,將由隱馬爾科夫模型引申出來(lái)的廣義模型運(yùn)用到音頻分類(lèi)檢索中,將廣義模型與支持向量機(jī)結(jié)合,提出將基于支持向量機(jī)和廣義模型的混合模型用于音頻分類(lèi)檢索。 (3)基于廣播新聞音頻的檢索技術(shù)研究語(yǔ)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于內(nèi)容的音頻信息檢索技術(shù)研究.pdf
- 基于內(nèi)容的音頻信息檢索系統(tǒng)研究.pdf
- 基于內(nèi)容的音頻檢索技術(shù)研究.pdf
- 基于內(nèi)容的視頻信息檢索技術(shù)研究與實(shí)現(xiàn).pdf
- 基于內(nèi)容的音頻檢索技術(shù)研究與實(shí)現(xiàn).pdf
- 音頻信息隱藏技術(shù)研究.pdf
- 基于內(nèi)容的音頻檢索的關(guān)鍵技術(shù)研究.pdf
- 基于音頻的視頻內(nèi)容檢索——面向流媒體內(nèi)容監(jiān)控的音頻檢索關(guān)鍵技術(shù)研究.pdf
- 基于內(nèi)容的音頻檢索特征提取技術(shù)研究.pdf
- 基于內(nèi)容的音頻檢索技術(shù)研究與系統(tǒng)實(shí)現(xiàn).pdf
- 基于內(nèi)容的音頻檢索技術(shù)的研究.pdf
- 基于內(nèi)容的音樂(lè)信息檢索技術(shù)研究.pdf
- 基于內(nèi)容的視覺(jué)信息檢索技術(shù)研究.pdf
- 基于最優(yōu)搜索理論的視頻信息檢索技術(shù)研究.pdf
- 基于內(nèi)容的音頻檢索.pdf
- 基于FPGA的數(shù)字音頻信息隱藏技術(shù)研究.pdf
- 基于神經(jīng)網(wǎng)絡(luò)理論的音頻信息隱藏技術(shù)研究.pdf
- 基于內(nèi)容的音頻檢索方法研究.pdf
- 視頻信息檢索的關(guān)鍵技術(shù)研究.pdf
- 基于內(nèi)容圖像檢索中圖像語(yǔ)義分類(lèi)技術(shù)研究.pdf
評(píng)論
0/150
提交評(píng)論