基于內(nèi)容的音樂檢索關鍵技術研究.pdf_第1頁
已閱讀1頁,還剩124頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、音樂是一類重要的音頻數(shù)據(jù),傳統(tǒng)的音樂檢索都是基于關鍵詞的檢索,使用受限。隨著互聯(lián)網(wǎng)的快速發(fā)展及數(shù)字化設備的普及,基于內(nèi)容的音頻檢索研究得到廣泛的關注。本文以國家自然科學基金項目“基于Web的音頻識別與檢索關鍵技術研究(N0.60673100)”為背景,針對基于內(nèi)容的音樂檢索關鍵技術展開了深入的研究:提出了適合音樂檢索的特征提取方法、相似度度量方法和檢索算法,并研究語音識別中端點檢測及連續(xù)詞識別等技術,研究成果已應用于基于內(nèi)容的音樂檢索系

2、統(tǒng)中。主要的研究進展如下: 1)構(gòu)建了音樂檢索的處理框架和符號體系。在分析音樂檢索存在問題的基礎上,給出了研究思路;定義了歌譜映射方法及音樂檢索中的符號體系,為基于內(nèi)容的音樂檢索打下基礎。 2)針對音樂特征的算法研究。將音樂特征分為低級特征(旋律輪廓)和高級特征(音樂歌譜)兩部分。 針針對低級特征提出了一種旋律輪廓提取算法。此算法能準確地提取出哼唱曲子的旋律輪廓特征,當輸入為基本音級時得出的特征值符合音程特征。但

3、此算法要求用戶對音調(diào)的把握要準確。 b針針對高級特征將語音識別技術應用于音樂檢索。為從包含歌譜的一段連續(xù)語音信號中確定出音符的起點和終點,需要使用端點檢測技術,本文提出了一種基于熵和時間序列方法PAA的端點檢測算法-PAAEPD(Piecewise Aggregate Approximation End Point Detection),用戶可直接哼唱歌譜檢索目標音樂,對音調(diào)把握要求不高,只要發(fā)音準確即可實現(xiàn)檢索。 3)

4、音樂檢索算法的研究。 a)針對音樂的時序特征定義了字符距離及特征字符串距離,并提出了一個字符串相似度計算方法。分析了音頻等復雜數(shù)據(jù)近似檢索的必要性以及現(xiàn)有的字符串近似匹配算法和時間序列相似檢索的局限性,提出了本方法并應用于音樂檢索中,對音調(diào)把握準確者獲得92%的前十位檢出率。 b)提出了以句為單位的分層檢索算法。音樂是以句為單位的,并且每句音樂的旋律波動和句子長度都是固定的。本文利用旋律波動和句子長度縮小搜索范圍,使瞼索

5、時間減少了25%。 c)針針對用戶的哼唱習慣提出了跨句檢索算法。用戶哼唱多句時,數(shù)據(jù)庫中保存的單句旋律輪廓信息不能使用,需要多句旋律特征,文中給出了候選音樂片段及特征生成算法,實現(xiàn)了跨句檢索。 4)音樂數(shù)據(jù)庫的研究。本文采用音樂的原始歌譜作為庫中數(shù)據(jù)來源,給出了音樂歌譜數(shù)據(jù)庫的構(gòu)成及數(shù)據(jù)庫中的特征及含義和計算方法。 5)將所研究的算法應用于音樂檢索,實現(xiàn)了基于內(nèi)容的音樂哼唱檢索系統(tǒng),取得較好的效果。研究成果可應用于其它類

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論