基于哼唱搜索的音樂檢索系統(tǒng)研究.pdf_第1頁
已閱讀1頁,還剩85頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、基于音頻內(nèi)容的搜索方式在哼唱的檢索領(lǐng)域應(yīng)用非常普遍。本文旨在實(shí)現(xiàn)一個(gè)基本的基于用戶哼唱的音頻搜索系統(tǒng)。該系統(tǒng)的具體實(shí)現(xiàn)主要涉及三個(gè)技術(shù)的難點(diǎn)。首先我們需要研究解決的就是如何提取音頻的特征曲線。第二個(gè)我們需要研究解決的就是如何構(gòu)造MIDI特征庫。第三個(gè)需要研究解決的就是如何從特征庫中檢索出結(jié)果即旋律匹配算法的實(shí)現(xiàn)。
  本文在第一個(gè)技術(shù)難點(diǎn)上的工作主要包括音頻的預(yù)處理和提取音頻特征旋律曲線。我們想要得到一段噪聲比較小的音頻數(shù)據(jù),所以

2、就必須去噪。我們采用卡爾曼濾波的方法先對輸入的音頻信號簡單去噪,然后預(yù)加重,我們使用的方法是高通濾波,最后漢明加窗。這樣我們就可以提取處理后音頻的特征。我們討論了各種現(xiàn)有的特征提取算法,最終選定改進(jìn)的AMDF平均幅度差方法,并使用matlab實(shí)現(xiàn)了該算法,完成了輸入音頻的特征提取。
  本文在第二個(gè)技術(shù)難點(diǎn)上的工作主要就是如何提取MIDI中的特征曲線,并構(gòu)建音頻特征數(shù)據(jù)庫。我們分析了 MIDI的文件格式,利用了第三方 MIDI庫讀

3、取MIDI文件的數(shù)據(jù),并結(jié)合輪廓線算法和最佳 k音軌旋律算法,最終我們得到了MIDI文件的音高特征曲線并且寫入文件,該文件中存儲的數(shù)據(jù)是旋律匹配模塊中的特征數(shù)據(jù)。
  本文的第三個(gè)難點(diǎn)是如何從特征庫中查找用戶需要的音樂。本文在這一方面的工作主要是分析了現(xiàn)有的旋律匹配算法,主要包括基于字符串的匹配算法、基于統(tǒng)計(jì)的HMM的算法以及基于動(dòng)態(tài)時(shí)間規(guī)整(DTW)的算法。最終我們選定了動(dòng)態(tài)時(shí)間規(guī)整算法來進(jìn)行旋律識別,并且考慮到實(shí)際檢索中的通用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論