視覺樂譜識別關鍵技術研究.pdf_第1頁
已閱讀1頁,還剩145頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、光學樂譜識別技術將數字化樂譜圖像轉化為計算機能理解的代碼格式,對音樂信息處理具有重要意義,同時對發(fā)展農村音樂教育、娛樂水平,甄選有利于農業(yè)生產的音樂作品等工作提供技術支持。以便攜式數碼相機設備采集的視覺圖像更適合農業(yè)的作業(yè)環(huán)境,經濟優(yōu)勢明顯。受點聚焦和自然環(huán)境因素的影響,視覺樂譜圖像具有背景復雜、光照不均勻、五線譜傾斜、彎曲、模糊等問題,嚴重影響了樂譜識別效果。文章針對視覺五線譜圖像識別的難點,對樂譜自動定位、二值化、譜線檢測及樂符識別

2、等關鍵問題的解決方法進行了探討,以期提高印刷體視覺樂譜的識別效率。本文主要貢獻和創(chuàng)新點如下:
  (1)將非監(jiān)督特征學習理論引入到樂譜自動定位方法中。不依賴于五線譜的結構特點,以圖像塊為判別單元,通過K-means聚類算法提取圖像塊特征,采用支撐向量機進行分類,利用同類結果的連通域搜索確定樂譜位置。與其他特征提取方法的比較表明,非監(jiān)督特征學習方法在視覺圖像塊分類適應性和復雜性上都具有一定優(yōu)越性,當漢字為干擾因素時降低了樂譜檢測的錯

3、誤率。
  (2)提出了基于灰度差分的雙層區(qū)域劃分方法,以動態(tài)多閾值二值化方法解決視覺樂譜圖像不規(guī)則區(qū)域自然光照不均勻問題。該方法以灰度差分變化率區(qū)分前景與背景圖像塊,再依據前景圖像塊的背景灰度值,將前景圖像塊集合劃分成光照強度相對一致的區(qū)域,最后對每個區(qū)域采用簡單的Otus閾值進行二值化。這種層次處理方式,與全局閾值、局部閾值及其它樂譜二值化方法相比,不受光照方向等限制,可以劃分出不規(guī)則形狀的二值化區(qū)域,有效提高了圖像二值化效果

4、。
  (3)改進了基于像素游程的細化算法和拐點的提取算法。通過直接在筆畫交叉位置出現斷點的方式,降低了細化后圖像矢量線段提取的復雜度;在雙角度閾值拐點提取方法基礎上,通過粗判斷細分析的方法,改進拐點位置判斷的準確度,從而提高矢量線度提取的精度。
  (4)在矢量線段分析基礎上,提出了一種以折線模擬彎曲譜線的音高識別方法。首先,在一個小節(jié)范圍內,對水平線段的組合方式進行了分析,改進了最短路徑譜線檢測算法,確定譜線段組;然后,

5、以水平線段及相鄰線段間的補充線段形成的折線表示譜線;最后,根據符頭所在位置調整譜線間距參數,識別音高。以折線表示譜線,與校正彎曲譜線方法相比,具有方法簡單、效果穩(wěn)定性好的特點。
  (5)提出了一種基于細化圖像斷點分析的樂符分割方法。在不去除譜線情況下,以譜線斷點為種子,設定規(guī)則以區(qū)域增長算法完成對譜線上樂符的切分;同時,針對帶有譜線的樂符識別問題,改進了方向梯度直方圖(Histogram of OrientedGradient,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論