版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、紙質(zhì)樂譜向數(shù)字化樂譜的轉(zhuǎn)換,是人類音樂活動與計算機音樂處理之間進行信息交流的必經(jīng)之路。光學(xué)樂譜識別是將紙質(zhì)樂譜掃描輸入計算機后,對樂譜圖像加以處理、識別、分析,最終獲得樂譜的計算機數(shù)字表達的過程。光學(xué)樂譜識別技術(shù)突破了純手工的樂譜數(shù)字化瓶頸,為樂譜數(shù)字化提供了一條智能、高效、快捷的新途徑,具有重要的理論研究意義和應(yīng)用價值。 本文以印刷體多聲部五線譜為研究對象,從譜線定位與刪除、音符識別、樂譜專用符號識別、樂譜重建與語義解釋四個方
2、面,對樂譜識別的關(guān)鍵技術(shù)進行了系統(tǒng)深入地研究,在多個環(huán)節(jié)上提出了行之有效的新思路和新方法。 譜線定位與刪除是樂譜識別的首要環(huán)節(jié)。在譜線定位方面,本文提出了基于交叉相關(guān)性的樂譜圖像變形校正與譜線定位算法,其本質(zhì)是利用“化整為零、相關(guān)計算”的思想,對基于水平投影的譜線定位方法的一種改進。該算法在保持了投影方法計算簡單、抗噪聲能力強的原有優(yōu)勢的同時,彌補了其對變形敏感的不足,有效解決了現(xiàn)有統(tǒng)計和結(jié)構(gòu)兩類譜線定位方法存在的抗變形和抗噪聲
3、之間的矛盾。 在譜線刪除方面,本文針對譜線刪除過程中存在的“過刪除”問題,提出了基于圖段拓撲關(guān)系的譜線刪除算法。與現(xiàn)有譜線刪除方法相比,該算法在提高刪除單元表達層次的同時,強調(diào)對刪除單元周邊環(huán)境特征的分析和判斷,能夠更全面、清晰地觀察到譜線與非譜線像素的區(qū)別,從而明顯減少譜線“過刪除”現(xiàn)象的發(fā)生,保證了樂譜圖形符號在譜線刪除之后的完整性。 音符識別是樂譜識別的核心與關(guān)鍵。本文根據(jù)音符的多樣性和多態(tài)性特點,確定了基于結(jié)構(gòu)的
4、音符識別方案,將其識別過程劃分為基元抽取和結(jié)構(gòu)分析兩個階段。 在音符基元抽取方面,提出了基于垂直游程編碼的粗提取、基于水平游程編碼的精檢測的符干抽取方法,克服了現(xiàn)有方法對復(fù)雜音符適應(yīng)性差、抽取結(jié)果不完整等缺陷:設(shè)計了一種先分割、后特征檢測的實心符頭抽取方法,該方法利用音符先驗知識和已有的譜線、符干識別結(jié)果對符頭進行切割,解決了粘連符頭的切分難題;提出一種基于塊狀體分割和特征檢測的尾橋抽取方法,避開了傳統(tǒng)的直線抽取方法所無法處理的
5、尾橋粘連問題。 在音符結(jié)構(gòu)分析方面,提出了一種基于作用場的音符結(jié)構(gòu)分析方法。該方法將物理學(xué)中的作用場概念引入到音符基元的關(guān)系表達,實現(xiàn)了知識性、魯棒性和精確性三者的統(tǒng)一。在此基礎(chǔ)上,定義了六個音符子結(jié)構(gòu),建立了關(guān)鍵結(jié)構(gòu)優(yōu)先定位的音符結(jié)構(gòu)分析模型,實現(xiàn)了音符基元數(shù)據(jù)向音符對象的重建。該模型體現(xiàn)了人工識譜時突出重點特征、從整體到細節(jié)的思維習(xí)慣,不僅減少了分析的復(fù)雜度,而且具有較強的基元冗余排錯能力。 對于音符除外的其它樂譜符
6、號即樂譜專用符號,提出了一種基于幾何、中心矩和穿刺三類特征的神經(jīng)網(wǎng)絡(luò)識別方法。上述三類特征能夠很好地兼顧統(tǒng)計特征的抗噪性和結(jié)構(gòu)特征對細微差別的分類能力,體現(xiàn)了各類樂譜專用符號的實際特點,并采用具有強大非線性分類能力的BP神經(jīng)網(wǎng)絡(luò)作為符號分類器,取得了良好的識別效果。最后,本文通過建立“樂譜結(jié)構(gòu)樹”,實現(xiàn)了由散亂圖形符號數(shù)據(jù)到樂譜數(shù)據(jù)的有機組織和重建。討論了音樂事件序列的生成方法,實現(xiàn)了樂譜語義解釋及其語義內(nèi)容的標準MIDI格式文件輸出。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 視覺樂譜識別關(guān)鍵技術(shù)研究.pdf
- 光學(xué)公式識別技術(shù)研究.pdf
- 干擾識別技術(shù)研究與實現(xiàn).pdf
- 樂譜識別
- 微光目標光學(xué)相關(guān)探測與識別技術(shù)研究.pdf
- 音樂識別技術(shù)研究與實現(xiàn).pdf
- 虹膜識別技術(shù)研究與實現(xiàn).pdf
- 語音識別技術(shù)研究與實現(xiàn).pdf
- 動態(tài)手勢識別技術(shù)研究與實現(xiàn).pdf
- 人臉識別的技術(shù)研究與實現(xiàn).pdf
- 干擾檢測與識別技術(shù)研究與實現(xiàn).pdf
- 海量圖像光學(xué)相關(guān)識別技術(shù)研究.pdf
- 漢語語音識別技術(shù)研究與實現(xiàn).pdf
- 網(wǎng)絡(luò)視頻流識別技術(shù)研究與實現(xiàn).pdf
- Turbo碼盲識別技術(shù)研究與實現(xiàn).pdf
- 調(diào)制模式識別技術(shù)研究與實現(xiàn).pdf
- 雷達調(diào)制方式識別技術(shù)研究與實現(xiàn).pdf
- 視網(wǎng)膜血管識別技術(shù)研究與算法實現(xiàn).pdf
- 網(wǎng)絡(luò)訪問的意圖識別技術(shù)研究與實現(xiàn).pdf
- 基于視覺的手語識別技術(shù)研究與實現(xiàn).pdf
評論
0/150
提交評論