2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩117頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、所謂歌聲是指人類有意識地通過控制自身聲帶的振動和口腔、鼻腔等發(fā)音器官的形變而發(fā)出的有樂感的聲音,而歌聲合成則是指利用語音合成相關技術讓計算機合成出模擬人的歌唱聲。隨著基于統(tǒng)計模型的語音合成技術的快速發(fā)展和逐漸成熟,尤其基于隱馬爾科夫模型的方法取得了最多的關注和最為充分的進展。2006年左右上述基于統(tǒng)計模型的語音合成技術開始被用于歌聲合成,并取得了不錯的結果。由于所述方法具有所需語料數(shù)據(jù)少、語料標注的自動化程度高等諸多優(yōu)點,使其的可用性大

2、大增加,引起了眾多學者的廣泛關注。
  本文以歌聲合成為主要研究目標,重點研究基于統(tǒng)計模型的歌聲合成算法,并在此基礎上構建一個可以從輸入樂譜、歌詞和歌唱人的個性化歌唱特征直接輸出個性化歌聲的歌聲合成系統(tǒng)。
  本文的主要貢獻和創(chuàng)新點如下:
  1.為了給個性化歌聲合成提供充分和優(yōu)質(zhì)的歌聲數(shù)據(jù),自主設計了歌聲錄制方案,并依據(jù)該方案錄制了包含210張樂譜,共132分鐘的歌聲數(shù)據(jù)庫,為構建歌唱合成系統(tǒng)奠定了可靠的數(shù)據(jù)基礎。<

3、br>  2.以上述歌聲數(shù)據(jù)庫為基礎,利用基于統(tǒng)計模型的語音合成相關技術構建了一套完整的歌聲合成系統(tǒng)。所構建的系統(tǒng)能夠合成出適度音強、精準音高和節(jié)奏以及個性化音色的歌唱聲。對比實驗結果表明,利用本文方法所合成的歌聲在質(zhì)量和表現(xiàn)力上均取得了與目前世界上公認最好的參數(shù)合成法(日語)相當?shù)慕Y果。
  3.結合歌聲的基頻的特點,提出了一系列的改進的基頻模型。
  針對歌聲基頻存在的數(shù)據(jù)稀疏問題,提出了參考樂譜的基頻引導方法。該方法將

4、樂譜中包含的基頻信息引入到歌聲基頻的生成算法中,避免了因數(shù)據(jù)稀疏而造成的合成音高在時間和頻譜結構上出現(xiàn)偏差的問題,可以合成出與樂譜相一致的具有精準音高的基頻。
  對真實基頻和樂譜基頻之間可能存在差異的問題進行了研究,提出了在訓練中也考慮樂譜基頻因素從而準確得到兩者之間的差值的方法。利用該方法可以得到相比樂譜基頻引導方法更加準確和真實的基頻估計。上述方法也可用于連音符的合成。
  提出了結合兩個不同時間尺度的統(tǒng)計模型來合成歌

5、唱基頻的方法。該方法結合了狀態(tài)與音節(jié)兩個不同時間尺度的模型以克服合成歌唱基頻時存在的過平滑現(xiàn)象,從而合成出表現(xiàn)力更強的基頻。
  提出了將挑選出的真實單元進行拼接的基頻合成方法。該方法將基頻的形狀曲線和顫音曲線分開處理。其中,顫音以音符為單位進行建模,大大提高了所合成顫音的正確性。實驗結果表明,基于真實單元的拼接方法可顯著提高所合成基頻的真實感和表現(xiàn)力。
  4.提出了基于統(tǒng)計模型的情感韻律轉(zhuǎn)換方法。該方法可以利用一個較小的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論