HMM在基于參數(shù)的語音合成系統(tǒng)中的應用.pdf_第1頁
已閱讀1頁,還剩52頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、語音合成是人機交互的關鍵技術之一。隨著電子計算機的迅猛發(fā)展,語音合成技術由早期的基于拼接調整合成,逐漸發(fā)展為目前基于參數(shù)的語音合成技術。本文主要是對隱馬爾可夫模型(HMM)在基于參數(shù)的語音合成系統(tǒng)中的應用方面進行了研究和探索。本文的主要研究工作如下:首先,基于對現(xiàn)有語音自動切分技術框架的分析,提出了不定長單元模型,改善切分的精度。目前,基于拼接的語音合成系統(tǒng)需要首先對語料庫進行語音自動切分,基于隱馬爾可夫模型的語音自動切分方法普遍采用的

2、聲學模型是三音子模型。本文針對一些語音單元間的協(xié)同發(fā)音現(xiàn)象和音變現(xiàn)象對切分精度造成的不利影響,提出了基于不定長單元模型的語音自動切分方法。具體定義了不定長語音單元,討論了不定長單元的選取,并對建立相應的模型,在模型的訓練方面也給出了解決的方案。實驗結果,長單元的邊界切分精度比三音子模型有了很大的提高,精度從原先的79.55%提高到了89.13%,同時總體切分精度也有了一定的提高。結果表明,不定長單元模型對于語音自動切分,特別是對三音子模

3、型表現(xiàn)較差的長單元邊界上,能達到比三音子模型更好的效果本文首先介紹基于HMM的自動切分的基本流程,并通過分析由于不同音子間的緊密結合而產生的音變現(xiàn)象,提出一種基于不定長單元模型并給出其訓練算法?;贖MM的自動切分技術的分析和改進工作,為后面基于HMM的可訓練語音合成的深入研究奠定一定的基礎。其次,基于現(xiàn)有的模型訓練和參數(shù)生成技術,對基于參數(shù)的語音合成的技術框架中的一些關鍵技術進行分析,并根據(jù)需要構建了中文的基于參數(shù)的語音合成系統(tǒng)。本文

4、建立了一整套的基于參數(shù)的語音合成系統(tǒng),包括模型的訓練流程和相應的語音合成模塊。它可以根據(jù)原始的語音數(shù)據(jù)進行訓練,并自動生成一個的合成系統(tǒng)。同時,本文在此框架基礎上進行了中文基于參數(shù)的語音合成系統(tǒng)的訓練和構建,對基于參數(shù)的語音合成技術進行效果驗證。此外,本文根據(jù)基于最小化生成誤差的訓練準則,對模型進行了改進,在新的準則下優(yōu)化合成語音的音質。最后,研究基于參數(shù)的語音合成在說話人轉換語音合成中的應用。在基于參數(shù)的語音合成進行說話人轉換應用中,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論