基于線譜對特征的參數(shù)化統(tǒng)計語音合成技術研究.pdf_第1頁
已閱讀1頁,還剩85頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、基于隱馬爾可夫模型(HMM)的語音合成方法,作為參數(shù)化統(tǒng)計語音合成(SPSS)的一種典型實現(xiàn),因為其系統(tǒng)構建自動快速、靈活度高、合成效果穩(wěn)定等優(yōu)點,成為目前一種主流的語音合成方法。基于HMM的參數(shù)語音合成方法中的一個關鍵問題,即是譜特征建模參數(shù)的選擇。線譜對(LSP)類參數(shù)由于其良好的內插性,單維LSP偏差造成的譜失真的局部性,以及其與譜包絡共振峰的聯(lián)系緊密,近年來成為在各HMM語音合成系統(tǒng)中流行采用的譜特征建模參數(shù)。
  隨著L

2、SP類參數(shù)在HMM語音合成中的廣泛應用,統(tǒng)計模型預測生成的LSP類參數(shù)的穩(wěn)定性成為一個重要的研究課題。另外,LSP參數(shù)、Mel頻率后的LSP參數(shù)(Mel-LSP)和基于Mel廣義倒譜分析的LSP參數(shù)(MGC-LSP)等和傳統(tǒng)使用的Mel倒譜(MCEP)參數(shù)在相同HMM語音合成系統(tǒng)中的合成表現(xiàn)比較尚未有系統(tǒng)科學的比較研究。對此,本論文對HMM預測生成的LSP類參數(shù)的保序性及其與MCEP參數(shù)進行合成的質量對比,進行了深入而系統(tǒng)的研究。本論文

3、具體的研究工作和研究成果如下:
  首先,本論文對基于LSP的語音譜分析理論、參數(shù)化統(tǒng)計語音合成的系統(tǒng)框架和關鍵技術以及LSP在HMM語音合成中的應用進行分析和研究。在介紹Mel廣義倒譜(MGC)統(tǒng)一譜分析理論和MGC-LSP概念的基礎上,分析基于LSP類特征的語音譜特點。在對HMM語音合成系統(tǒng)進行簡介的基礎上,研究結合動態(tài)特征和全局方差的最大似然參數(shù)生成算法,并討論LSP類參數(shù)作為譜特征在HMM語音合成中的應用情況和主要改進方法

4、。
  其次,本論文針對HMM語音合成中LSP參數(shù)的穩(wěn)定性問題,提出基于最大似然準則的LSP保序性生成算法。論文分析統(tǒng)計模型預測生成的LSP參數(shù)無法保持順序特性的根本原因,研究全局方差(GV)似然等對LSP順序性的影響。在最大似然參數(shù)生成(MLPG)算法的基礎上,設計生成LSP參數(shù)亂序的懲罰函數(shù),并將其結合到傳統(tǒng)的參數(shù)生成算法中。進行參數(shù)生成時在最大化傳統(tǒng)的HMM和GV似然的同時,將最小化提出的LSP亂序懲罰,使得生成的LSP參數(shù)

5、具有更好的保序性,從而提高合成語音的質量。
  最后,本論文針對MCEP、LSP、Mel-LSP和MGC-LSP四種HMM語音合成中經(jīng)常采用的譜特征參數(shù),結合考慮GV似然的參數(shù)生成方法和基于LSP類特征的共振峰增強等改進技術,系統(tǒng)地對其合成效果進行評測。本論文在對四種譜特征參數(shù)從理論上進行分析和比較各自性質的基礎上,針對目前關于不同譜特征參數(shù)合成情況的已有結論和依然欠缺的結論,提出四個具體的評測任務,并分別設計的相應的評測方法,并

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論