2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩42頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、隨著語音合成技術(shù)的研究與發(fā)展,合成語音音質(zhì)得到較大提升,但當(dāng)前語音合成技術(shù)的研究仍以中性化語音為主,對情感語音合成的研究較少。人類生活對智能語音的需求不僅要涵蓋基本的文字內(nèi)容,還要承載豐富的情感信息,情感語音合成的研究將是智能語音研究領(lǐng)域的必然趨勢。本文建立了一個多說話人的多種情感的情感語音語料庫,針對漢語統(tǒng)計參數(shù)語音合成中的上下文相關(guān)標(biāo)注生成,設(shè)計了一套包含6層上下文信息的標(biāo)注格式,在此基礎(chǔ)上,采用多說話人的情感語音數(shù)據(jù)和統(tǒng)計參數(shù)語音

2、合成方法,利用說話人自適應(yīng)訓(xùn)練算法訓(xùn)練了情感語音的聲學(xué)模型,實現(xiàn)了情感語音的合成。論文的主要工作和創(chuàng)新如下:
  1.建立了一個多說話人的多種情感的語料庫。在專業(yè)錄音棚中,采用誘發(fā)方式激發(fā)錄音人的情感,并進(jìn)行錄音。錄制了7個男性說話人和7個女性說話人的11種典型情感的情感語音數(shù)據(jù),并以 Microsoft WAV格式(單通道、16bit、16kHz采樣頻率)進(jìn)行保存。
  2.實現(xiàn)了一種面向普通話統(tǒng)計參數(shù)語音合成的標(biāo)注生成算

3、法。針對漢語統(tǒng)計參數(shù)語音合成中上下文相關(guān)標(biāo)注的生成,設(shè)計了一套包含6層上下文相關(guān)信息的標(biāo)注格式。以聲韻母做為語音合成的合成基元,利用基于隱 Markov模型(HMM)的統(tǒng)計參數(shù)語音合成方法,通過對合成語音音質(zhì)的主、客觀評測,驗證了不同上下文信息對合成語音音質(zhì)的影響。實驗結(jié)果表明,本文設(shè)計的上下文相關(guān)的6層標(biāo)注格式能夠滿足情感語音合成的需求。
  3.提出了一種利用多個說話人的多種情感訓(xùn)練語料,利用統(tǒng)計參數(shù)語音合成方法實現(xiàn)情感語音合

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論