版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、TTS系統(tǒng)是一項(xiàng)非常有用的技術(shù),它可以將任意文本信息轉(zhuǎn)換為語(yǔ)音信號(hào)。它可以被用于不同的用途,如汽車導(dǎo)航,電信的呼叫服務(wù),列車站名播報(bào),e-mail閱讀等等?,F(xiàn)有的基于大語(yǔ)料庫(kù)的TTS系統(tǒng)已經(jīng)能夠產(chǎn)生高清晰度和自然度的合成語(yǔ)音,并已得到較大的發(fā)展和應(yīng)用,但是還存在著一些問(wèn)題。尤其引人注目的是其音庫(kù)巨大,無(wú)法將其應(yīng)用到存儲(chǔ)空間受限的設(shè)備上去,這就嚴(yán)重地制約了語(yǔ)音合成技術(shù)的發(fā)展。目前大致有兩類解決辦法:一類是采用新的參數(shù)合成技術(shù),如基于HMM
2、的語(yǔ)音合成系統(tǒng),另一類是在保持合成語(yǔ)音自然度和清晰度的前提下,降低大語(yǔ)料庫(kù)中的聲學(xué)冗余度,從而實(shí)現(xiàn)高效率的壓縮(小音庫(kù)TTS系統(tǒng))。以上兩種方法都可以大幅降低TTS系統(tǒng)的存儲(chǔ)容量,比較而言:在存儲(chǔ)容量方面參數(shù)合成方法更有優(yōu)勢(shì),但在合成語(yǔ)音的質(zhì)量方面,后一類方法更好。 本文針對(duì)后一類合成系統(tǒng)中的若干關(guān)鍵問(wèn)題進(jìn)行了深入的研究,具體的工作成果與創(chuàng)新如下: 1、對(duì)小音庫(kù)的TTS系統(tǒng)而言,合成基元庫(kù)和韻律模型是兩個(gè)重要的組成部分,
3、而它們的構(gòu)建都依賴于一個(gè)帶韻律標(biāo)注的大語(yǔ)料庫(kù)。其中連續(xù)語(yǔ)音的準(zhǔn)確切分和標(biāo)注是一項(xiàng)十分重要的工作,并且費(fèi)時(shí)費(fèi)力。為了解決這個(gè)問(wèn)題,本文提出了一種統(tǒng)計(jì)與規(guī)則相結(jié)合的語(yǔ)音自動(dòng)切分和標(biāo)注方法。具體的步驟是:首先以兩種HMM模型對(duì)連續(xù)語(yǔ)音做粗切分,然后再針對(duì)不同的音素邊界類型,采用不同的后處理方法,對(duì)HMM的切分結(jié)果進(jìn)行調(diào)整,從而實(shí)現(xiàn)精確切分。這些后處理的方法將被分別用于檢測(cè)靜音和語(yǔ)音,清音和濁音,以及在譜域上的時(shí)間突變點(diǎn)。這種方法不僅簡(jiǎn)單而且還
4、可以獲得較高的切分和標(biāo)注精度。 2、針對(duì)實(shí)際音節(jié)基頻包絡(luò)長(zhǎng)度的不同,提出了一種非定長(zhǎng)包絡(luò)的聚類方法,并將其用于以基頻為特征的語(yǔ)音庫(kù)裁減。這種方法首先利用DP的思想,在兩個(gè)基頻包絡(luò)之間尋找一條最佳路徑,然后再沿這一路徑進(jìn)行兩包絡(luò)的相似度計(jì)算,若兩包絡(luò)形狀類似,距離測(cè)度的值會(huì)很小,將會(huì)被聚在一類。在聚類的基礎(chǔ)上,利用調(diào)域分層的概念,進(jìn)行樣本挑選,最后再結(jié)合現(xiàn)有的語(yǔ)音編碼技術(shù),就可以構(gòu)建出一個(gè)小存儲(chǔ)容量多樣本的帶調(diào)音節(jié)語(yǔ)音庫(kù),來(lái)滿足小
5、音庫(kù)或嵌入式TTS系統(tǒng)對(duì)合成語(yǔ)音清晰度和自然度的要求。 3、本文還利用統(tǒng)計(jì)的方法,對(duì)小音庫(kù)的TTS系統(tǒng)的韻律模型進(jìn)行了研究,給出了一組能夠預(yù)測(cè)句子基頻包絡(luò)的方法。句子的基頻包絡(luò)是音節(jié)基頻包絡(luò)加靜音段形成的。為了預(yù)測(cè)音節(jié)的基頻包絡(luò),我們首先通過(guò)聚類獲得音節(jié)典型的基頻包絡(luò)(基頻包絡(luò)模板),再采用決策樹(shù)方法來(lái)學(xué)習(xí)句中音節(jié)語(yǔ)境參數(shù)到音節(jié)基頻包絡(luò)模板的映射規(guī)則。然后,利用訓(xùn)練語(yǔ)料,統(tǒng)計(jì)計(jì)算不同帶調(diào)音節(jié)在不同語(yǔ)境下的基頻包絡(luò)模板控制參數(shù)(基
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 智能公交系統(tǒng)中的若干關(guān)鍵技術(shù)研究.pdf
- 考試系統(tǒng)中若干關(guān)鍵技術(shù)研究與系統(tǒng)實(shí)現(xiàn).pdf
- WebGIS中若干關(guān)鍵技術(shù)研究.pdf
- 聯(lián)運(yùn)系統(tǒng)若干關(guān)鍵技術(shù)研究.pdf
- 序列密碼中若干關(guān)鍵技術(shù)研究.pdf
- 知識(shí)融合中若干關(guān)鍵技術(shù)研究.pdf
- 全景視頻系統(tǒng)若干關(guān)鍵技術(shù)研究.pdf
- 智能天線系統(tǒng)若干關(guān)鍵技術(shù)研究.pdf
- MIMO-OFDM系統(tǒng)中若干關(guān)鍵技術(shù)研究.pdf
- 智能GPS天線系統(tǒng)中的若干關(guān)鍵技術(shù)研究.pdf
- WiMAX系統(tǒng)中MIMO應(yīng)用的若干關(guān)鍵技術(shù)研究.pdf
- HEVC若干關(guān)鍵技術(shù)研究.pdf
- ETL若干關(guān)鍵技術(shù)研究.pdf
- 增強(qiáng)現(xiàn)實(shí)中若干關(guān)鍵技術(shù)研究.pdf
- 中文文檔分類中若干關(guān)鍵技術(shù)的研究.pdf
- 中文分詞關(guān)鍵技術(shù)研究.pdf
- 寬帶MIMO系統(tǒng)若干關(guān)鍵技術(shù)研究.pdf
- 協(xié)同裝配中的若干關(guān)鍵技術(shù)研究.pdf
- 曲面激光直寫(xiě)中若干關(guān)鍵技術(shù)研究.pdf
- MicroRNA識(shí)別中的若干關(guān)鍵技術(shù)研究.pdf
評(píng)論
0/150
提交評(píng)論