版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著語(yǔ)音信號(hào)處理技術(shù)的不斷發(fā)展和人們對(duì)人工智能的不斷追求,說(shuō)話人語(yǔ)音轉(zhuǎn)換技術(shù)成為了一個(gè)新的研究課題.說(shuō)話人語(yǔ)音轉(zhuǎn)換技術(shù)是把源說(shuō)話人說(shuō)的語(yǔ)音轉(zhuǎn)換為象是目標(biāo)說(shuō)話人說(shuō)的語(yǔ)音的技術(shù).說(shuō)話人語(yǔ)音轉(zhuǎn)換具有廣泛的應(yīng)用領(lǐng)域,比如文語(yǔ)轉(zhuǎn)換(Text—to—Speech,TTS)系統(tǒng)、配音系統(tǒng)和翻譯系統(tǒng)等.該文提出了一種基于分段的說(shuō)話人語(yǔ)音轉(zhuǎn)換方法,這種方法適用于單語(yǔ)種和跨語(yǔ)種的說(shuō)話人語(yǔ)音轉(zhuǎn)換,該文主要工作包括:(1)在基于分段的說(shuō)話人語(yǔ)音轉(zhuǎn)換中,訓(xùn)練語(yǔ)句
2、和轉(zhuǎn)換語(yǔ)句需要進(jìn)行切分.為了完成對(duì)語(yǔ)句的切分,該文采用隱馬爾可夫模型的方法,利用HTK工具包分別實(shí)現(xiàn)了特定人語(yǔ)音切分系統(tǒng)和非特定人語(yǔ)音切分系統(tǒng).(2)該文提出了一種基于分段的說(shuō)話人語(yǔ)音轉(zhuǎn)換方法.和以往的方法比較,這種基于分段的說(shuō)話人語(yǔ)音轉(zhuǎn)換不要求源說(shuō)話人和目標(biāo)說(shuō)話人是同樣的訓(xùn)練語(yǔ)句,所以同時(shí)適用于單語(yǔ)種和跨語(yǔ)種的說(shuō)話人語(yǔ)音轉(zhuǎn)換.在這種基于分段的說(shuō)話人語(yǔ)音轉(zhuǎn)換中,該文采用"pitch+mel倒譜+MLSA濾波器"語(yǔ)音編碼器,提出了一種基于
3、修改mel倒譜和基音周期參數(shù)的說(shuō)話人語(yǔ)音轉(zhuǎn)換方法.在對(duì)頻譜的轉(zhuǎn)換中,先對(duì)每段基本語(yǔ)音的mel倒譜參數(shù)訓(xùn)練高斯混合模型,求出一個(gè)轉(zhuǎn)換函數(shù),然后用轉(zhuǎn)換函數(shù)對(duì)mel倒譜參數(shù)進(jìn)行轉(zhuǎn)換.而基音周期的轉(zhuǎn)換則采用一個(gè)全局的轉(zhuǎn)換公式,對(duì)基音周期的數(shù)值和范圍進(jìn)行修改.(3)該文運(yùn)用所提出的基于分段的說(shuō)話人語(yǔ)音轉(zhuǎn)換方法實(shí)現(xiàn)了單語(yǔ)種(英語(yǔ))說(shuō)話人的轉(zhuǎn)換.在單語(yǔ)種(英語(yǔ))說(shuō)話人語(yǔ)音轉(zhuǎn)換中,采用的語(yǔ)音段庫(kù)是41個(gè)單音素庫(kù)(包括一個(gè)靜音).通過(guò)分析元音轉(zhuǎn)換前后的F
4、FT頻譜,該文得出結(jié)論:轉(zhuǎn)換后的語(yǔ)音的FFT頻譜更接近于目標(biāo)說(shuō)話人語(yǔ)音的FFT頻譜.而且,通過(guò)主觀聽(tīng)覺(jué)判斷,轉(zhuǎn)換后的語(yǔ)音更象是目標(biāo)說(shuō)話人的語(yǔ)音.因此說(shuō)明這種基于分段的單語(yǔ)種(英語(yǔ))轉(zhuǎn)換是有效的.(4)為了實(shí)現(xiàn)跨語(yǔ)種(中英)說(shuō)話人語(yǔ)音轉(zhuǎn)換,該文研究了中英文的語(yǔ)言特點(diǎn),特別是兩種語(yǔ)言的單音素之間的異同點(diǎn).通過(guò)比較,發(fā)現(xiàn)英文中大部分英語(yǔ)音素可以在中文中找到相對(duì)應(yīng)的音素,有小部分的英文音素找不到中文對(duì)應(yīng)的音素.為了實(shí)現(xiàn)這小部分中英文不對(duì)應(yīng)的音素
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 說(shuō)話人語(yǔ)音轉(zhuǎn)換技術(shù)的研究.pdf
- 源-目標(biāo)說(shuō)話人語(yǔ)音轉(zhuǎn)換研究.pdf
- 基于小波變換的說(shuō)話人語(yǔ)音特征研究.pdf
- 基于GMM的說(shuō)話人語(yǔ)音識(shí)別研究與實(shí)踐.pdf
- 基于小波變換的說(shuō)話人語(yǔ)音特征參數(shù)研究.pdf
- 蓄意模仿說(shuō)話人語(yǔ)音中特征參數(shù)的研究.pdf
- 基于說(shuō)話人轉(zhuǎn)換的語(yǔ)音識(shí)別方法.pdf
- 語(yǔ)音轉(zhuǎn)換技術(shù)的研究.pdf
- 基于HMM算法的仿人機(jī)器人語(yǔ)音識(shí)別技術(shù)的研究.pdf
- 基于頻率規(guī)整的語(yǔ)音轉(zhuǎn)換技術(shù)研究.pdf
- 輪椅機(jī)器人語(yǔ)音識(shí)別、控制技術(shù)的研究.pdf
- 特定目標(biāo)說(shuō)話人的語(yǔ)音轉(zhuǎn)換系統(tǒng)設(shè)計(jì).pdf
- 基于高斯混合模型的語(yǔ)音轉(zhuǎn)換技術(shù)的研究.pdf
- 基于HMM的機(jī)器人語(yǔ)音識(shí)別系統(tǒng)的研究.pdf
- 說(shuō)話人識(shí)別語(yǔ)音庫(kù)構(gòu)建技術(shù)的研究.pdf
- 基于對(duì)話型語(yǔ)音的說(shuō)話人在線識(shí)別技術(shù)研究.pdf
- 特定人語(yǔ)音增強(qiáng)算法的研究.pdf
- 語(yǔ)音轉(zhuǎn)換關(guān)鍵技術(shù)研究及基于AMR的語(yǔ)音轉(zhuǎn)換系統(tǒng)設(shè)計(jì).pdf
- 基于高斯混合模型的語(yǔ)音轉(zhuǎn)換技術(shù)研究.pdf
- 基于STRAIGHT模型的語(yǔ)音轉(zhuǎn)換的研究.pdf
評(píng)論
0/150
提交評(píng)論