版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、語言是人類進行溝通和交流的一種最便捷方式,語音是語言的一種形式。語音合成與轉(zhuǎn)換是語音信號處理的重要分支,得到了廣泛的應用。語音預處理是語音合成與轉(zhuǎn)換的重要組成部分,其結(jié)果直接影響合成和轉(zhuǎn)換語音的質(zhì)量。然而語音預處理、語音合成與轉(zhuǎn)換算法仍然存在一些不足和有待解決的問題,如含噪語音清濁音分類準確度不是很高、協(xié)同發(fā)音現(xiàn)象沒有很好地得到解決、合成與轉(zhuǎn)換語音的自然度不能令人滿意等。語音合成與轉(zhuǎn)換的關(guān)鍵技術(shù)是語音預處理、小語料庫的語音合成與轉(zhuǎn)換,本
2、文研究上述相關(guān)算法,解決了合成與轉(zhuǎn)換語音清晰度、自然度低的問題,提高了合成與轉(zhuǎn)換語音的質(zhì)量。
在語音預處理方面,針對以往清、濁音分類算法的不足,提出基于Mel子帶能量高斯混合模型的分類算法,該算法采用Mel頻率來計算語音信號在頻譜各子帶能量分布比例,作為特征來建立高斯混合模型,計算各類語音信號對應高斯混合模型的最大后驗概率,對語音信號進行清、濁音分類,仿真實驗證明了該算法的有效性。針對基音檢測存在的問題,提出了幅值補償?shù)腁MD
3、F基音檢測算法,降低了由于語音信號幅值衰減而造成的檢測誤差,仿真實驗表明,該方法具有更高的基音檢測準確度。
在語音合成方面,考慮到自然語音存在協(xié)同發(fā)音的現(xiàn)象,提出了波形拼接和參數(shù)合成相結(jié)合的算法--頻譜能量過渡協(xié)同發(fā)音語音合成算法和共振峰過渡協(xié)同發(fā)音語音合成算法。第一種算法是根據(jù)協(xié)同發(fā)音過程中頻譜能量連續(xù)過渡這一現(xiàn)象,通過調(diào)整協(xié)同發(fā)音上下段音素對應的頻帶能量進行協(xié)同發(fā)音語音合成;第二種算法是根據(jù)協(xié)同發(fā)音過程中共振峰連續(xù)過渡現(xiàn)象
4、,通過對共振峰位置、幅值、帶寬的修改進行協(xié)同發(fā)音語音合成。將兩種算法和滑動窗拼接協(xié)同發(fā)音語音合成算法進行了比較,仿真實驗證明了本文算法的有效性。連續(xù)變調(diào)現(xiàn)象是自然語流中經(jīng)常出現(xiàn)的現(xiàn)象,能否解決此問題,直接關(guān)系到詞匯語義的正確理解。提出了決策樹建模,按照模型進行音節(jié)的音高、時長等修改的連續(xù)變調(diào)語音合成算法,仿真實驗結(jié)果表明,本算法合成連續(xù)變調(diào)詞匯的可懂度、自然度均高于聲調(diào)模型+基音同步疊加算法。針對漢語語調(diào)受聲調(diào),重讀詞匯等影響,難以準確
5、建模的問題,通過分析聲調(diào)、重讀詞匯等在語調(diào)大波浪中的作用,提出了采用決策樹對語調(diào)建模,根據(jù)模型對音節(jié)進行時長、音高、能量等修改,進行漢語語調(diào)合成的算法,將本算法和句尾基頻曲線調(diào)整語調(diào)合成算法進行了比較,仿真實驗證明了算法的有效性。
在語音轉(zhuǎn)換方面,針對語音轉(zhuǎn)換過程中源、目標語音動態(tài)時間規(guī)整出現(xiàn)的匹配誤差問題提出了變滑動窗語音轉(zhuǎn)換算法,該算法根據(jù)當前幀的基音檢測結(jié)果確定滑動窗的寬度,將源話者語音和目標話者語音對齊,采用高斯混合模
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 語音轉(zhuǎn)換關(guān)鍵技術(shù)研究及基于AMR的語音轉(zhuǎn)換系統(tǒng)設(shè)計.pdf
- 高畫質(zhì)視頻格式轉(zhuǎn)換關(guān)鍵技術(shù)研究.pdf
- 語音轉(zhuǎn)換中的關(guān)鍵技術(shù)研究.pdf
- 基于本體語義的模型轉(zhuǎn)換關(guān)鍵技術(shù)研究.pdf
- 嵌入式語音合成關(guān)鍵技術(shù)研究.pdf
- 軟交換關(guān)鍵技術(shù)研究與應用.pdf
- Shape向S-57的海圖格式轉(zhuǎn)換關(guān)鍵技術(shù)研究.pdf
- 移動云環(huán)境下地址空間轉(zhuǎn)換關(guān)鍵技術(shù)研究及應用.pdf
- 光標記交換關(guān)鍵技術(shù)研究.pdf
- 高自然度粵語語音合成關(guān)鍵技術(shù)研究.pdf
- MPEG視頻碼流實時轉(zhuǎn)換關(guān)鍵技術(shù)的研究.pdf
- 分布式語音合成系統(tǒng)及關(guān)鍵技術(shù)研究.pdf
- AAL2交換關(guān)鍵技術(shù)研究.pdf
- 多語種語音合成中的關(guān)鍵技術(shù)研究.pdf
- 光突發(fā)交換關(guān)鍵技術(shù)研究.pdf
- 帶約束的XML與RDB數(shù)據(jù)轉(zhuǎn)換關(guān)鍵技術(shù)的研究.pdf
- 高速列車多體動力學參數(shù)提取與模型轉(zhuǎn)換關(guān)鍵技術(shù)研究.pdf
- 語音壓縮感知關(guān)鍵技術(shù)研究.pdf
- 人眼驅(qū)動語音合成的若干關(guān)鍵技術(shù)研究.pdf
- 嵌入式語音合成系統(tǒng)實現(xiàn)中關(guān)鍵技術(shù)研究.pdf
評論
0/150
提交評論