基于瞬時(shí)幅度加噪聲模型的語(yǔ)音壓縮.pdf

上傳人：奔*** IP屬地：河北更新時(shí)間：2024-03-11 格式：pdf 頁(yè)數(shù)：72 大小：3.21MB 人氣指數(shù)：12 舉報(bào) 版權(quán)申訴

已閱讀1頁(yè)，還剩71頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、隨著信息技術(shù)的發(fā)展，信道資源越來(lái)越寶貴，為了提高存儲(chǔ)效率和減小存儲(chǔ)空間，在允許的失真條件下，如何設(shè)計(jì)/實(shí)現(xiàn)高質(zhì)量的低速率語(yǔ)音編碼器是當(dāng)前的熱點(diǎn)之一。
　　現(xiàn)如今，采用單一的編碼技術(shù)很難滿足上述要求，混合編碼技術(shù)已成為語(yǔ)音編碼的優(yōu)選方向。本文研究了一種確定分量和隨機(jī)分量組合的語(yǔ)音信號(hào)表示模型——瞬時(shí)幅度+噪聲模型，它是正弦+噪聲模型的一種改進(jìn)型結(jié)構(gòu)。正弦+噪聲模型是一種譜模型結(jié)構(gòu)，它利用人類對(duì)聲音的感知特性，將聲音的周期分量以正

2、弦的時(shí)變幅度、頻率和相位形式來(lái)表示，剩余的非周期分量(殘差信號(hào))用已濾波的噪聲形式呈現(xiàn)。因?yàn)橹芷诜至康牟环€(wěn)定性，在語(yǔ)音信號(hào)中，估計(jì)正弦模型的參數(shù)是一項(xiàng)十分困難的任務(wù)，進(jìn)行正弦軌跡的匹配和相位參數(shù)的平滑也是相當(dāng)繁瑣的工作，同時(shí)也很難達(dá)到較高的時(shí)間和頻率分辨率。因此，我們提出了一種改進(jìn)型正弦模型一一瞬時(shí)幅度(IA)模型。該模型主要是把正弦模型中難估計(jì)的相位參數(shù)轉(zhuǎn)化為對(duì)兩個(gè)瞬時(shí)幅度參數(shù)的估計(jì)，從算法的實(shí)現(xiàn)角度上做了簡(jiǎn)化。同時(shí)對(duì)頻率參數(shù)的估計(jì)采

3、用了一種迭代的方法，利用該方法提取出的正弦分量都是相對(duì)人耳最重要的成分，從而使得合成的語(yǔ)音在質(zhì)量上得到了相對(duì)提高。對(duì)于剩余的非周期分量我們采用線性預(yù)測(cè)分析合成原理，建立一個(gè)全極點(diǎn)聲道模型，然后估算并傳輸模型參數(shù)和激勵(lì)參數(shù)。
　　對(duì)瞬時(shí)幅度+噪聲模型提取的參數(shù)分別進(jìn)行編碼傳輸，對(duì)于正弦分量的幅度參數(shù)提出了一種多項(xiàng)式包絡(luò)擬合的方法。而對(duì)于線性預(yù)測(cè)(LP)系數(shù)，由于量化后再傳輸會(huì)對(duì)系統(tǒng)造成不穩(wěn)定的現(xiàn)象，因此將其變換成更適合編碼和傳輸

4、的參數(shù)——線譜頻率(LSF)參數(shù)。通過(guò)對(duì)模型參數(shù)的量化、編碼和解碼，我們?cè)O(shè)計(jì)了一個(gè)編碼速率為10.72 kb/s的語(yǔ)音編解碼器。
　　同時(shí)，本文設(shè)計(jì)了一個(gè)MATLAB用戶圖形界面(GUI)。我們將仿真后的數(shù)據(jù)都儲(chǔ)存在該界面中，并通過(guò)對(duì)界面上的按鍵操作實(shí)現(xiàn)相應(yīng)的功能，例如播放語(yǔ)音，顯示語(yǔ)音的波形圖等功能。通過(guò)大量的實(shí)驗(yàn)數(shù)據(jù)和平均意見(jiàn)得分(MOS)主觀測(cè)聽評(píng)價(jià)得出，本文基于瞬時(shí)幅度+噪聲模型設(shè)計(jì)的語(yǔ)音編解碼器具有較好的性能，合成的

眾賞文庫(kù)> 全部分類> 畢業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

基于瞬時(shí)幅度加噪聲模型的語(yǔ)音壓縮.pdf

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

基于瞬時(shí)幅度加噪聲模型的語(yǔ)音壓縮.pdf

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

免費(fèi)下載