基于小波變換的低速率波形內(nèi)插語音編碼算法研究.pdf_第1頁
已閱讀1頁,還剩143頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、語音編碼的目的是壓縮語音信號(hào)的冗余度提高語音信息傳輸?shù)挠行?,是?shù)字語音通信系統(tǒng)中最為重要的功能之一。多媒體通信的發(fā)展,需要高質(zhì)量的低速率語音編碼。為此,高質(zhì)量的低速率語音編碼成為語音編碼中的一個(gè)非常重要的研究課題,吸引著眾多的研究者去研究。
   特征波形內(nèi)插(Characteristic Waveform Interpolation, CWI)編碼算法以其獨(dú)特的特征波形描述激勵(lì)信號(hào)的編碼方式和優(yōu)良的編碼性能吸引許多學(xué)者對其進(jìn)

2、行研究。本文即是圍繞低速率語音編碼研究課題,以特征波形內(nèi)插模型為依托,利用小波變換技術(shù)對該編碼方法的諸如特征波形分解、基音檢測、語音增強(qiáng)和相關(guān)參數(shù)的量化等關(guān)鍵技術(shù)進(jìn)行研究,最終提出了純凈語音下的1.84kbit/s和2.32kbit/s的基于雙正交提升小波變換(Bi-orthogonal Lifting Wavelet Transform,BLWT)的CWI(BLWT-CWI)語音編碼算法和噪聲環(huán)境的1.84kbit/s的基于小波變換的

3、特征波形內(nèi)插(Speech Enhancement Based on Wavelet Transform for CWI, E-WT-CWI)語音編碼算法。
   本文的主要研究成果包括以下幾個(gè)方面:
   1、為了提高語音清濁分類的準(zhǔn)確性,本文提出了基于分帶譜熵和小波域Teager能量的語音清濁分類算法。該算法首先計(jì)算頻域內(nèi)的分帶譜熵,然后在小波域計(jì)算不同頻帶的Teager能量,計(jì)算出低頻能量所占的比例,通過這兩個(gè)參數(shù)

4、進(jìn)行清濁判斷。實(shí)驗(yàn)證明,由于分帶譜熵能加深清濁音之間的差異,Teager能量能快速跟蹤聲門周期內(nèi)信號(hào)能量的變化,從而該算法能更容易提取濁音,該算法在純凈語音和含噪語音上的性能都優(yōu)于幅度能量算法;
   2、為了提高在噪聲環(huán)境下基音檢測的準(zhǔn)確性,本文提出了基于前置濾波和小波系數(shù)加權(quán)的帶噪語音基音檢測算法,該算法首先對帶噪語音進(jìn)行前置濾波,去除高頻噪聲和大部分共振峰,然后采用二次樣條小波作為小波函數(shù),對濾波后的語音進(jìn)行3級分解,通過

5、對三級小波分解的細(xì)節(jié)分量加權(quán)求和突出邊緣特征,再利用該特征提取3個(gè)候選基音,最后采用歸一化自相關(guān)函數(shù)找到基音周期。實(shí)驗(yàn)表明,本文提出的算法與二進(jìn)小波變換和歸一化自相關(guān)函數(shù)檢測基音周期(Pitch Detection Algorithm Based on Dyadic Wavelet Transform and Normalized AutoCorrelation Function, DWT-NCCF-PDA)方法相比,提高了在噪聲環(huán)境下

6、的基音檢測精度;
   3、本文提出了一種基于雙正交提升小波變換的特征波形分解方法,得到多分辨率表面,使得激勵(lì)源被準(zhǔn)確地描述。該分解方法不需要復(fù)雜的特征波形對齊操作和濾波器的卷積運(yùn)算,其固有的原位運(yùn)算降低了傳統(tǒng)特征波形小波分解算法所需的內(nèi)存,所采取的當(dāng)前幀邊界點(diǎn)替代相鄰幀樣點(diǎn)的措施有效克服了傳統(tǒng)特征波形小波分解算法的額外時(shí)延;
   4、為了能使低速率語音編碼算法運(yùn)用在噪聲環(huán)境,本文提出了基于雙正交小波包分解的自適應(yīng)閾值

7、語音增強(qiáng)方法,該方法能夠自適應(yīng)地跟蹤噪聲的水平,以此來更新所選閾值,同時(shí)采用動(dòng)態(tài)閾值方法去除噪聲,從而能有效地去除或降低多種有色噪聲。實(shí)驗(yàn)結(jié)果表明,該方法由于能夠在處理過程中保證相位不失真,從而性能優(yōu)于基于正交小波分解的軟閾值去噪方法;
   5、基于上述技術(shù),本文構(gòu)建了在純凈語音環(huán)境下的1.84kbit/s和2.32kbit/sBWLT-CWI兩種語音編碼器,同時(shí)構(gòu)建了噪聲環(huán)境下的1.84kbit/sE-WT-CWI編碼器。M

8、OS分測試表明1.84kbit/sBWLT-CWI編碼器的語音質(zhì)量接近2.4kbit/s的MELP編碼器,2.32kbit/sBWLT-CWI編碼器的語音質(zhì)量稍優(yōu)子2.4kbit/s的MELP編碼器。A/B測試表明,1.84kbit/sBLWT-CWI編碼器的性能與2.4kbit/sMELP編碼器性能相當(dāng),卻明顯優(yōu)子2.0kbit/s的低復(fù)雜度改進(jìn)型波形內(nèi)插(Low-complex Improved Waveform Interpola

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論