混合音頻信號的壓縮與重建方法研究.pdf

上傳人：奔*** IP屬地：河北更新時間：2024-03-09 格式：pdf 頁數(shù)：154 大?。?.16MB 人氣指數(shù)：12 舉報 版權(quán)申訴

已閱讀1頁，還剩153頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、音頻信號通常包含語音信號、樂音信號以及兩者任意比例的混合(也即混合音頻信號)。鑒于當(dāng)前音頻壓縮編碼方法或是面向純語音信號，或是面向純樂音信號的現(xiàn)實(shí)，本文對可同時面向各類音頻(尤其是混合音頻)的壓縮與重建方法展開了深入研究。音頻信號的壓縮與重建過程通?？煞譃椋合∈璞硎尽⒎治雠c綜合以及量化與編碼等三個單元，其中，分析與綜合單元通常存在兩種實(shí)現(xiàn)方式：基于傳統(tǒng)香農(nóng)采樣定理的語/樂音統(tǒng)一編碼(Unified Speech and Audio Co

2、ding,USAC)方式和基于壓縮采樣理論的壓縮感知(Compressed Sensing，CS)方式。兩種方式中，USAC為動態(tài)圖像專家組(Moving Pictures Experts Group,MPEG)于2012年頒布的最新音頻編碼標(biāo)準(zhǔn)，可同時面向各類音頻信號，尤其是混合音頻信號，且其性能不亞于當(dāng)前最優(yōu)的語音及樂音壓縮編碼標(biāo)準(zhǔn)；而CS方式則是基于CS理論，在對混合音頻信號的壓縮采樣過程中，將壓縮與采樣相融合，在對信號采樣的同時

3、即實(shí)現(xiàn)對其壓縮，使得采樣過程極為簡單，并在某種意義上突破了香農(nóng)采樣定理的局限。
　　需要指出的是，隨著科技的發(fā)展，可同時面向各類音頻信號的統(tǒng)一壓縮采樣方式必將快速在我們的生活中占據(jù)重要位置。基于傳統(tǒng)香農(nóng)采樣定理的實(shí)現(xiàn)方法具有結(jié)構(gòu)成熟，兼容性好等優(yōu)點(diǎn)，在當(dāng)前及將來一段時間內(nèi)將占據(jù)統(tǒng)治地位。但由于其復(fù)雜度高，普適性弱等缺點(diǎn)，必將被越來越成熟的基于CS理論的方法所替代。本論文在對混合音頻信號的稀疏表示、量化與編碼以及USAC壓縮編碼標(biāo)準(zhǔn)

4、展開深入研究的基礎(chǔ)之上，探討了混合音頻信號的CS壓縮與重建方法。本論文的主要工作包括：
　　(1)針對混合音頻信號變換域系數(shù)的矢量量化過程中，量化器的存儲需求隨矢量維度的增加而指數(shù)式增長的缺陷，提出了一種具有有限個狀態(tài)的熵受限矢量量化器(Finite-State Entropy Constrained VQ,FS-ECVQ)。該FS-ECVQ利用當(dāng)前幀以及先前若干幀中已量化過的鄰近矢量的統(tǒng)計特性來預(yù)測當(dāng)前輸入矢量的統(tǒng)計特性，從而有

5、效消除了變換域系數(shù)的幀間及幀內(nèi)冗余，進(jìn)而顯著提升了量化性能。實(shí)驗表明，與USAC最終版中對應(yīng)算法相比，F(xiàn)S-ECVQ在維持率/失真(Rate/Distortion,R/D)性能不變的同時，減少了14.6％的存儲需求。
　　(2)針對混合音頻信號高頻帶寬擴(kuò)展過程中，通?；蛘卟捎脤φZ音信號最優(yōu)的頻譜復(fù)制(Spectral Band Reputation,SBR)方式或者采用對樂音信號最優(yōu)的諧波延伸(Harmonic Bandwidth

6、 Extension,HBE)方式的現(xiàn)實(shí)，提出了一種自適應(yīng)的高頻帶寬拓展(adaptive BWE,aBWE)方式。該方式將SBR與HBE相融合，根據(jù)音頻信號當(dāng)前輸入幀的頻譜特性實(shí)時地選取最佳的頻帶擴(kuò)展方式，從而可同時適用于各類音頻信號，尤其是混合音頻信號。實(shí)驗表明，在高頻帶寬擴(kuò)展中，對于語音信號和樂音信號，aBWE的性能不亞于SBR和HBE的性能，而對于混合音頻信號，aBWE的性能則明顯優(yōu)于SBR和HBE的性能。
　　(3)信號

7、的稀疏表示是CS理論應(yīng)用的前提與基礎(chǔ)，而混合音頻信號在單一正交基下通常很難實(shí)現(xiàn)稀疏分解。針對這一難點(diǎn)，提出了一種基于結(jié)構(gòu)化最小絕對收縮選擇算子(Least Absolute Shrinkage and Selection Operator,LASSO)的混合音頻信號稀疏逼近方法。該方法將音頻信號看作是音調(diào)成份、暫態(tài)成份與噪聲成份的疊加，采用結(jié)構(gòu)化LASSO算子將音頻信號最佳地分解為音調(diào)層與暫態(tài)層。由于所得兩層分別在時、頻域中具有很強(qiáng)的稀

8、疏特性，為此，實(shí)現(xiàn)了音頻信號的近似最佳稀疏分解，進(jìn)而為CS理論在音頻信號中的應(yīng)用提供了前提與基礎(chǔ)。
　　(4)針對一般音頻CS方法中，通常將音頻信號分幀處理，各幀獨(dú)立壓縮與重建，而忽略其幀間的時間相關(guān)性的不足，提出了一種基于動態(tài)CS的混合音頻信號重建算法，該算法在對混合音頻信號進(jìn)行統(tǒng)計建模的基礎(chǔ)上，借助信息傳遞的機(jī)理充分利用其幀間的時間相關(guān)性，從而提升系統(tǒng)的重建性能。
　　本課題在對傳統(tǒng)混合音頻壓縮編碼方法中若干關(guān)鍵問題展開

眾賞文庫> 全部分類> 畢業(yè)設(shè)計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

混合音頻信號的壓縮與重建方法研究.pdf

文檔簡介

溫馨提示

最新文檔

評論

混合音頻信號的壓縮與重建方法研究.pdf

文檔簡介

溫馨提示

最新文檔

評論

免費(fèi)下載