

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、音頻信號通常包含語音信號、樂音信號以及兩者任意比例的混合(也即混合音頻信號)。鑒于當(dāng)前音頻壓縮編碼方法或是面向純語音信號,或是面向純樂音信號的現(xiàn)實(shí),本文對可同時面向各類音頻(尤其是混合音頻)的壓縮與重建方法展開了深入研究。音頻信號的壓縮與重建過程通??煞譃椋合∈璞硎尽⒎治雠c綜合以及量化與編碼等三個單元,其中,分析與綜合單元通常存在兩種實(shí)現(xiàn)方式:基于傳統(tǒng)香農(nóng)采樣定理的語/樂音統(tǒng)一編碼(Unified Speech and Audio Co
2、ding,USAC)方式和基于壓縮采樣理論的壓縮感知(Compressed Sensing,CS)方式。兩種方式中,USAC為動態(tài)圖像專家組(Moving Pictures Experts Group,MPEG)于2012年頒布的最新音頻編碼標(biāo)準(zhǔn),可同時面向各類音頻信號,尤其是混合音頻信號,且其性能不亞于當(dāng)前最優(yōu)的語音及樂音壓縮編碼標(biāo)準(zhǔn);而CS方式則是基于CS理論,在對混合音頻信號的壓縮采樣過程中,將壓縮與采樣相融合,在對信號采樣的同時
3、即實(shí)現(xiàn)對其壓縮,使得采樣過程極為簡單,并在某種意義上突破了香農(nóng)采樣定理的局限。
需要指出的是,隨著科技的發(fā)展,可同時面向各類音頻信號的統(tǒng)一壓縮采樣方式必將快速在我們的生活中占據(jù)重要位置。基于傳統(tǒng)香農(nóng)采樣定理的實(shí)現(xiàn)方法具有結(jié)構(gòu)成熟,兼容性好等優(yōu)點(diǎn),在當(dāng)前及將來一段時間內(nèi)將占據(jù)統(tǒng)治地位。但由于其復(fù)雜度高,普適性弱等缺點(diǎn),必將被越來越成熟的基于CS理論的方法所替代。本論文在對混合音頻信號的稀疏表示、量化與編碼以及USAC壓縮編碼標(biāo)準(zhǔn)
4、展開深入研究的基礎(chǔ)之上,探討了混合音頻信號的CS壓縮與重建方法。本論文的主要工作包括:
(1)針對混合音頻信號變換域系數(shù)的矢量量化過程中,量化器的存儲需求隨矢量維度的增加而指數(shù)式增長的缺陷,提出了一種具有有限個狀態(tài)的熵受限矢量量化器(Finite-State Entropy Constrained VQ,FS-ECVQ)。該FS-ECVQ利用當(dāng)前幀以及先前若干幀中已量化過的鄰近矢量的統(tǒng)計特性來預(yù)測當(dāng)前輸入矢量的統(tǒng)計特性,從而有
5、效消除了變換域系數(shù)的幀間及幀內(nèi)冗余,進(jìn)而顯著提升了量化性能。實(shí)驗表明,與USAC最終版中對應(yīng)算法相比,F(xiàn)S-ECVQ在維持率/失真(Rate/Distortion,R/D)性能不變的同時,減少了14.6%的存儲需求。
(2)針對混合音頻信號高頻帶寬擴(kuò)展過程中,通?;蛘卟捎脤φZ音信號最優(yōu)的頻譜復(fù)制(Spectral Band Reputation,SBR)方式或者采用對樂音信號最優(yōu)的諧波延伸(Harmonic Bandwidth
6、 Extension,HBE)方式的現(xiàn)實(shí),提出了一種自適應(yīng)的高頻帶寬拓展(adaptive BWE,aBWE)方式。該方式將SBR與HBE相融合,根據(jù)音頻信號當(dāng)前輸入幀的頻譜特性實(shí)時地選取最佳的頻帶擴(kuò)展方式,從而可同時適用于各類音頻信號,尤其是混合音頻信號。實(shí)驗表明,在高頻帶寬擴(kuò)展中,對于語音信號和樂音信號,aBWE的性能不亞于SBR和HBE的性能,而對于混合音頻信號,aBWE的性能則明顯優(yōu)于SBR和HBE的性能。
(3)信號
7、的稀疏表示是CS理論應(yīng)用的前提與基礎(chǔ),而混合音頻信號在單一正交基下通常很難實(shí)現(xiàn)稀疏分解。針對這一難點(diǎn),提出了一種基于結(jié)構(gòu)化最小絕對收縮選擇算子(Least Absolute Shrinkage and Selection Operator,LASSO)的混合音頻信號稀疏逼近方法。該方法將音頻信號看作是音調(diào)成份、暫態(tài)成份與噪聲成份的疊加,采用結(jié)構(gòu)化LASSO算子將音頻信號最佳地分解為音調(diào)層與暫態(tài)層。由于所得兩層分別在時、頻域中具有很強(qiáng)的稀
8、疏特性,為此,實(shí)現(xiàn)了音頻信號的近似最佳稀疏分解,進(jìn)而為CS理論在音頻信號中的應(yīng)用提供了前提與基礎(chǔ)。
(4)針對一般音頻CS方法中,通常將音頻信號分幀處理,各幀獨(dú)立壓縮與重建,而忽略其幀間的時間相關(guān)性的不足,提出了一種基于動態(tài)CS的混合音頻信號重建算法,該算法在對混合音頻信號進(jìn)行統(tǒng)計建模的基礎(chǔ)上,借助信息傳遞的機(jī)理充分利用其幀間的時間相關(guān)性,從而提升系統(tǒng)的重建性能。
本課題在對傳統(tǒng)混合音頻壓縮編碼方法中若干關(guān)鍵問題展開
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于音頻信號的信息隱藏方法研究.pdf
- 音頻信號的分析與評價方法及實(shí)現(xiàn).pdf
- 音頻信號分析
- 音頻信號篡改檢測與恢復(fù)研究.pdf
- 音頻信號分類算法研究.pdf
- 音頻信號修復(fù)的算法研究.pdf
- 數(shù)字調(diào)頻激勵器的音頻信號處理方法研究.pdf
- 多音頻信號分離與識別技術(shù)的研究.pdf
- 視音頻信號接口詳解
- 音頻信號識別研究與基于SOPC的設(shè)計與實(shí)現(xiàn).pdf
- 音頻信號檢測技術(shù)研究.pdf
- 音頻信號處理電路的設(shè)計.pdf
- 音頻信號監(jiān)測系統(tǒng)的設(shè)計與實(shí)現(xiàn).pdf
- 音頻信號分析儀
- 車輛音頻信號特征分析和研究.pdf
- 基于音頻信號的汽車狀態(tài)與故障分析.pdf
- 音頻信號的采集[文獻(xiàn)綜述]
- 音頻信號紅外發(fā)射芯片的設(shè)計.pdf
- 多通道音頻信號傳輸系統(tǒng).pdf
- 基于FPGA的音頻信號處理的設(shè)計與實(shí)現(xiàn).pdf
評論
0/150
提交評論