多聲道編碼現(xiàn)狀

上傳人：奔*** IP屬地：河北更新時(shí)間：2024-03-02 格式：doc 頁(yè)數(shù)：14 大?。?30.50KB 人氣指數(shù)：12 舉報(bào) 版權(quán)申訴

已閱讀1頁(yè)，還剩13頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、　　當(dāng)前典型的多聲道音頻編碼方案　　杜比數(shù)字AC-3編碼壓縮算法　　杜比數(shù)字音頻壓縮標(biāo)準(zhǔn)( AC- 3) 是在1992年為35毫米電影研制出來(lái)的, 它解決了在一條膠片上數(shù)字聲和模擬聲并存的問題。后來(lái), AC- 3技術(shù)被廣泛的應(yīng)用于激光唱片, 高清晰度電視系統(tǒng), 有線電視系統(tǒng), 數(shù)字衛(wèi)星廣播, DVD 影碟, DVD- ROM

2、和互聯(lián)網(wǎng)中。　　杜比數(shù)字AC- 3環(huán)繞聲系統(tǒng)是于1991年由美國(guó)杜比實(shí)驗(yàn)室與日本先鋒公司聯(lián)合開發(fā)的。其目的就是為了改善和提高三維聲場(chǎng)的重現(xiàn)能力。傳統(tǒng)的立體聲系統(tǒng)僅僅能夠提供給聽者面前的二維聲場(chǎng), 而無(wú)法描述三維空間感。通過(guò)增加左、右環(huán)繞聲及中置聲道, 以多聲道音頻重放的方式來(lái)重現(xiàn)三維立體空問,就是AC- 3環(huán)繞聲系統(tǒng)要實(shí)現(xiàn)的。　　杜比數(shù)字AC-3環(huán)

3、繞聲是多聲道音頻系統(tǒng),它是由六只獨(dú)立的聲音聲道和揚(yáng)聲器來(lái)組成的。　　AC-3揚(yáng)聲器擺放　　其中C ( 中置音箱) 、L ( 左聲道) 、R ( 右聲道) 主要用于重建二維立體聲聲場(chǎng), Ls ( 左后環(huán)繞) , Rs ( 右后環(huán)繞) 則用以與L、C、R 共同營(yíng)造逼真的三維空間立體聲聲場(chǎng), 而LFE (

4、超低音) 聲道則用來(lái)彌補(bǔ)聲場(chǎng)中低頻部分的不足, 烘托和渲染整個(gè)三維立體聲空間聲場(chǎng), 由于六個(gè)獨(dú)立聲道中前五個(gè)聲道的頻響范圍都是音頻全頻帶即20Hz～20kHz, 而LFE 頻響范圍則是由15Hz～150Hz, 僅占整個(gè)頻譜的十分之一, 因此又稱為5. l 聲道環(huán)繞聲系統(tǒng)。　　由于聲場(chǎng)的構(gòu)造與揚(yáng)聲器的擺放位置有關(guān), 按照ITU - R BS.775建議, L, C, R, Ls,Rs

5、五只揚(yáng)聲器如圖示擺放, 用于構(gòu)造三維聲場(chǎng), 而LFE 的擺放則沒有太多限制, 一般放置在側(cè)面即可。因此可以看到要想得到最好的環(huán)繞聲三維聲場(chǎng)效果, 則必須位于圖示的可聽范圍, 否則不會(huì)感受到良好的效果。　　對(duì)于數(shù)字音頻信號(hào)來(lái)說(shuō)，AC-3通過(guò)應(yīng)用數(shù)字壓縮算法，來(lái)減少正確再現(xiàn)原始脈沖編碼調(diào)制(PCM)樣本所需要的數(shù)字信息量，得出原始信號(hào)經(jīng)數(shù)字壓縮后的表達(dá)式。<p

6、>　　編碼過(guò)程為:首先在分析濾波器組中完成把音頻表達(dá)式從一個(gè)PCM時(shí)間樣本的序列變換為一個(gè)頻率系數(shù)樣本塊的序列。每個(gè)樣本塊包含256個(gè)頻率系數(shù)。這些單獨(dú)的頻率系數(shù)用二進(jìn)制指數(shù)記數(shù)法表示為一個(gè)二進(jìn)制指數(shù)和一個(gè)尾數(shù)。這個(gè)指數(shù)的集合被編碼為信號(hào)頻譜的粗略表達(dá)式，稱作頻譜包絡(luò)。核心的比特指派例行程序用這個(gè)頻譜包絡(luò)來(lái)確定每個(gè)單獨(dú)尾數(shù)需要用多少比特進(jìn)行編碼。將頻譜包絡(luò)和6個(gè)音頻樣本塊粗略量化的尾數(shù)格式化成一個(gè)AC-3數(shù)據(jù)幀(FRAME)。AC

7、-3數(shù)碼流是一個(gè)AC-3數(shù)據(jù)幀的序列。　　Ac-3編碼原理圖　　在實(shí)際的AC- 3編碼器中, 還包括下述功能:　　●附有一個(gè)數(shù)據(jù)幀的信頭 ( header ) , 其中包含與編碼的數(shù)碼流同步及把它解碼的信息( 比特率、取樣率、編碼的信道數(shù)目等) 。&

8、lt;p>　　●插入誤碼檢測(cè)碼字, 以便解碼器能檢驗(yàn)接收的數(shù)據(jù)幀是否存在誤碼。　　●可以動(dòng)態(tài)的改變分析濾波器組的頻譜分辨率, 以便同每個(gè)音頻樣本塊的時(shí)域/ 頻域特性更好的匹配。　　●頻譜包絡(luò)可以用可變的時(shí)間/ 頻率分辨率進(jìn)行編碼。　　●可以實(shí)行更復(fù)雜的比特指派, 并修改核心比特分派例行程序的一些參數(shù), 以

9、便產(chǎn)生更加優(yōu)化的比特指派。　　●在高頻一些聲道可以耦合在一起, 以便工作在較低比特率時(shí), 仍可得到更高的編碼增益。　　●在兩聲道模式中, 可以有選擇的實(shí)施重新設(shè)置矩陣的過(guò)程, 以便提供附加的編碼增益,以及當(dāng)對(duì)兩信道的信號(hào)解碼時(shí)使用一個(gè)矩陣環(huán)繞聲解碼器, 同時(shí)獲得改進(jìn)的結(jié)果。　　解碼過(guò)程基本上是編碼的逆過(guò)程。解碼器

10、必須同編碼數(shù)碼流同步, 檢查誤碼, 以及將不同類型的數(shù)據(jù)( 例如編碼的頻譜包絡(luò)和量化的尾數(shù)) 進(jìn)行解格式化。運(yùn)行比特指派例行程序, 將其結(jié)果用于解數(shù)據(jù)大包( unpack) 和尾數(shù)的解量化。將頻譜包絡(luò)進(jìn)行解碼而產(chǎn)生各個(gè)指數(shù)。各個(gè)指數(shù)和尾數(shù)被變換回到時(shí)域成為解碼的PCM 時(shí)間樣本。　　AC- 3解碼過(guò)程框圖　　在實(shí)際的AC- 3解碼器中, 還包括

11、下述功能:　　●假若檢測(cè)出一個(gè)數(shù)據(jù)誤碼, 可以使用誤碼掩蓋或靜噪。　　●高頻內(nèi)容耦合在一起的那些聲道必須去除耦合。　　●已被重新設(shè)置矩陣處理的聲道, 必須進(jìn)行去除矩陣化的處理( 在2 - 聲道模式中) 。　　●必須動(dòng)態(tài)的改變綜合濾波器組的分辨率, 與編碼器分析濾波器組在

12、編碼過(guò)程中所用的方法相同。　　杜比數(shù)字AC- 3編碼數(shù)據(jù)格式　　經(jīng)過(guò)杜比數(shù)字AC- 3編碼器的編碼處理, 可以將原始的數(shù)據(jù)PCM 信號(hào)編碼為杜比數(shù)字　　AC- 3音頻數(shù)據(jù)流。一個(gè)AC- 3串行編碼的音頻數(shù)據(jù)流是由一個(gè)同步幀的序列所組成。　　AC- 3同步幀結(jié)構(gòu)</p

13、>　　由上圖可見, 每個(gè)同步幀包含六個(gè)編碼的音頻樣本塊( AB) 其中每個(gè)代表256個(gè)新的音頻樣本。在每個(gè)同步幀開始的同步信息( SI) 的信頭中, 包含為了獲得同步和維持同步所需要的信息。接著SI 后面的是數(shù)碼流信息( BSI) 的信頭, 它包含描述編碼數(shù)據(jù)流業(yè)務(wù)的各種參數(shù)。編碼的音頻樣本塊之后接著是一個(gè)輔助數(shù)據(jù)( AU X) 字段。在每個(gè)同步幀結(jié)尾處是誤碼檢驗(yàn)字段,其中包含一個(gè)用于誤碼檢測(cè)的

14、CRC 字。一個(gè)附加的CRC 字位于SI 信頭中, 以供選用。AB0～AB5的每一塊代表一個(gè)編碼聲道, 可以分別獨(dú)立解碼, 塊的大小可以調(diào)整, 但總數(shù)據(jù)量不變。在圖中還有兩個(gè)未標(biāo)出的CRC, 其中第一個(gè)位于幀的5/ 8處, 另一個(gè)位于幀未。之所以如此安排, 目的就是可以減少解碼器的RAM 需求量, 使得解碼器不必完全接收一幀后才解碼音頻數(shù)據(jù), 而是分成了兩部分進(jìn)行解碼。　　杜比數(shù)字AC

15、- 3的兼容性　　由于AC- 3比特流中同步結(jié)構(gòu)中的AB0～AB5是獨(dú)立解碼的, 因此可以將這些編碼信號(hào)重新構(gòu)造為所需的輸出信號(hào), 即輸出的下行兼容性。　　AC-3輸出的下行兼容性　　在許多重放系統(tǒng)中, 揚(yáng)聲器的數(shù)目不能同編碼的音頻聲道的數(shù)目匹配。為了重現(xiàn)完整的音頻節(jié)目, 需要向下混合。在幀同步中, AB

16、0～AB5中記錄著六個(gè)獨(dú)立聲道的音頻數(shù)據(jù), 按照AC-3重放時(shí)的安排, 我們稱之為L(zhǎng)、R、C、Ls、Rs、LFE。一般用于向下混合的過(guò)程中, 低音增強(qiáng)LFE 聲道記錄的音頻信號(hào)主要用于渲染烘托氣氛, 所以向下混合時(shí), 只用其中的L、RC、Ls、Rs。。從圖中可以看到編碼后的AC-3數(shù)據(jù)流可以直接傳輸后經(jīng)解碼器解碼為5. 1聲道音頻信息進(jìn)行重放, 也可以向下混合為兩個(gè)聲道信號(hào), 然后經(jīng)不同的解碼器得到不同的重放模式。就單一環(huán)繞聲道

17、( n/ l 模式) 而言, 把S 稱為單個(gè)環(huán)繞聲道。從圖中可看出, 向下混合提供兩種類型: 向下混合為L(zhǎng)t、Rt 矩陣環(huán)繞編碼的立體聲對(duì); 向下混合為通常的立體聲信號(hào)L 0 、R 0 。向下混合的立體聲信號(hào)( L 0 、R 0 或L t 、Rt) 可進(jìn)一步向下混合為單聲道M , 通過(guò)兩個(gè)聲道的簡(jiǎn)單相加即可。如果將Lt、Rt 向下混合為單聲道, 環(huán)繞信息將會(huì)丟失。當(dāng)希望需要一個(gè)單聲道信號(hào)時(shí), 則將Lo、Ro 向下混合即<

18、;/p>　　用于Lo、Ro 立體聲信號(hào)的一般3/ 2向下混合方程式為:　　Lo = 1. 0 ×L + clev ×C + slev ×L s;　　Ro = 1. 0 ×R + clev ×C + slev ×Rs;　　如果接

19、著L，R。被組合成單聲道信號(hào)重放, 有效的向下混合方程式為:　　M = 1. 0 ×L + 2. 0 ×clev ×C + 1. 0 ×R + slev ×L s + slev ×Rs;　　如果只出現(xiàn)單個(gè)環(huán)繞聲道S ( 3/ l 模式) , 則向下混合方程式為:<p

20、>　　L o = 1. 0 ×L + clev ×C + 0. 7 ×slev ×S;　　Ro = 1. 0 ×R + clev ×C + 0. 7 ×slev ×S;　　M = 1. 0 ×L + 2. 0 ×clev ×C + 1. 0

21、 ×R ×1. 4 ×slev ×S;　　其中clev、SIev分別代表中央聲道混合聲級(jí)系數(shù)和環(huán)繞聲道混合聲級(jí)系數(shù), 在BSI 數(shù)據(jù)中由Cmixlev、Surmixlev 比特字段來(lái)指出相對(duì)應(yīng)的值。　　用于Lt、Rt 立體聲信號(hào)的一般3/ 2向下混合方程式為:　　Lt =

22、 1. 0 ×L +0. 707 ×C - 0. 707 ×Ls - 0. 707 ×Rs;　　Rt = 1. 0 ×R +0. 707 ×C - 0. 707 ×L s - 0. 707 ×Rs;　　如果只出現(xiàn)單個(gè)環(huán)繞聲道S ( 3/ 1模式) , 則向下混合方程式為

23、:　　L t =1. 0 ×L + 0. 707 ×C -0. 707 ×S;　　Rt =1. 0 ×R +0. 707 ×C +0. 707 ×S;　　經(jīng)過(guò)對(duì)獨(dú)立聲道的音頻信號(hào)進(jìn)行不同的分配及矩陣重組, 則實(shí)現(xiàn)了AC- 3數(shù)據(jù)流的向下兼容性, 意即通過(guò)

24、不同的解碼器、解碼矩陣方式, 可以得到杜比數(shù)字5. 1聲道環(huán)繞聲、立體聲、杜比邏輯定向、單聲道以及杜比的虛擬環(huán)繞聲方式。其中Lo、Ro 與Lt、Rt 的最大區(qū)別就是Lt、Rt 是記錄的全部的L、R 及環(huán)繞聲的信息, 經(jīng)過(guò)矩陣重解可得到環(huán)繞產(chǎn)信息, 而Lo、Ro 則是將環(huán)繞聲信息增加至立體聲信號(hào)中, 無(wú)法再現(xiàn)環(huán)繞聲信號(hào)信息。　　DTS多聲道編碼</p

25、>　　DTS（Digital Theatre System 數(shù)字化影院系統(tǒng)）是美國(guó)另外一家非常有實(shí)力的數(shù)字音頻格式制定公司，總公司位于洛杉磯，公司主要分為兩大部分：一部分是以電影音樂的錄音現(xiàn)場(chǎng)及電影院的編、解碼為主的專業(yè)用“數(shù)字影院系統(tǒng)”，另一部分是以家庭用解碼器的開發(fā)及DVD/LD/CD等套裝軟件為主的消費(fèi)電子用“DTS技術(shù)”兩大部份。 DTS公司推出過(guò)很多多聲道技術(shù)，其中DTS D

26、igital Surround是最有影響力的一種，屬于5.1聲道系統(tǒng)，人們通常說(shuō)的DTS技術(shù)，或者DTS環(huán)繞，一般就是指DTS Digital Surround。DTS采用CAC（Coherent Acoustics Coding，相干聲學(xué)編碼）方式工作，和Dolby Digital一樣也屬于利用心理聲學(xué)原理來(lái)對(duì)聲軌進(jìn)行編碼的有損的數(shù)字壓縮技術(shù)。　　DTS系統(tǒng)中采用相干聲學(xué)編碼，主要目的就是用于

27、提高音頻重放設(shè)備重放的音頻質(zhì)量，其音頻重放質(zhì)量可以超越原有的如CD唱片的質(zhì)量。相干聲學(xué)編碼器是一種感知、優(yōu)化、差分子帶音頻編碼器，它使用了多種技術(shù)對(duì)音頻數(shù)據(jù)進(jìn)行壓縮。　　編碼過(guò)程:編碼過(guò)程中的第一步是通過(guò)一個(gè)多相濾波器組將每個(gè)聲道的全頻帶24比特線性PCM源信號(hào)進(jìn)行分割到一定數(shù)目的子帶中去。這種濾波方式提供了一種框架，既可以消除頻譜滾降較快的音頻信號(hào)分量，同時(shí)又去除了感知上的冗余度。多相濾波器只

28、要通過(guò)低復(fù)雜度的計(jì)算就可以實(shí)現(xiàn)更好的線性、更高的理論編碼增益和更理想的阻帶衰減。每一個(gè)子帶信號(hào)都包含了相應(yīng)的、嚴(yán)格限制帶寬的線性PCM音頻數(shù)據(jù)。子帶的個(gè)數(shù)及相應(yīng)的帶寬是由輸入源的帶寬來(lái)決定的，一般情況下分為32個(gè)獨(dú)立的子帶。　　相干聲學(xué)編碼器流程圖　　在每個(gè)子帶中進(jìn)行差分編碼(子帶ADPCM)，這一步可以去除信號(hào)中的客觀冗余量，如周期很短的信號(hào)。通過(guò)對(duì)信

29、號(hào)的對(duì)比分析、心理聲學(xué)及信號(hào)瞬態(tài)的分析可以判斷信號(hào)中的感知冗余信息。通過(guò)子帶范圍比特率的選擇和上述分析的結(jié)果，來(lái)調(diào)整對(duì)每個(gè)信號(hào)的差分編碼程序的執(zhí)行。差分編碼與心理聲學(xué)模型(如噪聲掩蔽門限)的結(jié)合可以得到較高的編碼效率，甚至可以在不影響主觀聽覺的基礎(chǔ)上進(jìn)一步降低比特率。如果使用較高的比特率，那么對(duì)于心理聲學(xué)模型的依賴性則相對(duì)較弱但可以肯定隨著比特率的增加編碼信號(hào)的保真度也會(huì)提高。　　比特指派程序管

30、理著所有音頻聲道中子帶信息的編碼指派和分配。在時(shí)間和頻率上的自適應(yīng)可以優(yōu)化音頻質(zhì)量。作為音頻編碼系統(tǒng)設(shè)計(jì)的基礎(chǔ)，比特指派程序通過(guò)對(duì)音頻信號(hào)比特的分配和使用的比特率來(lái)決定音頻質(zhì)量。通過(guò)在編碼策略中獨(dú)立的執(zhí)行這些程序使得運(yùn)算的復(fù)雜程度大大提高，但是這樣做卻可以使得解碼器相對(duì)的簡(jiǎn)單。相反，隨著比特率的增加，比特指派程序的靈活性也將大大降低，但是可以確保音頻質(zhì)量的透明性。　　編碼過(guò)程中最后一步就是將來(lái)自

31、每個(gè)子帶ADPCM處理后的音頻數(shù)據(jù)進(jìn)行數(shù)據(jù)復(fù)用(或稱打包)。數(shù)據(jù)復(fù)用器將所有聲道中子帶數(shù)據(jù)加上附加的輔助信息進(jìn)行打包，形成特殊數(shù)據(jù)語(yǔ)法格式的編碼數(shù)據(jù)流。在數(shù)據(jù)流中加入的同步信息將用于解碼器對(duì)編碼數(shù)據(jù)流的同步。　　MPEG多聲道編碼　　MPEG-2 BC&l

32、t;p>　　ITU-R工作組在關(guān)于多聲道聲音系統(tǒng)的建議方面進(jìn)行了工作。該項(xiàng)工作的主要成果就是說(shuō)明一個(gè)適當(dāng)?shù)亩嗦暤缆曇襞渲脩?yīng)包含五個(gè)聲道，分別代表左、中央、右、左環(huán)繞、右環(huán)繞聲道。如果使用了一個(gè)作為選項(xiàng)的低頻增強(qiáng)聲道（LFE），則該配置被稱為“5.1”。五聲道配置也可表示為‘3/2’，即三個(gè)前置聲道及兩個(gè)環(huán)繞（后置）聲道。 　　MPEG也認(rèn)識(shí)到應(yīng)根據(jù)ITU-R的建議來(lái)增加音頻標(biāo)準(zhǔn)的多聲道能力

33、的必要性，由此產(chǎn)生了MPEG-2 BC音頻標(biāo)準(zhǔn)。在多聲道聲音方面的擴(kuò)展支持在一路碼流中傳輸五個(gè)輸入聲道、低頻增強(qiáng)聲道以及7個(gè)邊聲道。該擴(kuò)展與MPEG-1保持前向及后向兼容。前向兼容性意味著多聲道解碼器可正確地對(duì)立體聲碼流進(jìn)行解碼。后向兼容性則意味著一個(gè)標(biāo)準(zhǔn)的立體聲解碼器在對(duì)多聲道碼流進(jìn)行解碼時(shí)可輸出兼容的立體聲信號(hào)。它是通過(guò)一種真正的可分級(jí)方式實(shí)現(xiàn)的。在編碼器端，五個(gè)輸入聲道被向下混合為一路兼容立體聲信號(hào)。該兼容立體聲信號(hào)按照MPE

34、G-1標(biāo)準(zhǔn)進(jìn)行編碼。所有用于在解碼器端恢復(fù)原來(lái)的五個(gè)聲道的信息都被置于MPEG-1的附加數(shù)據(jù)區(qū)內(nèi)，該數(shù)據(jù)區(qū)被MPEG-1解碼器忽略。這些附加的信息在信息聲道T2、T3及T4以及LFE聲道中傳輸，這幾個(gè)信息聲道通常包含中央、左環(huán)繞和右環(huán)繞聲道。MPEG-2多聲道解碼器不但對(duì)碼流中的MPEG-1部分進(jìn)行解碼，還對(duì)附加信息聲道T2、T3、T4及LFE解碼。根據(jù)這些信息，它可以恢復(fù)原來(lái)的5.1聲道聲音。

35、　　當(dāng)相同碼流饋送至MPEG-1解碼器時(shí)，解碼器將只對(duì)碼流的MPEG-1部分進(jìn)行解碼，而忽略所有附加的多聲道信息。由此它將輸出在MPEG-2編碼器中經(jīng)向下混合產(chǎn)生的兩個(gè)聲道。這種方式實(shí)現(xiàn)了與現(xiàn)有的雙聲道解碼器的兼容性。也許更為重要的是，這種可分級(jí)的方式使得即使在多聲道業(yè)務(wù)中仍可使用低成本的雙聲道解碼器?？紤]到所使用的其它所有編碼策略，多聲道業(yè)務(wù)中的雙聲道解碼器本質(zhì)上就是一個(gè)對(duì)所有聲道進(jìn)行解碼并在解碼器中產(chǎn)生雙聲道向下混合信號(hào)的多聲道

36、解碼器。如圖所示。 　　就其包含了不同的可由編碼器使用以進(jìn)一步提高音頻質(zhì)量的技術(shù)而言，該標(biāo)準(zhǔn)是具有很大靈活性的。　　MPEG-2 AAC 　　AAC可以支持1到48路之間任意數(shù)目的音頻聲道組合、包括15路低頻效果聲道、配音/多語(yǔ)聲聲道，以及15路數(shù)據(jù)。它可同時(shí)傳送16套節(jié)目，每套節(jié)目的音頻及數(shù)據(jù)結(jié)構(gòu)可任意規(guī)定。在

37、碼率為64kbps/聲道的條件下，AAC可以提供很高的聲音質(zhì)量。 　　為提高音頻編碼效率，AAC采用了許多先進(jìn)技術(shù)，如霍夫曼編碼、相關(guān)立體聲、聲道耦合、反向自適應(yīng)預(yù)測(cè)、時(shí)域噪聲整形、修正離散余弦變換（MDCT）、及混合濾波器組等。 　　其中，濾波器組與MPEG層III所采用的濾波器組相比，由于層III算法在對(duì)濾波器進(jìn)行選擇時(shí)考慮了兼容性問題，因而具有固有

38、的結(jié)構(gòu)上的不足；而AAC則直接采用了MDCT變換濾波。同時(shí)，AAC增加了窗口長(zhǎng)度，由1152點(diǎn)增至2048，使MDCT的性能優(yōu)于原來(lái)的濾波器組。 　　時(shí)域噪聲整形（TNS）技術(shù)是時(shí)域/頻域編碼中一項(xiàng)新穎的技術(shù)。它利用頻域的自適應(yīng)預(yù)測(cè)的結(jié)果來(lái)對(duì)時(shí)域中量化噪聲的分布進(jìn)行整形處理。通過(guò)采用TNS技術(shù)，可以使特殊環(huán)境下的話音信號(hào)質(zhì)量得到顯著的提高。 　　后向自適

39、應(yīng)預(yù)測(cè)是一項(xiàng)在語(yǔ)音信號(hào)編碼系統(tǒng)領(lǐng)域建立起來(lái)的技術(shù)。它主要利用了某一特定形式的音頻信號(hào)易于預(yù)測(cè)的特點(diǎn)。在量化過(guò)程中，通過(guò)對(duì)量化精度更為精細(xì)的控制，可以使給定的碼率得到更加有效的利用。在碼流復(fù)接時(shí)，通過(guò)對(duì)必須傳輸?shù)男畔⑦M(jìn)行熵編碼使冗余度降至最低。通過(guò)以上各種編碼技術(shù)的運(yùn)用以及采用一種可變的碼流結(jié)構(gòu)，使AAC編碼算法在得到大大優(yōu)化的同時(shí)，也為將來(lái)進(jìn)一步提高編碼效率提供了可能性。 　　AC可以在低

40、數(shù)據(jù)率的情況下提供較高質(zhì)量的音頻信息，如每個(gè)聲道僅64kb/s時(shí)就會(huì)有比較好的性能。 AAC當(dāng)前的應(yīng)用主要用于日本的數(shù)字音頻廣播及美國(guó)的IBOC（帶內(nèi)同頻技術(shù)）。 　　MPEG Surround　　MPEG Surround把多聲道音頻信號(hào)下混為正常的雙聲道數(shù)字音頻信號(hào)并提取表達(dá)聲像信息的參數(shù)，這些參數(shù)在解碼端與雙聲道信號(hào)一起使用，以恢復(fù)出高質(zhì)量的多聲道

41、信號(hào)。以下是它的整體框架圖：　　圖1 MPEG Surround整體框圖　　環(huán)繞MPEG編碼過(guò)程可通過(guò)三個(gè)步驟來(lái)描述：對(duì)每一個(gè)音頻通道分解其環(huán)繞信息的參量描述（提取環(huán)繞信息）；把各個(gè)通道混合成為單聲道或者立體聲的音頻（下混）；混合后的音頻通過(guò)核心音頻編解碼器進(jìn)行編碼并嵌入之前分解得到的環(huán)繞參量。如下是示意圖。

42、　在解碼端，混合后的音頻通過(guò)核心編解碼器解碼，并根據(jù)內(nèi)嵌的環(huán)繞信息參量重建完整的多通道信號(hào)。環(huán)繞MPEG數(shù)據(jù)是嵌入在比特流的額外數(shù)據(jù)部分，因此只會(huì)被環(huán)繞MPEG解碼系統(tǒng)所辨認(rèn)。對(duì)應(yīng)于內(nèi)嵌在環(huán)繞MPEG編碼系統(tǒng)內(nèi)部的核心編碼器，其傳統(tǒng)版本的立體聲解碼器會(huì)簡(jiǎn)單地忽略掉環(huán)繞MPEG數(shù)據(jù)去解碼混合后的音頻信號(hào)。下圖分別為僅支持立體聲的解碼端和支持環(huán)繞MPEG的解碼端的示意圖：　　與BCC直接下混到一個(gè)聲

43、道的方式不同，MPEG Surround實(shí)現(xiàn)的是逐級(jí)下混的方法，采用2至1（One to Two, OTT）和3至2（Two to Three, TTT）兩種基本下混模塊（圖2），最終下混到一個(gè)或兩個(gè)聲道。　　(a)分析 (b) 合成　　圖2 5.1聲道樹狀結(jié)構(gòu)圖　　這種樹狀

44、分析和提取的下混結(jié)構(gòu)使得MPEG Surround具有較強(qiáng)的聲道可擴(kuò)展性，可以方便地進(jìn)行5.1、7.1甚至更多聲道的編碼，并且其雙下混聲道還可與當(dāng)前立體聲回放設(shè)備自然融和。此外，MPEG Surround在低碼率下對(duì)合成的空間參數(shù)采用參數(shù)平滑的后處理技術(shù)，避免了低碼率下重建聲中聲源位置的跳躍。　　為適應(yīng)多聲道應(yīng)用，MPEG Surround采用了基于混響濾波器的去相關(guān)技術(shù)首先下混聲道經(jīng)混響濾波器

45、生成統(tǒng)計(jì)獨(dú)立的信號(hào)，然后對(duì)它們進(jìn)行加權(quán)求和求出各個(gè)輸出聲道，使它們有給定的相關(guān)度值。該方法在數(shù)學(xué)上模擬了物理上的混響效應(yīng)，使合成信號(hào)在聲象的穩(wěn)定性、分布范圍的準(zhǔn)確度和飽滿度方面等方面較BCC有了很大的提高。此外混響去相關(guān)技術(shù)與時(shí)頻域的包絡(luò)整形技術(shù)結(jié)合，降低了合成失真，進(jìn)一步改善了音質(zhì)　　Ogg Vorbis多聲道音頻編碼算法　　Ogg Vorbis編碼特

46、點(diǎn)　　Ogg Vorbis是近年來(lái)由美國(guó)公司Xiph.Org Foundatinn開發(fā)的通用感覺音頻編碼器，其特點(diǎn)是:源碼完全開放、無(wú)專利限制，具有較大編碼靈活性。在高質(zhì)量(高比特率)級(jí)別CD或DAT立體聲，16/24bit量化時(shí)，與現(xiàn)在的MPEG-2和MPEG-4等音頻算法相當(dāng); Ogg Vorbis編碼器在沒有重新采樣到低采樣率時(shí)，可將CD高質(zhì)量立體聲信號(hào)壓縮到低于48KPs比特率。輸出碼率

47、可設(shè)置為(平均比特率)ABR或(可變比特率)VBR，范圍為16-128Kbps/ch，輸入音頻信號(hào)支持:采樣率8-192kHz;量化分辨率16-24bit量化;聲道數(shù):單聲道、立體聲、4聲道、5.1聲道，最高可支持255獨(dú)立聲道。　　Ogg Vorbis，設(shè)計(jì)成一個(gè)具有心理聲學(xué)模型的復(fù)雜編碼器，但解碼運(yùn)算復(fù)雜度低于MP3。沒有提供幀格式、同步及錯(cuò)誤保護(hù)等，僅僅是接收輸入的音頻數(shù)據(jù)塊，并壓縮成數(shù)據(jù)

48、包方式。解碼器按順序接收元數(shù)據(jù)包，解碼并把音頻幀合成，然后把音頻幀合成原始音頻流。因此Vorbis數(shù)據(jù)包可用于任何能夠提供幀格式、同步、定位及錯(cuò)誤保護(hù)的一個(gè)傳輸機(jī)制，如Ogg (文件傳輸)或RTP(網(wǎng)絡(luò)傳輸)。　　Ogg Vorbis編碼原理　　Vothis編碼過(guò)程的基本過(guò)程如下圖所示，首先對(duì)音頻PCM信號(hào)進(jìn)行穩(wěn)態(tài)/瞬態(tài)分析，決定MDCT(Modifie

49、d Discrete Cosine Transform，改進(jìn)的離散余弦變換)的長(zhǎng)度:同時(shí)原始音頻信號(hào)要進(jìn)行FFT分析。2種變換的的頻譜系數(shù)輸入給心理聲學(xué)模型單元，MDCT系數(shù)用于噪聲掩蔽計(jì)算，F(xiàn)FT結(jié)果用于音調(diào)掩蔽特性計(jì)算，共同構(gòu)造總的掩蔽曲線，然后根據(jù)MDCT系數(shù)及掩蔽曲線，對(duì)頻譜系數(shù)進(jìn)行線性預(yù)測(cè)分析，用LPC線性預(yù)測(cè)系數(shù)表示頻譜包絡(luò)即基底曲線(filoor);或者通過(guò)線性分段逼近方式獲得基底曲線。從MDCT系數(shù)中去掉頻譜包絡(luò)則得到白

50、化的殘差(residue)頻譜，由于殘差頻譜動(dòng)態(tài)范圍明顯變小，從而降低量化誤差。之后要采用聲道耦合技術(shù)(stereo channel coupling)122]進(jìn)一步降低冗余度，耦合主要是將左右聲道數(shù)據(jù)從直角坐標(biāo)映射到平方極坐標(biāo);然后對(duì)白化的殘差信號(hào)以矢量量化VQ的形式表示。最后將要傳輸?shù)母鞣N信息數(shù)據(jù)按vothis定義的包格式組成，形成vorbis壓縮碼流。　　Ogg Vorbis 編碼原理框圖

眾賞文庫(kù)> 全部分類> 畢業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

多聲道編碼現(xiàn)狀

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

多聲道編碼現(xiàn)狀

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

免費(fèi)下載