版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、<p> 當(dāng)前典型的多聲道音頻編碼方案</p><p> 杜比數(shù)字AC-3編碼壓縮算法</p><p> 杜比數(shù)字音頻壓縮標(biāo)準(zhǔn)( AC- 3) 是在1992年為35毫米電影研制出來(lái)的, 它解決了在一條膠片上數(shù)字聲和模擬聲并存的問題。后來(lái), AC- 3技術(shù)被廣泛的應(yīng)用于激光唱片, 高清晰度電視系統(tǒng), 有線電視系統(tǒng), 數(shù)字衛(wèi)星廣播, DVD 影碟, DVD- ROM
2、 和互聯(lián)網(wǎng)中。</p><p> 杜比數(shù)字AC- 3環(huán)繞聲系統(tǒng)是于1991年由美國(guó)杜比實(shí)驗(yàn)室與日本先鋒公司聯(lián)合開發(fā)的。其目的就是為了改善和提高三維聲場(chǎng)的重現(xiàn)能力。傳統(tǒng)的立體聲系統(tǒng)僅僅能夠提供給聽者面前的二維聲場(chǎng), 而無(wú)法描述三維空間感。通過(guò)增加左、右環(huán)繞聲及中置聲道, 以多聲道音頻重放的方式來(lái)重現(xiàn)三維立體空問,就是AC- 3環(huán)繞聲系統(tǒng)要實(shí)現(xiàn)的。</p><p> 杜比數(shù)字AC-3環(huán)
3、繞聲是多聲道音頻系統(tǒng),它是由六只獨(dú)立的聲音聲道和揚(yáng)聲器來(lái)組成的。</p><p><b> AC-3揚(yáng)聲器擺放</b></p><p> 其中C ( 中置音箱) 、L ( 左聲道) 、R ( 右聲道) 主要用于重建二維立體聲聲場(chǎng), Ls ( 左后環(huán)繞) , Rs ( 右后環(huán)繞) 則用以與L、C、R 共同營(yíng)造逼真的三維空間立體聲聲場(chǎng), 而LFE (
4、超低音) 聲道則用來(lái)彌補(bǔ)聲場(chǎng)中低頻部分的不足, 烘托和渲染整個(gè)三維立體聲空間聲場(chǎng), 由于六個(gè)獨(dú)立聲道中前五個(gè)聲道的頻響范圍都是音頻全頻帶即20Hz~20kHz, 而LFE 頻響范圍則是由15Hz~150Hz, 僅占整個(gè)頻譜的十分之一, 因此又稱為5. l 聲道環(huán)繞聲系統(tǒng)。</p><p> 由于聲場(chǎng)的構(gòu)造與揚(yáng)聲器的擺放位置有關(guān), 按照ITU - R BS.775建議, L, C, R, Ls,Rs
5、 五只揚(yáng)聲器如圖示擺放, 用于構(gòu)造三維聲場(chǎng), 而LFE 的擺放則沒有太多限制, 一般放置在側(cè)面即可。因此可以看到要想得到最好的環(huán)繞聲三維聲場(chǎng)效果, 則必須位于圖示的可聽范圍, 否則不會(huì)感受到良好的效果。</p><p> 對(duì)于數(shù)字音頻信號(hào)來(lái)說(shuō),AC-3通過(guò)應(yīng)用數(shù)字壓縮算法,來(lái)減少正確再現(xiàn)原始脈沖編碼調(diào)制(PCM)樣本所需要的數(shù)字信息量,得出原始信號(hào)經(jīng)數(shù)字壓縮后的表達(dá)式。</p><p
6、> 編碼過(guò)程為:首先在分析濾波器組中完成把音頻表達(dá)式從一個(gè)PCM時(shí)間樣本的序列變換為一個(gè)頻率系數(shù)樣本塊的序列。每個(gè)樣本塊包含256個(gè)頻率系數(shù)。這些單獨(dú)的頻率系數(shù)用二進(jìn)制指數(shù)記數(shù)法表示為一個(gè)二進(jìn)制指數(shù)和一個(gè)尾數(shù)。這個(gè)指數(shù)的集合被編碼為信號(hào)頻譜的粗略表達(dá)式,稱作頻譜包絡(luò)。核心的比特指派例行程序用這個(gè)頻譜包絡(luò)來(lái)確定每個(gè)單獨(dú)尾數(shù)需要用多少比特進(jìn)行編碼。將頻譜包絡(luò)和6個(gè)音頻樣本塊粗略量化的尾數(shù)格式化成一個(gè)AC-3數(shù)據(jù)幀(FRAME)。AC
7、-3數(shù)碼流是一個(gè)AC-3數(shù)據(jù)幀的序列。</p><p><b> Ac-3編碼原理圖</b></p><p> 在實(shí)際的AC- 3編碼器中, 還包括下述功能:</p><p> ●附有一個(gè)數(shù)據(jù)幀的信頭 ( header ) , 其中包含與編碼的數(shù)碼流同步及把它解碼的信息( 比特率、取樣率、編碼的信道數(shù)目等) 。</p>&
8、lt;p> ●插入誤碼檢測(cè)碼字, 以便解碼器能檢驗(yàn)接收的數(shù)據(jù)幀是否存在誤碼。</p><p> ●可以動(dòng)態(tài)的改變分析濾波器組的頻譜分辨率, 以便同每個(gè)音頻樣本塊的時(shí)域/ 頻域特性更好的匹配。</p><p> ●頻譜包絡(luò)可以用可變的時(shí)間/ 頻率分辨率進(jìn)行編碼。</p><p> ●可以實(shí)行更復(fù)雜的比特指派, 并修改核心比特分派例行程序的一些參數(shù), 以
9、便產(chǎn)生更加優(yōu)化的比特指派。</p><p> ●在高頻一些聲道可以耦合在一起, 以便工作在較低比特率時(shí), 仍可得到更高的編碼增益。</p><p> ●在兩聲道模式中, 可以有選擇的實(shí)施重新設(shè)置矩陣的過(guò)程, 以便提供附加的編碼增益,以及當(dāng)對(duì)兩信道的信號(hào)解碼時(shí)使用一個(gè)矩陣環(huán)繞聲解碼器, 同時(shí)獲得改進(jìn)的結(jié)果。</p><p> 解碼過(guò)程基本上是編碼的逆過(guò)程。解碼器
10、必須同編碼數(shù)碼流同步, 檢查誤碼, 以及將不同類型的數(shù)據(jù)( 例如編碼的頻譜包絡(luò)和量化的尾數(shù)) 進(jìn)行解格式化。運(yùn)行比特指派例行程序, 將其結(jié)果用于解數(shù)據(jù)大包( unpack) 和尾數(shù)的解量化。將頻譜包絡(luò)進(jìn)行解碼而產(chǎn)生各個(gè)指數(shù)。各個(gè)指數(shù)和尾數(shù)被變換回到時(shí)域成為解碼的PCM 時(shí)間樣本。</p><p> AC- 3解碼過(guò)程框圖</p><p> 在實(shí)際的AC- 3解碼器中, 還包括
11、下述功能:</p><p> ●假若檢測(cè)出一個(gè)數(shù)據(jù)誤碼, 可以使用誤碼掩蓋或靜噪。</p><p> ●高頻內(nèi)容耦合在一起的那些聲道必須去除耦合。</p><p> ●已被重新設(shè)置矩陣處理的聲道, 必須進(jìn)行去除矩陣化的處理( 在2 - 聲道模式中) 。</p><p> ●必須動(dòng)態(tài)的改變綜合濾波器組的分辨率, 與編碼器分析濾波器組在
12、編碼過(guò)程中所用的方法相同。</p><p> 杜比數(shù)字AC- 3編碼數(shù)據(jù)格式</p><p> 經(jīng)過(guò)杜比數(shù)字AC- 3編碼器的編碼處理, 可以將原始的數(shù)據(jù)PCM 信號(hào)編碼為杜比數(shù)字</p><p> AC- 3音頻數(shù)據(jù)流。一個(gè)AC- 3串行編碼的音頻數(shù)據(jù)流是由一個(gè)同步幀的序列所組成。</p><p> AC- 3同步幀結(jié)構(gòu)</p
13、><p> 由上圖可見, 每個(gè)同步幀包含六個(gè)編碼的音頻樣本塊( AB) 其中每個(gè)代表256個(gè)新的音頻樣本。在每個(gè)同步幀開始的同步信息( SI) 的信頭中, 包含為了獲得同步和維持同步所需要的信息。接著SI 后面的是數(shù)碼流信息( BSI) 的信頭, 它包含描述編碼數(shù)據(jù)流業(yè)務(wù)的各種參數(shù)。編碼的音頻樣本塊之后接著是一個(gè)輔助數(shù)據(jù)( AU X) 字段。在每個(gè)同步幀結(jié)尾處是誤碼檢驗(yàn)字段,其中包含一個(gè)用于誤碼檢測(cè)的
14、CRC 字。一個(gè)附加的CRC 字位于SI 信頭中, 以供選用。AB0~AB5的每一塊代表一個(gè)編碼聲道, 可以分別獨(dú)立解碼, 塊的大小可以調(diào)整, 但總數(shù)據(jù)量不變。在圖中還有兩個(gè)未標(biāo)出的CRC, 其中第一個(gè)位于幀的5/ 8處, 另一個(gè)位于幀未。之所以如此安排, 目的就是可以減少解碼器的RAM 需求量, 使得解碼器不必完全接收一幀后才解碼音頻數(shù)據(jù), 而是分成了兩部分進(jìn)行解碼。</p><p> 杜比數(shù)字AC
15、- 3的兼容性</p><p> 由于AC- 3比特流中同步結(jié)構(gòu)中的AB0~AB5是獨(dú)立解碼的, 因此可以將這些編碼信號(hào)重新構(gòu)造為所需的輸出信號(hào), 即輸出的下行兼容性。</p><p> AC-3輸出的下行兼容性</p><p> 在許多重放系統(tǒng)中, 揚(yáng)聲器的數(shù)目不能同編碼的音頻聲道的數(shù)目匹配。為了重現(xiàn)完整的音頻節(jié)目, 需要向下混合。在幀同步中, AB
16、0~AB5中記錄著六個(gè)獨(dú)立聲道的音頻數(shù)據(jù), 按照AC-3重放時(shí)的安排, 我們稱之為L(zhǎng)、R、C、Ls、Rs、LFE。一般用于向下混合的過(guò)程中, 低音增強(qiáng)LFE 聲道記錄的音頻信號(hào)主要用于渲染烘托氣氛, 所以向下混合時(shí), 只用其中的L、RC、Ls、Rs。。從圖中可以看到編碼后的AC-3數(shù)據(jù)流可以直接傳輸后經(jīng)解碼器解碼為5. 1聲道音頻信息進(jìn)行重放, 也可以向下混合為兩個(gè)聲道信號(hào), 然后經(jīng)不同的解碼器得到不同的重放模式。就單一環(huán)繞聲道
17、( n/ l 模式) 而言, 把S 稱為單個(gè)環(huán)繞聲道。從圖中可看出, 向下混合提供兩種類型: 向下混合為L(zhǎng)t、Rt 矩陣環(huán)繞編碼的立體聲對(duì); 向下混合為通常的立體聲信號(hào)L 0 、R 0 。向下混合的立體聲信號(hào)( L 0 、R 0 或L t 、Rt) 可進(jìn)一步向下混合為單聲道M , 通過(guò)兩個(gè)聲道的簡(jiǎn)單相加即可。如果將Lt、Rt 向下混合為單聲道, 環(huán)繞信息將會(huì)丟失。當(dāng)希望需要一個(gè)單聲道信號(hào)時(shí), 則將Lo、Ro 向下混合即<
18、;/p><p> 用于Lo、Ro 立體聲信號(hào)的一般3/ 2向下混合方程式為:</p><p> Lo = 1. 0 ×L + clev ×C + slev ×L s;</p><p> Ro = 1. 0 ×R + clev ×C + slev ×Rs;</p><p> 如果接
19、著L,R。被組合成單聲道信號(hào)重放, 有效的向下混合方程式為:</p><p> M = 1. 0 ×L + 2. 0 ×clev ×C + 1. 0 ×R + slev ×L s + slev ×Rs;</p><p> 如果只出現(xiàn)單個(gè)環(huán)繞聲道S ( 3/ l 模式) , 則向下混合方程式為:</p><p
20、> L o = 1. 0 ×L + clev ×C + 0. 7 ×slev ×S;</p><p> Ro = 1. 0 ×R + clev ×C + 0. 7 ×slev ×S;</p><p> M = 1. 0 ×L + 2. 0 ×clev ×C + 1. 0
21、 ×R ×1. 4 ×slev ×S;</p><p> 其中clev、SIev分別代表中央聲道混合聲級(jí)系數(shù)和環(huán)繞聲道混合聲級(jí)系數(shù), 在BSI 數(shù)據(jù)中由Cmixlev、Surmixlev 比特字段來(lái)指出相對(duì)應(yīng)的值。</p><p> 用于Lt、Rt 立體聲信號(hào)的一般3/ 2向下混合方程式為:</p><p> Lt =
22、 1. 0 ×L +0. 707 ×C - 0. 707 ×Ls - 0. 707 ×Rs;</p><p> Rt = 1. 0 ×R +0. 707 ×C - 0. 707 ×L s - 0. 707 ×Rs;</p><p> 如果只出現(xiàn)單個(gè)環(huán)繞聲道S ( 3/ 1模式) , 則向下混合方程式為
23、:</p><p> L t =1. 0 ×L + 0. 707 ×C -0. 707 ×S;</p><p> Rt =1. 0 ×R +0. 707 ×C +0. 707 ×S;</p><p> 經(jīng)過(guò)對(duì)獨(dú)立聲道的音頻信號(hào)進(jìn)行不同的分配及矩陣重組, 則實(shí)現(xiàn)了AC- 3數(shù)據(jù)流的向下兼容性, 意即通過(guò)
24、不同的解碼器、解碼矩陣方式, 可以得到杜比數(shù)字5. 1聲道環(huán)繞聲、立體聲、杜比邏輯定向、單聲道以及杜比的虛擬環(huán)繞聲方式。其中Lo、Ro 與Lt、Rt 的最大區(qū)別就是Lt、Rt 是記錄的全部的L、R 及環(huán)繞聲的信息, 經(jīng)過(guò)矩陣重解可得到環(huán)繞產(chǎn)信息, 而Lo、Ro 則是將環(huán)繞聲信息增加至立體聲信號(hào)中, 無(wú)法再現(xiàn)環(huán)繞聲信號(hào)信息。</p><p><b> DTS多聲道編碼</b></p
25、><p> DTS(Digital Theatre System 數(shù)字化影院系統(tǒng))是美國(guó)另外一家非常有實(shí)力的數(shù)字音頻格式制定公司,總公司位于洛杉磯,公司主要分為兩大部分:一部分是以電影音樂的錄音現(xiàn)場(chǎng)及電影院的編、解碼為主的專業(yè)用“數(shù)字影院系統(tǒng)”,另一部分是以家庭用解碼器的開發(fā)及DVD/LD/CD等套裝軟件為主的消費(fèi)電子用“DTS技術(shù)”兩大部份。 DTS公司推出過(guò)很多多聲道技術(shù),其中DTS D
26、igital Surround是最有影響力的一種,屬于5.1聲道系統(tǒng),人們通常說(shuō)的DTS技術(shù),或者DTS環(huán)繞,一般就是指DTS Digital Surround。DTS采用CAC(Coherent Acoustics Coding,相干聲學(xué)編碼)方式工作,和Dolby Digital一樣也屬于利用心理聲學(xué)原理來(lái)對(duì)聲軌進(jìn)行編碼的有損的數(shù)字壓縮技術(shù)。</p><p> DTS系統(tǒng)中采用相干聲學(xué)編碼,主要目的就是用于
27、提高音頻重放設(shè)備重放的音頻質(zhì)量,其音頻重放質(zhì)量可以超越原有的如CD唱片的質(zhì)量。相干聲學(xué)編碼器是一種感知、優(yōu)化、差分子帶音頻編碼器,它使用了多種技術(shù)對(duì)音頻數(shù)據(jù)進(jìn)行壓縮。</p><p> 編碼過(guò)程:編碼過(guò)程中的第一步是通過(guò)一個(gè)多相濾波器組將每個(gè)聲道的全頻帶24比特線性PCM源信號(hào)進(jìn)行分割到一定數(shù)目的子帶中去。這種濾波方式提供了一種框架,既可以消除頻譜滾降較快的音頻信號(hào)分量,同時(shí)又去除了感知上的冗余度。多相濾波器只
28、要通過(guò)低復(fù)雜度的計(jì)算就可以實(shí)現(xiàn)更好的線性、更高的理論編碼增益和更理想的阻帶衰減。每一個(gè)子帶信號(hào)都包含了相應(yīng)的、嚴(yán)格限制帶寬的線性PCM音頻數(shù)據(jù)。子帶的個(gè)數(shù)及相應(yīng)的帶寬是由輸入源的帶寬來(lái)決定的,一般情況下分為32個(gè)獨(dú)立的子帶。</p><p> 相干聲學(xué)編碼器流程圖</p><p> 在每個(gè)子帶中進(jìn)行差分編碼(子帶ADPCM),這一步可以去除信號(hào)中的客觀冗余量,如周期很短的信號(hào)。通過(guò)對(duì)信
29、號(hào)的對(duì)比分析、心理聲學(xué)及信號(hào)瞬態(tài)的分析可以判斷信號(hào)中的感知冗余信息。通過(guò)子帶范圍比特率的選擇和上述分析的結(jié)果,來(lái)調(diào)整對(duì)每個(gè)信號(hào)的差分編碼程序的執(zhí)行。差分編碼與心理聲學(xué)模型(如噪聲掩蔽門限)的結(jié)合可以得到較高的編碼效率,甚至可以在不影響主觀聽覺的基礎(chǔ)上進(jìn)一步降低比特率。如果使用較高的比特率,那么對(duì)于心理聲學(xué)模型的依賴性則相對(duì)較弱但可以肯定隨著比特率的增加編碼信號(hào)的保真度也會(huì)提高。</p><p> 比特指派程序管
30、理著所有音頻聲道中子帶信息的編碼指派和分配。在時(shí)間和頻率上的自適應(yīng)可以優(yōu)化音頻質(zhì)量。作為音頻編碼系統(tǒng)設(shè)計(jì)的基礎(chǔ),比特指派程序通過(guò)對(duì)音頻信號(hào)比特的分配和使用的比特率來(lái)決定音頻質(zhì)量。通過(guò)在編碼策略中獨(dú)立的執(zhí)行這些程序使得運(yùn)算的復(fù)雜程度大大提高,但是這樣做卻可以使得解碼器相對(duì)的簡(jiǎn)單。相反,隨著比特率的增加,比特指派程序的靈活性也將大大降低,但是可以確保音頻質(zhì)量的透明性。</p><p> 編碼過(guò)程中最后一步就是將來(lái)自
31、每個(gè)子帶ADPCM處理后的音頻數(shù)據(jù)進(jìn)行數(shù)據(jù)復(fù)用(或稱打包)。數(shù)據(jù)復(fù)用器將所有聲道中子帶數(shù)據(jù)加上附加的輔助信息進(jìn)行打包,形成特殊數(shù)據(jù)語(yǔ)法格式的編碼數(shù)據(jù)流。在數(shù)據(jù)流中加入的同步信息將用于解碼器對(duì)編碼數(shù)據(jù)流的同步。</p><p><b> MPEG多聲道編碼</b></p><p><b> MPEG-2 BC</b></p>&l
32、t;p> ITU-R工作組在關(guān)于多聲道聲音系統(tǒng)的建議方面進(jìn)行了工作。該項(xiàng)工作的主要成果就是說(shuō)明一個(gè)適當(dāng)?shù)亩嗦暤缆曇襞渲脩?yīng)包含五個(gè)聲道,分別代表左、中央、右、左環(huán)繞、右環(huán)繞聲道。如果使用了一個(gè)作為選項(xiàng)的低頻增強(qiáng)聲道(LFE),則該配置被稱為“5.1”。五聲道配置也可表示為‘3/2’,即三個(gè)前置聲道及兩個(gè)環(huán)繞(后置)聲道。 </p><p> MPEG也認(rèn)識(shí)到應(yīng)根據(jù)ITU-R的建議來(lái)增加音頻標(biāo)準(zhǔn)的多聲道能力
33、的必要性,由此產(chǎn)生了MPEG-2 BC音頻標(biāo)準(zhǔn)。在多聲道聲音方面的擴(kuò)展支持在一路碼流中傳輸五個(gè)輸入聲道、低頻增強(qiáng)聲道以及7個(gè)邊聲道。該擴(kuò)展與MPEG-1保持前向及后向兼容。前向兼容性意味著多聲道解碼器可正確地對(duì)立體聲碼流進(jìn)行解碼。后向兼容性則意味著一個(gè)標(biāo)準(zhǔn)的立體聲解碼器 在對(duì)多聲道碼流進(jìn)行解碼時(shí)可輸出兼容的立體聲信號(hào)。 它是通過(guò)一種真正的可分級(jí)方式實(shí)現(xiàn)的。在編碼器端,五個(gè)輸入聲道被向下混合為一路兼容立體聲信號(hào)。該兼容立體聲信號(hào)按照MPE
34、G-1標(biāo)準(zhǔn)進(jìn)行編碼。所有用于在解碼器端恢復(fù)原來(lái)的五個(gè)聲道的信息都被置于MPEG-1的附加數(shù)據(jù)區(qū)內(nèi),該數(shù)據(jù)區(qū)被MPEG-1解碼器忽略。這些附加的信息在信息聲道T2、T3及T4以及LFE聲道中傳輸,這幾個(gè)信息聲道通常包含中央、左環(huán)繞和右環(huán)繞聲道。MPEG-2多聲道解碼器不但對(duì)碼流中的MPEG-1部分進(jìn)行解碼,還對(duì)附加信息聲道T2、T3、T4及LFE解碼。根據(jù)這些信息,它可以恢復(fù)原來(lái)的5.1聲道聲音。</p><p>
35、 當(dāng)相同碼流饋送至MPEG-1解碼器時(shí),解碼器將只對(duì)碼流的MPEG-1部分進(jìn)行解碼,而忽略所有附加的多聲道信息。由此它將輸出在MPEG-2編碼器中經(jīng)向下混合產(chǎn)生的兩個(gè)聲道。這種方式實(shí)現(xiàn)了與現(xiàn)有的雙聲道解碼器的兼容性。也許更為重要的是,這種可分級(jí)的方式使得即使在多聲道業(yè)務(wù)中仍可使用低成 本的雙聲道解碼器??紤]到所使用的其它所有編碼策略,多聲道業(yè)務(wù)中的雙聲道解碼器本質(zhì)上就是一 個(gè)對(duì)所有聲道進(jìn)行解碼并在解碼器中產(chǎn)生雙聲道向下混合信號(hào)的多聲道
36、解碼器。如圖所示。 </p><p> 就其包含了不同的可由編碼器使用以進(jìn)一步提高音頻質(zhì)量的技術(shù)而言,該標(biāo)準(zhǔn)是具有很大靈活性的。</p><p> MPEG-2 AAC </p><p> AAC可以支持1到48路之間任意數(shù)目的音頻聲道組合、包括15路低頻效果聲道、配音/多語(yǔ)聲聲道,以及15路數(shù)據(jù)。它可同時(shí)傳送16套節(jié)目,每套節(jié)目的音頻及數(shù)據(jù)結(jié)構(gòu)可任意規(guī)定。在
37、碼率為64kbps/聲道的條件下,AAC可以提供很高的聲音質(zhì)量。 </p><p> 為提高音頻編碼效率,AAC采用了許多先進(jìn)技術(shù),如霍夫曼編碼、相關(guān)立體聲、聲道耦合、反向自適應(yīng)預(yù)測(cè)、時(shí)域噪聲整形、修正離散余弦變換(MDCT)、及混合濾波器組等。 </p><p> 其中,濾波器組與MPEG層III所采用的濾波器組相比,由于層III算法在對(duì)濾波器進(jìn)行選擇時(shí)考慮了兼容性問題,因而具有固有
38、的結(jié)構(gòu)上的不足;而AAC則直接采用了MDCT變換濾波。同時(shí),AAC增加了窗口長(zhǎng)度,由1152點(diǎn)增至2048,使MDCT的性能優(yōu)于原來(lái)的濾波器組。 </p><p> 時(shí)域噪聲整形(TNS)技術(shù)是時(shí)域/頻域編碼中一項(xiàng)新穎的技術(shù)。它利用頻域的自適應(yīng)預(yù)測(cè)的結(jié)果來(lái)對(duì)時(shí)域中量化噪聲的分布進(jìn)行整形處理。通過(guò)采用TNS技術(shù),可以使特殊環(huán)境下的話音信號(hào)質(zhì)量得到顯著的提高。 </p><p> 后向自適
39、應(yīng)預(yù)測(cè)是一項(xiàng)在語(yǔ)音信號(hào)編碼系統(tǒng)領(lǐng)域建立起來(lái)的技術(shù)。它主要利用了某一特定形式的音頻信號(hào)易于預(yù)測(cè)的特點(diǎn)。 在量化過(guò)程中,通過(guò)對(duì)量化精度更為精細(xì)的控制,可以使給定的碼率得到更加有效的利用。在碼流復(fù)接時(shí),通過(guò)對(duì)必須傳輸?shù)男畔⑦M(jìn)行熵編碼使冗余度降至最低。 通過(guò)以上各種編碼技術(shù)的運(yùn)用以及采用一種可變的碼流結(jié)構(gòu),使AAC編碼算法在得到大大優(yōu)化的同時(shí), 也為將來(lái)進(jìn)一步提高編碼效率提供了可能性。 </p><p> AC可以在低
40、數(shù)據(jù)率的情況下提供較高質(zhì)量的音頻信息,如每個(gè)聲道僅64kb/s時(shí)就會(huì)有比較好的性能。 AAC當(dāng)前的應(yīng)用主要用于日本的數(shù)字音頻廣播及美國(guó)的IBOC(帶內(nèi)同頻技術(shù))。 </p><p> MPEG Surround</p><p> MPEG Surround把多聲道音頻信號(hào)下混為正常的雙聲道數(shù)字音頻信號(hào)并提取表達(dá)聲像信息的參數(shù),這些參數(shù)在解碼端與雙聲道信號(hào)一起使用,以恢復(fù)出高質(zhì)量的多聲道
41、信號(hào)。以下是它的整體框架圖:</p><p> 圖1 MPEG Surround整體框圖</p><p> 環(huán)繞MPEG編碼過(guò)程可通過(guò)三個(gè)步驟來(lái)描述:對(duì)每一個(gè)音頻通道分解其環(huán)繞信息的參量描述(提取環(huán)繞信息);把各個(gè)通道混合成為單聲道或者立體聲的音頻(下混);混合后的音頻通過(guò)核心音頻編解碼器進(jìn)行編碼并嵌入之前分解得到的環(huán)繞參量。如下是示意圖。</p><p>
42、 在解碼端,混合后的音頻通過(guò)核心編解碼器解碼,并根據(jù)內(nèi)嵌的環(huán)繞信息參量重建完整的多通道信號(hào)。環(huán)繞MPEG數(shù)據(jù)是嵌入在比特流的額外數(shù)據(jù)部分,因此只會(huì)被環(huán)繞MPEG解碼系統(tǒng)所辨認(rèn)。對(duì)應(yīng)于內(nèi)嵌在環(huán)繞MPEG編碼系統(tǒng)內(nèi)部的核心編碼器,其傳統(tǒng)版本的立體聲解碼器會(huì)簡(jiǎn)單地忽略掉環(huán)繞MPEG數(shù)據(jù)去解碼混合后的音頻信號(hào)。下圖分別為僅支持立體聲的解碼端和支持環(huán)繞MPEG的解碼端的示意圖:</p><p> 與BCC直接下混到一個(gè)聲
43、道的方式不同,MPEG Surround實(shí)現(xiàn)的是逐級(jí)下混的方法,采用2至1(One to Two, OTT)和3至2(Two to Three, TTT)兩種基本下混模塊(圖2),最終下混到一個(gè)或兩個(gè)聲道。</p><p> (a)分析 (b) 合成</p><p> 圖2 5.1聲道樹狀結(jié)構(gòu)圖</p><p> 這種樹狀
44、分析和提取的下混結(jié)構(gòu)使得MPEG Surround具有較強(qiáng)的聲道可擴(kuò)展性,可以方便地進(jìn)行5.1、7.1甚至更多聲道的編碼,并且其雙下混聲道還可與當(dāng)前立體聲回放設(shè)備自然融和。此外,MPEG Surround在低碼率下對(duì)合成的空間參數(shù)采用參數(shù)平滑的后處理技術(shù),避免了低碼率下重建聲中聲源位置的跳躍。</p><p> 為適應(yīng)多聲道應(yīng)用,MPEG Surround采用了基于混響濾波器的去相關(guān)技術(shù)首先下混聲道經(jīng)混響濾波器
45、生成統(tǒng)計(jì)獨(dú)立的信號(hào),然后對(duì)它們進(jìn)行加權(quán)求和求出各個(gè)輸出聲道,使它們有給定的相關(guān)度值。該方法在數(shù)學(xué)上模擬了物理上的混響效應(yīng),使合成信號(hào)在聲象的穩(wěn)定性、分布范圍的準(zhǔn)確度和飽滿度方面等方面較BCC有了很大的提高。此外混響去相關(guān)技術(shù)與時(shí)頻域的包絡(luò)整形技術(shù)結(jié)合,降低了合成失真,進(jìn)一步改善了音質(zhì)</p><p> Ogg Vorbis多聲道音頻編碼算法</p><p> Ogg Vorbis編碼特
46、點(diǎn)</p><p> Ogg Vorbis是近年來(lái)由美國(guó)公司Xiph.Org Foundatinn開發(fā)的通用感覺音頻編碼器,其特點(diǎn)是:源碼完全開放、無(wú)專利限制,具有較大編碼靈活性。在高質(zhì)量(高比特率)級(jí)別CD或DAT立體聲,16/24bit量化時(shí),與現(xiàn)在的MPEG-2和MPEG-4等音頻算法相當(dāng); Ogg Vorbis編碼器在沒有重新采樣到低采樣率時(shí),可將CD高質(zhì)量立體聲信號(hào)壓縮到低于48KPs比特率。輸出碼率
47、可設(shè)置為(平均比特率)ABR或(可變比特率)VBR,范圍為16-128Kbps/ch,輸入音頻信號(hào)支持:采樣率8-192kHz;量化分辨率16-24bit量化;聲道數(shù):單聲道、立體聲、4聲道、5.1聲道,最高可支持255獨(dú)立聲道。</p><p> Ogg Vorbis,設(shè)計(jì)成一個(gè)具有心理聲學(xué)模型的復(fù)雜編碼器,但解碼運(yùn)算復(fù)雜度低于MP3。沒有提供幀格式、同步及錯(cuò)誤保護(hù)等,僅僅是接收輸入的音頻數(shù)據(jù)塊,并壓縮成數(shù)據(jù)
48、包方式。解碼器按順序接收元數(shù)據(jù)包,解碼并把音頻幀合成,然后把音頻幀合成原始音頻流。因此Vorbis數(shù)據(jù)包可用于任何能夠提供幀格式、同步、定位及錯(cuò)誤保護(hù)的一個(gè)傳輸機(jī)制,如Ogg (文件傳輸)或RTP(網(wǎng)絡(luò)傳輸)。</p><p> Ogg Vorbis編碼原理</p><p> Vothis編碼過(guò)程的基本過(guò)程如下圖所示,首先對(duì)音頻PCM信號(hào)進(jìn)行穩(wěn)態(tài)/瞬態(tài)分析,決定MDCT(Modifie
49、d Discrete Cosine Transform,改進(jìn)的離散余弦變換)的長(zhǎng)度:同時(shí)原始音頻信號(hào)要進(jìn)行FFT分析。2種變換的的頻譜系數(shù)輸入給心理聲學(xué)模型單元,MDCT系數(shù)用于噪聲掩蔽計(jì)算,F(xiàn)FT結(jié)果用于音調(diào)掩蔽特性計(jì)算,共同構(gòu)造總的掩蔽曲線,然后根據(jù)MDCT系數(shù)及掩蔽曲線,對(duì)頻譜系數(shù)進(jìn)行線性預(yù)測(cè)分析,用LPC線性預(yù)測(cè)系數(shù)表示頻譜包絡(luò)即基底曲線(filoor);或者通過(guò)線性分段逼近方式獲得基底曲線。從MDCT系數(shù)中去掉頻譜包絡(luò)則得到白
50、化的殘差(residue)頻譜,由于殘差頻譜動(dòng)態(tài)范圍明顯變小,從而降低量化誤差。之后要采用聲道耦合技術(shù)(stereo channel coupling)122]進(jìn)一步降低冗余度,耦合主要是將左右聲道數(shù)據(jù)從直角坐標(biāo)映射到平方極坐標(biāo);然后對(duì)白化的殘差信號(hào)以矢量量化VQ的形式表示。最后將要傳輸?shù)母鞣N信息數(shù)據(jù)按vothis定義的包格式組成,形成vorbis壓縮碼流。</p><p> Ogg Vorbis 編碼原理框圖
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 多聲道音頻編碼算法的研究及優(yōu)化.pdf
- 多聲道數(shù)字音頻系統(tǒng)的編碼及應(yīng)用
- 多聲道數(shù)字音頻系統(tǒng)的編碼及應(yīng)用
- 多聲道聲卡如何連接5.1音箱 圖文實(shí)戰(zhàn)教程
- 基于內(nèi)容的多聲道音頻檢索系統(tǒng)開發(fā).pdf
- 基于流媒體的多聲道音頻播放器設(shè)計(jì)與實(shí)現(xiàn).pdf
- 多聲道超聲波氣體流量測(cè)量關(guān)鍵技術(shù)研究.pdf
- 多聲道超聲氣體流量計(jì)的精密測(cè)速技術(shù).pdf
- 多聲道超聲波氣體流量計(jì)信號(hào)處理模塊設(shè)計(jì).pdf
- 多聲道超聲波氣體流量檢測(cè)技術(shù)仿真與實(shí)驗(yàn)研究.pdf
- 多聲道超聲波氣體流量測(cè)量若干問題的研究.pdf
- 多聲道多普勒超聲波污水流量測(cè)量技術(shù)研究.pdf
- 時(shí)差法多聲道氣體超聲波流量計(jì)的研究.pdf
- 多聲道氣體超聲波流量計(jì)場(chǎng)補(bǔ)償關(guān)鍵技術(shù)研究.pdf
- 數(shù)字多聲道環(huán)繞聲技術(shù)在大學(xué)音樂素質(zhì)教育中的應(yīng)用研究.pdf
- 多聲道超聲波流量計(jì)算與流場(chǎng)剖面識(shí)別智能算法.pdf
- 讓多聲道環(huán)繞聲系統(tǒng)走進(jìn)高校藝術(shù)類多媒體教學(xué)課堂的可行性分析.pdf
- 基于過(guò)零檢測(cè)的多聲道氣體超聲波流量計(jì)信號(hào)處理中關(guān)鍵技術(shù)研究.pdf
- 手機(jī)耳機(jī)聲道反了怎么辦?
- 單聲道的歌聲分離方法研究.pdf
評(píng)論
0/150
提交評(píng)論