hrtf庫的模式選擇、一種基于頭相關(guān)傳輸函數(shù)線性插值vr音頻方法、人工混響模式_第1頁
已閱讀1頁,還剩8頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、GB/T XXXXX.3—XXXX98附 錄 A(資料性)HRTF 庫的模式選擇A.1 簡介虛擬現(xiàn)實音頻技術(shù)將用到 HRTF,HRTF 可將無方位感的單聲道音頻信號經(jīng)濾波得到左右兩路音頻信號,這個雙聲道立體聲信號將體現(xiàn)聲音的方位感。A.2 可供參考的HRTF目前, 國際上公開的HRTF數(shù)據(jù)庫主要采用AES協(xié)會在AES69-2020標準中規(guī)定的SOFA格式進行存儲, 下面的鏈接中提供了相應(yīng)的下載信息和相應(yīng)讀取方式, 其中數(shù)據(jù)庫包括實際人頭

2、測量、假人頭測量、含房間混響等的 HRTF 數(shù)據(jù)庫:https://www.sofaconventions.org/mediawiki/index.php/SOFA_(Spatially_Oriented_Format_for_Acoustics)下方鏈接為 22.2 聲道測量的雙耳房間脈沖響應(yīng)的下載信息:https://github.com/IoSR-Surrey/IoSR_ListeningRoom_BRIRs注:SOFA 只是一種

3、文件格式,使用該形式提供的 HRTF 數(shù)據(jù)庫時需審閱對應(yīng) HRTF 庫的 license 文件,如網(wǎng)站上的 HUTUBS 數(shù)據(jù)庫采取 Attribution 4.0 International (CC BY 4.0),chedar 數(shù) 據(jù) 庫 采 取 Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA4.0),使用時需自行評估 license 相關(guān)條款。

4、22.2 聲道測量的雙耳房間脈沖響應(yīng) license 為 Attribution 4.0 International (CC BY 4.0)。由于鏈接涵蓋了這些信息,附錄 A 無需重復(fù)陳述。A.3 HRTF 使用方案一般在 HRTF 數(shù)據(jù)庫儲存 HRIR 數(shù)據(jù),即 HRTF 的時域表達形式,可視作沖激響應(yīng)。使用時可根據(jù)需要讀取對應(yīng)角度的 HRIR 數(shù)據(jù),與輸入的 PCM 碼流做卷積。根據(jù)計算能力和延時方面出發(fā)考慮, 應(yīng)結(jié)合具體使用場景以

5、及具體 HRIR 來調(diào)整使用方案,如采用對 HRIR 拖尾做一定的截斷,不使用 HRIR 前端的廢數(shù)據(jù)等方法。A.4 HRTF和附錄C中采樣混響的使用方案由于 HRTF 的時域形式 HRIR 和采樣混響 IR 在本質(zhì)上都是沖擊響應(yīng),所以使用上可以采用兩種方案:1. 將 HRTF 的時域模式 HRIR 和采樣混響 IR 先做卷積得到一個更長的 FIR 濾波器,然后用此濾波器跟輸入信號做快速卷積, 先集成的好處是可以湊夠較長的序列然后便于做

6、快速卷積。2. HRTF 和采樣混響分開,即先經(jīng)過 HRTF 處理再送入采樣混響。這樣分步驟比較適合運動場景以及多路聲音的處理。比如多路聲音先經(jīng)各自不同的 HRTF 處理,然后混音,再送入采樣混響, 而不是各自都經(jīng)過較長的, HRIR 卷積上采樣混響 IR 后的序列, 再混音。GB/T XXXXX.3—XXXX100附 錄 B(資料性)一種基于頭相關(guān)傳輸函數(shù)線性插值的 VR 音頻方法B.1 概述附錄 B 提供了一種頭相關(guān)傳輸函數(shù)(HRT

7、F)的線性插值方法,用來預(yù)測空間未知位置的 HRTF,提高 HRTF 數(shù)據(jù)的空間分辨率。通過對待輸入的單路音頻進行空間定位渲染,最終通過耳機回放具有空間方位感的音頻。B.2 技術(shù)框架附錄 B 采用基于最小相位估計與計算雙耳時間差(ITD)的 HRTF 幅值線性插值方法,預(yù)測得到了分辨率更高的可以用來進行音頻實時渲染的 HRTF 數(shù)據(jù)庫(360 個方向,間隔 1度), 考慮到應(yīng)用場景里需要實現(xiàn)任意方向音頻的實時渲染, 因此需要算法復(fù)雜度和

8、時間復(fù)雜度都比較低,插值渲染算法的技術(shù)框架如圖 B.1 所示。(1)首先提取 HRTF 的幅值信息,通過線性插值的方法得到未知位置的 HRTF 幅值大小。 然后利用 HRTF 幅值與最小相位的希爾伯特變換關(guān)系得到最小相位信息, 補全未知位置的 HRTF,最后反傅里葉變換得到 HRIR,存儲所有空間方向的 HRIR 組成一個數(shù)據(jù)庫。(2)以上得到的最小相位信息不能直接反映原始相位中的雙耳時間差(ITD),因此附錄 B 采用左右耳互相關(guān)的方

9、法計算得到 ITD,并在立體聲還原過程中補充預(yù)測得到的左右耳延時大小,形成完整的延時定位信息。圖 B.1 基于 HRTF 線性插值的三維音頻定位渲染技術(shù)框架B.3 基于幅值線性插值與最小相位估計的HRTF預(yù)測原理首先通過公式(B.1)能夠得到相鄰間隔 1 度的任意水平方位角的 HRTF 幅值大小,但是要得到完整的 HRIR 需要補充相位信息。相位中包含有對應(yīng)時域 HRIR 的雙耳時延,幅值里面包含的 ILD 與相位中體現(xiàn)的 ITD 信息

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論