聲音心理學(xué)模型_第1頁
已閱讀1頁,還剩29頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、主要內(nèi)容,1.聽覺模型2.M-PEAG1心理聲學(xué)模型結(jié)構(gòu)3.仿真結(jié)果4.關(guān)于后期工作的想法5.總結(jié),1.聽覺模型,1.1 人耳聽覺模型(HAS)1.2 人耳生理系統(tǒng)和臨界頻段1.3 安靜狀態(tài)閾值和掩蔽,1.聽覺模型,人耳對(duì)于頻率的感知 呈對(duì)數(shù)規(guī)律的;會(huì)產(chǎn)生出差頻;人耳生理系統(tǒng)和臨界頻段 臨界頻段=24.7(4.37F+1)有調(diào)成分和無調(diào)成分 當(dāng)音調(diào)間的頻率差大于臨界頻段時(shí),就是一般的和音;而當(dāng)頻率差小于

2、臨界頻段時(shí),就成為不諧和音Bark 感知頻率的單位,1 個(gè)臨界頻段的寬度為 1Bark。使用 Bark 來標(biāo)度,需要將物理頻率轉(zhuǎn)化為心理聲學(xué)頻率。這樣,一個(gè)純音就可以用心理掩蔽曲線來表示。,1.聽覺模型,安靜狀態(tài)閾值 安靜狀態(tài)閾值曲線表示了在給定頻率上,人耳能夠聽到聲音的最小聲壓級(jí)。0dB 時(shí)的閾值為 1kHz。人耳在 1~5kHz 的范圍內(nèi)最為敏感,可以聽到低于 0dB 參考值幾個(gè)分貝的信號(hào)。一般而言,兩個(gè)相同能量不

3、同頻率的信號(hào),聽起來是不一樣的。類似的,能夠聽到的噪聲和失真也隨頻率而改變。在太高或太低的頻率處,聽覺的靈敏度也會(huì)下降。,1.聽覺模型,掩蔽閾值 掩蔽閾值是指幾乎聽不到聲音的聲壓級(jí)。當(dāng)同時(shí)有好幾個(gè)音調(diào)時(shí),當(dāng)高音調(diào)完全掩蓋低音調(diào)時(shí),就會(huì)出現(xiàn)掩蔽。掩蔽的一般性介紹 掩蔽的分類:同時(shí)掩蔽; 異時(shí)掩蔽 掩蔽的特點(diǎn):利用聲調(diào)的強(qiáng)弱; 利用人腦的反應(yīng)延遲,2.M-PEAG1心理聲學(xué)模型結(jié)構(gòu),2.1 譜計(jì)算2.2 聲壓級(jí)測

4、定2.3 安靜狀態(tài)閾值2.4 判決有調(diào)和無調(diào)2.5 有調(diào)和無調(diào)成分的抽取2.6 單獨(dú)掩蔽閾值的計(jì)算2.7 總體掩蔽閾值的計(jì)算,2.1 譜計(jì)算,進(jìn)行512點(diǎn)的FFT計(jì)算。FFT是直接對(duì)輸入PCM信號(hào)加海寧窗后進(jìn)行的。海寧窗h(i)和功率譜X(k)的計(jì)算公式分別為:,2.2 聲壓級(jí)的測定,子帶n中的聲壓級(jí)的計(jì)算公式如下 :,2.3 安靜狀態(tài)閾值,安靜閾值也稱絕對(duì)閾值,它依賴于信號(hào)的抽樣頻率,由經(jīng)驗(yàn)得出。對(duì)應(yīng)計(jì)算掩蔽閾值頻率范圍中的

5、每個(gè)樣點(diǎn),根據(jù)總體比特率補(bǔ)償絕對(duì)閾值,對(duì)于比特率≥96kbit/s,補(bǔ)償值為12dB,對(duì)于比特率<96kbit/s,補(bǔ)償值為0dB。下圖1給出了樣本音頻信號(hào)的安靜狀態(tài)閾值。,2.3 安靜狀態(tài)閾值,2.4 判決有調(diào)和無調(diào)成分,一個(gè)掩蔽成分的可調(diào)性影響到掩蔽閾值,因此必須判定有調(diào)與無調(diào)成分。為了計(jì)算總掩蔽閾值,必須從FFT頻譜中得出有調(diào)和無調(diào)成分。首先決定局部最大值,然后提取有調(diào)成分(正弦波),以及計(jì)算一個(gè)臨界頻段頻率范圍內(nèi)無調(diào)成分的

6、強(qiáng)度。下圖2給出了樣本音頻信號(hào)局部最大值的確定,圖中帶圈的成分為局部最大值成分。,2.4 判決有調(diào)和無調(diào)成分,2.4 判決有調(diào)和無調(diào)成分,而臨界頻段的頻寬隨著中心頻率變化,低頻時(shí)大約0.1kHz頻寬,高頻時(shí)大約4kHz頻寬。從心理聲學(xué)實(shí)驗(yàn)可以知道,耳朵的低頻分辨率比高頻分辨率好。為了決定某個(gè)局部最大值是否可能是有調(diào)成分,還必須了解局部最大值所處頻率處臨界頻段的頻寬df。在不同的頻率段所用的頻寬是事先規(guī)定的: df =172.26

7、6Hz,0kHz < f ≤5.512kHz df =281.25Hz, 5.512kHz < f ≤11.024kHz df =562.50Hz, 11.024kHz < f ≤19.982kHz,2.4 判決有調(diào)和無調(diào)成分,綜上所述,要列出譜線X(k)是有調(diào)或是無調(diào),需執(zhí)行以下三個(gè)運(yùn)算: 標(biāo)明局部最大值。 列出有調(diào)成分并計(jì)算聲壓級(jí).列出無調(diào)成分并計(jì)算功率.下面的圖3和圖4依次顯示了有調(diào)和無調(diào)

8、成分的讀取。,2.4 判決有調(diào)和無調(diào)成分,2.4 判決有調(diào)和無調(diào)成分,2.5 有調(diào)和無調(diào)掩蔽成分的抽取,抽取是用來減少掩蔽成分?jǐn)?shù)目的步驟,它是計(jì)算綜合掩蔽閾值時(shí)必須考慮的問題。只要有調(diào)成分的X(k)之間滿足小于0.5Bark的寬度,就可以抽取這樣的有調(diào)成分。方法是列出有調(diào)成分,在臨界頻段范圍內(nèi)采用0.5Bark寬度的滑動(dòng)窗,若窗內(nèi)存在兩個(gè)或更多的成分,僅保持窗內(nèi)最高功率的成分,移去所有較小功率的成分。圖5和圖6給出了樣本音頻信號(hào)有調(diào)成分

9、、無調(diào)成分和安靜狀態(tài)閾值的比較。,2.5 有調(diào)和無調(diào)掩蔽成分的抽取,2.5 有調(diào)和無調(diào)掩蔽成分的抽取,2.6 單獨(dú)掩蔽閾值的計(jì)算,通常在所有的N/2個(gè)頻率樣點(diǎn)的譜線中,僅僅只有其中一部分頻率樣點(diǎn)的譜線用于綜合掩蔽閾值計(jì)算。在最低頻的6個(gè)子帶的頻域范圍內(nèi)的譜線不考慮進(jìn)行下采樣;接著6個(gè)子帶的頻域范圍內(nèi)的譜線,每隔1個(gè)譜線考慮進(jìn)行下采樣;剩余的最高頻處的18個(gè)子帶的頻域范圍內(nèi)的譜線,每隔4個(gè)譜線考慮進(jìn)行下采樣。將所有考慮進(jìn)行下采樣的譜線進(jìn)行

10、下采樣,下采樣的樣點(diǎn)數(shù)n=106。,2.6 單獨(dú)掩蔽閾值的計(jì)算,對(duì)于這108個(gè)樣點(diǎn),經(jīng)驗(yàn)給定對(duì)應(yīng)的譜值。對(duì)每個(gè)序號(hào)為k有調(diào)無調(diào)成分,選擇最接近其譜值X(k)的106樣點(diǎn)譜值中的某個(gè)樣點(diǎn),將該成分序號(hào)令為i,i∈{1,2,3,...,106}。j為所有有調(diào)、無調(diào)成分在抽取后的譜線序號(hào)。有調(diào)和無調(diào)的單獨(dú)掩蔽閾值分別由下式計(jì)算:,,,2.6 單獨(dú)掩蔽閾值的計(jì)算,2.6 單獨(dú)掩蔽閾值的計(jì)算,2.7 總體掩蔽閾值的計(jì)算,第i個(gè)頻率樣點(diǎn)的總掩蔽閾值

11、LTg(i)是由序號(hào)為j的所有有調(diào)無調(diào)掩蔽成分的單獨(dú)掩蔽閾值LTtm[z(j),z(i)] 、LTnm[z(j),z(i)]和安靜狀態(tài)閾值LTq(i)求出的,把相應(yīng)于單獨(dú)掩蔽閾值的功率和安靜狀態(tài)閾值的功率相加可求得總掩蔽閾值:其中,有調(diào)掩蔽成分總數(shù)為m,無調(diào)掩蔽成分總數(shù)為n。圖9給出了樣本音頻信號(hào)的總體掩蔽閾值,即圖中黑色的虛線。,2.7 總體掩蔽閾值的計(jì)算,3.仿真結(jié)果,仿真文件選擇:1-5.wav仿真數(shù)據(jù)截取:總體掩蔽閾值,4.關(guān)

12、于后期工作的想法,基于心理聲學(xué)模型的音頻數(shù)據(jù)隱藏方案: 利用宿主音頻信號(hào)的心理學(xué)模型得到的掩蔽閾值,對(duì)偽隨機(jī)序列調(diào)制后的隱藏消息進(jìn)行頻域掩蔽,將掩蔽后的偽隨機(jī)消息嵌入宿主音頻。利用偽隨機(jī)信號(hào)的相關(guān)性思路的結(jié)合,5.總結(jié),心理聲學(xué)模型的優(yōu)缺點(diǎn) 采用以宿主音頻信號(hào)本身的頻域掩蔽效應(yīng)來調(diào)制隱藏的偽隨機(jī)序列,因此被隱藏的偽隨機(jī)序列是基于宿主音頻信號(hào)內(nèi)容的,嵌入后具有良好的聽覺不可感知性.但是在變換域中的抗攻擊能力較弱.,5.總

13、結(jié),信息隱藏技術(shù)的展望 利用數(shù)字化媒體進(jìn)行信息隱藏是一個(gè)嶄新的研究領(lǐng)域,在應(yīng)用需求的刺激下得到了迅速的發(fā)展,使其能夠橫跨數(shù)字信號(hào)處理、圖像處理、語音處理、模式識(shí)別、數(shù)字通信、多媒體技術(shù)、密碼學(xué)等多個(gè)學(xué)科,盡管在目前還沒形成完整的理論體系,但由于它是一項(xiàng)與具體應(yīng)用十分密切的實(shí)用技術(shù),隨著數(shù)字化和網(wǎng)絡(luò)化的發(fā)展,其應(yīng)用價(jià)值會(huì)越發(fā)突出。信息隱藏系統(tǒng)的幾個(gè)基本特性之間存在著相互矛盾的一面,例如:隱藏?cái)?shù)據(jù)量和隱藏信息免疫能力之間,不易察覺性

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論