版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、??收稿日期:20080512修回日期:20080726。??基金項(xiàng)目:上海市自然科學(xué)基金資助項(xiàng)目(04ZR14138)。??作者簡(jiǎn)介:宮云梅(1980)女山東乳山人博士研究生主要研究方向:強(qiáng)噪聲環(huán)境中語(yǔ)音增強(qiáng)算法?趙曉群(1962)男黑龍江依安人教授博士主要研究方向:數(shù)字語(yǔ)音信號(hào)處理、最佳信號(hào)設(shè)計(jì)理論、無(wú)線通信?史仍輝(1981)男山東梁山人博士研究生主要研究方向:最佳信號(hào)設(shè)計(jì)理論、RFID技術(shù)及應(yīng)用。文章編號(hào):10019081(20
2、08)11298103基于語(yǔ)音存在概率和聽(tīng)覺(jué)掩蔽特性的語(yǔ)音增強(qiáng)算法宮云梅趙曉群史仍輝(同濟(jì)大學(xué)電子與信息工程學(xué)院上海200092)(gong_0830@mai.ltongj.iedu.cn)摘?要:低信噪比下譜減語(yǔ)音增強(qiáng)法中一直存在的去噪度、殘留的音樂(lè)噪聲和語(yǔ)音畸變度三者間均衡這一關(guān)鍵問(wèn)題顯得尤為突出。為降低噪聲對(duì)語(yǔ)音通信的干擾提出了一種適于低信噪比下的語(yǔ)音增強(qiáng)算法。在傳統(tǒng)的譜減法基礎(chǔ)上根據(jù)噪聲的聽(tīng)覺(jué)掩蔽閾值自適應(yīng)調(diào)整減參數(shù)利用語(yǔ)音存在
3、概率對(duì)語(yǔ)音、噪聲信號(hào)估計(jì)避免低信噪比下端點(diǎn)檢測(cè)(VAD)的不準(zhǔn)確有更強(qiáng)的魯棒性。對(duì)算法進(jìn)行了客觀和主觀測(cè)試結(jié)果表明:相對(duì)于傳統(tǒng)的譜減法在幾乎不損傷語(yǔ)音清晰度的前提下該算法能更好地抑制殘留噪聲和背景噪聲特別是對(duì)低信噪比和非平穩(wěn)噪聲干擾的語(yǔ)音信號(hào)效果更加明顯。關(guān)鍵詞:語(yǔ)音增強(qiáng)譜減法語(yǔ)音存在概率聽(tīng)覺(jué)掩蔽特性中圖分類號(hào):TN912.3TP391??文獻(xiàn)標(biāo)志碼:ASpeechenhancementbasedonspeech?presencepro
4、babilityauditymaskingpropertyGONGYun?meiZHAOXiao?qunSHIReng?hui(CollegeofElectronicsInfmationEngineeringTongjiUniversityShanghai201804China)Abstract:InlowSignaltoNoiseRatio(SNR)environmentthetrade?offamongtheamountofnois
5、ereductionthelevelofmusicalresidualnoisethespeechdisttionwasthekeyproblemofspectralsubtractionspeechenhancement.AnimprovedspeechenhancementalgithmflowSNRwasdevelopedindertodecreasetheinterferenceofnoiseonpurespeech.Thisa
6、lgithmwasbasedonthetraditionalspectralsubtractionthesubtractionparameterwasself?adaptivelyadjustedinthelightofthemaskingpropertiesofhumanaudity.Thespeech?presenceprobabilitywasintegratedtoestimatethesignalnoisewhichwould
7、avoidtheinaccuracyofutilizingVoiceActivityDetection(VAD)increasetherobustness.Theexperimentalresultsdemonstratethatthisalgithmiseffectivetoreducetheresidualnoisethebackgroundnoisebutnottodisttthespeecharticulationcompare
8、dtoothermodifiedspectralsubtractionalgithmsespeciallyfthelowSNRnoisyspeechsignalthatbeingdegradedbynon?stationarynoise.Keywds:speechenhancementspectralsubtractionspeech?presenceprobabilityauditymaskingproperty??噪聲的干擾不僅會(huì)降
9、低語(yǔ)音通信的質(zhì)量而且也會(huì)使基于特征參數(shù)提取的語(yǔ)音處理系統(tǒng)(如低速率語(yǔ)音編碼、語(yǔ)音識(shí)別等)性能下降語(yǔ)音增強(qiáng)方法眾多譜減法由于其簡(jiǎn)單有效性已為許多實(shí)際數(shù)字語(yǔ)音處理系統(tǒng)所采用。但是由于噪聲與語(yǔ)音信號(hào)在頻域中的重疊特性在消除噪聲提高語(yǔ)音信號(hào)的信噪比的同時(shí)必然會(huì)引起原始語(yǔ)音信號(hào)的失真。常規(guī)譜減法還會(huì)產(chǎn)生較強(qiáng)的殘留音樂(lè)噪聲如何兼顧去噪度噪聲殘留和減少語(yǔ)音失真是不少學(xué)者致力研究的課題。噪聲估計(jì)是語(yǔ)音增強(qiáng)算法中關(guān)鍵的部分文獻(xiàn)[1]提出采用最優(yōu)平滑和語(yǔ)音
10、存在條件概率對(duì)噪聲進(jìn)行估計(jì)在低信噪比和非平穩(wěn)噪聲的情況下該方法明顯優(yōu)于其他的噪聲估計(jì)。文獻(xiàn)[2]最早提出基于語(yǔ)音概率估計(jì)的譜減算法不需語(yǔ)音激活檢測(cè)(VoiceActivityDetectionVAD)。在給出VAD估計(jì)噪聲的基礎(chǔ)上文獻(xiàn)[3~8]將語(yǔ)音存在概率引入到各種增強(qiáng)算法語(yǔ)音增強(qiáng)效果顯著改善但是對(duì)噪聲突然上升時(shí)[6]或者噪聲突然下降時(shí)[5]的估計(jì)存在較大的延時(shí)性?;诼?tīng)覺(jué)掩蔽特性調(diào)整減參數(shù)[9]改進(jìn)增強(qiáng)算法能提高語(yǔ)音的清晰度減少語(yǔ)音
11、的畸變度。文中結(jié)合語(yǔ)音存在概率利用人類聽(tīng)覺(jué)系統(tǒng)的掩蔽特性有選擇性地進(jìn)行譜減從而較好地兼顧了去噪度噪聲殘留和減少語(yǔ)音失真。通過(guò)比較文獻(xiàn)[3]改進(jìn)的對(duì)數(shù)譜最小均方誤差估計(jì)(MinimumMeanSquareErrLog?SpectralAmplitudeMMSE?LSA)算法本文提出的算法從主觀和客觀評(píng)價(jià)性能要更好。1?語(yǔ)音增強(qiáng)算法一幀語(yǔ)音信號(hào)時(shí)域和改為快速傅立葉變換(FastFourierTransfmFFT)變換的頻域表示:yl(n)=
12、xl(n)dl(n)1?n?NYlk=XlkDlk(1)其中:xl(n)dl(n)yl(n)分別表示第l幀第n樣本點(diǎn)的純凈語(yǔ)音信號(hào)、加性噪聲和帶噪語(yǔ)音信號(hào)XlkDlkYlk分別表示xl(n)dl(n)yl(n)的第l幀第k個(gè)頻譜分量通常xl(n)和dl(n)不相關(guān)所以有:E[Ylk2]=E[Xlk2]E[Dlk2](2)再設(shè)?X(lk)=E[|Xlk|2]和?D(lk)=E[|Dlk|2]分別表示xl(n)和dl(n)的第l幀第k個(gè)頻譜
13、分量的功率譜??梢酝ㄟ^(guò)語(yǔ)音端點(diǎn)檢測(cè)算法檢測(cè)到的語(yǔ)音間歇段的統(tǒng)計(jì)平均得到?D(lk)。對(duì)于分析幀內(nèi)的短時(shí)平穩(wěn)過(guò)程可以得到原始語(yǔ)音的幅度譜的估計(jì)值:第28卷第11期2008年11月?計(jì)算機(jī)應(yīng)用ComputerApplications?Vo.l28No.11Nov.200810lge(?b)=15.817.5(?b0.474)17.51(?b0.474)2?(dB)(23)3)計(jì)算Bark頻帶上的擴(kuò)展頻譜。時(shí)域一幀帶噪語(yǔ)音信號(hào)y(n)經(jīng)過(guò)快速
14、傅立葉變換(FFT)變成頻域信號(hào)Y(k)利用式(4)對(duì)語(yǔ)音信號(hào)進(jìn)行粗估計(jì)得語(yǔ)音信號(hào)X(k)功率譜為:P(k)=X(k)2(24)其中X(k)為X(k)的幅度譜。計(jì)算每一段的能量即:Bb=%khbk=klbp(k)(25)其中:Bb表示第b帶的能量klb和khb分別為b段的離散頻帶的下限和上限。Bb與e(?b)相互卷積就可以得到Bark頻域擴(kuò)展譜Cb即:Cb=e(?b)?Bb=%m=bmaxm=1e(bm)B(m)1?b?bmax(26)
15、其中bmax為臨界帶個(gè)數(shù)取決于時(shí)域信號(hào)的采樣頻率。4)噪聲掩蔽閾值的計(jì)算。有兩種噪聲掩蔽門限:一種是純音掩蔽噪聲(ToneMaskingNoiseTMN)是在Cb下面(14.5b)dB另一種是噪聲掩蔽純音(NoiseMaskingToneNMT)是在Cb下面5.5dB。計(jì)算每一幀的各個(gè)Bark臨界頻帶掩蔽閾值的偏移量Ob:Ob=%(14.5b)(1%)5.5(27)其中:%=minSFMdBSFMdBmax1定義為音調(diào)系數(shù)SFMdB=1
16、0logGmAm反映信號(hào)頻譜平滑程度定義為每個(gè)頻帶信號(hào)功率譜的幾何平均值Gm和算術(shù)平均值A(chǔ)m之比SFMdBmax為一個(gè)經(jīng)驗(yàn)值大小為60dB表示只存在純音信號(hào)的掩蔽效應(yīng)情況。由于噪聲和音調(diào)的掩蔽特性不同可以通過(guò)%的數(shù)值來(lái)判斷這個(gè)信號(hào)是偏噪聲的還是偏語(yǔ)音的:當(dāng)%=0完全是噪聲%=1完全是純音。實(shí)際語(yǔ)音信號(hào)既非噪聲又非純音%介于兩者之間。則噪聲掩蔽閾值為:Tb=10lgCb0.1Ob(28)5)聽(tīng)覺(jué)掩蔽閾值的計(jì)算。Tb映射到各個(gè)頻譜上才能進(jìn)行
17、后續(xù)工作則最終的對(duì)應(yīng)在各個(gè)頻譜上的掩蔽閾值記為Tk。把得到各個(gè)頻譜上的掩蔽閾值記為Tk與絕對(duì)聽(tīng)覺(jué)閾值比較較大的一個(gè)即為要求的聽(tīng)覺(jué)掩蔽閾值得到聽(tīng)覺(jué)掩蔽閾值:Thear(k)=max(TqTk)(29)2?實(shí)驗(yàn)結(jié)果及分析通過(guò)對(duì)多種不同的噪聲環(huán)境下不同程度輸入信噪比([105]dB)的帶噪語(yǔ)音信號(hào)利用文中改進(jìn)的增強(qiáng)算法進(jìn)行去噪處理然后從客觀評(píng)價(jià)標(biāo)準(zhǔn)的分段信噪比(segmentalSNR)和語(yǔ)譜圖兩種方法分析增強(qiáng)后的語(yǔ)音信號(hào)。這里選用Noise
18、x92噪聲庫(kù)的三種噪聲:高斯白噪聲M109坦克噪聲F16噪聲。并將本文中提出的算法和文獻(xiàn)[3]的改進(jìn)MMSE?LS算法相比較。幀的分段信噪比:SNRseg=1L%L1l=010lg%N1n=0x(lNn)2%N1n=0[x(lNn)x^(lNn)]2(30)L帶噪語(yǔ)音信號(hào)幀的個(gè)數(shù)N是每幀未重疊的點(diǎn)數(shù)。表1展示出了在三種不同噪聲環(huán)境下對(duì)從10到5dB輸入信噪比的帶噪信號(hào)的平均分段信噪比的改進(jìn)度。顯然本文算法的分段信噪比的改進(jìn)度比文獻(xiàn)[3]
19、改進(jìn)的MMSE?LS改進(jìn)度大特別是對(duì)于低信噪比環(huán)境下的非平穩(wěn)噪聲。考慮到信噪比客觀評(píng)價(jià)標(biāo)準(zhǔn)無(wú)法很好評(píng)價(jià)增強(qiáng)語(yǔ)音中的殘余噪聲下面給出了兩種增強(qiáng)算法對(duì)比實(shí)驗(yàn)的語(yǔ)譜圖。我們給出輸入分段信噪比是10dB情況下在純凈語(yǔ)音上疊加的M109坦克噪聲的語(yǔ)譜圖。圖1(a)為干凈原始語(yǔ)音信號(hào)相應(yīng)的語(yǔ)譜圖圖1(b)為原始語(yǔ)音上疊加M109坦克噪聲。圖1(c)為文獻(xiàn)[3]提出改進(jìn)MMSE?LS算法的實(shí)驗(yàn)結(jié)果能最大限度地去除音樂(lè)噪聲但是所引入的語(yǔ)音畸變度也最大對(duì)
20、語(yǔ)音的損傷在高頻部分也比較明顯。圖1(d)是本文算法的實(shí)驗(yàn)結(jié)果可以看出增強(qiáng)語(yǔ)音背景噪聲小語(yǔ)音起始段和靜音段增強(qiáng)效果比較好同時(shí)語(yǔ)音失真小。表1?各噪聲環(huán)境下分段信噪比的改進(jìn)度輸入信噪比dB高斯白噪聲改進(jìn)的MMSE?LS本文算法M109坦克噪聲改進(jìn)的MMSE?LS本文算法F16噪聲改進(jìn)的MMSE?LS本文算法55.217.454.287.215.057.6708.8710.317.239.417.499.40511.2013.408.671
21、0.988.6010.341012.1916.239.6412.389.2412.653?結(jié)語(yǔ)本文采用隨時(shí)頻變化的平滑因子和語(yǔ)音存在條件概率對(duì)每幀信號(hào)進(jìn)行有效的噪聲估計(jì)提出了一種改進(jìn)的語(yǔ)音增強(qiáng)算法通過(guò)利用噪聲頻譜的Guass統(tǒng)計(jì)模型噪聲幅度譜的Rayleigh模型最小控制遞歸平均(MinimaControlledRecursiveAveragingMCRA)估計(jì)的先驗(yàn)信噪比人耳掩蔽特性以及語(yǔ)音存在概率模型對(duì)傳統(tǒng)的譜減算法進(jìn)行了修正。語(yǔ)音
22、存在概率能夠保留最多的語(yǔ)音成分的同時(shí)也將噪聲譜盡可能地保持在聽(tīng)覺(jué)掩蔽閾值之下。從主觀聽(tīng)覺(jué)上感受到更小的語(yǔ)音畸變和更少的可聽(tīng)聞殘留噪聲和音樂(lè)噪聲并且能夠大幅度提高去噪后語(yǔ)音信號(hào)的信噪比使整個(gè)譜減語(yǔ)音增強(qiáng)系統(tǒng)相對(duì)其他改進(jìn)譜減法能夠較優(yōu)化地在殘余噪聲度、音樂(lè)噪聲度以及語(yǔ)音信號(hào)畸變度之間取得折中。圖1?帶噪語(yǔ)音經(jīng)過(guò)兩種算法增強(qiáng)后的語(yǔ)譜圖參考文獻(xiàn):[1]?SUNDARRIAJANRLOIZOUPC.Anoise?estimationalgithm
23、fhighlynon?stationaryenvironments[J].SpeechCommunication2006(48):220231.[2]?MCACLAYRJMALPASSML.Speechenhancementusingasoft?decisionnoisesuppressionfilter[J].IEEETransactionsonAcous?ticsSpeechSignalProcessing198028(2):137
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于聽(tīng)覺(jué)掩蔽效應(yīng)的語(yǔ)音增強(qiáng)算法研究.pdf
- 基于小波變換和聽(tīng)覺(jué)掩蔽特性的語(yǔ)音增強(qiáng)算法的研究.pdf
- 基于人耳聽(tīng)覺(jué)掩蔽效應(yīng)的語(yǔ)音增強(qiáng)的研究.pdf
- 基于聽(tīng)覺(jué)掩蔽效應(yīng)的小波包語(yǔ)音增強(qiáng)方法研究.pdf
- 基于約束方差噪聲譜估計(jì)和聽(tīng)覺(jué)掩蔽效應(yīng)的語(yǔ)音增強(qiáng).pdf
- 基于聽(tīng)覺(jué)特性的語(yǔ)音增強(qiáng)算法研究.pdf
- 基于人耳掩蔽效應(yīng)的語(yǔ)音增強(qiáng)算法研究.pdf
- 基于噪聲估計(jì)和掩蔽效應(yīng)的語(yǔ)音增強(qiáng).pdf
- 基于統(tǒng)計(jì)模型和掩蔽效應(yīng)的語(yǔ)音增強(qiáng).pdf
- 基于聽(tīng)覺(jué)特性及語(yǔ)譜特性的語(yǔ)音增強(qiáng).pdf
- 基于聽(tīng)覺(jué)掩蔽效應(yīng)的音頻水印算法的改進(jìn)與研究.pdf
- 基于聽(tīng)覺(jué)特性的電子耳蝸語(yǔ)音增強(qiáng)的研究.pdf
- 基于聽(tīng)覺(jué)掩蔽效應(yīng)的數(shù)字助聽(tīng)器算法研究及DSP的實(shí)現(xiàn).pdf
- 基于計(jì)算聽(tīng)覺(jué)場(chǎng)景分析的語(yǔ)音增強(qiáng).pdf
- 基于信號(hào)稀疏特性的語(yǔ)音增強(qiáng)算法研究.pdf
- 基于聽(tīng)覺(jué)掩蔽效應(yīng)的客觀音質(zhì)評(píng)價(jià)研究.pdf
- 基于二值掩蔽和感知小波包變換的語(yǔ)音增強(qiáng)研究.pdf
- 聽(tīng)覺(jué)特性與魯棒語(yǔ)音識(shí)別算法研究.pdf
- 窄帶語(yǔ)音通信中語(yǔ)音增強(qiáng)算法和實(shí)現(xiàn)研究.pdf
- 基于語(yǔ)音增強(qiáng)的語(yǔ)音活動(dòng)檢測(cè)算法研究.pdf
評(píng)論
0/150
提交評(píng)論