Techniques for Enhancemant of Noisy Speech in Adverse Environments.pdf_第1頁
已閱讀1頁,還剩61頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、近年來,針對受加性噪聲污染的語音信號進行語音增強的研究備受關(guān)注。在這些語音增強系統(tǒng)的設(shè)計過程中主要有兩個部分:干凈語音譜估計和噪聲譜估計。本論文著重解決這兩個問題。
   本論文的第一個貢獻是提出了一種改進的語音增強技術(shù)。該技術(shù)基于語音信號對數(shù)幅度譜的最小均方誤差估計(MMSE-LSA)和一種有效的先驗無語音概率(SAP)估計。先驗無語音概率是本文改進MMSE-LSA的必要組成部分。不少基于LSA估計的語音增強方法要么直接采用一

2、個較小的固定值作為先驗SAP,要么采用一個較小的固定值作為先驗SAP的參數(shù)。由于先驗無語音概率的計算受到純噪聲段的影響,因此使用一個固定值來計算先驗SAP的方法就顯得不適合、不優(yōu)良。更好的方法是使用動態(tài)的參數(shù)來計算先驗SAP,這樣就可以在每一幀中對其進行更新。這篇文章中,我們提出了兩個和先驗SAP計算有關(guān)的動態(tài)因子:一個平滑更新因子以及一個與第k個譜成分相關(guān)的因子。平滑更新因子取決于頻帶語音信號存在與否的判決,具體的計算方式是對之前的先

3、驗SAP遞歸取平均值。而與第k個譜成分相關(guān)的因子則依賴于先驗信噪比(SNR)。判斷一個頻率帶中是否存在語音信號是通過計算和比較帶噪語音譜的條件概率來實現(xiàn)的。我們采用了兩種客觀評價方法和語譜圖來對所提算法進行性能評估。實驗結(jié)果表明,不管是語音質(zhì)量、背景噪聲的消除還是語音失真的數(shù)量,該算法都有顯著的優(yōu)越性。
   本論文的第二個貢獻是為嘈雜環(huán)境下的噪聲估計提出了一種替代方法。算法是基于一個追蹤最小噪聲語音的最優(yōu)方法。本算法通過連續(xù)的

4、求解帶噪語音的過去頻譜值均值和一個在語音存在段用來控制噪聲譜估計更新的平滑更新因子來實現(xiàn)的。動態(tài)平滑更新因子是基于頻率帶是否存在語音信號的判決來計算得到的。區(qū)別語音存在和不存在則是通過計算出帶噪語音能量譜和相應(yīng)局部最小值的差值來判斷的。與其它方法不同的是,我們的算法不需要明確使用語音存在概率來完成計算。評估所提出的算法用到了NOIZEUS數(shù)據(jù)庫,實驗結(jié)果表明,當(dāng)把本文所提噪聲估計算法整合到語音增強中,能夠獲得更好的語音質(zhì)量和明顯的噪聲消

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論