基于機器學(xué)習(xí)的雙麥克風(fēng)手機語音增強算法研究.pdf_第1頁
已閱讀1頁,還剩124頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、手機作為目前市場最大,消費人群最廣的便攜式移動通訊設(shè)備,其通話質(zhì)量的改善一直以來受到了廣泛的關(guān)注。由于使用場合很廣,需要應(yīng)對的背景噪聲環(huán)境也十分復(fù)雜,這就要求應(yīng)用于手機平臺上的消噪算法可以靈活地應(yīng)對多種噪聲,在保證語音通話質(zhì)量的前提下,對背景噪聲進行有效抑制,而且算法的性能不會因使用者握機姿勢的不同或通話過程中手機的轉(zhuǎn)動而下降,對真實環(huán)境具有良好的魯棒性。~~
  近年來人工智能的應(yīng)用已逐步覆蓋各個領(lǐng)域,機器學(xué)習(xí)作為其核心,強調(diào)在

2、不斷的數(shù)據(jù)學(xué)習(xí)中改善算法的性能,這種特性使得機器學(xué)習(xí)相關(guān)算法(如神經(jīng)網(wǎng)絡(luò))能夠靈活應(yīng)對復(fù)雜而多變的外部環(huán)境,如果能將機器學(xué)習(xí)應(yīng)用于手機消噪算法中一定會顯著提升算法在真實場景下的性能,然而相關(guān)研究工作卻并不多。
  本文嘗試將機器學(xué)習(xí)中的神經(jīng)網(wǎng)絡(luò)模型應(yīng)用于手機消噪算法中,并針對消噪算法的各個部分進行了改進,提高了算法在真實使用場景下的靈活性和魯棒性。
  全文工作及創(chuàng)新點主要包含下列幾個方面:
  (1)針對現(xiàn)有的雙通道

3、VAD算法依賴于固定閾值難以在多種不同的噪聲環(huán)境下準確地檢測語音和噪聲等問題。論文第二章結(jié)合神經(jīng)網(wǎng)絡(luò)提出了一種新的雙通道VAD算法,該算法以分頻帶能量差和歸一化互通道相關(guān)作為兩類新的特征,采用神經(jīng)網(wǎng)絡(luò)對語音和噪聲進行分類,不依賴于固定的閾值,可以靈活應(yīng)對復(fù)雜而多變的噪聲環(huán)境,較現(xiàn)有的基于互通道能量差及其改進的VAD算法準確性更高。
  (2)論文的第三章利用了手機兩個麥克風(fēng)接收帶噪語音信號功率的比值在噪聲段和語音段的不同,提出一種

4、新的基于互通道功率比值的VAD算法,在此基礎(chǔ)上,將第二章的神經(jīng)網(wǎng)絡(luò)VAD算法與基于互通道功率比值的VAD算法相結(jié)合,最終得到一種適用于手機消噪處理中的語音和噪聲活動檢測算法,該算法能夠分別針對語音和噪聲進行準確的檢測,使用檢測結(jié)果控制時域語音增強算法對帶噪語音信號進行消噪處理,在濾除噪聲的同時能夠顯著降低對語音信號造成的損傷,提高語音的可懂度,特別是對方向性的語音干擾也能夠有很好的抑制效果。
  (3)為了進一步濾除第三章時域語音

5、增強處理后殘留的線性不相關(guān)噪聲,論文的第四章將時域輸出的增強語音信號和背景噪聲信號轉(zhuǎn)化到頻域進行進一步的消噪處理,并分別針對消噪算法中兩個重要的組成部分:噪聲估計和噪聲消除做了改進。首先結(jié)合單、雙麥克風(fēng)的噪聲估計算法,提高了噪聲估計的準確性,然后將基音檢測與消噪處理相結(jié)合,在語音幀中估計語音基音頻率確定語音和噪聲頻率點,針對語音和噪聲頻率點分別調(diào)整維納濾波器的參數(shù),在對噪聲進行濾除的同時盡可能地保留語音頻點,從而減少了語音失真。實驗結(jié)果

6、表明,與現(xiàn)有的雙麥克風(fēng)消噪算法相比,經(jīng)過改進后的頻域消噪算法能夠更有效地減少對語音信號造成的損害,提高了手機的通話質(zhì)量。
  (4)使用者握機姿勢的不同或通話過程中手機的轉(zhuǎn)動會對消噪算法的性能產(chǎn)生影響,如果能夠?qū)崟r確定手機的位置,并依據(jù)當(dāng)前位置及時調(diào)整消噪算法的參數(shù)則能夠提高算法的性能?,F(xiàn)有的定位算法大多需要三個以上的麥克風(fēng)陣列,無法直接用于雙麥克風(fēng)的手機上。論文第五章結(jié)合手機這一特定的應(yīng)用場景提出了一種只使用兩個麥克風(fēng)在三維空間

7、中定位手機位置的新方法,該方法使用互通道時延和通過對目標語音到達兩個麥克風(fēng)的傳播路徑進行分析提出的新特征子帶互通道功率比作為輸入,訓(xùn)練神經(jīng)網(wǎng)絡(luò)輸出手機的空間位置。
  (5)當(dāng)檢測到手機偏離標準通話位置時,依據(jù)第五章神經(jīng)網(wǎng)絡(luò)定位的結(jié)果及時地對論文第三和第四章中的時域和頻域消噪算法的參數(shù)進行調(diào)整,避免了算法因手機位置的移動而造成的通話性能下降。實驗結(jié)果表明,現(xiàn)有的雙麥克風(fēng)消噪算法由于忽略了手機轉(zhuǎn)動的問題,在真實場景下的性能無法得到保

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論