噪聲環(huán)境中說話人識別魯棒性研究.pdf_第1頁
已閱讀1頁,還剩57頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、說話人識別技術(shù)因其獨特的方便性、經(jīng)濟性和準(zhǔn)確性,在生物特征識別領(lǐng)域中具有廣闊的應(yīng)用前景?,F(xiàn)有的說話人識別技術(shù)在理想條件下效果很好,但在實際環(huán)境中卻由于各種因素的影響,識別效果明顯下降。因此如何提高識別系統(tǒng)的魯棒性已經(jīng)成為本領(lǐng)域的研究熱點。 說話人識別系統(tǒng)的魯棒性問題涉及系統(tǒng)的各個部分。本文從語音傳輸過程中的丟包補償、訓(xùn)練數(shù)據(jù)不足和噪聲下的說話人建模技術(shù)等幾個方面進行了研究,取得了以下進展: 1.提出了一種基于lagran

2、gian插值的分組恢復(fù)方法。這種補償方法在丟包率較小,且不是連續(xù)丟包的情況下效果比較好。但是當(dāng)丟包率比較大時這種補償方法的效果就不理想了?;趌agrangian插值的分組恢復(fù)方法對丟失幀的實際位置進行了估計,比傳統(tǒng)的分組恢復(fù)方法有更好的效果。 2.改進了GMM識別算法,提出了一種基于GMM-DM的識別算法。通過引入DM距離,即以測試語句與模板的之間的相似性測度,來修正GMM模型在訓(xùn)練數(shù)據(jù)不充分的情況下的識別結(jié)果,GMM-DM方

3、法在訓(xùn)練數(shù)據(jù)不充分時對GMM判決結(jié)果進行修正,進一步克服了數(shù)據(jù)丟失對系統(tǒng)識別率的影響。 3.研究了子帶識別技術(shù)在說話人識別的應(yīng)用。由于子帶信號相對于寬帶信號來說變化比較緩慢,因此數(shù)據(jù)模型相對比較簡單。本文主要研究了在不同信噪比的加性白噪聲和NOISEX-92噪聲數(shù)據(jù)庫中的真實噪聲環(huán)境下,子帶技術(shù)對說話人識別系統(tǒng)魯棒性的提高。我們采用從子帶提取特征參數(shù)的方法,提取出子帶上攜帶的語音信息,利用噪聲能量分布進行加權(quán),并結(jié)合GMM-DM

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論