基于因子分析和支持向量機的耳語說話人識別.pdf_第1頁
已閱讀1頁,還剩69頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、耳語音說話人識別在公共場合下的通訊,安全場所的身份鑒定以及罪犯識別,電話網(wǎng)絡(luò)查詢與電話銀行等領(lǐng)域都有著廣泛的實用價值。耳語音的說話人識別技術(shù)在日常生活中越來越被重視。
   由于耳語發(fā)音方式的特殊性,耳語音說話人識別受說話人的健康狀況、心理變化、發(fā)音狀態(tài)和信道環(huán)境等因素的影響尤為突出。用正常音建立的說話人識別系統(tǒng)應(yīng)用到耳語音,識別性能將大為下降。
   聯(lián)合因子分析(JFA)在不匹配信道環(huán)境下耳語說話人識別已經(jīng)取得了很好

2、的效果,它能夠從模型方面分離出說話人和信道信息,從而進行信道補償。本文只采取了聯(lián)合因子分析方法中的一部分,只估計說話人空間,并從中提取出所包含的說話人因子,將說話人因子與支持向量機(SVM)結(jié)合起來構(gòu)建一個基于因子分析-支持向量機(FA-SVM)的耳語說話人識別系統(tǒng)。
   本文在該識別系統(tǒng)的基礎(chǔ)上增加了類內(nèi)協(xié)方差規(guī)整(WCCN),線性判別分析(LDA)和冗余屬性投影(NAP)三種信道補償技術(shù),并將經(jīng)過信道補償之后的說話人因子輸

3、入到支持向量機系統(tǒng)中進行識別。實驗證明采用信道補償之后的系統(tǒng)獲得了比基線系統(tǒng)更好的識別結(jié)果。
   因為估計出的說話人因子仍然會包含信道信息的特點,本文對上述三種方法進行了相應(yīng)的改進。針對類內(nèi)協(xié)方差規(guī)整,本文采用平滑的類內(nèi)規(guī)整矩陣取代原來的矩陣以改進識別效果。針對冗余屬性投影,本文分析了冗余屬性投影和基線系統(tǒng)之間的關(guān)聯(lián),提出了一種介于兩者之間的差異補償-冗余屬性投影(VC-NAP)系統(tǒng),該系統(tǒng)實現(xiàn)了一種可調(diào)的信道補償,避免了因完

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論