基于加權(quán)FSVQ和SVM的說話人識別算法研究.pdf_第1頁
已閱讀1頁,還剩64頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、說話人識別技術(shù)是生物認證技術(shù)的一個范疇,由于語音采集容易、經(jīng)濟性高等優(yōu)點,使得說話人識別成為生物識別領(lǐng)域上研究的一個焦點。本論文首先討論了端點檢測以及特征提取的方法,然后在VQ的基礎(chǔ)上提出了加權(quán)FSVQ,并將其與SVM融合進行說話人識別,取得了一定的研究成果。
   一些端點檢測技術(shù)包括倒譜特征,信息熵,譜熵等對孤立詞語音的端點檢測都能達到很好的效果,但是說話人識別中用到的更多的是連續(xù)語音,實驗結(jié)果顯示,短時能量和過零率對連續(xù)語

2、音的端點檢測更為有效。這主要是因為短時能量和過零率綜合考慮了語音的能量和頻率。
   矢量量化作為一種比較常用的說話人識別方法,雖然在編碼率較低的情況下,其識別率并不高,但是其訓(xùn)練速度快。因此,本論文為了提高矢量量化在低編碼率情況下的識別率,提出了加權(quán)FSVQ。加權(quán)FSVQ認為任一時刻系統(tǒng)都處,于一個特定的狀態(tài),當前系統(tǒng)的狀態(tài)是由前一時刻的語音幀決定的。由于考慮到了語音信號幀間的關(guān)聯(lián)性,使得加權(quán)FSVQ相比傳統(tǒng)VQ有著更高的識別

3、率。實驗證明該方法相對于傳統(tǒng)矢量量化在識別率上有一定的提高,特別是在碼字較少時(少于8),識別率有l(wèi)O%以上的提高。
   對加權(quán)FSVQ的加權(quán)系數(shù)進行探討是本論文的另外一個重點,對比分析了按貢獻率加權(quán)、按量化精度加權(quán)、按貢獻率和量化精度結(jié)合加權(quán)以及未加權(quán)四種加權(quán)策略,實驗結(jié)果證明按貢獻率和量化精度結(jié)合加權(quán)可使加權(quán)FSVQ可達到最高識別率。
   加權(quán)FSVQ繼承了VQ在訓(xùn)練速度上的優(yōu)點,這主要體現(xiàn)在當編碼率較低時,加權(quán)

4、FSVQ能夠快速實現(xiàn)對大樣本的訓(xùn)練,而這一點正是SVM所欠缺的。相比加權(quán)FSVQ,SVM的主要優(yōu)勢在于對小樣本的識別精度上,SVM能夠?qū)π颖緦崿F(xiàn)高精度的快速識別。針對兩類方法存在的缺陷,為了有效地提高說話人識別的識別率,將二者進行融合,并最大可能地發(fā)揮二者的優(yōu)勢?;诩訖?quán)FSVQ和SVM融合的說話人識別方法采用的是先選定候選人,后確定的原則。實驗數(shù)據(jù)顯示:采用加權(quán)FSVQ作為第一種語音模型,SVM作為第二種語音模型的級聯(lián)模式進行融合,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論