版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、古人云:“未見其人,先聞其聲”。這句話的含義是人們可以根據(jù)一個人的聲音來辨別這個人的身份。因此,這里的聲音可以被認為是一個人特有的生物特征,我們稱之為“聲紋”。聲紋識別又叫說話人識別,它是通過對說話人的語音進行分析,然后對說話人的身份進行識別或判斷的技術(shù)。在司法鑒定、安全認證、智能家居等領(lǐng)域,聲紋識別技術(shù)得到了廣泛的應(yīng)用,也因此受到了國內(nèi)外語音信號處理研究者們的很大關(guān)注。
近年來,隨著智能移動終端的普及和移動互聯(lián)網(wǎng)的迅速發(fā)展,
2、基于移動平臺的聲紋識別應(yīng)用將會有更廣闊的發(fā)展空間。同時,由Google帶領(lǐng)開發(fā)的Android操作系統(tǒng)因其出色的系統(tǒng)性能、簡便的開發(fā)方法和良好的可移植性等原因,成為市場占有率最高的移動智能操作系統(tǒng)。因此,本文對聲紋識別技術(shù)中的一個重要方向——說話人確認方面的相關(guān)技術(shù)以及其在Android系統(tǒng)上的實現(xiàn)進行了深入研究。
一個基本的聲紋身份確認系統(tǒng)主要由說話者聲音特征提取模塊、說話者語音模型訓(xùn)練模塊以及對待測語音測試判決模塊組成。語
3、音特征的提取模塊主要是解決如何從語音信號中提取出可以代表說話者聲音特征的語音特征參數(shù)。語音模型的訓(xùn)練模塊主要是使用說話者特征向量和特定的模型訓(xùn)練出最能代表說話者聲音特性的模型參數(shù)。而對測試語音的測試和判決模塊就是把帶測試語音信號與所聲明說話者的模型進行對比評分,從而判定該測試語音是否是由所聲明的說話人發(fā)出的。本文在對以上三個主要方面的技術(shù)進行了了解和分析的基礎(chǔ)上,重點研究以下三個方面內(nèi)容:
1.語音特征提取技術(shù):本文對目前采用
4、比較廣泛的梅爾倒譜系數(shù)(MFCC)參數(shù)的提取進行了研究。對其存在的缺點以及不足進行了總結(jié),然后對傳統(tǒng)的MFCC參數(shù)進行了改進。改進后的MFCC參數(shù)主要在傳統(tǒng)MFCC參數(shù)的基礎(chǔ)上增加了一階、二階動態(tài)MFCC參數(shù),同時將MFCC參數(shù)的高階系數(shù)進行了余弦提升,得到一個改進的MFCC特征參數(shù)組合。
2.語者建模和測試判決方法:本文的建模和測試方法基于高斯混合模型(GMM)的通用背景模型(UBM)以及最大化后驗概率(MAP),并且重點針
5、對移動平臺應(yīng)用的特性,對如何提高測試判決階段的計算效率進行了研究。本文主要研究了兩種提高計算效率的方法:一種是直觀地減少測試語音時長;另一種是本文提出的根據(jù)閾值對高斯份量進行選擇再做評分計算的快速評分方法。
3.基于Android系統(tǒng)的原型實現(xiàn):主要研究如何在Android平臺將聲紋確認系統(tǒng)實現(xiàn)。本文對系統(tǒng)的功能、用戶界面、數(shù)據(jù)庫等必要組成部分進行了設(shè)計。在復(fù)雜功能的實現(xiàn)上,將語音特征提取、說話者建模等功能封裝在動態(tài)鏈接庫中,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 指紋身份驗證系統(tǒng)的研究.pdf
- 基于指紋身份驗證的授權(quán)系統(tǒng)設(shè)計與實現(xiàn).pdf
- 基于GPRS技術(shù)的無線指紋身份驗證系統(tǒng)的設(shè)計與實現(xiàn).pdf
- 基于人臉和聲紋組合身份驗證的研究與實現(xiàn).pdf
- 考試管理指紋身份驗證系統(tǒng).pdf
- 指紋身份驗證考試管理系統(tǒng)設(shè)計.pdf
- 基于人臉識別身份驗證系統(tǒng)的研究與實現(xiàn).pdf
- 基于Linux主機身份驗證系統(tǒng)的研究與實現(xiàn).pdf
- 基于JSP的運鈔押運身份驗證系統(tǒng)的設(shè)計與實現(xiàn).pdf
- 基于位置的身份驗證研究.pdf
- 小型語音身份驗證系統(tǒng)的研究及DSP實現(xiàn).pdf
- 自考身份驗證系統(tǒng).pdf
- 網(wǎng)絡(luò)層身份驗證機制的設(shè)計與實現(xiàn).pdf
- 基于在線掌紋的身份驗證技術(shù).pdf
- 基于LDA的聊天者身份驗證.pdf
- 基于人臉識別的身份驗證系統(tǒng)研究.pdf
- 基于文本的聊天對象身份驗證.pdf
- 基于身份特征度量建模與融合的多因素身份驗證.pdf
- 事件同步身份驗證系統(tǒng)的無共享存儲架構(gòu)的研究與實現(xiàn).pdf
- 支持移動網(wǎng)絡(luò)的身份驗證系統(tǒng)研究及實現(xiàn).pdf
評論
0/150
提交評論