說話人識別系統(tǒng)中的語音信號處理技術(shù)研究.pdf_第1頁
已閱讀1頁,還剩89頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、隨著當今信息技術(shù)的飛速發(fā)展,語音信號處理技術(shù)已經(jīng)滲透到了各個領(lǐng)域內(nèi),說話人識別技術(shù)是語音信號處理應用的一個重要分支,是目前語音信號處理技術(shù)領(lǐng)域中的一個研究熱點。說話人識別系統(tǒng)中最重要的一個環(huán)節(jié)就是特征提取,特征提取的方法選擇與性能優(yōu)化同語音信號特征參數(shù)有著密切聯(lián)系,而且說話人識別系統(tǒng)模型參數(shù)的選擇也直接影響著系統(tǒng)的識別性能。本文就上述問題在前人研究基礎(chǔ)上做了以下工作。
  1、首先介紹了語音的產(chǎn)生原理及傳輸模型,分別闡述了語音的時

2、域和頻域特性,并用語譜圖將二者結(jié)合起來分析,接下來是介紹語音信號的預處理部分和短時特征函數(shù)。并做了相應的仿真實驗及分析驗證。
  2、重點介紹了語音信號的三種端點檢測算法,即雙門限算法、短時能零積算法、功率譜熵算法。在 MATLAB平臺實現(xiàn)了三種算法的仿真與端點檢測性能的比較,得出結(jié)論:相比之下功率譜算法的檢測效果最好。并針對算法存在的不足作相應的改進。接下介紹了語音的LPC原理以及仿真實現(xiàn)過程,在此基礎(chǔ)上依次引入了基于聲道特征的

3、LPCC參數(shù)和聽覺特性的MFCC特征參數(shù),并研究了它們各自提取過程、參數(shù)特性特點以及圍繞他們拓展開的差分特征、特征分量加權(quán)、特征組合等優(yōu)化方法。通過仿真,對MFCC和LPCC的參數(shù)性能進行綜合比較,得出MFCC的參數(shù)性能要優(yōu)于LPCC的重要結(jié)論。
  3、介紹了說話人識別系統(tǒng)中模型訓練和模版匹配常用的高斯混合模型(GMM)的基本原理及相關(guān)算法方法。然后在 MATLAB平臺上利用高斯混合模型實現(xiàn)了說話人識別系統(tǒng)的仿真實驗,分析了在G

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論