噪聲環(huán)境下的語音識別技術(shù)研究.pdf_第1頁
已閱讀1頁,還剩137頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、本論文以應(yīng)用型語音控制技術(shù)為目標(biāo),以系統(tǒng)魯棒性為研究重點,對噪聲環(huán)境下嵌入式孤立詞語音識別技術(shù)的各個主要方面作了深入探討。通過對魯棒語音識別問題進(jìn)行系統(tǒng)的研究和實驗,本文形成了一套完整的魯棒語音識別研究體系,包括了實驗平臺、魯棒端點檢測算法、魯棒特征提取算法、特征補(bǔ)償算法、聲學(xué)模型等關(guān)鍵部分,涵蓋了魯棒語音識別的全過程,獲得了一些有意義的成果。所有研究成果都被完整地實現(xiàn)并在語音庫上進(jìn)行了驗證,最終建立了一個完整的孤立詞語音識別系統(tǒng),包括

2、語音庫、軟件程序、硬件實現(xiàn)、應(yīng)用系統(tǒng)等,以此為基礎(chǔ)可直接構(gòu)建出一個實用的語音控制系統(tǒng)。上述這些研究成果具體主要包括以下幾個方面: (1) 語音識別實驗系統(tǒng)建立了一個基于隱馬爾科夫模型 (Hidden Markov Model,HMM) 的語音識別實驗系統(tǒng)。針對孤立詞吾音識別的特點優(yōu)化了系統(tǒng)中的 HMM 算法實現(xiàn)。給出了一套用于抗噪語音識別實驗的選詞方案,保證了實驗的代表性。建立了完整的孤立詞識別語音庫和噪聲庫以及噪聲度量標(biāo)準(zhǔn),保

3、證了實驗的可重復(fù)性。 (2) 端點檢測算法針對傳統(tǒng)雙門限端點檢測算法在噪聲環(huán)境下的不足之處,對算法細(xì)節(jié)作出了多處改進(jìn)。首次將一種非線性動力學(xué)參數(shù)——排列熵 (Permutation Entropy,PE)應(yīng)用于噪聲環(huán)境下的端點檢測,提出了基于能頻比和排列熵差分的雙門限端點檢測算法。在實驗平臺下與傳統(tǒng)算法進(jìn)行了對比實驗,實驗結(jié)果顯示,提出的算法與傳統(tǒng)算法相比,噪聲魯棒性更好,檢測延時相當(dāng)。 (3) 特征提取算法系統(tǒng)總結(jié)了目

4、前常用的幾種語音識別特征參數(shù),特別是詳細(xì)分析了線性預(yù)測編碼 (Linear Prediction Coding,LPC) 特征和 Mel 頻率倒譜系數(shù) (Mel Frequency Cepstral Coefficient,MFCC ) 特征的原理、優(yōu)缺點和實現(xiàn)細(xì)節(jié)。針對LPC特征和MFCC 特征的問題,將最小方差無失真響應(yīng) (Minimum Variance Distortionless Response,MVDR) 潛估汁技術(shù)引入到

5、語音特征提取中,使用這種技術(shù)得到的特征參數(shù)在某種程度上結(jié)合了上述兩種主流特征參數(shù)的優(yōu)點。針對語音信號的特點,給出了幾種MVDR計算上的改進(jìn)方法。最后通過實驗對比了MVDR方法與其它方法的性能。 (4) 魯棒語音識別技術(shù)全面研究了包括抗環(huán)境噪聲、說話人自適應(yīng)、信道自適應(yīng)等在內(nèi)的系統(tǒng)魯棒性問題。提出了一種用于語音識別的魯棒特征提取算法,這種算法基于MVDR譜估計技術(shù),它在Mel頻率尺度上估計MVDR譜,并對得到的MVDR譜進(jìn)行調(diào)制譜

6、濾波,然后提取其倒譜系數(shù)作為特征參數(shù)。在汽車噪聲、人群噪聲和高斯白噪聲三種噪聲環(huán)境下,與MVDR特征提取算法和MFCC特征提取算法按多種信噪比做了對比實驗。實驗結(jié)果表明使用該算法的系統(tǒng)在這三種噪聲環(huán)境下的識別率均得到了不同程度的提高。 (5) 硬件實現(xiàn)問題針對孤立詞語音識別算法的硬件實現(xiàn)問題,比較了通用處理器、數(shù)字信號處理器(Digital Signal Processor,DSP)、專用集成電路(Application Spe

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論