噪聲魯棒性語音識別:從特征提取到聲學(xué)模型的研究.pdf_第1頁
已閱讀1頁,還剩163頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、該論文的研究課題是噪聲魯棒性語音識別.因?yàn)檎Z音識別系統(tǒng)在噪聲環(huán)境中識別性能會嚴(yán)重下降,所以噪聲魯棒性是目前語音識別面臨的主要問題之一.我們從特征撮到聲學(xué)模型進(jìn)行了一系列的研究工作,提出了一些新的魯棒性語音識別方法.第一個(gè)方法是略幀法.略幀法在識別過程中對每幀的似然值加權(quán),幀權(quán)值是幀信噪比的函數(shù).略幀法克服了忽略特征法的缺點(diǎn):一是特征參數(shù)可以使用倒譜參數(shù);二是只需要通過幀能量估計(jì)信噪比,魯棒性能較好.但略幀法不能彌補(bǔ)語音頻譜受噪聲的干擾.

2、為了進(jìn)行語音頻譜的補(bǔ)償,在第二個(gè)方法中我們提出了將離散全極點(diǎn)模型(DAP)用于特征提取過程中以提高特征參數(shù)的魯棒性.DAP頻譜克服了LP頻譜峰值會偏向基頻譜波的缺點(diǎn),且在計(jì)算過程中可以對IS距離進(jìn)行加權(quán).我們用時(shí)頻域信噪比對DAP加權(quán).但該方法的性能受到信噪比估計(jì)精確度的影響.為了避開信噪比的估計(jì),該文提出了第三個(gè)方法,一種新的子帶加權(quán)自適應(yīng)方法.該方法克服了傳統(tǒng)子帶法的兩個(gè)缺點(diǎn):一是保留了頻譜帶間的相關(guān)性;二是可以用自適應(yīng)的方法對子帶

3、權(quán)值進(jìn)行估計(jì).我們分別提出了特征空間和模型空間的子帶加權(quán).根據(jù)最大似然自適應(yīng)理論,分別提出了特征空間和模型空間子帶權(quán)值自適應(yīng)算法.以上的方法均基于HMM模型,在第四個(gè)方法中我們實(shí)現(xiàn)了基于HMM誤差模型(HEM)的語音識別系統(tǒng)并提出了HEM的最大似然線性變換自適應(yīng)算法,HEM是HMM的擴(kuò)展,具有比HMM更靈活的拓?fù)浣Y(jié)構(gòu).它將HMM的一個(gè)流(狀態(tài)串)擴(kuò)展到兩個(gè)流,分別稱為濾波模型和殘差模型,而HMM是當(dāng)殘差模型為單高斯分布時(shí)的特例.與此相對

4、應(yīng),HEM的自適應(yīng)算法比HMM自適應(yīng)自滿MLLR更為靈活,我們可以分別對HEM的濾波模型和殘差模型進(jìn)行自適應(yīng).為了拒識插入噪聲和集外詞,在該文第五個(gè)工作中我們實(shí)現(xiàn)了基于填充模型和噪聲模型的確信度判決法.我們使用所有聲學(xué)模型單元的全連接網(wǎng)絡(luò)作為填充模型,并對一些常見的短時(shí)噪聲或突發(fā)噪聲建立了噪聲模型.該文還完成了一些相關(guān)的研究工作.在特征提取上,我們提出了一種結(jié)合MFCC和PLP的P-MFCC特征參數(shù);提出了倒頻域差分系數(shù);對幾種歸一化能

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論