基于源—濾波模型的廣義似然比語音激活檢測.pdf_第1頁
已閱讀1頁,還剩67頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、隨著語音信號處理中各項技術(shù)的發(fā)展,語音激活檢測技術(shù)已經(jīng)在通信系統(tǒng)的各個領(lǐng)域中得到了成功應(yīng)用,種種需求使得VAD技術(shù)有著廣闊的發(fā)展前景。語音激活檢測技術(shù)能夠使通信系統(tǒng)中對帶寬的利用率提高一倍以上,在移動通信、衛(wèi)星通信以及其他帶寬有限的通信系統(tǒng)中有重要意義;能夠減少手持設(shè)備的平均能量消耗;使得信道能夠同時傳輸更多路的數(shù)據(jù);對聲音監(jiān)控等需要海量存儲語音信息的應(yīng)用,能夠大量節(jié)約存儲空間。
  在過去的幾十年里,語音激活檢測技術(shù)得到了極大的

2、發(fā)展,除了經(jīng)典的利用語音信號與噪聲之間的能量差異的基于信號能量的檢測方法,還有利用語音和信號高階統(tǒng)計特征差異的統(tǒng)計檢測算法,利用小波變換的檢測算法,基于隱馬爾科夫模型的檢測算法,基于倒譜的檢測等。
  這些方法提高了語音激活檢測的準(zhǔn)確性,但由于語音信號特別是其中的清音信號(Unvoiced Speech)本身就具有類似噪聲的特性,而不同類型的噪聲也具有截然不同的特征,使得盡管在安靜環(huán)境下的干凈的語音信號的激活檢測比較容易,但在低信

3、噪比條件下的受到噪聲污染的語音信號的激活檢測仍然有很大困難。
  本文基于語音產(chǎn)生的生理模型提出了一種具有實用價值的語音產(chǎn)生的源(激勵)-濾波模型,在這一模型的基礎(chǔ)上通過利用語音信號中的音調(diào)信息和線性預(yù)測分析方法,構(gòu)造了由兩個子檢測器組成的廣義似然比語音激活檢測器。兩個子檢測器分別針對語音信號中的清音信號和濁音信號進行檢測。用“估值-插入”(estimate-and-plug)的方法將語音的基頻信息輸入用于濁音檢測的子檢測器L1,

4、將線性預(yù)測分析信息同時輸入兩個子檢測器L0和L1,然后進一步通過兩者的線性聯(lián)合,用線性判別分析的方法進行權(quán)重特征的優(yōu)化,構(gòu)成一個特征優(yōu)化的廣義似然比檢測器(FO-GLRT,Feature Optimized Generalized Likelihood Ratio Test)。
  該檢測器充分利用了語音信號中源信號的特征及聲道調(diào)制過程中產(chǎn)生的線性預(yù)測特征,克服了基于能量檢測的方法對于低能量低信噪比條件下的語音激活檢測的困難,又避

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論