版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、近年來,在生物識(shí)別技術(shù)領(lǐng)域中,聲紋識(shí)別技術(shù)以其獨(dú)特的方便性、經(jīng)濟(jì)性和準(zhǔn)確性等優(yōu)勢受到世人矚目,并日益成為人們?nèi)粘I詈凸ぷ髦兄匾移占暗陌踩?yàn)證方式。聲紋識(shí)別屬于生物識(shí)別技術(shù)的一種,是一項(xiàng)根據(jù)語音波形中反映說話人生理和行為特征的語音參數(shù),自動(dòng)識(shí)別說話人身份的技術(shù)。與語音識(shí)別不同的是,聲紋識(shí)別利用的是語音信號(hào)中的說話人信息,而不考慮語音中的字詞意思,它強(qiáng)調(diào)說話人的個(gè)性而語音識(shí)別的目的是識(shí)別出語音信號(hào)中的言語內(nèi)容,并不考慮說話人是誰,它強(qiáng)調(diào)
2、共性。聲紋識(shí)別系統(tǒng)主要包括兩部分,即特征檢測和模式匹配。特征檢測的任務(wù)是選取唯一表現(xiàn)說話人身份的有效且穩(wěn)定可靠的特征,模式匹配的任務(wù)是對訓(xùn)練和識(shí)別時(shí)的特征模式做相似性匹配。1特征提取聲紋識(shí)別系統(tǒng)中的特征檢測即提取語音信號(hào)中表征人的基本特征,此特征應(yīng)能有效地區(qū)分不同的說話人,且對同一說話人的變化保持相對穩(wěn)定。考慮到特征的可量化性、訓(xùn)練樣本的數(shù)量和系統(tǒng)性能的評價(jià)問題,目前的聲紋識(shí)別系統(tǒng)主要依靠較低層次的聲學(xué)特征進(jìn)行識(shí)別。說話人特征大體可歸為
3、下述幾類:譜包絡(luò)參數(shù)語音信息通過濾波器組輸出,以合適的速率對濾波器輸出抽樣,并將它們作為聲紋識(shí)別特征?;糨喞⒐舱穹孱l率帶寬及其軌跡這類特征是基于發(fā)聲器官如聲門、聲道和鼻腔的生理結(jié)構(gòu)而提取的參數(shù)。線性預(yù)測系數(shù)使用線性預(yù)測系數(shù)是語音信號(hào)處理中的一次飛躍,以線性預(yù)測導(dǎo)出的各種參數(shù),如線性預(yù)測系數(shù)、自相關(guān)系數(shù)、反射系數(shù)、對數(shù)面積比、線性預(yù)測殘差及其組合等參數(shù),作為識(shí)別特征,可以得到較好的效果。主要原因是線性預(yù)測與聲道參數(shù)模型是相符合的。反映
4、聽覺特性的參數(shù)模擬人耳對聲音頻率感知的特性而提出了多種參數(shù),如美倒譜系數(shù)、感知線性預(yù)測等。此外,人們還通過對不同特征參量的組合來提高實(shí)際系統(tǒng)的性能,當(dāng)各組合參量間相關(guān)性不大時(shí),會(huì)有較好的效果,因?yàn)樗鼈兎謩e反映了語音信號(hào)的不同特征。2模式匹配目前針對各種特征而提出的模式匹配方法的研究越來越深入。這些方法大體可歸為下述幾類:概率統(tǒng)計(jì)方法語音中說話人信息在短時(shí)內(nèi)較為平穩(wěn),通過對穩(wěn)態(tài)特征如基音、聲門增益、低階反射系數(shù)的統(tǒng)計(jì)分析,可以利用均值、方
5、差等統(tǒng)計(jì)量和概率密度函數(shù)進(jìn)行分類判決。其優(yōu)點(diǎn)是不用對特征參量在時(shí)域上進(jìn)行規(guī)整,比較適合文本無關(guān)的說話人識(shí)別。動(dòng)態(tài)時(shí)間規(guī)整方法說話人信息不僅有穩(wěn)定因素(發(fā)聲器官的結(jié)構(gòu)和發(fā)聲習(xí)慣),而且有時(shí)變因素(語速、語調(diào)、重音和韻律)。將識(shí)別模板與參考模板進(jìn)行時(shí)間對比,按照某種距離測定得出兩模板間的相似程度。常用的方法是基于最近鄰原則的動(dòng)態(tài)時(shí)間規(guī)整DTW。矢量量化方法矢量量化最早是基于聚類分析的數(shù)據(jù)壓縮編碼技術(shù)。Helms首次將其用于聲紋識(shí)別,把每個(gè)人
6、的特定文本編成碼本,識(shí)別時(shí)將測試文本按此碼本進(jìn)行編碼,以量化產(chǎn)生的失真度作為判決標(biāo)準(zhǔn)。Bell實(shí)驗(yàn)室的Rosenberg和Soong用VQ進(jìn)行了孤立數(shù)字文本的聲紋識(shí)別研究。這種方法的識(shí)別精度較高,且判斷速度快。隱馬爾可夫模型方法隱馬爾可夫模型是一種基于轉(zhuǎn)移概率和傳輸概率的隨機(jī)模型,最早在CMU和IBM被用于語音識(shí)別。它把語音看成由可觀察到的符號(hào)序列組成的隨機(jī)過程,符號(hào)序列則是發(fā)聲系統(tǒng)狀態(tài)序列的輸出。在使用HMM識(shí)別時(shí),為每個(gè)說話人建立發(fā)
7、聲模型,通過訓(xùn)練得到狀態(tài)轉(zhuǎn)移概率矩陣和符號(hào)輸出概率矩陣。識(shí)別時(shí)計(jì)算未知語音在狀態(tài)轉(zhuǎn)移過程中的最大概率,根據(jù)最大概率對應(yīng)的模型進(jìn)行判決。HMM不需要時(shí)間規(guī)整,可節(jié)約判決時(shí)的計(jì)算時(shí)間和存儲(chǔ)量,在目前被廣泛應(yīng)用。缺點(diǎn)是訓(xùn)練時(shí)計(jì)算量較大。人工神經(jīng)網(wǎng)絡(luò)方法人工神經(jīng)網(wǎng)絡(luò)在某種程度上模擬了生物的感知特性,它是一種分布式并行處理結(jié)構(gòu)的網(wǎng)絡(luò)模型,具有自組織和自學(xué)習(xí)能力、很強(qiáng)的復(fù)雜分類邊界區(qū)分能力以及對不完全信息的魯棒性,其性能近似理想的分類器。其缺點(diǎn)是訓(xùn)
8、練時(shí)間長,動(dòng)態(tài)時(shí)間規(guī)整能力弱,網(wǎng)絡(luò)規(guī)模隨說話人數(shù)目增加時(shí)可能大到難以訓(xùn)練的程度。把以上分類方法與不同特征進(jìn)行有機(jī)組合可顯著提高聲紋識(shí)別的性能,如NTT實(shí)驗(yàn)室的T.Matsui和S.Furui使用倒譜、差分倒譜、基音和差分基音,采用VQ與HMM混和的方法得到99.3%的說話人確認(rèn)率。對于說話人確認(rèn)系統(tǒng),表征其性能的最重要的兩個(gè)參量是錯(cuò)誤拒絕率和錯(cuò)誤接受率。前者是拒絕真實(shí)的說話人而造成的錯(cuò)誤,后者是接受假冒者而造成的錯(cuò)誤,二者與閾值的設(shè)定相
9、關(guān)。說話人確認(rèn)系統(tǒng)的錯(cuò)誤率與用戶數(shù)目無關(guān),而說話人辨認(rèn)系統(tǒng)的性能與用戶數(shù)目有關(guān),并隨著用戶數(shù)目的增加,系統(tǒng)的性能會(huì)不斷下降。總的說來,一個(gè)成功的說話人識(shí)別系統(tǒng)應(yīng)該做到以下幾點(diǎn):能夠有效地區(qū)分不同的說話人,但又能在同一說話人語音發(fā)生變化時(shí)保持相對的穩(wěn)定,如感冒等情況。不易被他人模仿或能夠較好地解決被他人模仿問題。在聲學(xué)環(huán)境變化時(shí)能夠保持一定的穩(wěn)定性,即抗噪聲性能要好聲紋識(shí)別應(yīng)用前景與其他生物識(shí)別技術(shù),諸如指紋識(shí)別、掌形識(shí)別、虹膜識(shí)別等相比
10、較,聲紋識(shí)別除具有不會(huì)遺失和忘記、不需記憶、使用方便等優(yōu)點(diǎn)外,還具有以下特性:用戶接受程度高,由于不涉及隱私問題,用戶無任何心理障礙。利用語音進(jìn)行身份識(shí)別可能是最自然和最經(jīng)濟(jì)的方法之一。聲音輸入設(shè)備造價(jià)低廉,甚至無費(fèi)用(電話),而其他生物識(shí)別技術(shù)的輸入設(shè)備往往造價(jià)昂貴。在基于電信網(wǎng)絡(luò)的身份識(shí)別應(yīng)用中,如電話銀行、電話炒股、電子購物等,與其他生物識(shí)別技術(shù)相比,聲紋識(shí)別更為擅長,得天獨(dú)厚。由于與其他生物識(shí)別技術(shù)相比,聲紋識(shí)別具有更為簡便、準(zhǔn)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 聲紋識(shí)別讓聲音辨人
- 聲紋識(shí)別技術(shù)研究.pdf
- 聲紋識(shí)別系統(tǒng)研究.pdf
- VQ聲紋識(shí)別算法的研究.pdf
- 基于聲紋識(shí)別的門禁系統(tǒng)設(shè)計(jì).pdf
- 說話人聲紋識(shí)別的算法研究.pdf
- 基于GMM的聲紋識(shí)別技術(shù)的研究.pdf
- 基于Mel倒譜技術(shù)的聲紋識(shí)別.pdf
- 聲紋識(shí)別中關(guān)鍵技術(shù)的研究.pdf
- 基于Android的聲紋識(shí)別和語音識(shí)別的設(shè)計(jì).pdf
- 聲紋識(shí)別系統(tǒng)與模式識(shí)別算法研究.pdf
- 聲紋識(shí)別相關(guān)技術(shù)研究及應(yīng)用.pdf
- 基于雙層決策模型的實(shí)時(shí)聲紋識(shí)別研究.pdf
- 基于聲紋識(shí)別的身份認(rèn)證技術(shù)研究.pdf
- 聲紋識(shí)別系統(tǒng)與模式匹配算法研究.pdf
- 嵌入式聲紋識(shí)別系統(tǒng)研究.pdf
- 智能住宅門禁系統(tǒng)聲紋識(shí)別算法研究.pdf
- 聲紋識(shí)別系統(tǒng)關(guān)鍵技術(shù)研究.pdf
- 基于優(yōu)化語音提取的聲紋識(shí)別系統(tǒng).pdf
- 聲紋識(shí)別在微信中的模式匹配研究.pdf
評論
0/150
提交評論