版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、在文本無關的話者識別中,尤其以NIST 話者測評為代表的復雜環(huán)境下電話手機語音的話者識別,訓練語音與測試語音的失配是導致識別系統(tǒng)性能下降的重要因素。這種失配包含語音類失配和外部干擾失配兩種:包括訓練和測試文本內(nèi)容不同的影響,周圍環(huán)境噪聲的影響,語音信號采集設備(話筒)的影響,傳輸調(diào)制信道的影響等。除此之外,還有說話人自身因素的影響,情緒變化等。如何對這些失配信息進行準確而有效的補償是當前話者識別研究領域的熱點問題。
論文針
2、對復雜環(huán)境下電話手機語音識別系統(tǒng)的失配問題,圍繞如何解決當前失配方法的不足,更加有效的對上述兩種失配進行補償,如何提高訓練和測試失配補償?shù)乃俣?,如何將失配補償與區(qū)分性系統(tǒng)結合起來等方面進行了深入的研究。
論文首先深入分析了現(xiàn)有的一些失配補償方法的思路和算法實現(xiàn)細節(jié)。針對語音類失配問題,從訓練和測試兩個角度詳細分析了在GMM-UBM 框架下UBM模型在話者模型訓練和評分測試中所起到的重要的基準作用,以及通過測驗語音與目標話者
3、模型和UBM模型的評分相減來解決語音類失配的問題。針對外部影響失配問題,詳細介紹了現(xiàn)有的一些基于特征域、模型域、評分域的失配補償方法,并分析了這些失配補償方法的不足之處,主要體現(xiàn)在需要信道分類器對語音進行信道判決,只能針對孤立的信道類別進行補償,以及信道分類器判決可能出現(xiàn)誤判,訓練信道分類器也需要相應的信道標記的語音。這都限制了當前已有的一些失配補償方法的效果。
論文針對語音類和外部干擾兩類失配問題和現(xiàn)有失配補償方法存在的
4、不足之處,將因子分析方法用于估計說話人確認中訓練和測試受到的失配影響,詳細分析了在基于因子分析的失配補償方法中,如何構建失配信息空間和話者信息空間,并通過這兩個信息空間估計語音所受到的失配影響大?。▽獮槭湟蜃樱?,其失配補償是按照實際的失配影響大小而不是通道類別進行補償,無需利用信道模型判決語音的信道種類,避免信道種類判決錯誤的影響。故其連續(xù)相對的補償效果要優(yōu)于傳統(tǒng)的失配補償方法。在NIST SRE 2008測評中我們將本方法應用于長
5、語音任務中,在50多家國際參賽機構中排名第一。論文還利用話者信息空間解決短語音利用MAP 方法據(jù)估計話者模型的不足問題,實驗結果效果明顯,相對提高17% 左右。
為了提高語音在失配補償時的速度,論文提出了一種基于CUBM 選擇模型和因子分析的快速失配補償方法。CUBM 由UBM 高斯分量通過KL 距離準則和自底向上的分層聚類得到的高斯混合模型。在失配補償時,利用CUBM 選擇模型為每幀語音特征矢量選擇一組相應的UBM 高斯
6、分量,只用這些高斯分量計算相應的EM 統(tǒng)計量,可以顯著降低失配補償?shù)挠嬎懔?。論文還提出了一種基于Top-N的選擇策略,以提高UBM 高斯分量的選擇精度,平衡系統(tǒng)性能和失配補償計算量之間的矛盾。在NIST SRE 2006 主任務上的實驗表明,基于CUBM 選擇模型的快速失配補償方法在取得和原始失配補償方法相近的系統(tǒng)性能的同時,計算量降為原來的八分之一左右,解決了失配補償方法應用中的計算量問題。
論文提出將失配補償和SVM
7、區(qū)分性話者識別系統(tǒng)結合起來的一種方法。
當SVM 輸入是GMM 均值超矢量時,SVM的訓練樣本(目標和冒認話者的GMM 均值超矢量)在模型域進行補償,測試時,測試語音也同樣提取相應的GMM 均值超矢量,在模型域補償后與SVM 話者模型測試。在NIST SRE 2008核心任務的實驗表明,失配補償后的SVM系統(tǒng)性能比補償后的GMM系統(tǒng)性能有7% 左右的提高,比補償前的SVM系統(tǒng)性能相對提高24%。實驗結果充分說明了失配補償方
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 話者確認中信道和時長失配補償研究.pdf
- 情感說話人識別中的基頻失配及其補償方法研究.pdf
- 語音識別中環(huán)境失配的補償研究.pdf
- 說話人識別中訓練和測試時編碼失配影響的補償.pdf
- 人臉識別中光照估計和補償方法研究與實現(xiàn).pdf
- 信息安全中的信息隱藏理論和方法研究.pdf
- 基音和超音段信息用于話者確認的研究.pdf
- Robust話者識別中統(tǒng)計模型的研究.pdf
- 說話人確認的失配補償研究.pdf
- 微表情識別的理論和方法研究.pdf
- 自動語音識別特征補償方法研究.pdf
- 基于話者統(tǒng)計特征和SVM的文本無關話者確認研究.pdf
- 基于校準信號的時間交錯采樣系統(tǒng)失配補償方法研究.pdf
- 直接轉(zhuǎn)換接收機的IQ失配和直流偏移補償研究.pdf
- 信道失配條件下的話者確認研究.pdf
- 質(zhì)量信息集成理論和方法的研究.pdf
- 視覺目標跟蹤和識別的理論與方法研究.pdf
- 模型失配條件下基于失配信息的預測控制研究.pdf
- 語音識別中的環(huán)境補償研究.pdf
- 與文本無關話者識別算法研究及其DSP系統(tǒng)實現(xiàn).pdf
評論
0/150
提交評論