版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、隨著計算機技術(shù)的發(fā)展和社會信息化程度的提高,說話人識別技術(shù)具有了越來越廣闊的應(yīng)用前景,同時用戶對說話人識別系統(tǒng)的準(zhǔn)確性和魯棒性的要求也越來越高。在實際應(yīng)用環(huán)境中,說話人識別系統(tǒng)的性能受到很多因素的影響,情感變化是其中最為常見的一種。我們將訓(xùn)練或者測試語料中包含情感語音的說話人識別稱為情感說話人識別,訓(xùn)練與測試時說話人情感狀態(tài)的不一致會改變說話人個性特征的分布,從而導(dǎo)致測試語音與訓(xùn)練模型的模式不匹配,極大地降低系統(tǒng)的識別性能。
2、 針對僅有中性訓(xùn)練語音的情感說話人識別問題,本論文從分析各種情感語音與中性語音的差異出發(fā),以研究情感變化引發(fā)的基頻失配為基礎(chǔ),利用基頻與MFCC之間存在的關(guān)聯(lián),從情感補償框架中的情感拓展、情感屏蔽、情感規(guī)整和得分補償四個技術(shù)角度研究了相應(yīng)的算法,來削弱情感變化對說話人識別性能的影響。
本論文的主要貢獻總結(jié)如下:
1.提出了一種新的情感語音的劃分與檢測方法
鑒于情感檢測在情感補償方法中的重要性以
3、及目前情感識別算法的不可靠性,本文提出了一種依據(jù)模式失配程度來劃分與檢測情感語音的方法,根據(jù)不同情感語音與中性語音之間的差異,將情感語音劃分為高差異類(憤怒、高興和驚慌)與低差異類(悲傷),由此提出了一種基于MFCC特征與韻律特征相結(jié)合的差異檢測方法來區(qū)分這兩類語音。
2.首次研究了情感變化引發(fā)的基頻失配問題
從發(fā)音機制上研究了情感影響下基頻失配產(chǎn)生的原理,分別從前人有關(guān)聲源和聲道之間互擾的研究、基頻與MFC
4、C的關(guān)聯(lián)、基頻失配與說話人識別性能間的關(guān)系三方面分析了利用基頻失配來評估模式失配的可行性,并對通過修改基頻降低基頻失配來降低模式失配的可行性進行了詳盡的實驗分析。
3.首次提出并研究了基于基頻失配的情感補償方法
針對高差異類情感語音引發(fā)的模式失配問題,本文先用差異檢測方法檢測出該類語音,再通過拓展生成與之類似的情感語音,或者通過屏蔽、規(guī)整和得分補償?shù)确椒ㄏ鋵ο到y(tǒng)的負面影響。具體方法如下:
1
5、)基于基頻失配檢測的情感屏蔽方法
根據(jù)高差異類情感語音中基頻偏高的部分相比基頻偏低的部分與中性模型失配更嚴重這一特性,提出了基于基頻失配檢測的情感屏蔽方法,采用剔除和規(guī)整兩種策略屏蔽語音的高失配部分,從不同程度上降低了情感測試語音與中性訓(xùn)練語音之間的失配程度。
2)基于基頻映射的情感拓展方法
通過調(diào)節(jié)中性語音的基頻均值來合成在特征分布上更接近于真實的高差異類情感的語音,以此構(gòu)建說話人的“高差異類
6、情感模型”,并將其與中性模型相結(jié)合,來提高說話人模型對多情感狀態(tài)下的語音特征的描述能力。
3)基于基頻修正的情感規(guī)整方法
從修正高差異類情感語音與中性語音之間的基頻失配入手,通過使其基頻均值趨向于中性語音來降低兩者聲學(xué)特征之間的不匹配程度,從而有效降低情感變化對說話人識別的影響。
4)基于基頻失配評估的得分補償方法
鑒于情感變化引發(fā)的基頻失配與說話人識別率之間的相關(guān)性,以基頻偏差區(qū)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 說話人確認的失配補償研究.pdf
- 說話人識別中訓(xùn)練和測試時編碼失配影響的補償.pdf
- 情感說話人識別及其解決方法的研究.pdf
- 說話人識別中的信道補償.pdf
- 說話人識別中不同語音編碼影響的補償方法.pdf
- 話者識別中失配信息補償理論和方法研究.pdf
- 說話人識別技術(shù)中的判別性模型與環(huán)境補償方法研究.pdf
- 信道失配條件下的說話人識別技術(shù).pdf
- 基于說話人識別信道補償?shù)难芯?pdf
- 說話人識別中特征組合方法的研究.pdf
- 語音識別中環(huán)境失配的補償研究.pdf
- 說話人識別方法的研究.pdf
- 說話人識別中的模式匹配方法研究.pdf
- 說話人識別中特征提取的方法研究.pdf
- 說話人識別中語音參數(shù)提取方法的研究.pdf
- 基于特征選擇及其融合方法的說話人識別.pdf
- 說話人識別方法及其系統(tǒng)的應(yīng)用開發(fā)研究.pdf
- 說話人確認的特征域補償方法研究.pdf
- 基于信道補償方法的說話人確認研究.pdf
- 說話人識別情感合成問題的概率模型研究.pdf
評論
0/150
提交評論