情感語音信號特征分析與識別.pdf_第1頁
已閱讀1頁,還剩99頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、在人與人的交流中,識別對方的情感狀態(tài)是情感智能的一個重要內(nèi)容。情感智能是人類智能的一個方面,對人的社會交往起著非常重要的作用。在傳統(tǒng)的語音信號處理過程中,計算機(jī)沒有被賦予理解操作者的情緒和心情的能力,只能夠理解語音信號的表層符號信息,而不能理解隱層情感信息,不能實(shí)現(xiàn)類似人類交流之間的情感互動。語音情感信號處理就是要賦予計算機(jī)類似人一樣的觀察、理解語音信號中的情感信息,表達(dá)各種情感的能力。本文從認(rèn)知、心理、生理、特征獲取、模式識別等角度對

2、情感語音識別進(jìn)行了研究,取得了一些研究成果。 本文首先從心理生理學(xué)的角度回顧了情緒理論的研究發(fā)展歷程,給出了按照生理心理學(xué)的研究成果的不同的情緒分類方法,作為情緒模式識別的分類依據(jù)。 針對情感語音研究中所面臨的一些問題,對目前使用的一些情感語音數(shù)據(jù)庫進(jìn)行了分析,指出了不同類型的數(shù)據(jù)庫各自的優(yōu)點(diǎn)和缺點(diǎn)。在列舉目前所存在的所有數(shù)據(jù)庫的同時,從語音情感識別的角度對數(shù)據(jù)庫的建立提山了一些觀點(diǎn),并將其作為我們創(chuàng)建中文情感語音數(shù)據(jù)庫

3、的基礎(chǔ)?;诒疚牡姆治鲇^點(diǎn)進(jìn)行中文情感語音數(shù)據(jù)庫的建設(shè),我們得到了包括2268個單詞樣本,2916個短句樣本,280個長時語句樣本的中規(guī)模中文情感語音數(shù)據(jù)庫。 利用模糊熵的理論,本文提出了一種特征參數(shù)有效性度量手段。先得到特征參數(shù)相對于情感的模糊關(guān)系矩陣,然后將模糊綜合判決同利用模糊熵的參數(shù)有效性度量相結(jié)合,對情感語句進(jìn)行識別。實(shí)驗(yàn)結(jié)果表明,結(jié)合參數(shù)有效性度量的模糊綜合判決方法能較大提高語音信號的情感識別率,并高于常用的主元分析

4、方法。 漢語音節(jié)的韻律特征對情感表達(dá)起著非常重要的作用。本文提取情感語句中各元音區(qū)間的聲學(xué)參數(shù)組成時序結(jié)構(gòu)特征。由于元音數(shù)目的不同,對不同長短的語句的時序結(jié)構(gòu)特征進(jìn)行了規(guī)整。采用最長的句子為基準(zhǔn),將較短的句子的時序結(jié)構(gòu)與基準(zhǔn)對齊而進(jìn)行規(guī)整,并提出了3種不同的規(guī)整方法。傳統(tǒng)的QDF方法中,計算協(xié)方差矩陣所必要的乘法次數(shù)隨著參數(shù)的維數(shù)增加,會導(dǎo)致計算量和內(nèi)存所占容量變得很大。同時,協(xié)方差矩陣的推定誤差將增大,從而降低判別的性能。因此

5、,本文提出了一種新的修正二次判別函數(shù)(MQDF)。研究結(jié)果表明,利用了時序結(jié)構(gòu)特征與采用修正二次函數(shù)相結(jié)合的方法,可以較高的提高語音情感識別效率。 利用支持向量機(jī),本文對語音情感識別的二分模式識別和多模式識別進(jìn)行了研究。在二分模式的情感語音識別實(shí)驗(yàn)中,比較了線性映射和高斯核函數(shù)的映射方法。結(jié)果表明非線性的映射能夠改善情感的分類效果。在多模式情感實(shí)驗(yàn)中,選用“One-Against-All”的SVM網(wǎng)絡(luò)進(jìn)行.4類語音情感的識別。選

6、擇具有連續(xù)輸出的函數(shù)作為軟判決,然后選擇具有最大輸出值的類別作為最終的輸出。將多模式的SVM判決方法同PCA方法進(jìn)行比較,結(jié)果表明使用SVM對語音情感進(jìn)行識別效率大大高于其他識別方法。 本文研究了利用基音的統(tǒng)計模型信息來進(jìn)行語音情感的識別方法。提出一種變窗口的ParZen窗法估計方法對基音的統(tǒng)計模型進(jìn)行估計,防止了分布模型在高頻部分的抖動和低頻部分的延伸。通過采用巴氏距離(Bhattacharyya Distance)來衡量不同

7、的分布模型之間的距離,并將這個距離作為模式識別的參數(shù)之一。利用KNN方法對情感語料進(jìn)行了識別實(shí)驗(yàn),結(jié)果表明基音的統(tǒng)計模型參數(shù)的引入能夠較明顯的提高情感語基音和共振峰的衍生形式經(jīng)常被用來作為特征參數(shù)進(jìn)行語音信號的情感識別。這些參數(shù)和人的生理構(gòu)造有著密切的關(guān)系,不同的性別上之間具有差異。為消除這些性別差異,本文提出了基于性別分離的特征參數(shù)規(guī)整方法。利用基于模糊熵的有效性度量方法對情感特征參數(shù)的有效性進(jìn)行度量,表明消除性別差異使得特征參數(shù)具有

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論