語音情感識別的關鍵技術研究.pdf_第1頁
已閱讀1頁,還剩156頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、語音情感識別是人工智能領域的一個新興分支,在自然人機交互、多媒體分段與檢索、安全系統(tǒng)自動監(jiān)管等方面有著廣泛的應用前景。語音情感識別過程包括語音信號預處理、聲學特征提取、特征向量降維處理和基于統(tǒng)計模型的情感識別。本文的工作主要集中于語音情感識別過程中的若干關鍵問題。提出情感語料庫的可視化方法、半監(jiān)督機制的語音情感識別、非線性特征降維算法ELE以及基于對話關聯(lián)矩陣的情感識別技術。 探討情感語料庫的采集、扔注和可視化技術。構建包括表演

2、語料、引導語科和自然語料的中文情感語料庫CHAD。通過聽辨實驗,分析和比較不同來源的語料。將情感語料的高維聲學特征通過Sammon's算法映射,得到二維可視化空間圖MASEMAP?;趫D中的位置分布分析語料的情感表達以及各情感間的獨立與依賴關系。 在分析各聲學特征及其提取算法的基礎上,改進co-training算法,提出半監(jiān)督機制的語音情感識別。該算法結合時域特征和倒譜特,征,以未標注語料擴充訓練語料集,提高情感識別率7.4%-

3、9.0%0通過改變未標注語料的加入規(guī)則,減小出予錯誤接納未標注語料造成的分類噪聲。 探究各種特征降維算法。在分析線性特征抽取算法的基礎上,提出一個分層次的語音情感識別系統(tǒng)。不同特性的語料采用不同的降維算法,提高系統(tǒng)的整體性能。在非特定人情感識別中取得78.7%-83.4%的識別率。提出ELE非線性流形學習算法?;跍y地距離估算法,高維特征點被投影到六維子空間中。同一情感狀態(tài)的特征點聚集在子空間的一個平面附近。該分布規(guī)律有利于情感

4、語料的分離?;贓LE的非特定人情感識別取得9%-26%的識別率提高,特定人的結果提高5%-20%0提出LDA-Ll-Rank特征選擇算法,并與PCA-Ll-Rank進行對比實驗。在語音情感識別中,引入結合類集和類對的特征選擇算法。綜合考慮優(yōu)于分離所有類別和某兩個類別的特征,兼顧全局和局部的特征分布特性?;谠撍惴ǖ姆翘囟ㄈ饲楦凶R別的平均Fl衡量提高3.2%-8.4%。 在純語音情感識別的基礎上,進一步研究結合其他信息的情感識別

5、。采集和分析對話情感語料后,提窶對話情感關聯(lián)矩陣。對話雙方的情感約束提商了情感識別的正確率和魯棒性。結合人臉表情,實現(xiàn)雙模態(tài)情感識別。提出THMM模型及相關的Viterbi最路徑搜索算法和分段式K-means模型訓練算法。通過設置通道權重最大化融合視覺和語音信息,取得91.9%的平均識別率,識別結果也更為魯棒。根據實用化的要求,調查噪聲環(huán)境下豹情感識別。疊加受控噪聲的情感語料在提取聲學特征后,采用本文提出的ELE算法進行特征降維。優(yōu)于其

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論