版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、隨著人工交互技術(shù)的飛速發(fā)展,越來越多研究者關(guān)注情感計算方面的研究。情感計算在模式識別中開辟了研究語音情感識別的新領(lǐng)域,讓機器在聽懂人類語言內(nèi)容的同時也能夠識別說話人的當(dāng)前情感狀態(tài)。然而目前情感語音識別系統(tǒng)的發(fā)展還不夠完善,存在訓(xùn)練集質(zhì)量不純、沒有確定最能表征情緒狀態(tài)的特征參數(shù)和識別模型缺乏穩(wěn)定性、高效性等問題,因此本文針對上述問題開展研究,有利于情感語音識別技術(shù)的發(fā)展,同時促進(jìn)人工智能的學(xué)術(shù)研究和工程應(yīng)用領(lǐng)域的發(fā)展。
本論文基
2、于傳統(tǒng)語音情感識別模型框架,對基于級聯(lián)式語音情感識別模型展開研究。本文主要內(nèi)容如下:
?。?)設(shè)計了一個SVM級聯(lián)式語音情感識別模型總體框架。該框架包含語音增強方法、情感特征選取和級聯(lián)式識別模型三個設(shè)計模塊,其中語音增強方法模塊包括字典學(xué)習(xí)階段和語音增強階段;情感特征選取包括特征選擇和特征篩選;級聯(lián)式識別模型模塊結(jié)合多級分類理論,從語音情感數(shù)據(jù)預(yù)處理開始,選擇及篩選情感特征并搭建及優(yōu)化級聯(lián)式識別模型。
?。?)提出了基于
3、一步字典學(xué)習(xí)(One-stage dictionary learning,OS-DL)的語音增強方法。該方法首先采用初始化系數(shù)矩陣方法為帶相干性準(zhǔn)則的批量最小角回歸(Batch LARS with coherence criterion,LARC)算法的OS-DL算法分別學(xué)習(xí)得到純凈語言、噪音和帶噪語音的幅度譜字典;接著將純凈語言和噪音的聯(lián)合譜字典作為LARC算法的輸入,對帶噪語音幅度譜進(jìn)行稀疏表示;最后將得到的稀疏系數(shù)矩陣用來估計純凈
4、語音幅度譜,并基于帶噪語音的相位信息重構(gòu)出純凈語音。實驗結(jié)果表明,在不同信噪比下,所提語音增強方法均能很好地抑制噪聲,在提高語音質(zhì)量的同時減少計算復(fù)雜度。
?。?)提出了新的語音情感特征選取方案。該方案首先從情感語音預(yù)處理出發(fā),基于傳統(tǒng)的情感特征選取方法提出新的低維特征組合方案;然后確定合適的篩選方法及各參數(shù)的值;接著在CASIA情感語料庫數(shù)據(jù)集上驗證了不同的單一識別算法下所提取方案的可行性和準(zhǔn)確性;最后圍繞識別效果最佳的一種識
5、別算法,分析各個情緒之間的特征混淆度。仿真實驗表明,所提特征選取方案有效地緩解了維度災(zāi)難和情緒混淆度大的問題。
?。?)提出了基于SVM級聯(lián)式語音情感識別模型設(shè)計模塊。該模型結(jié)合級聯(lián)分類策略和SVM分類器具有較強的逼近、泛化能力,首先提出了兩種級聯(lián)式情感識別模型;然后分析各級分類器的分類結(jié)果,選擇合適的分類器及確定各參數(shù)的值;接著選擇識別率最高的模型,并將已選好的模型進(jìn)行擴展;最后對模型結(jié)構(gòu)進(jìn)行優(yōu)化。仿真實驗表明,此識別模型能夠
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于SVM的語音情感識別研究.pdf
- 基于SVM和HMM混合模型的語音情感識別和性別識別.pdf
- 基于SVM的漢語語音情感識別研究.pdf
- 基于SVM的漢語語音情感識別的研究.pdf
- 基于遺傳優(yōu)化的多級SVM語音情感識別.pdf
- 基于粗糙集和SVM的語音情感識別.pdf
- 基于SVM的語音情感識別和情感特征參數(shù)的研究.pdf
- 基于GMM-UBM-SVM中文情感語音識別的研究.pdf
- 基于HMM模型的語音情感識別的研究.pdf
- 基于SVM-CRF多分類器融合的語音情感識別研究.pdf
- 基于Boosting的語音情感識別.pdf
- 基于“產(chǎn)生-判別”混合模型的語音情感識別研究.pdf
- 基于語義模型的情感語音識別技術(shù)研究.pdf
- 基于HMM和RBF混合模型的語音情感識別.pdf
- 基于雙層分類模型的實時語音情感與音素識別.pdf
- 基于HMM的情感語音識別.pdf
- 高斯混合模型用于語音情感識別研究.pdf
- 基于高斯混合模型的語音情感識別研究與實現(xiàn).pdf
- 基于多級分類的語音情感識別.pdf
- 語音情感識別研究.pdf
評論
0/150
提交評論