智能數(shù)字助聽器中聲場景分類的研究.pdf_第1頁
已閱讀1頁,還剩90頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、隨著社會的不斷發(fā)展,老齡化問題越來越突出,這促使了人們對耳聾問題的關注,助聽器的發(fā)展開始受到人們的普遍重視。聲場景分類作為智能數(shù)字助聽器的核心技術,其算法處于信號處理的前端,能夠識別出助聽器使用者當前的聽覺場景,自適應地調用相應的處理程序,實現(xiàn)針對不同場景聲信號的個性化處理。本質上講,聲場景分類屬于環(huán)境聲識別問題,主要包括兩個方面:特征提取和分類。特征提取是對聲信號進行維數(shù)約減,提取出能代表原始信號的數(shù)據(jù);而分類是指通過一定方法編碼聲特

2、征,并與模板數(shù)據(jù)庫進行比對以確定聲信號所屬類別。
  本文主要圍繞選擇性注意模型、傳統(tǒng)的HMM模型和深度學習模型來展開對聲場景分類的研究。在特征提取方面,本文通過對聲信號的語譜圖做顯著性分析,提取出顯著圖特征,再將其與傳統(tǒng)的MFCC特征進行混合,形成混合特征。在分類器方面,本文分別使用傳統(tǒng)的HMM模型和深度學習模型進行分類。本文所做的工作主要有以下幾項:
  1.闡述了聲場景分類技術的研究背景和研究現(xiàn)狀,分析了現(xiàn)有聲場景分類

3、技術的優(yōu)缺點,并對當前有待深入研究和急需解決的問題進行了說明。
  2.概述了聲場景分類的理論基礎,介紹了聲場景分類的幾個模塊,包括預處理模塊、特征提取模塊、分類器訓練模塊和測試模塊,并介紹了聲場景分類特征提取和分類器設計方面的相關知識。
  3.深入研究了選擇性注意模型,包括選擇性注意模型的理論和視覺選擇性注意模型中的兩種常用模型——Itti模型和GBVS模型,并將視覺理論應用于聲學中,完成了對聲信號語譜圖的顯著性分析,提

4、取出了聲信號的顯著圖參數(shù)。
  4.利用提取出的顯著圖參數(shù)得到用于分類的特征向量,再提取出聲信號的MFCC特征,將二者進行混合,組成混合特征,再利用傳統(tǒng)的HMM分類器分別使用單獨的顯著圖特征、單獨的MFCC特征和混合特征完成對聲場景的分類,并比較各自的分類效果。
  5.簡述了深度學習的發(fā)展歷程、主要模型和應用,介紹了深度學習常用方法,包括自動編碼器、稀疏自動編碼器和受限玻爾茲曼機,介紹了Gibbs采樣過程和對比散度算法,將

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論