2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩90頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、隨著社會的不斷發(fā)展,老齡化問題越來越突出,這促使了人們對耳聾問題的關(guān)注,助聽器的發(fā)展開始受到人們的普遍重視。聲場景分類作為智能數(shù)字助聽器的核心技術(shù),其算法處于信號處理的前端,能夠識別出助聽器使用者當(dāng)前的聽覺場景,自適應(yīng)地調(diào)用相應(yīng)的處理程序,實(shí)現(xiàn)針對不同場景聲信號的個(gè)性化處理。本質(zhì)上講,聲場景分類屬于環(huán)境聲識別問題,主要包括兩個(gè)方面:特征提取和分類。特征提取是對聲信號進(jìn)行維數(shù)約減,提取出能代表原始信號的數(shù)據(jù);而分類是指通過一定方法編碼聲特

2、征,并與模板數(shù)據(jù)庫進(jìn)行比對以確定聲信號所屬類別。
  本文主要圍繞選擇性注意模型、傳統(tǒng)的HMM模型和深度學(xué)習(xí)模型來展開對聲場景分類的研究。在特征提取方面,本文通過對聲信號的語譜圖做顯著性分析,提取出顯著圖特征,再將其與傳統(tǒng)的MFCC特征進(jìn)行混合,形成混合特征。在分類器方面,本文分別使用傳統(tǒng)的HMM模型和深度學(xué)習(xí)模型進(jìn)行分類。本文所做的工作主要有以下幾項(xiàng):
  1.闡述了聲場景分類技術(shù)的研究背景和研究現(xiàn)狀,分析了現(xiàn)有聲場景分類

3、技術(shù)的優(yōu)缺點(diǎn),并對當(dāng)前有待深入研究和急需解決的問題進(jìn)行了說明。
  2.概述了聲場景分類的理論基礎(chǔ),介紹了聲場景分類的幾個(gè)模塊,包括預(yù)處理模塊、特征提取模塊、分類器訓(xùn)練模塊和測試模塊,并介紹了聲場景分類特征提取和分類器設(shè)計(jì)方面的相關(guān)知識。
  3.深入研究了選擇性注意模型,包括選擇性注意模型的理論和視覺選擇性注意模型中的兩種常用模型——Itti模型和GBVS模型,并將視覺理論應(yīng)用于聲學(xué)中,完成了對聲信號語譜圖的顯著性分析,提

4、取出了聲信號的顯著圖參數(shù)。
  4.利用提取出的顯著圖參數(shù)得到用于分類的特征向量,再提取出聲信號的MFCC特征,將二者進(jìn)行混合,組成混合特征,再利用傳統(tǒng)的HMM分類器分別使用單獨(dú)的顯著圖特征、單獨(dú)的MFCC特征和混合特征完成對聲場景的分類,并比較各自的分類效果。
  5.簡述了深度學(xué)習(xí)的發(fā)展歷程、主要模型和應(yīng)用,介紹了深度學(xué)習(xí)常用方法,包括自動(dòng)編碼器、稀疏自動(dòng)編碼器和受限玻爾茲曼機(jī),介紹了Gibbs采樣過程和對比散度算法,將

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論