版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、語言是實現(xiàn)人與人甚至機(jī)器之間便捷交流的信息工具,而語音信號是實現(xiàn)這種工具功能的介質(zhì)。然而在現(xiàn)實生活生產(chǎn)中,語音信號經(jīng)常會被各種類型的干擾噪聲甚至是自身的反射信號所污染。受污染的語音,由于破壞了信號的結(jié)構(gòu)、增添了干擾成分,就一方面會導(dǎo)致人類主觀聽覺感受質(zhì)量的下降甚至疲勞和厭惡,另一方面嚴(yán)重影響語音內(nèi)容的可懂度。語音增強(qiáng)所要實現(xiàn)的就是要抑制和消除接收信號中的干擾、噪聲以及反射成分,恢復(fù)出干凈的語音信號,從而提高語音的聽覺質(zhì)量和可懂度??梢愿?/p>
2、據(jù)污染噪聲源的不同,將語音增強(qiáng)大體分為語音解混響、分離和降噪等三個問題,分別對應(yīng)著污染源為自身反射產(chǎn)生的干擾成分、其他說話人的干擾語音以及環(huán)境中的干擾噪聲。一般根據(jù)算法所使用通道麥克風(fēng)數(shù)目可以將語音增強(qiáng)算法又大致分為單通道和多通道兩大類。顯然,單通道增強(qiáng)算法是語音增強(qiáng)的基礎(chǔ)和基本方式,也常??梢院投嗤ǖ兰夹g(shù)結(jié)合,所以擁有廣泛的研究基礎(chǔ)和非常重要的研究價值。近些年來互聯(lián)網(wǎng)尤其是移動互聯(lián)網(wǎng)和智能設(shè)備的快速普及,使得語音數(shù)據(jù)的收集越來越方便和
3、大量,這為各種訓(xùn)練學(xué)習(xí)類算法的實現(xiàn)提供了豐富的數(shù)據(jù)原料?;诖耍灿捎趥鹘y(tǒng)語音解混響和降噪方法的局限性和對非平穩(wěn)干擾噪聲的處理能力有限,本文研究了有監(jiān)督學(xué)習(xí)條件下的單通道語音增強(qiáng)技術(shù)。結(jié)合近些年來興起并迅速發(fā)展的字典學(xué)習(xí)和稀疏表示理論和方法,本文針對單通道語音降噪以及解混響和降噪問題進(jìn)行了研究,提出了三種新的算法應(yīng)用于語音增強(qiáng)中。其中主要的工作和創(chuàng)新點列舉如下:
首先,提出了基于區(qū)分性聯(lián)合字典學(xué)習(xí)的單通道語音降噪算法。針對字典
4、學(xué)習(xí)和稀疏表示類算法運用于語音降噪過程中遇到的兩個重要問題:一、如何提高學(xué)習(xí)得到的語音和噪聲字典之間的區(qū)分性;二、如何保持訓(xùn)練學(xué)習(xí)和增強(qiáng)測試兩個階段的稀疏表示的一致性。創(chuàng)新性地提出了結(jié)合約束交叉稀疏表示誤差項和不同字典原子間相關(guān)性項的區(qū)分性聯(lián)合字典優(yōu)化訓(xùn)練方法,促進(jìn)不同字典間的區(qū)分和判別力,從而提高稀疏表示的準(zhǔn)確性。此外,通過訓(xùn)練階段對混合信號的利用,統(tǒng)一了訓(xùn)練學(xué)習(xí)和增強(qiáng)測試兩階段的稀疏表示方式,保持了一致性。通過這兩點的改進(jìn)本文實現(xiàn)了
5、更好的語音增強(qiáng)算法。
其次,針對一般字典學(xué)習(xí)和稀疏表示類單通道降噪算法只是利用了信號時頻幅度譜信息,沒有充分挖掘出帶噪信號中語音和噪聲信號的其他聯(lián)系。本文提出了比率掩碼和掩碼字典的概念,主要是充分利用帶噪信號中的時頻幅度譜中隱含的語音和噪聲的比率掩碼和近似為1的條件,這是由語音和噪聲在時頻譜域上的稀疏性近似保證的。然后,基于字典學(xué)習(xí)和稀疏表示方法,提出了聯(lián)合語音時頻幅度譜和比率掩碼信息的聯(lián)合字典學(xué)習(xí)算法,接著利用訓(xùn)練得到的信號
6、字典和掩碼字典組成的復(fù)合字典對帶噪信號和混合比率掩碼進(jìn)行聯(lián)合稀疏表示得到稀疏表示系數(shù)。將得到的稀疏表示系數(shù)結(jié)合對應(yīng)的信號字典和掩碼字典構(gòu)建不同的掩碼濾波器完成最終的語音降噪。實驗結(jié)果驗證了算法的有效性。
最后,本文研究了單通道語音解混響和降噪問題,指出了之前的基于非負(fù)矩陣分解或者非負(fù)卷積模型的單通道語音解混響和降噪算法存在對房間沖激響應(yīng)比較長情況下的收斂性和計算復(fù)雜度問題,創(chuàng)造性地提出了一種基于兩步序貫的非負(fù)矩陣分解模型的語音
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 單通道語音增強(qiáng)算法的研究.pdf
- 單通道語音水印與語音增強(qiáng)算法研究.pdf
- 單通道語音增強(qiáng)算法的研究與應(yīng)用.pdf
- 單通道語音增強(qiáng)方法研究.pdf
- 單通道語音增強(qiáng)算法的改進(jìn)及DSP實現(xiàn).pdf
- 基于盲源分離的單通道語音增強(qiáng)算法研究.pdf
- 基于噪聲幅度譜估計的單通道語音增強(qiáng)算法研究.pdf
- 基于序貫字典學(xué)習(xí)的單通道語音分離算法研究.pdf
- 有混響條件下的室內(nèi)語音定向研究.pdf
- 基于深度學(xué)習(xí)的單通道語音分離.pdf
- 基于多窗譜的單通道耳語音增強(qiáng)的研究.pdf
- 多媒體學(xué)習(xí)條件下信念對元認(rèn)知監(jiān)控的影響
- 有意學(xué)習(xí)條件下詞匯呈現(xiàn)方式對詞匯記憶的影響.pdf
- 基于半監(jiān)督學(xué)習(xí)的語音情感識別研究.pdf
- 基于改進(jìn)噪聲功率譜估計的單通道語音增強(qiáng)研究.pdf
- 多媒體學(xué)習(xí)條件下信念對元認(rèn)知監(jiān)控的影響.pdf
- 欠定和單通道條件下混合信號定階技術(shù)研究.pdf
- 基于集成學(xué)習(xí)的半監(jiān)督學(xué)習(xí)算法研究.pdf
- 基于稀疏分解的單通道混合語音分離算法研究.pdf
- 主動式半監(jiān)督學(xué)習(xí)算法的研究.pdf
評論
0/150
提交評論