基于感知的語(yǔ)音編解碼系統(tǒng)研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩116頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、語(yǔ)音通信是一種高效的信息交流方式。在實(shí)際環(huán)境中,語(yǔ)音信號(hào)會(huì)受到外界環(huán)境的影響,而網(wǎng)絡(luò)傳輸會(huì)進(jìn)一步引入干擾。隨著移動(dòng)通信系統(tǒng)的飛速發(fā)展,各種通信組織相繼推出了和完善了包括變速率語(yǔ)音編碼和立體聲語(yǔ)音編碼等標(biāo)準(zhǔn)。如何獲得更好的音質(zhì)效果,涉及到語(yǔ)音編碼、語(yǔ)音增強(qiáng)、解碼語(yǔ)音信號(hào)的后處理等多個(gè)方面。語(yǔ)音的音質(zhì)通過(guò)人的聽(tīng)覺(jué)感受來(lái)檢驗(yàn),而人的聽(tīng)覺(jué)系統(tǒng)是一個(gè)復(fù)雜的心理、生理和物理的轉(zhuǎn)換過(guò)程實(shí)現(xiàn)的。在帶噪語(yǔ)音中,如何獲得純凈語(yǔ)音,提高語(yǔ)音的清晰度和可懂度是

2、研究的重點(diǎn),涉及的主要研究工作如下:
   當(dāng)殘留噪聲處于聽(tīng)覺(jué)掩蔽之下時(shí),噪聲的感知會(huì)被大大減輕。子空間增強(qiáng)方法首先通過(guò)移除噪聲子空間,然后通過(guò)對(duì)加入權(quán)重系數(shù)的信號(hào)子空間的逆變換獲得純凈語(yǔ)音。人耳的掩蔽特性是和關(guān)鍵頻帶相關(guān),并且關(guān)鍵頻帶是根據(jù)人耳耳蝸的特性推理出來(lái)的,所以子空間去噪如果需要利用掩蔽性質(zhì),需要頻率域到特征域的轉(zhuǎn)換。在計(jì)算自相關(guān)矩陣后,通過(guò)特征分解獲得特征值和特征向量矩陣。通過(guò)功率譜密度計(jì)算掩蔽門限值,再利用特征濾波

3、器增益計(jì)算線性預(yù)測(cè)矩陣,反變換后獲得增強(qiáng)后的語(yǔ)音。
   語(yǔ)音的基音和諧波成分有著明顯的周期性。相對(duì)而言,波峰比波谷對(duì)聽(tīng)覺(jué)感知的影響重要的多。自適應(yīng)變速率編碼(Adaptive MulTiRate,AMR)按照感知權(quán)重最小的標(biāo)準(zhǔn)為線性預(yù)測(cè)系數(shù)搜索激勵(lì)信號(hào)。按照聽(tīng)覺(jué)掩蔽理論,人耳對(duì)共振峰處的噪聲感知相對(duì)較不敏感。在開(kāi)環(huán)基音搜索前,輸入語(yǔ)音會(huì)通過(guò)一個(gè)感知加權(quán)濾波器。系數(shù)的調(diào)整來(lái)控制濾波器的響應(yīng)。根據(jù)能量值,可以粗略判斷該幀是否為語(yǔ)音

4、幀。通過(guò)設(shè)定門限值,使用梳狀濾波器強(qiáng)化語(yǔ)音中的周期成分而弱化噪聲,能取得較好的去噪效果。
   當(dāng)網(wǎng)絡(luò)傳輸質(zhì)量較差時(shí),信道也無(wú)法進(jìn)行差錯(cuò)控制,解碼段會(huì)接收到錯(cuò)誤的幀信號(hào)。一般的錯(cuò)誤隱藏方法會(huì)根據(jù)周圍正確幀的信號(hào)進(jìn)行插值或者替換重建錯(cuò)誤幀。自適應(yīng)碼本的相關(guān)性會(huì)影響錯(cuò)誤幀的恢復(fù)速度。當(dāng)能量較高時(shí),限定其對(duì)激勵(lì)信號(hào)的貢獻(xiàn)可以減少幀間相關(guān)性。當(dāng)連續(xù)收到錯(cuò)誤幀時(shí),基音值不是簡(jiǎn)單自增,而是在一定范圍內(nèi)波動(dòng),可以避免偏差值的累計(jì)。增益系數(shù)的修

5、整也可以在錯(cuò)誤幀結(jié)束后,盡快恢復(fù)正常解碼。
   嵌入式技術(shù)的特點(diǎn)非常適合目前終端市場(chǎng)的發(fā)展趨勢(shì)。考慮到嵌入式設(shè)備資源的有限性,需要減少應(yīng)用程序計(jì)算的復(fù)雜度。在基于ARM的手機(jī)平臺(tái)上,對(duì)自適應(yīng)變速率編碼進(jìn)行了移植和優(yōu)化。在該語(yǔ)音標(biāo)準(zhǔn)中,代數(shù)碼本的搜索是一個(gè)重要且復(fù)雜的環(huán)節(jié)。在不同的軌道中,包含著對(duì)應(yīng)的脈沖。通過(guò)按照加權(quán)輸入語(yǔ)音與加權(quán)重構(gòu)語(yǔ)音之間的均方誤差最小的標(biāo)準(zhǔn),對(duì)不同的位置進(jìn)行搜索。整個(gè)搜索是嵌套進(jìn)行的,這帶來(lái)了較大的計(jì)算量

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論