基于主動學習機制的聲學模型擴充方法.pdf_第1頁
已閱讀1頁,還剩65頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、語音作為最自然、最方便的傳遞方式,在人類社會中無處不在。尤其在信息和多媒體技術迅猛發(fā)展的今天,語音通信網(wǎng)絡和計算機互聯(lián)網(wǎng)上的語音數(shù)據(jù)正以迅猛的趨勢增長。對這些數(shù)據(jù)進行分析和處理,并獲取人們感興趣的信息,具有重要的理論意義和實用價值。作為語音信息處理的核心技術,語音識別以讓機器將語音信號轉化成文字信息為目標而備受關注。讓機器聽懂人類的說話,一直是科技的夢想,語音識別技術在語音分析、智能化控制等領域有著廣泛的應用前景和商業(yè)價值。
  

2、近年來,語音識別一直是語音處理領域研究的熱點,吸引了很多學者展開廣泛而深入的研究,取得了大量的研究成果。尤其是基于隱馬爾可夫模型的方法出現(xiàn)后,語音識別的性能得到了大幅度的提升。然而許多在實驗室中性能較好的識別器,拿到實際環(huán)境中卻表現(xiàn)的不盡如人意,這成為制約語音識別技術實用化的關鍵因素。究其原因,模型不匹配問題扮演了重要的角色,即訓練得到的識別模型不能很好的匹配實際環(huán)境的語音數(shù)據(jù)?;陔[馬爾可夫模型的語音識別方法,本質上是利用統(tǒng)計模型來刻

3、畫訓練數(shù)據(jù)中所蘊含的聲學知識和語言學知識,其識別效果的好壞依賴于訓練數(shù)據(jù)的多少以及數(shù)據(jù)的覆蓋寬度,而實際的訓練數(shù)據(jù)總是有限的不充分的,不可能覆蓋所有的發(fā)音情況。
  考慮到人類學習的方式之一是在錯誤中學習,通過不斷的消化錯誤知識,不斷的主動學習、累積學習,從而持續(xù)擴充和校正頭腦中的認知??梢詫⑦@樣的學習方式運用到語音識別中,通過對錯誤識別的語音數(shù)據(jù)進行學習,轉化為新的模型知識,擴充已有的模型。這樣不斷的學習,去減輕模型不匹配現(xiàn)象。

4、要達到上述目的,需要解決如下兩個問題:(1)聲學模型的擴充問題,如何將新獲得的語音知識加入到已有的聲學模型中去,考慮到現(xiàn)有的語音識別技術大多基于統(tǒng)計的方法實現(xiàn),顯然聲學模型擴充不能直接完成;(2)累積式學習問題,這樣一種從錯誤中學習的過程顯然應該是一個長期的、持續(xù)的、在線的過程,是一個不斷修正的過程,然而面對現(xiàn)有的語音識別技術框架,如何實現(xiàn)這一學習過程成為本文研究重點。
  本文圍繞著上述問題開展了一系列的研究工作,針對基元同構和

5、異構兩種情況,提出了聲學模型擴充方法,并結合主動學習機制,來解決聲學模型擴充中的累積式學習問題。主要研究工作如下:
 ?。?)提出了基于MAP的聲學模型擴充方法。擴充的聲學模型采用與原模型相同的基元形式,并研究了基于MAP模型自適應方法的新模型生成方法,并在保留原有聲學模型的基礎上向其添加新模型。
 ?。?)提出了聲學基元異構條件下的聲學模型擴充方法。為了減少添加模型的規(guī)模,以音節(jié)為基元來訓練新擴充的聲學模型。為了平衡基元異

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論