版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、提高語音識別精度一直是自動語音識別研究領(lǐng)域所關(guān)注的核心問題之一。本文分別從單系統(tǒng)以及多系統(tǒng)聯(lián)合解碼方面展開研究,以提高大詞匯量連續(xù)語音識別的系統(tǒng)識別精度。首先基于單詞識別精度評價準則考虐,本文對貝葉斯風險準則的解碼方法提出多種創(chuàng)新實現(xiàn),這不但為解碼方法提供更多有價值的參考,而且能更好地改善系統(tǒng)的識別性能?;诟鞣N單系統(tǒng)解碼方法,本文還對多系統(tǒng)聯(lián)合解碼進行了大量地研究,為全面改善語音系統(tǒng)的識別性能提供更多的途徑。最小音子誤差區(qū)分性訓練方法
2、在大詞匯量連續(xù)語音識別中對改善系統(tǒng)性能方面取得了顯著效果,究其本質(zhì),它是一廣義的貝葉斯風險準則。其基本思想是通過更新模型參數(shù)優(yōu)化目標函數(shù),使得模型的區(qū)分性性能得到提高。受其啟發(fā),本文提出一種最小音子誤差準則的解碼方法。該方法在實現(xiàn)中以字圖為假設(shè)空間,以N.最佳句子列表為假設(shè)參考空間,利用前后向算法估計假設(shè)參考相對字圖的平均正確度,而目標是從N.最佳句子列表中選取使目標字圖平均正確度最大的假設(shè)參考作為解碼結(jié)果。該解碼方法的顯著優(yōu)點是實現(xiàn)簡
3、單、效果明顯。為進一步研究該解碼方法的性能,文中對其解碼結(jié)果與N-最佳句子列表容量關(guān)系進行了研究,發(fā)現(xiàn)較小的N.最佳句子列表即能使其解碼性能達到飽和。另外,本文還研究了改進的正確度計算方法,將一個局部優(yōu)化問題轉(zhuǎn)化為全局優(yōu)化問題求解,從理論上減小局部優(yōu)化方法所造成的近似。
基于最小音子誤差解碼方法對單系統(tǒng)解碼的成功應(yīng)用,本文另一研究重點是利用該方法實現(xiàn)多系統(tǒng)聯(lián)合解碼。為此,本文提出兩種系統(tǒng)聯(lián)合解碼方法。一種是改進的N.最佳投
4、票方法,該方法通過優(yōu)化聯(lián)合目標函數(shù)從合并的N.最佳句子列表中選擇若干個最優(yōu)的解碼結(jié)果。第二種多系統(tǒng)聯(lián)合解碼方法為改進的N.最佳句子列表解碼方法,該方法以混清網(wǎng)絡(luò)為假設(shè)參考空間,通過遍歷混淆網(wǎng)絡(luò)搜索基于聯(lián)合目標函數(shù)最優(yōu)的解碼結(jié)果。以上兩種系統(tǒng)聯(lián)合解碼方法都取得改進的識別結(jié)果。
最小音子誤差解碼方法雖然在單系統(tǒng)和多系統(tǒng)聯(lián)合解碼任務(wù)中對系統(tǒng)識別性能有顯著的改善,但它的不足之處是在多系統(tǒng)聯(lián)合解碼實現(xiàn)方面不直接,計算量偏大。為此文中
5、提出一種迭代實現(xiàn)的貝葉斯風險解碼方法。該解碼方法通過三個子算法完成:首先通過二維前向算法估計假設(shè)參考相對目標字圖的期望誤差(風險值):其次,依據(jù)前向算法中獲取的對齊信息,利用改進的后向算法累積字圖中單詞標注與假設(shè)參考每一位置對齊的似然度;最后利用累積的似然度更新假設(shè)參考,重復(fù)迭代直至估計風險不再降低為止。該優(yōu)化方法與離散的期望最大化優(yōu)化方法類似,通過迭代更新假設(shè)參考優(yōu)化目標函數(shù)。在結(jié)果形式上,迭代的貝葉斯風險解碼方法類似于混淆網(wǎng)絡(luò),混淆
6、集為相互支持或競爭的單詞標注組成。為表明該解碼方法在目標近似和收斂特性上具有嚴格的理論依據(jù),文中證明該算法的估計風險值為理論風險值的上限,同時證明該算法在有限步迭代后收斂。在多系統(tǒng)聯(lián)合解碼方面,該迭代解碼方法的顯著優(yōu)點是通過聯(lián)合目標函數(shù)直接在不同系統(tǒng)中累積統(tǒng)計分量,避免在不同分量系統(tǒng)之間進行動態(tài)規(guī)劃運算,使分量系統(tǒng)的結(jié)果充分地融合,以得到更好的解碼結(jié)果。不但如此,對迭代的貝葉斯風險解碼方法而言,單系統(tǒng)解碼只是多系統(tǒng)解碼的一個特例,因此能
7、將單系統(tǒng)解碼和多系統(tǒng)聯(lián)合解碼統(tǒng)一起來,實現(xiàn)更為靈活。
為研究迭代的貝葉斯風險解碼的近似特性,本文從三個方面提出改進嘗試.首先為避免極端條件下初始化對解碼結(jié)果造成更大的影響,文章提出基于單詞的廣義損失函數(shù),該損失函數(shù)通過一控制參數(shù)改變其特性,當該控制參數(shù)為一較小正數(shù)時,該損失函數(shù)近似為概率密度函數(shù),反之,該損失函數(shù)等價于常規(guī)的0-1損失函數(shù)。通過廣義損失函數(shù),不但使得迭代的貝葉斯風險解碼實現(xiàn)靈活,而且使其魯棒性得到了增強:其
8、次,本文提出了基于模擬隨機退火的迭代解碼方法,通過設(shè)定不同初始溫度和溫度改變量搜索最優(yōu)解。對比該隨機迭代解碼方法取得的識別結(jié)果,實證了確定性迭代解碼方法具有極好的近似特性。最后,為減小因字圖拓撲結(jié)構(gòu)對估計風險可能造成過分近似的影響,文章分別提出前后向字圖展開方法,對該假設(shè)進行了充分的驗證。
本文最后為體現(xiàn)研究問題的應(yīng)用價值,文章對基于貝葉斯風險的系統(tǒng)聯(lián)合解碼的實際應(yīng)用展開研究。它的直接動機源于貝葉斯風險準則的系統(tǒng)聯(lián)合解碼方
9、法能顯著改善識別結(jié)果,因此,用多系統(tǒng)的聯(lián)合解碼結(jié)果顯然有助于無監(jiān)督的系統(tǒng)自適應(yīng)性能的改善,后者在廣播語音自動標注方面有著廣泛的應(yīng)用前景。基于聯(lián)合解碼結(jié)果,文中分別用最大似然線性回歸方法以及最大后驗概率方法對模型參數(shù)進行自適應(yīng)訓練,發(fā)現(xiàn)經(jīng)過以上兩種自適應(yīng)方法訓練后的模型在識別性能上均有顯著的提高。不但如此,模型通過最大似然線性回歸自適應(yīng)方法訓練之后,分量模型之間依然保持性能互補特性,再次將它們聯(lián)合解碼,識別結(jié)果仍然能取得進一步改善。與其對
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 語音識別算法及應(yīng)用技術(shù)研究.pdf
- 多水平貝葉斯模型及應(yīng)用研究.pdf
- 多異常點識別的貝葉斯方法.pdf
- 基于貝葉斯網(wǎng)絡(luò)的軟件需求風險評估技術(shù)研究.pdf
- 基于動態(tài)貝葉斯網(wǎng)絡(luò)的音視頻語音識別模型研究.pdf
- 基于貝葉斯算法的垃圾郵件識別與過濾技術(shù)研究.pdf
- 基于貝葉斯網(wǎng)絡(luò)的智能診斷技術(shù)研究及系統(tǒng)開發(fā).pdf
- 結(jié)構(gòu)參數(shù)識別的貝葉斯估計方法及應(yīng)用研究.pdf
- 現(xiàn)代經(jīng)濟管理中的線性貝葉斯推斷理論與多總體貝葉斯分類識別方法研究.pdf
- 基于貝葉斯的人臉識別.pdf
- 基于貝葉斯模型的文檔分類及相關(guān)技術(shù)研究.pdf
- 基于貝葉斯壓縮感知理論與技術(shù)研究.pdf
- 基于貝葉斯網(wǎng)絡(luò)的事件處理技術(shù)研究.pdf
- 人臉識別的貝葉斯統(tǒng)計方法.pdf
- 圖像識別應(yīng)用技術(shù)研究.pdf
- 基于貝葉斯策略的人臉識別研究.pdf
- 模式識別貝葉斯方法報告
- 基于最小貝葉斯風險的頻譜感知技術(shù)的研究.pdf
- 貝葉斯網(wǎng)絡(luò)構(gòu)造方法及應(yīng)用研究.pdf
- 基于演化樸素貝葉斯的木馬檢測技術(shù)研究.pdf
評論
0/150
提交評論