版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、人工智能及識別技術(shù)文章編號:文獻(xiàn)標(biāo)識碼:中圖分類號:TN912.34半連續(xù)半連續(xù)HMMHMM碼本生成算法的研究碼本生成算法的研究李軍,朱小燕,王東(清華大學(xué)智能技術(shù)與系統(tǒng)國家重點實驗室,北京100084)摘要:要:本文對基于半連續(xù)隱馬爾科夫模型(SCHMM)語音識別系統(tǒng)的碼本生成算法及其原理進(jìn)行了探討。闡述了譯碼器擾動簡化隨機(jī)松弛聚類算法(SRD),并將其應(yīng)用到初始碼本生成中。實驗結(jié)果表明這種方法能顯著地提高系統(tǒng)性能。初始碼本生成后,采
2、用最大似然準(zhǔn)則對生成的碼本進(jìn)行了訓(xùn)練,使得碼本和SCHMM其它參數(shù)達(dá)到較好的一致。本文也探討了碼本大小及其對最終性能的影響并給出了相關(guān)實驗結(jié)果。關(guān)鍵詞:關(guān)鍵詞:SCHMM,聚類,碼本,隨機(jī)松弛TheResearchofCodebookGenerationAlgithminSCHMMLiJunZhuXiaoyanWangDong(StateKeylabofIntelligentTechnologySystemTsinghuaUnivers
3、ityBeijing100084)【Abstract】ThispaperdiscussedthealgithmsofcodebookgenerationinSCHMMbasedspeechrecognitionsystemtheirfundamentalprinciple.IntroducingthebasicdisciplineofStochasticRelaxationDivision(SRD)algithmweintroduced
4、thegeneralideaintoourinitialcodebookgenerationalgithm.Theexperimentresultsshowthatournewmethodsignificantlyimprovesthesystemperfmance.WiththemodifiedinitialcodebookthemodelisfurthertrainedwiththecriterionofMaximumLikelih
5、ood(ML)whichleadsthecodebookotherparametersmeconsistentcompatible。Theeffectofcodebooksizetofinalperfmanceisalsodiscussedrelativeexperimentresultsarepresented.【Keywds】SCHMMclusteringcodebookStochasticrelaxationSCHMM作為一種有效
6、的語音識別技術(shù),是離散隱馬爾科夫模型(DHMM)和連續(xù)隱馬爾科夫模型(CHMM)的一種折衷方案。它既克服了DHMM識別精度較低的缺點又降低了CHMM計算的復(fù)雜性,因而是一種相當(dāng)好的語音識別技術(shù)。SCHMM之所以能做到這一點,主要是因為SCHMM使用了一組特殊的碼本。這組碼本由所有模型和所有狀態(tài)共享。它相當(dāng)于連接DHMM和CHMM的橋,是決定整個SCHMM系統(tǒng)性能的關(guān)鍵因素之一。碼本在SCHMM中的重要性集中反映在碼本的初值和數(shù)量上。好的
7、初值能夠總體上接近各模型的質(zhì)心,因而在調(diào)整碼本過程中收斂較快并且容易達(dá)到或接近全局最優(yōu),相反,如果某個模型附近沒有碼本,它在調(diào)整碼本過程中對整個碼本調(diào)整趨勢的影響力降低以至于碼本更加遠(yuǎn)離它,自然地,碼本對這個模型的刻畫精度就低;如果某個碼本附近沒有模型,那么所有模型對該碼本的權(quán)重都較小以至于區(qū)別不大,這種情況造成的結(jié)果是該碼本的方差迅速減小,均值變化不大,它對整個模型的刻畫能力大大降低,從而成為垃圾碼本。因此,碼本初值的好壞對半連續(xù)模型
8、相當(dāng)重要。另外,由于碼本是所有模型和狀態(tài)共享的,多少碼本才能較好地刻畫整圍內(nèi),也就是說,擾動可以到達(dá)這些碼字。根據(jù)擾動矢量設(shè)計規(guī)則,對i區(qū)域,可以表示為:0T=表示第一次最佳劃分的第i個0T??iiYYd112?,iY1區(qū)域的碼字,為i區(qū)域內(nèi)與畸變最大的矢量,iY1?iY1代表兩矢量間歐氏距離的平方。對每一個??yxd2區(qū)域做同樣的計算,選擇其中的最大者作為值,0T這樣能夠較好地保證有效的擾動范圍,有利于下次區(qū)域劃分向理想碼字靠近。由于
9、以后的新區(qū)域都是經(jīng)過最佳劃分的,比前一次劃分的區(qū)域更加靠近理想碼字,需要擾動的范圍也會比前一次小,因此按上式所給的初始退火溫度是夠用的。熄火溫度可根據(jù)精度要求給出。SRD算法見圖1。所求出的M個碼字可作為碼本的均值,然后再利用已求出的M個碼字對訓(xùn)練集進(jìn)行M個區(qū)域劃分,在每個區(qū)域計算均方差。從而可求得M個碼字的均方差。這樣M個碼字的初始碼本就形成了。2基于最大似然準(zhǔn)則的基于最大似然準(zhǔn)則的SCHMM碼本的訓(xùn)練碼本的訓(xùn)練初始碼本生成以后,對S
10、CHMM來說不是最好的,必須在SCHMM統(tǒng)一的框架下進(jìn)行訓(xùn)練,從而對初始碼本進(jìn)行適當(dāng)?shù)恼{(diào)整。調(diào)整碼本的過程也是語音訓(xùn)練的過程。利用訓(xùn)練中產(chǎn)生的參數(shù)來調(diào)整碼本的均值和方差。SCHMM中主要參數(shù)是:初始狀態(tài)概率狀態(tài)轉(zhuǎn)移概率碼本權(quán)重及碼本的均值和均方差。訓(xùn)練的目的就是調(diào)整這些參數(shù),使特定模型相對于某些語音幀輸出的概率最大,從而完成識別的任務(wù)。訓(xùn)練的方法是給以上參數(shù)一定的初值,然后進(jìn)行迭代運(yùn)算逐漸逼近最佳解。在每次迭代中,所有模型都利用自己的訓(xùn)
11、練語料求出自身新的參數(shù),然后計算碼本新的均值和方差。再進(jìn)行下一輪迭代,直到滿足精度要求為止。其中碼本的初值采用SRD算法已獲得,其它參數(shù)的初值可通過賦予平均數(shù)或根據(jù)具體情況賦值,因為這些參數(shù)的初值對迭代結(jié)果影響不大。計算SCHMM參數(shù)的一種有效方法是前后項算法。利用該算法可以高效地計算出前項系數(shù)和后項系數(shù),而前后項系數(shù)是計算SCHMM參數(shù)的關(guān)鍵。下面給出與計算SCHMM的均值和方差相關(guān)的公式,在公式中所引用的變量包括:初始狀態(tài)概率狀態(tài)轉(zhuǎn)
12、移概率碼本權(quán)重lajiA碼本的均值均方差前項系數(shù)jBjMj?,后項系數(shù),概率密度函數(shù)P(x),模??ln???ln?型的狀態(tài)數(shù)L,k樣本語音幀數(shù)Nk。樣本數(shù)K,模型數(shù)R。碼本數(shù)J。計算計算θ值的公式:值的公式:?????????????????????????????????LikkrnkrnrnjljilrkrrjljkrlkljrNnliyPbAnlyPbn1111~21?????θ參數(shù)是計算SCHMM參數(shù)的中間結(jié)果,它的含義是r模
13、型第k個樣本第n幀經(jīng)過l狀態(tài)第j個碼字的概率。計算均值計算均值的公式的公式j(luò)M???????????????????????????KkRrLlkNnkljrkrnKkRrLlkNnkljrnynjM11111111??計算均方差計算均方差的公式:的公式:j?F圖1SRD算法流程圖算法流程圖NnTT?T以為初始碼字,進(jìn)行最佳劃??1?niY分并求出M個新碼字。??1?niY?生成擾動,計算新碼字??niY???????nininiYYY
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于半監(jiān)督聚類的爬蟲在線樣本生成算法.pdf
- 基于LBG碼本生成改進(jìn)的說話人識別.pdf
- 橢圓生成算法的研究
- 規(guī)則曲線生成算法的研究97371
- 板自動生成算法的研究.pdf
- 虛擬視點生成算法研究.pdf
- 曲線生成算法的文獻(xiàn)綜述
- 概念格的生成算法.pdf
- Power圖掃描生成算法的研究.pdf
- OpenGL機(jī)載圖形生成算法的研究.pdf
- 基本光柵圖形生成算法研究.pdf
- 基于CUDA的概念生成算法研究.pdf
- 動態(tài)聯(lián)盟結(jié)構(gòu)生成算法的研究.pdf
- 概念格的矩陣生成算法.pdf
- Grobner基生成算法的并行.pdf
- 組合電路測試生成算法研究.pdf
- 概念格的幾種生成算法.pdf
- 基本圖形元素的生成算法
- 等高線生成算法的研究.pdf
- 實時動態(tài)云的生成算法.pdf
評論
0/150
提交評論