版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、國家語委于2008年10月啟動了“中國語言資源有聲數(shù)據(jù)庫建設(shè)”的項(xiàng)目,江蘇省于2013年9月率先完成了江蘇方言有聲數(shù)據(jù)庫的建設(shè),其他省市數(shù)據(jù)庫的建設(shè)也正陸續(xù)展開。為確保方言有聲數(shù)據(jù)庫的質(zhì)量,需要對人工記音的內(nèi)容進(jìn)行校對,而人工校對耗時耗力。自動校對是自然語言處理的一個重要的研究領(lǐng)域,借助計(jì)算機(jī)對人工記音的內(nèi)容進(jìn)行自動校對可以減輕人工勞動的工作量,提高工作效率。
本文以有聲數(shù)據(jù)庫中方言單字記音存在的漏記和錯記現(xiàn)象為校對目標(biāo),運(yùn)用
2、語音端點(diǎn)檢測技術(shù)發(fā)現(xiàn)漏記的讀音,并運(yùn)用語音的模式識別技術(shù)對漏記和錯記的讀音進(jìn)行校對。運(yùn)用門限過零率法對單字音端點(diǎn)進(jìn)行檢測時,對記音個數(shù)判斷的準(zhǔn)確率能達(dá)到99.85%,能夠滿足校對任務(wù)的需求。在對單字記音進(jìn)行自動校對時,由于目前還不具備建立專門適用于識別所有方言的語音模型,并且各方言點(diǎn)的樣本數(shù)據(jù)相對較少,因此,本文采用封閉測試的方法來進(jìn)行校對。
首先,為了驗(yàn)證封閉測試方法的可行性,我們以南京方言聲調(diào)自動校對為例進(jìn)行探究,在選用聲
3、調(diào)段的基頻參數(shù)為特征項(xiàng)時,分別采用SGM和GMM進(jìn)行識別,封閉測試的精確率分別為90.78%和93.61%,并且校正了記音問題,驗(yàn)證了封閉測試的方法是可行的。當(dāng)換用MFCC和HMM對南京方言聲調(diào)進(jìn)行自動校對時,在音節(jié)層面進(jìn)行校對的精確率達(dá)到了98.54%,并且對蘇州和徐州兩地方言的自動校對的平均精確率也分別能達(dá)到95.62%和98.86%。其次,當(dāng)記音錯誤較多時,重復(fù)校對可以不斷發(fā)現(xiàn)記音問題,并向錯誤總數(shù)收斂,南京方言聲調(diào)偽錯誤召回實(shí)驗(yàn)
4、驗(yàn)證了重復(fù)校對的方法的有效性,具有實(shí)際應(yīng)用價值。再次,我們將聲調(diào)自動校對的方法進(jìn)行遷移,應(yīng)用于聲母和韻母的自動校對中,精確率總體上都比較高。以上的探究實(shí)驗(yàn)說明了選取的校對方法、聲學(xué)參數(shù)和統(tǒng)計(jì)模型具有較好的普適性。因此,我們最終采用MFCC和HMM作為系統(tǒng)的聲學(xué)參數(shù)和統(tǒng)計(jì)模型。最后,在探究實(shí)驗(yàn)的基礎(chǔ)上,我們研制了一款方言單字記音自動校對系統(tǒng),并且以江蘇庫其余67個方言點(diǎn)的語料對系統(tǒng)進(jìn)行了實(shí)測,平均的精確率能夠達(dá)到97.79%,并且在校對過
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《現(xiàn)代漢語方言音庫》單字調(diào)實(shí)驗(yàn)研究.pdf
- 新野方言單字音聲調(diào)的實(shí)驗(yàn)分析.pdf
- 資陽方言音系研究.pdf
- 黑山方言音系研究.pdf
- 大洼方言音系研究.pdf
- 河南林州南區(qū)方言單字調(diào)聲學(xué)語音實(shí)驗(yàn)研究
- 滕州方言音系.pdf
- 天長方言音韻研究.pdf
- 包頭方言分音詞研究.pdf
- 海城方言音系.pdf
- 藏文虛詞自動校對研究
- 贛方言鷹弋片鷹潭方言音系研究.pdf
- 忻城方言音系及其臨近方言調(diào)查研究.pdf
- 山東茌平方言音系研究.pdf
- 壯語北部方言r音類研究.pdf
- 江西宜春方言音系.pdf
- 朝陽縣方言音系研究.pdf
- 藏文虛詞自動校對研究_8085.pdf
- 江西廣豐方言音系
- 江淮九江方言音系研究.pdf
評論
0/150
提交評論