版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、國際交流日益緊密,單語種語音環(huán)境已經不能滿足需求,在一臺智能設備上集成多種語言的語音環(huán)境成為趨勢。嵌入式設備存儲容量有限,多語種語音數據占用存儲空間十分龐大。同語種內部、不同語種間語音基元數據存在廣泛關聯特性,單文種編碼方法無法消除這類數據冗余,探討異類文種語音數據結構特點,優(yōu)化多語種語音數據存儲形式具有重要現實意義。
多語種處理技術是研究熱點,如多語種機器翻譯,多語種語音識別與合成,說話人語種自適應等。多語種處理中,音素常作
2、為不同語種間建立聯系的基元。語言學中音素數目有限,音素之間區(qū)分明確,且語言的韻律規(guī)則、拼讀規(guī)則、音素組合規(guī)則等研究成果都可以作為語音處理中的先驗知識。
本文面向多文種文字書寫智能輔導系統(tǒng)進行異類文種語音融合研究,該類系統(tǒng)主要用于對初學者如學齡兒童進行在線或脫機輔導,包括對他們的書寫規(guī)范引導、文字書寫評價和綜合指導等,文字讀音、書寫評價反饋、綜合指導提示語等語音信息不可或缺。由于涉及指導意見語音、被練習文字讀音等眾多語音數據,導
3、致系統(tǒng)的存儲空間與語音數據存儲量之間成為必須面對與重點解決的問題之一。為此,依據異類文種之間、同類文種不同語音之間存在音素數據關聯的特性提出多文種語音數據融合編碼方法:將不同文種存在的相同音素數據段塊按段塊模板截取語音樣本序列,小波變換,提取特征矢量,生成共享模板集;任意字音或語句音串均按共享模板集提供的元素進行編碼與解碼;以模板音素串構成的語音記錄庫按(音節(jié),音素)索引。單字語音數據壓縮比、語音數據存儲量、語音還原分段信噪比、主觀評價
4、得分等實驗結果參數明顯優(yōu)于現有方法,語音還原質量良好。
本文的創(chuàng)新點為:
一.通過對語言學大量資料的研究,從學科交叉的角度,將語言學研究成果引入語音編碼領域,試圖從一個新的方向探索語音的壓縮編碼,提出了基于音素數據關聯的多語種語音融合編碼機制。
二.建立了音節(jié)、音素二級檢索結構,優(yōu)化了語音庫記錄數據存儲,大幅降低了語音庫數據存儲量。
三.設計了一種客觀有效的音節(jié)、音素自動切分機制,語音數據預處理后
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 面向文字書寫教學的多文種融合知識構建.pdf
- 基于語義的多文種信息處理平臺SMIPP的研究.pdf
- 法語音素表
- 西班牙語音素
- 基于機器學習的自然圖像中文本檢測及多文種辨識方法研究.pdf
- 法語音素表_法語音標_整理篇
- 法語音素表_法語音標_整理篇
- 英語音素-m-的音義學研究.pdf
- 印刷體蒙古文文檔中多文種識別技術的研究與實現.pdf
- 法語音素一覽表
- 基于DIVA模型的漢語語音音素加工機制研究.pdf
- 基于雙層分類模型的實時語音情感與音素識別.pdf
- 音義學視角下對英語音素-b-的研究.pdf
- 英語專業(yè)學生語音素質培養(yǎng)的研究與實踐.pdf
- 基于圖像處理的維吾爾語音素語音學特征提取與應用.pdf
- 淺析多媒體技術在英語音素教學中的實踐探索—flash在創(chuàng)作“學習英語音素”音像課件中的設計與應用
- 基于最小音素錯誤(MPE)訓練算法的語音識別技術的研究.pdf
- 基于音素的非特定人語音識別及其拒識算法研究.pdf
- 基于語音頻率特性抑制音素影響的說話人特征提取.pdf
- 基于音素模型的語音關鍵詞檢出系統(tǒng)中確認技術研究.pdf
評論
0/150
提交評論