2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩104頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、近幾年隨著計算機多媒體技術(shù)的快速發(fā)展,蒙古語的教育、影視、文化等諸多方面的語音資料越來越多,已形成了豐富的民族文化資源。如何對這些語音文檔進行有效地檢索和分類成為了蒙古文信息處理領(lǐng)域中的一個熱點問題。語音關(guān)鍵詞檢測技術(shù)是根據(jù)用戶給定的查詢,從指定的語音數(shù)據(jù)集中返回與其對應的語音片段。本文針對蒙古語語音關(guān)鍵詞檢測任務中涉及到的一些相關(guān)技術(shù)進行了深入的研究,包括蒙古語大詞匯量連續(xù)語音識別(LVCSR)技術(shù)、基于網(wǎng)格和混淆網(wǎng)絡的蒙古語關(guān)鍵詞檢

2、測技術(shù)和蒙古文字母到音素的轉(zhuǎn)換技術(shù)等。本文研究的蒙古語語音關(guān)鍵詞檢測相關(guān)技術(shù)不僅具有重要的學術(shù)價值,并對維護國家安全及邊疆少數(shù)民族地區(qū)的穩(wěn)定,繁榮和發(fā)展少數(shù)民族文化具有重要意義。論文所做工作主要集中在以下幾個方面:
  1.蒙古文屬于黏著語,是詞根綴加多個后綴的形式構(gòu)成新詞,通過這種方式可以生成大量的蒙古文單詞,這給蒙古語大詞匯量連續(xù)語音識別的研究工作帶來了很大的困難。為了解決大規(guī)模蒙古文單詞的識別問題,本文根據(jù)蒙古文的構(gòu)詞特點,

3、提出了基于分割識別的蒙古語LVCSR方法。本文詳細描述了蒙古語語音識別技術(shù)的基本原理,并且針對基于分割識別的蒙古語LVCSR方法,重新建立了聲學模型和語言模型。實驗結(jié)果表明,基于分割識別的蒙古語LVCSR方法可以較好的解決蒙古語大詞匯量連續(xù)語音識別問題,并且在訓練聲學模型時,校正結(jié)尾后綴的發(fā)音會提高識別的準確率。本文提出的基于分割識別的蒙古語LVCSR方法對其他黏著語的語音識別和語音檢測等領(lǐng)域的研究提供了新的思路和方法。
  2.

4、本文將基于網(wǎng)格和混淆網(wǎng)絡的關(guān)鍵詞檢測首次應用到蒙古語關(guān)鍵詞檢測任務中,并結(jié)合蒙古文的構(gòu)詞特點對集內(nèi)詞檢測方法進行了改進。本文詳細描述了基于詞網(wǎng)格的蒙古語關(guān)鍵詞檢測方法中的后驗概率的估計、搜索和置信度計算等問題。其次,介紹了網(wǎng)格轉(zhuǎn)換混淆網(wǎng)絡的方法和基于詞混淆網(wǎng)絡的蒙古語關(guān)鍵詞檢測中的索引的建立、關(guān)鍵詞搜索和確認等方法。最后,結(jié)合蒙古文構(gòu)詞特點,提出了基于詞干進行檢測的集內(nèi)詞檢測方法。實驗結(jié)果表明,基于詞混淆網(wǎng)絡的檢測方法從各個性能上都好于

5、基于詞網(wǎng)格的檢測方法,并且改進的集內(nèi)詞檢測方法有效的提高了系統(tǒng)的性能。
  3.為了解決蒙古語關(guān)鍵詞檢測任務中的集外詞檢測問題,本文提出了基于音素混淆網(wǎng)絡的蒙古語關(guān)鍵詞檢測方法。蒙古語語音文件被解碼成音素形式時正確識別率會變得很低,并會出現(xiàn)很多不符合韻律學的發(fā)音序列。為了提高系統(tǒng)的精準率和召回率,我們采用了音素混淆矩陣改進了關(guān)鍵詞的置信度計算方法,并得到了較好的實驗結(jié)果。本章首先介紹了對音素混淆網(wǎng)絡文件建立索引的方法。其次,詳細介

6、紹了音素混淆矩陣。第三,描述了在音素混淆網(wǎng)絡文件中搜索和確認音素串的方法。第四,介紹了蒙古語關(guān)鍵詞檢測系統(tǒng)的框架。最后對相關(guān)方法進行了實驗比較。實驗結(jié)果表明,基于音素混淆網(wǎng)絡的蒙古語關(guān)鍵詞檢測方法可以較好的解決集外詞的檢測問題,并且采用音素混淆矩陣的置信度計算方法提高了系統(tǒng)的整體性能。
  4.為了解決蒙古文集外詞到音素串的轉(zhuǎn)換工作,本文提出了蒙古文字母到音素的轉(zhuǎn)換方法。蒙古語關(guān)鍵詞檢測任務中對集外詞進行檢測時需要將集外詞轉(zhuǎn)換成對

7、應的音素串形式,然后通過音素串進行查找,因此蒙古文字母到音素的轉(zhuǎn)換系統(tǒng)變得極其重要。蒙古文的書面形式和口語發(fā)音不是一一對應的,會出現(xiàn)元音和輔音的增加、脫落及變換等現(xiàn)象,這給蒙古文字母到音素的轉(zhuǎn)換工作帶來了一定的難度。針對蒙古文字母到音素的轉(zhuǎn)換問題本文提出了基于規(guī)則的蒙古文字母到音素的轉(zhuǎn)換方法和基于聯(lián)合序列模型的蒙古文字母到音素的轉(zhuǎn)換方法。實驗結(jié)果表明,利用聯(lián)合序列模型的蒙古文字母到音素的轉(zhuǎn)換方法要明顯好于基于規(guī)則的蒙古文字母到音素的轉(zhuǎn)換

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論