基于語塊的漢語韻律短語邊界識別研究.pdf_第1頁
已閱讀1頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、科技在進步,時代在發(fā)展,在這個“讀圖”和“聽音”的時代,語音技術深入到人們生活的各方各面,讓機器說話已不是幻想。然而,目前語音合成的質量仍不是很高,主要表現(xiàn)在:合成的語音自然度低、節(jié)奏感差,所以,語音合成自然度的進一步提高是目前亟待解決的問題。
  本文的研究工作主要針對漢語韻律結構中的韻律短語識別展開。韻律結構是以句法結構為基礎的。通過對大量語料的分析可以看出,韻律結構和句法結構之間存在著一定的聯(lián)系。由于語塊本身可以反映出一定的

2、句法信息,且人們在朗讀或說話時往往是以語塊為基本單位的,語塊的切分可以把句法上相關的詞進行整合,所以本文提出將語塊結構這種非遞歸嵌套的淺層句法結構應用于韻律短語的預測。
  本文的主要工作包括以下幾個方面:
 ?。?)語塊的定義及獲取
  目前對韻律層級的劃分所使用的特征多為詞、詞性和詞長?;谶@些特征的局限性和韻律結構與句法信息之間的緊密聯(lián)系,在對漢語語塊結構與韻律結構之間的關系進行比較研究的基礎上,本文定義了8種適

3、用于韻律短語邊界識別的語塊類型,并歸納總結了語塊的處理規(guī)則,通過語塊之間結合緊密度的度量,實現(xiàn)了語塊的歸并,生成了最終的語塊結構。
 ?。?)基于語塊和條件隨機場的韻律短語識別
  本文將語塊結構這種非遞歸嵌套的淺層句法結構應用于韻律短語的預測,提出了一種基于語塊信息,并利用條件隨機場CRFs對韻律短語進行識別的方法。首先基于語塊結構抽取、選擇模型特征,然后利用CRFs訓練構建模型用于韻律短語的識別。
 ?。?)基于語

4、塊和AdaBoost-SVM集成算法的韻律短語識別
  由于尋找一種較強的分類算法用于韻律短語的識別較為困難,基于強、弱學習算法的等價性問題,利用集成學習方法能夠使多個準確率略高于隨機猜測弱分類器進行加權融合,形成一個強學習算法,達到比強分類器更好的分類效果,所以,本文使用AdaBoost集成學習算法,以SVM作為基分類器,通過對訓練語料多次隨機抽取,經過多次訓練更改權重,訓練生成多個基分類器,最終將這幾個基分類器進行加權投票的方

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論