限定性文本的語料庫自動(dòng)構(gòu)建.pdf_第1頁
已閱讀1頁,還剩71頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、語音合成技術(shù)是人機(jī)交互研究中比較重要的技術(shù)之一,并且已經(jīng)應(yīng)用到了社會(huì)生活的許多領(lǐng)域。語料庫構(gòu)建技術(shù)作為語音合成技術(shù)開發(fā)中的一個(gè)重要模塊也受到研究人員的普遍關(guān)注??焖贅?gòu)建語音合成語料庫的研究具有重要意義。目前,解決此問題較為成熟的技術(shù)是傳統(tǒng)的構(gòu)建語料庫的方法。在傳統(tǒng)的語音合成系統(tǒng)的構(gòu)建中,首先要收集大量的文本資料,然后從文本中選擇文本然后進(jìn)行文本的錄音和標(biāo)注工作。對于英語語音合成系統(tǒng)的構(gòu)建中,發(fā)音人的發(fā)音水平對合成語音的自然度和表現(xiàn)力方面

2、都有重要的影響,是語音合成系統(tǒng)實(shí)現(xiàn)中要解決的重要問題。由于本試驗(yàn)室非母語發(fā)音人的關(guān)系,不能夠?qū)崿F(xiàn)純正的發(fā)音水平??紤]到在網(wǎng)絡(luò)中存在著海量的電子文本及其對應(yīng)的語音錄音(例如MP3形式)的優(yōu)勢,所以要采用新的方式實(shí)現(xiàn)語音合成系統(tǒng)。
   本文所做的工作是實(shí)現(xiàn)語音合成系統(tǒng)的一個(gè)組成部分-限定文本的語音合成語料庫的自動(dòng)構(gòu)建。所要實(shí)現(xiàn)語音合成系統(tǒng)的方法是首先從網(wǎng)絡(luò)中自動(dòng)下載語言教學(xué)類網(wǎng)站中的基于特定人的文本和語音。我們從美國之音網(wǎng)站中下載

3、了Faith Lapitus的語音MP3文件和對應(yīng)的文本文件。由于發(fā)音人是新聞節(jié)目主持人,解決了實(shí)驗(yàn)室非母語發(fā)音人發(fā)音不標(biāo)準(zhǔn)的問題。由于在語音文件中存在音樂音頻,所以需要實(shí)現(xiàn)語音和音樂音頻分類,挑選出語音音頻文件。由于構(gòu)建語音合成語料庫通常的方法都是使用句子,所以需要把這個(gè)的文本篇章形式的文件轉(zhuǎn)換為句子形式的,所需要做的是句子切分,本文所實(shí)現(xiàn)的就是最后把得到的切分正確的句子集合作為初始文本集合來構(gòu)建語音合成語料庫。由于文本的選擇是必須存

4、在錄音的情況下進(jìn)行選擇的,所以本文命名為在限定條件下的語料庫構(gòu)建。
   本文對語料庫構(gòu)建的常用方法-文本選擇方法進(jìn)行了研究和介紹,貪婪算法是解決文本選擇問題常用的方法,我們應(yīng)用貪婪算法進(jìn)行了文本選擇,并且結(jié)合信息檢索中的方法,使用開源軟件語音識(shí)別工具HTK和語音合成工具Festival實(shí)現(xiàn)語料庫的構(gòu)建過程。從實(shí)驗(yàn)中我們得到的最后結(jié)果就是基于特定人的文本選擇中,雙音素的覆蓋率為93.52%。本文的主要工作和創(chuàng)新點(diǎn)有:
  

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論