版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、口語翻譯是語音、語言技術(shù)領(lǐng)域重要的研究方向之一,具有巨大的應(yīng)用價值。口語翻譯涉及到語言學(xué)、計算機科學(xué)、語音識別、語音合成和通訊等多種學(xué)科和技術(shù),開展這項研究具有非常重要的科學(xué)意義。 隨著各國人們在文化,經(jīng)濟,體育等各方面的日常交流日趨頻繁,口語翻譯越來越受到人們的關(guān)注。本文針對基于中間語言的口語翻譯方法中的口語解析問題和基于統(tǒng)計模型的口語翻譯方法中的短語翻譯對自動抽取問題以及口語翻譯系統(tǒng)實驗平臺建設(shè)等幾個方面做了相關(guān)的研究和實現(xiàn)
2、工作,主要內(nèi)容歸納為如下幾點: 1.論文在面向中間轉(zhuǎn)換格式(InterchangeFormat,IF)【"NESPOLE",2002】的口語解析方法研究方面,提出了一種基于語義分類樹的漢語口語淺層語義解析方法,用來獲取漢語口語句子的淺層語義領(lǐng)域行為(IF的一部分)。該方法利用統(tǒng)計模型從訓(xùn)練語料中自動獲取語義規(guī)則構(gòu)造語義分類樹,并利用語義分類樹對句子中和領(lǐng)域行為密切相關(guān)的詞語進(jìn)行解析,然后對多個詞的解析結(jié)果利用統(tǒng)計解析模型進(jìn)行選擇
3、和組合,從而生成句子的領(lǐng)域行為表示。規(guī)則自動獲取方法避免了人工制定規(guī)則的繁瑣性和主觀性,保證了解析具有較高的魯棒性;利用統(tǒng)計模型對領(lǐng)域行為各部分進(jìn)行組合,避免了對IF表達(dá)能力的影響;與HMM相比,語義分類樹擴大了解析窗口,更好地利用了上下文信息。實驗結(jié)果表明:這種方法在限定領(lǐng)域內(nèi)進(jìn)行漢語口語淺層語義解析具有較高的準(zhǔn)確率和魯棒性。 2.基于統(tǒng)計模型的口語翻譯方法是目前口語翻譯研究領(lǐng)域中非常重要的方法。基于短語的統(tǒng)計翻譯方法與基于單
4、個詞的統(tǒng)計翻譯方法相比,可以更好地處理句子中短語內(nèi)部詞語之間的關(guān)系,從而有效地提高機器翻譯系統(tǒng)的性能?;诙陶Z的統(tǒng)計翻譯方法之一把短語翻譯對作為知識源加入到系統(tǒng)中,這樣整個系統(tǒng)的性能對于使用的短語翻譯對的質(zhì)量具有非常大的依賴性,針對這個問題,論文提出了一種改進(jìn)的基于HMM的短語翻譯對抽取方法,從大規(guī)模訓(xùn)練語料中自動抽取高質(zhì)量的短語翻譯對,作為統(tǒng)計口語翻譯的知識源。這種方法首先利用HMM對雙語句子進(jìn)行雙向?qū)R,然后根據(jù)對齊的結(jié)果抽取短語翻
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于統(tǒng)計的中文文本關(guān)鍵短語自動抽取方法研究.pdf
- 領(lǐng)域術(shù)語自動抽取方法研究.pdf
- 基于WEB的雙語翻譯對抽取方法研究.pdf
- 詞語搭配自動抽取方法對比研究.pdf
- 短語級復(fù)述的識別與抽取.pdf
- 中文術(shù)語自動抽取相關(guān)方法研究.pdf
- 網(wǎng)頁信息的自動抽取方法研究.pdf
- 短語級復(fù)述的識別與抽取
- 金融領(lǐng)域信息的自動抽取與分析方法.pdf
- 特定領(lǐng)域術(shù)語自動抽取方法的研究.pdf
- 基于DOM信息抽取技術(shù)的網(wǎng)頁自動翻譯方法的應(yīng)用研究.pdf
- Web記錄自動抽取與去重方法的研究與實現(xiàn).pdf
- 可比語料中命名實體翻譯等價對抽取方法研究.pdf
- 基于Hadoop的Web評論自動抽取方法研究.pdf
- 英漢機器翻譯模板自動抽取算法的研究與實現(xiàn).pdf
- 文本宏特征抽取與基于質(zhì)心的自動分類方法研究.pdf
- 關(guān)鍵短語抽取及相關(guān)技術(shù)研究.pdf
- 利用web抽取雙語翻譯對的研究與實現(xiàn).pdf
- 關(guān)鍵短語抽取及相關(guān)技術(shù)研究
- 典型關(guān)系抽取系統(tǒng)的技術(shù)方法解析
評論
0/150
提交評論