已閱讀1頁,還剩127頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、雙語詞表作為跨語言信息處理的基本紐帶,是自然語言處理領域的重要資源,在統(tǒng)計機器翻譯和跨語言信息檢索等應用中發(fā)揮著重要的作用。本文在深入研究現(xiàn)有從可比較語料庫構建雙語詞表方法的基礎上,以中文和英文為例,提出了基于依存關系映射模型的雙語詞表構建方法,旨在提高其性能。研究內(nèi)容主要包括:
1)實現(xiàn)了基于依存上下文模型的中英文詞表構建系統(tǒng)。參考傳統(tǒng)的依存上下文模型,從句子的依存樹結(jié)構中抽取詞語的前驅(qū)節(jié)點和后繼節(jié)點詞語作為其上下文來實
2、現(xiàn)了本文的基準系統(tǒng),并考察了窗口大小、關聯(lián)強度衡量方法和相似度計算方法對雙語詞表構建性能的影響;
2)提出了基于依存關系映射模型的雙語詞表構建方法。針對依存上下文模型所存在的缺點,本文提出了基于依存關系映射的中英文詞表構建方法,通過同時匹配依存樹中的上下文詞語、依存關系類型來實現(xiàn)雙語詞表的構建;
3)研究了依存關系映射的自動獲取和優(yōu)化方法。針對手工制定依存映射規(guī)則所存在的局限性,提出了依存映射規(guī)則的自動獲取方
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中英可比較語料庫的構建.pdf
- 英漢可比較語料庫的構建與應用研究.pdf
- 基于語料庫的中英文非詞語化研究.pdf
- 基于雙語依存關系映射的中英文詞表構建.pdf
- 基于語料庫的中英文形容詞非詞語化研究.pdf
- 中英文公司簡介的體裁分析——基于語料庫的研究.pdf
- 基于語料庫的中英泰大學英文簡介研究.pdf
- 基于Web語料的中英文詞典生成方法研究.pdf
- 基于醫(yī)學研究論文語料庫的醫(yī)學學術詞表的構建.pdf
- 基于可比語料庫的跨語言信息檢索研究.pdf
- 桂林旅游資料英語可比語料庫的構建與應用.pdf
- 基于語料庫的旅游漢語話題庫及話題詞表構建.pdf
- 基于平行語料庫的無監(jiān)督中文詞性標注研究.pdf
- 連接成分的顯化:基于語料庫的中英文翻譯文本對比.pdf
- 俄語語料庫和基于語料庫的語法研究.pdf
- 基于語料庫的英語程度副詞比較研究.pdf
- 基于語料庫的中英常規(guī)味覺隱喻研究.pdf
- 基于詞向量與可比語料庫的雙語詞典抽取算法研究.pdf
- 物流中英文詞典
- 基于事件抽取的日漢新聞語料庫構建研究.pdf
評論
0/150
提交評論