版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、非英語為母語的人們在用英文寫作的時候,經(jīng)常會遇到一個句子不知道怎么說,或者一個意思不知如何表達的情況。目前的機器翻譯系統(tǒng)由于準確率太低,翻譯結果不通順而很難實際應用;在線詞典系統(tǒng)由于只能以單詞為單位進行檢索,對于整句的查找沒有什么幫助。英漢例句檢索系統(tǒng)通過讓用戶輸入母語句子,系統(tǒng)查找意思最相近的英文例句的方式,幫助人們解決英文寫作過程中遇到的困難。雖然檢索得到的例句與用戶輸入的母語句子不完全相同,但用戶可以利用人類的智慧,舉一反三的找到
2、需要的英文表達。
英漢例句檢索系統(tǒng)的核心是一個例句搜索引擎。與網(wǎng)頁搜索引擎不同的是,例句檢索系統(tǒng)首先對用戶查詢進行同義詞擴展,對擴展后得到的查詢進行初步檢索,然后采用改進編輯距離的方法計算每個初步檢索結果與用戶查詢之間的相似程度,返回相似程度最高的若干個結果。
英漢例句檢索系統(tǒng)使用了一個包含50萬中英英漢例句對的例句庫。為了得到每個中文單詞具體與哪個英文單詞互為對應,對50萬中英句對進行了自動單詞對齊處理。系
3、統(tǒng)直接使用了著名的詞對齊系統(tǒng)--GIZA++作為預處理系統(tǒng)。針對GIZA++只能得到一對一或者一對多的對齊結果的弱點,通過“中到英”和“英到中”雙向?qū)R結果的融合,獲得了多對多的對齊,同時還把對齊錯誤率降低到了23.3%。
對于用戶輸入的查詢,系統(tǒng)通過計算各個單詞之間二元語言模型的概率,找到最高頻的單詞組合,并作為查詢提示返回給用戶。
由于系統(tǒng)使用的技術與具體的語言相關性不高,所以只要擁有足夠的語料資源,可以
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 面向輔助診斷的醫(yī)學資源檢索系統(tǒng)設計與實現(xiàn).pdf
- 面向文檔的全文檢索系統(tǒng)的設計與實現(xiàn).pdf
- 面向移動終端的圖像檢索系統(tǒng)設計與實現(xiàn).pdf
- 面向旅游信息的檢索系統(tǒng)的設計與實現(xiàn).pdf
- 面向腦科學領域的信息檢索系統(tǒng)設計與實現(xiàn).pdf
- 面向移動終端的圖像信息檢索系統(tǒng)設計與實現(xiàn).pdf
- 集成檢索系統(tǒng)的設計與實現(xiàn).pdf
- Email檢索系統(tǒng)的設計與實現(xiàn).pdf
- 信息檢索系統(tǒng)的設計與實現(xiàn).pdf
- 網(wǎng)絡檢索系統(tǒng)的設計與實現(xiàn).pdf
- 網(wǎng)絡檢索系統(tǒng)的設計與實現(xiàn)
- 面向博客的個性化檢索系統(tǒng)的設計與實現(xiàn).pdf
- 面向互聯(lián)網(wǎng)輿情的圖像檢索系統(tǒng)設計與實現(xiàn).pdf
- 面向推薦的Web檢索系統(tǒng)研究與實現(xiàn).pdf
- 面向海量郵件的檢索系統(tǒng)研究與實現(xiàn).pdf
- 高校BBS檢索系統(tǒng)的設計與實現(xiàn).pdf
- 面向自然語言的法律檢索系統(tǒng)的研究與實現(xiàn).pdf
- 領帶圖像檢索系統(tǒng)的設計與實現(xiàn).pdf
- 社區(qū)問答檢索系統(tǒng)的設計與實現(xiàn).pdf
- 圖像檢索系統(tǒng)MOVER的設計與實現(xiàn).pdf
評論
0/150
提交評論