2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩64頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、機(jī)器翻譯是自然語(yǔ)言處理領(lǐng)域的一個(gè)重要研究課題,對(duì)于目前高速發(fā)展的信息社會(huì)有著廣泛的市場(chǎng)潛力和研究?jī)r(jià)值。隨著科學(xué)技術(shù)的逐漸發(fā)展,基于圖像識(shí)別的機(jī)器翻譯開(kāi)始引起人們的重視和關(guān)注。國(guó)際信函批譯是指將國(guó)際信函上的英文地址信息翻譯成相應(yīng)的中文地址,然后批注到信函上,以便信函的進(jìn)一步分揀和投遞。
   本文以中國(guó)郵政集團(tuán)公司上海研究院SATP-120型高速外信批譯分揀機(jī)項(xiàng)目為背景,對(duì)國(guó)際信函圖像中的地址翻譯過(guò)程和條碼定位識(shí)別過(guò)程展開(kāi)研究。論

2、文首先介紹了機(jī)器翻譯的發(fā)展歷程和相關(guān)技術(shù)研究,并對(duì)條碼定位識(shí)別技術(shù)進(jìn)行分析,最后,完成了基于圖像識(shí)別和地址翻譯的國(guó)際信函自動(dòng)批譯系統(tǒng)的開(kāi)發(fā)。整個(gè)系統(tǒng)分為條碼定位模塊、條碼識(shí)別模塊、信函圖像地址定位模塊、OCR識(shí)別模塊、地址理解模塊和地址翻譯模塊,并深入分析各個(gè)模塊的具體功能和關(guān)鍵技術(shù)。本文主要完成了以下工作:
   第一,結(jié)合圖像處理算法,自動(dòng)定位信函圖像的地址區(qū)域。采用OCR識(shí)別算法,將圖像中的英文地址轉(zhuǎn)化為相應(yīng)的文本信息。提

3、出基于地址詞庫(kù)的OCR字符后處理,減少OCR識(shí)別結(jié)果中的誤識(shí)字符對(duì)后續(xù)地址理解和地址翻譯過(guò)程的干擾;
   第二,根據(jù)有限狀態(tài)自動(dòng)機(jī)算法設(shè)計(jì)地址理解規(guī)則,自動(dòng)理解英文地址中的各項(xiàng)信息,如人名、公司名、路名、號(hào)碼等。設(shè)計(jì)中英文號(hào)碼的排序規(guī)則,使其符合當(dāng)前的實(shí)際應(yīng)用需求;
   第三,提出基于地址實(shí)例庫(kù)與地址直譯相結(jié)合的地址批譯方法,實(shí)驗(yàn)證明取得了較好的翻譯效果;
   第四,提出了一種復(fù)雜背景下的條碼自動(dòng)定位技術(shù),

4、該技術(shù)根據(jù)條碼的梯度特征和角點(diǎn)特征,可以自動(dòng)區(qū)分和條碼類似的紋理,例如文字等,實(shí)現(xiàn)國(guó)際掛號(hào)信函圖像中的條碼自動(dòng)定位。針對(duì)國(guó)際掛號(hào)信函圖像采集過(guò)程中可能出現(xiàn)的非均勻光照,設(shè)計(jì)一種改進(jìn)的Bernsen二值化預(yù)處理算法,從而有效地減少非均勻光照對(duì)條碼識(shí)別的影響;
   將該系統(tǒng)應(yīng)用于郵政批譯分揀系統(tǒng),測(cè)試驗(yàn)證機(jī)器翻譯的正確率、錯(cuò)誤率和拒絕率。實(shí)驗(yàn)結(jié)果表明,本文提出的設(shè)計(jì)方案滿足了系統(tǒng)的需求,該課題的研究成果對(duì)于郵政自動(dòng)化領(lǐng)域以及其他相

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論