金融票據(jù)版面的自動(dòng)識(shí)別技術(shù)研究與原型系統(tǒng)設(shè)計(jì).pdf_第1頁(yè)
已閱讀1頁(yè),還剩47頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、金融票據(jù)的自動(dòng)識(shí)別是模式識(shí)別的重要應(yīng)用領(lǐng)域。幾乎涉及了模式識(shí)別與圖像處理的所有重要分支,是一個(gè)綜合的研究課題,具有理論和實(shí)用兩方面的價(jià)值。本文在收集和分析大量近年來(lái)國(guó)內(nèi)外文檔圖像處理方面的研究報(bào)告、學(xué)術(shù)論文的基礎(chǔ)上,對(duì)文檔圖像版面理解所涉及的若干問題進(jìn)行了深入探討;著重對(duì)文檔圖像的傾斜校正、版面分析和版面識(shí)別進(jìn)行了研究,并且完成了原型系統(tǒng)的實(shí)現(xiàn),經(jīng)測(cè)試,可以滿足要求。主要工作包括: 1.對(duì)文檔圖像的預(yù)處理進(jìn)行了研究。文檔圖像輸入

2、時(shí)會(huì)產(chǎn)生一定的歪斜,文檔版面理解和OCR識(shí)別算法對(duì)文檔的傾斜非常敏感,文檔圖像的傾斜校正十分重要。針對(duì)種類繁多、版面復(fù)雜的文檔,本文對(duì)基于整數(shù)Bresenham算法求方向投影的傾斜檢測(cè)方法進(jìn)行了研究,并與改進(jìn)的Hough變換方法進(jìn)行了比較,發(fā)現(xiàn)其具有很強(qiáng)的抗干擾性和應(yīng)用適應(yīng)性,可以自動(dòng)進(jìn)行傾斜調(diào)整并且具有較高的可變的精度。 2.對(duì)表格文檔圖像的版面結(jié)構(gòu)進(jìn)行了分析。論文研究了完整的表格結(jié)構(gòu)表示方法,提出了基于表格線段交點(diǎn)為特征的文

3、檔類型識(shí)別算法。該算法由兩個(gè)步驟組成:首先是文檔圖像中表格線段的提取。目前,在圖像中提取線段的算法有很多,這些算法各有優(yōu)缺點(diǎn)。在分析這些算法優(yōu)缺點(diǎn)的基礎(chǔ)上,根據(jù)文檔圖像中線條的特點(diǎn)采用了一個(gè)基于線段支持區(qū)域的線段檢測(cè)算法。第二步,在表格線段檢測(cè)的基礎(chǔ)上,根據(jù)不同文檔有不同幾何和拓?fù)浣Y(jié)構(gòu)這一原理,提出了一種以參數(shù)化表格交點(diǎn)為特征點(diǎn)的文檔類型匹配算法。 3.對(duì)表格文檔圖像的邏輯結(jié)構(gòu)進(jìn)行了分析,論文提出了一種基于數(shù)據(jù)域與標(biāo)題域聯(lián)系的樹

4、形結(jié)構(gòu)表格全局邏輯結(jié)構(gòu)的表示方法,此方法可以很好地將表格的邏輯結(jié)構(gòu)與數(shù)據(jù)庫(kù)中表中的數(shù)據(jù)結(jié)構(gòu)對(duì)應(yīng)起來(lái)。并對(duì)一種關(guān)于表格文件邏輯結(jié)構(gòu)提取的方法進(jìn)行了研究。此方法主要分為整表的全局劃分、局部的邏輯結(jié)構(gòu)分析、整表的再次全局劃分和將分析出的各個(gè)局部表區(qū)用樹形結(jié)構(gòu)表示,最后將整個(gè)表格用樹形結(jié)構(gòu)表示等幾個(gè)步驟。該方法強(qiáng)調(diào)對(duì)文件全局和局部布局結(jié)構(gòu)的綜合分析,與以往的僅僅從局部上對(duì)表格邏輯結(jié)構(gòu)進(jìn)行確定的方法相比,它具有較高的識(shí)別正確率,并可以識(shí)別結(jié)構(gòu)更為

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論