版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、手寫體數(shù)字識別是信息錄入的關(guān)鍵步驟,廣泛應(yīng)用于公安、稅務(wù)、交通、金融等行業(yè)的實踐活動中。雖然識別方法多種多樣,但是目前技術(shù)尚不能使識別率達到100﹪。為了能夠?qū)⑹謱戵w數(shù)字識別真正應(yīng)用到實際工作中,本文除了在手寫體識別算法的識別率提高上下功夫之外,還設(shè)計了一個基于手寫體數(shù)字識別的信息錄入與處理系統(tǒng)。 手寫體數(shù)字識別的主要難點在于手寫體數(shù)字字形小,特征信息量少,不同的人群書寫習(xí)慣不同造成數(shù)字的形態(tài)千變?nèi)f化;在某些應(yīng)用中對于單字識別來
2、說,手寫體數(shù)字的正確識別要比其他字符嚴格得多。在對手寫體數(shù)字識別技術(shù)做了充分比較后,本文選擇了BP神經(jīng)網(wǎng)絡(luò)算法作為識別算法。BP網(wǎng)絡(luò)實質(zhì)上實現(xiàn)了一個從輸入到輸出的映射,理論上它具有實現(xiàn)任何復(fù)雜的非線性映射的能力,適合于求解內(nèi)部機制復(fù)雜的問題。 BP神經(jīng)網(wǎng)絡(luò)的識別效果還依賴于訓(xùn)練神經(jīng)網(wǎng)絡(luò)樣本集合的質(zhì)量。為了獲得識別率高、誤識率低的分類神經(jīng)網(wǎng)絡(luò),本文采集了不同人群中的5萬余個有代表性的手寫體數(shù)字圖像作為訓(xùn)練、測試樣本。有了這些樣本以
3、后,我們對樣本圖像作了二值化、去噪聲、糾偏、細化、定位分割、尺寸歸一化等一系列處理,經(jīng)過這些處理后的單個字符圖像被離散成神經(jīng)網(wǎng)絡(luò)的輸入樣本。將樣本劃分為訓(xùn)練集和測試集,對神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,所得到的神經(jīng)網(wǎng)絡(luò)能夠達到較滿意識別效果。其中,我在處理數(shù)字樣本的時候發(fā)現(xiàn),某些樣本是對神經(jīng)網(wǎng)絡(luò)有害的‘壞’樣本,在研究中我嘗試將這些壞樣本‘剔除’以后發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)的識別率和拒識率有所提高、誤識率明顯下降。 將手寫體數(shù)字識別技術(shù)投入實際應(yīng)用中是我
4、們的最終目標(biāo),為此本文設(shè)計了一個基于手寫體數(shù)字識別的信息錄入與處理系統(tǒng),此系統(tǒng)可以混合處理照片、文字(僅保存圖像)、OMR以及手寫體數(shù)字,本文僅重點研究及介紹其中的手寫體數(shù)字識別模塊。系統(tǒng)使用掃描儀將信息卡內(nèi)容掃描到計算機中以后,程序?qū)κ謱戵w數(shù)字圖像進行二值化、去噪聲等預(yù)處理,然后形成神經(jīng)網(wǎng)絡(luò)分類模型的輸入,并由神經(jīng)網(wǎng)絡(luò)進行識別。識別后的結(jié)果會顯示在計算機終端上,并由操作人員對拒識字符進行處理??紤]到識別算法可能有誤識別的情況,本文設(shè)計
5、了一種批量校對的方法來處理可能發(fā)生的誤識。經(jīng)過測試,BP神經(jīng)網(wǎng)絡(luò)手寫體數(shù)字識別算法識別率可達到96.8﹪以上、拒識率小于2.7﹪、誤識率小于0.5﹪;在實際系統(tǒng)應(yīng)用中,批量手寫體數(shù)字校對方式可以成倍提高誤識校正的速度,熟練操作者的處理速度可以達到100字符/秒甚至更高,經(jīng)過人工干預(yù)后,最終誤識率小于萬分之一。本文主要貢獻如下: (1)實現(xiàn)了BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和識別算法,并在實際工作中得到應(yīng)用。 (2)發(fā)現(xiàn)了‘壞’樣本對B
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于手寫體數(shù)字識別的考試成績自動錄入與處理系統(tǒng).pdf
- 手寫體英文數(shù)字識別系統(tǒng)識別預(yù)處理
- 手寫體數(shù)字識別.pdf
- 基于DS-SVM的手寫體數(shù)字識別的研究.pdf
- 基于SVM的脫機手寫體數(shù)字識別的研究與應(yīng)用.pdf
- 手寫體漢字識別的研究與應(yīng)用系統(tǒng)設(shè)計.pdf
- 基于RVM的手寫體數(shù)字識別.pdf
- 基于BP網(wǎng)絡(luò)的手寫體數(shù)字識別.pdf
- 基于輪廓曲率的手寫體數(shù)字識別.pdf
- 基于專家乘積的手寫體數(shù)字識別系統(tǒng).pdf
- 手寫體字符識別的研究與應(yīng)用.pdf
- 基于核方法的手寫體數(shù)字識別研究.pdf
- 手寫體數(shù)字識別系統(tǒng)的設(shè)計與實現(xiàn).pdf
- 手寫體數(shù)字識別技術(shù)研究.pdf
- 自由手寫體數(shù)字識別系統(tǒng)的設(shè)計與實現(xiàn)
- 聯(lián)機數(shù)學(xué)公式手寫體識別的研究與實現(xiàn).pdf
- 無限制手寫體數(shù)字串切分與識別的相關(guān)問題研究.pdf
- 高精度手寫體數(shù)字的識別.pdf
- 漢字文本圖處理與手寫體漢字識別.pdf
- 基于神經(jīng)網(wǎng)絡(luò)的手寫體數(shù)字識別系統(tǒng)的研究.pdf
評論
0/150
提交評論