版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、脫機(jī)漢字識別是用計算機(jī)自動辨識印刷在紙上或人寫在紙上的漢字,它涉及到模式識別、圖像處理、人工智能、形式語言與自動機(jī)、中文信息、組合數(shù)學(xué)、模糊數(shù)學(xué)、信息論、處理等學(xué)科,也涉及到心理學(xué)、語言文字學(xué)、仿生學(xué)等學(xué)科,手寫體漢字識別是漢字識別的一個重要分支,是模式識別和人工智能的一個不可缺少的范疇。
目前,聯(lián)機(jī)手寫體漢字識別技術(shù)已經(jīng)取得了飛速的進(jìn)步并得到了比較好的識別效果,在實(shí)時性和正確率這兩方面的識別基本能夠滿足用戶的需求。比如在自動
2、閱讀郵件地址、處理銀行支票和賬單等這些特定的應(yīng)用領(lǐng)域中,識別技術(shù)也已經(jīng)取得了驕人的效果。
但是,聯(lián)機(jī)手寫體識別技術(shù)它的應(yīng)用范圍相對狹窄,對漢字的書寫也有較大的限制。所以遠(yuǎn)遠(yuǎn)不能滿足用戶的基本需求,因?yàn)樵谖覀兊娜粘9ぷ骱蜕钪?,大量的手抄報表、手寫文檔等都需要輸入計算機(jī),那如何將它們高效的錄入計算機(jī),使它們成為可編輯的數(shù)字化信息,另外,龐大的歷史文檔需要處理,如果把它們以聯(lián)機(jī)方式一個字一個字的輸入計算機(jī)將是一項(xiàng)既耗人力物力又費(fèi)財
3、力的浩大工程。
另外,手寫體漢字字型結(jié)構(gòu)復(fù)雜、相似字較多、字符集大、以及字形變化較大,加之不同的人有不同的書寫風(fēng)格等。所以脫機(jī)手寫體漢字識別雖然經(jīng)過了幾十年的研究,目前還沒有成熟的產(chǎn)品,技術(shù)有待開發(fā),是國內(nèi)外研究焦點(diǎn),也漢字識別領(lǐng)域的一個富有挑戰(zhàn)性的難題。但印刷體漢字識別技術(shù)已經(jīng)功走出實(shí)驗(yàn)室,得到廣泛應(yīng)用,聯(lián)機(jī)手寫體漢字識別已趨于成熟,走向商業(yè)化。
基于以上本文對脫機(jī)手寫體漢字識別進(jìn)行了研究,提出了一種基于筆畫的脫機(jī)
4、手寫體漢字識別方法。因?yàn)榇蠖鄶?shù)中國漢字的構(gòu)成離不開橫豎撇捺這四種筆畫,這四種筆畫在手寫體漢字中所占比例如下:39.51%、33.94%、16.77%和9.78%。盡管不同的人寫出來的漢字大小形狀各異,但橫豎撇捺這四種筆畫在手寫體漢字中的相對位置、距離、夾角這些特征肯定是相對穩(wěn)定的,還有以前人們對手寫體漢字識別大多采用了簡單的統(tǒng)計特征提取和分類算法,這不能從根本上解決手寫體漢字識別的困難。
本文采用的脫機(jī)手寫體漢字識別方法分為三
5、個步驟,分別是預(yù)處理,特征提取,對提取的特征進(jìn)行特征匹配識別。首先對手寫體漢字樣本進(jìn)行預(yù)處理,本文通過對圖像灰度化二值化、平滑去噪、圖像切分、大小歸一化、細(xì)化六個步驟對手寫體漢字樣本圖像進(jìn)行預(yù)處理。通過對手寫體漢字圖像的預(yù)處理,有效的保持了原始圖像信息和手寫體漢字本質(zhì)特征,弱化或降低了原始圖像中存在的各種干擾因素,從而達(dá)到達(dá)到優(yōu)化原始圖像的效果。當(dāng)然,毫無疑問,預(yù)處理的好壞將直接影響特征提取的效率。
第二步特征提取。本文采用了
6、以下幾個步驟:1.對預(yù)處理好的手寫體漢字提取筆畫的分叉點(diǎn);2.采用最大距離法提取筆畫拐點(diǎn);3.提取筆畫的傾斜度和端點(diǎn)坐標(biāo);4.修復(fù)預(yù)處理時不可避免產(chǎn)生的各種畸變;5.合并預(yù)處理時產(chǎn)生的偽交叉點(diǎn)等;6.構(gòu)造手寫體筆畫結(jié)構(gòu)特征。
第三步匹配識別。在筆畫特征匹配識別階段,本文首先把手寫體樣本漢字的筆畫作為特征存儲到模板庫中從而建立筆畫模板庫,接著訓(xùn)練筆畫模板庫,然后將每一個待識別手寫體樣本漢字與系統(tǒng)的筆畫模板庫進(jìn)行匹配比對,并計算待
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 脫機(jī)手寫體漢字識別研究.pdf
- 基于特征融合的脫機(jī)手寫體漢字識別.pdf
- 基于bandelet的脫機(jī)手寫體漢字識別研究.pdf
- 基于稀疏表示的脫機(jī)手寫體漢字識別研究.pdf
- 基于深度模型的脫機(jī)手寫體漢字識別研究.pdf
- 基于SVM的脫機(jī)手寫體漢字識別研究.pdf
- 基于模糊筆畫方向特征的脫機(jī)手寫體漢字識別系統(tǒng).pdf
- 脫機(jī)手寫體漢字識別方法的研究.pdf
- 脫機(jī)手寫體漢字識別技術(shù)研究.pdf
- 基于筆畫重構(gòu)的脫機(jī)手寫漢字識別研究.pdf
- 基于筆畫結(jié)構(gòu)特征的脫機(jī)手寫漢字識別.pdf
- 脫機(jī)手寫體漢字切分算法研究.pdf
- 基于筆畫結(jié)構(gòu)特征的脫機(jī)手寫漢字識別
- 基于極限學(xué)習(xí)機(jī)的脫機(jī)手寫體漢字識別研究.pdf
- 基于筆段的脫機(jī)手寫體漢字識別方法研究.pdf
- 脫機(jī)手寫體漢字識別的特征提取研究與實(shí)現(xiàn).pdf
- 基于SVM的脫機(jī)手寫體漢字識別方法的研究.pdf
- 脫機(jī)手寫體漢字識別系統(tǒng)的設(shè)計與實(shí)現(xiàn).pdf
- 基于鄰域覆蓋的脫機(jī)手寫體漢字切分.pdf
- 基于HMM的脫機(jī)手寫體字符識別.pdf
評論
0/150
提交評論