場景文字識別方法研究及其軟件實現(xiàn).pdf_第1頁
已閱讀1頁,還剩93頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、在目前這個信息化的世界中,信息的傳遞顯得尤為重要,其中文字信息在現(xiàn)實環(huán)境中隨處可見,而識別其中的文本信息對獲取周圍環(huán)境的信息具有非常重要的作用,所以文字識別技術(shù)在近年來受到越來越多的重視?,F(xiàn)有的較為通用的文字識別技術(shù)OCR的局限性在于:OCR只能處理背景單一的文字圖片。在實際生活應(yīng)用中,待識別的文字圖片往往是直接來源于成像設(shè)備捕捉的自然場景圖片,該類圖片的特點是背景復(fù)雜且不可預(yù)測,如果直接將此種圖片作為OCR的輸入進行識別,效果往往是不

2、盡人意的。自然地,自然場景文字識別作為計算機視覺技術(shù)中的一種較為年輕的學(xué)科在近年來發(fā)展得非常迅速。
  作為最常見的文字識別類型,英文識別的應(yīng)用最為廣泛。如何對輸入圖片進行預(yù)處理,并對處理后的圖片來提取特征、訓(xùn)練分類器、抑制錯誤結(jié)果和對最終結(jié)果進行判別和修正,是英文文字識別中的一些值得深入研究的問題?;趯ι鲜鰡栴}的考慮,及對結(jié)合近年的英文文字識別的方法的研究,本文對自然場景英文文字識別進行相關(guān)研究,主要內(nèi)容有:
  1.提

3、出了基于類間錯分率的模糊類別劃分方案,本文通過計算目前最為通用的是62類英文字符分類的兩兩樣本間的錯分概率,對類別進行了模糊處理,通過降低類別空間,本方法從根本上提高了初始分類精度。
  2.提出了基于圖像分割的方法預(yù)處理方法,對輸入待識別的自然場景圖片使用圖像分割方法進行預(yù)處理,結(jié)合預(yù)處理結(jié)果,提出分離置信度SC的計算公式,并結(jié)合字符的縱橫比統(tǒng)計信息抑制大量滑動窗口,最終將分離置信度加入所有的識別結(jié)果候選序列的最終識別分?jǐn)?shù)的計算

4、中,得到一系列分?jǐn)?shù)較高的識別結(jié)果。
  3.提出了基于大樣本字典的定量修正識別單詞的準(zhǔn)則,對目前現(xiàn)有的根據(jù)字典信息對識別結(jié)果進行修正的方法進行了改進。確定了根據(jù)識別結(jié)果中不同字符數(shù)的不同修正方法,并通過大量實驗證明了本文提出的識別方法具有較好的識別精度和運行速度。
  本文提出的自然場景英文字符識別方法準(zhǔn)確度高,基于重新給定樣本空間的方法,提高了分類器的分類精度,且基于縱橫比的子窗口抑制方法更為合理地將子窗口數(shù)量降低了2個數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論