自然場(chǎng)景中文本信息提取方法.pdf_第1頁(yè)
已閱讀1頁(yè),還剩135頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、自然場(chǎng)景中不僅包含大量的圖形信息,而且存在豐富的文本信息。這些文本信息對(duì)場(chǎng)景內(nèi)容的描述與理解有重要的價(jià)值,是場(chǎng)景圖像檢索的關(guān)鍵線索。因而迫切需要一種自動(dòng)化的工具,通過自然場(chǎng)景中文本認(rèn)知獲取場(chǎng)景中的文本信息,為檢索、查詢、瀏覽場(chǎng)景圖像資料和理解場(chǎng)景內(nèi)容服務(wù),提高圖像資料的管理效率。
  自然場(chǎng)景中文本認(rèn)知是指在對(duì)文本所依存的環(huán)境無限制或較少限制的條件下,對(duì)自然場(chǎng)景中文本的識(shí)別與理解。盡管傳統(tǒng)文檔分析技術(shù)已經(jīng)取得了巨大的成果,但是通常

2、只能處理文檔上的文本字符,無法處理自然場(chǎng)景中文本字符。因此自然場(chǎng)景中文本認(rèn)知逐漸成為研究的熱點(diǎn)。
  本文對(duì)自然場(chǎng)景中文本認(rèn)知的相關(guān)技術(shù)進(jìn)行研究,重點(diǎn)研究自然場(chǎng)景中文本信息提取方法。自然場(chǎng)景中文本信息提取是在圖像中檢測(cè)文本的存在,確定文本區(qū)域的位置,并將文本區(qū)域中的字符提取出來。論文通過對(duì)圖像中文本特點(diǎn)的分析,提出基于模糊同質(zhì)性映射的文本信息提取方法,能夠同時(shí)處理人工文本和場(chǎng)景文本,具有較強(qiáng)的通用性。該方法采用基于學(xué)習(xí)的文本檢測(cè)方

3、法和基于文本像素密度的文本定位方法確定圖像中的文本區(qū)域,并通過多尺度變換與模板匹配的方法提取字符。與其他文本信息提取方法相比具有以下優(yōu)點(diǎn):圖像的同質(zhì)性在很大程度上與圖像的局部信息相關(guān),能夠反映文本區(qū)域的本質(zhì)特征;模糊理論較好描述了人類視覺中的模糊性和隨機(jī)性,因此更適于處理背景復(fù)雜的圖像;多尺度變換與模板匹配充分利用文本區(qū)域的結(jié)構(gòu)特征,降低顏色復(fù)雜文本字符的提取難度。本文著重對(duì)以下問題進(jìn)行了研究:
  1.對(duì)圖像空間映射進(jìn)行了研究,

4、將同質(zhì)性映射引入文本檢測(cè),并提出了改進(jìn)的同質(zhì)性映射定義??臻g映射能夠增強(qiáng)文本區(qū)域的特征,提高文本檢測(cè)的性能。重點(diǎn)比較了不同類型空間映射對(duì)文本檢測(cè)的影響,實(shí)驗(yàn)結(jié)果表明同質(zhì)性映射能夠更準(zhǔn)確地刻畫文本區(qū)域與非文本區(qū)域之間的差異,為文本檢測(cè)奠定基礎(chǔ)。
  2.提出了基于模糊同質(zhì)性映射的文本檢測(cè)方法。在同質(zhì)性定義的基礎(chǔ)上,利用模糊理論處理圖像本身所具有的模糊屬性,將二者相結(jié)合定義模糊同質(zhì)性映射,充分反映圖像區(qū)域的局部均勻程度,適用于背景比較

5、復(fù)雜的自然場(chǎng)景中文本檢測(cè),尤其適用于一些背景與文本區(qū)域視覺特征近似的圖像。3.為了提取文本區(qū)域內(nèi)的字符信息,需要獲得文本區(qū)域的范圍和確切位置,提出基于文本像素密度的文本定位方法,并利用文本區(qū)域的特點(diǎn)和幾何統(tǒng)計(jì)信息對(duì)文本候選區(qū)域進(jìn)行篩選。圖像中文本字符尺寸的差異給文本定位造成很大困難,采用多分辨分析技術(shù),將多個(gè)文本定位結(jié)果融合得到多分辨分析下的文本定位結(jié)果。通過在ICDAR’2005開放測(cè)試集上測(cè)試,實(shí)驗(yàn)結(jié)果表明該文本定位方法具有較好的性

6、能。
  4.提出了多尺度變換與模板匹配的文本提取方法。由于圖像中文本的諸多變化,傳統(tǒng)字符分割技術(shù)無法正確分割自然場(chǎng)景中的文本字符。首先通過定義文本區(qū)域的標(biāo)準(zhǔn)模板、存在模板和多尺度變換來描述文本區(qū)域的變化,然后給出了多尺度變換與模板匹配的文本提取算法。將該方法應(yīng)用到車牌精確定位與字符分割中,實(shí)驗(yàn)表明,該方法對(duì)具有確定存在形式的文本區(qū)域及其各種形變具有很好的定位和字符分割能力,同時(shí)該方法有很強(qiáng)的抗干擾能力,尤其對(duì)斷裂和粘連字符的分割

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論