

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、視頻圖像中的文本,特別是附加的文本包含許多重要的信息,原因有三:(1)與當前的視頻內(nèi)容緊密相關;(2)文本具有明顯的視覺特征;(3)OCR文字識別技術的發(fā)展遠遠超過了聲音識別技術和圖像理解技術。因此幾乎所有的視頻圖像檢索研究都是從視頻文本的識別開始。現(xiàn)有的OCR識別系統(tǒng)還不能直接識別復雜背景下的文本,因而從視頻中提取和跟蹤文本區(qū)域,具有重要的實際意義。 本文的主要研究成果如下: (1)提出了一種基于支持向量機的模糊推理噪
2、聲檢測方法。該建模方法應用支持向量機的學習機制從訓練樣本中提取支持向量,由支持向量確定模糊基函數(shù),產(chǎn)生相應的模糊規(guī)則,建立起模糊推理模型。并依據(jù)此設計了一套噪聲檢測系統(tǒng)。該系統(tǒng)由基于支持向量機的模糊推理子系統(tǒng)和決策子系統(tǒng)組成。其中,推理子系統(tǒng)分別在縱向和橫向上檢測噪聲信息;決策子系統(tǒng)綜合縱向和橫向的信息,做出決策。實驗結果證明,該方法可有效地檢測并去除噪聲,同時保留了圖像的細節(jié)信息,為后續(xù)的文本檢測、定位和提取提供了良好的基礎。
3、 (2)提出了一種基于小波變換和支持向量機(SVM)在數(shù)字圖像中定位文本的方法。首先對圖像進行小波變換;其次在低頻概貌和高頻能量空間應用SVM提取文本的紋理特征,由SVM來決定當前的像素是文本類還是非文本類;最后因為SVM的分類結果可能存在噪聲或虛假文本,用形態(tài)學去噪和計算紋理能量的方法對SVM的分類結果進行后處理。小波變換和SVM的結合,不僅降低了輸入空間樣本的數(shù)量,而且利用了SVM適合于高維空間工作的特點,提高了文本提取的效率。實驗
4、結果表明,提出的方法可以快速有效地定位數(shù)字圖像中的文本區(qū)域。 (3)提出了一種判斷文本區(qū)域字符顏色極性的方法。文本區(qū)域的字符存在著不同的顏色極性,為了能夠正確地把文本區(qū)域的灰度圖像轉換成OCR識別軟件可以識別的二值圖像,本文提出,首先計算文本區(qū)域的灰度一梯度共生矩陣,并采用二維最大熵閾值分割遞推算法快速地找到分割的灰度和梯度最佳閾值;然后在此基礎上提取特征向量,送入神經(jīng)網(wǎng)絡進行分類;最后根據(jù)顏色極性判斷的結果,分割出字符。實驗結
5、果表明,這種方法在復雜度不同的背景下,正確地識別出了不同類別的字符顏色極性。在準確的識別出文本顏色極性的基礎之上,用高帽(Top-Hat)和低帽(Bottom-Hat)運算尋找種子點,進行區(qū)域增長,將文本圖像轉換成二值圖像。最后利用字符的筆畫特征消除二值圖像中的噪聲。 (4)提出了一種從時域到空域的自動視頻分割方法。在時間域的階段,通過對相鄰兩幀的變換部分的檢測,找到運動目標的初步的定位。在空間域階段,采用預測分水嶺算法對運動
6、目標進行精確定位。兩種方法互相補充,互相增強。實驗結果表明,提出的方法不僅分割效果好,而且計算時間少。 (5)提出了一種快速而實用的印刷體數(shù)字識別算法,它的基本原理是利用印刷體數(shù)字的結構特征,應用神經(jīng)網(wǎng)絡的方法對數(shù)字進行識別的。由于采樣手段多種多樣,環(huán)境的變化等因素的影響,采集到的圖像效果通常不是很理想,因此本文提出了采用Hopfield神經(jīng)網(wǎng)絡對每個數(shù)字進行矯正,再送入BP網(wǎng)絡進行識別的方法。并把該算法用于DSP實現(xiàn),實驗結果
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 視頻圖像中文本定位與提取的方法研究.pdf
- 視頻圖像中文本區(qū)域提取算法的研究.pdf
- 文本圖像處理中若干問題的研究.pdf
- 圖像-視頻車輛檢測若干問題的研究.pdf
- 視頻與圖像信息隱藏技術若干問題研究.pdf
- 中文文本自動分類中的若干問題研究.pdf
- 基于內(nèi)容的視頻檢索語義提取若干問題研究.pdf
- 文本情感分析若干問題研究.pdf
- 文本聚類分析若干問題研究.pdf
- 視頻行為分析若干問題研究.pdf
- 視頻中文本的定位與提取.pdf
- 視頻圖像中文字提取方法研究.pdf
- 數(shù)字視頻中文本的提取方法研究.pdf
- 中文術語抽取若干問題研究.pdf
- 文本情感傾向分析若干問題研究.pdf
- 視頻中文本信息提取技術研究.pdf
- 視頻目標跟蹤的若干問題研究.pdf
- 圖像薛定諤變換若干問題研究.pdf
- 圖像質量評價若干問題研究.pdf
- 圖像表示的若干問題研究.pdf
評論
0/150
提交評論