視頻圖像中的口唇檢測與跟蹤.pdf_第1頁
已閱讀1頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、在語音識別和人機交互技術(shù)備受關(guān)注的情況下,口唇檢測和跟蹤逐漸引起人們的關(guān)注,口唇檢測是唇讀和唇動合成的首要部分,可以提高語音識別的識別率,且能輔助老師進行聾兒教學以彌補相關(guān)老師的缺乏和提高學生的自學能力。
  本課題分析了國內(nèi)外在口唇特征定位和跟蹤方面的研究現(xiàn)狀,重點研究了兩種技術(shù):一種變形模型方法是精確提取物體幾何特征的常用方法,但是其計算量大;另一種粒子濾波器是圖像目標跟蹤中常用技術(shù),在大目標的跟蹤中效果顯著,然而對于微特征的

2、圖像目標也存在點漂移等情況。本課題綜合使用變形模板和粒子濾波獲取嘴唇區(qū)域特征,對視頻序列中嘴唇特征定位與跟蹤技術(shù)進行了研究:
  1.針對黃色人種的唇色與膚色相似性、胡須、牙齒等干擾因素對口唇定位的影響以及光照不均勻性等問題,給出了一種基于CIELab顏色空間的口唇定位方法,與現(xiàn)有的排紅法、CCD算法、色彩特征提取法等比較,可以解決對光照的依賴性、盡量避免干擾因素對口唇定位問題的影響,實現(xiàn)比較準確的提取出口唇區(qū)域。
  2.

3、針對可變形模板的初始化及其存在的多參數(shù)優(yōu)化求解問題,給出了一種采用投影法粗略確定口唇的嘴角點,對可變形模板進行初始化的方法??梢越鉀Q可變形模板的求解復(fù)雜性的問題,為進一步精確提取口唇特征點打下基礎(chǔ)。
  3.針對發(fā)音過程中口唇變形、旋轉(zhuǎn)、縮放以及對邊緣連續(xù)性要求等問題,給出了一種基于可變形模板的口唇輪廓提取算法,通過采用多條曲線逼近口唇輪廓,利用邊緣、波谷等能量函數(shù)確定口唇輪廓。實驗表明該方法克服了不同光照、牙齒、舌頭等的影響準確

4、提取口唇輪廓,得到反映口形變化的參數(shù)。
  4.針對口唇微特征點難以跟蹤問題,本文給出了一種使用粒子濾波器跟蹤口唇特征點的方法。在使用粒子濾波器時,對如何選取跟蹤特征框尺寸和粒子數(shù)目進行了實驗確定,保證了跟蹤的精度和效率。并通過實驗統(tǒng)計特征點跟蹤偏差,對嘴唇區(qū)域進行調(diào)整,減少定位的偏差。實驗表明該方法在跟蹤精度和時間方面具有一定的優(yōu)勢。
  總之,本文對視頻序列中口唇檢測與跟蹤進行研究,并對關(guān)鍵技術(shù)進行了實驗驗證,達到了預(yù)期

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論