版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第2章圖像的基本知識及運算,專業(yè)術(shù)語及表示方法圖像與視覺之間的關(guān)系圖像象素間的關(guān)系圖像間的運算,專業(yè)術(shù)語,數(shù)字圖像與物理圖像-數(shù)字圖像是離散的,物理圖像是連續(xù)的函數(shù),數(shù)字化-為了適應數(shù)字計算機的處理,必須對連續(xù)圖像函數(shù)進行空間和幅值數(shù)字化。空間坐標(x,y)的數(shù)字化稱為圖像采樣,而幅值數(shù)字化被稱為灰度級量化。經(jīng)過數(shù)字化后的圖像稱為數(shù)字圖像(或離散圖像)。,,采樣-就是圖像在空間上的離散化處理,即使空間上連續(xù)變化的圖像離散化,,量化
2、-經(jīng)過取樣的圖像,只是在空間上被離散為像素(樣本)的陣列,而每一個樣本灰度值還是一個有無窮多個取值的連續(xù)變化量,必須將其轉(zhuǎn)化為有限個離散值,賦于不同碼字才能真正成為數(shù)字圖像,再由數(shù)字計算機或其它數(shù)字設(shè)備進行處理運算,這樣的轉(zhuǎn)化過程稱其為量化,分辨率 -空間分辨率和灰度分辨率 灰度分辨率是指值的單位幅度上包含的灰度級數(shù),即在灰度級數(shù)中可分辨的最小變化。若用8比特來存儲一幅數(shù)字圖像,其灰度級為256。 空間分辨率是指圖像中可辨別
3、的最小細節(jié),采樣間隔決定空間分辨率的主要參數(shù)。一般情況下,如果沒有必要實際度量所涉及象素的物理分辨率和在原始場景中分析細節(jié)等級時,通常將圖像大小M×N,灰度為L級的數(shù)字圖像稱為空間分辨率為M×N,灰度級分辨率為L級的圖像。,對比度-指一幅圖像中灰度反差的大小,對比度=最大亮度/最小亮度,,圖像噪聲-妨礙人們感覺器官對所接收的信息理解的因素 ,種類很多,如加性噪聲、乘性噪聲、白噪聲和高斯噪聲,采樣點和量化級的選取,假定
4、一幅圖像取M×N個樣點,對樣點值進行Q 級分檔取整。那么對 M、N和Q如何取值呢?為了存取的方便,Q一般總是取成2的整數(shù)次冪 ,如Q=2b,b為正整數(shù),通常稱為對圖像進行b比特量化。 對b來講,取值越大,重建圖像失真越小,對M×N的取值,主要的依據(jù)是取樣的約束條件,也就是在M×N達到滿足取樣定理的情況下,重建圖像就不會產(chǎn)生失真,否則就會因取樣點數(shù)不夠而產(chǎn)生所謂混淆失真,,數(shù)字圖像的表示,灰度圖像表示,,
5、象素(pixel),灰度圖象(128x128)及其對應的數(shù)值矩陣(僅列出一部分(26x31)),,彩色圖像表示-彩色圖象可以用紅、綠、藍三元組的二維矩陣來表示。通常,三元組的每個數(shù)值也是在0到255之間,0表示相應的基色在該象素中沒有,而255則代表相應的基色在該象素中取得最大值,這種情況下每個象素可用三個字節(jié)來表示,,彩色圖象(128x128)及其對應的數(shù)值矩陣(僅列出一部分(25x31)),二值圖像表示,為了減少計算量,常將灰度圖
6、像轉(zhuǎn)為二值圖像處理。,定義:只有黑白兩個灰度級,即象素灰度級非1即0,如文字圖片,其數(shù)字圖像可用每個象素1bit的矩陣表示,二值圖像的特殊表示法:如鏈碼(Freeman碼)-適合表示直線和曲線組成的二值圖像,以及描述圖像的邊界輪廓,采用鏈碼節(jié)省很多的比特數(shù)-規(guī)定了鏈的起點坐標和鏈的斜率序列,這樣就可以完全描述曲線和直線,八向鏈碼,,,圖像信息的基本知識,圖像與視覺之間的關(guān)系圖像象素之間聯(lián)系圖像之間的運算,人眼與亮度視覺,鏡頭,成像面
7、,人眼的亮度適應范圍 量級同時亮度適應區(qū)間不大, 一般 < 64級,x/17=15/100x=2.55mm,假設(shè)一個平面如磨砂玻璃一樣散光,被1個強度為I且可以變化的光源從背后照亮,1個照度增量為△I,像短促閃光一樣加在均勻照明的平面上,可使人感到平面中間像1個圓形亮點,如圖所示,如果△I不夠亮,實驗者沒有感知上的變化,當△I逐步增強,感知上發(fā)生變化。如果50%的機會感知亮度變化,則量△I50/I為韋伯率,小的韋伯率表
8、示可區(qū)分強度的小變化,有較好的亮度區(qū)分能力;大的韋伯率表示只有大的強度變化才能區(qū)分,有較差的亮度區(qū)分能力,亮度適應,馬赫帶效應,亮背景下顯得暗、暗背景下顯得亮它是基于人眼對某個區(qū)域感覺到的亮度并不僅僅依賴于它的強度,同時對比度,視覺系統(tǒng)有趨向于過高或過低估計不同亮度區(qū)域邊界值的現(xiàn)象,每個條帶內(nèi)部的亮度是常數(shù),但仍然有強烈的邊緣效應,顏色視覺,顏色分解,對彩色圖像來說,顏色中摻入白色越多,就越亮,摻入黑色越多灰度就越小,與混合光譜中主要
9、光波長相聯(lián)系,與一定色調(diào)的純度有關(guān),純光譜是完全飽和的,隨著白光的加入,飽和度逐漸減少,顏色模型,RGBCMYYUVYCrCbHSV,RGB彩色空間,RGB顏色模型主要應用于CRT監(jiān)視器和圖形刷新設(shè)備中。盡管該彩色空間是最普遍的,但是由于R、G、B三色之間存在強烈的相關(guān)性,CMY-在印刷行業(yè) , CMY分別是青色(Cyan)、品紅(Magenta)、黃色(Yellow)三種油墨色 CMY常用于從白光中濾去某種顏色,又被稱為減性
10、原色系統(tǒng)。CMY顏色模型與RGB顏色模型幾乎完全相同。差別僅僅在于前者的原點為白,而后者的原點為黑。前者是定義在白色中減去某種顏色來定義一種顏色,而后者是通過從黑色中加入顏色來定義一種顏色。,CMY彩色空間,HSV彩色空間,該模型經(jīng)常為藝術(shù)家所使用。這種格式反映了人類觀察色彩的方式,同時也有利于圖像處理,優(yōu)點,亮度(V)與反映色彩本質(zhì)特性的兩個參數(shù)-色度(H)和飽和度(S)――分開,光照明暗給物體顏色帶來的直接影響就是亮度分量(V),
11、所以若能將亮度分量從色彩中提取出去,而只用反映色彩本質(zhì)特性的色度、飽和度來進行聚類分析,會獲得比較好的效果。這也正是HSV模型在彩色圖像處理和計算機視覺的研究中經(jīng)常被使用的原因,與RGB之間關(guān)系,YUV彩色空間,一種彩色傳輸模型,主要用于彩色電視信號傳輸標準Y-黑白亮度分量,U,V-彩色信息用以顯示彩色圖像,,與RGB之間的轉(zhuǎn)換關(guān)系:,YCrCb彩色空間,一種彩色傳輸模型 ,主要用于彩色電視信號傳輸標準方面,被廣泛的應用在電視的色彩顯
12、示等領(lǐng)域中,優(yōu)點,人類視覺感知過程相類似,應用于電視顯示,視頻壓縮,MPGE/JPEG,將色彩中的亮度分量分離,計算過程和空間坐標形式簡單,與RGB之間關(guān)系,圖像象素間的聯(lián)系,主要介紹數(shù)字圖像中基本而又重要的象素間的關(guān)系,,,表示一幅圖像,p和q,,表示圖像中某個特定的象素,象素的鄰域,4-鄰域和8-鄰域,4-鄰域,4-對角鄰域,8-鄰域,連通性,為了確定目標的邊界和區(qū)域的元素分為連接和連通,連接是連通的一個特例,V-定義為連接的灰度
13、值集合,如在一幅二值圖中,為考慮灰度值為1的象素之間的連通性,V={1}。又知在l幅灰度圖中,考慮具有灰度值在8到16之間象素的連通性,則V={8,9,…,15,16}。,定義3種情況的連接,(1)4-連接: 2個象素p和r在V中取值且r在 中,則它們?yōu)?-連接;,(2)8-連接: 2個象素p和r在V中取值且r在 中,則它們?yōu)?-連接;,m-不連接,路徑,臨近-如果1個象素p和1個象素q是連通的,則稱象素p臨近于q 路
14、徑-如果一條從具有坐標(x,y)的象素p,到具有坐標(s,t)的象素q的路徑,是指具有坐標(x0,y0),(x1,y1),…,(xn,yn)的不同象素的序列。其中(x0,y0)=(x,y),(xn,yn)=(s,t),(xi,yi)臨近于(xi-1,yi-1),1≤i≤n,n是路徑的長度,連通體算法,在二值圖像中標注值為1的4-連通元素為例來說明自動標注連通元素的算法 1、申請一片標注空間2、對圖像中的任意象素p,其上面的象素為t,
15、左邊的象素為r,從左向右掃描圖像,有4中情況,如圖所示: A:如r和t的值為0,給p一個新標記; B:如r或t有一個為1,將為1的標記給p; C:如r和t都是1,并且有相同標記,賦該標記到p; D:如r和t都是1,并且有不同的標記,賦這兩個標記中的一個給p,并且建立一個說明,指出那兩個標記是等價的。,3、在掃描結(jié)束時,所有具有1值的點都被打上標記,但這些標記中的一些也許是等價的,現(xiàn)在需要做
16、的是整理所有的等價對成為等價類,然后給每一個類一個標記,第二次掃描圖像,用所賦予的等價類的標記替換不同的標記。,象素間的距離測量,給定3個象素p, q, r, 坐標分別為 , , ,如果下列條件滿足的話,D是距離量度函數(shù):(1) ( 當且僅當 );(2) ;(3) 。點p和q之間的Euclide
17、an距離定義為,,,小于等于某個值d的距離,以(x,y)為中心,以d為半徑的圓中,點p和q之間的 距離,即棋盤(chessboard)距離,定義為:,,兩點p和q之間的 距離等于它們之間最短的4-通路的長度, 距離也有類似性質(zhì)。實際上我們考慮2點p和q之間的 距離和 距離時并不需要看它們之間是否真有1條通路,因為這些距離的定義只涉及這些點的坐標。但對m-連通,2點之間的距離值(通路的長度)依賴于沿通路的象素和它
18、們近鄰象素的值。,小于等于某個值d的距離,以(x,y)為中心的正方形,,圖像之間的運算,代數(shù)運算幾何運算,代數(shù)運算,代數(shù)運算是指對圖像象素幾何不變化,圖像灰度級的加、減、乘和除運算。也就是對兩幅輸入圖像進行點對點的加、減、乘和除計算而得到輸出圖像的運算,可以將兩幅待處理的圖像f(x,y)和g(x,y)以矩陣的形式表達,M、N分別代表圖像的行列數(shù)。這樣,對于尺寸相同的兩幅圖像,其間的加、減、乘和除運算可分別表達為,,既可為常數(shù),也可為變
19、量。,應用,加運算應用-求平均降噪聲,假設(shè)我們有M幀待分析的圖像序列,則第k幀圖像表示為,理想圖像,噪聲,假設(shè)噪聲圖像為零均值以及各幀獨立,,,定義功率信噪比為,對M幀圖像進行平均,則有,,則輸出圖像的信噪比為,,減運算應用-序列圖像求運動目標,幾何運算,通過圖像象素位置的變換,運算后,直接確定該象素灰度的運算。與代數(shù)運算不同,幾何運算可改變圖像中各物體之間的空間關(guān)系 可看成是將各物體在圖像內(nèi)移動。一個幾何運算需要兩個獨立的算法???/p>
20、間變換,用它來描述每個象素如何從其初始位置“移動”到終止位置;灰度級插值的算法,這是因為,在一般情況下,輸入圖像的位置坐標(x,y)為整數(shù),而輸出圖像的位置坐標為非整數(shù)。,空間變換,要求保持圖像中曲線型特征的連續(xù)性和各物體的連通性,一個約束較少的空間變換算法很可能會弄斷直線和打碎圖像,從而使圖像的內(nèi)容“支離破碎”。一般用數(shù)學方法來描述輸入、輸出圖像點之間的空間關(guān)系。幾何運算的一般定義為:,,灰度級插值,在輸入圖像f(x,y)中,灰度
21、值僅僅在整數(shù)位置(x,y)處被定義,然而在上式中,g(x,y)的灰度值一般由處在非整數(shù)坐標上的f(x,y)的值來確定。所以,如果把幾何運算看成是一個從f到g的映射,則f中的一個象素會映射到g中的幾個象素之間的位置 最簡單的方法-最近鄰法一般采樣雙線性插值,雙線性插值,令f(x,y)為兩個變量的函數(shù),其在單位正方形頂點的值已知,假設(shè)我們希望通過插值得到正方形內(nèi)任意點的f(x,y)的灰度值,則可由雙曲線方程,,從a到d這四個系數(shù)需由已知
22、的四個頂點的f(x,y)灰度值擬合,步驟1-對上端的兩個頂點進行線性插值,可得: 步驟2-對底端的兩個頂點進行線性插值,可得 步驟3-進行垂直方向的線性插值 合并,,,,,,,,基本的幾何運算,平移放大、縮小旋轉(zhuǎn),平移,變換公式,,,放大、縮小,,使圖像在x軸方向放大(縮小)c倍,在y軸方向上放大(縮小)d倍,,由于放大(縮小)算子運算不是一一映射,只是簡單的重復放大,因此將產(chǎn)生所謂的“方塊”效應,為改善這種可視效果,需要進行
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論