2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩51頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第二章  圖像信息基本知識一、 人眼視覺特性 引起視覺的外周感受器官是眼,它由含有感光細胞的視網膜和作為附屬結構的折光系統(tǒng)等部分組成。人眼的適宜刺激是波長370-740nm的電磁波;在這個可見光譜的范圍內,人腦通過接受來自視網膜的傳入信息,可以分辨出視網膜像的不同亮度和色澤,因而可以看清視野內發(fā)光物體上反光物質的輪廓、形狀、顏色、大小、遠近和表面細節(jié)等情況。,自然界形形色色的物體以及文字、圖形等形象,通過視覺系統(tǒng)在

2、人腦得到反映。據估計,在人腦獲得的全部信息中,大約有95%以上來自視覺系統(tǒng),因而眼無疑是人體最重要的感覺器官。,1.    人眼構造簡介  人眼的基本結構如下圖所示。,人眼的結構和照相機相似:瞳孔的直徑可在2-8毫米間調節(jié)--光圈;扁球形彈性透明體(晶狀體)--透鏡;使不同距離的景物在視網膜上成像,視細胞受到光的刺激產生電脈,電脈沖沿著神經纖維傳遞到視神經中樞,由于各細胞產生的電脈沖不同,大腦就形成了景象

3、的感覺。,當用光學原理分析眼的折光特性時,首先遇到的一個困難是,眼球并非一個薄透鏡或單球面折光體,而是由一系列曲率半徑和折光指數都不相同的折光體所組成的折光系統(tǒng)。 研究表明,正常成人眼處于安靜而不進行調節(jié)的狀態(tài)時,它的折光系統(tǒng)的后主焦點的位置,正好是其視網膜所在的位置。,這一解剖關系對于理解正常眼的折光成像能力十分重要。它說明,凡是位于眼前方6m以外直至無限遠處的物體,由于由它們發(fā)出或反射出的光線在到達眼的折光系統(tǒng)時已近于平行,

4、因而都可以在視網膜上形成基本清晰的像,這正如放置于照相機主焦點處的底片,可以拍出清晰的遠景一樣。,當然,人眼不是無條件的看清任何遠處的特體,例如,人眼可以看清楚月亮(或其他更遠的星體)和它表面較大的陰影,但不能看清楚月球表面更小的物體或特征。,為什么?,造成后一限制的原因有二:一是,如果來自某物體的光線過弱,或它們在空間傳播時被散射或吸收,那么它們到達視網膜時已減弱到不足以興奮感光細胞的程度,這樣就不可能被感知;二是,如果物體過小或

5、它們離眼的距離過大,則它們在視網膜上形成的大小,將會小到視網膜分辨能力的限度以下,因而也不能感知。,如果安靜狀態(tài)的眼的折光能力正好把6m以外的物體成像在視網膜上,那么來自較6m為近的物體的光線將是不同程度呈輻射狀的,它們在折射后的成像位置將在主焦點,亦即視網膜的位置之后;由于光線到達視網膜時尚未聚焦,因而物像是模糊的,由此也只能引起一個模糊的視覺形象。 但正常眼在看近物時為什么也十分清楚?,這是由于眼在看近物時已進行了調節(jié),使進

6、入眼內的光線經歷較強的折射,結果也能成像在視網膜上。人眼的調節(jié)亦即折光能力的改變,主要是靠晶狀體形狀的改變。,,眼調節(jié)前后睫狀體位置和晶狀體形狀的改變,為什么買電影往往不要前幾排的票?為什么我要戴眼鏡才看得清楚?,瞳孔和瞳孔對光反應   瞳孔指虹膜中間的開孔,是光線進入眼內的門戶;它在亮光處縮小,在暗光處散大?! ⊥状笮‰S光照強度而變化的反應,是一種神經反射,稱為瞳孔對光反射。引起此反射的感受器就是視網膜,傳入纖維在視神經中,但這

7、部分纖維在進入中樞后不到達外側膝狀體,而在在中腦的頂蓋前區(qū)換神經元,然后到同側和對側的動眼神經核,傳出纖維主要是動眼神經中的副交感纖維,效應器也主要是瞳孔約肌。,有關“視網膜的結構和兩種感光換能系統(tǒng) ”、“視桿細胞的感光換能機制 ”、“視錐系統(tǒng)的換能和顏色視覺 ”、“視網膜的信息處理 ”等不作介紹,感興趣的同學可查閱相關文獻,2.     人眼視覺模型(1)   點擴展函數和

8、調制轉移函數沖激函數經過光學系統(tǒng)后的成像     稱為點擴展函數(PSF)或沖激響應函數;經線性移不變系統(tǒng)后得到的圖像   是原圖像    與點擴展函數   的卷積;    稱為光學系統(tǒng)的調制轉移函數(MTF);    和   可以表征一個線性移不變的光學系統(tǒng),,,,,,,,(2)  人眼視覺模型  人眼類似一個光學系統(tǒng)。由于神經系統(tǒng)的調節(jié),它又不是普通意義上的光學系統(tǒng)。建立視覺模型就是力圖用線性光學系統(tǒng)的概念來解

9、釋某些視覺特性,并可進行一些定量的分析和預測。,1)作為一個光學器件,從空間頻率的角度來說,是一個低通型線性系統(tǒng)。表明:人眼的分辨力是有限的。(瞳孔一定的幾何尺寸及視細胞有一定的大小。)2)人眼對于亮度的響應具有對數性質。人眼正是通過這一對數性質來接受寬達  倍的亮度范圍。人所能覺察到的亮度增量的度量是以B為底的對數增量形式,而不是線性增量:,,,3)由于神經系統(tǒng)的作用,從空間頻率的角度來說,人眼又具有帶通型線性系統(tǒng)的特性,又稱為側抑

10、制效應。加權求和運算將有帶通濾波器的效應。4)從時間上說,人眼對亮度的響應有一定的延時。這是由神經系統(tǒng)時間響應上的限制引起的。,人從亮處進入暗室時,最初看不清楚任何東西,經過一定時間,視覺敏感度才逐漸增主,恢復了在暗處的視力,這稱為暗適應。相反,從暗處初來到亮光處,最初感到一片耀眼的光亮,不能看清物體,只有稍待片刻才能恢復視覺,這稱為明適應。,(3)人眼調制轉移函數和對數-線性系統(tǒng) 圖像處理中大量是靜止圖像,因此上述模型中的1)

11、,2),3)三個子系統(tǒng)將起作用?! 榱说窒搜蹖α炼软憫膶敌再|,測試人眼視覺系統(tǒng)的實際亮度應當是指數性的,這樣人眼視覺系統(tǒng)可以“線性化”,直接可測出調制轉移函數。  亮暗在空間上作正弦變化條紋圖像的物理對比度和感覺對比度之比隨空間頻率變化而變化的曲線,稱為調制轉移函數(MTF)。,3 . 視覺系統(tǒng)對顏色的感知 可見光的波長范圍為380nm~780nm,大多數自然光都是由不同波長的光組合而成。 人的視網膜有對紅、

12、綠、藍顏色敏感程度不同的三種錐體細胞,另外還有一種在光功率極端低的條件下才起作用的桿狀體細胞,因此顏色只存在于眼睛和大腦中。顏色是視覺系統(tǒng)對可見光的感知結果。 紅、綠和藍三種錐體細胞對不同頻率的光的感知程度不同,對不同亮度的感知程度也不同,因此不同組成成分的可見光就呈現(xiàn)出不同的顏色.,視覺系統(tǒng)對顏色和亮度的響應特性曲線(各個波長的光的強度相等),上面的顏色響應曲線表明,人類眼睛對藍光的靈敏度遠遠低于對紅光和綠光的靈敏度。亮度

13、響應曲線表明人眼對波長為550nm左右的黃綠色最為敏感。,許多具有不同光譜分布的光產生的視覺效果(顏色)是一樣的。即光譜與顏色的對應是多對一的。 光譜分布不同而看上去相同的兩種顏色稱為條件等色(匹配等色)。 絕大部分可見光譜對眼睛的刺激效果都可以用紅(700nm),綠(546.1),藍(435.8nm)三色光按不同比例和強度的混合來等效表示。(三刺激理論),匹配任意可見光所需的三原色光比例曲線,從人的主觀感覺角度,顏色包含三

14、個要素:(1)色調(hue):色調反映顏色的類別,如紅色、綠色、藍色等。色調大致對應光譜分布中的主波長。,(2)飽和度(Saturation) 飽和度是指彩色光所呈現(xiàn)顏色的深淺或純潔程度。對于同一色調的彩色光,其飽和度越高,顏色就越深,或越純;而飽和度越小,顏色就越淺,或純度越低。高飽和度的彩色光可因摻入白光而降低純度或變淺,變成低飽和度的色光。100%飽和度的色光就代表完全沒有混入白光的純色光。,(3)明亮度(luminan

15、ce) 明亮度是光作用于人眼時引起的明亮程度的感覺。一般來說,彩色光能量大則顯得亮,反之則暗。 大量試驗表明,人的眼睛能分辨128種不同的色調,10-30種不同的飽和度,而對亮度非常敏感。人眼大約可以分辨35萬種顏色。,4. 顏色模型 顏色模型(color model)是用來精確標定和生成各種顏色的一套規(guī)則和定義。 某種顏色模型所標定的所有顏色就構成了一個顏色空間。 顏色空間通常用三維模型表示

16、,空間中的顏色通常使用代表三個參數的三維坐標來指定,對于人來說,可以通過色調、飽和度和亮度來定義顏色(HSL顏色模型); 對于顯示設備來說,可以用紅、綠、藍磷光體的發(fā)光量來描述顏色(RGB顏色模型); 對于打印設備來說,可以使用青色、品紅、黃色和黑色顏料的用量來指定顏色(CMYK顏色模型)。,(1) RGB顏色模型 理論上絕大部分可見光譜都可用紅、綠和藍 (RGB) 三色光按不同比例和強度的混合來表示。 L=

17、R(紅色的百分比)+G(綠色的百分比)+ B(藍色的百分比)    如 L=0.3R+0.6G+0.1R   當然,這里的系數只是近似的,它具體的值依賴于顯示器所采用的磷粉標準,以NTSC視頻信號標準,則三個系數依次為:0.299、0.587、0.144 RGB模型稱為相加混色模型,用于光照、視頻和顯示器。例如,顯示器通過紅、綠和藍熒光粉發(fā)射光線產生彩色。,(2) CMYK顏色模型在理論上,絕大多數顏色都可以用三種基本顏料(

18、青色cyan、品紅magenta、和黃色yellow)按一定比例混合得到。理論上,青色、品紅和黃色三種基本色素等量混合能得到黑色。但實際上,因為所有打印油墨都會包含一些雜質,這三種油墨混合實際上產生一種土灰色,必須與黑色 (K) 油墨混合才能產生真正的黑色,所以再加入黑色作為基本色形成CMYK顏色模型。CMYK模型稱為相減混色模型。,RGB彩色空間和CMY彩色空間的表示法,顏色模型的空間表示,(3)HSL顏色模型在HSL模型中,H

19、定義色調;S定義顏色的深淺程度或飽和度;L定義亮度。RGB模型和CMYK模型主要是面向設備的,而HSL模型更容易被人理解和控制。,(4)YIQ顏色模型 我們也可以將RGB顏色模型轉化為亮度-色度空間。在NTSC視頻信號中使用了YIQ顏色模型。這是一種由RGB轉化來的亮度-色度模型,該模型中Y代表了光源的亮度,而色度則包含在I、Q兩個參數里。在參數I中包含了橙-青的色彩信息,Q中包含了綠-品紅的色彩信息。 由于人眼對于亮度的敏感程度

20、大于對于色度的敏感程度,因此將最大的帶寬分給Y信號,并且由于Y信號包含了亮度信號,所以在黑白電視機中就只使用Y信號。,下面是RGBYIQ的變換公式:,(5)YUV顏色模型 YUV顏色模型和YIQ顏色模型類似。 事實上YUV只是一類顏色模型(YCrCb)的總稱。其中Y的定義是相同的,色度信息也是組合在Cr、Cb中,其中Cr代表了光源中的紅色分量,Cb代表了光源中的藍色分量,因此它的變換公式:,5 “眼見為實”嗎?,,,馬赫帶效應,

21、雖然條帶強度恒定,但實際感覺到了一幅帶有毛邊(特別是靠近邊界處)的亮度圖形。,二、  圖像質量評價可懂度逼真度1.圖像質量評估方法與標準當前對圖像質量的評估方法主要分成兩類:主觀評價和客觀測量。主觀評價的方法與標準已相對完善,而客觀測量則處于熱點研究中。,1)主觀評價 主觀評價的方法是將待評價的圖像序列播放給評論者觀看,并記錄他們的打分,然后對所有評論者的打分進行統(tǒng)計,得出平均分作為評價結果。,很顯然,主觀評價有幾

22、個顯著的不足之處: (1)觀察者一般需要是一個群體,并且經過培訓以準確判定主觀評測分,人力和物力投入大,為時較長;(2)圖像內容與情節(jié)千變萬化,觀察者個體差異大,容易發(fā)生主觀上的偏差;(3)主觀評價無法進行實時監(jiān)測;(4)僅僅只有平均分,如果評測分數低,無法確切定位問題出在哪里。,2)客觀測量 客觀測量基于仿人眼視覺模型的原理對圖像質量進行客觀評估,并給出客觀評價分。近幾年,隨著人們對人眼視覺系統(tǒng)研究的深入,客觀測量

23、的方法和工具不斷被開發(fā)出來,其測量結果也與主觀評價較吻合。國際上也成立了ITU-R視頻質量專家組(ITU-RVQEG:VideoQualityExperts Group)專門研究和規(guī)范圖像質量客觀測量的方法和標準。,VQEG規(guī)定了兩個簡單的技術參數:峰值信噪比(PSNR)和均方差(MSE)。此外,還有許多圖像質量模型,這些模型在測量圖像質量時都基于人眼視覺特性。下圖是一種典型的基于解碼圖像與基準圖像差值的圖像質量客觀測量模型。,,三、

24、    圖像噪聲 1.   噪聲的定義:  不可預測,只能用概率統(tǒng)計方法來認識的隨機誤差。圖像噪聲:妨礙人們視覺器官對所接收的信源信息理解的因素?!?由于噪聲定義為隨機誤差,因而對噪聲的描述方法可以借用隨機過程的描述,即用其概率分布函數和概率密度分布函數。這種描述是困難的,甚至不可能的。實際應用中往往采用數字特征來描述。 但是,噪聲問題不能完全看作是一個純科學或純數學問題

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論