web圖像語義特征的分析與提取研究及實現(xiàn)【畢業(yè)設計+開題報告+文獻綜述】

上傳人：奔*** IP屬地：河北更新時間：2024-05-12 格式：doc 頁數(shù)：56 大?。?.51MB 人氣指數(shù)：12 舉報 版權(quán)申訴

web圖像語義特征的分析與提取研究及實現(xiàn)【畢業(yè)設計+開題報告+文獻綜述】_第1頁

已閱讀1頁，還剩55頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

1、　　本科畢業(yè)設計(論文)　　（二零屆）　　WEB圖像語義特征的分析與提取研究及實現(xiàn)　　所在學院 　　專業(yè)班級計算機科學與技術(shù) <

2、;/p>　　學生姓名學號 　　指導教師職稱 　　完成日期年月 　　摘要：隨著網(wǎng)絡和多媒體技術(shù)的快速發(fā)展，每天都會在互聯(lián)網(wǎng)上涌現(xiàn)出海量的WEB圖像。

3、然而，如何從中獲得用戶所需的WEB圖像，挖掘隱藏在其中的有用信息，使得圖像識別和檢測技術(shù)的研究有著重要的意義和發(fā)展前景。特征提取是圖像識別和檢測急速的關(guān)鍵步驟,其有效性將直接決定后續(xù)操作的效果。因此，如何從圖像中提取出具有較強語義表示能力的特征是近期圖像處理研究領(lǐng)域的一個熱點。在本文中，我們將介紹常見圖像特征提取方法的基本思想、特點及存在的一些問題。特別是重點介紹了特征提取中最常用的三種語義特征（顏色、紋理和形狀特征）的提取方法。最后，

4、我們設計了應用程序來提取網(wǎng)絡上下載得到風景圖像的顏色、紋理和形狀特征，并加以性能對比。　　關(guān)鍵詞：WEB圖像；特征提??；顏色特征；紋理特征；形狀特征；　　The Research and Implement of the Analysis and Extraction for WEB Image Semantic Features

5、　　Abstract: With the fast development of network technology and multimedia technique, huge of WEB images are appeared on the Internet. However, how to obtain WEB images that users requested, and mine useful info

6、rmation from them, which makes the research on image recognition and retrieval having a significant meaning and a large prospect. Image feature extraction is a key step in image recognition and retrieval and its effectiv

7、eness will directly determine the results of following processing. Thus　　Key words: WEB image; feature extraction; color feature; texture feature; shape feature　　目錄</

8、b>　　1 緒論1　　1.1 研究意義1　　1.2 國內(nèi)外研究現(xiàn)狀1　　1.3 特征提取中存在的問題3　　1.4 研究的主要內(nèi)容5<p&

9、gt;　　1.5 論文的結(jié)構(gòu)5　　2 圖像的語義信息6　　2.1 圖像的低層語義信息6　　2.1.1 顏色特征7　　2.1.2 紋理特征7　　2.1.3 形狀特征8

10、　　2.2 圖像的高層語義信息8　　3 特征提取的主要技術(shù)10　　3.1 顏色特征提取10　　3.1.1 顏色空間模型10　　3.1.1.1 RGB顏色空間10　　3.1.1.2 HSV顏色空間11<

11、/p>　　3.1.1.3 RGB顏色空間到HSV顏色空間的轉(zhuǎn)化12　　3.1.2 顏色直方圖13　　3.1.3 顏色矩13　　3.1.4 顏色聚合矢量14　　3.2 紋理特征提取14

12、　　3.2.1 灰度共生矩陣14　　3.2.2 Tamura紋理特征16　　3.2.3 小波變換方法18　　3.3 形狀特征提取19　　3.3.1 傅里葉描述子19　　3.3.2 Hu不變矩20</p

13、>　　4 WEB圖像的特征分析與提取22　　4.1 WEB圖像的特征分析22　　4.2 WEB圖像的顏色特征提取22　　4.3 WEB圖像的紋理特征提取22　　4.4 WEB圖像的形狀特征提取23&l

14、t;p>　　5 功能實現(xiàn)25　　5.1 實現(xiàn)環(huán)境25　　5.2 實驗實現(xiàn)26　　5.2.1 顏色特征提取的實現(xiàn)26　　5.2.2 紋理特征提取的實現(xiàn)29　　5.2.3

15、形狀特征提取的實現(xiàn)31　　6 總結(jié)與展望35　　6.1 總結(jié)35　　6.2 展望35　　致謝錯誤!未定義書簽。　　參考文獻36

16、　　1 緒論　　1.1 研究意義　　隨著網(wǎng)絡速度的提高和上網(wǎng)人數(shù)的快速增長，互聯(lián)網(wǎng)已經(jīng)走進了千家萬戶中。與此同時，網(wǎng)絡的普及、網(wǎng)絡技術(shù)的飛快發(fā)展和多媒體技術(shù)的迅速崛起，使得互聯(lián)網(wǎng)上圖像所占的比重越來越大。隨著社交網(wǎng)絡、博客、論壇等在網(wǎng)絡上的崛起與壯大，每天被網(wǎng)民所游覽、上傳、

17、下載的圖像簡直無以計數(shù)，同時越來越多的行業(yè)通過網(wǎng)絡都在使用大量的圖像數(shù)據(jù)。而如何從大量的圖像數(shù)據(jù)中獲得自己感興趣的信息，并對其進行合理的組織和利用，是一個非常有挑戰(zhàn)性的問題，因此，在這樣的趨勢下圖像檢索技術(shù)的研究有重要的意義和發(fā)展前景。　　而圖像檢索或分類技術(shù)的前提和關(guān)鍵在于分析和提取最有表現(xiàn)力的圖像特征。如果選擇鑒別力高的圖像語義特征用于分類，則會產(chǎn)生較好的分類結(jié)果，反之，結(jié)果會不慎心意。而在

18、檢索之前先對圖像數(shù)據(jù)庫進行合理的分類，特別是對于現(xiàn)在容量日益趨增的圖像數(shù)據(jù)庫檢索出符合心意的圖像來，將會大大提高CBIR[1]系統(tǒng)的檢索效率，使得搜索結(jié)果更深人意。另一方面，由于WEB圖像的特征維數(shù)高，運算復雜度高，從提高檢索精度或分類正確率的角度而言，都不可能將所有提取的特征都能用于檢索或分類。在提取多種圖像語義特征的基礎上，提出采用互信息的方法分別研究單一的語義特征和多種特征組合的鑒別力，并分析特征之間的互補或冗余關(guān)系，從而進行特征

19、的選擇。因此對圖像語義特征的分析與提取研究是非常有必要。　　由于目前大型圖像數(shù)據(jù)庫的廣泛存在，對于圖像數(shù)據(jù)庫檢索或分類是一門重要的課題，多年來已經(jīng)取得了很大發(fā)展。但是因為圖像的復雜度，使圖像檢索仍是熱門課題，并尚有很多關(guān)鍵技術(shù)點沒有解決，其中關(guān)于圖像語義特征的研究成為這一領(lǐng)域最前沿的研究熱點之一。　　1.2 國內(nèi)外研究現(xiàn)狀<

20、;p>　　基于內(nèi)容的圖像檢索自從幾十年前被提出以來，得到國內(nèi)外信息領(lǐng)域科技人員的廣泛重視和研究，迅速成為多媒體，特別是圖像和數(shù)據(jù)庫技術(shù)中的研究熱點之一和中國圖像工程的新類別之一。　　經(jīng)過國內(nèi)外信息領(lǐng)域科技人員幾十年的研究，基于內(nèi)容的圖像檢索研究和應用已經(jīng)取得了相當大的進展。不僅有大量相關(guān)理論研究和技術(shù)應用的論文發(fā)表，而且也出現(xiàn)了不少較成熟的應用系統(tǒng)模型。其中，具有商用價值的著名軟件包系統(tǒng)包

21、括IBM公司的QBIC[2,3]系統(tǒng)和Virage公司開發(fā)的Virage[4]系統(tǒng)；試驗原型系統(tǒng)包括由哥倫比亞大學開發(fā)的VisualSEEK和WebSEEK[5,6]，MIT媒體實驗室開發(fā)的PhotoBook[7,8]系統(tǒng)，美國UCSB大學的Alexandria數(shù)字化圖書館項目中用于圖像檢索的Netra[9]系統(tǒng)以及UIUC的MARS[10]系統(tǒng)等等，這些系統(tǒng)在一定的領(lǐng)域得到了應用。<b&

22、gt;　　(1)QBIC　　QBIC(Query By Image Content)是IBM Almaden研究中心于90年代開發(fā)的第一個商用的基于內(nèi)容的圖像檢索系統(tǒng)，它的系統(tǒng)結(jié)構(gòu)及所用技術(shù)對后來的圖像檢索系統(tǒng)有很深遠的影響。　　它提供了基于顏色特征、紋理特征和形狀特征的檢索功能。基于顏色特征的查詢用的是RGB、Lab和MTM(Mat

23、hematical Transformto Munsell)坐標系及K元顏色直方圖，主要采用顏色百分比殼詢和顏色直方圖查詢兩種方法；基于紋理特征的查詢用的是Tamura紋理表示的一種改進形式，如粗糙度、對比度和方向性的組合?；谛螤钐卣鞯牟樵兪褂昧诵螤蠲娣e、曲線、主軸方向和一組變換不變量等描述方法。QBIC還考慮了高維特征索引。這種方法能夠使用戶更加快速簡潔的對可視化信息進行篩選與確定。用戶檢索時，無需提供文字檢索詞，只要輸入以圖像形式

24、表達的檢索要求即可檢索出一系列相似的圖像。它為多個數(shù)據(jù)庫提供檢索試驗，例如美國1995年以前發(fā)行的郵祟圖案、世界著名商標、舊金山美術(shù)博物館圖像數(shù)據(jù)庫等。它提供了多種查詢方式，包括利用系統(tǒng)提供的標準范圖檢索，用戶繪制簡圖或輸入圖像進行檢索等。　　雖然QBIC系統(tǒng)可以使用多種特征進行檢索，但這些特征間是孤立而沒有聯(lián)系的，同時用戶使用該系統(tǒng)需要具有圖像特征的一些基本知識，這就使得該系統(tǒng)的易用性大打折扣

25、。　　VisualSEEK and WebSEEK　　VisualSEEK和WebSEEK是美國哥倫比亞大學開發(fā)的。VisualSEEK是基于圖像視覺特征的搜索引擎，支持基于視覺特征和它們之間空間關(guān)系的查詢。圖像特征從圖像的壓縮域中獲得。圖像視覺特征主要是顏色和基于小波變換的紋理特征，并且使用基于quad-tree和R-tree的索引結(jié)構(gòu)提高檢索速度。W

26、ebSEEK是面向WEB的文本/圖像搜索引擎，主題分類是其主要優(yōu)點。它由三個模塊組成，分別是視頻/圖像采集模塊，主題分類和索引模塊，查找、瀏覽和檢索模塊。該系統(tǒng)支持基于關(guān)鍵字的查找和基于視覺內(nèi)容的查找。WebSEEK的檢索途徑有三種，一是使用關(guān)鍵詞進行自由全文檢索，但不支持短語檢索；二是利用不同的類目等級進行主題瀏覽；三是在檢出圖像的基礎上利用其可視屬性進一步檢索。　　(3)Photobook&

27、lt;/p>　　Photobook是MIT媒體實驗室開發(fā)的一套瀏覽、檢索圖像的交互式工具，它包含三個子系統(tǒng)，分別提取形狀、紋理和面部特征，用戶可以分別在上述三個子系統(tǒng)中根據(jù)相應的特征進行檢索。目前還沒有一種特征可以很好地對圖像建模，所以在Photobook的最新版本FourEyes　　中，Picard等提出在圖像的標注和檢索過程中包括人。更進一步，由于人的感知是主觀的

28、，他們又提出了“模型集合”結(jié)合人的因素。實驗結(jié)果表明該方法對交互式圖像注釋很有效。　　國內(nèi)從1994年開始關(guān)注這方面的研究，清華大學圖形圖像研究所、中科院計算所、微軟亞洲研究院多媒體技術(shù)組、國防科技大學多媒體中心等科研機構(gòu)在這方面都取得了一定的成果。　　清華大學設計了基于內(nèi)容的WWW圖像搜索引擎ImgRetr[11]，該系統(tǒng)是面向多媒體制作圖像素材庫的，

29、圖庫中設計的內(nèi)容面較廣，但缺乏特定的領(lǐng)域知識。它采用了主顏色、紋理、顏色直方圖、顏色分布、輪廓等通用特征來對圖像的內(nèi)容進行描述，同時采用GSS樹作為系統(tǒng)的相似索引，顏色直方圖和輪廓的相似度計算采用二次型的距離度量，其他特征的相似度計算采用了歐式距離進行度量。　　國防科技大學多媒體開發(fā)中心設計開發(fā)了一個基于內(nèi)容的視頻新聞節(jié)目瀏覽檢索系統(tǒng)——NewsVideoCAR(News Video Conte

30、nt Analysis & Representation)[12]。該系統(tǒng)能對新聞視頻的內(nèi)容進行自動分析、分類和管理，用戶在該系統(tǒng)的幫助下可以快速定位感興趣的新聞片斷，也可以快速掌握一段新聞的大意。另外，用戶還可以通過關(guān)鍵字檢索特定內(nèi)容的新聞。　　iFind[13,14]系統(tǒng)是微軟亞洲研究院多媒體組開發(fā)的基于內(nèi)容圖像檢索的原型系統(tǒng)，它提供了關(guān)鍵詞檢索、示例檢索、分類瀏覽、相關(guān)反饋和半自動

31、標引等功能。其主要技術(shù)在于物理特征和語義信息相結(jié)合的檢索技術(shù)，其特色在于基于語義傳遞的相關(guān)反饋技術(shù)。ImageHunter[15]是中科院計算技術(shù)研究所數(shù)字化技術(shù)研究室開發(fā)的一個圖像檢索原型系統(tǒng)，目前系統(tǒng)實現(xiàn)了圖像顏色、紋理特征的自動提取及在此基礎上的圖像檢索，同時該系統(tǒng)還包含了基于文本的圖像檢索及標注功能。　　1.3 特征提取中存在的問題　　就目前研

32、究現(xiàn)狀而言，CBIR技術(shù)己經(jīng)研究了幾十多年，有了很大發(fā)展，也有了不少成形的算法，不過其中很多關(guān)鍵問題還是遠遠沒有得到解決，總體效果不能令人滿意。基于內(nèi)容的圖像檢索希望采用圖像處理與計算機視覺技術(shù)自動地從圖像中獲得語義內(nèi)容,但由于圖像語義的內(nèi)在復雜性，目前還難以實現(xiàn)對圖像語義的自動提取。語義特征的提取，現(xiàn)在只是將圖像的低層視覺特征映射到高層語義。圖像的低層特征的提取始終是關(guān)鍵，目前基于內(nèi)容的圖像檢索技術(shù)仍然主要集中在顏色、紋理、形狀、輪廓

33、等低層視覺特征提取的基礎上，但是由于圖像特征描述和特征提取及相似性度量的復雜性，其技術(shù)仍不是很成熟，理論上還有許多問題有待解決。　　顏色特征提取中存在的問題　　顏色特征是許多CBIR系統(tǒng)的一個主要研究對象[16]，但顏色之間的相似性度量的定義和視覺上人對顏色的判定仍有一定的差距[17]。另外由于顏色對圖像或圖像區(qū)域的方向、大小等變化不敏感，所以顏色特征不

34、能很好地捕捉圖像中對象的局部特征。同時定義一種和人的視覺相一致的度量可以進一步提高檢索效果，這需要對人類心理學和人類視覺以及顏色物理幾方面進行綜合深入地研究。　　紋理特征提取中存在的問題　　基于紋理的特征提取的主要問題在于目前的紋理特征提取的算法僅僅適用于某一特定物體，無法精確的適用于圖像庫中的其他物體。而且紋理特征是圖像中比較復雜的特征，因為紋理特征代

35、表了人的復雜心理認知過程，而機器視覺難以精確模擬人在多變場景中對紋理的準確識別過程。紋理是一個區(qū)域性概念，無法在像素級層面給予準確描述。而且由于紋理特征所占有的有效尺度隨著圖片的細致程度而變化，且紋理效果受視角、幾何形變的影響較大，所以準確的提取和判斷出圖像的紋理特征至今沒有很好的辦法。同時使用紋理特征首先需要將圖像紋理進行分割，而這是一項相當困難且計算量很大的上作，另外基于紋理的技術(shù)缺乏有效的紋理模型，紋理特征與人類感知的相關(guān)性還不得

36、而知[18]。　　形狀特征提取中存在的問題　　如何精確地提取圖像的邊界形狀一直是困擾圖像處理領(lǐng)域多年的難題[19]，對于大批量圖像數(shù)據(jù)而言，這個問題將顯得更為突出。各種形狀特征表達方法對形狀信息的丟失非常嚴重；而目前基于形狀的檢索方法還缺乏比較完善的數(shù)學模型；另外如果目標有變形時檢索結(jié)果往往不太可靠；同時許多形狀特征僅描述了目標局部的性質(zhì)，要全面描述目標

37、常對計算時間和存儲量有較高的要求；還有許多形狀特征所反映的目標形狀信息與人的直觀感覺不完全一致，或者說，特征空間的相似性與人視覺系統(tǒng)感受到的相似性有差別[20]。　　圖像語義特征提取難度高，“語義鴻溝”導致目前檢索系統(tǒng)通常只使用的低層可視化特征，這與高層語義之間存在的巨大語義間隔[21]。因此，亟需一個從高層語義到低層特征的映射來彌合兩者之間的間隔。

38、圖像特征提取是圖像檢索的關(guān)鍵步驟，它直接影響到圖像特征的相似性度量以及圖像檢索的結(jié)果。　　1.4 研究的主要內(nèi)容　　本文從圖像低層語義特征的分析及提取出發(fā)，對WEB圖像中的風景圖片的可視化視覺特征的分析與提取進行研究。本文主要做了一下幾個方面的研究。　　特征分析。圍繞WEB圖像中的風景圖片的可視化特征進行分析，

39、以得出其特有的低層語義特征，為特征提取做好進一步的準備工作。　　特征提取。圍繞圖像低層特征的提取提取方法展開研究，在總結(jié)他人的研究成果的基礎上，就綜合WEB圖像中的風景圖片分析得到的特征進行低層語義特征的提取。　　基于以上的研究，設計了一個圖像低層語義特征提取的系統(tǒng),分別提取WEB圖像的顏色、紋理、形狀特征。

40、1.5 論文的結(jié)構(gòu)　　本文詳細介紹了基于圖像特征檢索技術(shù)的現(xiàn)狀，在系統(tǒng)分析了圖像低層特征提取的一些關(guān)鍵技術(shù)后，重點圍繞WEB圖像特征分析和提取展開研究，本文共分六章，具體的章節(jié)內(nèi)容安排如下。　　緒論，論述圖像特征提取的研究的背景與研究意義，研究的現(xiàn)狀和存在的問題以及本文主要研究的內(nèi)容和結(jié)構(gòu)安排。　　圖像的語義信

41、息，介紹了圖像的低層語義特征和圖像的高層語義特征以及圖像語義特征的“語義鴻溝”，最后就本文就研究低層視覺特征進行了說明。　　圖像特征的提取技術(shù)，介紹目前基于圖像低層語義特征的提取技術(shù)，主要是在顏色、紋理和形狀這三種常用特征介紹了其各自的常用提取技術(shù)與算法。　　針對WEB圖像的語義特征分析與提取，主要先從WEB圖像的語義特征分析入手，介紹了WEB圖像的視覺

42、特點并提出其語義特征（顏色、紋理、形狀）的提取。　　功能實現(xiàn)與實驗結(jié)果，對基于WEB圖像特征提取系統(tǒng)進行了實現(xiàn)，介紹了系統(tǒng)開發(fā)的環(huán)境，并對WEB圖像分別采用不同的算法提取其視覺特征，并給出了實驗結(jié)果。　　總結(jié)與展望，總結(jié)本論文的要點和主要工作，并對進一步的研究方向和未來發(fā)展進行展望。　　2 圖像的語義信息<

43、;/p>　　圖像視覺信息內(nèi)容主要涉及兩層含義[23]：一層是圖像信息的視覺特征，如顏色(灰度)、紋理、形狀與空間關(guān)系等，這是低層的圖像信息模型，也是圖像所固有的物理屬性，能被人的感官覺察出來的，圖像內(nèi)容是客觀的；另一層是與人類認知領(lǐng)域相關(guān)的圖像內(nèi)容，即圖像內(nèi)容的語義描述，也稱為高層次圖像信息。在一幅圖像中，語義描述包含了物體(或稱對象)的定義、物體的空間位置與物體間的空間關(guān)系等。圖像內(nèi)容除了客觀內(nèi)容外，還帶有

44、主觀內(nèi)容。對于一幅太陽的圖片，“紅色的圓形物體”是圖像視覺信息內(nèi)容的低層視覺特征，而“太陽”就是圖像所含的語義，它是用戶直接習慣描述圖像內(nèi)容的方式，顯然，這種說法更自然，更方便。雖然語義描述對于人來說比較簡單，是建立在對所描述圖像內(nèi)容的某些先驗知識(或假設)的基礎上，但是由計算機實現(xiàn)則是非常的困難[24]。　　按照圖像語義的復雜程度，可以將之分為三個層次[25]，如圖2-1所示：</p&g

45、t;　　圖2-1 圖像語義層次模型　　第一層次是特征語義層。通過圖像的低層視覺特征如顏色、紋理及形狀等及其組合來提取相關(guān)語義描述；第二層是對象語義層。通過識別和推理找出圖像中的具體目標對象及其相互之間的關(guān)系，然后給出語義表達；第三層是抽象語義層。通過圖像包含的對象、場景的含義和目標進行高層推理，得到相關(guān)的語義描述。這個層次的語義主要涉及圖像的場景語義、行為語義和情感語義。&

46、lt;/p>　　2.1 圖像的低層語義信息　　目前對于圖像語義特征的研究集中在語義特征模型的第一層，即特征語義層，而現(xiàn)在圖像檢索中較常用的低層視覺特征主要是：顏色、紋理、形狀。　　2.1.1 顏色特征　　顏色特征是彩色圖像的最顯著的特征，是圖像檢索中應用最為廣泛的視覺特征[26,2

47、7]，是人識別圖像的主要感知特征之一。另外，相對于其他特征，顏色特征對圖像本身的尺寸、方向、視角的依賴性較小，從而具有較強的魯棒性[28]，而且顏色特征計算簡單，因此，顏色特征是使用最多的圖像低層特征之一，也是最有效的圖像特征之一?；谶@些優(yōu)點，利用顏色特征進行圖像檢索受到大量重視和研究，成為基于內(nèi)容圖像檢索系統(tǒng)中應用最廣泛的主要特征之一。　　圖像的顏色特征可以是各種顏色的比例分布或者顏色空間的

48、分不等。如何準確充分的提取一幅圖像的顏色信息，并以適當?shù)姆绞奖硎?，將直接影響整個圖像檢索系統(tǒng)的效率和精度。　　要準確地描述顏色特征則需要選擇一個合適的顏色空間，并用量化的方式將顏色特征表征為向量的形式。典型的顏色方法是利用顏色直方圖表示圖像顏色的分布特點，另外還有顏色集、顏色矩、顏色聚合向量和顏色相關(guān)圖等表示圖像的顏色特征，每一種表示方法各有其優(yōu)缺點。

49、　2.1.2 紋理特征　　紋理，是描述圖像內(nèi)容的另一個重要特征，同時也是一個難于描述的特征，關(guān)于紋理的定義和紋理的量化方法至今還沒有一個統(tǒng)一的標準，針對圖像處理領(lǐng)域，相關(guān)的定義有：“紋理是一種反映一個區(qū)域中象素灰度級的空間分布的屬性”[28]，一般將圖像在局部區(qū)域內(nèi)呈現(xiàn)不規(guī)則性而在整體上表現(xiàn)出某種規(guī)律性的特性稱為紋理。紋理特征是一種全局特征，一種不依賴于顏色或亮度的反映圖像中同質(zhì)現(xiàn)象的視覺特征

50、，它也描述了圖像或圖像區(qū)域所對應景物的表面性質(zhì)。紋理特征包含了物體表面結(jié)構(gòu)組織排列的重要信息以及它們與周圍環(huán)境的聯(lián)系。紋理是一種統(tǒng)計特征，具有旋轉(zhuǎn)不變性，并具有較強的抗噪音能力。與顏色特征不同，紋理特征不是基于像素點的特征，它需要在包含多個像素點的區(qū)域中進行統(tǒng)計計算。在模式匹配中，這種區(qū)域性的特征具有較大的優(yōu)越性，不會由于局部的偏差而無法匹配成功。同時，紋理特征只是物體表面的一種特性，并不能完全反殃出物體的本質(zhì)屬性。另外，由于有可能受到

51、光照、反射情況的影響，從二維圖像中反映出來的紋理不一定是三維物體表面真實的紋理。　　基于紋理特征檢索的分析方法主要有兩類：結(jié)構(gòu)分析方法，統(tǒng)計分析方法。結(jié)構(gòu)法分析紋理的基本思想是假定紋理模式由紋理基元以一定的、有規(guī)律的形式重復排列組合而成，特征提取就變?yōu)榇_定這些基元并定量分析它們的排列規(guī)則。對于紋理規(guī)則的圖像采用結(jié)構(gòu)分析方法是很有效的。統(tǒng)計法分析紋理的主要思想是通過圖像中灰度級分布的隨機屬性來描述

52、紋理特征。統(tǒng)計分析方法通常在頻率域和空間域上進行。在頻率域上主要采用傅里葉變換級數(shù)和小波分析，而在空間域上主要采用R.Haralick[29]等人提出的關(guān)于紋理的共生矩陣表示。　　2.1.3 形狀特征　　形狀特征是描述圖像內(nèi)容的另一個重要特征，也是計算機視覺和模式識別研究的一個基本問題。采用形狀特征進行檢索，用戶可以通過勾勒圖像的形狀或輪廓，從圖像庫中

53、檢索出形狀相似的圖像?；谛螤钐卣鞯臋z索有兩種：一種是分割圖像經(jīng)過邊緣提取后得到目標的輪廓線，針對這種輪廓線進行圖像特征檢索；另一種是基于圖像的區(qū)域特征進行檢索[30,31]。　　針對形狀輪廓特征的描述方法主要有：邊界直方圖、鏈編碼、曲率尺度空間、傅里葉描述符等，其中最典型的方法為傅立法描述符。它的基本思想是用物體邊界的傅里葉交換作為形狀描述。利用區(qū)域邊界的封閉性和周期性將工作問題轉(zhuǎn)化為一維問題

54、，從而提高了檢索的效率。針對區(qū)域特征的描述方法主要有形狀的無關(guān)矩、區(qū)域的面積、形狀的縱橫比率[32]。對于基于形狀的檢索來說。形狀的提取、描述及匹配都是重點要解決的問題。與基于顏色和紋理的檢索方法相比較，基于形狀的檢索方法比較困難。　　2.2 圖像的高層語義信息　　基于高層語義信息的圖像檢索被認為是最具利用價值的圖像語義檢索方式，因為它允許用戶在檢索過

55、程中可以用主觀感覺來描述圖像，這對于圖像檢索者而言，無疑有助于提高檢索效率和準確度。　　許多研究者將圖2-1圖像語義層次模型的第二和第三層次的圖像檢索稱為語義圖像檢索[33]。目前，語義特征一般用文字描述，傳統(tǒng)的方法一般用半自動或手動輸入的方式提取語義特征。圖像的高層語義特征需要人為理解，而且每個用戶對圖像語義的主觀理解又不盡相同，這大大增加了圖像檢索中高層語義特征提取的難度。研究者普遍認為，在

56、基于內(nèi)容的圖像檢索研究中合理地引入人工智能和機器學習技術(shù)是解決高層語義難題的有效途徑[34]?？梢酝ㄟ^嵌入知識表示、推理學習機制和機器學習技術(shù)，采用統(tǒng)計的方法自動建立圖像多維信息特征的索引結(jié)構(gòu)，自動選取合適的低層特征組合實現(xiàn)圖像與其語義內(nèi)容的對應，實現(xiàn)圖像語義的有效檢索。　　雖然基于語義圖像內(nèi)容檢索進行查詢是最符合人的需求的方式[35]，也是理想的檢索方式，但是就當前的計算機技術(shù)和圖像理解的發(fā)展

57、水平來看，這種完全智能化的檢索正處于研究階段，也產(chǎn)生了一些原型系統(tǒng)，但離實際廣泛應用還有較遠的距離。　　由于目前計算機視覺和圖像理解技術(shù)的發(fā)展水平限制，使得基于內(nèi)容的圈像檢索技術(shù)無法真正支持基于語義的圖像檢索，故本文在是基于圖像的低層語義特征下展開研究的。　　3 特征提取的主要技術(shù)　　特征提取是基于內(nèi)容的圖像檢

58、索的基礎。如何有效的描述圖像的特征，是CBIR中最為關(guān)鍵的環(huán)節(jié)，其直接關(guān)系到整個系統(tǒng)的檢索準確度、檢索效率和檢索效果。有效的特征應該是：具有直觀意義，區(qū)分能力強，計算相對簡單，平移、尺度旋轉(zhuǎn)不變性等。　　因為高層語義特征需要對物體進行識別和解釋，往往要借助人類的知識推理，由于目前計算機視覺和圖像理解的發(fā)展水平限制，使得基于內(nèi)容的圖像檢索技術(shù)無法真正支持基于語義的圖像檢索。因此，本文暫不考慮圖像的

59、高層語義特征，主要涉及圖像的低層語義特征分析和提取。　　3.1 顏色特征提取　　顏色特征的提取首先要建立在一定的顏色空間模型上，然后利用各種特征表示方法提取圖像顏色。　　3.1.1 顏色空間模型　　顏色特征的提取不僅取決與圖像本身，還依賴于觀察者的視覺系統(tǒng)和個人經(jīng)驗。

60、因此，為了準確提取表達原始圖像的顏色信息，提取算法必須在符合人類視覺系統(tǒng)的生理特征和人類觀察經(jīng)驗的視覺感知特征的特定的顏色空間內(nèi)進行。顏色空間模型的選擇直接將影響到檢索效果。表示數(shù)字圖像的顏色空間有很多種，每一種顏色空間都是在某種特定上下文中對顏色的特性和行為的解釋方法。目前常用的顏色空間模型有RGB顏色空間，HSV顏色空間等。　　3.1.1.1 RGB顏色空間<

61、p>　　RGB顏色空間[36]是彩色圖像最基本的顏色空間，也是最直接的表示顏色的方法，所有的顏色都可以看作是3個基本顏色——紅(R，red)，綠(G，green)和藍(B，blue)的不同組合。如圖3-1，RGB顏色空間是基于迪卡爾坐標系，其三個軸分別代表R、G、B三個分量，用第一象限內(nèi)的經(jīng)過歸一化的單位立方體表示所有的顏色，即每一種顏色都用三個顏色分量R、G、B來表示，對應空間中三個分量所構(gòu)成的一個空間點。原點處對應黑色，其R、

62、G、B分量都是0；和原點距離最遠的定點對應白色，其R、G、B分量都是l；黑色點和白色點之間的連線上R、G、B三者等值，代表由黑色到白色的灰度值，為灰度線；其余六個頂點分別代表光的三基色和三補色；立方體內(nèi)的其余各點都可以分解為三個坐標用R、G、B三個顏色分量來表示。　　圖3-1 RGB顏色空間模型　　RGB顏色空間是面向硬設備常用的彩色模型，應用十分廣泛

63、。雖然RGB空間表達簡單方便，但是這種方法不過直觀，從RGB值中很難知道所表示顏色的認知屬性，不符合人對顏色的感知心理。其次，RGB顏色空間不是一個均勻視覺的顏色空間，空間上的兩點間距離并不代表人類視覺上兩種顏色的相似性。　　3.1.1.2 HSV顏色空間　　HSV顏色空間[37]是一種面向視覺感知的顏色空間，直接對應于人眼色彩視覺特性的三要素：色調(diào)H

64、(Hue)、飽和度S(Saturation)和亮度V(Value)，通道間各自獨立。色調(diào)H表示從一個物體反射過來的或透過物體的光波長，即是光的顏色，不同波長的光呈現(xiàn)不同的顏色，具有不同的色調(diào)，如紅、橙、黃、綠、青、藍、紫等。飽和度S是指彩色的深淺程度，與一定色調(diào)的純度相關(guān)。飽和度的深淺與色光中白光成分的多少有關(guān)，一種純彩色光中加入的白光成分越少，其飽和度就越高；反之，飽和度就越低。故而，飽和度反映了某種色光被沖淡的程度。色調(diào)H和飽和度S

65、統(tǒng)稱色度，反映了顏色的深淺。亮度V是指人眼感受到的光的明暗程度，對彩色來說，顏色中摻入白色越多就越明亮，摻入黑色越多亮度就越小。　　HSV顏色空間模型可被看成是個倒置的圓錐形，如圖3-2所示。長軸表示亮度V，通常用百分比度量，從黑O%到白100%，體現(xiàn)著光線的明暗程度。離開長軸的距離表示飽和度S，即顏色的統(tǒng)一純度，它也用百分比來表示。從0%到完全飽和的100%。圍繞軸的角度是色調(diào)H，它用或度量，

66、色調(diào)尤其影響著人類的視覺判斷。　　圖3-2 HSV顏色空間模型　　HSV顏色模型有兩個特點：其一，亮度分量與圖像的彩色信息無關(guān)；其二，色調(diào)和飽和度分量與人感受顏色的方式是緊密相連的。這些特點使HSV顏色模型非常適合于借助人的視覺系統(tǒng)來感知彩色特性的圖像處理算法。　　3.1.1.3 RGB顏色空間到HSV顏色空

67、間的轉(zhuǎn)化　　沒有哪一種顏色空間可以解決所有的顏色問題。一個恰當?shù)念伾臻g是解決相應的顏色問題的基礎。最常用的顏色空間是RGB顏色空間，原因在于大部分的數(shù)字圖像都是用這種顏色空間表示的。然而RGB空間并不符合人們對于顏色相似性的主觀判斷。HSV模型對應于畫家配色模型，能夠較好地反映人對顏色的感知和鑒別能力。HSV空間是直方圖最常用的顏色空間。從RGB空間到HSV空間的轉(zhuǎn)換公式[25,37,38]如

68、下所示：　　(3-1)　　(3-2)　　(3-3)　　(3-4)<b&g

69、t;　　(3-5)　　其中　　3.1.2 顏色直方圖　　顏色直方圖是在許多圖像檢索系統(tǒng)中被廣泛采用的顏色特征，是對圖像中每個像素的顏色在色彩空間中出現(xiàn)頻率的統(tǒng)計。它描述的是圖像中色彩的組成，以及不同色彩在圖像中所占的比例，而并不關(guān)心每種色彩所處的空間位置

70、，即無法描述圖像中的對象或物體。顏色直方圖計算簡單，對于以觀察軸為軸心的圖像旋轉(zhuǎn)、幅度不大的圖像平移以及圖像尺寸的變化不敏感，對于圖像質(zhì)量的變化也不敏感，這種特性使得顏色直方圖比較適用于提取圖像全局特征的場合。　　顏色直方圖實際上是一個一維的離散函數(shù)，即：　　（3-6） 　　即先將顏色空間劃分為

71、若干個固定的子空間，然后對每幅圖像統(tǒng)計屬于各子空間的像素數(shù)目。其中代表圖像的特征取值，代表特征可取值的個數(shù)，代表圖像中具有特征值為的像素的個數(shù)，代表圖像像素的總個數(shù)。　　3.1.3 顏色矩　　另一種非常簡單而有效的顏色特征使由Stricker和Orengo所提出的顏色矩[25,39]（Color Moments）。這種方法的數(shù)學基礎在于圖像中任何的顏色

72、分布均可以用它的矩來表示。此外，由于顏色分布信息主要集中在低階矩中，因此僅采用顏色的一階矩（mean）、二階矩（variance）和三階矩（skewness）就足以表達圖像的顏色分布。與顏色直方圖相比，該方法的另一個好處在于無需對特征進行向量化。因此，圖像的顏色矩一共只需要9個分量（3個顏色分量，每個分量上3個低階矩），與其他的顏色特征相比是非常簡潔的。顏色的三個低次矩在數(shù)學上表達為：<b

73、>　?。?-7）　?。?-8）　　（3-9）　　其中是圖像中第個像素的第個顏色分量。　　在實際應用中為避免低次矩較弱的分辨能力，顏色矩常和其它特征結(jié)合使用，而且一般在使用

74、其它特征前起到過濾縮小范圍的作用。 　　3.1.4 顏色聚合矢量　　針對顏色直方圖和顏色矩無法表達圖像色彩的空間位置的缺點，Pass提出了圖像的顏色聚合矢量（Color Coherence Vector）[40]。它是顏色直方圖的一種演變，其核心思想是將屬于直方圖每一個的像素進行分為兩部分：如果該內(nèi)的某些像素所占據(jù)的連續(xù)區(qū)域的面積大于給定的閾值，則該區(qū)

75、域內(nèi)的像素作為聚合像素，否則作為非聚合像素。假設與分別代表直方圖的第個中聚合像素和非聚合像素的數(shù)量，則圖像的顏色聚合矢量可以表達為。而就是該圖像的顏色直方圖。由于包含了顏色分布的空間信息，顏色聚合矢量相比顏色直方圖可以達到更好的檢索效果。 　　3.2 紋理特征提取　　對紋理特征的提取目前比較常用的有灰度共生矩陣、Tamura紋理特征、小波變換[25,3

76、6,39]等。　　3.2.1 灰度共生矩陣　　共生矩陣用兩個位置的象素的聯(lián)合概率密度來定義，它不僅反映亮度的分布特性，也反映具有同樣亮度或接近亮度的象素之間的位置分布特性，是有關(guān)圖象亮度變化的二階統(tǒng)計特征。它是定義一組紋理特征的基礎。　　一幅圖象的灰度共生矩陣能反映出圖象灰度關(guān)于方向、相鄰間隔、變化幅度的綜合信

77、息，它是分析圖象的局部模式和它們排列規(guī)則的基礎。　　設為一幅二維數(shù)字圖象，其大小為，灰度級別為，則滿足一定空間關(guān)系的灰度共生矩陣為　?。?-10）　　其中表示集合中的元素個數(shù)，顯然為的矩陣，若與間距離為,兩者與坐標橫軸的夾角為，則可以得到各種間距及角度的灰度共生矩陣。<

78、/p>　　為了能更直觀地以共生矩陣描述紋理狀況，從共生矩陣導出一些反映矩陣狀況的參數(shù)，典型的有以下幾種：　　能量　?。?-11）　　灰度共生矩陣元素值的平方和，所以也稱能量，反映了圖像灰度分布均勻程度和紋理粗細

79、度。如果共生矩陣的所有值均相等，則值小；相反，如果其中一些值大而其它值小，則值大。當共生矩陣中元素集中分布時，此時值大。值大表明一種較均一和規(guī)則變化的紋理模式。　　慣性矩　　（3-12）　　反映了圖像的清晰度和紋理溝紋深淺的程度。紋理溝

80、紋越深，其慣性矩值越大，視覺效果越清晰；反之，慣性矩值小，則溝紋淺，效果模糊?；叶炔罴磻T性矩大的像素對越多，這個值越大?；叶裙仃囍羞h離對角線的元素值越大，越大。　　相關(guān)量　　（3-13）　　式中，分別是的均值和標準差,是矩陣中每列元素

81、之和；是矩陣中每行元素之和。　　它反應了度量空間灰度共生矩陣元素在行或列方向上的相似程度，因此，相關(guān)值大小反映了圖像中局部灰度相關(guān)性。當矩陣元素值均勻相等時，相關(guān)值就大；相反，如果矩陣像元值相差很大則相關(guān)值小。如果圖像中有水平方向紋理，則水平方向矩陣的大于其余矩陣的值。　　熵

82、　?。?-14）　　是圖像所具有的信息量的度量，紋理信息也屬于圖像的信息，是一個隨機性的度量，當共生矩陣中所有元素有最大的隨機性、空間共生矩陣中所有值幾乎相等時，共生矩陣中元素分散分布時，熵較大。它表示了圖像中紋理的非均勻程度或復雜程度。　　逆差距：反映圖像紋理的同質(zhì)性，度量圖像紋理局部變化的多少。其值大則說明圖像紋

83、理的不同區(qū)域間缺少變化，局部非常均勻。　　其它參數(shù)：中值<Mean>，協(xié)方差<Variance>，同質(zhì)性/逆差距<Homogeneity>，反差<Contrast>，差異性<Dissimilarity>，二階距<Angular Second Moment>，自相關(guān)<Correlation>。

84、　　3.2.2 Tamura紋理特征　　基于紋理的人類視覺的心理學研究的啟發(fā)，Tamura等人從另外一個角度提出了表示紋理的方法。Tamura紋理特征的六個分量對應于心理學角度上紋理特征的六個視覺性質(zhì)：粗細度(Coarseness)，對比度(Contrast)，方向性(Directionality)，線狀性(Linelikeness)，規(guī)則性(Regularity)和粗糙度

85、(Roughness)。目前使用較多的是前三個分量。故本文主要介紹Tamura粗糙度，對比度和方向性這三種特征的提取方法。　　Tamura粗糙度的計算方法如下：　　計算圖像中大小為個像素的活動窗口中像素的平均強度值：　?。?-15）&

86、lt;b>　　式中，　　對于每個像素，分別計算它在水平和垂直方向上互不重疊的窗口之間的平均強度差：　　（3-16）　　式中對于每個像素，能使或的值達到最大（無論方向）的值來設置最佳尺寸：

87、（3-17）　　粗糙度可以通過計算整幅圖像中的平均值來得到，表達式為：　?。?-18）　　Tamura對比度的計算方法由下式給出其定義：　?。?-19）

88、　?。?-20）　　其中，是圖像的四階矩，是圖像的方差。給出了圖像對比度的全局度量。　　Tamura方向性的計算步驟如下：　　計算圖像中每個像素處的梯度向量，該向量的模和方向分別定義為：　　（3-2

89、1）　　（3-22）　　式中，和分別是圖像與下列兩個算子做卷積所得的水平方向和垂直方向上的變化量：　　2）對的值進行量化，再統(tǒng)計對應于每個量化柄中模大于給定閾值的像素的數(shù)量，并作歸一化處理，構(gòu)造用于表達值的直方圖。

90、;　　3）根據(jù)（2）所得的直方圖計算峰值的尖銳程度。　　3.2.3 小波變換方法　　小波變換(Wavelet Transform)理論早在20世紀30年代就已經(jīng)出現(xiàn)，隨著計算機的發(fā)展，Y.Meyer等人在20世紀80年代構(gòu)建出較為系統(tǒng)的小波變換理論框架，使之成為一個發(fā)展十分迅速的應用數(shù)學分支。小波變換也成為了一種新興的紋理分析方法。小波分析是對傅里葉分

91、析的一種改進，是一種全新的時、頻分析，在時、頻兩域都具有表征信號局部特征的能力，具有多分辨分析的特點。　　小波變換就是選擇適當?shù)幕拘〔ɑ蚍Q母波，通過對基本小波平移、伸縮而形成一系列的小波，然后將信號分解為一系列的基本函數(shù)。這些基本函數(shù)都是通過母函數(shù)的變形得到的，它具有平移、放大、縮小的特點，因而可以在不同的頻率范圍、不同的時間(空間)位置對信號進行分析。其基本函數(shù)如下式：

92、　　（3-23）　　其中，和為整數(shù)。信號可以被表示為如下式:　　（3-24）　?。?-25）　　二維小波變換的計算需要進行遞歸地過濾和采樣

93、。在每個層次上，二維的信號被分解為四個子波段，根據(jù)頻率特征分別稱為LL(水平低通-垂直低通)，LH(水平低通-垂直帶通)，HL(水平帶通-垂直低通)和HH(水平帶通-垂直帶通)。有兩種類型的小波變換，可以用于紋理分析，它們分別是金字塔結(jié)構(gòu)的小波變換(Pyramid-structured Wavelet Transform 或 PWT)和樹樁結(jié)構(gòu)的小波變換(Tree-structured Wavelet Transform 或 TWT）。

94、PWT遞歸地分解LL波段，分解過程如圖3-3所示。但是對于那些主要信息包含在中頻段范圍內(nèi)的紋理特征，僅僅分解低頻的LL波段是不夠的。因此，TWT被提出來克服上述的問題。TWT區(qū)別于PWT的主要之處在于它除了遞歸分解LL波段之外，還會分解其它的LH，HL和HH等波段。小波變換表示的紋理特征可以用每個波段的每個分解層次上能量分布的均值和標準方差。　　圖3-3 小波多級分解&l

95、t;p>　　由于小波變換在數(shù)字圖像中局部區(qū)域的頻率和方向信息提取方面有優(yōu)異的性能，因此，近年來成為一種較常用且有效的紋理分析和分類方法。　　3.3 形狀特征提取　　對形狀特征的提取方法分為輪廓和區(qū)域兩種?；谳喞男螤钐卣魈崛”仨毥⒃谶吘墮z測的基礎上，通常用傅里葉描述子[25,37,41]、小波輪廓描述子等形狀描述符來描述物體的形狀特征，比較適

96、用于圖像邊緣較為清晰的圖像?；趨^(qū)域的形狀描述主要方法有區(qū)域的面積、圓形度、形狀的縱橫比、不變矩等，其中最有代表性的是Hu不變矩[42]。　　3.3.1 傅里葉描述子　　傅里葉描述子具有很好的平移、旋轉(zhuǎn)、伸縮等幾何不變性，適合用于對形狀的輪廓特征進行索引和檢索。其基本思想如下：　　在給定的圖像中，假設目標物體的

97、形狀是一條封閉的曲線，把封閉輪廓上的每個點表示成復數(shù)的形式，這樣將輪廓由空間轉(zhuǎn)換到空間，則一個點繞輪廓一周可以得到一個復數(shù)序列：　　（3-26）　　的離散傅里葉變換是：　?。?-27）　　其中，，

98、，稱為輪廓的傅里葉描述，它能夠以一定的精度描述輪廓的特性，并可以進行定量比較。設和分別代表兩個輪廓和的特征符號，則他們之間的相似度可以表示為：　?。?-28）　　3.3.2 Hu不變矩　　由于矩在表達形狀時具有旋轉(zhuǎn)、平移、縮放等空間幾何不變形，因此基于矩的方法被廣泛地運用在

99、基于形狀區(qū)域特征的圖像檢索中?；诰氐姆椒ㄓ性S多種，這里主要介紹由K.M.Hu在1972年首次提出的表征圖像形狀的七個不變矩。　　給定圖像圖像的二階矩定義為：　?。?-29）　　（3-30）<

100、;b>　　（3-31）　　其中,為區(qū)域形心的位置。則圖像的階中心矩定義如下：　?。?-32）　　利用中心矩可以提取形狀的七個不變矩：　?。?-33）

101、　　其中等六個不變矩具有尺度、平移、旋轉(zhuǎn)不變性，則只具有尺度和平移不變性，稱為Hu不變矩。其中Hu不變矩在基于形狀的商標圖像檢索中取得了顯著的檢索效果。但是，由于計算這七個無關(guān)矩的計算復雜度較高，許多人提出了關(guān)于無關(guān)矩的其他計算方法。　　4 WEB圖像的特征分析與提取　　隨著網(wǎng)絡和多媒體技術(shù)的快速發(fā)展，在互聯(lián)網(wǎng)上出現(xiàn)了海量的WEB圖

102、像。傳統(tǒng)的基于內(nèi)容的圖像處理技術(shù)由于沒有很好地考慮圖像高層語義，因此，在實際應用中常常會失效。另一方面，由于WEB圖像的特征維數(shù)較高，導致的運算量很大，從提高后續(xù)分類的準確率來說，都需要從WEB圖像中提取出最為有效的可視化特征。本文提出多種可視化特征的提取方法，充分利用人類的視覺感知，分析WEB圖像的特性，選擇并提取出來的可視化特征應具有表述WEB圖像的特性。WEB圖像通常具有來源多樣性、內(nèi)容豐富性的特點，同時現(xiàn)階段對WEB圖像還沒具體

103、的分類，本文在下載自互聯(lián)網(wǎng)上的風景圖像數(shù)據(jù)集上進行實驗，以驗證它的可行性和有效性。　　4.1 WEB圖像的特征分析　　由于人類認知的主觀性、網(wǎng)絡環(huán)境的異質(zhì)性，以及WEB圖像特有的多樣性和豐富性，導致WEB圖像的高層語義信息表示十分復雜。故在本文中，我們沒有對如何提取圖像語義進行深入探討和研究，同時通過對大量的WEB圖像中的風景圖像進行分析，發(fā)現(xiàn)風景圖像

104、的畫面通常顏色鮮明，其中描繪景物的圖像線條相對較多，紋理特征比較顯著，邊緣特征比較明顯。該類圖像適合從圖像中提取全局特征，故本文采用適用于提取圖像全局特征的HSV顏色直方圖、傅里葉頻譜法和拉普拉斯算子。　　4.2 WEB圖像的顏色特征提取　　本文采用第三章介紹的顏色直方圖來提取特征。　　鑒于HSV顏色空間在表示

105、顏色與人眼感覺上的相似性，提取顏色直方圖的顏色空間選擇為HSV顏色空間。首先采用第三章介紹的RGB顏色空間轉(zhuǎn)換成HSV顏色空間，然后將HSV顏色空間各分量進行均勻的劃分，量化成256個顏色，即H分量量化成16個值，S分量量化成4個值，V分量量化成4個值。在此基礎上再計算圖像的顏色直方圖。這樣所得到的圖像特征是256維的HSV顏色直方圖。　　4.3 WEB圖像的紋理特征提取

106、　　本文采用傅里葉頻譜法來提取紋理特征。　　圖像的紋理呈現(xiàn)出一定的周期性，或者說它在圖像空間中具有一定的發(fā)生頻率。因此可以對圖像進行頻譜分析來提取紋理特征。傅里葉變換是把圖像從空間域變換到頻域的常用方法，傅里葉功率譜數(shù)值的大小反映不同頻率成分的強度。　　傅里葉頻譜法的依據(jù)是：圖像的頻域能量譜能在一定的程度上反映某些紋理的特征。由于計算

107、紋理一定要選窗口，僅一個點是無紋理可言的，所以紋理是二維的。設灰度變化函數(shù)為，可利用二維傅里葉變換將圖像變換到頻域，如下式　　（4-1）　　并且，二維傅里葉變換的頻譜能描述紋理的粗細程度。所謂傅里葉頻譜定義為：。其中為之共軛復數(shù)?？梢岳妙l譜的下列特性來做紋理分析。　　值的分

108、布反映了紋理的粗糙程度。在粗糙的紋理中，值在有一個顯著的高　　峰。若紋理比較細膩，值就比較分散，無顯著高峰。因此可以選取一個環(huán)形區(qū)域，將用極坐標表示，取該區(qū)域上的平均值，計算，如下式　?。?-2）　　為各種不同的值。若小時，很大；大時，很小，則說明紋理是粗糙的。反之，若變化對

109、純值影響不大，就說明紋理是比較細膩的。　　值能反映紋理的方向性。若紋理中具有指向某一個方向的許多線條及邊界條紋，則值在垂直于的方向上就有高峰值。因此，可以在某一個區(qū)域中計算，如下式　　（4-3）　　其中為各種不同的數(shù)值。這是一個扇形區(qū)域，改變可知道有無方向性，從而檢測出紋理是

110、否有線條和邊界條紋。　　4.4 WEB圖像的形狀特征提取　　由于基于形狀的檢索方法比較困難，本文采用經(jīng)典微分邊緣檢測算子——拉普拉斯（Laplacian）算子來提取圖像的邊緣形狀特征。　　圖像邊緣是指圖像灰度發(fā)生空間突變或者在梯度方向上發(fā)生突變的像素的集合，它往往是由圖像中景物的物理特性發(fā)生變化而引起的，是圖像

眾賞文庫> 全部分類> 畢業(yè)設計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

web圖像語義特征的分析與提取研究及實現(xiàn)【畢業(yè)設計+開題報告+文獻綜述】

文檔簡介

溫馨提示

最新文檔

評論

web圖像語義特征的分析與提取研究及實現(xiàn)【畢業(yè)設計+開題報告+文獻綜述】

文檔簡介

溫馨提示

最新文檔

評論

免費下載