web圖像語(yǔ)義特征的分析與提取研究及實(shí)現(xiàn)【畢業(yè)設(shè)計(jì)+開(kāi)題報(bào)告+文獻(xiàn)綜述】_第1頁(yè)
已閱讀1頁(yè),還剩55頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、<p>  本科畢業(yè)設(shè)計(jì)(論文)</p><p><b> ?。ǘ?屆)</b></p><p>  WEB圖像語(yǔ)義特征的分析與提取研究及實(shí)現(xiàn)</p><p>  所在學(xué)院 </p><p>  專(zhuān)業(yè)班級(jí) 計(jì)算機(jī)科學(xué)與技術(shù) <

2、;/p><p>  學(xué)生姓名 學(xué)號(hào) </p><p>  指導(dǎo)教師 職稱(chēng) </p><p>  完成日期 年 月 </p><p>  摘 要:隨著網(wǎng)絡(luò)和多媒體技術(shù)的快速發(fā)展,每天都會(huì)在互聯(lián)網(wǎng)上涌現(xiàn)出海量的WEB圖像。

3、然而,如何從中獲得用戶(hù)所需的WEB圖像,挖掘隱藏在其中的有用信息,使得圖像識(shí)別和檢測(cè)技術(shù)的研究有著重要的意義和發(fā)展前景。特征提取是圖像識(shí)別和檢測(cè)急速的關(guān)鍵步驟,其有效性將直接決定后續(xù)操作的效果。因此,如何從圖像中提取出具有較強(qiáng)語(yǔ)義表示能力的特征是近期圖像處理研究領(lǐng)域的一個(gè)熱點(diǎn)。在本文中,我們將介紹常見(jiàn)圖像特征提取方法的基本思想、特點(diǎn)及存在的一些問(wèn)題。特別是重點(diǎn)介紹了特征提取中最常用的三種語(yǔ)義特征(顏色、紋理和形狀特征)的提取方法。最后,

4、我們?cè)O(shè)計(jì)了應(yīng)用程序來(lái)提取網(wǎng)絡(luò)上下載得到風(fēng)景圖像的顏色、紋理和形狀特征,并加以性能對(duì)比。</p><p>  關(guān)鍵詞:WEB圖像;特征提??;顏色特征;紋理特征;形狀特征;</p><p>  The Research and Implement of the Analysis and Extraction for WEB Image Semantic Features</p>

5、<p>  Abstract: With the fast development of network technology and multimedia technique, huge of WEB images are appeared on the Internet. However, how to obtain WEB images that users requested, and mine useful info

6、rmation from them, which makes the research on image recognition and retrieval having a significant meaning and a large prospect. Image feature extraction is a key step in image recognition and retrieval and its effectiv

7、eness will directly determine the results of following processing. Thus</p><p>  Key words: WEB image; feature extraction; color feature; texture feature; shape feature</p><p><b>  目錄</

8、b></p><p><b>  1 緒論1</b></p><p>  1.1 研究意義1</p><p>  1.2 國(guó)內(nèi)外研究現(xiàn)狀1</p><p>  1.3 特征提取中存在的問(wèn)題3</p><p>  1.4 研究的主要內(nèi)容5</p><p&

9、gt;  1.5 論文的結(jié)構(gòu)5</p><p>  2 圖像的語(yǔ)義信息6</p><p>  2.1 圖像的低層語(yǔ)義信息6</p><p>  2.1.1 顏色特征7</p><p>  2.1.2 紋理特征7</p><p>  2.1.3 形狀特征8</p><p>

10、  2.2 圖像的高層語(yǔ)義信息8</p><p>  3 特征提取的主要技術(shù)10</p><p>  3.1 顏色特征提取10</p><p>  3.1.1 顏色空間模型10</p><p>  3.1.1.1 RGB顏色空間10</p><p>  3.1.1.2 HSV顏色空間11<

11、/p><p>  3.1.1.3 RGB顏色空間到HSV顏色空間的轉(zhuǎn)化12</p><p>  3.1.2 顏色直方圖13</p><p>  3.1.3 顏色矩13</p><p>  3.1.4 顏色聚合矢量14</p><p>  3.2 紋理特征提取14</p><p>

12、  3.2.1 灰度共生矩陣14</p><p>  3.2.2 Tamura紋理特征16</p><p>  3.2.3 小波變換方法18</p><p>  3.3 形狀特征提取19</p><p>  3.3.1 傅里葉描述子19</p><p>  3.3.2 Hu不變矩20</p

13、><p>  4 WEB圖像的特征分析與提取22</p><p>  4.1 WEB圖像的特征分析22</p><p>  4.2 WEB圖像的顏色特征提取22</p><p>  4.3 WEB圖像的紋理特征提取22</p><p>  4.4 WEB圖像的形狀特征提取23</p>&l

14、t;p><b>  5 功能實(shí)現(xiàn)25</b></p><p>  5.1 實(shí)現(xiàn)環(huán)境25</p><p>  5.2 實(shí)驗(yàn)實(shí)現(xiàn)26</p><p>  5.2.1 顏色特征提取的實(shí)現(xiàn)26</p><p>  5.2.2 紋理特征提取的實(shí)現(xiàn)29</p><p>  5.2.3

15、 形狀特征提取的實(shí)現(xiàn)31</p><p>  6 總結(jié)與展望35</p><p>  6.1 總結(jié)35</p><p>  6.2 展望35</p><p>  致 謝錯(cuò)誤!未定義書(shū)簽。</p><p><b>  參考文獻(xiàn)36</b></p><p>

16、<b>  1 緒論</b></p><p><b>  1.1 研究意義</b></p><p>  隨著網(wǎng)絡(luò)速度的提高和上網(wǎng)人數(shù)的快速增長(zhǎng),互聯(lián)網(wǎng)已經(jīng)走進(jìn)了千家萬(wàn)戶(hù)中。與此同時(shí),網(wǎng)絡(luò)的普及、網(wǎng)絡(luò)技術(shù)的飛快發(fā)展和多媒體技術(shù)的迅速崛起,使得互聯(lián)網(wǎng)上圖像所占的比重越來(lái)越大。隨著社交網(wǎng)絡(luò)、博客、論壇等在網(wǎng)絡(luò)上的崛起與壯大,每天被網(wǎng)民所游覽、上傳、

17、下載的圖像簡(jiǎn)直無(wú)以計(jì)數(shù),同時(shí)越來(lái)越多的行業(yè)通過(guò)網(wǎng)絡(luò)都在使用大量的圖像數(shù)據(jù)。而如何從大量的圖像數(shù)據(jù)中獲得自己感興趣的信息,并對(duì)其進(jìn)行合理的組織和利用,是一個(gè)非常有挑戰(zhàn)性的問(wèn)題,因此,在這樣的趨勢(shì)下圖像檢索技術(shù)的研究有重要的意義和發(fā)展前景。</p><p>  而圖像檢索或分類(lèi)技術(shù)的前提和關(guān)鍵在于分析和提取最有表現(xiàn)力的圖像特征。如果選擇鑒別力高的圖像語(yǔ)義特征用于分類(lèi),則會(huì)產(chǎn)生較好的分類(lèi)結(jié)果,反之,結(jié)果會(huì)不慎心意。而在

18、檢索之前先對(duì)圖像數(shù)據(jù)庫(kù)進(jìn)行合理的分類(lèi),特別是對(duì)于現(xiàn)在容量日益趨增的圖像數(shù)據(jù)庫(kù)檢索出符合心意的圖像來(lái),將會(huì)大大提高CBIR[1]系統(tǒng)的檢索效率,使得搜索結(jié)果更深人意。另一方面,由于WEB圖像的特征維數(shù)高,運(yùn)算復(fù)雜度高,從提高檢索精度或分類(lèi)正確率的角度而言,都不可能將所有提取的特征都能用于檢索或分類(lèi)。在提取多種圖像語(yǔ)義特征的基礎(chǔ)上,提出采用互信息的方法分別研究單一的語(yǔ)義特征和多種特征組合的鑒別力,并分析特征之間的互補(bǔ)或冗余關(guān)系,從而進(jìn)行特征

19、的選擇。因此對(duì)圖像語(yǔ)義特征的分析與提取研究是非常有必要。</p><p>  由于目前大型圖像數(shù)據(jù)庫(kù)的廣泛存在,對(duì)于圖像數(shù)據(jù)庫(kù)檢索或分類(lèi)是一門(mén)重要的課題,多年來(lái)已經(jīng)取得了很大發(fā)展。但是因?yàn)閳D像的復(fù)雜度,使圖像檢索仍是熱門(mén)課題,并尚有很多關(guān)鍵技術(shù)點(diǎn)沒(méi)有解決,其中關(guān)于圖像語(yǔ)義特征的研究成為這一領(lǐng)域最前沿的研究熱點(diǎn)之一。</p><p>  1.2 國(guó)內(nèi)外研究現(xiàn)狀</p><

20、;p>  基于內(nèi)容的圖像檢索自從幾十年前被提出以來(lái),得到國(guó)內(nèi)外信息領(lǐng)域科技人員的廣泛重視和研究,迅速成為多媒體,特別是圖像和數(shù)據(jù)庫(kù)技術(shù)中的研究熱點(diǎn)之一和中國(guó)圖像工程的新類(lèi)別之一。</p><p>  經(jīng)過(guò)國(guó)內(nèi)外信息領(lǐng)域科技人員幾十年的研究,基于內(nèi)容的圖像檢索研究和應(yīng)用已經(jīng)取得了相當(dāng)大的進(jìn)展。不僅有大量相關(guān)理論研究和技術(shù)應(yīng)用的論文發(fā)表,而且也出現(xiàn)了不少較成熟的應(yīng)用系統(tǒng)模型。其中,具有商用價(jià)值的著名軟件包系統(tǒng)包

21、括IBM公司的QBIC[2,3]系統(tǒng)和Virage公司開(kāi)發(fā)的Virage[4]系統(tǒng);試驗(yàn)原型系統(tǒng)包括由哥倫比亞大學(xué)開(kāi)發(fā)的VisualSEEK和WebSEEK[5,6],MIT媒體實(shí)驗(yàn)室開(kāi)發(fā)的PhotoBook[7,8]系統(tǒng),美國(guó)UCSB大學(xué)的Alexandria數(shù)字化圖書(shū)館項(xiàng)目中用于圖像檢索的Netra[9]系統(tǒng)以及UIUC的MARS[10]系統(tǒng)等等,這些系統(tǒng)在一定的領(lǐng)域得到了應(yīng)用。</p><p><b&

22、gt;  (1)QBIC</b></p><p>  QBIC(Query By Image Content)是IBM Almaden研究中心于90年代開(kāi)發(fā)的第一個(gè)商用的基于內(nèi)容的圖像檢索系統(tǒng),它的系統(tǒng)結(jié)構(gòu)及所用技術(shù)對(duì)后來(lái)的圖像檢索系統(tǒng)有很深遠(yuǎn)的影響。</p><p>  它提供了基于顏色特征、紋理特征和形狀特征的檢索功能。基于顏色特征的查詢(xún)用的是RGB、Lab和MTM(Mat

23、hematical Transformto Munsell)坐標(biāo)系及K元顏色直方圖,主要采用顏色百分比殼詢(xún)和顏色直方圖查詢(xún)兩種方法;基于紋理特征的查詢(xún)用的是Tamura紋理表示的一種改進(jìn)形式,如粗糙度、對(duì)比度和方向性的組合?;谛螤钐卣鞯牟樵?xún)使用了形狀面積、曲線(xiàn)、主軸方向和一組變換不變量等描述方法。QBIC還考慮了高維特征索引。這種方法能夠使用戶(hù)更加快速簡(jiǎn)潔的對(duì)可視化信息進(jìn)行篩選與確定。用戶(hù)檢索時(shí),無(wú)需提供文字檢索詞,只要輸入以圖像形式

24、表達(dá)的檢索要求即可檢索出一系列相似的圖像。它為多個(gè)數(shù)據(jù)庫(kù)提供檢索試驗(yàn),例如美國(guó)1995年以前發(fā)行的郵祟圖案、世界著名商標(biāo)、舊金山美術(shù)博物館圖像數(shù)據(jù)庫(kù)等。它提供了多種查詢(xún)方式,包括利用系統(tǒng)提供的標(biāo)準(zhǔn)范圖檢索,用戶(hù)繪制簡(jiǎn)圖或輸入圖像進(jìn)行檢索等。</p><p>  雖然QBIC系統(tǒng)可以使用多種特征進(jìn)行檢索,但這些特征間是孤立而沒(méi)有聯(lián)系的,同時(shí)用戶(hù)使用該系統(tǒng)需要具有圖像特征的一些基本知識(shí),這就使得該系統(tǒng)的易用性大打折扣

25、。</p><p>  VisualSEEK and WebSEEK</p><p>  VisualSEEK和WebSEEK是美國(guó)哥倫比亞大學(xué)開(kāi)發(fā)的。VisualSEEK是基于圖像視覺(jué)特征的搜索引擎,支持基于視覺(jué)特征和它們之間空間關(guān)系的查詢(xún)。圖像特征從圖像的壓縮域中獲得。圖像視覺(jué)特征主要是顏色和基于小波變換的紋理特征,并且使用基于quad-tree和R-tree的索引結(jié)構(gòu)提高檢索速度。W

26、ebSEEK是面向WEB的文本/圖像搜索引擎,主題分類(lèi)是其主要優(yōu)點(diǎn)。它由三個(gè)模塊組成,分別是視頻/圖像采集模塊,主題分類(lèi)和索引模塊,查找、瀏覽和檢索模塊。該系統(tǒng)支持基于關(guān)鍵字的查找和基于視覺(jué)內(nèi)容的查找。WebSEEK的檢索途徑有三種,一是使用關(guān)鍵詞進(jìn)行自由全文檢索,但不支持短語(yǔ)檢索;二是利用不同的類(lèi)目等級(jí)進(jìn)行主題瀏覽;三是在檢出圖像的基礎(chǔ)上利用其可視屬性進(jìn)一步檢索。</p><p>  (3)Photobook&

27、lt;/p><p>  Photobook是MIT媒體實(shí)驗(yàn)室開(kāi)發(fā)的一套瀏覽、檢索圖像的交互式工具,它包含三個(gè)子系統(tǒng),分別提取形狀、紋理和面部特征,用戶(hù)可以分別在上述三個(gè)子系統(tǒng)中根據(jù)相應(yīng)的特征進(jìn)行檢索。目前還沒(méi)有一種特征可以很好地對(duì)圖像建模,所以在Photobook的最新版本FourEyes</p><p>  中,Picard等提出在圖像的標(biāo)注和檢索過(guò)程中包括人。更進(jìn)一步,由于人的感知是主觀的

28、,他們又提出了“模型集合”結(jié)合人的因素。實(shí)驗(yàn)結(jié)果表明該方法對(duì)交互式圖像注釋很有效。</p><p>  國(guó)內(nèi)從1994年開(kāi)始關(guān)注這方面的研究,清華大學(xué)圖形圖像研究所、中科院計(jì)算所、微軟亞洲研究院多媒體技術(shù)組、國(guó)防科技大學(xué)多媒體中心等科研機(jī)構(gòu)在這方面都取得了一定的成果。</p><p>  清華大學(xué)設(shè)計(jì)了基于內(nèi)容的WWW圖像搜索引擎ImgRetr[11],該系統(tǒng)是面向多媒體制作圖像素材庫(kù)的,

29、圖庫(kù)中設(shè)計(jì)的內(nèi)容面較廣,但缺乏特定的領(lǐng)域知識(shí)。它采用了主顏色、紋理、顏色直方圖、顏色分布、輪廓等通用特征來(lái)對(duì)圖像的內(nèi)容進(jìn)行描述,同時(shí)采用GSS樹(shù)作為系統(tǒng)的相似索引,顏色直方圖和輪廓的相似度計(jì)算采用二次型的距離度量,其他特征的相似度計(jì)算采用了歐式距離進(jìn)行度量。</p><p>  國(guó)防科技大學(xué)多媒體開(kāi)發(fā)中心設(shè)計(jì)開(kāi)發(fā)了一個(gè)基于內(nèi)容的視頻新聞節(jié)目瀏覽檢索系統(tǒng)——NewsVideoCAR(News Video Conte

30、nt Analysis & Representation)[12]。該系統(tǒng)能對(duì)新聞視頻的內(nèi)容進(jìn)行自動(dòng)分析、分類(lèi)和管理,用戶(hù)在該系統(tǒng)的幫助下可以快速定位感興趣的新聞片斷,也可以快速掌握一段新聞的大意。另外,用戶(hù)還可以通過(guò)關(guān)鍵字檢索特定內(nèi)容的新聞。</p><p>  iFind[13,14]系統(tǒng)是微軟亞洲研究院多媒體組開(kāi)發(fā)的基于內(nèi)容圖像檢索的原型系統(tǒng),它提供了關(guān)鍵詞檢索、示例檢索、分類(lèi)瀏覽、相關(guān)反饋和半自動(dòng)

31、標(biāo)引等功能。其主要技術(shù)在于物理特征和語(yǔ)義信息相結(jié)合的檢索技術(shù),其特色在于基于語(yǔ)義傳遞的相關(guān)反饋技術(shù)。ImageHunter[15]是中科院計(jì)算技術(shù)研究所數(shù)字化技術(shù)研究室開(kāi)發(fā)的一個(gè)圖像檢索原型系統(tǒng),目前系統(tǒng)實(shí)現(xiàn)了圖像顏色、紋理特征的自動(dòng)提取及在此基礎(chǔ)上的圖像檢索,同時(shí)該系統(tǒng)還包含了基于文本的圖像檢索及標(biāo)注功能。</p><p>  1.3 特征提取中存在的問(wèn)題</p><p>  就目前研

32、究現(xiàn)狀而言,CBIR技術(shù)己經(jīng)研究了幾十多年,有了很大發(fā)展,也有了不少成形的算法,不過(guò)其中很多關(guān)鍵問(wèn)題還是遠(yuǎn)遠(yuǎn)沒(méi)有得到解決,總體效果不能令人滿(mǎn)意?;趦?nèi)容的圖像檢索希望采用圖像處理與計(jì)算機(jī)視覺(jué)技術(shù)自動(dòng)地從圖像中獲得語(yǔ)義內(nèi)容,但由于圖像語(yǔ)義的內(nèi)在復(fù)雜性,目前還難以實(shí)現(xiàn)對(duì)圖像語(yǔ)義的自動(dòng)提取。語(yǔ)義特征的提取,現(xiàn)在只是將圖像的低層視覺(jué)特征映射到高層語(yǔ)義。圖像的低層特征的提取始終是關(guān)鍵,目前基于內(nèi)容的圖像檢索技術(shù)仍然主要集中在顏色、紋理、形狀、輪廓

33、等低層視覺(jué)特征提取的基礎(chǔ)上,但是由于圖像特征描述和特征提取及相似性度量的復(fù)雜性,其技術(shù)仍不是很成熟,理論上還有許多問(wèn)題有待解決。</p><p>  顏色特征提取中存在的問(wèn)題</p><p>  顏色特征是許多CBIR系統(tǒng)的一個(gè)主要研究對(duì)象[16],但顏色之間的相似性度量的定義和視覺(jué)上人對(duì)顏色的判定仍有一定的差距[17]。另外由于顏色對(duì)圖像或圖像區(qū)域的方向、大小等變化不敏感,所以顏色特征不

34、能很好地捕捉圖像中對(duì)象的局部特征。同時(shí)定義一種和人的視覺(jué)相一致的度量可以進(jìn)一步提高檢索效果,這需要對(duì)人類(lèi)心理學(xué)和人類(lèi)視覺(jué)以及顏色物理幾方面進(jìn)行綜合深入地研究。</p><p>  紋理特征提取中存在的問(wèn)題</p><p>  基于紋理的特征提取的主要問(wèn)題在于目前的紋理特征提取的算法僅僅適用于某一特定物體,無(wú)法精確的適用于圖像庫(kù)中的其他物體。而且紋理特征是圖像中比較復(fù)雜的特征,因?yàn)榧y理特征代

35、表了人的復(fù)雜心理認(rèn)知過(guò)程,而機(jī)器視覺(jué)難以精確模擬人在多變場(chǎng)景中對(duì)紋理的準(zhǔn)確識(shí)別過(guò)程。紋理是一個(gè)區(qū)域性概念,無(wú)法在像素級(jí)層面給予準(zhǔn)確描述。而且由于紋理特征所占有的有效尺度隨著圖片的細(xì)致程度而變化,且紋理效果受視角、幾何形變的影響較大,所以準(zhǔn)確的提取和判斷出圖像的紋理特征至今沒(méi)有很好的辦法。同時(shí)使用紋理特征首先需要將圖像紋理進(jìn)行分割,而這是一項(xiàng)相當(dāng)困難且計(jì)算量很大的上作,另外基于紋理的技術(shù)缺乏有效的紋理模型,紋理特征與人類(lèi)感知的相關(guān)性還不得

36、而知[18]。</p><p>  形狀特征提取中存在的問(wèn)題</p><p>  如何精確地提取圖像的邊界形狀一直是困擾圖像處理領(lǐng)域多年的難題[19],對(duì)于大批量圖像數(shù)據(jù)而言,這個(gè)問(wèn)題將顯得更為突出。各種形狀特征表達(dá)方法對(duì)形狀信息的丟失非常嚴(yán)重;而目前基于形狀的檢索方法還缺乏比較完善的數(shù)學(xué)模型;另外如果目標(biāo)有變形時(shí)檢索結(jié)果往往不太可靠;同時(shí)許多形狀特征僅描述了目標(biāo)局部的性質(zhì),要全面描述目標(biāo)

37、常對(duì)計(jì)算時(shí)間和存儲(chǔ)量有較高的要求;還有許多形狀特征所反映的目標(biāo)形狀信息與人的直觀感覺(jué)不完全一致,或者說(shuō),特征空間的相似性與人視覺(jué)系統(tǒng)感受到的相似性有差別[20]。</p><p>  圖像語(yǔ)義特征提取難度高,“語(yǔ)義鴻溝”導(dǎo)致目前檢索系統(tǒng)通常只使用的低層可視化特征,這與高層語(yǔ)義之間存在的巨大語(yǔ)義間隔[21]。因此,亟需一個(gè)從高層語(yǔ)義到低層特征的映射來(lái)彌合兩者之間的間隔。</p><p>  

38、圖像特征提取是圖像檢索的關(guān)鍵步驟,它直接影響到圖像特征的相似性度量以及圖像檢索的結(jié)果。</p><p>  1.4 研究的主要內(nèi)容</p><p>  本文從圖像低層語(yǔ)義特征的分析及提取出發(fā),對(duì)WEB圖像中的風(fēng)景圖片的可視化視覺(jué)特征的分析與提取進(jìn)行研究。本文主要做了一下幾個(gè)方面的研究。</p><p>  特征分析。圍繞WEB圖像中的風(fēng)景圖片的可視化特征進(jìn)行分析,

39、以得出其特有的低層語(yǔ)義特征,為特征提取做好進(jìn)一步的準(zhǔn)備工作。</p><p>  特征提取。圍繞圖像低層特征的提取提取方法展開(kāi)研究,在總結(jié)他人的研究成果的基礎(chǔ)上,就綜合WEB圖像中的風(fēng)景圖片分析得到的特征進(jìn)行低層語(yǔ)義特征的提取。</p><p>  基于以上的研究,設(shè)計(jì)了一個(gè)圖像低層語(yǔ)義特征提取的系統(tǒng),分別提取WEB圖像的顏色、紋理、形狀特征。</p><p>  

40、1.5 論文的結(jié)構(gòu)</p><p>  本文詳細(xì)介紹了基于圖像特征檢索技術(shù)的現(xiàn)狀,在系統(tǒng)分析了圖像低層特征提取的一些關(guān)鍵技術(shù)后,重點(diǎn)圍繞WEB圖像特征分析和提取展開(kāi)研究,本文共分六章,具體的章節(jié)內(nèi)容安排如下。</p><p>  緒論,論述圖像特征提取的研究的背景與研究意義,研究的現(xiàn)狀和存在的問(wèn)題以及本文主要研究的內(nèi)容和結(jié)構(gòu)安排。</p><p>  圖像的語(yǔ)義信

41、息,介紹了圖像的低層語(yǔ)義特征和圖像的高層語(yǔ)義特征以及圖像語(yǔ)義特征的“語(yǔ)義鴻溝”,最后就本文就研究低層視覺(jué)特征進(jìn)行了說(shuō)明。</p><p>  圖像特征的提取技術(shù),介紹目前基于圖像低層語(yǔ)義特征的提取技術(shù),主要是在顏色、紋理和形狀這三種常用特征介紹了其各自的常用提取技術(shù)與算法。</p><p>  針對(duì)WEB圖像的語(yǔ)義特征分析與提取,主要先從WEB圖像的語(yǔ)義特征分析入手,介紹了WEB圖像的視覺(jué)

42、特點(diǎn)并提出其語(yǔ)義特征(顏色、紋理、形狀)的提取。</p><p>  功能實(shí)現(xiàn)與實(shí)驗(yàn)結(jié)果,對(duì)基于WEB圖像特征提取系統(tǒng)進(jìn)行了實(shí)現(xiàn),介紹了系統(tǒng)開(kāi)發(fā)的環(huán)境,并對(duì)WEB圖像分別采用不同的算法提取其視覺(jué)特征,并給出了實(shí)驗(yàn)結(jié)果。</p><p>  總結(jié)與展望,總結(jié)本論文的要點(diǎn)和主要工作,并對(duì)進(jìn)一步的研究方向和未來(lái)發(fā)展進(jìn)行展望。</p><p>  2 圖像的語(yǔ)義信息<

43、;/p><p>  圖像視覺(jué)信息內(nèi)容主要涉及兩層含義[23]:一層是圖像信息的視覺(jué)特征,如顏色(灰度)、紋理、形狀與空間關(guān)系等,這是低層的圖像信息模型,也是圖像所固有的物理屬性,能被人的感官覺(jué)察出來(lái)的,圖像內(nèi)容是客觀的;另一層是與人類(lèi)認(rèn)知領(lǐng)域相關(guān)的圖像內(nèi)容,即圖像內(nèi)容的語(yǔ)義描述,也稱(chēng)為高層次圖像信息。在一幅圖像中,語(yǔ)義描述包含了物體(或稱(chēng)對(duì)象)的定義、物體的空間位置與物體間的空間關(guān)系等。圖像內(nèi)容除了客觀內(nèi)容外,還帶有

44、主觀內(nèi)容。對(duì)于一幅太陽(yáng)的圖片,“紅色的圓形物體”是圖像視覺(jué)信息內(nèi)容的低層視覺(jué)特征,而“太陽(yáng)”就是圖像所含的語(yǔ)義,它是用戶(hù)直接習(xí)慣描述圖像內(nèi)容的方式,顯然,這種說(shuō)法更自然,更方便。雖然語(yǔ)義描述對(duì)于人來(lái)說(shuō)比較簡(jiǎn)單,是建立在對(duì)所描述圖像內(nèi)容的某些先驗(yàn)知識(shí)(或假設(shè))的基礎(chǔ)上,但是由計(jì)算機(jī)實(shí)現(xiàn)則是非常的困難[24]。</p><p>  按照?qǐng)D像語(yǔ)義的復(fù)雜程度,可以將之分為三個(gè)層次[25],如圖2-1所示:</p&g

45、t;<p>  圖2-1 圖像語(yǔ)義層次模型</p><p>  第一層次是特征語(yǔ)義層。通過(guò)圖像的低層視覺(jué)特征如顏色、紋理及形狀等及其組合來(lái)提取相關(guān)語(yǔ)義描述;第二層是對(duì)象語(yǔ)義層。通過(guò)識(shí)別和推理找出圖像中的具體目標(biāo)對(duì)象及其相互之間的關(guān)系,然后給出語(yǔ)義表達(dá);第三層是抽象語(yǔ)義層。通過(guò)圖像包含的對(duì)象、場(chǎng)景的含義和目標(biāo)進(jìn)行高層推理,得到相關(guān)的語(yǔ)義描述。這個(gè)層次的語(yǔ)義主要涉及圖像的場(chǎng)景語(yǔ)義、行為語(yǔ)義和情感語(yǔ)義。&

46、lt;/p><p>  2.1 圖像的低層語(yǔ)義信息</p><p>  目前對(duì)于圖像語(yǔ)義特征的研究集中在語(yǔ)義特征模型的第一層,即特征語(yǔ)義層,而現(xiàn)在圖像檢索中較常用的低層視覺(jué)特征主要是:顏色、紋理、形狀。</p><p>  2.1.1 顏色特征</p><p>  顏色特征是彩色圖像的最顯著的特征,是圖像檢索中應(yīng)用最為廣泛的視覺(jué)特征[26,2

47、7],是人識(shí)別圖像的主要感知特征之一。另外,相對(duì)于其他特征,顏色特征對(duì)圖像本身的尺寸、方向、視角的依賴(lài)性較小,從而具有較強(qiáng)的魯棒性[28],而且顏色特征計(jì)算簡(jiǎn)單,因此,顏色特征是使用最多的圖像低層特征之一,也是最有效的圖像特征之一?;谶@些優(yōu)點(diǎn),利用顏色特征進(jìn)行圖像檢索受到大量重視和研究,成為基于內(nèi)容圖像檢索系統(tǒng)中應(yīng)用最廣泛的主要特征之一。</p><p>  圖像的顏色特征可以是各種顏色的比例分布或者顏色空間的

48、分不等。如何準(zhǔn)確充分的提取一幅圖像的顏色信息,并以適當(dāng)?shù)姆绞奖硎?,將直接影響整個(gè)圖像檢索系統(tǒng)的效率和精度。</p><p>  要準(zhǔn)確地描述顏色特征則需要選擇一個(gè)合適的顏色空間,并用量化的方式將顏色特征表征為向量的形式。典型的顏色方法是利用顏色直方圖表示圖像顏色的分布特點(diǎn),另外還有顏色集、顏色矩、顏色聚合向量和顏色相關(guān)圖等表示圖像的顏色特征,每一種表示方法各有其優(yōu)缺點(diǎn)。</p><p> 

49、 2.1.2 紋理特征</p><p>  紋理,是描述圖像內(nèi)容的另一個(gè)重要特征,同時(shí)也是一個(gè)難于描述的特征,關(guān)于紋理的定義和紋理的量化方法至今還沒(méi)有一個(gè)統(tǒng)一的標(biāo)準(zhǔn),針對(duì)圖像處理領(lǐng)域,相關(guān)的定義有:“紋理是一種反映一個(gè)區(qū)域中象素灰度級(jí)的空間分布的屬性”[28],一般將圖像在局部區(qū)域內(nèi)呈現(xiàn)不規(guī)則性而在整體上表現(xiàn)出某種規(guī)律性的特性稱(chēng)為紋理。紋理特征是一種全局特征,一種不依賴(lài)于顏色或亮度的反映圖像中同質(zhì)現(xiàn)象的視覺(jué)特征

50、,它也描述了圖像或圖像區(qū)域所對(duì)應(yīng)景物的表面性質(zhì)。紋理特征包含了物體表面結(jié)構(gòu)組織排列的重要信息以及它們與周?chē)h(huán)境的聯(lián)系。紋理是一種統(tǒng)計(jì)特征,具有旋轉(zhuǎn)不變性,并具有較強(qiáng)的抗噪音能力。與顏色特征不同,紋理特征不是基于像素點(diǎn)的特征,它需要在包含多個(gè)像素點(diǎn)的區(qū)域中進(jìn)行統(tǒng)計(jì)計(jì)算。在模式匹配中,這種區(qū)域性的特征具有較大的優(yōu)越性,不會(huì)由于局部的偏差而無(wú)法匹配成功。同時(shí),紋理特征只是物體表面的一種特性,并不能完全反殃出物體的本質(zhì)屬性。另外,由于有可能受到

51、光照、反射情況的影響,從二維圖像中反映出來(lái)的紋理不一定是三維物體表面真實(shí)的紋理。</p><p>  基于紋理特征檢索的分析方法主要有兩類(lèi):結(jié)構(gòu)分析方法,統(tǒng)計(jì)分析方法。結(jié)構(gòu)法分析紋理的基本思想是假定紋理模式由紋理基元以一定的、有規(guī)律的形式重復(fù)排列組合而成,特征提取就變?yōu)榇_定這些基元并定量分析它們的排列規(guī)則。對(duì)于紋理規(guī)則的圖像采用結(jié)構(gòu)分析方法是很有效的。統(tǒng)計(jì)法分析紋理的主要思想是通過(guò)圖像中灰度級(jí)分布的隨機(jī)屬性來(lái)描述

52、紋理特征。統(tǒng)計(jì)分析方法通常在頻率域和空間域上進(jìn)行。在頻率域上主要采用傅里葉變換級(jí)數(shù)和小波分析,而在空間域上主要采用R.Haralick[29]等人提出的關(guān)于紋理的共生矩陣表示。</p><p>  2.1.3 形狀特征</p><p>  形狀特征是描述圖像內(nèi)容的另一個(gè)重要特征,也是計(jì)算機(jī)視覺(jué)和模式識(shí)別研究的一個(gè)基本問(wèn)題。采用形狀特征進(jìn)行檢索,用戶(hù)可以通過(guò)勾勒?qǐng)D像的形狀或輪廓,從圖像庫(kù)中

53、檢索出形狀相似的圖像?;谛螤钐卣鞯臋z索有兩種:一種是分割圖像經(jīng)過(guò)邊緣提取后得到目標(biāo)的輪廓線(xiàn),針對(duì)這種輪廓線(xiàn)進(jìn)行圖像特征檢索;另一種是基于圖像的區(qū)域特征進(jìn)行檢索[30,31]。</p><p>  針對(duì)形狀輪廓特征的描述方法主要有:邊界直方圖、鏈編碼、曲率尺度空間、傅里葉描述符等,其中最典型的方法為傅立法描述符。它的基本思想是用物體邊界的傅里葉交換作為形狀描述。利用區(qū)域邊界的封閉性和周期性將工作問(wèn)題轉(zhuǎn)化為一維問(wèn)題

54、,從而提高了檢索的效率。針對(duì)區(qū)域特征的描述方法主要有形狀的無(wú)關(guān)矩、區(qū)域的面積、形狀的縱橫比率[32]。對(duì)于基于形狀的檢索來(lái)說(shuō)。形狀的提取、描述及匹配都是重點(diǎn)要解決的問(wèn)題。與基于顏色和紋理的檢索方法相比較,基于形狀的檢索方法比較困難。</p><p>  2.2 圖像的高層語(yǔ)義信息</p><p>  基于高層語(yǔ)義信息的圖像檢索被認(rèn)為是最具利用價(jià)值的圖像語(yǔ)義檢索方式,因?yàn)樗试S用戶(hù)在檢索過(guò)

55、程中可以用主觀感覺(jué)來(lái)描述圖像,這對(duì)于圖像檢索者而言,無(wú)疑有助于提高檢索效率和準(zhǔn)確度。</p><p>  許多研究者將圖2-1圖像語(yǔ)義層次模型的第二和第三層次的圖像檢索稱(chēng)為語(yǔ)義圖像檢索[33]。目前,語(yǔ)義特征一般用文字描述,傳統(tǒng)的方法一般用半自動(dòng)或手動(dòng)輸入的方式提取語(yǔ)義特征。圖像的高層語(yǔ)義特征需要人為理解,而且每個(gè)用戶(hù)對(duì)圖像語(yǔ)義的主觀理解又不盡相同,這大大增加了圖像檢索中高層語(yǔ)義特征提取的難度。研究者普遍認(rèn)為,在

56、基于內(nèi)容的圖像檢索研究中合理地引入人工智能和機(jī)器學(xué)習(xí)技術(shù)是解決高層語(yǔ)義難題的有效途徑[34]??梢酝ㄟ^(guò)嵌入知識(shí)表示、推理學(xué)習(xí)機(jī)制和機(jī)器學(xué)習(xí)技術(shù),采用統(tǒng)計(jì)的方法自動(dòng)建立圖像多維信息特征的索引結(jié)構(gòu),自動(dòng)選取合適的低層特征組合實(shí)現(xiàn)圖像與其語(yǔ)義內(nèi)容的對(duì)應(yīng),實(shí)現(xiàn)圖像語(yǔ)義的有效檢索。</p><p>  雖然基于語(yǔ)義圖像內(nèi)容檢索進(jìn)行查詢(xún)是最符合人的需求的方式[35],也是理想的檢索方式,但是就當(dāng)前的計(jì)算機(jī)技術(shù)和圖像理解的發(fā)展

57、水平來(lái)看,這種完全智能化的檢索正處于研究階段,也產(chǎn)生了一些原型系統(tǒng),但離實(shí)際廣泛應(yīng)用還有較遠(yuǎn)的距離。</p><p>  由于目前計(jì)算機(jī)視覺(jué)和圖像理解技術(shù)的發(fā)展水平限制,使得基于內(nèi)容的圈像檢索技術(shù)無(wú)法真正支持基于語(yǔ)義的圖像檢索,故本文在是基于圖像的低層語(yǔ)義特征下展開(kāi)研究的。</p><p>  3 特征提取的主要技術(shù)</p><p>  特征提取是基于內(nèi)容的圖像檢

58、索的基礎(chǔ)。如何有效的描述圖像的特征,是CBIR中最為關(guān)鍵的環(huán)節(jié),其直接關(guān)系到整個(gè)系統(tǒng)的檢索準(zhǔn)確度、檢索效率和檢索效果。有效的特征應(yīng)該是:具有直觀意義,區(qū)分能力強(qiáng),計(jì)算相對(duì)簡(jiǎn)單,平移、尺度旋轉(zhuǎn)不變性等。</p><p>  因?yàn)楦邔诱Z(yǔ)義特征需要對(duì)物體進(jìn)行識(shí)別和解釋?zhuān)柚祟?lèi)的知識(shí)推理,由于目前計(jì)算機(jī)視覺(jué)和圖像理解的發(fā)展水平限制,使得基于內(nèi)容的圖像檢索技術(shù)無(wú)法真正支持基于語(yǔ)義的圖像檢索。因此,本文暫不考慮圖像的

59、高層語(yǔ)義特征,主要涉及圖像的低層語(yǔ)義特征分析和提取。</p><p>  3.1 顏色特征提取</p><p>  顏色特征的提取首先要建立在一定的顏色空間模型上,然后利用各種特征表示方法提取圖像顏色。</p><p>  3.1.1 顏色空間模型</p><p>  顏色特征的提取不僅取決與圖像本身,還依賴(lài)于觀察者的視覺(jué)系統(tǒng)和個(gè)人經(jīng)驗(yàn)。

60、因此,為了準(zhǔn)確提取表達(dá)原始圖像的顏色信息,提取算法必須在符合人類(lèi)視覺(jué)系統(tǒng)的生理特征和人類(lèi)觀察經(jīng)驗(yàn)的視覺(jué)感知特征的特定的顏色空間內(nèi)進(jìn)行。顏色空間模型的選擇直接將影響到檢索效果。表示數(shù)字圖像的顏色空間有很多種,每一種顏色空間都是在某種特定上下文中對(duì)顏色的特性和行為的解釋方法。目前常用的顏色空間模型有RGB顏色空間,HSV顏色空間等。</p><p>  3.1.1.1 RGB顏色空間</p><

61、p>  RGB顏色空間[36]是彩色圖像最基本的顏色空間,也是最直接的表示顏色的方法,所有的顏色都可以看作是3個(gè)基本顏色——紅(R,red),綠(G,green)和藍(lán)(B,blue)的不同組合。如圖3-1,RGB顏色空間是基于迪卡爾坐標(biāo)系,其三個(gè)軸分別代表R、G、B三個(gè)分量,用第一象限內(nèi)的經(jīng)過(guò)歸一化的單位立方體表示所有的顏色,即每一種顏色都用三個(gè)顏色分量R、G、B來(lái)表示,對(duì)應(yīng)空間中三個(gè)分量所構(gòu)成的一個(gè)空間點(diǎn)。原點(diǎn)處對(duì)應(yīng)黑色,其R、

62、G、B分量都是0;和原點(diǎn)距離最遠(yuǎn)的定點(diǎn)對(duì)應(yīng)白色,其R、G、B分量都是l;黑色點(diǎn)和白色點(diǎn)之間的連線(xiàn)上R、G、B三者等值,代表由黑色到白色的灰度值,為灰度線(xiàn);其余六個(gè)頂點(diǎn)分別代表光的三基色和三補(bǔ)色;立方體內(nèi)的其余各點(diǎn)都可以分解為三個(gè)坐標(biāo)用R、G、B三個(gè)顏色分量來(lái)表示。</p><p>  圖3-1 RGB顏色空間模型</p><p>  RGB顏色空間是面向硬設(shè)備常用的彩色模型,應(yīng)用十分廣泛

63、。雖然RGB空間表達(dá)簡(jiǎn)單方便,但是這種方法不過(guò)直觀,從RGB值中很難知道所表示顏色的認(rèn)知屬性,不符合人對(duì)顏色的感知心理。其次,RGB顏色空間不是一個(gè)均勻視覺(jué)的顏色空間,空間上的兩點(diǎn)間距離并不代表人類(lèi)視覺(jué)上兩種顏色的相似性。</p><p>  3.1.1.2 HSV顏色空間</p><p>  HSV顏色空間[37]是一種面向視覺(jué)感知的顏色空間,直接對(duì)應(yīng)于人眼色彩視覺(jué)特性的三要素:色調(diào)H

64、(Hue)、飽和度S(Saturation)和亮度V(Value),通道間各自獨(dú)立。色調(diào)H表示從一個(gè)物體反射過(guò)來(lái)的或透過(guò)物體的光波長(zhǎng),即是光的顏色,不同波長(zhǎng)的光呈現(xiàn)不同的顏色,具有不同的色調(diào),如紅、橙、黃、綠、青、藍(lán)、紫等。飽和度S是指彩色的深淺程度,與一定色調(diào)的純度相關(guān)。飽和度的深淺與色光中白光成分的多少有關(guān),一種純彩色光中加入的白光成分越少,其飽和度就越高;反之,飽和度就越低。故而,飽和度反映了某種色光被沖淡的程度。色調(diào)H和飽和度S

65、統(tǒng)稱(chēng)色度,反映了顏色的深淺。亮度V是指人眼感受到的光的明暗程度,對(duì)彩色來(lái)說(shuō),顏色中摻入白色越多就越明亮,摻入黑色越多亮度就越小。</p><p>  HSV顏色空間模型可被看成是個(gè)倒置的圓錐形,如圖3-2所示。長(zhǎng)軸表示亮度V,通常用百分比度量,從黑O%到白100%,體現(xiàn)著光線(xiàn)的明暗程度。離開(kāi)長(zhǎng)軸的距離表示飽和度S,即顏色的統(tǒng)一純度,它也用百分比來(lái)表示。從0%到完全飽和的100%。圍繞軸的角度是色調(diào)H,它用或度量,

66、色調(diào)尤其影響著人類(lèi)的視覺(jué)判斷。</p><p>  圖3-2 HSV顏色空間模型</p><p>  HSV顏色模型有兩個(gè)特點(diǎn):其一,亮度分量與圖像的彩色信息無(wú)關(guān);其二,色調(diào)和飽和度分量與人感受顏色的方式是緊密相連的。這些特點(diǎn)使HSV顏色模型非常適合于借助人的視覺(jué)系統(tǒng)來(lái)感知彩色特性的圖像處理算法。</p><p>  3.1.1.3 RGB顏色空間到HSV顏色空

67、間的轉(zhuǎn)化</p><p>  沒(méi)有哪一種顏色空間可以解決所有的顏色問(wèn)題。一個(gè)恰當(dāng)?shù)念伾臻g是解決相應(yīng)的顏色問(wèn)題的基礎(chǔ)。最常用的顏色空間是RGB顏色空間,原因在于大部分的數(shù)字圖像都是用這種顏色空間表示的。然而RGB空間并不符合人們對(duì)于顏色相似性的主觀判斷。HSV模型對(duì)應(yīng)于畫(huà)家配色模型,能夠較好地反映人對(duì)顏色的感知和鑒別能力。HSV空間是直方圖最常用的顏色空間。從RGB空間到HSV空間的轉(zhuǎn)換公式[25,37,38]如

68、下所示:</p><p><b>  (3-1)</b></p><p><b>  (3-2)</b></p><p><b>  (3-3)</b></p><p><b>  (3-4)</b></p><p><b&g

69、t;  (3-5)</b></p><p><b>  其中</b></p><p>  3.1.2 顏色直方圖</p><p>  顏色直方圖是在許多圖像檢索系統(tǒng)中被廣泛采用的顏色特征,是對(duì)圖像中每個(gè)像素的顏色在色彩空間中出現(xiàn)頻率的統(tǒng)計(jì)。它描述的是圖像中色彩的組成,以及不同色彩在圖像中所占的比例,而并不關(guān)心每種色彩所處的空間位置

70、,即無(wú)法描述圖像中的對(duì)象或物體。顏色直方圖計(jì)算簡(jiǎn)單,對(duì)于以觀察軸為軸心的圖像旋轉(zhuǎn)、幅度不大的圖像平移以及圖像尺寸的變化不敏感,對(duì)于圖像質(zhì)量的變化也不敏感,這種特性使得顏色直方圖比較適用于提取圖像全局特征的場(chǎng)合。</p><p>  顏色直方圖實(shí)際上是一個(gè)一維的離散函數(shù),即:</p><p> ?。?-6) </p><p>  即先將顏色空間劃分為

71、若干個(gè)固定的子空間,然后對(duì)每幅圖像統(tǒng)計(jì)屬于各子空間的像素?cái)?shù)目。其中代表圖像的特征取值,代表特征可取值的個(gè)數(shù),代表圖像中具有特征值為的像素的個(gè)數(shù),代表圖像像素的總個(gè)數(shù)。</p><p>  3.1.3 顏色矩</p><p>  另一種非常簡(jiǎn)單而有效的顏色特征使由Stricker和Orengo所提出的顏色矩[25,39](Color Moments)。這種方法的數(shù)學(xué)基礎(chǔ)在于圖像中任何的顏色

72、分布均可以用它的矩來(lái)表示。此外,由于顏色分布信息主要集中在低階矩中,因此僅采用顏色的一階矩(mean)、二階矩(variance)和三階矩(skewness)就足以表達(dá)圖像的顏色分布。與顏色直方圖相比,該方法的另一個(gè)好處在于無(wú)需對(duì)特征進(jìn)行向量化。因此,圖像的顏色矩一共只需要9個(gè)分量(3個(gè)顏色分量,每個(gè)分量上3個(gè)低階矩),與其他的顏色特征相比是非常簡(jiǎn)潔的。顏色的三個(gè)低次矩在數(shù)學(xué)上表達(dá)為:</p><p><b

73、> ?。?-7)</b></p><p><b>  (3-8)</b></p><p><b> ?。?-9)</b></p><p>  其中是圖像中第個(gè)像素的第個(gè)顏色分量。</p><p>  在實(shí)際應(yīng)用中為避免低次矩較弱的分辨能力,顏色矩常和其它特征結(jié)合使用,而且一般在使用

74、其它特征前起到過(guò)濾縮小范圍的作用。 </p><p>  3.1.4 顏色聚合矢量</p><p>  針對(duì)顏色直方圖和顏色矩?zé)o法表達(dá)圖像色彩的空間位置的缺點(diǎn),Pass提出了圖像的顏色聚合矢量(Color Coherence Vector)[40]。它是顏色直方圖的一種演變,其核心思想是將屬于直方圖每一個(gè)的像素進(jìn)行分為兩部分:如果該內(nèi)的某些像素所占據(jù)的連續(xù)區(qū)域的面積大于給定的閾值,則該區(qū)

75、域內(nèi)的像素作為聚合像素,否則作為非聚合像素。假設(shè)與分別代表直方圖的第個(gè)中聚合像素和非聚合像素的數(shù)量,則圖像的顏色聚合矢量可以表達(dá)為。而就是該圖像的顏色直方圖。由于包含了顏色分布的空間信息,顏色聚合矢量相比顏色直方圖可以達(dá)到更好的檢索效果。 </p><p>  3.2 紋理特征提取</p><p>  對(duì)紋理特征的提取目前比較常用的有灰度共生矩陣、Tamura紋理特征、小波變換[25,3

76、6,39]等。</p><p>  3.2.1 灰度共生矩陣</p><p>  共生矩陣用兩個(gè)位置的象素的聯(lián)合概率密度來(lái)定義,它不僅反映亮度的分布特性,也反映具有同樣亮度或接近亮度的象素之間的位置分布特性,是有關(guān)圖象亮度變化的二階統(tǒng)計(jì)特征。它是定義一組紋理特征的基礎(chǔ)。</p><p>  一幅圖象的灰度共生矩陣能反映出圖象灰度關(guān)于方向、相鄰間隔、變化幅度的綜合信

77、息,它是分析圖象的局部模式和它們排列規(guī)則的基礎(chǔ)。</p><p>  設(shè)為一幅二維數(shù)字圖象,其大小為,灰度級(jí)別為,則滿(mǎn)足一定空間關(guān)系的灰度共生矩陣為</p><p><b> ?。?-10)</b></p><p>  其中表示集合中的元素個(gè)數(shù),顯然為的矩陣,若與間距離為,兩者與坐標(biāo)橫軸的夾角為,則可以得到各種間距及角度的灰度共生矩陣。<

78、/p><p>  為了能更直觀地以共生矩陣描述紋理狀況,從共生矩陣導(dǎo)出一些反映矩陣狀況的參數(shù),典型的有以下幾種:</p><p><b>  能量</b></p><p><b>  (3-11)</b></p><p>  灰度共生矩陣元素值的平方和,所以也稱(chēng)能量,反映了圖像灰度分布均勻程度和紋理粗細(xì)

79、度。如果共生矩陣的所有值均相等,則值?。幌喾?,如果其中一些 值大而其它值小,則值大。當(dāng)共生矩陣中元素集中分布時(shí),此時(shí)值大。值大表明一種較均一和規(guī)則變化的紋理模式。</p><p><b>  慣性矩</b></p><p><b> ?。?-12)</b></p><p>  反映了圖像的清晰度和紋理溝紋深淺的程度。紋理溝

80、紋越深,其慣性矩值越大,視覺(jué)效果越清晰;反之,慣性矩值小,則溝紋淺,效果模糊?;叶炔罴磻T性矩大的像素對(duì)越多,這個(gè)值越大?;叶裙仃囍羞h(yuǎn)離對(duì)角線(xiàn)的元素值越大,越大。</p><p><b>  相關(guān)量</b></p><p><b> ?。?-13)</b></p><p>  式中,分別是的均值和標(biāo)準(zhǔn)差,是矩陣中每列元素

81、之和;是矩陣中每行元素之和。</p><p>  它反應(yīng)了度量空間灰度共生矩陣元素在行或列方向上的相似程度,因此,相關(guān)值大小反映了圖像中局部灰度相關(guān)性。當(dāng)矩陣元素值均勻相等時(shí),相關(guān)值就大;相反,如果矩陣像元值相差很大則相關(guān)值小。如果圖像中有水平方向紋理,則水平方向矩陣的大于其余矩陣的值。</p><p><b>  熵</b></p><p>

82、<b> ?。?-14)</b></p><p>  是圖像所具有的信息量的度量,紋理信息也屬于圖像的信息,是一個(gè)隨機(jī)性的度量,當(dāng)共生矩陣中所有元素有最大的隨機(jī)性、空間共生矩陣中所有值幾乎相等時(shí),共生矩陣中元素分散分布時(shí),熵較大。它表示了圖像中紋理的非均勻程度或復(fù)雜程度。</p><p>  逆差距:反映圖像紋理的同質(zhì)性,度量圖像紋理局部變化的多少。其值大則說(shuō)明圖像紋

83、理的不同區(qū)域間缺少變化,局部非常均勻。</p><p>  其它參數(shù):中值<Mean>,協(xié)方差<Variance>,同質(zhì)性/逆差距<Homogeneity>,反差<Contrast>,差異性<Dissimilarity>,二階距<Angular Second Moment>,自相關(guān)<Correlation>。</p>

84、<p>  3.2.2 Tamura紋理特征</p><p>  基于紋理的人類(lèi)視覺(jué)的心理學(xué)研究的啟發(fā),Tamura等人從另外一個(gè)角度提出了表示紋理的方法。Tamura紋理特征的六個(gè)分量對(duì)應(yīng)于心理學(xué)角度上紋理特征的六個(gè)視覺(jué)性質(zhì):粗細(xì)度(Coarseness),對(duì)比度(Contrast),方向性(Directionality),線(xiàn)狀性(Linelikeness),規(guī)則性(Regularity)和粗糙度

85、(Roughness)。目前使用較多的是前三個(gè)分量。故本文主要介紹Tamura粗糙度,對(duì)比度和方向性這三種特征的提取方法。</p><p>  Tamura粗糙度的計(jì)算方法如下:</p><p>  計(jì)算圖像中大小為個(gè)像素的活動(dòng)窗口中像素的平均強(qiáng)度值:</p><p><b> ?。?-15)</b></p><p>&

86、lt;b>  式中,</b></p><p>  對(duì)于每個(gè)像素,分別計(jì)算它在水平和垂直方向上互不重疊的窗口之間的平均強(qiáng)度差:</p><p><b> ?。?-16)</b></p><p>  式中對(duì)于每個(gè)像素,能使或的值達(dá)到最大(無(wú)論方向)的值來(lái)設(shè)置最佳尺寸:</p><p><b>  

87、(3-17)</b></p><p>  粗糙度可以通過(guò)計(jì)算整幅圖像中的平均值來(lái)得到,表達(dá)式為:</p><p><b> ?。?-18)</b></p><p>  Tamura對(duì)比度的計(jì)算方法由下式給出其定義:</p><p><b>  (3-19)</b></p>

88、<p><b> ?。?-20)</b></p><p>  其中,是圖像的四階矩,是圖像的方差。給出了圖像對(duì)比度的全局度量。</p><p>  Tamura方向性的計(jì)算步驟如下:</p><p>  計(jì)算圖像中每個(gè)像素處的梯度向量,該向量的模和方向分別定義為:</p><p><b> ?。?-2

89、1)</b></p><p><b>  (3-22)</b></p><p>  式中, 和分別是圖像與下列兩個(gè)算子做卷積所得的水平方向和垂直方向上的變化量:</p><p>  2)對(duì)的值進(jìn)行量化,再統(tǒng)計(jì)對(duì)應(yīng)于每個(gè)量化柄中模大于給定閾值的像素的數(shù)量,并作歸一化處理,構(gòu)造用于表達(dá)值的直方圖。</p><p>

90、;  3)根據(jù)(2)所得的直方圖計(jì)算峰值的尖銳程度。</p><p>  3.2.3 小波變換方法</p><p>  小波變換(Wavelet Transform)理論早在20世紀(jì)30年代就已經(jīng)出現(xiàn),隨著計(jì)算機(jī)的發(fā)展,Y.Meyer等人在20世紀(jì)80年代構(gòu)建出較為系統(tǒng)的小波變換理論框架,使之成為一個(gè)發(fā)展十分迅速的應(yīng)用數(shù)學(xué)分支。小波變換也成為了一種新興的紋理分析方法。小波分析是對(duì)傅里葉分

91、析的一種改進(jìn),是一種全新的時(shí)、頻分析,在時(shí)、頻兩域都具有表征信號(hào)局部特征的能力,具有多分辨分析的特點(diǎn)。</p><p>  小波變換就是選擇適當(dāng)?shù)幕拘〔ɑ蚍Q(chēng)母波,通過(guò)對(duì)基本小波平移、伸縮而形成一系列的小波,然后將信號(hào)分解為一系列的基本函數(shù)。這些基本函數(shù)都是通過(guò)母函數(shù)的變形得到的,它具有平移、放大、縮小的特點(diǎn),因而可以在不同的頻率范圍、不同的時(shí)間(空間)位置對(duì)信號(hào)進(jìn)行分析。其基本函數(shù)如下式:</p>

92、<p><b> ?。?-23)</b></p><p>  其中,和為整數(shù)。信號(hào)可以被表示為如下式:</p><p><b> ?。?-24)</b></p><p><b> ?。?-25)</b></p><p>  二維小波變換的計(jì)算需要進(jìn)行遞歸地過(guò)濾和采樣

93、。在每個(gè)層次上,二維的信號(hào)被分解為四個(gè)子波段,根據(jù)頻率特征分別稱(chēng)為L(zhǎng)L(水平低通-垂直低通),LH(水平低通-垂直帶通),HL(水平帶通-垂直低通)和HH(水平帶通-垂直帶通)。有兩種類(lèi)型的小波變換,可以用于紋理分析,它們分別是金字塔結(jié)構(gòu)的小波變換(Pyramid-structured Wavelet Transform 或 PWT)和樹(shù)樁結(jié)構(gòu)的小波變換(Tree-structured Wavelet Transform 或 TWT)。

94、PWT遞歸地分解LL波段,分解過(guò)程如圖3-3所示。但是對(duì)于那些主要信息包含在中頻段范圍內(nèi)的紋理特征,僅僅分解低頻的LL波段是不夠的。因此,TWT被提出來(lái)克服上述的問(wèn)題。TWT區(qū)別于PWT的主要之處在于它除了遞歸分解LL波段之外,還會(huì)分解其它的LH,HL和HH等波段。小波變換表示的紋理特征可以用每個(gè)波段的每個(gè)分解層次上能量分布的均值和標(biāo)準(zhǔn)方差。</p><p>  圖3-3 小波多級(jí)分解</p>&l

95、t;p>  由于小波變換在數(shù)字圖像中局部區(qū)域的頻率和方向信息提取方面有優(yōu)異的性能,因此,近年來(lái)成為一種較常用且有效的紋理分析和分類(lèi)方法。</p><p>  3.3 形狀特征提取</p><p>  對(duì)形狀特征的提取方法分為輪廓和區(qū)域兩種。基于輪廓的形狀特征提取必須建立在邊緣檢測(cè)的基礎(chǔ)上,通常用傅里葉描述子[25,37,41]、小波輪廓描述子等形狀描述符來(lái)描述物體的形狀特征,比較適

96、用于圖像邊緣較為清晰的圖像。基于區(qū)域的形狀描述主要方法有區(qū)域的面積、圓形度、形狀的縱橫比、不變矩等,其中最有代表性的是Hu不變矩[42]。</p><p>  3.3.1 傅里葉描述子</p><p>  傅里葉描述子具有很好的平移、旋轉(zhuǎn)、伸縮等幾何不變性,適合用于對(duì)形狀的輪廓特征進(jìn)行索引和檢索。其基本思想如下:</p><p>  在給定的圖像中,假設(shè)目標(biāo)物體的

97、形狀是一條封閉的曲線(xiàn),把封閉輪廓上的每個(gè)點(diǎn)表示成復(fù)數(shù)的形式,這樣將輪廓由空間轉(zhuǎn)換到空間,則一個(gè)點(diǎn)繞輪廓一周可以得到一個(gè)復(fù)數(shù)序列:</p><p><b> ?。?-26)</b></p><p>  的離散傅里葉變換是:</p><p><b>  (3-27)</b></p><p>  其中,,

98、,稱(chēng)為輪廓的傅里葉描述,它能夠以一定的精度描述輪廓的特性,并可以進(jìn)行定量比較。設(shè)和分別代表兩個(gè)輪廓和的特征符號(hào),則他們之間的相似度可以表示為:</p><p><b>  (3-28)</b></p><p>  3.3.2 Hu不變矩</p><p>  由于矩在表達(dá)形狀時(shí)具有旋轉(zhuǎn)、平移、縮放等空間幾何不變形,因此基于矩的方法被廣泛地運(yùn)用在

99、基于形狀區(qū)域特征的圖像檢索中?;诰氐姆椒ㄓ性S多種,這里主要介紹由K.M.Hu在1972年首次提出的表征圖像形狀的七個(gè)不變矩。</p><p>  給定圖像圖像的二階矩定義為:</p><p><b> ?。?-29)</b></p><p><b>  (3-30)</b></p><p><

100、;b> ?。?-31)</b></p><p>  其中,為區(qū)域形心的位置。則圖像的階中心矩定義如下:</p><p><b> ?。?-32)</b></p><p>  利用中心矩可以提取形狀的七個(gè)不變矩:</p><p><b> ?。?-33)</b></p>

101、<p>  其中等六個(gè)不變矩具有尺度、平移、旋轉(zhuǎn)不變性,則只具有尺度和平移不變性,稱(chēng)為Hu不變矩。其中Hu不變矩在基于形狀的商標(biāo)圖像檢索中取得了顯著的檢索效果。但是,由于計(jì)算這七個(gè)無(wú)關(guān)矩的計(jì)算復(fù)雜度較高,許多人提出了關(guān)于無(wú)關(guān)矩的其他計(jì)算方法。</p><p>  4 WEB圖像的特征分析與提取</p><p>  隨著網(wǎng)絡(luò)和多媒體技術(shù)的快速發(fā)展,在互聯(lián)網(wǎng)上出現(xiàn)了海量的WEB圖

102、像。傳統(tǒng)的基于內(nèi)容的圖像處理技術(shù)由于沒(méi)有很好地考慮圖像高層語(yǔ)義,因此,在實(shí)際應(yīng)用中常常會(huì)失效。另一方面,由于WEB圖像的特征維數(shù)較高,導(dǎo)致的運(yùn)算量很大,從提高后續(xù)分類(lèi)的準(zhǔn)確率來(lái)說(shuō),都需要從WEB圖像中提取出最為有效的可視化特征。本文提出多種可視化特征的提取方法,充分利用人類(lèi)的視覺(jué)感知,分析WEB圖像的特性,選擇并提取出來(lái)的可視化特征應(yīng)具有表述WEB圖像的特性。WEB圖像通常具有來(lái)源多樣性、內(nèi)容豐富性的特點(diǎn),同時(shí)現(xiàn)階段對(duì)WEB圖像還沒(méi)具體

103、的分類(lèi),本文在下載自互聯(lián)網(wǎng)上的風(fēng)景圖像數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),以驗(yàn)證它的可行性和有效性。</p><p>  4.1 WEB圖像的特征分析</p><p>  由于人類(lèi)認(rèn)知的主觀性、網(wǎng)絡(luò)環(huán)境的異質(zhì)性,以及WEB圖像特有的多樣性和豐富性,導(dǎo)致WEB圖像的高層語(yǔ)義信息表示十分復(fù)雜。故在本文中,我們沒(méi)有對(duì)如何提取圖像語(yǔ)義進(jìn)行深入探討和研究,同時(shí)通過(guò)對(duì)大量的WEB圖像中的風(fēng)景圖像進(jìn)行分析,發(fā)現(xiàn)風(fēng)景圖像

104、的畫(huà)面通常顏色鮮明,其中描繪景物的圖像線(xiàn)條相對(duì)較多,紋理特征比較顯著,邊緣特征比較明顯。該類(lèi)圖像適合從圖像中提取全局特征,故本文采用適用于提取圖像全局特征的HSV顏色直方圖、傅里葉頻譜法和拉普拉斯算子。</p><p>  4.2 WEB圖像的顏色特征提取</p><p>  本文采用第三章介紹的顏色直方圖來(lái)提取特征。</p><p>  鑒于HSV顏色空間在表示

105、顏色與人眼感覺(jué)上的相似性,提取顏色直方圖的顏色空間選擇為HSV顏色空間。首先采用第三章介紹的RGB顏色空間轉(zhuǎn)換成HSV顏色空間,然后將HSV顏色空間各分量進(jìn)行均勻的劃分,量化成256個(gè)顏色,即H分量量化成16個(gè)值,S分量量化成4個(gè)值,V分量量化成4個(gè)值。在此基礎(chǔ)上再計(jì)算圖像的顏色直方圖。這樣所得到的圖像特征是256維的HSV顏色直方圖。</p><p>  4.3 WEB圖像的紋理特征提取</p>

106、<p>  本文采用傅里葉頻譜法來(lái)提取紋理特征。</p><p>  圖像的紋理呈現(xiàn)出一定的周期性,或者說(shuō)它在圖像空間中具有一定的發(fā)生頻率。因此可以對(duì)圖像進(jìn)行頻譜分析來(lái)提取紋理特征。傅里葉變換是把圖像從空間域變換到頻域的常用方法,傅里葉功率譜數(shù)值的大小反映不同頻率成分的強(qiáng)度。</p><p>  傅里葉頻譜法的依據(jù)是:圖像的頻域能量譜能在一定的程度上反映某些紋理的特征。由于計(jì)算

107、紋理一定要選窗口,僅一個(gè)點(diǎn)是無(wú)紋理可言的,所以紋理是二維的。設(shè)灰度變化函數(shù)為,可利用二維傅里葉變換將圖像變換到頻域,如下式</p><p><b> ?。?-1)</b></p><p>  并且,二維傅里葉變換的頻譜能描述紋理的粗細(xì)程度。所謂傅里葉頻譜定義為:。其中為之共軛復(fù)數(shù)。可以利用頻譜的下列特性來(lái)做紋理分析。</p><p>  值的分

108、布反映了紋理的粗糙程度。在粗糙的紋理中,值在有一個(gè)顯著的高</p><p>  峰。若紋理比較細(xì)膩,值就比較分散,無(wú)顯著高峰。因此可以選取一個(gè)環(huán)形區(qū)域,將用極坐標(biāo)表示,取該區(qū)域上的平均值,計(jì)算,如下式</p><p><b> ?。?-2)</b></p><p>  為各種不同的值。若小時(shí),很大;大時(shí),很小,則說(shuō)明紋理是粗糙的。反之,若變化對(duì)

109、純值影響不大,就說(shuō)明紋理是比較細(xì)膩的。</p><p>  值能反映紋理的方向性。若紋理中具有指向某一個(gè)方向的許多線(xiàn)條及邊界條紋,則值在垂直于的方向上就有高峰值。因此,可以在某一個(gè)區(qū)域中計(jì)算,如下式</p><p><b> ?。?-3)</b></p><p>  其中為各種不同的數(shù)值。這是一個(gè)扇形區(qū)域,改變可知道有無(wú)方向性,從而檢測(cè)出紋理是

110、否有線(xiàn)條和邊界條紋。</p><p>  4.4 WEB圖像的形狀特征提取</p><p>  由于基于形狀的檢索方法比較困難,本文采用經(jīng)典微分邊緣檢測(cè)算子——拉普拉斯(Laplacian)算子來(lái)提取圖像的邊緣形狀特征。</p><p>  圖像邊緣是指圖像灰度發(fā)生空間突變或者在梯度方向上發(fā)生突變的像素的集合,它往往是由圖像中景物的物理特性發(fā)生變化而引起的,是圖像

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論