版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、<p><b> 目錄</b></p><p> North China University of Water Resources and Electric Power1</p><p><b> 摘要5</b></p><p> Abstract6</p><p><
2、;b> 第一章 緒論7</b></p><p> 1.1 選題的背景和意義7</p><p> 1.2 三維信息獲取的發(fā)展前景8</p><p> 1.3 本文的結(jié)構(gòu)9</p><p> 第二章 攝像機的成像模型10</p><p> 2.1參考坐標系10</p>
3、<p> 2.2 攝像機模型11</p><p> 2.3 坐標變換關(guān)系12</p><p> 2.4攝像機成像模型的參數(shù)14</p><p> 第三章 偽逆算法16</p><p> 3.1 最小二乘法原理16</p><p> 3.2 偽逆矩陣18</p>&l
4、t;p> 3.2.1 右偽逆矩陣18</p><p> 3.2.2 左偽逆矩陣18</p><p> 3.3 線性方程組求解19</p><p> 3.4 偽逆算法19</p><p> 第四章 獲取圖像的三維特征點坐標21</p><p> 4.1圖像預處理21</p>
5、<p> 4.2利用偽逆法提取圖像的特征點坐標23</p><p> 第五章 結(jié)果分析25</p><p> 第六章 總結(jié)與展望29</p><p><b> 6.1 總結(jié)29</b></p><p><b> 6.2 展望29</b></p><
6、p><b> 致謝30</b></p><p><b> 參考文獻31</b></p><p><b> 附錄一32</b></p><p><b> 程序:32</b></p><p> 單幅圖像的三維信息獲取</p>
7、<p><b> 摘要</b></p><p> 三維信息獲取,是研究快速獲取物體表面三維信息,得到物體三維數(shù)字化模型的技術(shù)。三維信息主要包括目標點的空間位置信息、顏色信息、結(jié)構(gòu)信息等等,隨著電子技術(shù)和計算機技術(shù)的迅猛發(fā)展,人們經(jīng)常需要迅速的獲得圖像的三維信息。 當前三維信息獲取技術(shù)大多是基于計算機視覺理論,計算機視覺是用視覺傳感器獲取環(huán)境圖像并將其轉(zhuǎn)換成數(shù)字信號,用計算機
8、實現(xiàn)對視覺信息處理的全過程。 計算機視覺的研究目標是使計算機具有通過二維圖像認知三維環(huán)境信息的能力,使機器能感知三維環(huán)境中物體的幾何信息,包括形狀,位置,姿態(tài),運動等,并對它們進行描述,存儲,識別和理解。本研究的核心算法是首先需要得到攝像機從三維到二維的成像矩陣M3*4,并計算M3*4的偽逆矩陣N,然后利用偽逆矩陣N提取二維單幅圖像中的三維信息,即提取特征點的三維坐標。</p><p> 本文在分析了攝像機成像
9、模型的基礎(chǔ)上,提出了空間點獲取的方案,得到了世界坐標系與像素坐標系之間的轉(zhuǎn)換關(guān)系式,并為獲取三維信息提供了一種簡單的方法。</p><p> 關(guān)鍵詞:三維信息獲取;攝像機成像模型;偽逆;特征點</p><p><b> Abstract</b></p><p> 3D information acquisition is the stud
10、y of the rapid acquisition of 3D object surface information to get the 3D model technology.Three dimensional information mainly includes the target space position information, color information, configuration information
11、 and so on, along with the electronic technology and the rapid developement of computer technology, people often need to obtain images of three-dimensional information. </p><p> The current 3D information a
12、cquisition methods are mostly based on the theory of computer vision, computer vision is the vision sensor image acquisition environment and converts it into a digital signal, using computer to realize the whole process
13、of visual information processing.The study of the core algorithm is the first need to get the camera from 3D to 2D image matrix M3* 4, and calculate the M3 *4 pseudo inverse matrix N, and then use the pseudo inverse matr
14、ix N extracted from the two-dime</p><p> Based on the analysis of the model imaging camera are put forward, based on the point of the scheme for space, by the world coordinate system and the conversion rela
15、tion between pixel coordinate system, and for access to the 3 d information provides a simple method. </p><p> Key words:3D information acquisition;A camera imaging model ; pseudo inverse; feature point<
16、/p><p><b> 第一章 緒論</b></p><p> 計算機視覺的研究目標是使計算機具有通過一幅或多幅圖像認知周圍環(huán)境信息的能力。這種能力將不僅使計算機能感知環(huán)境中物體的幾何信息,包括它的形狀、位置、姿態(tài)、運動等,而且能對它們進行描述、存儲、識別與理解。</p><p> 80年代初Marr首次從信息處理的角度綜合了圖像處理、心理
17、物理學、神經(jīng)生理學及臨床精神病學的研究成果,提出了第一個較為完善的視覺系統(tǒng)框架。在這一理論的指導下,經(jīng)過眾多學者辛勤探索,計算機視覺已發(fā)展起一套獨立的計算理論與算法,它并不刻意去“仿真”生物視覺系統(tǒng),從而能用計算機對視覺信息(或者說對圖像)進行分析與處理。在理論發(fā)展的同時,計算機視覺已應(yīng)用于遙感圖像分析,文字識別,醫(yī)學圖像處理,多媒體技術(shù),工藝檢測與軍事等方面。我們相信,隨著跨學科基礎(chǔ)研究的不斷深入,隨著計算機性能的快速提高,計算機視覺
18、將廣泛地應(yīng)用于更復雜的場合。</p><p> 1.1 選題的背景和意義</p><p> 客觀世界在空間上是三維的。在工程技術(shù)和其他很多領(lǐng)域,一般要對物體進行三維信息分析,從而得到對研究有用的信息。基于數(shù)碼圖片的三維信息獲取是計算機視覺領(lǐng)域中一個重要的研究部分,近年來,三維信息獲取的理論和應(yīng)用也得到了很大的發(fā)展。目前,絕大部分圖像采集裝置所獲取的圖像信息都是二維的平面信息,盡管其中可
19、以含有三維物體的空間信息。要想從數(shù)碼圖片去認識真實物體,就要從二維世界中的平面圖像來恢復其在三維空間中的立體模型,這就需要研究二維空間中的圖像中的像素點與客觀世界中物體各點之間的對應(yīng)關(guān)系,分析確定物體的大小和空間物體的相互位置關(guān)系,得到物體的三維坐標,從而獲取三維信息。</p><p> 在美國召開的第10屆模式識別會議上,J.Atoimonos(英國馬里蘭大學)提出了有目的的、定性的主動視覺,他認為以馬爾視覺
20、計算理論為代表的理論將視覺規(guī)定為由場景的圖像精確地獲取三維幾何機器視覺,這要求太高了,是沒有必要的,計算也太過復雜,求解太困難,并且這些定量計算沒有必要, 可以用定性視覺來代表定量視覺。立體成像的方式主要由光源、采集器和景物三者的相互位置和運動情況所決定。傳統(tǒng)的成像方法幾乎是這三者中至少有一者位置不固定,比如雙目成像是兩個采集器位于兩個位置,當然也可以是同一個采集器平移到另一個位置;光移(光度立體)成像是光源運動,另兩者固定;主動視覺成
21、像是采集器運動,另兩者固定;主動視覺(自運動)成像是僅光源固定,另兩者運動等等。盡管圖像中包含著豐富的信息, 但是從一幅圖像無法直接獲得沿著某條投影線上的點的深度。至少需要兩幅圖像,才可以通過三角測量的方法得到點的深度。傳統(tǒng)的三維重建方法很少基于三者都固定的情況。從一幅圖像中提取三維信息的原理有很多,如透視縮放、透視縮短和紋理梯度等,因為在一幅圖像中,三維信息是隱藏在所成像的幾何畸變、明暗度、紋理、表面輪廓等因素之中的。值得注意的是&l
22、t;/p><p> 1.2 三維信息獲取的發(fā)展前景</p><p> 生活在三維的物理世界中,所有物體都具有三維物理尺寸。然而,迄今為止所有商業(yè)化信息器都只能顯示二維圖像,人們無法從被顯示的圖像上獲得物體的三維信息或感受到物體的物理深度。這種目前仍在使用的二維顯示技術(shù)剝奪了物體的三維特征,具有極大的局限性。</p><p> 有鑒于此,近年來提出并開展了一系列的三
23、維信息獲取技術(shù),并且這些三維信息獲取技術(shù)在一定程度上解決了城市規(guī)劃、國土調(diào)查、數(shù)字電力、數(shù)字森林、數(shù)字交通、應(yīng)急減災、礦產(chǎn)調(diào)查、文物數(shù)字保護等應(yīng)用領(lǐng)域的數(shù)據(jù)需求,有不可替代的商業(yè)價值和廣闊的應(yīng)用市場。特別是最近十年來迅速發(fā)展起來的激光雷達新型遙感技術(shù)和計算機視覺的攝影測量技術(shù)為三維信息快速獲取注入了新的活力。在巨大的市場需求和技術(shù)競爭面前,自主創(chuàng)新與技術(shù)集成是迫在眉睫的頭等大事。</p><p> 近些年,單幅
24、圖像信息獲取的研究越來越受到關(guān)注,由于一幅圖像無法完全重構(gòu)出對應(yīng)的三維模型,針對這一點,眾多研究者利用圖像中已知的幾何信息對目標物體進行三維信息獲取。</p><p> 在國外,caPrile和Torre首先提出了利用滅點進行攝像機標定的思想。在給出并證明了滅點屬性的基礎(chǔ)上,根據(jù)滅點與攝像機內(nèi)參數(shù)的關(guān)系通過單幅圖像確定攝像機的內(nèi)參數(shù),再由根據(jù)特定模板計算攝像機的外參數(shù)。Guilfou等人提出了一種利用滅點實現(xiàn)單
25、幅圖像中三維物體信息獲取的方法,假設(shè)攝相機在投影面上的投影中心即為圖像的中心,而不是利用滅點的屬性進行計算,且在對相機內(nèi)參數(shù)的估算時也沒有充分利用滅點的屬性,因而計算過程稍顯復雜。Debevec等將目標物體的幾何形狀作為相應(yīng)參數(shù),實現(xiàn)結(jié)構(gòu)化場景的交互式建模。ZHANG提出利用一些用戶指定的約束,如目標物體表面的位置、輪廓、皺痕等生成滿足這些約束的三維表面。</p><p> 在國內(nèi),對利用單幅圖像進建模工作的研
26、究也很多,張祖勛等通過分析滅點幾何,基于單幅圖像的三維信息獲取的研究建立了攝像機的成像模型,根據(jù)偽逆算法,用最小二乘法原理,計算影像的內(nèi)、外方位元素的方法,并在三維信息獲取的實踐中進行了驗證。</p><p><b> 1.3 本文的結(jié)構(gòu)</b></p><p> 本文一共由六章組成,本文的主要內(nèi)容如下:</p><p> 緒論介紹了本課
27、題的研究背景和意義,以及獲取三維信息技術(shù)的發(fā)展前景,并列出本課題的具體任務(wù)。</p><p> 研究了攝像機的成像模型,知道攝像機的兩個內(nèi)參矩陣,為提取特征點的偽逆算法提供了依據(jù)。</p><p> 先介紹最小二乘法原理,然后再了解偽逆算法。</p><p> 對圖像進行預處理,然后根據(jù)偽逆算法獲取圖像特征點的三維坐標</p><p>
28、 對實驗結(jié)果進行分析,并總結(jié)偽逆算法提取特征點的優(yōu)點和缺點。</p><p> 對全文做總結(jié)和對未來的研究工作進行展望。</p><p> 第二章 攝像機的成像模型</p><p> 從圖像中獲取三維信息的幾何數(shù)據(jù),必須建立物體位置點與其在攝相機中所處的位置點到像點之間的數(shù)學關(guān)系表達式,即確定攝像機成像幾何模型。</p><p>
29、攝像機成像模型是攝像機標定的基礎(chǔ),確定了成像模型,才能確定攝像機內(nèi)外參數(shù)的個數(shù)和求解的方法。在計算機視覺中,利用所拍攝的圖像來計算出三維空間中被測物體幾何參數(shù)。圖像是空間物體通過成像系統(tǒng)在像平面上的反映,即空間物體在像平面上的投影。圖像上每一個像素點的灰度反映了空間物體表面某點的反射光的強度,而該點在圖像上的位置則與空間物體表面對應(yīng)點的幾何位置有關(guān)。這些位置的相互關(guān)系,由攝像機成像系統(tǒng)的幾何投影模型所決定。計算機視覺研究中,三維空間中的
30、物體到像平面的投影關(guān)系即為成像模型。</p><p><b> 2.1參考坐標系</b></p><p> 攝像機的成像過程如圖2-1,共涉及到4個坐標系,這4個坐標系分別為:</p><p> 世界坐標系 —— 根據(jù)自己的需要選定的坐標系,坐標原點為,其</p><p> 它的坐標用表示;世界坐標系用來描述場景
31、中攝像機和物體的位置。 </p><p> (2) 攝像機坐標系 ——坐標系為Oc-XcYcZc,其中Oc為攝像機的光心,Xc軸和Yc軸與成像平面坐標系的坐標軸平行,Z軸為攝像機的光軸,與成像平面垂直。</p><p> (3) 圖像坐標系 —— 它的坐標原點O在攝像機獲得的圖像平面的中心,其點的坐標用(x, y)來表示,它的 X 軸、Y 軸分別平行于攝像機坐標系的兩條垂直邊;&
32、lt;/p><p> 像素坐標系 —— 它的坐標原點在圖像平面的左上角,它的兩個坐標軸分別用 U、V 表示,且 U 軸、V 軸也平行于攝像機坐標系的兩條垂直邊,其點的坐標用(u ,v)來表示,由于像素坐標系中的坐標是用像素來表達的,所以該坐標值都是一些離散的整數(shù)值。 </p><p> P(Xw,Yw,Zw)Zc</p><p> (Xc,Yc,Zc)</
33、p><p><b> O0V</b></p><p><b> P'</b></p><p><b> O</b></p><p><b> X</b></p><p><b> U</b>&l
34、t;/p><p><b> Y</b></p><p><b> f</b></p><p><b> Xc</b></p><p><b> Oc</b></p><p><b> Yc</b><
35、;/p><p> 2-1 攝相機成像坐標系</p><p><b> 2.2 攝像機模型</b></p><p> 攝像機采集得到的圖像上的每一點的亮度反映了空間物體表面某點反射光的強度,而該點在圖像中的位置與物體表面點在三維世界中的位置有關(guān)。攝像機成像模型將三維空間的點與圖像平面上的點對應(yīng)起來,可以用一個從三維空間到二維空間的映射來表示:&
36、lt;/p><p><b> ?。?-1)</b></p><p> 2.3 坐標變換關(guān)系</p><p> 四個參考坐標系的坐標變換一共涉及到三個過程,將空間中點的世界坐標變換為圖像的像素坐標。</p><p> (1)世界坐標系到攝像機坐標系的變換</p><p> 世界坐標系到攝像機坐標
37、系的變換是一個剛體變換,可以由一個正交變換矩陣R和一個位移向量T表示為:</p><p><b> ?。?-2)</b></p><p> 用齊次坐標的形式可以表示為:</p><p><b> (2-3)</b></p><p> 其中,是世界坐標系的坐標(X,Y,Z)是攝像機坐標系的坐標,
38、T是世界坐標系原點在攝像機坐標系中的坐標,矩陣R是正交旋轉(zhuǎn)矩陣,矩陣元素滿足下式:</p><p><b> ?。?-4)</b></p><p> 正交旋轉(zhuǎn)矩陣實際上只有3個獨立變量,再加上T的3個變量,一共有6個參數(shù)決定了攝像機光軸在世界坐標系中的位置,這6個參數(shù)被稱為攝像機的外部參數(shù)。 (2)攝像機坐標系到成像平面坐標系的變換 攝像機坐標系到成像平
39、面坐標系的變換是一個透視投影變換,由相似三角形關(guān)系可以得到下面的關(guān)系式:</p><p><b> ?。?-5)</b></p><p> 用齊次坐標的形式可以表示為:</p><p><b> (2-6)</b></p><p> 其中,(X,Y,Z)是攝像機坐標系的坐標,(x,y)是成像平
40、面坐標系的坐標,f是攝像機的焦距。 (3)成像平面坐標系到圖像坐標系的變換 成像平面坐標系到圖像坐標系的變換是圖像數(shù)字化的過程,將像素點的物理坐標變換為圖像的像素坐標。設(shè)主點在圖像坐標系中的坐標為,每一個像素在x軸和y軸方向上的物理尺寸為dx,dy,則圖像坐標變換關(guān)系可由下式表示:</p><p><b> ?。?-7)</b></p><p> 用
41、齊次坐標的形式可以表示為:</p><p><b> ?。?-8)</b></p><p> 其中,(x,y)是成像平面坐標系的坐標(u,v)是圖像坐標系的坐標,和為x和y方向的采樣頻率,即單位長度的像素點個數(shù)。 將式(2.3)和式(2.6)代入式(2.8)得到圖像坐標和世界坐標的變換關(guān)系可由下式表示:</p><p><b&
42、gt; ?。?-9)</b></p><p> 上面的關(guān)系式是在假設(shè)圖像坐標軸相互垂直的情況下推導出來的,但是通常情況下,兩個坐標軸之間并不是嚴格垂直的,引入傾斜因子s來描述圖像坐標軸的傾斜程度。最終得到針孔成像模型的數(shù)學表達式如下:</p><p><b> ?。?-10)</b></p><p> 其中,和分別為x和y方向的
43、等效焦距,K稱為攝像機的內(nèi)部參數(shù)矩陣,(R,T)稱為攝像機的外部參數(shù)矩陣,P稱為投影矩陣。</p><p> 2.4攝像機成像模型的參數(shù)</p><p> 三維計算機視覺系統(tǒng)從攝像機獲得的圖像信息出發(fā),計算三維環(huán)境物體的位置、形狀等幾何信息,并由此來識別環(huán)境中的物體.圖像上每一點的亮度反映了空間物體表面某點反射光的強度,而該點在圖像上的位置則與空間物體表面相應(yīng)點的位置有關(guān).這些位置的相
44、互關(guān)系,與攝像機成像的幾何模型有關(guān).該幾何模型的參數(shù)稱為攝像機參數(shù).攝像機標定的任務(wù)是去求解這些參數(shù). </p><p> 攝像機參數(shù)可以分為內(nèi)外2種參數(shù).外部參數(shù)用來把世界坐標系轉(zhuǎn)換成攝像機坐標系.其最簡單的模型是線性模型,由于攝像機可安放在環(huán)境中的任何一個位置,可在環(huán)境中選擇一個基準坐標系來描述攝像機的位置,并用它來描述環(huán)境中任何物體的位置,該坐標系稱為世界坐標系.攝像機坐標系(x,y,z)與世界坐標系(X
45、,Y,Z)之間的關(guān)系可以用旋轉(zhuǎn)矩陣R與平移向量T來描述.矩陣R與向量T被稱為攝像機的外部參數(shù).攝像機的內(nèi)部參數(shù)通常包括焦距f,圖像中心坐標. 由于圖像像素坐標并沒有用物理單位表示出該像素在圖像中的位置,因此, 需要再建立以物理單位(mm)表示的圖像物理坐標系.該坐標系以圖像中心坐標為原點,x軸與y軸分別與u,v軸平行。</p><p> 式(2-11)是攝像機成像過程矩陣運算表示方法:</p>&
46、lt;p><b> (2-11)</b></p><p> 式中,k表示畸變系數(shù),dx與dy分別表示圖像采樣時x方向與y方向像素與像素之間的長度,單位為[毫米/像素];u0與v0分別表示計算機圖像坐標系中圖像中心的坐標值;f表示攝像機有效焦距。是旋轉(zhuǎn)矩陣,是平移矩陣。</p><p><b> 第三章 偽逆算法</b></p&
47、gt;<p> 本實驗的核心算法就是偽逆算法,通過對三維到二維的成像矩陣,進行偽逆,就可以提取圖像的特征點。但進行偽逆,需要應(yīng)用最小二乘法原理來計算。下面我們將介紹最小二乘法原理。</p><p> 3.1 最小二乘法原理</p><p> 最小二乘法是一種數(shù)學優(yōu)化技術(shù),它通過最小化誤差的平方和找到一組數(shù)據(jù)的最佳函數(shù)匹配。最小二乘法就是用最簡單的方法去求得一些絕對不可
48、知的、真值,從而令誤差平方之和為最小。最小二乘法是應(yīng)用最多的參數(shù)估計方法,是從最小二乘法原理出發(fā)的其他估計方法的基礎(chǔ),是必須熟練掌握的一種方法。</p><p> 在已經(jīng)獲得樣本觀測值(i=1,2,…,n)的情況下,假設(shè)參數(shù)估計量已經(jīng)求得到,為,并且是最合理的參數(shù)估計量,那么直線方程</p><p> i=1,2,…,n (3-1)</p><p>
49、 應(yīng)該能夠最好地去擬合樣本數(shù)據(jù)。其中被解釋為變量的估計值,它是由參數(shù)估計量和解釋變量的觀測值計算得到的。那么,被解釋變量的估計值與觀測值應(yīng)該在總體上最為接近,判斷的標準是二者之差的平方和最小。</p><p><b> (3-2)</b></p><p> 為什么要用平方和?因為二者之差可正可負,簡單求和可能將很大的誤差抵掉,只有平方和才能反映二者在總體上的接近
50、程度。這就是最小二乘原則。那么,就可以從最小二乘原則和樣本觀測值出發(fā),求得參數(shù)估計量。</p><p><b> 由于</b></p><p><b> (3-3)</b></p><p> 是、的二次函數(shù)并且非負,所以其極小值總是存在。根據(jù)羅彼塔法則,當Q對、的一階偏導數(shù)為0時,Q達到最小。即</p>
51、<p><b> (3-4)</b></p><p><b> 容易推得特征方程:</b></p><p><b> (3-5)</b></p><p> 解得: </p><p><b> (3-6)</
52、b></p><p> 所以有: (3-7)</p><p> 于是得到了符合最小二乘原則的參數(shù)估計量。</p><p> 為了減少計算工作量,本實驗介紹了采用樣本的利差形式的參數(shù)估計量的計算公式。由于現(xiàn)在計量經(jīng)濟學計算機軟件被普遍采用,計算工作量已經(jīng)不是什么大問題。但離差形式的計算公式在其他方面也是有應(yīng)用的,有關(guān)公式如下:
53、 </p><p><b> (3-8)</b></p><p> ?。?-8)的參數(shù)估計量可以寫成</p><p><b> (3-9)</b></p><p> 至此,完
54、成了模型估計的第一項任務(wù)。下面進行模型估計的第二項任務(wù),即求隨機誤差項方差的估計量。記為第i個樣本觀測點的殘差,即被解釋變量的估計值與觀測值之差。則隨機誤差項方差的估計量為</p><p><b> (3-10)</b></p><p><b> 3.2 偽逆矩陣</b></p><p> 3.2.1 右偽逆矩陣&l
55、t;/p><p> 設(shè)A是mn階矩陣,規(guī)定:叫右偽逆矩陣。右偽逆矩陣具有逆矩陣的性質(zhì):</p><p><b> (3-11)</b></p><p> 3.2.2 左偽逆矩陣</p><p> 設(shè)A是mn階矩陣,規(guī)定:叫左偽逆矩陣。右偽逆矩陣具有逆矩陣的性質(zhì):</p><p><b&g
56、t; ?。?-12)</b></p><p> 3.3 線性方程組求解</p><p> 對于n元線性方程組AX=B其解有三種情況;解惟一,有無窮組解,無解.下面應(yīng)用偽逆矩陣對線性方程組AX=B作進一步的討論.設(shè)方程組有n個變元,A是階矩陣,B是階矩陣.</p><p><b> (1)有唯一解</b></p>
57、<p> 當線性方程組AX=B有唯一解時,必有R(A)=R(AB)=n=m.此時方程組的解為;。</p><p><b> ?。?)有無窮組解</b></p><p> 當線性方程組AX=B有無窮組解時,必有R(A)=R(AB)<n.</p><p> 一般的,對于線性方程組AX=B,當有無窮組解時,我們要找出最接近原點
58、的解,即最小范數(shù)解,則他是惟一的。令這個最小范數(shù)解為,即滿足以下條件:AX=B,且對所有滿足AX=B的X,有:||||||X||,這表示在X 對應(yīng)的n維空間中,是所有滿足AX=B的解中最靠近遠點的。</p><p><b> 的構(gòu)造如下:=。</b></p><p><b> ?。?)無解</b></p><p> 當
59、線性方程組AX=B有無解時,必有R(A)R(AB)。如果方程組無解,我們希望能夠找到可以使范數(shù)||AX-B||最小化的解。令此解為,即滿足以下條件:</p><p><b> ?。?-13)</b></p><p> 這里不是傳統(tǒng)意義上的解,因為它不滿足代數(shù)方程組AX=B,因此被稱為可使||AX-B||最小化的近似解的構(gòu)造如下:</p><p&g
60、t;<b> ?。?-14)</b></p><p><b> 3.4 偽逆算法</b></p><p> 在本試驗中,圖像經(jīng)已標定的攝像機所得到的成像矩陣為M,它的偽逆矩陣的算法如下:</p><p> 如果矩陣M是方陣且非奇異,則M的偽逆矩陣(記為)與相等; 如果M不是方陣或M為奇異陣, 則不相等。即有:<
61、;/p><p><b> (3-15)</b></p><p> 可以通過最小二乘法得到矩陣的偽逆矩陣,也稱之為通過矛盾方程組求解。本文需要求矩陣的偽逆。為了求的偽逆,構(gòu)造等式:</p><p><b> ?。?-16)</b></p><p> 式中,表示的偽逆,在該式中它是未知數(shù); 表示四階
62、方陣。展開式后,可以得到16個方程, 其中前4個方程如式(3-15)所示, 它是通過的第一行元素得到的4個方程:</p><p><b> (3-17)</b></p><p> 為了解這16個方程、12個未知數(shù)的方程組,可以通過最小二乘法來求解。首先把這16個方程寫成方程矩陣形式,得到:</p><p><b> ?。?-18)
63、</b></p><p> 式中,是的12個元素寫成列向量的行式, 是單位方陣寫成列向量的行式, 就是通過上面得到的16個方程的系數(shù)矩陣得到的。在式(3-16)左邊和右邊分別左乘,得到相應(yīng)的正規(guī)方程組,即:</p><p><b> ?。?-19)</b></p><p> 再對上述正規(guī)方程組進行求解,即可得到的最小二乘偽逆陣
64、。把寫成4行、3列形式, 就得到。將上述求解過程合并一下, 就可以得到以下公式:</p><p><b> (3-20)</b></p><p> 顯然式(3-20)滿足式(3-15)關(guān)于偽逆矩陣的定義,其運算過程也滿足矩陣逆的定義。可以證明,這種方法求得的偽逆解,就是最小二乘解。因為對于形如式(3-20)這種AX = b的超定方程組而言,與子空間是正交的,其中為
65、最逼近真解的最近似解,因此可以看成是子空間的法線,所以該解向量到子空間的距離是最短的,即最小二乘原理。</p><p> 第四章 獲取圖像的三維特征點坐標</p><p> 隨著科技不斷的發(fā)展進步,針對一幅圖片,人們不單單的只去觀看了解它的表面,而是想更深入的知道這幅圖在真實環(huán)境中的立體感覺。一部分科學家正在研究怎樣才能更準確,高精度的去獲取它的三維信息,讓人們更能直觀的去認識這幅圖片
66、。本實驗為大家提供一種比較快速的去獲得圖像的三維數(shù)據(jù)的方法。</p><p><b> 4.1圖像預處理</b></p><p> 在圖像的產(chǎn)生、傳輸和變換過程中,由于多種因素的影響,往往使其與原始景物之間產(chǎn)生某些差異,這種差異稱為變劣或退化。圖像的退化一般包括對比度較差,邊緣模糊、噪聲較大等。這些變劣給圖像的進一步處理造成了困難和不便。因此,有必要對圖像進行恰當
67、的處理,從而改善圖像的視覺效果,提高圖像成分的清晰度,并且使圖像更有利于計算機的處理,便于對圖像進行分割,從而提高圖像的識別率,這一過程就是圖像的預處理。本文利用MATLAB對圖像進行預處理,該系統(tǒng)中所用到的算法容易實現(xiàn),運算量少。</p><p> (1)灰度圖像的直方圖</p><p> 按照隨機過程理論,圖像可以看作是一個隨機場具有相應(yīng)的統(tǒng)計特性,其中最重要的特征是灰度密度函數(shù)。
68、要精確得到圖像的灰度密度函數(shù)是比較困難的,實際中用數(shù)字圖像的直方圖來代替?;叶戎狈綀D是一個離散函數(shù),它表示數(shù)字圖像每一灰度級與該灰度級出現(xiàn)頻率的對應(yīng)關(guān)系。假設(shè)一幅數(shù)字圖像的象素總數(shù)為 N,有L個灰度級,具有第k個灰度級的灰度的像素共有個,則第k個灰度級或者說是出現(xiàn)的頻率為:</p><p> , k=0.1....L-1 (4-1) <
69、/p><p> 密度函數(shù)p (z)或直方圖雖然不能直接反映出圖像的內(nèi)容,但對它進行分析可以得出圖像的一些有用特征,這些特征能反映出圖像的特點。例如,當圖像對比度較小時,它的灰度直方圖只在灰度軸上較小的一段區(qū)間上非零;較暗的圖像由于較多的象素灰度值低,因此它的直方圖的主體出現(xiàn)在低灰度區(qū)間上,其在高灰度區(qū)間上的幅度較小或為零;看起來清晰的圖像,它的直方圖灰度分布較均勻。</p><p><
70、b> ?。?)直方圖均衡化</b></p><p> 直方圖均衡化處理的“中心思想”是把原始圖像的灰度直方圖從比較集中的某個灰度區(qū)間變成在全部灰度范圍內(nèi)的均勻分布。直方圖均衡化就是對灰度圖像進行非線性拉伸,重新分配圖像的像素值,是一定灰度范圍內(nèi)的像素數(shù)量大致相同。直方圖均衡化就是把給定圖像的直方圖分布改變成均勻分布直方圖分布。</p><p> 直方圖均衡化方法是將一
71、已知灰度概率密度分布圖像經(jīng)過某種變換變成一幅具有均勻灰度概率密度分布的新圖像,從而達到增強圖像整體對比度的效果,是一種常用的灰度增強的算法。</p><p> 假設(shè)一幅圖像的像素數(shù)為n,共有1個灰度級,代表灰度級為的像素的數(shù)目,則第k個灰度級出現(xiàn)的概率可以表示為</p><p><b> ?。?-2)</b></p><p> 其中,0,其
72、中k=0,1...,變換函數(shù)T(r)為:</p><p><b> ?。?-3) </b></p><p> 其中,0,且j=0,1...</p><p> 從上面計算過程可以看出,對原始輸入圖像直方圖的統(tǒng)計值可以算出均衡化各像素的灰度值。采用直方圖均衡化后會是灰度分布較密的部分被拉伸,灰度分布稀疏的部分被壓縮,從而使一幅圖像對比度在總體上
73、得到增強。更重要的是,通過圖像的直方圖,可以確定圖像的閾值范圍,去除圖像以外的像素點,更方便的提取圖像的特征點。</p><p><b> ?。?)二值圖像</b></p><p> 二值圖像是指每個像素不是黑就是白,其灰度值沒有中間過渡的圖像。二值圖像一般用來描述文字或者圖形,其優(yōu)點是占用空間少,缺點是,當表示人物,風景的圖像時,二值圖像只能描述其輪廓,不能描述細
74、節(jié)。這時候要用更高的灰度級。</p><p> 二值圖像是每個像素只有兩個可能值的數(shù)字圖像。人們經(jīng)常用的黑白、B&W單色圖像表示二值圖像,但是也可以用來表示每個像素只有一個采樣值的任何圖像,例如灰度圖像等。 </p><p> 二值圖像中所有的像素只能從0和1這兩個值中取,因此在MATLAB中,二值圖像用一個由0和1組成的二維矩陣表示。這兩個可取的值分別對應(yīng)于關(guān)閉和打開,關(guān)
75、閉表征該像素處于背景,而打開表征該像素處于前景。以這種方式來操作圖像可以更容易識別出圖像的結(jié)構(gòu)特征。二值圖像操作只返回與二值圖像的形式或結(jié)構(gòu)有關(guān)的信息,如果希望對其他類型的圖像進行同樣的操作,則首先要將其轉(zhuǎn)換為二進制的圖像格式,可以通過調(diào)用MATLAB提供的im2bw()來實現(xiàn)。</p><p><b> ?。?)邊緣檢測</b></p><p> 邊緣是所要提取目
76、標的分界線,提取出邊緣才能將目標和背景區(qū)分開來。在圖像中,邊界表明一個特征區(qū)域的終結(jié)和另一個特征區(qū)域的開始,邊界所分開區(qū)域的內(nèi)部特征或?qū)傩允且恢碌?,而不同區(qū)域內(nèi)部的特征或?qū)傩允遣煌摹_吘壍臋z測正是利用物體和背景在某種圖像特性上的差異來實現(xiàn)的,這些差異包括灰度、顏色或者紋理特征。邊緣檢測實際上就是檢測圖像特性發(fā)生變化的位置。</p><p> 由于噪聲和模糊的存在,檢測到的邊界可能會變寬或在某些點出發(fā)生間斷,因
77、此,邊界檢測包括兩個基本內(nèi)容:首先抽取出反映灰度變化的邊緣點,然后剔除某些邊界點或補邊界間斷點,并將這些邊緣連接成完整的線。</p><p> 4.2利用偽逆法提取圖像的特征點坐標</p><p> 特征提取和選擇是對于處理后的數(shù)據(jù)進行分析、去粗存精的過程。由于原始圖像數(shù)據(jù)量是相當大的,需要把這些數(shù)據(jù)轉(zhuǎn)換為若干個特征,即為特征提取。為了提高分類處理的速度和精度,對提取的特征必須選擇最有
78、代表性的特征,其信息冗余度最小,而且希望具有比例、旋轉(zhuǎn)、位移不變性。</p><p> 從數(shù)學上講,特征提取相當于把一個物理模式變成一個隨機向量,如果抽取和選擇了m個特征,則物理模式可用一個m維特征向量描述,表現(xiàn)為m維歐氏空間中的一個點。m維特征向量表示為</p><p> 近幾年來,研究者對特征提取的理論作了較多的探索,力求得出一些針對特定目標的高精度、高效率的特征提取算法與方法。這
79、其中包含PCA方法、Fisher鑒別分析方法,以及以核方法為代表的非線性特征提取方法等。另外,在實際應(yīng)用中算法的效率也是非常重要的。核方法是新近發(fā)展起來的一種非線性特征提取方法,它的理論基礎(chǔ)來自于統(tǒng)計學習理論。下面介紹的是以最小二乘法原理為基礎(chǔ),利用偽逆算法來提取圖像的特征點坐標的。</p><p> 這一步是式(2-11)的逆過程,可以通過以下公式計算特征點的三維坐標值,該三維坐標值的坐標系取決于前面計算的時
80、用到的R與T,計算公式為:</p><p><b> ?。?-4)</b></p><p><b> 結(jié)果分析</b></p><p> 本次試驗的目的是從二維的圖像平面感知它的三維立體空間,并提取特征點的三維坐標,得到三維信息。</p><p> 本實驗的主要步驟如下:</p>
81、<p> 首先要根據(jù)攝像機的成像模型, 得到攝像機從三維到二維的成像矩陣。這里要用到攝像機的內(nèi)參和外參矩陣。</p><p> 其次利用最小二乘原理,計算成像矩陣的偽逆矩陣。</p><p> 然后利用偽逆算法提取圖像的特征點。</p><p> 最后獲取圖像的特征點的三維坐標,獲得三維信息。</p><p> 本實驗的
82、具體內(nèi)容如下:</p><p> 首先先輸入一幅原圖(即灰度圖像)如下圖1:</p><p> 圖 1 原圖像 圖2 原圖像的直方圖</p><p> 為了看到圖像的分布情況,直方圖能夠反映圖像的分布,如上圖2,可以從圖2中看出該直方圖只在灰度軸較小的一段區(qū)間上非零,說明該圖像的對比度較?。欢移渲黧w出現(xiàn)在低值
83、灰度區(qū)間上,說明圖像中有較多的象素灰度值低。</p><p> 為了使圖像清晰,可以對圖像進行原圖像均化處理,使圖像的灰度范圍拉開,并且然灰度頻率較小的灰度級變大,即讓灰度直方圖在較大的動態(tài)范圍內(nèi)趨于一致,如下圖3:</p><p> 圖3 原圖像均衡化圖4 均衡化的直方圖</p><p> 從圖4可以使圖像的細節(jié)更加清楚了,而從圖像的直方圖上也可以看出,在
84、直方圖調(diào)整之前,低灰度的比例較大,經(jīng)過直方圖調(diào)整,各灰度等級的比例更加平衡,從而得到圖像的閾值范圍。但是由于直方圖均衡并沒有考慮圖像的內(nèi)容,簡單地將圖像進行直方圖均衡,還需用其它方法對圖像進行增強。</p><p> 對圖1進行黑白化,白的部分就是就是圖像的閾值,如下圖5:</p><p><b> 圖5 二值圖像</b></p><p>
85、; 對比度增強的圖像處理技術(shù)是按一定的規(guī)則修改輸入圖像每一個象素灰度,從而改變圖像灰度的動態(tài)范圍。它可以使灰度動態(tài)范圍擴展,也可以使其壓縮,或者對灰度進行分段處理,根據(jù)圖像特點和要求在某段區(qū)間中進行壓縮而在另外區(qū)間中進行擴展。</p><p> 提取圖像的邊緣,如下圖6:</p><p> 圖6 邊緣提取 圖7 邊緣檢測</p><p> 從上圖6可
86、以看出,物體與背景的對比度很強,已能將其邊緣提出,提取對比度調(diào)整后的圖像的邊緣,由于噪聲和模糊的存在,需進行邊緣檢測,如上圖7:從邊緣輪廓圖像可清楚看到,圖像的邊緣已經(jīng)很清楚,物體中心的圖像坐標可以很容易得到。</p><p> 對于這幅圖像,它的參考參數(shù)如下:</p><p><b> 旋轉(zhuǎn)矩陣</b></p><p><b>
87、 平移矩陣</b></p><p> 有效焦距f=15.71mm</p><p> 像素為 10241392</p><p> 圖像采樣時x方向像素與像素之間的長度1/(4.65*10e-3) 毫米/像素</p><p> 圖像采樣時y方向像素與像素之間的長度1/(4.65*10e-3) 毫米/像素</p>
88、<p> 圖像中心點坐標=(696.5,520.5)</p><p><b> 成像矩陣</b></p><p><b> 偽逆矩陣</b></p><p> 利用偽逆算法提取的圖像特征點的三維坐標,以下是部分點三維坐標:</p><p> 第六章 總結(jié)與展望</p&g
89、t;<p> 本文主要通過對攝像機的成像模型、圖像預處理以及獲取空間點的三維坐標進行分析與研究,在實驗的基礎(chǔ)上,最終得到了比較滿意的結(jié)果。</p><p><b> 6.1 總結(jié)</b></p><p> 1.本課題將計算機視覺的理論、算法與圖像處理相融合,用攝像機拍攝物體的圖像,然后對物體的圖像進行分析與處理,從而對獲取圖像的三維坐標,得到圖像
90、的三維信息。</p><p> 2.攝像機的成像模型是對空間物體進行三維重建必不可少的前提,本文通過對攝像機的成像模型進行分析,得到攝像機從三維到二維的成像矩陣。</p><p> 3.本文采用偽逆算法獲取空間點坐標,這種方法可以在任意的攝像機配置下獲取空間任意點。</p><p> 4.本文對上述研究進行了分析與實驗,實驗結(jié)果表明,該算法獲取原理簡單,計算量
91、小,能夠?qū)崿F(xiàn)通過處理拍攝的圖像確定目標的空間坐標,從而得到三維信息。</p><p><b> 6.2 展望</b></p><p> 首先,本文算法是建立在線非性攝像機模型基礎(chǔ)上的,因此,該算法提取的三維信息不能做定量分析,只能做定性分析。當然,只要最小二乘解很接近真實解, 也可以做定量分析。</p><p> 其次,本文對空間點進行坐
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- DSA圖像三維重建中的二維信息處理及三維表達.pdf
- 冠脈造影圖像的二維信息處理及三維重建研究.pdf
- 基于單幅圖像的三維人臉模型重建.pdf
- 基于單幅圖像的三維形貌恢復研究.pdf
- 圖像信息處理
- 基于單幅灰度圖像的三維表面重構(gòu).pdf
- B超序列截面圖像采集及其三維信息處理的研究.pdf
- 基于單幅圖像的三維重建技術(shù)研究
- 基于單幅圖像的三維建模技術(shù)及其應(yīng)用.pdf
- 心血管造影圖像的二維信息處理及其三維重建研究.pdf
- 基于單幅未標定圖像的三維重建.pdf
- 基于單幅SEM圖像的三維重建技術(shù).pdf
- 單幅正視灰度圖像三維重建及偽彩處理的研究與實現(xiàn).pdf
- 相位法激光三維測量系統(tǒng)信息處理技術(shù).pdf
- 基于單幅圖像的三維發(fā)型建模技術(shù)及其應(yīng)用.pdf
- 基于單幅圖像的交互式三維花朵建模.pdf
- 基于單幅圖像的三維重建技術(shù)研究.pdf
- 基于單幅實時測量圖像三維形貌恢復的研究.pdf
- 基于單幅編碼圖像的三維重構(gòu)系統(tǒng)集成.pdf
- 圖像信息的三維顯示
評論
0/150
提交評論