版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第五講 空間點(diǎn)數(shù)據(jù)分析,引言點(diǎn)數(shù)據(jù)概述點(diǎn)數(shù)據(jù)分析,--Spatial Point Data Analysis--,1. 引言,點(diǎn)模式分析由植物學(xué)家和生態(tài)學(xué)家在1930s應(yīng)用。但是,隨后許多不同領(lǐng)域也開始應(yīng)用點(diǎn)模式分析,如考古學(xué)、流行病學(xué)、天文學(xué)和犯罪學(xué)。一般來說,點(diǎn)模式分析可以用來描述任何類型的事件數(shù)據(jù)(incident data)。因?yàn)槊恳皇录伎梢猿橄蠡癁榭臻g上的一個(gè)位置點(diǎn)。,搶劫案,Data,城市發(fā)展的空間演變模式,星羅
2、棋布的村莊,http://www.sphere.ad.jp/togen/photo-n.html,,來源:USGS,Arp 272是兩個(gè)螺旋星云——NGC 6050 和 IC 1179相撞形成的,這兩個(gè)星云的螺旋臂相互扭結(jié)在一起。它們是武仙座星群的一部分。武仙座星群是已知的宇宙中最大的結(jié)構(gòu):所謂的長(zhǎng)城的一部分。Arp 272距離地球大約4.5億光年。,http://news.xinhuanet.com/photo/2008-04/25/
3、content_8047673_4.htm,Arp 240是一對(duì)大小相似的螺旋星云——NGC 5257 和NGC 5258。這兩個(gè)星系顯然通過一個(gè)暗淡的恒星橋相互作用。它們兩個(gè)的中心都有超大質(zhì)量黑洞。Arp 240位于室女座內(nèi),距離地球大約3億光年。,http://news.xinhuanet.com/photo/2008-04/25/content_8047673_6.htm,ESO 99-4是一個(gè)擁有奇特形狀的星系,它可能是一個(gè)早期
4、合并過程的殘余物,沒有成形。ESO 99-4位于北三角座內(nèi),距離地球大約4億光年。,軋制鋼橫截面(100×100 微米)573個(gè)碳化物顆粒中心,混凝土(10×10×10毫米)(白色為切的剛玉顆粒,黑色為氣孔),細(xì)胞表面的蛋白質(zhì)位置矩形大?。?07×119 微米,血液樣本(紅細(xì)胞為黑色)矩形大?。?25×182 微米,“點(diǎn)”模式在自然與社會(huì)經(jīng)濟(jì)中普遍存在。 識(shí)別空間點(diǎn)模式(spat
5、ial point pattern)的目的是為了更好地理解空間點(diǎn)過程(spatial point progress),揭示隱藏在空間模式表象之下的空間過程的機(jī)理。— 空間隨機(jī)/ 聚集/均勻— 過程建模,2. 點(diǎn)數(shù)據(jù)概述,隨機(jī)分布:任何一點(diǎn)在任何一個(gè)位置發(fā)生的概率相同,某點(diǎn)的存在不影響其它點(diǎn)的分布。又稱泊松分布(Poisson distribution)。均勻分布:個(gè)體間保持一定的距離,每一個(gè)點(diǎn)盡量地遠(yuǎn)離其周圍的鄰近點(diǎn)。在單位(樣方
6、)中個(gè)體出現(xiàn)與不出現(xiàn)的概率完全或幾乎相等。聚集分布:許多點(diǎn)集中在一個(gè)或少數(shù)幾個(gè)區(qū)域,大面積的區(qū)域沒有或僅有少量點(diǎn)??傮w中一個(gè)或多個(gè)點(diǎn)的存在影響其它點(diǎn)在同一取樣單位中的出現(xiàn)概率。,空間點(diǎn)數(shù)據(jù)的三種基本分布模式,點(diǎn)數(shù)據(jù)的三種基本空間分布模式,怎樣描述點(diǎn)模式?,一階效應(yīng)(First-Order Effects)事件間的絕對(duì)位置具有決定作用,單位面積的事件數(shù)量在空間上有比較清楚的變化。如,空間上平均值/密度的變化。二階效應(yīng)(Secon
7、d-Order Effects)事件間的相對(duì)位置和距離具有決定作用。如,空間相互作用。,3.1 基于密度的方法:測(cè)度一階效應(yīng),3. 點(diǎn)數(shù)據(jù)分析,3.2 基于距離的方法:測(cè)度二階效應(yīng),最近鄰距離: G 函數(shù)、 F 函數(shù) 最近鄰距離的統(tǒng)計(jì)檢驗(yàn) K 函數(shù) (K Function),樣方分析 樣方分析的統(tǒng)計(jì)檢驗(yàn) 核密度估計(jì),空間點(diǎn)數(shù)據(jù)分析架構(gòu),3. 點(diǎn)數(shù)據(jù)分析,3.1 基于密度的方法 ① 樣方分析(Quadra
8、t analysis)② 樣方分析的統(tǒng)計(jì)檢驗(yàn) ③ 核密度估計(jì) (Kernel Density Estimation),利用所有點(diǎn):樣方的形狀、大小、方向?qū)Y(jié)果有影響如果樣方太大/小,那么 ……?,隨機(jī)抽樣方法:有增加樣本量的作用可以描述一個(gè)沒有完全數(shù)據(jù)的空間點(diǎn)過程,①樣方分析-兩種方式,樣方形狀,http://psychology.exeter.ac.uk/lundy/quadrat.htm,The term “Quad
9、rat” strictly means a four sided figure, but in practice this term is used to mean any sampling unit, whether square, rectangular, circular, hexagonal or even irregular in outline.,樣方分析步驟,a). 研究區(qū)域中打上網(wǎng)格,建議方格大小為: QuadratS
10、ize = 2A /n A:研究區(qū)域面積,n:點(diǎn)的個(gè)數(shù)。b). 確定每個(gè)網(wǎng)格中點(diǎn)的個(gè)數(shù)。c). 計(jì)算均值(Mean)、方差(Var)和方差均值比:VMR=Var/Mean,對(duì)于均勻分布,方差=0,因此VMR的期望值= 0;對(duì)于隨機(jī)分布,方差=均值,因此VMR的期望值= 1;對(duì)于聚集分布,方差大于均值。因此VMR的期望值 >1 。,注: N = 樣方數(shù)量 = 10,隨機(jī),,隨機(jī),聚集,x,均勻,x,x,樣方
11、分析的缺點(diǎn),結(jié)果依賴于樣方的大小和方向。,總的模式是分散的,但局部有聚集現(xiàn)象。,樣方分析主要依據(jù)點(diǎn)密度, 而不是點(diǎn)之間的相互關(guān)系,所以不能區(qū)別圖示的兩種情況:,樣方分析不能探測(cè)區(qū)域內(nèi)的變化。,密度:,密度依賴于研究區(qū)域的大小。a: a, 4a, 16a, 64an: 2, 2, 5, 10 :2.0, 0.5, 0.31, 0.15,,樣方分析:K-S檢驗(yàn),D檢驗(yàn),如何
12、比較精確地檢驗(yàn)零假設(shè)?H0:沒有空間模式假設(shè)在一區(qū)域內(nèi)通過隨機(jī)放點(diǎn)來模擬零假設(shè),并計(jì)算其方差-均值比(VMR)。更進(jìn)一步地,假如重復(fù)模擬1000次,得到模擬結(jié)果的直方圖,當(dāng)H0為真時(shí),1000次VMR的均值將接近于1。直方圖中VMR的尾部值(VMR的抽樣分布),當(dāng)零假設(shè)為真時(shí)相對(duì)稀少。,②樣方分析的統(tǒng)計(jì)檢驗(yàn)-方差均值比的x2檢驗(yàn),如果觀測(cè)模式的VMR大于VMRH,則拒絕零假設(shè),相對(duì)于隨機(jī)模式而言觀測(cè)值更趨于均勻分布;如果觀測(cè)模式的V
13、MR小于VMRL,也拒絕零假設(shè),相對(duì)于隨機(jī)模式而言觀測(cè)值更趨于聚集分布。,當(dāng)H0為真時(shí)VMR的抽樣分布,如果觀測(cè)到VMR的極值(大于VMRH或小于VMRL),則拒絕沒有空間模式的零假設(shè)。在這種情況下,1)零假設(shè)實(shí)際上是真的,而我們拒絕了它,犯了第I類錯(cuò)誤(棄真);2)零假設(shè)不是真的,我們做了一個(gè)正確的決定。為了確定臨界值點(diǎn)(VMRH、VMRL ),首先必須確定所容許犯第I類錯(cuò)誤的概率。,如果α=0.05,那么1000次模擬當(dāng)中50個(gè)較大
14、的值用于獲取臨界值(50/1000=0.05)。如果把1000次模擬的VMR值從小到大依次排序,第25個(gè)值將作為VMRL ,當(dāng)H0為真時(shí)1000次中有25次低于VMRL ;相似地,第975個(gè)值將作為VMRH,當(dāng)H0為真時(shí)1000次中有25次高于VMRH 。這樣,當(dāng)采用該臨界值時(shí),1000次當(dāng)中有50次,或5%的幾率犯第I類錯(cuò)誤。,樣方分析:假設(shè)檢驗(yàn)示例,判斷下圖是否空間隨機(jī)(共100個(gè)點(diǎn),分布于10×10的樣方內(nèi)) ?,均值:
15、100/(10×10)=1含3個(gè)點(diǎn)的樣方:6個(gè)含2個(gè)點(diǎn)的樣方:20個(gè)含1個(gè)點(diǎn)的樣方:42個(gè)含0個(gè)點(diǎn)的樣方:32個(gè),方差為:{6(3-1)2+20(2-1)2+42(1-1)2+32(0-1)2} /(100-1)=0.77,VMR = 0.77/1 = 0.77<1,趨于均勻分布。如果H0為真,0.77是否小到可以拒絕原假設(shè)?,方法:隨機(jī)模擬,均值=1重復(fù)模擬1000次,建立VMR的抽樣分布,得到的結(jié)果從小到
16、大排序。第25個(gè)最小值VMRL =0.747,第975個(gè)值VMRH =1.313。由于VMRL <0.77< VMRH ,接受原假設(shè),即隨機(jī)情況下VMR=0.77不是特別不正常。上述方法即所謂的蒙特卡羅模擬(Monte Carlo Simulation)。優(yōu)點(diǎn):易于理解和實(shí)現(xiàn)缺點(diǎn):不同的人得到的模擬結(jié)果不同,e.g. 10個(gè)人可能得到 10個(gè)不同的臨界值。,蒙特卡羅模擬方法的基本思想,圓的外切正方形的邊長(zhǎng)。,,蒙
17、特卡羅模擬方法的基本思想,,,,,,,,,,,,,,蒙特卡羅模擬方法的基本思想,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,當(dāng)H0為真時(shí),有一個(gè)簡(jiǎn)單的方法可以避免采用前述的模擬方法。臨界值可用x2 =(m-1)VMR具有m-1個(gè)自由度的x2 分布表確定。當(dāng)自由度(df)比較大時(shí),
18、 x2 =(m-1)VMR趨于正態(tài)分布。特別地,當(dāng)H0為真、df > 30的情況下, (m-1)VMR具有均值為m-1、方差為2(m-1)的正態(tài)分布。這意味著,是均值為0、方差為1的標(biāo)準(zhǔn)正態(tài)分布。 在α=0.05的情況下,臨界值分別為zL=-1.96、zH=+1.96。如果zzH ,則拒絕原假設(shè)。上例中:,自由度小于30的情況100個(gè)點(diǎn),5×5樣方:VMR = 0.6875。x2=(25-1)×VMR=16.
19、5,由于自由度(df)小于30,需要應(yīng)用x2分布表。查找df=24、p=0.025和p=0.975,并進(jìn)行插值,得到上、下臨界值40.5、12。,因?yàn)?2<16.5< 40.5,所以接受零假設(shè)。點(diǎn)模式為空間隨機(jī)分布。,,,,基本思想:在研究區(qū)域內(nèi)的任一點(diǎn)都有一個(gè)密度,而不僅僅是在事件點(diǎn)上。該密度通過計(jì)數(shù)一定區(qū)域內(nèi)的事件點(diǎn)數(shù)量,或核(Kernel)進(jìn)行估計(jì)。核以估計(jì)點(diǎn)為中心,一定距離為半徑。,其中:C(p,r) 是以待估
20、點(diǎn)p為 圓心、r為半徑的圓。,帶寬:r如果 r太大/小,那么…… ?r 固定? r 變化?,③ 核密度估計(jì)(Kernel Density Estimation, KDE),邊界?,Kernel Windows,© Paul Bolstad, GIS Fundamentals,帶寬選擇是核密度估計(jì)中一個(gè)具有挑戰(zhàn)性的問題,可以采用不同的帶寬對(duì)同一問題進(jìn)行分析,探測(cè)模式的異質(zhì)性。,,Analysis,,密度估計(jì)(帶寬700Km
21、),密度估計(jì)(帶寬300Km),密度估計(jì)(帶寬500Km),Quartic Kernel Funktion,A,B,C,r = 500m,r = 1000m,r = 3000m,核密度估計(jì)(KDE)用途:可視化點(diǎn)模式進(jìn)行熱點(diǎn) (hot spot)探測(cè);離散?連續(xù)。 如,疾病與污染。,Spatial smoothing,,Cluster detection,,3.1 基于密度的方法:測(cè)度一階效應(yīng),3. 點(diǎn)數(shù)據(jù)分析,3.2 基于距
22、離的方法:測(cè)度二階效應(yīng),最近鄰距離:G 函數(shù)、F 函數(shù) 最近鄰距離的統(tǒng)計(jì)檢驗(yàn) K 函數(shù),樣方分析 樣方分析的統(tǒng)計(jì)檢驗(yàn) 核密度估計(jì),3.2 基于距離的方法:測(cè)度二階效應(yīng) ①最近鄰距離方法,計(jì)算每個(gè)點(diǎn)到其最近鄰點(diǎn)之間的距離, 然后計(jì)算所有點(diǎn)最近鄰距離的平均值。對(duì)每一個(gè)點(diǎn),根據(jù)其歐幾里德距離最小確定其最近鄰點(diǎn)。平均最近鄰距離的大小,反映點(diǎn)在空間的分布特征。最近鄰距離越小,說明點(diǎn)在空間分布越密集,反之,越離散。,3.2 基于距
23、離的方法 ①最近鄰距離方法:G函數(shù)(Event-Event),歐幾里德距離:,3.2 基于鄰距離的方法 ①最近鄰距離方法:G函數(shù)(Event-Event),與最近鄰距離只采用平均距離不同,G函數(shù)基于最近鄰距離的所有頻率分布。,如果是聚集分布, 的值是大是小?,2024/3/20,河南大學(xué)環(huán)境與規(guī)劃學(xué)院 zhaoy@henu.edu.cn,52,最近鄰距離的最小值是9.00,即點(diǎn)4&8和點(diǎn)8&4之間的距離,
24、有兩個(gè), 2/12=0.167,所以G(d)在距離等于9時(shí)的值為0.167。下一個(gè)最近鄰距離的最小值是15.64,即點(diǎn)2的最近鄰距離,有一個(gè),加上前面的兩個(gè)最近鄰距離(即9)共有3個(gè),3/12=0.25,所以G(d)在距離等于15.64時(shí)的值為0.25。依次累積下去,得到G函數(shù)。,如果點(diǎn)是聚集的,G(d)在短距離內(nèi)急速上升。如果點(diǎn)趨于均勻分布, G(d)在一定距離內(nèi)緩慢上升,在該距離內(nèi)包含大多數(shù)點(diǎn),之后G(d)快速上升。,3.2
25、基于距離的方法:測(cè)度二階效應(yīng) ①最近鄰距離方法:F函數(shù)(Point-Event),與G函數(shù)僅僅基于事件間最近鄰距離的頻率分布不同,F(xiàn)函數(shù)基于區(qū)域內(nèi)任意位置點(diǎn)與事件間最近鄰距離的頻率分布。,三個(gè)步驟:隨機(jī)選擇m個(gè)位置{p1, p2, …, pm};計(jì)算dmin(pi, s) :pi到點(diǎn)模式S中的任一事件的最小距離;計(jì)算:,如果事件是聚集的, F(d)先緩慢上升,而在遠(yuǎn)距離處急速上升,因?yàn)檠芯繀^(qū)的大部分地方?jīng)]有事件點(diǎn)。如果點(diǎn)趨于
26、均勻分布,F(xiàn)(d)先快速上升,而在遠(yuǎn)距離處上升緩慢。,G 函數(shù)與 F 函數(shù)的比較,G 函數(shù)與 F 函數(shù)的比較,3.2 最近鄰距離方法②最近鄰距離統(tǒng)計(jì)量的統(tǒng)計(jì)檢驗(yàn),Clark & Evans(1954)發(fā)展了一個(gè)最近鄰分析用于分析植物種類的空間分布。采用最近鄰距離的平均值與隨機(jī)模式下的期望值之比構(gòu)建一個(gè)所謂的最近鄰統(tǒng)計(jì)量:,其中, 為平均最近鄰距離, 為單位面積的點(diǎn)數(shù)。,R的取值從0(所有點(diǎn)聚集到一起)到理論最大值2.
27、14(正六邊形完全均勻)。 R=1表示隨機(jī)模式,即觀測(cè)值與隨機(jī)分布下的期望值相等。,方差:,Clark, P. J. , Evans F. C. Distance to Nearest Neighbor as a Measure of Spatial Relationships in Populations. Ecology, 1954, 35(4): 445-453.,最近鄰指數(shù)(NNI) :,R的取值從0(所有點(diǎn)聚集到一起)到理論最
28、大值2.14(正六邊形完全均勻)。 如果:R = 0, 所有的點(diǎn)集中于同一位置?聚集分布。如果:R = 1, 無分布模式?隨機(jī)分布。即觀測(cè)值與隨機(jī)分布下的期望值相等。如果:R >1, 每個(gè)點(diǎn)趨近于等間距?均勻分布。,60,60,61,61,Step 1: 計(jì)算每一個(gè)點(diǎn)到其最近鄰的距離(通過計(jì)算直角三角形的斜邊):,62,62,Step 2: 計(jì)算不同條件下的距離如果模式是隨機(jī)的,平均距離為?其中,密度
29、= n / 面積 = 6/88 = 0.068如果模式完全聚集 (所有點(diǎn)在同一個(gè)位置), 那么:如果模式完全分散,那么:,(Based on a Poisson distribution),63,63,Step 3: 計(jì)算標(biāo)準(zhǔn)最近鄰指數(shù) (NNI ):,= slightly more dispersed than random,,0,1,,,,2.14,完全聚集(Perfectly clustered),隨機(jī),完全分
30、散(Perfectly dispersed),More dispersedthan random,More clusteredthan random,,,空間隨機(jī)分布條件下,給定面積內(nèi)恰有n個(gè)點(diǎn)的概率可以用泊松分布描述:,Clark, P. J. , Evans F. C. Distance to Nearest Neighbor as a Measure of Spatial Relationships in Populatio
31、ns[J]. Ecology, 1954, 35(4): 445-453.,Clark, P. J. , Evans F. C. Distance to Nearest Neighbor as a Measure of Spatial Relationships in Populations[J]. Ecology, 1954, 35(4): 445-453.,假設(shè)給定面積是半徑為r的圓k等分的一部分,令 為分布的平均密度,那么
32、有:,表示任意給定面積 內(nèi),恰有n個(gè)點(diǎn)的概率;而 表示任意給定面積內(nèi)不包含任何事件點(diǎn)的概率(n=0)。,如果圓心任意選取,那么給定面積中距圓心為r的距離內(nèi)不包含點(diǎn)的概率也為 。作為r的一個(gè)函數(shù),它是到最近鄰的距離≥r的比例。相應(yīng)地, 是到最近鄰距離≤r的比例。,對(duì) 關(guān)于
33、r微分,得到 作為r的概率分布函數(shù)。 r的期望(均值),即Re,可以通過r乘以其概率分布函數(shù)并從0到無窮大積分得到。,若取圓為單位圓,即 ,則:,( ),( ),r的二階矩,E(r2),可以通過r2乘以其概率分布函數(shù),并從0到無窮大進(jìn)行積分得到。,若取圓為單位圓,即 ,
34、則:,( ),r的方差為:,若取圓為單位圓,即 ,則r的標(biāo)準(zhǔn)差為:,因此,r的標(biāo)準(zhǔn)差為:,( ),最近鄰距離統(tǒng)計(jì)量的構(gòu)建,根據(jù)上述均值和標(biāo)準(zhǔn)差,可以構(gòu)造出一個(gè)服從標(biāo)準(zhǔn)正態(tài)分布N(0,1)的統(tǒng)計(jì)量:,當(dāng)顯著性水平為 時(shí),Z的置信區(qū)間為 。如果 或 ,則觀測(cè)模式和完全空間
35、隨機(jī)(CSR)之間存在顯著的差異。若Z的符號(hào)為負(fù),則模式趨向于聚集;若Z的符號(hào)為正,則模式趨向于均勻分布。,,判斷下圖(7×6矩形)的空間分布模式,并進(jìn)行統(tǒng)計(jì)檢驗(yàn)。,例子:最近鄰統(tǒng)計(jì)量,Rogerson, P. A. Statistical Methods for Geography . Sage Publications Ltd, 2001. p.163,平均最近鄰距離: =(1+1+2+3+3+3+3)/6=2.
36、1676個(gè)點(diǎn)隨機(jī)分布在7×6的矩形內(nèi)的平均最近鄰距離的期望值為:,例子:最近鄰統(tǒng)計(jì)量,近鄰距離統(tǒng)計(jì)量為R=2.167/1.323=1.638,即觀測(cè)模式的平均最近鄰距離大于完全空間隨機(jī)(CSR)模式下的值,模式趨于均勻分布。檢驗(yàn)統(tǒng)計(jì)量:因此,在5%的顯著性水平上,拒絕空間隨機(jī)分布的零假設(shè)。,例子:最近鄰統(tǒng)計(jì)量,但我們忘記了對(duì)分析結(jié)果具有明顯影響的邊界效應(yīng)。可以用 Monte Carlo模擬方法,在x軸上(0,7)
37、和y軸上(0,6)區(qū)間內(nèi)隨機(jī)選取6個(gè)點(diǎn),并計(jì)算其最近鄰距離。模擬10000次,然后計(jì)算其平均最近鄰距離,比如為1.62,大于前述的Re=1.323。這主要是因?yàn)橄鄬?duì)于假想的區(qū)域外的點(diǎn)而言,區(qū)域內(nèi)靠近邊界上的點(diǎn)與區(qū)域內(nèi)其他點(diǎn)之間的距離較遠(yuǎn)。,例子:最近鄰統(tǒng)計(jì)量,對(duì)10000次模擬結(jié)果從小到大進(jìn)行排序,顯示第9500個(gè)值為2.29。平均最近鄰距離僅有5%的機(jī)會(huì)大于2.29,我們的觀測(cè)模式的平均最近鄰距離為2.167<2.29,因此,在
38、通過Monte Carlo模擬考慮邊界效應(yīng)后,接受空間分布模式為隨機(jī)的零假設(shè)。,3.2 基于距離的方法 ③K 函數(shù),Ripley(1976)提出。The K function (variously called ''Ripley's K-function'' and the ''reduced second moment function'') Ripley
39、’s K function can be used to summarize a point pattern, test hypotheses about the pattern, estimate parameters and fit models.,Ripley, B. D. The Second-Order Analysis of Stationary Point Processes. Journal of Applied Pro
40、bability, 1976, 13(2): 255-266.,Volume 3, pp.1796-1803 in Encyclopedia of Environmetrics,與G函數(shù)、F函數(shù)只使用事件或點(diǎn)的最近鄰距離不同,K函數(shù)基于事件間的所有距離。因此,K函數(shù)不僅能探測(cè)空間模式,而且可以給出空間模式和尺度的關(guān)系。,③K 函數(shù),定義:,K(d) 可以在許多不同的距離尺度上描述點(diǎn)過程的特征。Many ecological point
41、 patterns show a combination of effects, e.g. clustering at large scales and regularity at small scales. The combination can be seen as a characteristic pattern in a plot of the K function.,Volume 3, pp.1796-1803 in Ency
42、clopedia of Environmetrics,假設(shè):平穩(wěn)性(Stationary):統(tǒng)計(jì)特征獨(dú)立于絕對(duì)位置。特別地,均值和方差是不依賴于空間位置的常數(shù);協(xié)方差僅依賴于兩點(diǎn)之間的相對(duì)位置、距離和方向,而與空間上的絕對(duì)位置無關(guān)。各向同性( Isotropy):No directional detection,Ripley’s K 函數(shù),平穩(wěn),各向同性,Cov(Y(s1),Y(s2))=Cov(Y(s9),Y(s10)),Cov
43、(Y(s1),Y(s2)) ≠Cov(Y(s3),Y(s4)),Cov(Y(s1),Y(s2)) =Cov(Y(s3),Y(s4)),K 函數(shù),,,,,經(jīng)驗(yàn)K函數(shù)估計(jì)的四個(gè)步驟:對(duì)于每一個(gè)事件si ,以si為圓心、d 為半徑畫圓C(si,d)計(jì)算圓內(nèi)其他事件點(diǎn)的數(shù)量,3) 計(jì)算同一半徑下所有事件的均值,4) 均值除以研究區(qū)內(nèi)事件密度 得:,聚集?,均勻?,K 函數(shù),每個(gè)圓的面積為 , 為單位面積的
44、事件平均密度。因此, CSR下K(d)的期望值為:,K 函數(shù),當(dāng),平均點(diǎn)數(shù)高于CSR下的期望值,在尺度d上聚集。,平均點(diǎn)數(shù)低于CSR下的期望值,在尺度d上分散。,當(dāng),K 函數(shù) ? L函數(shù),由于K(d)基于平方距離進(jìn)行計(jì)算,對(duì)于大的d其結(jié)果會(huì)變得非常大,為此,可將K(d)的期望值轉(zhuǎn)換為零:,當(dāng)L(d)>0,在尺度d上聚集。當(dāng)L(d)<0,在尺度d上分散。,K函數(shù)的檢驗(yàn):Monte Carlo模擬假設(shè)在CSR條件下,對(duì)n個(gè)
45、事件進(jìn)行m次獨(dú)立的模擬,計(jì)算其經(jīng)驗(yàn)L函數(shù),并取其上、下界:,邊界校正:,K 函數(shù),邊界校正:1)Ripley校正(Ripley,1977),K 函數(shù),wi是圓C(si, d)位于研究區(qū)域內(nèi)的比例。2)建立警戒區(qū):位于警戒區(qū)內(nèi)的點(diǎn)在計(jì)算K(d)時(shí)采用,但不作為點(diǎn)模式的一部分。3)環(huán)形邊緣校正(Toroidal edge correction):假設(shè)研究區(qū)的上部和左部分別與下部和右部連接,好像研究區(qū)域是一個(gè)圓環(huán)(torus),僅用于矩
46、形研究區(qū)域。,Yamada, I. , Rogerson P. A. An Empirical Comparison of Edge Effect Correction Methods Applied to K-function Analysis[J]. Geographical Analysis, 2003, 35(2): 97-109.,例子:R package spatstatA point pattern giving the
47、 locations of 3605 trees in a tropical rain forest. Accompanied by covariate data giving the elevation (altitude) and slope of elevation in the study region.,K 函數(shù),> library(spatstat)> data(bei)> plot(bei),Barr
48、o Colorado Island熱帶雨林內(nèi)1000 × 500 m的矩形抽樣區(qū)域,> plot(Kest(bei)) #K function> plot(Lest(bei)) #L function,plot(Kest(bei,correction="none")) #無邊界校正,plot(Kest(bei,correction="Ripley")) #Ripley校
49、正,K 函數(shù)的Monte Carlo模擬,> plot(envelope(simdat, Kest, nsim=99)),空間點(diǎn)數(shù)據(jù)分析總結(jié),基于密度的方法: 樣方分析?統(tǒng)計(jì)分析核密度估計(jì)基于距離的方法: NND(G/F函數(shù))?統(tǒng)計(jì)分析K函數(shù):統(tǒng)計(jì)模擬檢驗(yàn)、邊界校正,2024/3/20,河南大學(xué)環(huán)境與規(guī)劃學(xué)院 zhaoy@henu.edu.cn,93,空間點(diǎn)數(shù)據(jù)分析學(xué)習(xí)資料,書籍: Bailey, T. an
50、d Gatrell, A. (1995) Interactive Spatial Data Analysis, Longman. pp.98-103. O’Sullivan D. and Unwin D.(2003) Geographic information Analysis, John Wiley & Sons. pp.77-114 Rogerson, P. A. Statistical Methods for
51、Geography . Sage Publications Ltd, 2001. pp.154-164 王遠(yuǎn)飛,何洪林. 編著 (2007) 空間數(shù)據(jù)分析方法, 科學(xué)出版社. pp.57-93.文章:Clark, P. J. , Evans F. C. Distance to Nearest Neighbor as a Measure of Spatial Relationships in Populations. Ecolog
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 空間建模與數(shù)據(jù)分析論文
- 62404.空間數(shù)據(jù)分析和空間數(shù)據(jù)共享系統(tǒng)實(shí)現(xiàn)
- 基于空間編目數(shù)據(jù)庫(kù)的數(shù)據(jù)分析和應(yīng)用.pdf
- 基于特征子空間的質(zhì)譜數(shù)據(jù)分析.pdf
- 1-地理空間數(shù)據(jù)分析與gis
- 大數(shù)據(jù)分析市場(chǎng)成倍增長(zhǎng) 深耕空間巨大
- 基于共享子空間學(xué)習(xí)的多視角數(shù)據(jù)分析.pdf
- 中國(guó)省級(jí)政府效率研究——基于空間面板數(shù)據(jù)分析.pdf
- 空間數(shù)據(jù)分析的神經(jīng)計(jì)算方法.pdf
- 中國(guó)省域能源消費(fèi)影響因素的空間面板數(shù)據(jù)分析.pdf
- 針刺神經(jīng)數(shù)據(jù)分析的狀態(tài)空間模型與傳導(dǎo)機(jī)制研究.pdf
- 【數(shù)據(jù)分析】店鋪經(jīng)營(yíng)數(shù)據(jù)分析表
- 大數(shù)據(jù)時(shí)代的空間分析
- 基于WEBGIS的空間數(shù)據(jù)分析及其可視化研究.pdf
- hr數(shù)據(jù)分析
- 成交數(shù)據(jù)分析
- 逆向數(shù)據(jù)分析
- 數(shù)據(jù)分析技術(shù)
- GMLGIS空間分析與空間數(shù)據(jù)編輯探索研究.pdf
- [學(xué)習(xí)]算法設(shè)計(jì)與分析-作業(yè)-第5-6章-v
評(píng)論
0/150
提交評(píng)論