計(jì)量地理學(xué)-2-地理數(shù)據(jù)基本統(tǒng)計(jì)指標(biāo)_第1頁(yè)
已閱讀1頁(yè),還剩56頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、計(jì)量地理學(xué),胡碧松hubisong624@126.com,地理數(shù)據(jù)統(tǒng)計(jì)指標(biāo),地理數(shù)據(jù)的統(tǒng)計(jì)分組,統(tǒng)計(jì)整理的基本步驟: ①統(tǒng)計(jì)分組,就是根據(jù)研究目的,按照一定的分組標(biāo)志將地理數(shù)據(jù)分成若干組。 ②計(jì)算各組數(shù)據(jù)的頻數(shù)、頻率,編制統(tǒng)計(jì)分組表。 ③繪制統(tǒng)計(jì)分布圖。,Why???,What???,What???,例: 對(duì)于黃土高原西部地區(qū)某山區(qū)縣的人工造林地調(diào)查數(shù)據(jù)進(jìn)行統(tǒng)計(jì)整理,步驟如下:

2、 (1)以地塊面積作為統(tǒng)計(jì)分組標(biāo)志進(jìn)行分組; (2)計(jì)算各組數(shù)據(jù)的頻數(shù)、頻率,編制成如下的統(tǒng)計(jì)分組表; (3)做出頻數(shù)分布的直方圖; (4)將上圖各組的頻數(shù)分布從組中值位置用折線連接起來(lái),得到頻數(shù)分布的散點(diǎn)曲線圖。,某縣人工造林地面積的統(tǒng)計(jì)分組數(shù)據(jù),,,,,,頻數(shù)分布柱狀圖,頻數(shù)分布曲線圖,地理數(shù)據(jù)統(tǒng)計(jì)圖,,,,讀某邊的數(shù)值:向該邊作與其零起點(diǎn)相交邊的平行線,該平行線與該邊的交點(diǎn)即為該邊所對(duì)應(yīng)的數(shù)

3、值。,,,,,,B,%,%,%,,AB兩國(guó)三大產(chǎn)業(yè)產(chǎn)值比重構(gòu)成示意圖,平面正三角坐標(biāo)圖,三維坐標(biāo)圖,,,,,,,,,,,,,,,,1,4,7,10,(月),,,,,,,,,,,,,,0,10,20,-10,50,100,降水量(mm),氣溫(℃),,,雷達(dá)圖,風(fēng)玫瑰圖,人口金字塔圖,,,,(1)描述地理數(shù)據(jù)一般水平的指標(biāo),(2)描述地理數(shù)據(jù)分布的離散程度的指標(biāo),(3)描述地理數(shù)據(jù)分布特征的參數(shù),1,2,3,幾種常用的統(tǒng)計(jì)指標(biāo)與參數(shù),平均

4、值,一般水平指標(biāo),中位數(shù),眾數(shù),,,,描述地理數(shù)據(jù)一般平均水平,,=54.25,,,,xi: 第i組的組中值,fi: 第i組的頻數(shù),m: 分組總數(shù)量,中國(guó)西部地區(qū)某城市2000年家庭月收入的抽樣調(diào)查結(jié)果,,,,= 300×2500+1300×3500+…+30×8500 2130 =3899.06(元),對(duì)于未分組的地理數(shù)據(jù): 樣本數(shù)n為奇數(shù)時(shí),中位數(shù)是位置排在第(n+1)/2位的數(shù)據(jù);

5、 樣本數(shù)n為偶數(shù)時(shí),中位數(shù)是排在中間位置的兩個(gè)數(shù)據(jù)的平均值。,,Me =61,升序排序,,Me =52.5,對(duì)于分組的地理數(shù)據(jù),中位數(shù)的計(jì)算方法: 1) 確定中位數(shù)所在的組位置:——中位數(shù)應(yīng)該在向上累計(jì)頻數(shù)包括∑fi/2的組中。 2) 按下述公式計(jì)算中位數(shù):,或,Me 代表中位數(shù);L 為中位數(shù)所在組的下限值;U 為中位數(shù)所在組的上限值;fm 為中位數(shù)所在組的頻數(shù);Sm-1 為中位數(shù)所在組以下的

6、累計(jì)頻數(shù);Sm+1 為中位數(shù)所在組以上的累計(jì)頻數(shù);d 為中位數(shù)所在組的組距。,第1組,第n組,fm,f1,fn,∑fi/2,∑fm-1,∑fm,L,U,d=U-L,,,?,,,,∑fi/2=2130/2=1065,,300≤∑fi/2=1065≤1600,∴Me位于分組[3000,4000],L = 3000 U = 4000 d = L-U = 1000,fm = 1300,,,,Sm-1 = 300,=300

7、0+ 1065?300 1300 ×1000=3588.46,眾數(shù)即出現(xiàn)次數(shù)最多的那個(gè)數(shù)值。 對(duì)于未分組的地理數(shù)據(jù),可以根據(jù)每一個(gè)數(shù)值出現(xiàn)的頻數(shù)大小取最大值可直接確定眾數(shù)。,,,M0 =50,對(duì)于已經(jīng)分組的地理數(shù)據(jù),中位數(shù)的計(jì)算步驟如下: 1) 確定頻數(shù)最多的組為眾數(shù)所在組; 2) 按以下公式計(jì)算眾數(shù):,或,?1為眾數(shù)組頻數(shù)與上一組頻數(shù)之差;?2為眾數(shù)組頻數(shù)與下一組頻數(shù)之差。,,∴M0位

8、于分組[3000,4000],?1=1300-300=1000?2=1300-200=1100,=3000+ 1000 1000+1100 ×1000=3476.19,或,=4000? 1100 1000+1100 ×1000=3476.19,,極差,離差,離差平方和,方差,標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)差無(wú)偏估計(jì),變異系數(shù),描述地理數(shù)據(jù)分布離散程度的指標(biāo),,,,,,,,,,所有數(shù)據(jù)中最大值與最小值之差,每一個(gè)地理數(shù)據(jù)與平均值的差值

9、,從總體上衡量一組地理數(shù)據(jù)與平均值的離散程度的指標(biāo),從平均概況衡量一組地理數(shù)據(jù)與平均值的離散程度的指標(biāo),極差,離差,離差平方和,方差,,,,標(biāo)準(zhǔn)差為方差的平方根,,,以樣本方差對(duì)標(biāo)準(zhǔn)差進(jìn)行無(wú)偏估計(jì),,,變異系數(shù)表示地理數(shù)據(jù)的相對(duì)變化(波動(dòng))程度,標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)差無(wú)偏估計(jì),變異系數(shù),𝑑 𝑖,𝑑 2 = 𝑖=1 𝑛 𝑑 𝑖 2

10、,𝜎 2 = 𝑑 2 𝑛,𝜎= 𝜎 2,𝑆= 𝑑 2 𝑛?1,𝐶 𝑣 = 𝑆 𝑥 ×100%,離差,離差平方和,方差,標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)差無(wú)偏估計(jì),變異系數(shù),例:,,離差平方和,離差,極差,,,方差,標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)差無(wú)偏

11、估計(jì),𝜎 2 = 𝑑 2 𝑛 = 5666.25 12 =472.19,𝜎= 𝜎 2 = 472.19 =21.73,𝑆= 𝑑 2 𝑛?1 = 5666.25 12?1 =21.7299,變異系數(shù),𝐶 𝑣 = 𝑆 𝑥

12、 ×100%= 21.7299 54.25 ×100%=41.84%,,,,,,,,,,,,g1,g2,偏度系數(shù),峰度系數(shù),描述地理數(shù)據(jù)分布特征的參數(shù),偏度系數(shù),測(cè)度地理數(shù)據(jù)分布的不對(duì)稱性情況,刻畫以平均值為中心的偏向情況,計(jì)算公式為,g10,表示正偏,即均值在峰值的右邊;g1=0,表示對(duì)稱分布,峰度系數(shù),測(cè)度了地理數(shù)據(jù)在均值附近的集中程度,其計(jì)算公式為,g2=0,表示地理數(shù)據(jù)分布的集中程度是標(biāo)準(zhǔn)正態(tài)分布;g2&g

13、t;0,表示地理數(shù)據(jù)分布的集中程度高于正態(tài)分布;g2<0,表示地理數(shù)據(jù)分布的集中程度低于正態(tài)分布,𝜎=21.73,𝑥 =54.25,偏度系數(shù),峰度系數(shù),=?0.3086,=?0.6796,負(fù)偏,平均值在峰值的左邊,數(shù)據(jù)分布集中程度低于正態(tài)分布,應(yīng)用實(shí)例:中國(guó)大陸省份人均GDP的變異系數(shù),我們知道變異系數(shù)測(cè)度的是地理數(shù)據(jù)分布的相對(duì)差異。 為了分析中國(guó)大陸經(jīng)濟(jì)發(fā)展的省際差異及其演化過(guò)程,我

14、們首先把1978-2002年各省(直轄市、自治區(qū))的GDP數(shù),按照可比價(jià)格進(jìn)行折算,再除以人口數(shù),計(jì)算出按照可比價(jià)衡量的人均GDP數(shù)據(jù),然后再用變異系數(shù)公式,計(jì)算1978-2002每一年對(duì)應(yīng)的變異系數(shù),將計(jì)算結(jié)果繪制成散點(diǎn)折線圖:,這說(shuō)明,在1978-1990年期間,中國(guó)大陸經(jīng)濟(jì)發(fā)展的省際差異,基本上呈縮小趨勢(shì),而1990-2002年期間則基本上呈擴(kuò)大趨勢(shì)。這一變化與國(guó)家宏觀經(jīng)濟(jì)政策變動(dòng)的時(shí)間、趨勢(shì)大體一致。,,在1978-2002年期

15、間,人均GDP的變異系數(shù),以1990年為轉(zhuǎn)折點(diǎn),呈現(xiàn)出一個(gè)U形曲線。即:人均GDP的變異系數(shù),在1978-1990年期間基本上呈現(xiàn)下降趨勢(shì),而在1990-2002年期間則基本上呈現(xiàn)上升趨勢(shì)。,,地理數(shù)據(jù)分布的集中化與均衡度指數(shù),洛倫茲曲線,20世紀(jì)初,意大利統(tǒng)計(jì)學(xué)家洛倫茲(M. Lorenz),首先使用累計(jì)頻率曲線研究工業(yè)化的集中化程度。后來(lái),這種曲線就被稱之為洛倫茲曲線。,(1)將各部門的收入及其占總收入比重(百分比),從大到小重新排

16、序;(2)從大到小,逐次計(jì)算累計(jì)百分比;(3)以自然序號(hào)為橫坐標(biāo)(x),累計(jì)百分比為縱坐標(biāo)(y);以(部門代碼,累計(jì)百分比)為坐標(biāo)點(diǎn),連成一個(gè)上凸的曲線,即洛倫茲曲線。,標(biāo)準(zhǔn)洛倫茲曲線繪制步驟,某地區(qū)農(nóng)戶家庭經(jīng)營(yíng)性純收入水平及其構(gòu)成,,,,(1)將表中2004年各產(chǎn)業(yè)部門的收入及其占總收入比重(百分比),從大到小重新降序排序;,,(2)從大到小,逐次計(jì)算收入比重的累計(jì)百分比;,計(jì)算累計(jì)百分比,,(3)以自然序號(hào)為橫坐標(biāo)(x),累計(jì)百

17、分比為縱坐標(biāo)(y);以(部門代碼,累計(jì)百分比)為坐標(biāo)點(diǎn),連成一個(gè)上凸的曲線,即洛倫茲曲線。,統(tǒng)計(jì)自然序號(hào),,,,,洛倫茲曲線什么情況下是這條橫軸平行線?,,洛倫茲曲線什么情況下是這條對(duì)角線?,1999年農(nóng)戶家庭經(jīng)營(yíng)性純收入構(gòu)成的洛倫茲曲線,2004年農(nóng)戶家庭經(jīng)營(yíng)性純收入構(gòu)成的洛倫茲曲線,洛倫茲曲線的上凸程度,表示農(nóng)戶家庭經(jīng)營(yíng)性純收入的部門集中化程度。上凸程度越大,就表示農(nóng)戶家庭經(jīng)營(yíng)性純收入越是集中于某些產(chǎn)業(yè)部門。,哪一年的農(nóng)戶家庭

18、經(jīng)營(yíng)性純收入部門集中化程度較高?1999or2004?,集中化指數(shù),集中化指數(shù)是一個(gè)描述地理數(shù)據(jù)分布的集中化程度的指數(shù)。,假若洛倫茲曲線的解析式為: 顯然,該曲線下方區(qū)域的面積為:,當(dāng)數(shù)據(jù)均勻分布時(shí),A就變成了對(duì)角線以下三角形的面積(R);當(dāng)數(shù)據(jù)集中分布時(shí),A就變成了整個(gè)矩形的面積(M)。,A——實(shí)際洛倫茲曲線與橫軸圍成的圖形面積; R——均勻分布時(shí)洛倫茲曲線與橫軸圍成的圖形面積; M——集中分布時(shí)洛倫茲曲線與橫軸圍成的圖形面積

19、。,,R,M,A,,顯然:集中化指數(shù)在[0, 1]區(qū)間上取值。I越大,就說(shuō)明數(shù)據(jù)分布的集中化程度越高;I越小,就說(shuō)明數(shù)據(jù)分布的集中化程度越低(越均衡)。,集中化指數(shù),常采用如下近似取值方法: A——實(shí)際數(shù)據(jù)的累計(jì)百分比總和; R——均勻分布時(shí)的累計(jì)百分比總和; M——集中分布時(shí)的累計(jì)百分比總和。 集中化指數(shù)在[0,1]區(qū)間上取值。

20、 只有數(shù)據(jù)的個(gè)數(shù)相同而且橫坐標(biāo)劃分一致時(shí),才有可比性。,直接計(jì)算定積分較為麻煩,,A=∑累計(jì)百分比=7.5939,M=∑累計(jì)百分比=10,,,R=∑累計(jì)百分比=5.5,=(7.5939-5.5)/(10-5.5)=0.4653,基尼系數(shù)就是通過(guò)人口和收入兩組數(shù)據(jù)的對(duì)比分析,縱、橫坐標(biāo)均以累計(jì)百分比表示,從而做出羅倫次曲線,然后再計(jì)算得出的集中化指數(shù)。 它是通過(guò)對(duì)人口和收入兩組數(shù)據(jù)進(jìn)行比較分析,然后將縱、橫坐標(biāo)均以累計(jì)百分比

21、表示,作出羅倫次曲線,再計(jì)算集中化指數(shù)而得到的一個(gè)判斷收入分配不平等程度的指標(biāo)。,基尼系數(shù),(Gini coefficient),與標(biāo)準(zhǔn)洛倫茲曲線有什么不同?,基尼系數(shù)洛倫茲曲線繪制原理方法:,(1)列出每一個(gè)區(qū)域(部門)的人口與收入占全區(qū)(各部門總計(jì))的比重p與w;,,,p,w,(2)計(jì)算每一區(qū)域(部門)的比率w/p;,w/p,,基尼系數(shù)洛倫茲曲線繪制原理方法:,(3)根據(jù)w/p值,由小到大將每一地區(qū)(部門)排序;,,,由小到大升序

22、排序,w和p累積值,(4)按照上述順序分別計(jì)算p和w的累計(jì)值X和Y;,,,X,Y,(5)以X為橫坐標(biāo),以Y為縱坐標(biāo),在直角坐標(biāo)系中依次連接各點(diǎn),得到一條下凸的羅倫次曲線。,X,Y,Y1,Y2,Why?,,繪制散點(diǎn)曲線圖即得洛倫茲曲線,基尼系數(shù)洛倫茲曲線繪制原理方法:,,基尼系數(shù)洛倫茲曲線,為什么是下凸曲線?,怎么計(jì)算該洛倫茲曲線的集中化指數(shù),A——實(shí)際洛倫茲曲線與橫軸圍成的圖形面積; R——均勻分布時(shí)洛倫茲曲線與橫軸圍成的圖形面積;

23、 M——集中分布時(shí)洛倫茲曲線與橫軸圍成的圖形面積。,此時(shí),M=0,R=1/2。,Why?,Why?,基尼系數(shù)G就可按照如下公式計(jì)算:,𝐼= 𝑅?𝐴 𝑅?𝑀,如果用冪函數(shù)擬合,則基尼系數(shù)的近似計(jì)算公式為,式中: 可以通過(guò)最小二乘法擬合,即,近似計(jì)算基尼系數(shù),Xi為排序后的人口累計(jì)百分比Yi為排序后的收入累計(jì)百分比,X,Y,,,∑lnXi*lnYi=11.20

24、,∑(lnxi)^2=9.11,=11.20/9.11=1.23,=(1.23-1)/(1+1.23)=0.1025,基尼系數(shù),錫爾系數(shù),(Theil coefficient),錫爾系數(shù)(Theil coefficient)又稱錫爾熵,有兩個(gè)錫爾系數(shù)指標(biāo),即錫爾系數(shù)T 和錫爾系數(shù)L。 兩者的不同之處在于錫爾系數(shù)T 以收入比重加權(quán)計(jì)算,而錫爾系數(shù)L則以人口比重加權(quán)計(jì)算。,如果以人口比重加權(quán),錫爾系數(shù) L 的計(jì)算公式為:,式中:n

25、: 區(qū)域(部門)個(gè)數(shù); yi: i地區(qū)(部門)收入占全區(qū)(各部門總計(jì))的份額; pi: i地區(qū)(部門)的人口占全區(qū)(各部門總計(jì))的份額。,如果以收入比重加權(quán),則錫爾系數(shù) T 的計(jì)算公式為,錫爾系數(shù)越大,就表示收入分配差異越大;反之,錫爾系數(shù)越小,就表示收入分配越均衡。,式中:n: 區(qū)域(部門)個(gè)數(shù); yi: i地區(qū)(部門)收入占全區(qū)(各部門總計(jì))的份額; pi: i地區(qū)(部門)的人口占全區(qū)(各部門總計(jì))的份額。,p,w,,=∑

26、pi*log(pi/yi)=0.0103,=∑yi*log(yi/pi)=0.0099,,錫爾系數(shù),錫爾系數(shù),根據(jù)中國(guó)大陸1978-2002年各?。ㄖ陛犑?、自治區(qū))的人口數(shù)和按照可比價(jià)格折算的GDP數(shù)據(jù),計(jì)算基尼系數(shù),結(jié)果如圖??梢钥闯觯?978-1990年期間,基尼系數(shù)雖然出現(xiàn)過(guò)幾次上升和下降的微小波動(dòng),但基本趨勢(shì)是緩慢地下降的;而在1991-2002年期間,基本上呈現(xiàn)上升趨勢(shì)。這一結(jié)論,與上節(jié)計(jì)算的變異系數(shù)結(jié)果是相互印證的。,19

27、78—2002年中國(guó)大陸省際收入差異的基尼系數(shù),應(yīng)用實(shí)例:中國(guó)大陸省份收入差異的基尼系數(shù),,根據(jù)各?。ㄖ陛犑小⒆灾螀^(qū))的人口和按照可比價(jià)格折算的GDP數(shù)據(jù),計(jì)算1978-2002年中國(guó)大陸省際差異的錫爾系數(shù)T 值,結(jié)果如圖所示??梢钥闯?,在1978-1990年期間,錫爾系數(shù)雖然有微小波動(dòng),但基本上呈下降趨勢(shì);而在1991-2002年期間,基本上呈現(xiàn)出上升趨勢(shì)。這一結(jié)論,與前面計(jì)算出的基尼系數(shù)也是相互印證的。,1978-2002年中國(guó)大陸

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論