計量地理學(xué)-2-地理數(shù)據(jù)基本統(tǒng)計指標(biāo)

上傳人：奔*** IP屬地：河北更新時間：2024-01-06 格式：ppt 頁數(shù)：57 大?。?.50MB 人氣指數(shù)：12 舉報 版權(quán)申訴

計量地理學(xué)-2-地理數(shù)據(jù)基本統(tǒng)計指標(biāo)_第1頁

已閱讀1頁，還剩56頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、計量地理學(xué),胡碧松hubisong624@126.com,地理數(shù)據(jù)統(tǒng)計指標(biāo),地理數(shù)據(jù)的統(tǒng)計分組,統(tǒng)計整理的基本步驟: ①統(tǒng)計分組，就是根據(jù)研究目的，按照一定的分組標(biāo)志將地理數(shù)據(jù)分成若干組。 ②計算各組數(shù)據(jù)的頻數(shù)、頻率，編制統(tǒng)計分組表。 ③繪制統(tǒng)計分布圖。,Why???,What???,What???,例: 對于黃土高原西部地區(qū)某山區(qū)縣的人工造林地調(diào)查數(shù)據(jù)進行統(tǒng)計整理,步驟如下:

2、 (1)以地塊面積作為統(tǒng)計分組標(biāo)志進行分組； (2)計算各組數(shù)據(jù)的頻數(shù)、頻率，編制成如下的統(tǒng)計分組表； (3)做出頻數(shù)分布的直方圖； (4)將上圖各組的頻數(shù)分布從組中值位置用折線連接起來，得到頻數(shù)分布的散點曲線圖。,某縣人工造林地面積的統(tǒng)計分組數(shù)據(jù),,,,,,頻數(shù)分布柱狀圖,頻數(shù)分布曲線圖,地理數(shù)據(jù)統(tǒng)計圖,,,,讀某邊的數(shù)值：向該邊作與其零起點相交邊的平行線，該平行線與該邊的交點即為該邊所對應(yīng)的數(shù)

3、值。,,,,,,B,%,%,%,,ＡＢ兩國三大產(chǎn)業(yè)產(chǎn)值比重構(gòu)成示意圖,平面正三角坐標(biāo)圖,三維坐標(biāo)圖,,,,,,,,,,,,,,,,1,4,7,10,(月),,,,,,,,,,,,,,0,10,20,－10,50,100,降水量(mm),氣溫(℃),,,雷達(dá)圖,風(fēng)玫瑰圖,人口金字塔圖,,,,(1)描述地理數(shù)據(jù)一般水平的指標(biāo),(2)描述地理數(shù)據(jù)分布的離散程度的指標(biāo),(3)描述地理數(shù)據(jù)分布特征的參數(shù),1,2,3,幾種常用的統(tǒng)計指標(biāo)與參數(shù),平均

4、值,一般水平指標(biāo),中位數(shù),眾數(shù),,,,描述地理數(shù)據(jù)一般平均水平,,=54.25,,,,xi: 第i組的組中值,fi: 第i組的頻數(shù),m: 分組總數(shù)量,中國西部地區(qū)某城市2000年家庭月收入的抽樣調(diào)查結(jié)果,,,,= 300×2500+1300×3500+…+30×8500 2130 =3899.06(元),對于未分組的地理數(shù)據(jù)：樣本數(shù)n為奇數(shù)時，中位數(shù)是位置排在第(n+1)/2位的數(shù)據(jù)；

5、樣本數(shù)n為偶數(shù)時，中位數(shù)是排在中間位置的兩個數(shù)據(jù)的平均值。,,Me =61,升序排序,,Me =52.5,對于分組的地理數(shù)據(jù)，中位數(shù)的計算方法: 1) 確定中位數(shù)所在的組位置:——中位數(shù)應(yīng)該在向上累計頻數(shù)包括∑fi/2的組中。 2) 按下述公式計算中位數(shù):,或,Me 代表中位數(shù)；L 為中位數(shù)所在組的下限值；U 為中位數(shù)所在組的上限值；fm 為中位數(shù)所在組的頻數(shù)；Sm-1 為中位數(shù)所在組以下的

6、累計頻數(shù)；Sm+1 為中位數(shù)所在組以上的累計頻數(shù)；d 為中位數(shù)所在組的組距。,第1組,第n組,fm,f1,fn,∑fi/2,∑fm-1,∑fm,L,U,d=U-L,,,?,,,,∑fi/2=2130/2=1065,,300≤∑fi/2=1065≤1600,∴Me位于分組[3000,4000],L = 3000 U = 4000 d = L-U = 1000,fm = 1300,,,,Sm-1 = 300,=300

7、0+ 1065?300 1300 ×1000=3588.46,眾數(shù)即出現(xiàn)次數(shù)最多的那個數(shù)值。對于未分組的地理數(shù)據(jù)，可以根據(jù)每一個數(shù)值出現(xiàn)的頻數(shù)大小取最大值可直接確定眾數(shù)。,,,M0 =50,對于已經(jīng)分組的地理數(shù)據(jù)，中位數(shù)的計算步驟如下： 1) 確定頻數(shù)最多的組為眾數(shù)所在組； 2) 按以下公式計算眾數(shù):,或,?1為眾數(shù)組頻數(shù)與上一組頻數(shù)之差；?2為眾數(shù)組頻數(shù)與下一組頻數(shù)之差。,,∴M0位

8、于分組[3000,4000],?1=1300-300=1000?2=1300-200=1100,=3000+ 1000 1000+1100 ×1000=3476.19,或,=4000? 1100 1000+1100 ×1000=3476.19,,極差,離差,離差平方和,方差,標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)差無偏估計,變異系數(shù),描述地理數(shù)據(jù)分布離散程度的指標(biāo),,,,,,,,,,所有數(shù)據(jù)中最大值與最小值之差,每一個地理數(shù)據(jù)與平均值的差值

9、,從總體上衡量一組地理數(shù)據(jù)與平均值的離散程度的指標(biāo),從平均概況衡量一組地理數(shù)據(jù)與平均值的離散程度的指標(biāo),極差,離差,離差平方和,方差,,,,標(biāo)準(zhǔn)差為方差的平方根,,,以樣本方差對標(biāo)準(zhǔn)差進行無偏估計,,,變異系數(shù)表示地理數(shù)據(jù)的相對變化（波動）程度,標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)差無偏估計,變異系數(shù),𝑑 𝑖,𝑑 2 = 𝑖=1 𝑛 𝑑 𝑖 2

10、,𝜎 2 = 𝑑 2 𝑛,𝜎= 𝜎 2,𝑆= 𝑑 2 𝑛?1,𝐶 𝑣 = 𝑆 𝑥 ×100%,離差,離差平方和,方差,標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)差無偏估計,變異系數(shù),例：,,離差平方和,離差,極差,,,方差,標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)差無偏

11、估計,𝜎 2 = 𝑑 2 𝑛 = 5666.25 12 =472.19,𝜎= 𝜎 2 = 472.19 =21.73,𝑆= 𝑑 2 𝑛?1 = 5666.25 12?1 =21.7299,變異系數(shù),𝐶 𝑣 = 𝑆 𝑥

12、 ×100%= 21.7299 54.25 ×100%=41.84%,,,,,,,,,,,,g1,g2,偏度系數(shù),峰度系數(shù),描述地理數(shù)據(jù)分布特征的參數(shù),偏度系數(shù),測度地理數(shù)據(jù)分布的不對稱性情況，刻畫以平均值為中心的偏向情況，計算公式為,g10，表示正偏，即均值在峰值的右邊；g1=0，表示對稱分布,峰度系數(shù),測度了地理數(shù)據(jù)在均值附近的集中程度，其計算公式為,g2=0，表示地理數(shù)據(jù)分布的集中程度是標(biāo)準(zhǔn)正態(tài)分布；g2&g

13、t;0，表示地理數(shù)據(jù)分布的集中程度高于正態(tài)分布；g2<0，表示地理數(shù)據(jù)分布的集中程度低于正態(tài)分布,𝜎=21.73,𝑥 =54.25,偏度系數(shù),峰度系數(shù),=?0.3086,=?0.6796,負(fù)偏，平均值在峰值的左邊,數(shù)據(jù)分布集中程度低于正態(tài)分布,應(yīng)用實例：中國大陸省份人均GDP的變異系數(shù),我們知道變異系數(shù)測度的是地理數(shù)據(jù)分布的相對差異。為了分析中國大陸經(jīng)濟發(fā)展的省際差異及其演化過程，我

14、們首先把1978－2002年各?。ㄖ陛犑?、自治區(qū)）的GDP數(shù)，按照可比價格進行折算，再除以人口數(shù)，計算出按照可比價衡量的人均GDP數(shù)據(jù)，然后再用變異系數(shù)公式，計算1978－2002每一年對應(yīng)的變異系數(shù)，將計算結(jié)果繪制成散點折線圖：,這說明，在1978-1990年期間，中國大陸經(jīng)濟發(fā)展的省際差異，基本上呈縮小趨勢，而1990-2002年期間則基本上呈擴大趨勢。這一變化與國家宏觀經(jīng)濟政策變動的時間、趨勢大體一致。,,在1978-2002年期

15、間，人均GDP的變異系數(shù)，以1990年為轉(zhuǎn)折點，呈現(xiàn)出一個U形曲線。即：人均GDP的變異系數(shù)，在1978-1990年期間基本上呈現(xiàn)下降趨勢，而在1990-2002年期間則基本上呈現(xiàn)上升趨勢。,,地理數(shù)據(jù)分布的集中化與均衡度指數(shù),洛倫茲曲線,20世紀(jì)初，意大利統(tǒng)計學(xué)家洛倫茲（M. Lorenz），首先使用累計頻率曲線研究工業(yè)化的集中化程度。后來，這種曲線就被稱之為洛倫茲曲線。,（1）將各部門的收入及其占總收入比重（百分比），從大到小重新排

16、序；（2）從大到小，逐次計算累計百分比；（3）以自然序號為橫坐標(biāo)(x)，累計百分比為縱坐標(biāo)(y)；以（部門代碼，累計百分比）為坐標(biāo)點，連成一個上凸的曲線，即洛倫茲曲線。,標(biāo)準(zhǔn)洛倫茲曲線繪制步驟,某地區(qū)農(nóng)戶家庭經(jīng)營性純收入水平及其構(gòu)成,,,,（1）將表中2004年各產(chǎn)業(yè)部門的收入及其占總收入比重（百分比），從大到小重新降序排序；,,（2）從大到小，逐次計算收入比重的累計百分比；,計算累計百分比,,（3）以自然序號為橫坐標(biāo)(x)，累計百

17、分比為縱坐標(biāo)(y)；以（部門代碼，累計百分比）為坐標(biāo)點，連成一個上凸的曲線，即洛倫茲曲線。,統(tǒng)計自然序號,,,,,洛倫茲曲線什么情況下是這條橫軸平行線？,,洛倫茲曲線什么情況下是這條對角線？,1999年農(nóng)戶家庭經(jīng)營性純收入構(gòu)成的洛倫茲曲線,2004年農(nóng)戶家庭經(jīng)營性純收入構(gòu)成的洛倫茲曲線,洛倫茲曲線的上凸程度，表示農(nóng)戶家庭經(jīng)營性純收入的部門集中化程度。上凸程度越大，就表示農(nóng)戶家庭經(jīng)營性純收入越是集中于某些產(chǎn)業(yè)部門。,哪一年的農(nóng)戶家庭

18、經(jīng)營性純收入部門集中化程度較高？1999or2004？,集中化指數(shù),集中化指數(shù)是一個描述地理數(shù)據(jù)分布的集中化程度的指數(shù)。,假若洛倫茲曲線的解析式為：顯然，該曲線下方區(qū)域的面積為：,當(dāng)數(shù)據(jù)均勻分布時，A就變成了對角線以下三角形的面積（R）；當(dāng)數(shù)據(jù)集中分布時，A就變成了整個矩形的面積（M）。,A——實際洛倫茲曲線與橫軸圍成的圖形面積； R——均勻分布時洛倫茲曲線與橫軸圍成的圖形面積； M——集中分布時洛倫茲曲線與橫軸圍成的圖形面積

19、。,,R,M,A,,顯然：集中化指數(shù)在[0, 1]區(qū)間上取值。I越大，就說明數(shù)據(jù)分布的集中化程度越高；I越小，就說明數(shù)據(jù)分布的集中化程度越低（越均衡）。,集中化指數(shù),常采用如下近似取值方法： A——實際數(shù)據(jù)的累計百分比總和； R——均勻分布時的累計百分比總和； M——集中分布時的累計百分比總和。集中化指數(shù)在[0，1]區(qū)間上取值。

20、只有數(shù)據(jù)的個數(shù)相同而且橫坐標(biāo)劃分一致時，才有可比性。,直接計算定積分較為麻煩,,A=∑累計百分比=7.5939,M=∑累計百分比=10,,,R=∑累計百分比=5.5,=(7.5939-5.5)/(10-5.5)=0.4653,基尼系數(shù)就是通過人口和收入兩組數(shù)據(jù)的對比分析，縱、橫坐標(biāo)均以累計百分比表示，從而做出羅倫次曲線，然后再計算得出的集中化指數(shù)。它是通過對人口和收入兩組數(shù)據(jù)進行比較分析，然后將縱、橫坐標(biāo)均以累計百分比

21、表示，作出羅倫次曲線，再計算集中化指數(shù)而得到的一個判斷收入分配不平等程度的指標(biāo)。,基尼系數(shù),（Gini coefficient）,與標(biāo)準(zhǔn)洛倫茲曲線有什么不同？,基尼系數(shù)洛倫茲曲線繪制原理方法：,(1)列出每一個區(qū)域（部門）的人口與收入占全區(qū)（各部門總計）的比重p與w；,,,p,w,(2)計算每一區(qū)域（部門）的比率w/p；,w/p,,基尼系數(shù)洛倫茲曲線繪制原理方法：,(3)根據(jù)w/p值，由小到大將每一地區(qū)（部門）排序；,,,由小到大升序

22、排序,w和p累積值,(4)按照上述順序分別計算p和w的累計值X和Y；,,,X,Y,(5)以X為橫坐標(biāo)，以Y為縱坐標(biāo)，在直角坐標(biāo)系中依次連接各點，得到一條下凸的羅倫次曲線。,X,Y,Y1,Y2,Why?,,繪制散點曲線圖即得洛倫茲曲線,基尼系數(shù)洛倫茲曲線繪制原理方法：,,基尼系數(shù)洛倫茲曲線,為什么是下凸曲線？,怎么計算該洛倫茲曲線的集中化指數(shù),A——實際洛倫茲曲線與橫軸圍成的圖形面積； R——均勻分布時洛倫茲曲線與橫軸圍成的圖形面積；

23、 M——集中分布時洛倫茲曲線與橫軸圍成的圖形面積。,此時，M=0，R=1/2。,Why?,Why?,基尼系數(shù)G就可按照如下公式計算：,𝐼= 𝑅?𝐴 𝑅?𝑀,如果用冪函數(shù)擬合，則基尼系數(shù)的近似計算公式為,式中：可以通過最小二乘法擬合，即,近似計算基尼系數(shù),Xi為排序后的人口累計百分比Yi為排序后的收入累計百分比,X,Y,,,∑lnXi*lnYi=11.20

24、,∑(lnxi)^2=9.11,=11.20/9.11=1.23,=(1.23-1)/(1+1.23)=0.1025,基尼系數(shù),錫爾系數(shù),（Theil coefficient）,錫爾系數(shù)（Theil coefficient）又稱錫爾熵，有兩個錫爾系數(shù)指標(biāo)，即錫爾系數(shù)T 和錫爾系數(shù)L。兩者的不同之處在于錫爾系數(shù)T 以收入比重加權(quán)計算，而錫爾系數(shù)L則以人口比重加權(quán)計算。,如果以人口比重加權(quán)，錫爾系數(shù) L 的計算公式為:,式中：n

25、: 區(qū)域（部門）個數(shù)； yi: i地區(qū)（部門）收入占全區(qū)（各部門總計）的份額； pi: i地區(qū)（部門）的人口占全區(qū)（各部門總計）的份額。,如果以收入比重加權(quán)，則錫爾系數(shù) T 的計算公式為,錫爾系數(shù)越大，就表示收入分配差異越大；反之，錫爾系數(shù)越小，就表示收入分配越均衡。,式中：n: 區(qū)域（部門）個數(shù)； yi: i地區(qū)（部門）收入占全區(qū)（各部門總計）的份額； pi: i地區(qū)（部門）的人口占全區(qū)（各部門總計）的份額。,p,w,,=∑

26、pi*log(pi/yi)=0.0103,=∑yi*log(yi/pi)=0.0099,,錫爾系數(shù),錫爾系數(shù),根據(jù)中國大陸1978-2002年各省（直轄市、自治區(qū)）的人口數(shù)和按照可比價格折算的GDP數(shù)據(jù)，計算基尼系數(shù)，結(jié)果如圖?？梢钥闯觯?978－1990年期間，基尼系數(shù)雖然出現(xiàn)過幾次上升和下降的微小波動，但基本趨勢是緩慢地下降的；而在1991-2002年期間，基本上呈現(xiàn)上升趨勢。這一結(jié)論，與上節(jié)計算的變異系數(shù)結(jié)果是相互印證的。,19

27、78—2002年中國大陸省際收入差異的基尼系數(shù),應(yīng)用實例：中國大陸省份收入差異的基尼系數(shù),,根據(jù)各?。ㄖ陛犑小⒆灾螀^(qū)）的人口和按照可比價格折算的GDP數(shù)據(jù)，計算1978-2002年中國大陸省際差異的錫爾系數(shù)T 值，結(jié)果如圖所示?？梢钥闯?，在1978-1990年期間，錫爾系數(shù)雖然有微小波動，但基本上呈下降趨勢；而在1991-2002年期間，基本上呈現(xiàn)出上升趨勢。這一結(jié)論，與前面計算出的基尼系數(shù)也是相互印證的。,1978－2002年中國大陸

眾賞文庫> 全部分類> 畢業(yè)設(shè)計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

計量地理學(xué)-2-地理數(shù)據(jù)基本統(tǒng)計指標(biāo)

文檔簡介

溫馨提示

最新文檔

評論

計量地理學(xué)-2-地理數(shù)據(jù)基本統(tǒng)計指標(biāo)

文檔簡介

溫馨提示

最新文檔

評論

免費下載