2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩56頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、計量地理學,胡碧松hubisong624@126.com,地理數(shù)據(jù)統(tǒng)計指標,地理數(shù)據(jù)的統(tǒng)計分組,統(tǒng)計整理的基本步驟: ①統(tǒng)計分組,就是根據(jù)研究目的,按照一定的分組標志將地理數(shù)據(jù)分成若干組。 ②計算各組數(shù)據(jù)的頻數(shù)、頻率,編制統(tǒng)計分組表。 ③繪制統(tǒng)計分布圖。,Why???,What???,What???,例: 對于黃土高原西部地區(qū)某山區(qū)縣的人工造林地調(diào)查數(shù)據(jù)進行統(tǒng)計整理,步驟如下:

2、 (1)以地塊面積作為統(tǒng)計分組標志進行分組; (2)計算各組數(shù)據(jù)的頻數(shù)、頻率,編制成如下的統(tǒng)計分組表; (3)做出頻數(shù)分布的直方圖; (4)將上圖各組的頻數(shù)分布從組中值位置用折線連接起來,得到頻數(shù)分布的散點曲線圖。,某縣人工造林地面積的統(tǒng)計分組數(shù)據(jù),,,,,,頻數(shù)分布柱狀圖,頻數(shù)分布曲線圖,地理數(shù)據(jù)統(tǒng)計圖,,,,讀某邊的數(shù)值:向該邊作與其零起點相交邊的平行線,該平行線與該邊的交點即為該邊所對應的數(shù)

3、值。,,,,,,B,%,%,%,,AB兩國三大產(chǎn)業(yè)產(chǎn)值比重構(gòu)成示意圖,平面正三角坐標圖,三維坐標圖,,,,,,,,,,,,,,,,1,4,7,10,(月),,,,,,,,,,,,,,0,10,20,-10,50,100,降水量(mm),氣溫(℃),,,雷達圖,風玫瑰圖,人口金字塔圖,,,,(1)描述地理數(shù)據(jù)一般水平的指標,(2)描述地理數(shù)據(jù)分布的離散程度的指標,(3)描述地理數(shù)據(jù)分布特征的參數(shù),1,2,3,幾種常用的統(tǒng)計指標與參數(shù),平均

4、值,一般水平指標,中位數(shù),眾數(shù),,,,描述地理數(shù)據(jù)一般平均水平,,=54.25,,,,xi: 第i組的組中值,fi: 第i組的頻數(shù),m: 分組總數(shù)量,中國西部地區(qū)某城市2000年家庭月收入的抽樣調(diào)查結(jié)果,,,,= 300×2500+1300×3500+…+30×8500 2130 =3899.06(元),對于未分組的地理數(shù)據(jù): 樣本數(shù)n為奇數(shù)時,中位數(shù)是位置排在第(n+1)/2位的數(shù)據(jù);

5、 樣本數(shù)n為偶數(shù)時,中位數(shù)是排在中間位置的兩個數(shù)據(jù)的平均值。,,Me =61,升序排序,,Me =52.5,對于分組的地理數(shù)據(jù),中位數(shù)的計算方法: 1) 確定中位數(shù)所在的組位置:——中位數(shù)應該在向上累計頻數(shù)包括∑fi/2的組中。 2) 按下述公式計算中位數(shù):,或,Me 代表中位數(shù);L 為中位數(shù)所在組的下限值;U 為中位數(shù)所在組的上限值;fm 為中位數(shù)所在組的頻數(shù);Sm-1 為中位數(shù)所在組以下的

6、累計頻數(shù);Sm+1 為中位數(shù)所在組以上的累計頻數(shù);d 為中位數(shù)所在組的組距。,第1組,第n組,fm,f1,fn,∑fi/2,∑fm-1,∑fm,L,U,d=U-L,,,?,,,,∑fi/2=2130/2=1065,,300≤∑fi/2=1065≤1600,∴Me位于分組[3000,4000],L = 3000 U = 4000 d = L-U = 1000,fm = 1300,,,,Sm-1 = 300,=300

7、0+ 1065?300 1300 ×1000=3588.46,眾數(shù)即出現(xiàn)次數(shù)最多的那個數(shù)值。 對于未分組的地理數(shù)據(jù),可以根據(jù)每一個數(shù)值出現(xiàn)的頻數(shù)大小取最大值可直接確定眾數(shù)。,,,M0 =50,對于已經(jīng)分組的地理數(shù)據(jù),中位數(shù)的計算步驟如下: 1) 確定頻數(shù)最多的組為眾數(shù)所在組; 2) 按以下公式計算眾數(shù):,或,?1為眾數(shù)組頻數(shù)與上一組頻數(shù)之差;?2為眾數(shù)組頻數(shù)與下一組頻數(shù)之差。,,∴M0位

8、于分組[3000,4000],?1=1300-300=1000?2=1300-200=1100,=3000+ 1000 1000+1100 ×1000=3476.19,或,=4000? 1100 1000+1100 ×1000=3476.19,,極差,離差,離差平方和,方差,標準差,標準差無偏估計,變異系數(shù),描述地理數(shù)據(jù)分布離散程度的指標,,,,,,,,,,所有數(shù)據(jù)中最大值與最小值之差,每一個地理數(shù)據(jù)與平均值的差值

9、,從總體上衡量一組地理數(shù)據(jù)與平均值的離散程度的指標,從平均概況衡量一組地理數(shù)據(jù)與平均值的離散程度的指標,極差,離差,離差平方和,方差,,,,標準差為方差的平方根,,,以樣本方差對標準差進行無偏估計,,,變異系數(shù)表示地理數(shù)據(jù)的相對變化(波動)程度,標準差,標準差無偏估計,變異系數(shù),𝑑 𝑖,𝑑 2 = 𝑖=1 𝑛 𝑑 𝑖 2

10、,𝜎 2 = 𝑑 2 𝑛,𝜎= 𝜎 2,𝑆= 𝑑 2 𝑛?1,𝐶 𝑣 = 𝑆 𝑥 ×100%,離差,離差平方和,方差,標準差,標準差無偏估計,變異系數(shù),例:,,離差平方和,離差,極差,,,方差,標準差,標準差無偏

11、估計,𝜎 2 = 𝑑 2 𝑛 = 5666.25 12 =472.19,𝜎= 𝜎 2 = 472.19 =21.73,𝑆= 𝑑 2 𝑛?1 = 5666.25 12?1 =21.7299,變異系數(shù),𝐶 𝑣 = 𝑆 𝑥

12、 ×100%= 21.7299 54.25 ×100%=41.84%,,,,,,,,,,,,g1,g2,偏度系數(shù),峰度系數(shù),描述地理數(shù)據(jù)分布特征的參數(shù),偏度系數(shù),測度地理數(shù)據(jù)分布的不對稱性情況,刻畫以平均值為中心的偏向情況,計算公式為,g10,表示正偏,即均值在峰值的右邊;g1=0,表示對稱分布,峰度系數(shù),測度了地理數(shù)據(jù)在均值附近的集中程度,其計算公式為,g2=0,表示地理數(shù)據(jù)分布的集中程度是標準正態(tài)分布;g2&g

13、t;0,表示地理數(shù)據(jù)分布的集中程度高于正態(tài)分布;g2<0,表示地理數(shù)據(jù)分布的集中程度低于正態(tài)分布,𝜎=21.73,𝑥 =54.25,偏度系數(shù),峰度系數(shù),=?0.3086,=?0.6796,負偏,平均值在峰值的左邊,數(shù)據(jù)分布集中程度低于正態(tài)分布,應用實例:中國大陸省份人均GDP的變異系數(shù),我們知道變異系數(shù)測度的是地理數(shù)據(jù)分布的相對差異。 為了分析中國大陸經(jīng)濟發(fā)展的省際差異及其演化過程,我

14、們首先把1978-2002年各?。ㄖ陛犑?、自治區(qū))的GDP數(shù),按照可比價格進行折算,再除以人口數(shù),計算出按照可比價衡量的人均GDP數(shù)據(jù),然后再用變異系數(shù)公式,計算1978-2002每一年對應的變異系數(shù),將計算結(jié)果繪制成散點折線圖:,這說明,在1978-1990年期間,中國大陸經(jīng)濟發(fā)展的省際差異,基本上呈縮小趨勢,而1990-2002年期間則基本上呈擴大趨勢。這一變化與國家宏觀經(jīng)濟政策變動的時間、趨勢大體一致。,,在1978-2002年期

15、間,人均GDP的變異系數(shù),以1990年為轉(zhuǎn)折點,呈現(xiàn)出一個U形曲線。即:人均GDP的變異系數(shù),在1978-1990年期間基本上呈現(xiàn)下降趨勢,而在1990-2002年期間則基本上呈現(xiàn)上升趨勢。,,地理數(shù)據(jù)分布的集中化與均衡度指數(shù),洛倫茲曲線,20世紀初,意大利統(tǒng)計學家洛倫茲(M. Lorenz),首先使用累計頻率曲線研究工業(yè)化的集中化程度。后來,這種曲線就被稱之為洛倫茲曲線。,(1)將各部門的收入及其占總收入比重(百分比),從大到小重新排

16、序;(2)從大到小,逐次計算累計百分比;(3)以自然序號為橫坐標(x),累計百分比為縱坐標(y);以(部門代碼,累計百分比)為坐標點,連成一個上凸的曲線,即洛倫茲曲線。,標準洛倫茲曲線繪制步驟,某地區(qū)農(nóng)戶家庭經(jīng)營性純收入水平及其構(gòu)成,,,,(1)將表中2004年各產(chǎn)業(yè)部門的收入及其占總收入比重(百分比),從大到小重新降序排序;,,(2)從大到小,逐次計算收入比重的累計百分比;,計算累計百分比,,(3)以自然序號為橫坐標(x),累計百

17、分比為縱坐標(y);以(部門代碼,累計百分比)為坐標點,連成一個上凸的曲線,即洛倫茲曲線。,統(tǒng)計自然序號,,,,,洛倫茲曲線什么情況下是這條橫軸平行線?,,洛倫茲曲線什么情況下是這條對角線?,1999年農(nóng)戶家庭經(jīng)營性純收入構(gòu)成的洛倫茲曲線,2004年農(nóng)戶家庭經(jīng)營性純收入構(gòu)成的洛倫茲曲線,洛倫茲曲線的上凸程度,表示農(nóng)戶家庭經(jīng)營性純收入的部門集中化程度。上凸程度越大,就表示農(nóng)戶家庭經(jīng)營性純收入越是集中于某些產(chǎn)業(yè)部門。,哪一年的農(nóng)戶家庭

18、經(jīng)營性純收入部門集中化程度較高?1999or2004?,集中化指數(shù),集中化指數(shù)是一個描述地理數(shù)據(jù)分布的集中化程度的指數(shù)。,假若洛倫茲曲線的解析式為: 顯然,該曲線下方區(qū)域的面積為:,當數(shù)據(jù)均勻分布時,A就變成了對角線以下三角形的面積(R);當數(shù)據(jù)集中分布時,A就變成了整個矩形的面積(M)。,A——實際洛倫茲曲線與橫軸圍成的圖形面積; R——均勻分布時洛倫茲曲線與橫軸圍成的圖形面積; M——集中分布時洛倫茲曲線與橫軸圍成的圖形面積

19、。,,R,M,A,,顯然:集中化指數(shù)在[0, 1]區(qū)間上取值。I越大,就說明數(shù)據(jù)分布的集中化程度越高;I越小,就說明數(shù)據(jù)分布的集中化程度越低(越均衡)。,集中化指數(shù),常采用如下近似取值方法: A——實際數(shù)據(jù)的累計百分比總和; R——均勻分布時的累計百分比總和; M——集中分布時的累計百分比總和。 集中化指數(shù)在[0,1]區(qū)間上取值。

20、 只有數(shù)據(jù)的個數(shù)相同而且橫坐標劃分一致時,才有可比性。,直接計算定積分較為麻煩,,A=∑累計百分比=7.5939,M=∑累計百分比=10,,,R=∑累計百分比=5.5,=(7.5939-5.5)/(10-5.5)=0.4653,基尼系數(shù)就是通過人口和收入兩組數(shù)據(jù)的對比分析,縱、橫坐標均以累計百分比表示,從而做出羅倫次曲線,然后再計算得出的集中化指數(shù)。 它是通過對人口和收入兩組數(shù)據(jù)進行比較分析,然后將縱、橫坐標均以累計百分比

21、表示,作出羅倫次曲線,再計算集中化指數(shù)而得到的一個判斷收入分配不平等程度的指標。,基尼系數(shù),(Gini coefficient),與標準洛倫茲曲線有什么不同?,基尼系數(shù)洛倫茲曲線繪制原理方法:,(1)列出每一個區(qū)域(部門)的人口與收入占全區(qū)(各部門總計)的比重p與w;,,,p,w,(2)計算每一區(qū)域(部門)的比率w/p;,w/p,,基尼系數(shù)洛倫茲曲線繪制原理方法:,(3)根據(jù)w/p值,由小到大將每一地區(qū)(部門)排序;,,,由小到大升序

22、排序,w和p累積值,(4)按照上述順序分別計算p和w的累計值X和Y;,,,X,Y,(5)以X為橫坐標,以Y為縱坐標,在直角坐標系中依次連接各點,得到一條下凸的羅倫次曲線。,X,Y,Y1,Y2,Why?,,繪制散點曲線圖即得洛倫茲曲線,基尼系數(shù)洛倫茲曲線繪制原理方法:,,基尼系數(shù)洛倫茲曲線,為什么是下凸曲線?,怎么計算該洛倫茲曲線的集中化指數(shù),A——實際洛倫茲曲線與橫軸圍成的圖形面積; R——均勻分布時洛倫茲曲線與橫軸圍成的圖形面積;

23、 M——集中分布時洛倫茲曲線與橫軸圍成的圖形面積。,此時,M=0,R=1/2。,Why?,Why?,基尼系數(shù)G就可按照如下公式計算:,𝐼= 𝑅?𝐴 𝑅?𝑀,如果用冪函數(shù)擬合,則基尼系數(shù)的近似計算公式為,式中: 可以通過最小二乘法擬合,即,近似計算基尼系數(shù),Xi為排序后的人口累計百分比Yi為排序后的收入累計百分比,X,Y,,,∑lnXi*lnYi=11.20

24、,∑(lnxi)^2=9.11,=11.20/9.11=1.23,=(1.23-1)/(1+1.23)=0.1025,基尼系數(shù),錫爾系數(shù),(Theil coefficient),錫爾系數(shù)(Theil coefficient)又稱錫爾熵,有兩個錫爾系數(shù)指標,即錫爾系數(shù)T 和錫爾系數(shù)L。 兩者的不同之處在于錫爾系數(shù)T 以收入比重加權(quán)計算,而錫爾系數(shù)L則以人口比重加權(quán)計算。,如果以人口比重加權(quán),錫爾系數(shù) L 的計算公式為:,式中:n

25、: 區(qū)域(部門)個數(shù); yi: i地區(qū)(部門)收入占全區(qū)(各部門總計)的份額; pi: i地區(qū)(部門)的人口占全區(qū)(各部門總計)的份額。,如果以收入比重加權(quán),則錫爾系數(shù) T 的計算公式為,錫爾系數(shù)越大,就表示收入分配差異越大;反之,錫爾系數(shù)越小,就表示收入分配越均衡。,式中:n: 區(qū)域(部門)個數(shù); yi: i地區(qū)(部門)收入占全區(qū)(各部門總計)的份額; pi: i地區(qū)(部門)的人口占全區(qū)(各部門總計)的份額。,p,w,,=∑

26、pi*log(pi/yi)=0.0103,=∑yi*log(yi/pi)=0.0099,,錫爾系數(shù),錫爾系數(shù),根據(jù)中國大陸1978-2002年各省(直轄市、自治區(qū))的人口數(shù)和按照可比價格折算的GDP數(shù)據(jù),計算基尼系數(shù),結(jié)果如圖??梢钥闯?,在1978-1990年期間,基尼系數(shù)雖然出現(xiàn)過幾次上升和下降的微小波動,但基本趨勢是緩慢地下降的;而在1991-2002年期間,基本上呈現(xiàn)上升趨勢。這一結(jié)論,與上節(jié)計算的變異系數(shù)結(jié)果是相互印證的。,19

27、78—2002年中國大陸省際收入差異的基尼系數(shù),應用實例:中國大陸省份收入差異的基尼系數(shù),,根據(jù)各?。ㄖ陛犑?、自治區(qū))的人口和按照可比價格折算的GDP數(shù)據(jù),計算1978-2002年中國大陸省際差異的錫爾系數(shù)T 值,結(jié)果如圖所示??梢钥闯?,在1978-1990年期間,錫爾系數(shù)雖然有微小波動,但基本上呈下降趨勢;而在1991-2002年期間,基本上呈現(xiàn)出上升趨勢。這一結(jié)論,與前面計算出的基尼系數(shù)也是相互印證的。,1978-2002年中國大陸

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論