著重探討統(tǒng)計(jì)以及統(tǒng)計(jì)量的穩(wěn)健性比較_第1頁(yè)
已閱讀1頁(yè),還剩4頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、<p>  著重探討統(tǒng)計(jì)以及統(tǒng)計(jì)量的穩(wěn)健性比較</p><p>  摘要:本文筆者對(duì)幾種常用的統(tǒng)計(jì)量進(jìn)行著重探討,結(jié)合實(shí)踐提出穩(wěn)健性的不足。同時(shí)給出幾種穩(wěn)健統(tǒng)計(jì)量,并與傳統(tǒng)的統(tǒng)計(jì)量進(jìn)行比較。通過(guò)比較來(lái)展現(xiàn)穩(wěn)健統(tǒng)計(jì)量的優(yōu)勢(shì)及其應(yīng)用價(jià)值。 </p><p>  關(guān)鍵詞:穩(wěn)健統(tǒng)計(jì);統(tǒng)計(jì)量 </p><p><b>  1、前言 </b>&l

2、t;/p><p>  統(tǒng)計(jì)學(xué)作為一套科學(xué)原理和技術(shù),統(tǒng)計(jì)是從眾多數(shù)據(jù)中挖掘有用的信息,然后得出有關(guān)這個(gè)領(lǐng)域的某些特征或結(jié)論,進(jìn)而用以指導(dǎo)實(shí)踐,來(lái)創(chuàng)造更好的數(shù)據(jù)的科學(xué)。然而,傳統(tǒng)的用以描述數(shù)據(jù)或數(shù)據(jù)分布特征的統(tǒng)計(jì)量在許多情況下都不具有很強(qiáng)的代表性,使得分析結(jié)果與實(shí)際不符,據(jù)此制定相關(guān)政策用于指導(dǎo)實(shí)踐時(shí),必定會(huì)產(chǎn)生不利于社會(huì)經(jīng)濟(jì)發(fā)展的情況。由于穩(wěn)健統(tǒng)計(jì)方法不受實(shí)際數(shù)據(jù)是否服從正態(tài)分布條件的束縛,與傳統(tǒng)的統(tǒng)計(jì)方法相比,具有

3、更強(qiáng)的抵抗異常值影響的能力,更能夠反映實(shí)際情況,所以它一問(wèn)世就有著很強(qiáng)的生命力,并逐漸地被廣泛應(yīng)用于醫(yī)學(xué)、生物學(xué)、化學(xué)以及地質(zhì)學(xué)等領(lǐng)域,成為人們處理各種問(wèn)題的重要思想和工具。 </p><p>  穩(wěn)健統(tǒng)計(jì)的內(nèi)容非常廣泛,任何涉及到與實(shí)際問(wèn)題和假定條件有偏離有關(guān)的傳統(tǒng)統(tǒng)計(jì)方法中,都會(huì)有穩(wěn)健統(tǒng)計(jì)成長(zhǎng)的空間,都會(huì)有待于對(duì)傳統(tǒng)統(tǒng)計(jì)方法進(jìn)一步完善的必要。本文將主要分析幾種代表總體平均水平的穩(wěn)健統(tǒng)計(jì)量的穩(wěn)健性,并與傳統(tǒng)的統(tǒng)

4、計(jì)量如樣本平均數(shù)等進(jìn)行比較,從而揭示穩(wěn)健統(tǒng)計(jì)量的優(yōu)勢(shì)所在。由于篇幅所限,對(duì)穩(wěn)健統(tǒng)計(jì)的其他方面的討論不在本文范圍之內(nèi)。 </p><p>  2、統(tǒng)計(jì)量的穩(wěn)健性比較分析 </p><p><b>  2.1傳統(tǒng)統(tǒng)計(jì)量 </b></p><p>  人們普遍會(huì)感覺(jué)官方公布的人均收入或人均工資之類的指標(biāo)明顯偏高。進(jìn)一步研究發(fā)現(xiàn),除了統(tǒng)計(jì)誤差和統(tǒng)計(jì)口徑

5、上的不同以外,對(duì)人均收入指標(biāo)主觀上認(rèn)為偏高的主要原因在于收入分布是一種偏態(tài)的分布,而且隨著貧富差異原因的增多,偏態(tài)有日益嚴(yán)重的態(tài)勢(shì)。同時(shí)收入分布中存在著異常極端的離群大值,也會(huì)導(dǎo)致收入平均值的不正常上升。舉一個(gè)極端一點(diǎn)的例子,如果收入數(shù)據(jù)中有一個(gè)值趨于無(wú)窮大,不管是由于操作失誤還是實(shí)際情況的真實(shí)反映,據(jù)此計(jì)算出來(lái)的平均收入也會(huì)趨于無(wú)窮大,由此可見(jiàn),運(yùn)用非常普遍的平均數(shù)絲毫不具有抵御離群值的能力。這也就意味著在正態(tài)假定下性能表現(xiàn)非常良好的

6、平均數(shù),當(dāng)實(shí)際數(shù)據(jù)并不是呈正態(tài)分布時(shí)所表現(xiàn)出的代表性不強(qiáng)的缺陷。這就引發(fā)人們?nèi)ニ伎计渌慕y(tǒng)計(jì)量,要求這樣的統(tǒng)計(jì)量滿足以下兩個(gè)條件:第一,當(dāng)實(shí)際分布未知或雖然已知但不是正態(tài)分布時(shí),這樣的統(tǒng)計(jì)量應(yīng)該能夠比較好地描述所研究現(xiàn)象的實(shí)際情況;第二,當(dāng)數(shù)據(jù)中存在正常的或是非正常的離群值時(shí),這樣的統(tǒng)計(jì)量不會(huì)偏離實(shí)際情況太遠(yuǎn),也即不會(huì)因?yàn)殡x群值的存在而對(duì)所要說(shuō)明的問(wèn)題以及想要得出的結(jié)論造成災(zāi)害性的影響。 </p><p>  切

7、尾均值是對(duì)均值的一種變通方法。均值對(duì)異常值或離群值非常敏感,它會(huì)由于數(shù)據(jù)集合中的一個(gè)或多個(gè)異常值的出現(xiàn)而失真。在這種情況下,離群值會(huì)使均值偏向自己的一方以尋找平衡點(diǎn),因而也就歪曲了均值作為平均水平度量的意義。這時(shí)就需要對(duì)均值的計(jì)算方法進(jìn)行適當(dāng)?shù)淖兺ǎ怪^為穩(wěn)健。通常用到的就是切尾均值,其做法是去掉最大的和最小的數(shù)據(jù),然后對(duì)其余的作平均。 </p><p>  2.2幾種穩(wěn)健統(tǒng)計(jì)量 </p><

8、;p>  從數(shù)理角度分析,許多統(tǒng)計(jì)量都是通過(guò)極小化某一目標(biāo)函數(shù)而得到的結(jié)果。例如熟悉的樣本均值就是極小化目標(biāo)函數(shù)Q(xi,t)=Eni=1(xi-t)2所得的t值,其中xi,i=1,,,n是某一獨(dú)立同分布的樣本,t是估計(jì)值,Q表示目標(biāo)函數(shù)。解此問(wèn)題的方法是先求Q關(guān)于t的導(dǎo)數(shù)7(在Q可導(dǎo)的情況下),7(xi,t)=Qc(xi,t)=Eni=1(xi-t)(去掉常數(shù)因子),然后求t,使之滿足Eni=1(xi-t)=0。通過(guò)求解得t=E

9、ni=1xiPn,也就是樣本均值。同樣,樣本中位數(shù)是最小化目標(biāo)函數(shù)Q(xi,t)=Eni=1|xi-t|的解。已經(jīng)看到,基于殘差平方目標(biāo)函數(shù)的樣本平均值的統(tǒng)計(jì)量對(duì)于離群值過(guò)于敏感,即由于經(jīng)過(guò)平方,使得數(shù)據(jù)分布的尾部有太大的權(quán)數(shù);而基于絕對(duì)殘差目標(biāo)函數(shù)的樣本中位數(shù)雖然克服了樣本平均值對(duì)離群值敏感的缺陷,但卻對(duì)數(shù)據(jù)的中間估計(jì)值太敏感。于是,Huber(1964)提出了一種新的目標(biāo)函數(shù),作為樣本平均值和樣本中位數(shù)的折衷。這個(gè)目標(biāo)函數(shù)就是極小化

10、上述目標(biāo)函數(shù)的解就是HuberM統(tǒng)計(jì)量。樣本中位數(shù)和平均數(shù)分別是HuberM統(tǒng)計(jì)量的極端情況,k稱作細(xì)調(diào)參數(shù),它決定著Huber統(tǒng)計(jì)量的</p><p>  根據(jù)M統(tǒng)計(jì)量7函數(shù)(即目標(biāo)函數(shù)的導(dǎo)數(shù))的形狀,人們把Huber統(tǒng)計(jì)量稱作單調(diào)的,統(tǒng)計(jì)量,另外三種比較常見(jiàn)的M統(tǒng)計(jì)量:圖基(Tukey)雙權(quán)M統(tǒng)計(jì)量、漢佩爾(Hampel)回降M統(tǒng)計(jì)量和安德魯斯(Andrews)正弦波M統(tǒng)計(jì)量都是回降統(tǒng)計(jì)量。也就是說(shuō),Hube

11、rM統(tǒng)計(jì)量的7函數(shù)是單調(diào)遞增的,而后面三種M統(tǒng)計(jì)量的7函數(shù)最終都要回到水平軸,其函數(shù)形式均比較復(fù)雜,這里從略。需要強(qiáng)調(diào)指出的是,M統(tǒng)計(jì)量之所以較平均數(shù)穩(wěn)健,是因?yàn)橄鄬?duì)于平均數(shù)對(duì)所有觀察值都賦權(quán)數(shù)以1的情形,M統(tǒng)計(jì)量最終的目標(biāo)是根據(jù)觀察值離數(shù)據(jù)分布中心的遠(yuǎn)近而賦大小不等的權(quán)數(shù),即觀測(cè)值距離數(shù)據(jù)分布中心越遠(yuǎn),賦予它的權(quán)數(shù)就越小,反之就越大。從而提高統(tǒng)計(jì)量的全局效率和整體耐抗性。不同的M統(tǒng)計(jì)量具有不同的加權(quán)體系。HampelM統(tǒng)計(jì)量和Andr

12、ews正弦波M估計(jì)量的權(quán)重函數(shù)的形狀與Tukey雙權(quán)M統(tǒng)計(jì)量大體上類似,都是中間部分權(quán)數(shù)較大,以后逐漸遞減,到兩側(cè)的某一點(diǎn)減小到零。所不同的是,如同HuberM統(tǒng)計(jì)量中的k一樣,不同的統(tǒng)計(jì)量具有不同的細(xì)調(diào)參數(shù),從而也決定了權(quán)重函數(shù)走勢(shì)變化的分界點(diǎn)。 </p><p>  表1 是筆者利用SPSS 軟件對(duì)某市近幾年的居民實(shí)際支出原始數(shù)據(jù)計(jì)算的四種M 統(tǒng)計(jì)量(為節(jié)省篇幅, 只列出每隔一年共6 年的計(jì)算結(jié)果) , 并列

13、出了平均支出和中位數(shù)支出以供比較。 </p><p>  表1 基于居民實(shí)際支出數(shù)據(jù)的四種M 統(tǒng)計(jì)量比較 </p><p>  通過(guò)上表對(duì)六種統(tǒng)計(jì)量的比較發(fā)現(xiàn),四種M統(tǒng)計(jì)量均低于平均實(shí)際支出,而與中位數(shù)實(shí)際支出的大小關(guān)系不固定。由于實(shí)際支出數(shù)據(jù)中有一定量的離群值存在,所以平均實(shí)際支出是對(duì)實(shí)際數(shù)據(jù)的一種偏高估計(jì),這是毫無(wú)疑問(wèn)的,又由于位數(shù)附近可能出現(xiàn)的分布離散性,使得中位數(shù)在整體上是對(duì)實(shí)際數(shù)

14、據(jù)的一種偏低估計(jì)。而M統(tǒng)計(jì)量反映了支出數(shù)據(jù)主體部分的更多信息,因而能夠更準(zhǔn)確地體現(xiàn)實(shí)際支出的一般水平。 </p><p><b>  3、結(jié)束語(yǔ) </b></p><p>  綜上所述,運(yùn)用非常廣泛的樣本平均數(shù),雖然有其計(jì)算簡(jiǎn)單的優(yōu)點(diǎn),但卻在很多情況下不能夠很好地代表所研究現(xiàn)象總體的平均水平。因此,對(duì)更加穩(wěn)健的統(tǒng)計(jì)量的重視和應(yīng)用,無(wú)論是對(duì)數(shù)據(jù)使用者還是對(duì)政策的制定者,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論