調(diào)查抽樣中的推斷方法和漸近理論.pdf_第1頁(yè)
已閱讀1頁(yè),還剩109頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、我們知道,在抽樣調(diào)查中并不總能獲得感興趣特征y的精確值,測(cè)量誤差常常存在。而堅(jiān)持對(duì)大量樣本單位獲得精確測(cè)量值將耗資巨大。因此,常代之以兩個(gè)或多個(gè)在精度和費(fèi)用上明顯不同的“儀器”進(jìn)行測(cè)量。具有最小測(cè)量誤差的“儀器”常稱為“精確的”。當(dāng)然,“精確的”這個(gè)概念是相對(duì)的,是為了實(shí)際需要。假設(shè)我們用幾種不精確的和一精確的儀器獨(dú)立地測(cè)量了一總體的某一特征,這樣我們得到了幾個(gè)具有不同精度的樣本集。此時(shí)統(tǒng)計(jì)推斷應(yīng)基于它們組成的合并樣本集,因?yàn)閮H利用精確

2、測(cè)量值將導(dǎo)致效率損失。 在有限總體推斷問(wèn)題中,附帶信息??衫谩@?,假設(shè)有限總體由N個(gè)不同的單位組成,對(duì)應(yīng)第i個(gè)單位的是研究變量yi,和輔助向量xi。在許多應(yīng)用中,輔助向量xi的某些特征(如,總體均值X=1-N∑i-1xi或者總體中位數(shù)mx)是已知的。在某些情況下,所有x1,x2,…,xN都已知,即有完全輔助信息。另外,我們也可能有關(guān)于研究變量的部分信息。例如,我們可能已知研究變量總體均值,或者已知研究變量分布函數(shù)關(guān)于某常數(shù)對(duì)

3、稱。一個(gè)有趣的問(wèn)題是,如何才能最有效地利用這些信息? 經(jīng)驗(yàn)似然是一非參統(tǒng)計(jì)推斷方法。正如自助法(bootstrap)和刀切法(jackknife),經(jīng)驗(yàn)似然方法也不需要像參數(shù)似然方法那樣假定數(shù)據(jù)來(lái)自某指定的分布族。經(jīng)驗(yàn)似然還可自動(dòng)確定置信區(qū)域的形狀,并可直接結(jié)合由約束或先驗(yàn)分布表示的附帶信息。經(jīng)驗(yàn)似然法可看作是不需重抽樣的自助法,又可看作不需參數(shù)假設(shè)的似然法。 盡管Owen(1988)最初提出的經(jīng)驗(yàn)似然方法是關(guān)于獨(dú)立同分

4、布數(shù)據(jù)的,但它已扎根于抽樣調(diào)查中(HartleyandRao(1968))。在簡(jiǎn)單隨機(jī)抽樣下,HartleyandRao(1968),ChenandQin(1993)發(fā)現(xiàn)經(jīng)驗(yàn)似然方法可有效地利用抽樣調(diào)查中廣泛存在的輔助信息,并具有許多吸引人的特征。最近,ZhongandRao(2000)研究了在分層簡(jiǎn)單隨機(jī)抽樣下的經(jīng)驗(yàn)似然法。在復(fù)雜抽樣下,ChenandSitter(1999)提出了擬經(jīng)驗(yàn)似然方法。所有這些方法僅在樣本被精確測(cè)量的范疇內(nèi)

5、討論。Zhong,ChenandRao(2000)將經(jīng)驗(yàn)似然法用于在有測(cè)量誤差情形下感興趣參數(shù)的推斷。然而,他們的討論僅局限在簡(jiǎn)單隨機(jī)抽樣下的點(diǎn)估計(jì)問(wèn)題。因此,當(dāng)存在測(cè)量誤差時(shí),對(duì)感興趣參數(shù)在簡(jiǎn)單隨機(jī)抽樣下的檢驗(yàn)問(wèn)題及分層隨機(jī)抽樣下的統(tǒng)計(jì)推斷值得感興趣。 在1.1節(jié)中,我們考慮在有測(cè)量誤差情況下感興趣參數(shù)的檢驗(yàn)問(wèn)題。這里假設(shè)所有不精確的儀器沒(méi)有系統(tǒng)誤差。利用經(jīng)驗(yàn)似然方法,我們可結(jié)合所有可用的信息對(duì)感興趣參數(shù)進(jìn)行統(tǒng)計(jì)檢驗(yàn)。我們定義

6、了經(jīng)驗(yàn)似然比統(tǒng)計(jì)量,并獲得了它們的漸近分布。在1.2節(jié)中,在分層隨機(jī)抽樣及存在測(cè)量誤差情況下,我們采用經(jīng)驗(yàn)似然方法去推斷感興趣參數(shù)。我們指出,經(jīng)驗(yàn)似然方法充分地結(jié)合了所有樣本信息,且導(dǎo)出的估計(jì)量是漸近正態(tài)的。我們也定義了經(jīng)驗(yàn)似然檢驗(yàn)統(tǒng)計(jì)量并獲得了它們的漸近分布。特別地,我們應(yīng)用經(jīng)驗(yàn)似然方法去得到總體均值的點(diǎn)估計(jì)及置信區(qū)間。利用合樣本所得到的估計(jì)量在效率上比僅用精確測(cè)量數(shù)據(jù)得到的估計(jì)量有明顯的提高。 Owen(1988)指出,經(jīng)驗(yàn)

7、似然方法可用來(lái)構(gòu)造M-泛函的置信區(qū)間。在關(guān)于M-泛函的經(jīng)驗(yàn)似然范疇內(nèi),他證明了非參情形下的Wilks定理,即對(duì)數(shù)經(jīng)驗(yàn)似然比的漸近分布是卡方分布。Zhang(1995,1997)考慮了M-泛函的經(jīng)驗(yàn)似然估計(jì)和置信區(qū)問(wèn).但是,所有這些討論不包括聯(lián)系有限總體M-泛函的推斷。 在1.3節(jié)中,我們考慮在存在輔助信息情況下去估計(jì)聯(lián)系有限總體的M-泛函。特別地,我們考慮了在已知有限總體均值時(shí)去估計(jì)有限總體方差。通過(guò)雇傭經(jīng)驗(yàn)似然方法,我們提出了

8、關(guān)于M-泛函的改進(jìn)的估計(jì)和置信區(qū)間,并從理論上論證了它們優(yōu)于標(biāo)準(zhǔn)的估計(jì)和置信區(qū)間。為評(píng)估改進(jìn)的估計(jì),我們還進(jìn)行了模擬。模擬結(jié)果與理論上預(yù)期的基本一致。 ElBarmi(1996)利用經(jīng)驗(yàn)似然比方法去檢驗(yàn)M-泛函是否滿足一組不等式。其結(jié)果是QinandLawless(1995)文中結(jié)果的推廣。這個(gè)工作也與ElBarmiandDykstra(1994a,1995)的工作密切相關(guān)。然而,他們沒(méi)有考慮關(guān)于分布本身有部分信息的情況。

9、 在1.4節(jié)中,我們考慮了在有輔助信息情況下對(duì)M-泛函的一約束集進(jìn)行統(tǒng)計(jì)檢驗(yàn)的問(wèn)題。我們定義了經(jīng)驗(yàn)似然比檢驗(yàn)統(tǒng)計(jì)量,并獲得了它們的漸近分布。 從ChenandQin(1993),ChenandSitter(1999)文中知,他們所定義的經(jīng)驗(yàn)似然并不是真正的似然,而僅僅是一種近似或在整個(gè)有限總體看作來(lái)自某超總體iid樣本時(shí)似然函數(shù)的一設(shè)計(jì)無(wú)偏估計(jì)。盡管經(jīng)驗(yàn)似然方法有好的大樣本性質(zhì),它不能說(shuō)是最好的方法。在第2章中,我們提出了有效

10、利用調(diào)查數(shù)據(jù)中輔助信息的信息論方法。我們說(shuō)交叉熵最小化(CEM)估計(jì)(或指數(shù)型經(jīng)驗(yàn)似然估計(jì))比經(jīng)驗(yàn)最大似然(EML)估計(jì)更有吸引力。第一,兩種估計(jì)量都可看作是最小化待估概率πi和經(jīng)驗(yàn)頻率1-n之間的距離而得到的。在CEM方法中用這些概率的有效估計(jì)(即πi)作為差異的權(quán)似乎比在EML方法中用這些概率的無(wú)效估計(jì)(即1-n)作為差異的權(quán)更有吸引力。第二,相對(duì)來(lái)說(shuō),CEM估計(jì)量受數(shù)據(jù)擾動(dòng)的影響較小(參看Imbens,SpadyandJohnso

11、n(1998))。第三,用經(jīng)驗(yàn)似然方法,其優(yōu)化問(wèn)題在某些情況下可能無(wú)解。然而,我們的優(yōu)化問(wèn)題的解總存在且唯一。更進(jìn)一步,我們的方法計(jì)算上簡(jiǎn)單。 在2.1節(jié)中,我們提出了適合簡(jiǎn)單和復(fù)雜調(diào)查數(shù)據(jù)的交叉熵最小化方法。在簡(jiǎn)單無(wú)放回隨機(jī)抽樣下所得的CEM估計(jì)是一致的且是漸近正態(tài)的,與EML估計(jì)有相同的漸近方差。在復(fù)雜抽樣情況下我們所得的CEM估計(jì)與PEML估計(jì)具有相同的漸近性質(zhì)。模擬結(jié)果顯示,CEM估計(jì)量一致地好。 在2.2節(jié)中,

12、我們提出了有效使用輔助信息和含在層總體大小中的信息的交叉熵最小化方法。我們的方法適用分層簡(jiǎn)單和復(fù)雜抽樣。在分層簡(jiǎn)單隨機(jī)抽樣下,我們證明了CEM估計(jì)量的漸近方差不會(huì)比其它估計(jì)量的漸近方差大。特別地,當(dāng)X已知,Y的交叉熵最小化估計(jì)等價(jià)于最優(yōu)回歸估計(jì)(Rao(1994))。我們證明了導(dǎo)出的估計(jì)比通常的無(wú)信息估計(jì)有較小的漸近方差。我們也給出了其方差的刀切法估計(jì)及其漸近性質(zhì)。 在2.3節(jié)中,我們提出了使用調(diào)查數(shù)據(jù)中完全輔助信息的模型校正交

13、叉熵最小化(MCEM)方法。在估計(jì)有限總體均值時(shí)我們的估計(jì)漸近等價(jià)于MC估計(jì)(WuandSitter(2001))。我們方法一個(gè)有吸引力的優(yōu)點(diǎn)是,導(dǎo)出的權(quán)具有特征:Pi>0和∑i∈spi=1。這便可把此方法容易地用于估計(jì)分布函數(shù)和分位數(shù)。導(dǎo)出的分布函數(shù)估計(jì)量FMCE(y)漸近等價(jià)于廣義回歸估計(jì),且本身是一分布函數(shù)。 DevilleandSarndal(1992)給出了用于估計(jì)總體總量的校正方法。這個(gè)方法隱含的目的就是利用輔助信息

14、去獲得比Horvitz-Thompson(H-T)估計(jì)量有較小漸近方差的漸近無(wú)偏估計(jì)量。當(dāng)采用加權(quán)平方和距離來(lái)度量?jī)蓹?quán)集的距離時(shí),通過(guò)校正方法所得的估計(jì)量為廣義回歸估計(jì)。對(duì)一般的距離度量,在一定的正規(guī)條件下,導(dǎo)出的校正估計(jì)近似于廣義回歸估計(jì)(見(jiàn)DevilleandSarndal(1992))。 在構(gòu)造校正估計(jì)時(shí)有兩基本的元素:距離度量和校正方程集。從有效性角度來(lái)講,距離度量的選擇不是關(guān)鍵的(DevilleandSarndal(1

15、992))。許多調(diào)查機(jī)構(gòu)日常使用的校正方程i∈s∑wixi=∑i=1xi被稱作水準(zhǔn)基點(diǎn)約束。在實(shí)踐中常加上水準(zhǔn)基點(diǎn)約束有如下兩點(diǎn)理由:(1)能給輔助變量以完美估計(jì)的校正權(quán)也可能為研究變量提供一個(gè)好的估計(jì);(2)可利用的輔助信息可能是集成的形式,即僅已知X'C。然而,在許多抽樣調(diào)查問(wèn)題中有完全輔助信息,即x1,x2,…,xN均已知,此時(shí)一個(gè)自然的問(wèn)題是,在構(gòu)造校正估計(jì)時(shí)最好的校正方程是什么呢?WuandSitter(2001)在估計(jì)總體總

16、量和均值時(shí)發(fā)展了使用調(diào)查數(shù)據(jù)中完全輔助信息的模型校正方法。SitterandWu(2002)指出,當(dāng)響應(yīng)變量和輔助變量的真正關(guān)系是嚴(yán)重的非線性關(guān)系時(shí),為有效地利用輔助信息,在單位水平上的完全輔助信息和精心建模是必要的。但是,他們文中討論的實(shí)際上僅是總體總量或均值。Théberge(1999)推廣校正技術(shù)去估計(jì)總量和均值以外的總體參數(shù),如線性和雙線性參數(shù)。然而,他沒(méi)有考慮已知完全輔助信息的情況。在第3章中,在估計(jì)線性和雙線性參數(shù)時(shí),我們提

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論