版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第八次中國公民科學(xué)素養(yǎng)調(diào)查抽樣與數(shù)據(jù)加權(quán)QQ:126998647,主要內(nèi)容,一、追加抽樣設(shè)計二、權(quán)數(shù)的計算三、追加后的估計四、幾個問題的說明,調(diào)查目的 通過追加抽樣調(diào)查,來了解并推估各省(直轄市、自治區(qū))18-69歲的人口在科學(xué)素養(yǎng)方面的有關(guān)情況。 調(diào)查對象 各個需進行樣本追加省(直轄市、自治區(qū))內(nèi)的18-69歲的公民(不含現(xiàn)役軍人、智力障礙者)。,一、追加抽樣設(shè)計,追加抽樣設(shè)計原則,以各省級單位
2、為子總體,進行獨立的追加抽樣設(shè)計。 各省的追加抽樣設(shè)計應(yīng)與全國的抽樣設(shè)計保持一致,采用三階段抽樣設(shè)計。追加后的省級樣本由兩部分構(gòu)成: 落入本省內(nèi)的全國原有樣本 本省獨立的追加樣本在95%的置信度下,估計省級子總體比例參數(shù),抽樣絕對誤差不超過3%。,追加抽樣設(shè)計思路,可以采取以下兩種方式對各省級單位進行樣本追加: 1、通過增加各省級單位內(nèi)全國抽樣設(shè)計落入的末級抽樣單元抽取的數(shù)量; 2、通過在各省級單位
3、內(nèi)追加一部分初級抽樣單元的數(shù)量。,,本次追加采用以上兩種追加思路。 最終追加的樣本量是69360.,二、權(quán)數(shù)的計算,抽樣后如何用樣本推斷總體? 為了從調(diào)查得到的樣本數(shù)據(jù)中得到全國目標量的無偏或近似無偏的估計,需要利用每個樣本單元的調(diào)查值乘以該單元的權(quán)數(shù),因而權(quán)數(shù)的確定是對目標量進行估計中的一個重要問題。,權(quán)數(shù)的確定,權(quán)數(shù)包含初始權(quán)數(shù)和最終權(quán)數(shù)。(1)初始權(quán)數(shù)的確定 初始權(quán)數(shù)為樣本單元入
4、樣概率的倒數(shù)。表示一個樣本單元代表的總體單元數(shù)。(2)最終權(quán)數(shù)的確定 復(fù)雜的調(diào)查過程中經(jīng)常會出現(xiàn)樣本結(jié)構(gòu)與總體結(jié)構(gòu)不一致的情況。對調(diào)查的樣本結(jié)構(gòu)進行有效的加權(quán)調(diào)整。,加權(quán)調(diào)整的必要性,大規(guī)模調(diào)查中調(diào)查樣本與總體經(jīng)常存在結(jié)構(gòu)性偏差。產(chǎn)生結(jié)構(gòu)性偏差的原因很多,主要原因有:(1)調(diào)查前不能進行或來不及事先分層,使得在影響目標量的主要輔助變量上,調(diào)查后樣本結(jié)構(gòu)與總體結(jié)構(gòu)存在偏差。(2)進行分層多階段抽樣設(shè)計時,劃分總體的分
5、類指標很多,但由于條件的限制,往往不能完全考慮這些分類指標。比如分層考慮了最主要的指標地區(qū)、城鄉(xiāng),沒有考慮同樣與調(diào)查目標量高度相關(guān)的年齡、文化程度等因素。,,(3)大規(guī)模的調(diào)查涉及調(diào)查單位和人員廣泛,層層監(jiān)督和控制難度加大。(4)大規(guī)模抽樣調(diào)查后期對大量數(shù)據(jù)的處理會對樣本結(jié)構(gòu)產(chǎn)生影響。如調(diào)查中無回答產(chǎn)生的問卷失效率較高,剔除失效問卷往往會產(chǎn)生結(jié)構(gòu)性偏差。,,例如:,此外還有民族、文化程度、城鄉(xiāng)、年齡等因素。,,若在與調(diào)查目標量高度相關(guān)
6、的指標上,調(diào)查的樣本結(jié)構(gòu)與總體結(jié)構(gòu)有較大的偏差,直接利用調(diào)查樣本的初始權(quán)數(shù)進行估計勢必影響目標估計量的估計精度。在這種情況下,要想較為準確地推斷出總體的有關(guān)信息,提高估計的精度,就必須對調(diào)查的樣本結(jié)構(gòu)進行加權(quán)調(diào)整。,如何調(diào)整權(quán)數(shù)?,通常采用基于多變量輔助信息、事后分層、非線性口徑等校準加權(quán)方法對樣本結(jié)構(gòu)進行加權(quán)調(diào)整,以減少樣本結(jié)構(gòu)與總體結(jié)構(gòu)的差異性,達到減小抽樣方差和偏差,提高估計精度的目的。,三、追加后的估計,為該省全國樣本和追加樣
7、本的目標參數(shù)的總量估計; 為該省全國樣本的目標參數(shù)的總量估計; 為該省追加樣本的目標參數(shù)的總量估計。,四、幾個問題的說明,1、為什么有些縣有樣本,而有些縣沒有落入樣本? 由抽樣的隨機性本身決定。2、為什么不能進行縣域的估計? 樣本追加方案設(shè)計是以省為總體設(shè)計,因此追加后的樣本僅對省級層面具有代表性,目的是為了進行省級推斷。落入各區(qū)縣的樣本對各個區(qū)縣不具代表性,且樣本量過小,進行縣域一級的估計會產(chǎn)
8、生較大的誤差,與真實情況產(chǎn)生偏離。,,3、調(diào)查樣本量是怎么確定的?為什么有些人群的計算結(jié)果不能呈現(xiàn)? 調(diào)查樣本量是根據(jù)抽樣技術(shù)原理計算得到的,以估計簡單隨機抽樣總體比例P時的樣本量為基礎(chǔ)。樣本量的計算公式為: 式中,r為相對誤差限, 為t統(tǒng)計量值。,,,在95%的置信度下,根據(jù)調(diào)查結(jié)果的普遍情況,以5%作為P的基準值,以50%的相對誤差限計算得到n。 同時結(jié)合各地分人群樣本分布狀況,結(jié)合可操作性
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 省(自治區(qū)、直轄市)
- 省(自治區(qū)、直轄市)市縣(區(qū))
- 以?。ㄖ陛犑小⒆灾螀^(qū))劃分的
- 各流域機構(gòu),各?。ㄗ灾螀^(qū)、直轄市)水利(水務(wù))
- 各流域機構(gòu),各?。ㄗ灾螀^(qū)、直轄市)水利(水務(wù))廳(局
- 全國31個省、自治區(qū),4個直轄市,5個單列市
- 各省、自治區(qū)、直轄市黨委黨校(行政學(xué)院),鐵道黨校,
- 主送各省、自治區(qū)、直轄市教育廳(教委),各計劃單列
- 2009年?。ㄗ灾螀^(qū)、直轄市)礦業(yè)權(quán)核查基數(shù)統(tǒng)計表
- ?。ㄗ灾螀^(qū)、直轄市)繼續(xù)醫(yī)學(xué)教育管理工作評估指標
- 省、自治區(qū)、直轄市間調(diào)運森林植物和產(chǎn)品檢疫核發(fā)
- 甲、乙級城市規(guī)劃編制單位跨省、自治區(qū)、直轄市承擔規(guī)劃編
- 各省、自治區(qū)、直轄市黨委、政府,中央各部委,國家機關(guān)各
- 中國經(jīng)濟區(qū)域劃分——基于各?。ㄗ灾螀^(qū),直轄市)人均GDP曲線的劃分.pdf
- 區(qū)域能源效率及其影響因素研究——以中國30個省、自治區(qū)、直轄市為例.pdf
- 82416.我國公共教育支出效率的比較分析——基于31個省直轄市、自治區(qū)層面
- 全國導(dǎo)游資格考試《地方導(dǎo)游基礎(chǔ)知識》全國省份自治區(qū)直轄市基本概況
- 增設(shè)直轄市,還是增設(shè)“特別市”?
- 區(qū)域科技資源配置效率、時空格局和影響因素研究——以中國31個省、自治區(qū)、直轄市為例
- 王安順直轄市最年輕市長
評論
0/150
提交評論