數(shù)量特征敏感問題樣本輪換下連續(xù)調查的統(tǒng)計方法及應用.pdf_第1頁
已閱讀1頁,還剩207頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、目的:
  所謂敏感性問題的研究,即在抽樣調查中,若關心的變量或個體是涉及個人隱私或不被社會認可的敏感性問題,采用直接調查的方法會使部分被調查對象出于自我保護的心理而產(chǎn)生一定程度的不合作甚至拒絕回答,調查結果難以反映總體的真實特征。由于敏感性問題的特殊性,不宜采用常規(guī)的調查方法來研究,這就要求調查者不斷提出特殊的、科學可行的新方法來減少誤差,提高受訪者的應答率,使結果更加真實可靠。為了提高敏感性問題的正確應答率,Warner通過引

2、入隨機化裝置,成功實現(xiàn)了在不暴露應答者隱私的情況下獲得人群中某敏感性問題的發(fā)生比例,開創(chuàng)了隨機應答技術(Randomized Response Technique,RRT)的先河。
  抽樣調查是經(jīng)濟社會學、衛(wèi)生工作及醫(yī)學科研中的重要統(tǒng)計學方法,
  是統(tǒng)計學的基本內(nèi)容。隨著社會經(jīng)濟的不斷發(fā)展和變化,很多調查對象的總體也在不斷發(fā)展和變化。一方面,為了調查總體在不同時間上的水平及其變化、累計或平均水平,尤其對很多重要的醫(yī)學方面

3、調查等,須采用連續(xù)調查(每隔一定時間對同一總體反復調查),我國建立的統(tǒng)計調查體系正是以經(jīng)常性的連續(xù)調查為主體。另一方面,對固定樣本進行多次調查存在代表性下降和樣本疲勞兩個嚴重問題;在不同次調查中重新抽取不同的新樣本,也存在另幾個嚴重問題:如不能利用固定樣本的前期資料對現(xiàn)期總體做出精度較高的回歸組合估計,與固定樣本相比,調查費用更高,難度更大,時間更長等等。為了權衡這兩方面的問題,國內(nèi)外的統(tǒng)計學家早已研究出樣本輪換(在樣本容量不變的前提下

4、,每隔一定時間更換部分樣本單位)的好方法。
  目前國內(nèi)外對一次性抽樣調查的研究較多,理論及方法比較成熟,而對于連續(xù)調查的研究較少,理論與方法很不成熟。有關連續(xù)抽樣調查的研究,在本團隊研究之前,國內(nèi)外主要局限于對簡單隨機抽樣調查中的樣本輪換問題的研究,復雜抽樣方法下連續(xù)調查中樣本輪換問題的研究甚少,尤其對敏感問題連續(xù)抽樣調查的研究至今是空白。敏感問題連續(xù)抽樣調查的研究,是國內(nèi)外衛(wèi)生與醫(yī)學統(tǒng)計學及統(tǒng)計學中抽樣研究的發(fā)展趨勢,是國內(nèi)外

5、統(tǒng)計學及統(tǒng)計學理論與方法學的重要研究課題?;诖耍疚牡谝徊糠?,分別對敏感問題數(shù)量特征加法 RRT模型、敏感問題數(shù)量特征乘法RRT模型2種RRT模型與簡單隨機抽樣下樣本輪換的連續(xù)調查、分層簡單隨機抽樣下樣本輪換的連續(xù)調查、整群抽樣下樣本輪換的連續(xù)調查、分層整群抽樣下樣本輪換的連續(xù)調查、二階段抽樣下樣本輪換的連續(xù)調查、分層二階段抽樣下樣本輪換的連續(xù)調查6種連續(xù)調查方法組合的12種調查方法,提供總體均值的估計量及其方差、最優(yōu)樣本輪換率與回歸

6、組合估計的最優(yōu)權數(shù)的計算公式。本文第二部分,采用本文第一部分研究的調查方法及其統(tǒng)計公式,對北京市男男性行為這一艾滋病高危人群進行了連續(xù)抽樣調查分析,為艾滋病的預防控制提供準確可靠的數(shù)據(jù)。本文第三部分,分別對本文第一部分研究的12種敏感問題連續(xù)抽樣調查方法及其統(tǒng)計公式,采用大樣本個數(shù)的計算機模擬抽樣調查分析,評價信度與效度。
  方法:
  一、在調查方法的設計及統(tǒng)計公式的推導證明中:統(tǒng)計抽樣的理論方法、回歸估計的理論方法、比

7、率估計的理論方法、連續(xù)調查的理論方法、樣本輪換的理論方法及概率統(tǒng)計的基本理論方法被應用;簡單隨機抽樣、分層簡單隨機抽樣、整群抽樣、分層整群抽樣、兩階段抽樣、分層兩階段抽樣6種抽樣方法被采用;數(shù)量特征加法RRT模型、數(shù)量特征乘法RRT模型被采用。
  二、本團隊對非敏感性問題使用分層簡單隨機抽樣下樣本輪換的連續(xù)調查、整群抽樣下樣本輪換的連續(xù)調查、分層整群抽樣下樣本輪換的連續(xù)調查、二階段抽樣下樣本輪換的連續(xù)調查、分層二階段抽樣下樣本輪

8、換的連續(xù)調查、二階段整群抽樣下樣本輪換的連續(xù)調查、分層二階段整群抽樣下樣本輪換的連續(xù)調查七種調查方法,推導出總體均值的估計量及其方差與估計方差的計算公式,為本文進行了方法學前期探討。
  三、樣本輪換(Sample rotation)是提高調查的效率、減少和控制非抽樣誤差的重要手段。樣本輪換由于既保留了部分原有樣本單位,又增加了部分新樣本單位,所以兼有全新樣本與固定樣本的優(yōu)點,能在抽樣費用與抽樣精度之間取得平衡,并已大規(guī)模地應用于

9、國內(nèi)外連續(xù)調查的抽樣中。本文采用上述研究的調查方法及其統(tǒng)計公式,對北京市男男性行為這一艾滋病高危人群進行了敏感問題樣本輪換下整群連續(xù)抽樣與分層整群連續(xù)抽樣調查分析,數(shù)據(jù)管理與計算通過Excel2003及MATLAB軟件完成。
  四、本文分別對上述研究的12種敏感問題連續(xù)抽樣調查方法及其統(tǒng)計公式,采用大樣本個數(shù)的計算機模擬抽樣調查分析,進行信度與效度評價。在信度、效度評價中,運用了信度、效度的評價方法;采用MATLAB作為模擬平臺

10、,數(shù)據(jù)分析、計算機編程設計相關程序及結果分析均是通過MATLAB軟件實現(xiàn)。
  結果:
  一、推導出12種敏感問題樣本輪換下連續(xù)調查的統(tǒng)計公式
  1.本文對數(shù)量特征敏感問題加法RRT模型簡單隨機抽樣下樣本輪換的連續(xù)調查,設計了調查方法,推導出敏感問題總體均數(shù)的估計量及其方差及最優(yōu)權數(shù)與最優(yōu)樣本輪換率的計算公式。
  2.本文對數(shù)量特征敏感問題乘法RRT模型簡單隨機抽樣下樣本輪換的連續(xù)調查,設計了調查方法,推導

11、出敏感問題總體均數(shù)的估計量及其方差及最優(yōu)權數(shù)與最優(yōu)樣本輪換率的計算公式。
  3.本文對數(shù)量特征敏感問題加法 RRT模型分層簡單隨機抽樣下樣本輪換的連續(xù)調查,設計了調查方法,推導出敏感問題總體均數(shù)的估計量及其方差及最優(yōu)權數(shù)與最優(yōu)樣本輪換率的計算公式。
  4.本文對數(shù)量特征敏感問題乘法 RRT模型分層簡單隨機抽樣下樣本輪換的連續(xù)調查,設計了調查方法,推導出敏感問題總體均數(shù)的估計量及其方差及最優(yōu)權數(shù)與最優(yōu)樣本輪換率的計算公式。

12、
  5.本文對數(shù)量特征敏感問題加法RRT模型整群隨機抽樣下樣本輪換的連續(xù)調查,設計了調查方法,推導出敏感問題總體均數(shù)的估計量及其方差及最優(yōu)權數(shù)與最優(yōu)樣本輪換率的計算公式。
  6.本文對數(shù)量特征敏感問題加法 RRT模型分層整群隨機抽樣下樣本輪換的連續(xù)調查,設計了調查方法,推導出敏感問題總體均數(shù)的估計量及其方差及最優(yōu)權數(shù)與最優(yōu)樣本輪換率的計算公式。
  7.本文對數(shù)量特征敏感問題乘法RRT模型整群隨機抽樣下樣本輪換的連

13、續(xù)調查,設計了調查方法,推導出敏感問題總體均數(shù)的估計量及其方差及最優(yōu)權數(shù)與最優(yōu)樣本輪換率的計算公式。
  8.本文對數(shù)量特征敏感問題乘法 RRT模型分層整群隨機抽樣下樣本輪換的連續(xù)調查,設計了調查方法,推導出敏感問題總體均數(shù)的估計量及其方差及最優(yōu)權數(shù)與最優(yōu)樣本輪換率的計算公式。
  9.本文對數(shù)量特征敏感問題加法 RRT模型二階段隨機抽樣下樣本輪換的連續(xù)調查,設計了調查方法,推導出敏感問題總體均數(shù)的估計量及其方差及最優(yōu)權數(shù)與

14、最優(yōu)樣本輪換率的計算公式。
  10.本文對數(shù)量特征敏感問題加法RRT模型分層二階段隨機抽樣下樣本輪換的連續(xù)調查,設計了調查方法,推導出敏感問題總體均數(shù)的估計量及其方差及最優(yōu)權數(shù)與最優(yōu)樣本輪換率的計算公式。
  11.本文對數(shù)量特征敏感問題乘法RRT模型二階段隨機抽樣下樣本輪換的連續(xù)調查,設計了調查方法,推導出敏感問題總體均數(shù)的估計量及其方差及最優(yōu)權數(shù)與最優(yōu)樣本輪換率的計算公式。
  12.本文對數(shù)量特征敏感問題乘法R

15、RT模型分層二階段隨機抽樣下樣本輪換的連續(xù)調查,設計了調查方法,推導出敏感問題總體均數(shù)的估計量及其方差及最優(yōu)權數(shù)與最優(yōu)樣本輪換率的計算公式。
  二、北京市MSM人群樣本輪換下整群抽樣與分層整群抽樣的連續(xù)調查
  本文采用了敏感問題數(shù)量特征加法模型,分別于2010年、2012年連續(xù)兩次調查北京市15-49歲男性MSM人群首次男男性行為的年齡,男男性行為月人均不同性伴人數(shù),月人均男男性行為次數(shù)(參見附錄一:敏感問題MSM人群R

16、RT調查方案)。分別對敏感問題數(shù)量特征加法 RRT模型的樣本輪換下整群抽樣、分層整群抽樣進行了連續(xù)調查。
  1.敏感問題數(shù)量特征加法RRT模型的樣本輪換下整群抽樣連續(xù)調查結果:
  ⑴第一次調查男男同性戀者首次發(fā)生男男性行為平均年齡的估計值為20.36歲,計算2012年北京市MSM人群首次男男性行為平均年齡的估計值為23.14歲,計算得2?Y的估計差為0.2112,由此可得2012年北京市MSM人群首次發(fā)生男男性行為年齡總

17、體均數(shù)的95%置信區(qū)間為22.22~24.02(歲)。
  ⑵計算得到第一次調查男男同性戀者不同男性性伴的月平均人數(shù)的估計值為3.48人,計算2012年北京市MSM人群不同男性性伴的月平均人數(shù)的估計值為3.20人,計算得2?Y的估計差為0.0448,2012年北京市 MSM人群上月發(fā)生男男性行為不同男性性伴人數(shù)的總體均數(shù)95%的置信區(qū)間為2.79~3.61(人)。
  ⑶計算得到第一次調查男男同性戀者上個月發(fā)生男男性行為的月

18、平均次數(shù)的估計值為5.56次,計算2012年北京市MSM人群上個月所發(fā)生男男性行為平均次數(shù)估計值為4.30次,計算得2?Y的估計方差為0.1338,可得2012年北京市MSM人群上月發(fā)生男男性行為次數(shù)的總體均數(shù)95%的置信區(qū)間為3.58~5.02(次)。
  2.敏感問題數(shù)量特征加法RRT模型的樣本輪換下分層整群抽樣連續(xù)調查結果:
  ⑴2010年第一次調查第一層男男同性戀者首次發(fā)生男男性行為平均年齡的估計值為19.66歲,

19、第一次調查第二層男男同性戀者首次發(fā)生男男性行為平均年齡的估計值為21.10歲;計算北京市15-29歲MSM人群2012年第二次調查首次男男性行為平均年齡的估計值為21.97歲,計算北京市30-49歲MSM人群2012年第二次調查首次男男性行為平均年齡的估計值為27.11歲,計算北京市MSM人群2012年第二次調查首次男男性行為平均年齡的估計值為24.01歲,2012年北京市MSM人群首次發(fā)生男男性行為年齡總體均數(shù)的95%置信區(qū)間為23.

20、49~24.53(歲)。
 ?、?010年第一次調查第一層男男同性戀者男男性行為不同性伴月人均人數(shù)的估計值為3.38人,計算得第一次調查第二層男男性行為不同性伴月人均人數(shù)的估計值為3.50人,計算北京市15-29歲MSM人群2012年第二次調查男男性行為不同性伴月人均人數(shù)的估計值為2.96人,計算北京市MSM人群2012年第二次調查男男性行為不同性伴月人均人數(shù)的估計值為2.30人,可得2012年北京市MSM人群上個月發(fā)生男男性行為

21、不同性伴人數(shù)總體均數(shù)的95%置信區(qū)間為1.79~2.81(人)。
 ?、怯嬎愕玫谝淮握{查第一層男男同性戀者男男性行為月平均次數(shù)的估計值為5.12次,計算得第一次調查第二層男男性行為月平均次數(shù)的估計值為5.66次,計算北京市15-29歲MSM人群2012年第二次調查男男性行為月平均次數(shù)的估計值為4.61次,計算北京市30-49歲MSM人群2012年第二次調查男男性行為月平均次數(shù)的估計值為2.91次,計算北京市MSM人群2012年第二

22、次調查男男性行為不同性伴月平均次數(shù)的估計值為3.90次,可得2012年北京市MSM人群首次發(fā)生男男性行為年齡總體均數(shù)的95%置信區(qū)間為3.69~4.12(次)。
  三、敏感問題樣本輪換下連續(xù)調查的統(tǒng)計方法基于計算機模擬的信度與效度評價1.模擬數(shù)量特征加法RRT模型的樣本輪換下簡單隨機抽樣連續(xù)調查
  相對標準誤差RSE的值為0.000012168,遠遠小于0.01;相對絕對誤差RAE的值為0.00036479,遠遠小于0.

23、01;對模擬抽樣的100個樣本,計算100個樣本均數(shù)的估計量及其方差,獲得100個樣本的總體均數(shù)95%置信區(qū)間,全部(100%)包含模擬總體均數(shù)。
  2.模擬數(shù)量特征乘法RRT模型的樣本輪換下簡單隨機抽樣連續(xù)調查
  相對標準誤差RSE的值為0.0007541,遠遠小于0.01;相對絕對誤差RAE的值為0.0003870,遠遠小于0.01;對模擬抽樣的100個樣本,計算100個樣本均數(shù)的估計量及其方差,獲得100個樣本的總

24、體均數(shù)95%置信區(qū)間,全部(100%)個包含模擬總體均數(shù).
  3.數(shù)量特征加法RRT模型的樣本輪換下分層簡單隨機抽樣連續(xù)調查
  相對標準誤差 RSE的值為0.000011415,遠遠小于0.01;相對絕對誤差 RAE值為0.00016318,遠遠小于0.01,接近于總體均數(shù);對模擬抽樣的100個樣本,計算100個樣本均數(shù)的估計量及其方差,獲得100個樣本的總體均數(shù)95%置信區(qū)間,全部(100%)個包含模擬總體均數(shù)。

25、>  4.數(shù)量特征乘法RRT模型的樣本輪換下分層簡單隨機抽樣連續(xù)調查
  相對標準誤差RSE的值為0.0184,遠遠小于0.01;相對絕對誤差RAE值為0.0021,遠遠小于0.01,接近于總體均數(shù);對模擬抽樣的100個樣本,計算100個樣本均數(shù)的估計量及其方差,獲得100個樣本的總體均數(shù)95%置信區(qū)間,全部(100%)個包含模擬總體均數(shù)。
  5.數(shù)量特征加法RRT模型的樣本輪換下整群抽樣連續(xù)調查
  相對標準誤差

26、RSE的值為0.00082199,遠遠小于0.01;相對絕對誤差 RAE值為0.000099452,遠遠小于0.01,接近于總體均數(shù);對模擬抽樣的100個樣本,計算100個樣本均數(shù)的估計量及其方差,獲得100個樣本的總體均數(shù)95%置信區(qū)間,全部(100%)個包含模擬總體均數(shù)。
  6.數(shù)量特征加法RRT模型的樣本輪換下分層整群抽樣連續(xù)調查
  相對標準誤差 RSE的值為0.0071451,遠遠小于0.01;相對絕對誤差 RA

27、E值為0.00037591,遠遠小于0.01,接近于總體均數(shù);對模擬抽樣的100個樣本,計算100個樣本均數(shù)的估計量及其方差,獲得100個樣本的總體均數(shù)95%置信區(qū)間,全部(100%)個包含模擬總體均數(shù)。
  7.數(shù)量特征乘法RRT模型的樣本輪換下整群抽樣連續(xù)調查
  相對標準誤差 RSE的值為0.0011,遠遠小于0.01;相對絕對誤差 RAE值為0.00022685,遠遠小于0.01,接近于總體均數(shù);對模擬抽樣的100個

28、樣本,計算100個樣本均數(shù)的估計量及其方差,獲得100個樣本的總體均數(shù)95%置信區(qū)間,全部(100%)個包含模擬總體均數(shù)。
  8.數(shù)量特征乘法RRT模型的樣本輪換下分層整群抽樣連續(xù)調查
  相對標準誤差 RSE的值為0.0069,遠遠小于0.01;相對絕對誤差 RAE值為0.00089859,遠遠小于0.01,接近于總體均數(shù);對模擬抽樣的100個樣本,計算100個樣本均數(shù)的估計量及其方差,獲得100個樣本的總體均數(shù)95%置

29、信區(qū)間,全部(100%)個包含模擬總體均數(shù)。
  9.數(shù)量特征加法RRT模型的樣本輪換下兩階段抽樣連續(xù)調查
  相對標準誤差 RSE的值為0.00077796,遠遠小于0.01;相對絕對誤差 RAE值為0.000099244,遠遠小于0.01,接近于總體均數(shù);對模擬抽樣的100個樣本,計算100個樣本均數(shù)的估計量及其方差,獲得100個樣本的總體均數(shù)95%置信區(qū)間,全部(100%)個包含模擬總體均數(shù)。
  10.數(shù)量特征

30、加法RRT模型的樣本輪換下分層兩階段抽樣連續(xù)調查
  相對標準誤差 RSE的值為0.00056284,遠遠小于0.01;相對絕對誤差 RAE值為0.00089019,遠遠小于0.01,接近于總體均數(shù);對模擬抽樣的100個樣本,計算100個樣本均數(shù)的估計量及其方差,獲得100個樣本的總體均數(shù)95%置信區(qū)間,全部(100%)個包含模擬總體均數(shù)。
  11.數(shù)量特征乘法RRT模型的樣本輪換下兩階段抽樣連續(xù)調查
  相對標準誤

31、差 RSE的值為0.00059809,遠遠小于0.01;相對絕對誤差 RAE值為0.00029276,遠遠小于0.01,接近于總體均數(shù);對模擬抽樣的100個樣本,計算100個樣本均數(shù)的估計量及其方差,獲得100個樣本的總體均數(shù)95%置信區(qū)間,全部(100%)個包含模擬總體均數(shù)。
  12.數(shù)量特征乘法RRT模型的樣本輪換下分層兩階段抽樣連續(xù)調查
  相對標準誤差 RSE的值為0.00091709,遠遠小于0.01;相對絕對誤

32、差 RAE值為0.00023691,遠遠小于0.01,接近于總體均數(shù);對模擬抽樣的100個樣本,計算100個樣本均數(shù)的估計量及其方差,獲得100個樣本的總體均數(shù)95%置信區(qū)間,全部(100%)個包含模擬總體均數(shù)。
  結論:
  1.本文分別對敏感問題2種隨機應答模型與6種連續(xù)抽樣方法組合共12種調查方法,從數(shù)學上首次推導出敏感問題總體均數(shù)的估計量、總體均值估計量的方差及最優(yōu)權數(shù)與最優(yōu)樣本輪換率的計算公式,填補了抽樣研究統(tǒng)計

33、方法上的空白。
  2.采用本文研究的調查方法及其統(tǒng)計公式,成功應用于北京市男男性行為人群這一艾滋病高危人群的敏感問題調查分析,取得了良好的實際應用效果,可看出樣本輪換下分層整群抽樣連續(xù)調查比樣本輪換下整群抽樣連續(xù)調查的抽樣誤差更小、可信區(qū)間的精度更高。調查分析結果為相關部門制定艾滋病預防控制措施提供了重要的科學依據(jù),也說明本文研究的調查方法及其統(tǒng)計公式具有較大的實際意義。
  3.對敏感問題樣本輪換下連續(xù)調查的統(tǒng)計方法基于

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論