[學(xué)習(xí)]概率論-抽樣原理與方法_第1頁
已閱讀1頁,還剩35頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、,,第七章,抽樣原理與方法,,,,,,,?,抽樣是從所研究的總體中抽取一定數(shù)量的個體構(gòu)成樣本,通過對樣本特征的研究和計算,進(jìn)而 對總體特征作出推斷。******************,****************************************************************************************************

2、*****,**************,,,?,實際工作中,由于存在無限總體,即使是有限總體,由于受到人力、物力、財力及其他因素的限制,只能通過對樣本的研究和分析,推斷該樣本所在總體的特征。,,,,一、全及總體與樣本總體,??,全及總體簡稱總體,是指所研究現(xiàn)象的全體??傮w單位數(shù)用N表示。樣本總體簡稱樣本,是指按照隨機(jī)原則,從全及總體中抽取的一部分單位所組成的小總體,用n表示。,,,?總體成數(shù),?總體

3、方差,?樣本成數(shù),?樣本方差,二、全及指標(biāo)(參數(shù))和樣本指標(biāo)(統(tǒng)計量)1、全及指標(biāo):根據(jù)總體各單位的標(biāo)志或標(biāo)志屬性計算的,反映總體數(shù)量特征的綜和指標(biāo)稱為全及指標(biāo)。2、樣本指標(biāo):根據(jù)樣本各單位標(biāo)志值或標(biāo)志屬性計算的綜合指標(biāo)稱為統(tǒng)計量。,?總體平均數(shù)?全及指標(biāo)??總體標(biāo)準(zhǔn)差?,?樣本平均數(shù)?樣本指標(biāo)??樣本標(biāo)準(zhǔn)差?,,,三、樣本容量和樣本個數(shù),樣本容量是指一個樣本所包含的單位數(shù)。,樣本個數(shù)又稱樣本可能

4、數(shù)目,指從一個總體中可,能抽取的樣本個數(shù),四、重復(fù)抽樣和不重復(fù)抽樣,,,,?,抽樣誤差的概念:由于生物界變異普遍存在,進(jìn)行隨機(jī)抽樣時,不可避免地造成樣本統(tǒng)計量與總體參數(shù)之間或各樣本統(tǒng)計量之間的差別,稱為抽樣誤差。,,,,?,抽樣誤差存在的根本原因:個體差異由于個體差異的普遍存在,所以抽樣誤差是不可避免的(但其存在是有規(guī)律的),為更加準(zhǔn)確地通過樣本統(tǒng)計量估計其總體參數(shù),就應(yīng)該尋找抽樣誤差的規(guī)律,估計抽樣誤差的

5、大小。,,,,,,,,,,,,,,,,,,,,,,,,,,,?,樣本平均數(shù)的標(biāo)準(zhǔn)誤,?,?,df=n-1,σn,σ X =置信區(qū)間,sn,sx =,(x ? t0.05sx, x + t0.05sx),,,,,,,,,,,,,,,,?,樣本頻率的標(biāo)準(zhǔn)誤,??,置信區(qū)間df=n-1,p(1? p)n,sp =,(p? u0.05sp, p+ u0.05sp),,,,,t0.0

6、5s2,4s2,一、平均數(shù)資料樣本容量的確定根據(jù)均值區(qū)間估計公式可得樣本容量n為:,L置信半徑,即參數(shù)估計的允許誤差Δ,2,n,=,2 ≈ 2L L,,,[例]用某藥治療胃及十二指腸潰瘍病人,服藥四周后胃鏡復(fù)查時,患者潰瘍面平均縮小0.2cm2,標(biāo)準(zhǔn)差為0.4cm2,假定該藥確能使?jié)兠婵s小或愈合,問需多少病人作療效觀察才能在α=0.05的水準(zhǔn)

7、上發(fā)出用藥前后相差顯著?,,,=,= 900,二、頻率資料樣本容量的確定,[例]擬了解40歲以上男性冠心病患病率,據(jù)以往調(diào)查,預(yù)測其患病率在10%左右,允許誤差為2%,試計算需要調(diào)查多少人才比較合適。已知p=10%=0.1,L=2%=0.02,可得,4p(1? p)L 2,n =,n,4p(1? p)L 2,4×0.1×0.90.022,=,,,,,,,t0.05sd

8、 d 2,4s,三、成對資料樣本容量的確定,n,=,2 22 ≈ 2d d,sd = sx1?x2,,,,,,,,,,,,,2t0.05sx 21 2,? x,(x1 2),四、非成對資料樣本容量的確定,2,2,n,?x2,=,≈,8sx1?x2(x1 ?

9、 x2)2,,,[例]某職業(yè)病防治所用兩種療法治療矽肺患者,一個療程后,患者血清粘蛋白下降值甲療法平均為2.6(mg),乙療法平均為2.0(mg,)兩種療法下降值之合并標(biāo)準(zhǔn)差為1.3(mg)。若要發(fā)現(xiàn)兩組療效相差顯著,每組至少應(yīng)觀察多少病人?,,,[例]據(jù)某院初步觀察,用甲、乙兩種藥物治療慢性氣管炎患者,近控率甲藥為45%,乙藥為25%?,F(xiàn)擬進(jìn)一步試驗,問每組需觀察多少例,

10、才可能在α=0.05的水準(zhǔn)上發(fā)現(xiàn)兩種療法近控率有顯著相差?,,,一.隨機(jī)(概率)抽樣,? 簡單隨機(jī)抽樣? 分層抽樣,? 系統(tǒng)(等距)抽樣? 整群(集體)抽樣? 多階段抽樣? 雙重抽樣,,,?簡單隨機(jī)抽樣,它是按隨機(jī)原則直接從總體N個單位中抽出n個單位作為樣本,總體中每個總體單位都有同等被抽取的機(jī)會,適用于均勻總體。,?重置抽樣又稱重復(fù)抽樣、有放回抽樣,是每次從總體中

11、抽取,一個單位,觀察記錄后又放回,再抽取下一個。,?不重置抽樣又稱不重復(fù)抽樣、無放回抽樣,是每次從總體中,抽取一個單位,觀察記錄后不放回,再抽取下一個。,,,,,,σ,Nt,N?X +t,Nt p(1? p),N?P +t p(1? p),??,重復(fù)抽樣(同前)不重復(fù)抽樣,2,2 2,2σ,2,n,=,2 2,2,n,=,,,?,優(yōu)點:,(1)比較容易理

12、解和掌握;(2)抽樣框不需要其他輔助信息;(3)理論上比較成熟,有現(xiàn)成的方差估計公式。,?,缺點:,(1)沒有利用輔助信息;(2)樣本分散,面訪費(fèi)用較高;(3)有可能抽到較差的樣本;(4)抽選大樣本比較費(fèi)時,,,,,,,,,,,,,,,,,,,,,,,,,定義:在抽樣之前將總體按變異原因或程度或分成若干區(qū)層。然后在每一個層獨立地隨機(jī)抽取樣本。,??,將相似的個體歸入一類,即為一層,分

13、層要求每層的各個個體互不交叉,即遵循不重復(fù)、不遺漏的原則。分層抽樣示意圖,,,分層抽樣的步驟:,(1)按某種特征將總體分成互不相交的層(2)按比例k=n/N確定每層抽取個體的個數(shù)(n/N)*Ni個。,(3)各層分別按簡單隨機(jī)抽樣的方法抽取。(4)綜合每層抽樣,組成樣本。,,,例 某高中共有900人,其中高一年級300人,高二年級200人,高三年級400人,現(xiàn)采用分層抽樣抽取容量為45的樣本,那么高一、高二、高

14、三各年級抽取的人數(shù)分別為( ),A.15,5,25 B.15,15,15C.10,5,30 D15,10,20,,,,??,優(yōu)點:樣本代表性高、抽樣誤差小、抽樣調(diào)查成本較低。如果抽樣誤差的要求相同的話則抽樣數(shù)目可以減少。缺點:必須有分層的輔助信息;若調(diào)查變量與分層的變量不相關(guān)

15、,效率可能降低;估計值的計算比簡單隨機(jī)抽樣復(fù)雜,,,??,定義:又稱等距抽樣,對研究的總體按一定的順序排列,每隔一定的間隔抽取一個單元的抽樣方法。抽選方法:設(shè)總體單元數(shù)為N,要抽n個單元為樣本,先計算抽樣間隔k=N/n,在1到k之間抽取一個隨機(jī)起點r,則被抽中單元的順序位置是:r,r+k,r+2k,…。當(dāng)N不能被n整除時,可采用隨機(jī)抽樣的方法從總體中剔除部分個體,使剩下的個體數(shù)能被樣本容量整除,然

16、后再采用系統(tǒng)抽樣方法。,,,?,系統(tǒng)抽樣的缺點,(1)若抽樣間隔與總體的某種周期性變化一致,會得一個差的樣本;(2)不使用輔助信息使抽樣效率不高;(3)樣本彼此不獨立,沒有一個無偏的方差估計量,對抽樣誤差的估計只是近似的。,??,系統(tǒng)抽樣比簡單隨機(jī)抽樣更容易實施,可節(jié)約抽樣成本;我們國家的國家統(tǒng)計局的調(diào)查多采用系統(tǒng)抽樣,它便于操作。,,,?,整群抽樣即從全及總體中成群地抽取樣本單位,對抽中的群內(nèi)的所有單

17、位都進(jìn)行觀察。綠色為總體紅色為群白點為基本單元,,,?,整群抽樣的優(yōu)點:,(1)能大大減低收集數(shù)據(jù)的費(fèi)用;(2)當(dāng)總體單元自然形成群時,容易取得抽樣框,抽樣也更容易;(3)當(dāng)群內(nèi)單元差異大,而不同群之間的差異小時,可以提高效率。,,,?,整群抽樣的缺點:,(1)若群內(nèi)個單元有趨同性,效率將會降低;(2)通常無法預(yù)先知道總樣本量,因為不知道群內(nèi)有多少單元;(3)方差估計比簡單隨機(jī)抽樣

18、更為復(fù)雜,?,可以綜合利用分層和整群抽樣技術(shù),采取分層整群抽樣,比如人體尺寸調(diào)查,采用分層提高樣本代表性,采用整群抽樣,便于數(shù)據(jù)的收集。,,,?,是由兩個或更多個連續(xù)的階段抽取樣本的方法。①先抽大單位(可以用類型抽樣或機(jī)械抽樣)②再在大單位中抽小單位(可用整群抽樣或簡單隨機(jī)抽)③小單位中再抽更小的單位;而不是一次就直接抽取基層的調(diào)查單位。,,,優(yōu)點:(1)當(dāng)群具有同質(zhì)性時,多階抽樣的效率高于整群

19、抽樣;,(2)樣本的分布比簡單隨機(jī)抽樣集中,采用面訪可以節(jié)約時間和費(fèi)用;(3)不需要整個總體單元的名錄框,只要群的名錄框和抽中群的單元名錄框。,缺點: (1)效率不如簡單隨機(jī)抽樣;(2)通常不能提前知道最終的樣本量;(3)調(diào)查的組織較整群抽樣復(fù)雜;(4)估計值與抽樣方差的計算較為復(fù)雜。,,,,??,又稱二重抽樣、復(fù)式抽樣,相關(guān)抽樣法。是指在抽樣時分兩次抽取樣本的一種抽樣方式。

20、雙重抽樣的主要作用是提高抽樣效率、節(jié)約調(diào)查經(jīng)費(fèi)。,,,,?,雙重抽其具體步驟為:,首先抽取一個初步樣本,并搜取一些簡單項目以獲得有關(guān)總體的信息; 然后,在此基礎(chǔ)上再進(jìn)行深入抽樣。?做一次隨機(jī)抽樣,調(diào)查y和x兩種性狀,從中求出y依x的回歸方程。這個樣本容量n 不一定很大,但希望x和y有較大的幅度。?采用雙重抽樣法,必須注重y和x兩性狀間不但要有顯著相關(guān),而且須有高程度顯著相關(guān),才能獲得比較準(zhǔn)確的結(jié)果,所以在建立回歸

21、方程時要檢驗其相關(guān)系數(shù)的大小及顯著性。,,,二.非隨機(jī)抽樣(非概率抽樣),? 就近抽樣(偶遇抽樣、方便抽樣、自然抽樣)? 目標(biāo)式或判斷式抽樣或立意抽樣? 滾雪球抽樣? 配額抽樣? 空間抽樣,,,???????,抽樣調(diào)查的目的和指標(biāo)要求確定調(diào)查對象(總體和觀察單位)確定抽樣調(diào)查的方法確定樣本容量和抽樣分?jǐn)?shù)總體單位編號編制抽樣調(diào)查表制訂抽

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論