非參量統(tǒng)計(jì)_第1頁
已閱讀1頁,還剩25頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、非參量統(tǒng)計(jì)nonparametric statistics,參量統(tǒng)計(jì)——嚴(yán)格要求樣本數(shù)據(jù)服從某一總體分布的假設(shè)檢驗(yàn)。 如:t檢驗(yàn)、f檢驗(yàn)的樣本數(shù)據(jù)必須服從正態(tài)分布。非參量統(tǒng)計(jì)——不考慮樣本數(shù)據(jù)的總體分布類型,而只對它進(jìn) 行一般性的假設(shè)檢驗(yàn)稱為非參量統(tǒng)計(jì)。前面所講的X2屬性 檢驗(yàn)就是一種非參量統(tǒng)計(jì),在進(jìn)行統(tǒng)計(jì)前,并不需要考慮 數(shù)據(jù)是否符合正態(tài)分布。,包括:①秩和檢驗(yàn) rank-su

2、m test ②符號(hào)檢驗(yàn) sign test ③游程檢驗(yàn) run test ④秩相關(guān) rank correiation,①秩和檢驗(yàn)——是從兩個(gè)總體中所得到的 兩個(gè)樣本之間的比較。通常一組是對照組,另一組是處理組。它的零假設(shè)是這兩個(gè)樣本是從同一總體中 抽取的。在零假設(shè)建立的前提下,將兩個(gè)樣本的數(shù)據(jù)合并,從小到大排列好,記下每個(gè)數(shù)據(jù)所對應(yīng)的序號(hào)叫秩(rank

3、),再將兩個(gè)樣本分 開,并分別計(jì)算兩個(gè)樣本的秩和,用所得的秩和作為檢驗(yàn)的統(tǒng)計(jì)量。,例:考察兩種不同類型的肥料A和B對玉米的增產(chǎn)效果。共選擇10塊地,隨機(jī)抽取n1=5塊地施用A肥料,n2=5塊地施用B肥料,結(jié)果如下表:,問:A、B兩種肥料對玉米的增產(chǎn)效果是否不同?解:H0:A=B(兩種肥料有相同的效果) HA:A≠B (兩種肥料有不同的效果) (包括A>B 或A<

4、B,雙側(cè)檢驗(yàn)) 如果零假設(shè)成立的話,則A、B在同一序列中應(yīng)該相間出現(xiàn)。也就是說,A、B出現(xiàn)的秩和應(yīng)該相同。,,A的和=70+76+84+86+94=410A的秩和=1+2+3+4+7=17B的和=90+92+100+106+122=510B的秩和=5+6+8+9+10=38總的秩和=17+38=55 因此,當(dāng)數(shù)據(jù)個(gè)數(shù)(N)已知時(shí),我們可以總結(jié)出: 總秩和=N(N+1) ÷2=10&

5、#215;(10+1) ÷2=55 P(秩和為某值)=秩和為某值的秩的組合數(shù) ÷全部秩的組合數(shù),當(dāng)n ∞時(shí),總秩和(T1+T2)逼近正態(tài)分布,,上例:,U0.01,單側(cè)=2.32610,n2>10時(shí),就可以。 2、選用的統(tǒng)計(jì)量秩和(T1或T2)以樣本容量 較小的作為統(tǒng)計(jì)量。,例:調(diào)查有視力

6、障礙的學(xué)生的IQ得分(A),視力正常的學(xué)生的IQ得分(B)。普遍認(rèn)為,有視力障礙的學(xué)生的IQ比視力正常的學(xué)生的IQ得分要低,但心理學(xué)家認(rèn)為有視力障礙的學(xué)生由于他們特別專注IQ不是低而是高。調(diào)查結(jié)果如下表:,假設(shè):H0:群體A的IQ=群體B的IQ HA:群體A的IQ>群體B的IQ將上述表中的結(jié)果的秩序列成下表:,因?yàn)闃颖続的含量較小,故以A的秩和為檢驗(yàn)統(tǒng)計(jì)量(以小樣本容量的秩和為檢驗(yàn)統(tǒng)計(jì)量,nA=1

7、0<nB=12)T=5.5+9+11+13+14+15+16+18+20+22=143.5n1=10 n2=12 代入公式:,U0.05=1.645 1.88>1.645 P<0.05拒接H0,接受HA結(jié)論是:有視力障礙的學(xué)生比視力正常的學(xué)生有較高的IQ。,比較一下秩和檢驗(yàn)與t檢驗(yàn):將表中數(shù)據(jù)進(jìn)行成組數(shù)據(jù)的t檢驗(yàn):,n1=10

8、 n2=12 1116 1263X1= 10 =111.6 x2= 12 =105.25 11162 12632 125044- 10

9、 133889- 12S12= 9 =55.38 s22= 11 =87.11,,,,,,,查表:t20,0.05=1.725 1.738>1.725 P<0.05結(jié)果仍然是:拒接H0,接受HA。與秩和檢驗(yàn)相同。,一般來說,同樣的樣本數(shù)據(jù),用t檢驗(yàn)比用秩和檢

10、驗(yàn)更為精確、有效;但t檢驗(yàn)要求樣本符合正態(tài)分布,而秩和檢驗(yàn)則不需要考慮樣本的分布問題,因而秩和檢驗(yàn)比t檢驗(yàn)的應(yīng)用范圍更加廣泛。同時(shí),秩和檢驗(yàn)還可以檢驗(yàn)按照某種標(biāo)準(zhǔn)進(jìn)行等級分類的實(shí)驗(yàn)數(shù)據(jù)。,②符號(hào)檢驗(yàn)----符號(hào)檢驗(yàn)只考慮每一對數(shù)據(jù)間相差的符號(hào),而不考慮數(shù)據(jù)間差值的大小,大于用“+”表示,小于用“-”表示。同秩和檢驗(yàn)一樣,不需要考慮數(shù)據(jù)的分布類型。它相當(dāng)于配對數(shù)據(jù)的t檢驗(yàn),但比配對數(shù)據(jù)t檢驗(yàn)有更廣泛的用途。例:用兩種不

11、同的測定方法,測定同一種藥用植物 的有效成分,共做了20次重復(fù),得到試驗(yàn)結(jié)果 如下表:,兩種不同的方法測定同一種藥用植物的有效成分的實(shí)驗(yàn)數(shù)據(jù)(mg/L),假設(shè):H0:兩種測定方法所測得的結(jié)果無顯著差異。 HA:方法A所測得的結(jié)果顯著高于方法B所 測得的結(jié)果。(單側(cè)檢驗(yàn)) 由于符號(hào)檢驗(yàn)是不考慮差值為0的,故符號(hào)總數(shù)為17個(gè)。其中n+

12、=14,n-=3。如果A、B具有相同的分布,那么,這17個(gè)符號(hào)“+”、“-”應(yīng)該各占1/2。若某一種符號(hào)偏多、另一種符號(hào)偏少,說明A、B具有不同的分布。符號(hào)檢驗(yàn)所采用的統(tǒng)計(jì)量S也是n+或n-中較少的一個(gè)。S=min(n+、n-) 本例中n=17,S=3(n-),表明方法A絕大多數(shù)高于方法B所測得的結(jié)果,因而拒絕H0,但這樣拒絕缺乏足夠的理論依據(jù),必須進(jìn)一步研究S的抽樣分布。,,⑵u測驗(yàn)法: 當(dāng)n

13、 ∞時(shí),S逼近正態(tài)分布N(µ,δ2),其中: µ=np=n/2 δ=√npq =√n/4 (二項(xiàng)分布中講過),,,,|-2.668|>U0.01=2.326 P<0.01 同樣拒絕H0,接受HA。例:一位教育學(xué)家研究一種新的語言學(xué)習(xí)方法,他認(rèn)為,在相同的時(shí)間內(nèi),除了通常的方法學(xué)習(xí)以外,在加上一些新的措施,能提高學(xué)生學(xué)習(xí)語言的能力。他以不同學(xué)校小學(xué)四年級學(xué)生為研究對象,每班

14、選出兩名語言能力近似的學(xué)生作為對子,共選出25對。將各隊(duì)隨機(jī)分成兩組,一組為對照組A,一組為實(shí)驗(yàn)組B。對照組的學(xué)生仍然回原班學(xué)習(xí),實(shí)驗(yàn)組的學(xué)生除了按通常的學(xué)習(xí)方法以外,還要求寫讀書報(bào)告,并進(jìn)行課堂討論。期末兩組學(xué)生用同樣的題目、同樣的方式一起考試,測驗(yàn)結(jié)果如下:,表 A、B兩種學(xué)習(xí)方法對語文成績影響的配對數(shù)據(jù),假設(shè):H0:兩種學(xué)習(xí)方法的效果相同。 HA:新的學(xué)習(xí)方法(A)優(yōu)于原法(B)。單側(cè)檢驗(yàn)解:n-=

15、8 n+=15 n0=2 n=25-2=23 S=8,|-1.46|0.05 接受H0。結(jié)論是新的學(xué)習(xí)方法與老的學(xué)習(xí)方法無顯著差異。我們再來比較一下配對數(shù)據(jù)的t檢驗(yàn): H0:µd=0 HA:µd>0,,,2.551>t24,0.01=2.492 P<0.01 拒絕H0,接受HA。結(jié)論是:新的學(xué)習(xí)方法極顯著地優(yōu)于老的學(xué)習(xí)

16、 方法。,符號(hào)檢驗(yàn)法與配對數(shù)據(jù)的t檢驗(yàn)法所得的結(jié)果不一樣,所以說配對數(shù)據(jù)t檢驗(yàn)法比符號(hào)檢驗(yàn)法更精確、更有效。因?yàn)榕鋵?shù)據(jù)t檢驗(yàn)法不僅考慮了符號(hào)的正負(fù),而且還考慮了差值的大小。因此,能夠用配對數(shù)據(jù)t檢驗(yàn)法時(shí),應(yīng)盡量不用符號(hào)檢驗(yàn)法。 當(dāng)然,符號(hào)檢驗(yàn)法也有它的優(yōu)點(diǎn)。如:方法簡單; 不用考慮總體的分布; 以及成對出現(xiàn)的定性資料。 所以,符號(hào)檢驗(yàn)法比配對數(shù)據(jù)t檢驗(yàn)法

17、的用途更加廣泛。,③游程檢驗(yàn):run test ------判斷觀察的樣本是否 為隨機(jī)樣本的一種檢驗(yàn)方法。 包括:游程總數(shù)檢驗(yàn)number of run test和 游程長度檢驗(yàn)length of run test。例:觀察連續(xù)出生的20個(gè)新生嬰兒的體重,將中 位數(shù)以上的記作a;中位數(shù)以下的記作b。按嬰 兒出生的時(shí)間順序可得到:序列1:a

18、 bb aaa bb a bbbb aaa bb aa 在這個(gè)序列中,相間出現(xiàn)連續(xù)的a或b,這種連續(xù)出現(xiàn)的同一種觀察值稱為一個(gè)游程(run);每一個(gè)游程內(nèi)觀察值的個(gè)數(shù)稱為游程長度(length of run);游程的個(gè)數(shù)稱為游程總數(shù)(number of runs),序列1中共出現(xiàn)5個(gè)a游程,記作:Ra=5 4個(gè)b游程,記作:Rb=4

19、 游程總數(shù)=Ra + Rb=5+4=9n1表示a的個(gè)數(shù),n2表示b的個(gè)數(shù),n1=n2=10 理論上,在一段時(shí)間內(nèi),游程總數(shù)太多或太少都不合理。如:序列2:aaaaaaaaaa bbbbbbbbbb R=2 前出生的10個(gè)嬰兒體重偏高,后10個(gè)偏低。序列3:a b a b a b a b a b a b a b a b a b a b R=20 這種情況在隨機(jī)樣本中很少出現(xiàn)。怎樣判斷

20、這3種序列是否是隨機(jī)樣本呢? 可用正態(tài)分布作近似的估計(jì):,假設(shè):H0:a、b兩樣本的出現(xiàn)時(shí)隨機(jī)的。 HA:不是隨機(jī)的。序列1:u=|-0.44|0.05,接受H0。是隨機(jī)的。序列2:u=|-3.95|>u=1.96 Pu=1.96 P<0.05,拒絕H0。非隨機(jī)。④秩相關(guān)rank correlation(即:等級相關(guān)) 在相關(guān)分析一章中已經(jīng)講過

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論