統(tǒng)計學(xué) 秩和檢驗

上傳人：奔*** IP屬地：河北更新時間：2024-01-06 格式：ppt 頁數(shù)：71 大小：678.50KB 人氣指數(shù)：12 舉報 版權(quán)申訴

已閱讀1頁，還剩70頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、等級資料的秩和檢驗,陳濤,Department of Epidemiology & Biostatistics, School of Public Health Nanjing Medical University,Rank Sum Test of Ranked Data,Biostatistics,2,資料的分類,數(shù)值變量資料分類資料,,,二分類多分類,,無序多分類有序多分類(等級資料),Biostat

2、istics,3,內(nèi)容提要：,1 醫(yī)學(xué)研究中的等級資料2 秩次與秩和 3 兩樣本比較的秩和檢驗4 多樣本比較的秩和檢驗5 配對設(shè)計的秩和檢驗6 配伍組比較的秩和檢驗7 秩和檢驗的正確應(yīng)用,Biostatistics,4,1 醫(yī)學(xué)研究中的等級資料,療效：痊愈、顯效、有效、無效、惡化化驗結(jié)果：－、?、+、++體格發(fā)育：下等、中下、中等、中上、上等心功能分級：I、II、III、IV文化程度：小

3、學(xué)、中學(xué)、大學(xué)、研究生營養(yǎng)水平：差、一般、好,Biostatistics,5,等級資料的特點,既非呈連續(xù)分布的定量資料，也非僅按性質(zhì)歸屬于獨立的若干類的定性資料；比“定量”粗，而比一般的“定性”細(xì)；等級間既非等距，亦不能度量。,,Biostatistics,6,2 秩次與秩和,Wilcoxon在1945年首先提出了比較兩個總體分布函數(shù)的秩和檢驗。秩和檢驗以及其它的秩檢驗法，都是建立在秩及秩統(tǒng)計量基礎(chǔ)上的非參數(shù)方法。秩次(ran

4、k)，秩統(tǒng)計量是指全部觀察值按某種順序排列的位序；秩和(rank sum) 同組秩次之和。,Biostatistics,7,例1 編秩(page86),A組：－、?、+、+、+、++B組： +、++、++、++、+++、+++,A：－ ? + + + ++ B： + ++ ++ ++ +++ +++

5、,1 2 3 4 5 7 6 8 9 10 11 12,1 2 4.5 4.5 4.5 8.5 4.5 8.5 8.5 8.5 11 12,1 2 4.5 4.5 4.5 7

6、 4.5 8 9 10 11 12,1 2 4.5 4.5 4.5 8.5 4.5 8.5 8.5 8.5 11.5 11.5,尿白細(xì)胞：,等級相同(tie)取平均秩次??！,Biostatistics,8,秩和,A組：－、?、+、+、+、 ++ 秩和： 1 2 4.5 4.5 4.5

7、 8.5 TA＝25 B組： +、++、++、++、+++、+++ 秩和： 4.5 8.5 8.5 8.5 11.5 11.5 TB＝53,TA+TB=N(N+1)/2=78,Biostatistics,9,秩次：在一定程度

8、上反映了等級的高低；秩和：在一定程度上反映了等級的分布位置。對等級的分析，轉(zhuǎn)化為對秩次的分析。秩和檢驗就是通過秩次的排列求出秩和，進(jìn)行假設(shè)檢驗。,2 秩次與秩和,10,假如兩組等級分布相同,理論上兩組秩和相近.,A,,兩樣本合并排序,,示例,B,Biostatistics,11,3 兩樣本比較的秩和檢驗,檢驗假設(shè) H0 ：A、B兩組等級分布相同；

9、 H1 ：A、B兩組等級分布不同。 ? =0.05。,,,Distribution of two populations when their locations are same,分布情況,第1 種情形…第2種情形…,,,,A,B,,,,B,A,13,Biostatistics,14,基本思想,如果H0 成立，即兩組分布位置相同，則A組的實際秩和應(yīng)接近理論秩和n1(N+1)/2;

10、 (B組的實際秩和應(yīng)接近理論秩和n2(N+1)/2). 或相差不大，差值很大的概率應(yīng)很小。如果相差較大，超出了預(yù)定的界值，則可認(rèn)為H0不成立。,Biostatistics,15,A組 B組和實際秩和 25 53 78 理論秩和 n1(N+1)/2 n2(N+1)/2 N(N+1

11、)/2 39 39 78差值－14 14 0 抽樣誤差？如果H0成立，則理論秩和與實際秩和之差純粹由抽樣誤差造成。,基本思想,Biostatistics,16,兩樣本

12、秩和檢驗 T 界值,,n1=6,n2-n1=0 雙側(cè) 單側(cè) 28～50 0.10 0.05 26 ～ 52 0.05 0.025 24 ～ 54

13、 0.02 0.01 23 ～ 55 0.01 0.005,間距 22 26 30 32,6(12+1)/2=39(理論值),,Biostatistics,17,檢驗結(jié)果,如果H0成立，則按0.05水準(zhǔn)， A組秩和之界值為26～52。現(xiàn)A組的實際秩和為25，在界值之外，故拒絕H0，接受H1，認(rèn)為兩組的分布

14、位置不同。,Biostatistics,18,秩和檢驗的結(jié)論判斷,A組的實際秩在界值之外， (小于或等于下界，大于或等于上界) 則拒絕H0，接受H1。A組的實際秩在界值之內(nèi)， (大于下界且小于上界) 則不拒絕H0。,Biostatistics,19,例題,【例】某實驗室觀察在缺氧條件下貓和兔的生存時間，結(jié)果見表，試檢驗在缺氧條件下貓和兔的生存時間有無差別？,Biostatistics,20

15、,例題,Biostatistics,21,檢驗假設(shè) H0 ：貓和兔在缺氧條件下生存時間總體分布相同； H1 ：貓和兔在缺氧條件下生存時間總體分布不同。 ? =0.05。檢驗統(tǒng)計量T值 n1=8，n2=12，檢驗統(tǒng)計量T=127.5 確定P值和作出推斷結(jié)論查附表10得T界值是58~110。則雙側(cè)P<0.05，按?

16、=0.05水準(zhǔn)，拒絕H0，接受H1，差異有統(tǒng)計學(xué)意義，故可認(rèn)為在缺氧條件下貓的生存時間較兔長。,例題,Biostatistics,22,例8.2 用復(fù)方豬膽膠囊治療老年性慢性支氣管炎患者403例，療效見表8.1第(1)~ (3)欄。問該藥對此兩型支氣管炎療效是否相同？,例題（page87）,Biostatistics,23,例題（ page87 ）,Biostatistics,24,例題（ page87 ）,Biostatistics

17、,25,建立檢驗假設(shè) H0：兩型老慢支療效分布相同； H1：兩型老慢支療效分布不同； ? =0.05。檢驗統(tǒng)計量 n1=182, n2=221，檢驗統(tǒng)計量T=40682.5 。,例題（ page88 ）,Biostatistics,26,樣本含量較大時，用 u 檢驗,相同秩次較多時需要校正,,,,,Biostatistics,28,確定P值和作出推斷結(jié)論

18、 P<0.01，按? =0.05水準(zhǔn)，拒絕H0 ，接受H1，差異有統(tǒng)計學(xué)意義。可認(rèn)為復(fù)方豬膽膠囊治療老年性慢性支氣管炎喘息型與單純型的療效有差別。,例題（ page88 ）,,Biostatistics,29,4 多組比較的秩和檢驗,Kruskal-Wallis法先對所有數(shù)據(jù)編秩，求各組秩和；計算 H 統(tǒng)計量；查 H 界值表，或用近似 ?2 檢驗，計算 P 值；界定 P 值，作出結(jié)論。注：相同觀察值不

19、同組時取平均；相同組時，按位置順序編號,Biostatistics,30,【例】某醫(yī)生在研究再生障礙性貧血時，測得不同程度再生障礙性貧血患者血清中可溶性CD8抗原水平（U/ml），問不同程度再生障礙性貧血患者血清中可溶性CD8抗原水平有無差別？,例題,Biostatistics,31,例題 (假設(shè)不滿足參數(shù)檢驗的要求),Biostatistics,32,例題,Biostatistics,33,多組等級比較的檢驗假設(shè),建立檢驗假設(shè)

20、H0 ：各組總體的等級分布相同；H1 ：各組總體的等級分布不同或不全相同。? =0.05。,,,,計算檢驗統(tǒng)計量H值,Biostatistics,34,,,多組等級比較的檢驗假設(shè),若組數(shù)k=3，每組例數(shù)ni≤9，可查附表11，H界值表得出P值。若組數(shù)k≥3，有ni≥10，則H近似服從? =k?1的?2分布。,Biostatistics,35,確定P值和作出推斷結(jié)論本例k=3，查附表12, 得P<0.001。按?

21、= 0.05水準(zhǔn)拒絕H0，接受H1，差異有統(tǒng)計學(xué)意義，可認(rèn)為不同程度再生障礙性貧血患者血清中可溶性CD8抗原水平有差別。,多組等級比較的檢驗假設(shè),Biostatistics,36,H 的校正,當(dāng)有相同秩次時，H 需校正：,Biostatistics,37,例8.3 某醫(yī)院用三種復(fù)方小葉枇杷治療老年性慢性支氣管炎，數(shù)據(jù)見表8.2第(1)～(4)欄，試比較其療效有無差異。,例題（page89）,Biostatistics,38,例題（ p

22、age89 ）,Biostatistics,39,建立檢驗假設(shè) H0：三藥療效總體分布相同；H1：三藥療效總體分布不同或不全相同；? = 0.05。,例題（ page89 ）,Biostatistics,40,,計算檢驗統(tǒng)計量H值,例題（ page89）,Biostatistics,41,由于此資料的相同秩次很多，須校正：,例題,,Biostatistics,42,確定P值和作出推斷結(jié)論　故按?=k?1=3?1=2查?2

23、界值表，得?20.005,2 =10.60，Hc>?20.005,2，P<0.005。按? =0.05水準(zhǔn)拒絕H0，接受H1，差異有統(tǒng)計學(xué)意義。認(rèn)為三藥療效有差別。,例題,Biostatistics,43,多組間的兩兩比較,如果多組等級比較拒絕H0，認(rèn)為組間存在差異，則需進(jìn)行兩兩比較。兩兩比較的方法很多。,,,Biostatistics,44,5 配對符號秩和檢驗（ page91）,Wilcoxon符號秩和檢驗計算等

24、級之差值，對差值進(jìn)行編秩，并冠以差值的符號。查 T 界值表，或用近似 u 檢驗，計算 P 值；界定 P 值，作出結(jié)論。注：1，差數(shù)等于0，舍掉 2，差值的絕對值排序，并冠以差值的符號 3，差值的絕對值相等，取平均秩次,Biostatistics,45,符號秩和檢驗的假設(shè),H0：差值的總體中位數(shù)為0；H1：差值的總體中位數(shù)不為0。? =0.05。當(dāng)n≤50時，查Ｔ界值表當(dāng)n＞50時，用u近似,,B

25、iostatistics,46,扁平足療效例(page91),用配對設(shè)計觀察兩種方法治療扁平足效果記錄如下，問那種方法好。（好=3 中=1 差=0）病例號 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 A法好好好好差中好好中差好差好中好中 B法差好差中中差中

26、差中差好差中差中差,差值 2 0 2 1 -1 1 1 2 0 0 0 0 1 1 1 1,Biostatistics,47,符號秩和檢驗,病例號 A法 B法差值秩次(1)(2)(3)(4)(5)1312102330—33121043214.5512

27、-1-4.562114.573214.58312109220—10110—11330—12110—133214.5142114.5153214.5162114.5,T+ =61.5 T- = 4.5,Biostatistics,48,符號秩和檢驗的基本思想,總秩和為T＝N(N+1)/2如H0成

28、立，則正負(fù)各半，T+ 與 T－均接近 N(N+1)/4。如果相差太大，超出了事先規(guī)定的界值，則H0不成立。,Biostatistics,49,符號秩和檢驗 T 界值表,N=11 雙側(cè) 單側(cè) 13～53 0.10 0.05

29、 10 ～ 56 0.05 0.025 7 ～ 59 0.02 0.01 5 ～ 61 0.01 0.005,間距 40 46 52 56,11(11+1)/4=33(理論值),,B

30、iostatistics,50,本例T＋=61.5，T－=4.5，已超出附表10中雙側(cè)P0.01相對應(yīng)的界值5～61，故得P? 0.01。按? =0.05水準(zhǔn)拒絕H0，接受H1，認(rèn)為兩種方法療效的總體分布不同。結(jié)合資料可認(rèn)為A法優(yōu)于B法。,扁平足療效例,Biostatistics,51,u 的校正,當(dāng)重復(fù)的秩次較多時，u 需要校正：,,Biostatistics,52,【例】某醫(yī)院檢驗科試用新舊兩種方法檢測谷-草轉(zhuǎn)氨酶，新方法的檢測

31、時間由20分鐘縮短為10分鐘。用兩種方法測一份血清，結(jié)果見表第（2）、（3）欄，問兩法所得結(jié)果有無差別？,例題(假設(shè)不滿足參數(shù)檢驗的要求),Biostatistics,53,例題,Biostatistics,54,建立檢驗假設(shè)H0：差值總體中位數(shù)Md = 0；H1：差值總體中位數(shù)Md ≠ 0；? = 0.05。求檢驗統(tǒng)計量T值T+ =18.5，T- =36.5，其和為55，n(n+1)/2=10(10+1)/2=55。,例

32、題,Biostatistics,55,符號秩和檢驗 T 界值表,N=10 雙側(cè) 單側(cè) 10～45 0.10 0.05 8 ～ 47 0.05 0.025

33、 5 ～ 50 0.02 0.01 3 ～ 52 0.01 0.005,間距 40 46 52 56,10(10+1)/4=27.5(理論值),,Biostatistics,56,確定P值和作出推斷結(jié)論本例n=10，T=18.5，查附表10，得

34、 ?=0.05時的T界值為8~47，T在雙側(cè)界值范圍內(nèi)，故P >0.05。按雙側(cè)0.05水準(zhǔn)，不拒絕H0，差異無統(tǒng)計學(xué)意義，故尚不能認(rèn)為兩法測定血清中谷-丙轉(zhuǎn)氨酶含量有差別。查表時，若T在T?上、下界值范圍外，則P?。,例題,,Biostatistics,57,6 配伍組比較的秩和檢驗(page93),Friedman法分別對每一配伍組中的觀察值進(jìn)行編秩；按處理組求各組秩和計算Friedman M 統(tǒng)計量；查M界值表

35、，或用近似 ?2 檢驗，計算 P 值；界定 P 值，作出結(jié)論。,Biostatistics,58,葡萄酒的等級例：,白蘭地評委WXYZA四二一三B四一二三C三一二四D四二三一E三一二四Ri,,,,,,(4)(2)(1)(3)(4)(1)(2)(3)(3)(1)(2)(4)(4)(2)(3)(1)(3)(1)

36、(2)(4)1871015,Biostatistics,59,葡萄酒等級資料的分析,H0：對四種葡萄酒評判結(jié)果的總體分布相同； H1：評判結(jié)果的總體分布不同或不全相同。 ? =0.05。式中b為配伍組數(shù)，k為處理組數(shù)。本例b=5，k=4。,,,,,Biostatistics,60,檢驗結(jié)果,本例b=5，k=4，查M界值表得：M0.05=7.80，M0.01=9.96

37、。M0.05<M<M0.01，0.01<P<0.05。按? =0.05水準(zhǔn)拒絕H0，接受H1，差異有統(tǒng)計學(xué)意義，即可認(rèn)為四種酒的等級有差別。,,Biostatistics,61,7 秩和檢驗的正確應(yīng)用,主要對等級資料進(jìn)行分析；秩和檢驗可用于任意分布(distribution free)的資料；非參數(shù)統(tǒng)計的主要優(yōu)點是不受總體分布的限制，適用范圍廣。非參數(shù)統(tǒng)計的主要缺點是符合參數(shù)檢驗的資料（如兩樣本均數(shù)比較

38、的t檢驗），如用非參數(shù)檢驗，因沒有充分利用資料提供的信息，檢驗效率降低。,已知總體分布類型，對未知參數(shù)進(jìn)行統(tǒng)計推斷,,依賴于特定分布類型，比較的是參數(shù),,參數(shù)檢驗（parametric test）,非參數(shù)檢驗（nonparametric test）,對總體的分布類型不作嚴(yán)格要求,,不受分布類型的影響，比較的是總體分布位置,,優(yōu)點：方法簡便、易學(xué)易用，易于推廣使用、應(yīng)用范圍廣；可用于參數(shù)檢驗難以處理的資料(如

39、等級資料，或含數(shù)值“>50mg”等 ),,缺點：方法比較粗糙，對于符合參數(shù)檢驗條件者，采用非參數(shù)檢驗會損失部分信息，其檢驗效能較低；樣本含量較大時，兩者結(jié)論常相同。,,Biostatistics,63,秩和檢驗用于定量資料,計量資料中：極度偏態(tài)資料，或個別數(shù)值偏離過大各組離散度相差懸殊資料中含有不確定值大于5年 <0.001 1:1024以上兼有等級和定量性質(zhì)的資料,Biostat

40、istics,64,心肌壞死面積例,用二種食物配方飼養(yǎng)大白鼠，觀察心肌壞死面積。分析二組間的差異。A組：(n=29, mean＝ 3.61) 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.2, 0.3, 0.4, 0.4, 0.6, 1, 1.6, 2.2, 2.6, 3.3, 4.3, 5.1, 5.4, 5.5, 6.1, 6.2, 9.7, 13.8, 36B組： (n

41、=28, mean＝1.06) 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.2, 0.2, 0.2 0.3, 0.4, 0.4, 0.9, 0.9, 1.3, 1.7, 2.8, 7.4, 13,Biostatistics,65,特點：,0特別多，無論用什么變換均不可能改變分布的偏性；0與其它數(shù)的區(qū)別是質(zhì)的區(qū)別。,Biostatistics,66,分析一：二組

42、心肌壞死率比較，按四格表作?2檢驗：,無心肌壞死有心肌壞死合計心肌壞死率甲組 10 19 29 65.5% 乙組 15 13 28 46.4% ?2= 2.1081, P = 0.147,,Biostatistics,67,分析

43、二：二組平均心肌壞死面積的比較,二組平均心肌壞死面積的 t 檢驗： t =－1.7755，P = 0.0814,Biostatistics,68,分析三：按等級資料處理：,兩組秩和檢驗： n 秩和理論秩和 A組29 968 841B組28 685 812合計57

44、 1653 1653u = 2.119， P =0.0341。,Biostatistics,69,成組設(shè)計兩樣本比較,如資料滿足 t 檢驗的條件,應(yīng)該用 t 檢驗進(jìn)行分析。此時，如果對這類資料用Wilcoxon秩和檢驗，實際上是將觀察單位的具體數(shù)值舍棄不用，只保留了秩次的信息，使檢驗功效降低；尤其樣本含量較小時，降低更加明顯。如資料不滿足 t 檢驗的條件，而用了t 檢驗，同樣降低了檢驗效能。,Biost

眾賞文庫> 全部分類> 畢業(yè)設(shè)計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

統(tǒng)計學(xué) 秩和檢驗

文檔簡介

溫馨提示

最新文檔

評論

統(tǒng)計學(xué) 秩和檢驗

文檔簡介

溫馨提示

最新文檔

評論

免費下載