2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩70頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、等級資料的秩和檢驗,陳濤,Department of Epidemiology & Biostatistics, School of Public Health Nanjing Medical University,Rank Sum Test of Ranked Data,Biostatistics,2,資料的分類,數(shù)值變量資料 分類資料,,,二分類 多分類,,無序多分類有序多分類(等級資料),Biostat

2、istics,3,內(nèi)容提要:,1 醫(yī)學(xué)研究中的等級資料2 秩次與秩和 3 兩樣本比較的秩和檢驗4 多樣本比較的秩和檢驗5 配對設(shè)計的秩和檢驗6 配伍組比較的秩和檢驗7 秩和檢驗的正確應(yīng)用,Biostatistics,4,1 醫(yī)學(xué)研究中的等級資料,療 效:痊愈、顯效、有效、無效、惡化化驗結(jié)果:-、?、+、++體格發(fā)育:下等、中下、中等、中上、上等心功能分級:I、II、III、IV文化程度:小

3、學(xué)、中學(xué)、大學(xué)、研究生營養(yǎng)水平:差、一般、好,Biostatistics,5,等級資料的特點,既非呈連續(xù)分布的定量資料,也非僅按性質(zhì)歸屬于獨立的若干類的定性資料;比“定量”粗,而比一般的“定性”細(xì);等級間既非等距,亦不能度量。,,Biostatistics,6,2 秩次與秩和,Wilcoxon在1945年首先提出了比較兩個總體分布函數(shù)的秩和檢驗。秩和檢驗以及其它的秩檢驗法,都是建立在秩及秩統(tǒng)計量基礎(chǔ)上的非參數(shù)方法。秩次(ran

4、k),秩統(tǒng)計量 是指全部觀察值按某種順序排列的位序;秩和(rank sum) 同組秩次之和。,Biostatistics,7,例1 編秩(page86),A組: - 、?、+、+、+、++B組: +、++、++、++、+++、+++,A:- ? + + + ++ B: + ++ ++ ++ +++ +++

5、,1 2 3 4 5 7 6 8 9 10 11 12,1 2 4.5 4.5 4.5 8.5 4.5 8.5 8.5 8.5 11 12,1 2 4.5 4.5 4.5 7

6、 4.5 8 9 10 11 12,1 2 4.5 4.5 4.5 8.5 4.5 8.5 8.5 8.5 11.5 11.5,尿白細(xì)胞:,等級相同(tie)取平均秩次?。?Biostatistics,8,秩和,A組: - 、?、+、+、+、 ++ 秩和: 1 2 4.5 4.5 4.5

7、 8.5 TA=25 B組: +、++、++、++、+++、+++ 秩和: 4.5 8.5 8.5 8.5 11.5 11.5 TB=53,TA+TB=N(N+1)/2=78,Biostatistics,9,秩次:在一定程度

8、上反映了等級的高低;秩和:在一定程度上反映了等級的分布 位置。對等級的分析,轉(zhuǎn)化為對秩次的分析。秩和檢驗就是通過秩次的排列求出秩和,進行假設(shè)檢驗。,2 秩次與秩和,10,假如兩組等級分布相同,理論上兩組秩和相近.,A,,兩樣本合并排序,,示例,B,Biostatistics,11,3 兩樣本比較的秩和檢驗,檢驗假設(shè) H0 :A、B兩組等級分布相同;

9、 H1 :A、B兩組等級分布不同。 ? =0.05。,,,Distribution of two populations when their locations are same,分布情況,第1 種情形…第2種情形…,,,,A,B,,,,B,A,13,Biostatistics,14,基本思想,如果H0 成立,即兩組分布位置相同, 則A組的實際秩和應(yīng)接近理論秩和n1(N+1)/2;

10、 (B組的實際秩和應(yīng)接近理論秩和n2(N+1)/2). 或相差不大,差值很大的概率應(yīng)很小 。如果相差較大,超出了預(yù)定的界值,則可認(rèn)為H0不成立。,Biostatistics,15,A組 B組 和 實際秩和 25 53 78 理論秩和 n1(N+1)/2 n2(N+1)/2 N(N+1

11、)/2 39 39 78差值 -14 14 0 抽樣誤差?如果H0成立,則理論秩和與實際秩和之差純粹由抽樣誤差造成。,基本思想,Biostatistics,16,兩樣本

12、秩和檢驗 T 界值,,n1=6,n2-n1=0 雙側(cè) 單側(cè) 28~50 0.10 0.05 26 ~ 52 0.05 0.025 24 ~ 54

13、 0.02 0.01 23 ~ 55 0.01 0.005,間距 22 26 30 32,6(12+1)/2=39(理論值),,Biostatistics,17,檢驗結(jié)果,如果H0成立,則按0.05水準(zhǔn), A組秩和之界值為26~52?,F(xiàn)A組的實際秩和為25,在界值之外,故拒絕H0,接受H1,認(rèn)為兩組的分布

14、位置不同。,Biostatistics,18,秩和檢驗的結(jié)論判斷,A組的實際秩在界值之外, (小于或等于下界,大于或等于上界) 則拒絕H0,接受H1。A組的實際秩在界值之內(nèi), (大于下界且小于上界) 則不拒絕H0。,Biostatistics,19,例題,【例】 某實驗室觀察在缺氧條件下貓和兔的生存時間,結(jié)果見表,試檢驗在缺氧條件下貓和兔的生存時間有無差別?,Biostatistics,20

15、,例題,Biostatistics,21,檢驗假設(shè) H0 :貓和兔在缺氧條件下生存時間總體分布相同 ; H1 :貓和兔在缺氧條件下生存時間總體分布不同 。 ? =0.05。檢驗統(tǒng)計量T值 n1=8,n2=12,檢驗統(tǒng)計量T=127.5 確定P值和作出推斷結(jié)論 查附表10得T界值是58~110。則雙側(cè)P<0.05,按?

16、=0.05水準(zhǔn),拒絕H0,接受H1,差異有統(tǒng)計學(xué)意義,故可認(rèn)為在缺氧條件下貓的生存時間較兔長。,例題,Biostatistics,22,例8.2 用復(fù)方豬膽膠囊治療老年性慢性支氣管炎患者403例,療效見表8.1第(1)~ (3)欄。問該藥對此兩型支氣管炎療效是否相同?,例題(page87),Biostatistics,23,例題( page87 ),Biostatistics,24,例題( page87 ),Biostatistics

17、,25,建立檢驗假設(shè) H0:兩型老慢支療效分布相同 ; H1:兩型老慢支療效分布不同; ? =0.05。檢驗統(tǒng)計量 n1=182, n2=221,檢驗統(tǒng)計量T=40682.5 。,例題( page88 ),Biostatistics,26,樣本含量較大時,用 u 檢驗,相同秩次較多時需要校正,,,,,Biostatistics,28,確定P值和作出推斷結(jié)論

18、 P<0.01,按? =0.05水準(zhǔn),拒絕H0 ,接受H1,差異有統(tǒng)計學(xué)意義??烧J(rèn)為復(fù)方豬膽膠囊治療老年性慢性支氣管炎喘息型與單純型的療效有差別。,例題( page88 ),,Biostatistics,29,4 多組比較的秩和檢驗,Kruskal-Wallis法先對所有數(shù)據(jù)編秩,求各組秩和;計算 H 統(tǒng)計量;查 H 界值表,或用近似 ?2 檢驗, 計算 P 值;界定 P 值,作出結(jié)論。 注:相同觀察值不

19、同組時取平均;相同組時,按位置順序編號,Biostatistics,30,【例】 某醫(yī)生在研究再生障礙性貧血時,測得不同程度再生障礙性貧血患者血清中可溶性CD8抗原水平(U/ml),問不同程度再生障礙性貧血患者血清中可溶性CD8抗原水平有無差別?,例題,Biostatistics,31,例題 (假設(shè)不滿足參數(shù)檢驗的要求),Biostatistics,32,例題,Biostatistics,33,多組等級比較的檢驗假設(shè),建立檢驗假設(shè)

20、H0 :各組總體的等級分布相同;H1 :各組總體的等級分布不同或不全相同。? =0.05。,,,,計算檢驗統(tǒng)計量H值,Biostatistics,34,,,多組等級比較的檢驗假設(shè),若組數(shù)k=3,每組例數(shù)ni≤9,可查附表11,H界值表得出P值。若組數(shù)k≥3,有ni≥10,則H近似服從? =k?1的?2分布。,Biostatistics,35,確定P值和作出推斷結(jié)論 本例k=3,查附表12, 得P<0.001。按?

21、= 0.05水準(zhǔn)拒絕H0,接受H1,差異有統(tǒng)計學(xué)意義,可認(rèn)為不同程度再生障礙性貧血患者血清中可溶性CD8抗原水平有差別。,多組等級比較的檢驗假設(shè),Biostatistics,36,H 的校正,當(dāng)有相同秩次時,H 需校正:,Biostatistics,37,例8.3 某醫(yī)院用三種復(fù)方小葉枇杷治療老年性慢性支氣管炎,數(shù)據(jù)見表8.2第(1)~(4)欄,試比較其療效有無差異。,例題(page89),Biostatistics,38,例題( p

22、age89 ),Biostatistics,39,建立檢驗假設(shè) H0:三藥療效總體分布相同 ;H1:三藥療效總體分布不同或不全相同 ;? = 0.05。,例題( page89 ),Biostatistics,40,,計算檢驗統(tǒng)計量H值,例題( page89),Biostatistics,41,由于此資料的相同秩次很多,須校正:,例題,,Biostatistics,42,確定P值和作出推斷結(jié)論  故按?=k?1=3?1=2查?2

23、界值表,得?20.005,2 =10.60,Hc>?20.005,2,P<0.005。按? =0.05水準(zhǔn)拒絕H0,接受H1,差異有統(tǒng)計學(xué)意義。認(rèn)為三藥療效有差別。,例題,Biostatistics,43,多組間的兩兩比較,如果多組等級比較拒絕H0,認(rèn)為組間存在差異,則需進行兩兩比較。兩兩比較的方法很多。,,,Biostatistics,44,5 配對符號秩和檢驗( page91),Wilcoxon符號秩和檢驗計算等

24、級之差值,對差值進行編秩,并冠以差值的符號。查 T 界值表,或用近似 u 檢驗,計算 P 值;界定 P 值,作出結(jié)論。注:1,差數(shù)等于0,舍掉 2,差值的絕對值排序,并冠以差值的符號 3,差值的絕對值相等,取平均秩次,Biostatistics,45,符號秩和檢驗的假設(shè),H0:差值的總體中位數(shù)為0;H1:差值的總體中位數(shù)不為0。? =0.05。當(dāng)n≤50時,查T界值表當(dāng)n>50時,用u近似,,B

25、iostatistics,46,扁平足療效例(page91),用配對設(shè)計觀察兩種方法治療扁平足效果記錄如下,問那種方法好。(好=3 中=1 差=0) 病例號 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 A法 好 好 好 好 差 中 好 好 中 差 好 差 好 中 好 中 B法 差 好 差 中 中 差 中

26、差 中 差 好 差 中 差 中 差,差值 2 0 2 1 -1 1 1 2 0 0 0 0 1 1 1 1,Biostatistics,47,符號秩和檢驗,病例號 A法 B法 差值 秩次(1)(2)(3)(4)(5)1312102330—33121043214.5512

27、-1-4.562114.573214.58312109220—10110—11330—12110—133214.5142114.5153214.5162114.5,T+ =61.5 T- = 4.5,Biostatistics,48,符號秩和檢驗的基本思想,總秩和為T=N(N+1)/2如H0成

28、立,則正負(fù)各半,T+ 與 T- 均接近 N(N+1)/4。如果相差太大,超出了事先規(guī)定的界值, 則H0不成立。,Biostatistics,49,符號秩和檢驗 T 界值表,N=11 雙側(cè) 單側(cè) 13~53 0.10 0.05

29、 10 ~ 56 0.05 0.025 7 ~ 59 0.02 0.01 5 ~ 61 0.01 0.005,間距 40 46 52 56,11(11+1)/4=33(理論值),,B

30、iostatistics,50,本例T+=61.5,T-=4.5,已超出附表10中雙側(cè)P0.01相對應(yīng)的界值5~61,故得P? 0.01。按? =0.05水準(zhǔn)拒絕H0,接受H1,認(rèn)為兩種方法療效的總體分布不同。結(jié)合資料可認(rèn)為A法優(yōu)于B法。,扁平足療效例,Biostatistics,51,u 的校正,當(dāng)重復(fù)的秩次較多時,u 需要校正:,,Biostatistics,52,【例】 某醫(yī)院檢驗科試用新舊兩種方法檢測谷-草轉(zhuǎn)氨酶,新方法的檢測

31、時間由20分鐘縮短為10分鐘。用兩種方法測一份血清,結(jié)果見表第(2)、(3)欄,問兩法所得結(jié)果有無差別?,例題(假設(shè)不滿足參數(shù)檢驗的要求),Biostatistics,53,例題,Biostatistics,54,建立檢驗假設(shè)H0:差值總體中位數(shù)Md = 0;H1:差值總體中位數(shù)Md ≠ 0;? = 0.05。求檢驗統(tǒng)計量T值T+ =18.5,T- =36.5,其和為55,n(n+1)/2=10(10+1)/2=55。,例

32、題,Biostatistics,55,符號秩和檢驗 T 界值表,N=10 雙側(cè) 單側(cè) 10~45 0.10 0.05 8 ~ 47 0.05 0.025

33、 5 ~ 50 0.02 0.01 3 ~ 52 0.01 0.005,間距 40 46 52 56,10(10+1)/4=27.5(理論值),,Biostatistics,56,確定P值和作出推斷結(jié)論 本例n=10,T=18.5,查附表10,得

34、 ?=0.05時的T界值為8~47,T在雙側(cè)界值范圍內(nèi),故P >0.05。按雙側(cè)0.05水準(zhǔn),不拒絕H0,差異無統(tǒng)計學(xué)意義,故尚不能認(rèn)為兩法測定血清中谷-丙轉(zhuǎn)氨酶含量有差別。查表時,若T在T?上、下界值范圍外,則P?。,例題,,Biostatistics,57,6 配伍組比較的秩和檢驗(page93),Friedman法分別對每一配伍組中的觀察值進行編秩;按處理組求各組秩和計算Friedman M 統(tǒng)計量;查M界值表

35、,或用近似 ?2 檢驗,計算 P 值;界定 P 值,作出結(jié)論。,Biostatistics,58,葡萄酒的等級例:,白 蘭 地評委WXYZA四二一三B四一二三C三一二四D四二三一E三一二四Ri,,,,,,(4)(2)(1)(3)(4)(1)(2)(3)(3)(1)(2)(4)(4)(2)(3)(1)(3)(1)

36、(2)(4)1871015,Biostatistics,59,葡萄酒等級資料的分析,H0:對四種葡萄酒評判結(jié)果的總體分布相同; H1:評判結(jié)果的總體分布不同或不全相同。 ? =0.05。 式中b為配伍組數(shù),k為處理組數(shù)。本例b=5,k=4。,,,,,Biostatistics,60,檢驗結(jié)果,本例b=5,k=4,查M界值表得:M0.05=7.80,M0.01=9.96

37、。M0.05<M<M0.01,0.01<P<0.05。按? =0.05水準(zhǔn)拒絕H0,接受H1,差異有統(tǒng)計學(xué)意義,即可認(rèn)為四種酒的等級有差別。,,Biostatistics,61,7 秩和檢驗的正確應(yīng)用,主要對等級資料進行分析;秩和檢驗可用于任意分布(distribution free)的資料;非參數(shù)統(tǒng)計的主要優(yōu)點是不受總體分布的限制,適用范圍廣。 非參數(shù)統(tǒng)計的主要缺點是符合參數(shù)檢驗的資料(如兩樣本均數(shù)比較

38、的t檢驗),如用非參數(shù)檢驗,因沒有充分利用資料提供的信息,檢驗效率降低。,已知總體分布類型,對未知參數(shù)進行統(tǒng)計推斷,,依賴于特定分布類型,比較的是參數(shù),,參數(shù)檢驗 (parametric test),非參數(shù)檢驗 (nonparametric test),對總體的分布類型不作嚴(yán)格要求,,不受分布類型的影響,比較的是總體分布位置,,優(yōu)點:方法簡便、易學(xué)易用,易于推廣使用、應(yīng)用范圍廣;可用于參數(shù)檢驗難以處理的資料(如

39、等級資料,或含數(shù)值“>50mg”等 ),,缺點:方法比較粗糙,對于符合參數(shù)檢驗條件者,采用非參數(shù)檢驗會損失部分信息,其檢驗效能較低;樣本含量較大時,兩者結(jié)論常相同。,,Biostatistics,63,秩和檢驗用于定量資料,計量資料中: 極度偏態(tài)資料,或個別數(shù)值偏離過大 各組離散度相差懸殊 資料中含有不確定值 大于5年 <0.001 1:1024以上 兼有等級和定量性質(zhì)的資料,Biostat

40、istics,64,心肌壞死面積例,用二種食物配方飼養(yǎng)大白鼠,觀察心肌壞死面積。分析二組間的差異。A組:(n=29, mean= 3.61) 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.2, 0.3, 0.4, 0.4, 0.6, 1, 1.6, 2.2, 2.6, 3.3, 4.3, 5.1, 5.4, 5.5, 6.1, 6.2, 9.7, 13.8, 36B組: (n

41、=28, mean=1.06) 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.2, 0.2, 0.2 0.3, 0.4, 0.4, 0.9, 0.9, 1.3, 1.7, 2.8, 7.4, 13,Biostatistics,65,特點:,0特別多,無論用什么變換均不可能改變分布的偏性;0與其它數(shù)的區(qū)別是質(zhì)的區(qū)別。,Biostatistics,66,分析一:二組

42、心肌壞死率比較,按四格表作?2檢驗:,無心肌壞死 有心肌壞死 合計 心肌壞死率 甲組 10 19 29 65.5% 乙組 15 13 28 46.4% ?2= 2.1081, P = 0.147,,Biostatistics,67,分析

43、二:二組平均心肌壞死面積的比較,二組平均心肌壞死面積的 t 檢驗: t =-1.7755,P = 0.0814,Biostatistics,68,分析三:按等級資料處理:,兩組秩和檢驗: n 秩和 理論秩和 A組29 968 841B組28 685 812合計57

44、 1653 1653u = 2.119, P =0.0341。,Biostatistics,69,成組設(shè)計兩樣本比較,如資料滿足 t 檢驗的條件,應(yīng)該用 t 檢驗進行分析。此時,如果對這類資料用Wilcoxon秩和檢驗,實際上是將觀察單位的具體數(shù)值舍棄不用,只保留了秩次的信息,使檢驗功效降低;尤其樣本含量較小時,降低更加明顯。 如資料不滿足 t 檢驗的條件,而用了t 檢驗,同樣降低了檢驗效能。,Biost

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論