《醫(yī)學統(tǒng)計學》最新版ch08秩和檢驗72h_第1頁
已閱讀1頁,還剩67頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、Medical Statistics 醫(yī)學統(tǒng)計學,秩和檢驗Rank Sum Test基于秩次的非參數(shù)統(tǒng)計學方法Non-Parametric Statistics Methods,主要內容,秩和檢驗的應用范圍(掌握)秩次與秩和 (掌握)成組設計兩樣本比較的秩和檢驗(掌握)成組設計多樣本比較的秩和檢驗(熟悉)配對設計樣本比較的秩和檢驗(掌握)隨機區(qū)組設計樣本比較的秩和檢驗(了解)秩和檢驗的正確應用(掌握)參數(shù)統(tǒng)計學和非

2、參數(shù)統(tǒng)計學(了解),已經學過的假設檢驗方法,數(shù)值變量資料在滿足正態(tài)性、方差齊性時,對均數(shù)進行比較,采用t檢驗或方差分析。無序分類資料(dichotomous、polynomous)率或構成比的比較采用卡方檢驗。,,未解決的:數(shù)值變量資料在嚴重不滿足正態(tài)性(極度偏態(tài)、數(shù)據不規(guī)則),對平均水平進行比較。數(shù)值變量資料在方差相差懸殊,無法利用變量變換達到方差齊性時,對平均水平進行比較。等級資料的分析,欲充分利用次序信息,比較組間等

3、級差異。,醫(yī)學研究中的等級資料,療 效:痊愈、顯效、有效、無效、惡化化驗結果:-、?、+、++、+++體格發(fā)育:下等、中下、中等、中上、上等心功能分級:I、II、III文化程度:小學、中學、大學、研究生營養(yǎng)水平:差、一般、好,等級資料的特點,既非呈連續(xù)分布的定量資料,也非僅按性質歸屬于獨立的若干類的定性資料;比“定量”粗,而比一般的“定性”細;等級間既非等距,亦不能被度量。,秩次與秩和,秩次(rank),秩統(tǒng)計量

4、(rank statistics) 是指全部觀察值按某種順序排列的位序;秩和(rank sum) 同組秩次之和,編秩,A組: - ± + + + ++ 1 2 3 4 5 7秩次 1 2 4.5 4.5 4.5 8.5 TA=25 B組: + ++ ++ ++ ++

5、+ +++ 6 8 9 10 11 12秩次 4.5 8.5 8.5 8.5 11.5 11.5TB=53,TA+TB=N(N+1)/2=78,,秩次:在一定程度上反映了等級的高低;秩和:在一定程度上反映了等級的分布位置。對等級的分析,轉化為對秩次的分析。秩和檢驗就是通過秩次的排列求出秩和

6、,進行假設檢驗。,成組設計兩樣本比較的秩和檢驗,某實驗室檢測了兩組各6人的尿蛋白,結果如下,問所得兩組結果有無差異?A組:?±+++++ 124.54.54.58.5B組:+++++++++++++ 4.58.58.58.511.511.5 TA=25、TB=53,成組設計兩樣本比較的秩和檢驗,基本思想(Wi

7、lcoxon成組秩和檢驗) 如果H0 成立,即兩組分布位置相同, A組的實際秩和應接近理論秩和n1(N+1)/2; B組的實際秩和應接近理論秩和n2(N+1)/2 或相差不大。如果相差較大,超出了預定的界值,則可認為H0不成立。,為什么?若兩組沒有差異,最理論的情形是所有觀察值一樣,即秩次均為(N+1)/2。,,檢驗假設 H0 :A、B兩組分布相同; H1

8、:A、B兩組分布不同(相互偏離)。 ? =0.05。,A組 B組 和 實際秩和 25 53 78 理論秩和 n1(N+1)/2 n2(N+1)/2 N(N+1)/2 39 39

9、 78差值 -14 14 0 抽樣誤差?如果H0成立,則理論秩和與實際秩和之差純粹由抽樣誤差造成。,兩樣本秩和檢驗 T 界值,,該范圍表明,在當前水準下,只要實際秩和位于范圍內,都可以認為實際秩和和理論秩和的偏離屬于抽樣誤差n1=6 n2-n1=0

10、 雙側 單側 28~50 0.10 0.05 26 ~ 52 0.05 0.025 24 ~ 54 0.02 0.01 23

11、 ~ 55 0.01 0.005,間距 22 26 30 32,6(12+1)/2=39(理論值),檢驗結果,如果H0成立,則按0.05水準,A組秩和之界值為26~52?,F(xiàn)A組的實際秩和為25,在界值之外,故拒絕H0,接受H1,認為兩組的分布位置不同。,秩和檢驗的結論判斷,A組的實際秩和在界值之外, (小于或等于下界,大于或等于上界)

12、 則拒絕H0,接受H1。A組的實際秩和在界值之內, (大于下界且小于上界) 則不拒絕H0。,兩組等級資料間的秩和檢驗,用復方豬膽膠囊治療老年性慢性支氣管炎患者403例,療效見表。問該藥對此兩型支氣管炎療效是否相同?,,建立檢驗假設:H0 :兩型老慢支療效分布相同;H1 :兩型老慢支療效分布不同。? =0.05。編秩 ,求秩和。確定檢驗統(tǒng)計量T 若兩樣本例數(shù)不等,以例數(shù)較少者為n1,檢驗統(tǒng)計量T=

13、T1=40682.5。確定P值,作出推斷結論,正態(tài)近似法(n1,n2-n1超出表的范圍時),n1>10或n2-n1 >10時相同秩次多時校正,,P<0.01,按? =0.05水準,拒絕H0 ,接受H1,差異有統(tǒng)計學意義??烧J為復方豬膽膠囊治療老年性慢性支氣管炎喘息型與單純型的療效有差別。,,,,,構成比的比較與平均秩次的比較,group A group B控制 100

14、 0 顯效 0 100有效 0 100無效 100 0構成比比較:不同平均秩比較:相同,成組設計多樣本比較的秩和檢驗,Kruskal-Wallis法先對所有數(shù)據編秩;計算 H 統(tǒng)計量;查 H 界值表,或用近似 ?2 檢驗;界定 P

15、值,作出結論。,成組設計多樣本比較的秩和檢驗,H0 :各組總體的等級分布相同;H1 :各組總體的等級分布不同或不全相同。? =0.05。,,,,H 的校正與?2近似,當有相同秩次時,H 需校正: 當 n 較大時, H 近似服從 ? = k – 1 的 ?2 分布。 故可按 ? 2 分布獲得概率 P,作出統(tǒng)計推斷。,,某醫(yī)院用三種復方小葉枇杷治療老年性慢性支氣管炎,試比較其療效有無差異。,,檢驗假設

16、H0 :三藥療效總體分布相同;H1 :三藥療效總體分布不同或不全相同。? =0.05。編秩 先計算各等級合計人數(shù),再確定秩次范圍,計算平均秩次。,,因每組例數(shù)遠遠超過5,故按?=k?1=3?1=2查?2界值表,得?20.005,2 =10.60,Hc> ?20.005,2 ,P<0.005。按? =0.05水準拒絕H0,接受H1,認為三藥療效有差別。,,,,統(tǒng)計量 H 的意義(1),設有k個對比組各組樣本含量:

17、ni秩和: Ri平均秩和: 總樣本含量: N=n1+n2+…+nk總秩和為: N(N+1)/2總秩次之平均為:(N+1)/2。,統(tǒng)計量 H 的意義(2),設無相同等級,則秩次的總離均差平方和為:秩次的組間離均差平方和為:H值:,,,,,等級資料的多組比較是兩組比較的擴展,相當于單因素方差分析的秩和檢驗。屬于秩變換檢驗:將原始觀察值編秩后,再進行統(tǒng)計,多組間的兩兩比較,如果多

18、組等級比較拒絕H0,認為組間存在差異,則可進行兩兩比較 ( t 檢驗法):自由度為v=N-k。H 為Kruskal-Wallis中的 H 統(tǒng)計量( H或HC )。,,,建立檢驗假設H0 :三個處理組中任兩個總體分布均相同;H1 :至少有兩個總體分布不同。? =0.05。計算各組平均秩次 令老復方組為第1組、復方I為第2組、復方II為第3組。,,,,,,確定P值,作出推斷結論 按?=522?3查t界值表,得P值

19、。按? =0.05水準,拒絕H0,接受H1,三種方劑療效總體分布不全相同,差別主要存在于老復方小葉枇杷與復方I組之間,其余組間差別無統(tǒng)計學意義。,配對設計樣本比較的秩和檢驗,Wilcoxon符號秩和檢驗計算等級之差值,對差值進行編秩。查 T 界值表,或用近似 u 檢驗,計算 P 值;界定 P 值,作出結論。,Wilcoxon符號秩和檢驗,H0:差值的總體中位數(shù)為0;H1:差值的總體中位數(shù)不為0。? =0.05。當n

20、≤50時,查界值表當n>50時,用u近似,,,用配對設計觀察兩種方法治療扁平足效果記錄如下,問那種方法好。,配對資料的編秩,按差值絕對值大小從小到大編秩。若差值為0,不參與編秩。若差值絕對值相等,則取平均秩。按差值的正負號在秩次上冠以符號。累積正秩次和負秩次,得到正秩和和負秩和。正負秩和的絕對值秩和應等于n(n+1)/2。,,H0:差值的總體中位數(shù)為0;H1:差值的總體中位數(shù)不為0。? =0.05。編秩,求秩和,確定檢

21、驗統(tǒng)計量T。T+=61.5,T-=4.5。 確定 P值和推斷結論,符號秩和檢驗的基本思想,總秩和為T=n(n+1)/2如H0成立,則正負各半,T+ 與 T- 均接近 n(n+1)/4。如果相差太大,超出了事先規(guī)定的界值, 則H0不成立。,符號秩和檢驗 T 界值表,N=11 雙側 單側 13 ~

22、 53 0.10 0.05 10 ~ 56 0.05 0.025 7 ~ 59 0.02 0.01 5 ~ 61 0.01

23、 0.005,間距 40 46 52 56,11(11+1)/4=33(理論值),,本例中雙側0.05的界值為10-56,0.01的界值為5-61。正、負秩和均在范圍之外,故P<0.01。拒絕H0,差別有統(tǒng)計學意義,說明兩種方法療效總體分布不同。,正態(tài)近似法(n>50時),配伍設計樣本比較的秩和檢驗,Friedman法分別對每一配伍組中的觀察值進行編秩;計算Friedman M 統(tǒng)計量;查M界值表

24、或自由度為k-1的卡方界值表,計算 P 值;界定 P 值,作出結論。,,五位評委分別評定了4種葡萄酒的等級(一至四級),結果如表8.5,問對四種酒的評判是否一致(四種酒的等級有無差別)? (設一級為最優(yōu),二級其次,依次類推。),,檢驗假設 H0:對四種葡萄酒評判結果的總體分布相同;H1:評判結果的總體分布不同或不全相同。? =0.05。編秩并求秩和 先在每一配伍組內將數(shù)據從小到大編秩(見括弧內數(shù)字),如有相同數(shù)據,取平均

25、秩次;再按處理組求各組秩和Ri,i=1,2,?,k。,,按式(8.8)計算檢驗統(tǒng)計量M值,,,確定P值,作出推斷性結論 根據配伍組數(shù)b與處理組數(shù)k查附表13,得到P值范圍。本例b=5,k=4,查表得:M0.05=7.80,M0.01=9.96。0.05<M<M0.01,0.01<P<0.05。下結論,按? =0.05水準拒絕H0,接受H1,差異有統(tǒng)計學意義,即可認為四種酒的等級有差別。,,若b或k超出附表1

26、3的范圍時,M近似服從?=k-1的?2分布。故可按?2分布界值,獲得概率P,作出統(tǒng)計推斷。如有相同秩次,且M按近似 ?2分布進行統(tǒng)計推斷時,需采用校正公式:,,,秩和檢驗的正確應用,適用范圍:主要對等級資料進行分析;理論上來講,可以適用于任意分布(distribution free)的資料;在用于定量資料時,需注意使用條件。T檢驗與H檢驗的關系 H檢驗

27、 T檢驗 n=2 F檢驗 t檢驗,,,秩和檢驗用于定量資料,計量資料中: 極度偏態(tài)資料,或個別數(shù)值偏離過大 各組離散度相差懸殊 資料中含有不確定值 大于5年 <0.001 1:1024以上 兼有等級和定量性質的資料,用二種食物配方飼養(yǎng)大白鼠,觀

28、察心肌壞死面積。分析二組間的差異。A組:(n=29, mean= 3.61) 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.2, 0.3, 0.4, 0.4, 0.6, 1, 1.6, 2.2, 2.6, 3.3, 4.3, 5.1, 5.4, 5.5, 6.1, 6.2, 9.7, 13.8, 36B組: (n=28, mean=1.06) 0, 0, 0, 0

29、, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.2, 0.2, 0.2 0.3, 0.4, 0.4, 0.9, 0.9, 1.3, 1.7, 2.8, 7.4, 13,正確選擇分析方法:例一,特點,0特別多,無論用什么變換均不可能改變分布的偏性;0與其它數(shù)的區(qū)別是質的區(qū)別。,分析一:兩組心肌壞死率比較,按四格表作?2檢驗:,無心肌壞死 有心肌壞死 合計 心肌壞死率(%) 甲組

30、 10 19 29 65.5 乙組 15 13 28 46.4 P = 0.24,,分析二:二組平均心肌壞死面積的比較,二組平均心肌壞死面積的 t 檢驗: t =-1.7755,P = 0

31、.0814,分析三:按等級資料處理:,兩組秩和檢驗:n秩和理論秩和 A組29968841B組28685812合計5716531653u = 2.119, P =0.0341。,正確選擇分析方法:例二,兩組完全隨機設計計量資料的比較(已知兩組確實不同質),分析方法一 兩組秩和檢驗,兩組秩和檢驗:n 秩和 理論秩和 A組10

32、 83.5 105.0B組10 126.5 105.0合計20 210.0 210.0u = 1.63, P =0.1040。,分析方法二 兩組t檢驗,是否可以用兩組資料的t檢驗?服從正態(tài)性的要求(P分別為0.4359和0.4408)。服從方差齊性的要求(P=0.7217)。利用兩個樣本均數(shù)的t檢驗,,分組n均數(shù)

33、標準誤 標準差A組104.840.88 2.79B組107.971.00 3.15差值 -3.13 1.33 自由度 18t=-2.36P=0.0301,成組設計兩樣本比較,如資料滿足 t 檢驗的條件,應該用 t 檢驗進行分析。此時,如果對這類資料用Wilcoxon秩和檢驗,實際上是將觀察單位的具體數(shù)值舍棄不用,只保留了秩次的信息,使檢驗功效降低;尤其樣本含量較

34、小時,降低更加明顯。 如資料不滿足 t 檢驗的條件,而用了t 檢驗,同樣降低了檢驗效能。,參數(shù)檢驗和非參數(shù)檢驗,以往所用的統(tǒng)計學方法,都假設樣本來自于某個分布,并對該分布的參數(shù)進行統(tǒng)計推斷。稱為參數(shù)檢驗(Parametric Methods)t檢驗、F檢驗要求正態(tài)性、獨立性。相關與回歸分析。在假設正確時,參數(shù)統(tǒng)計學方法效率高,因為可以直接利用分布的有關規(guī)律去進行推斷。當樣本含量不夠、分布形式未明,現(xiàn)有參數(shù)方法無法解決時,需

35、要對樣本來自的總體進行盡量少的假設,稱為非參數(shù)統(tǒng)計學方法(Non-parametric Methods)。,非參數(shù)統(tǒng)計學方法分類,基于二項分布的方法(忽略原始分布的情形)基于Permutation的方法。Wilcoxon成組秩和檢驗、配對秩和檢驗、Kwallis檢驗等等。利用秩次的組合來得到抽樣分布,據此得到獲得現(xiàn)有樣本及更大樣本的概率。基于Bootstrap的方法對樣本進行再抽樣,得到抽樣分布!目前很Fashion!基于

36、平滑(Smoothing)的方法,基于二項分布的方法,檢驗總體中位數(shù)是否為某常數(shù)例:40個樣品測量值為72.1、72.8……、79.7等等,欲檢驗其中位數(shù)是否大于75。若將樣本按是否大于75分類,其實就是檢驗個體取值大于75的總體率是否大于0.5!(注意:單側檢驗),基于Permutation的秩和檢驗,如果組間沒有差異,秩次應當是隨機散布,每組是從這些秩次中的一個隨機抽樣。那么在總樣本含量為7,A組為2時,從總樣本中隨機選出2個

37、,一共可以 個子數(shù)據集。每一個子數(shù)據集對應于一個秩和,每個出現(xiàn)的頻率約是0.05。其中最極端的兩個,一個是1、2,另一個是6、7,且這兩個秩和只會出現(xiàn)一次,故雙側0.10的界值為3-13。同樣,我們也可以在所有子數(shù)據集中找到與現(xiàn)有樣本相同的那個子集,以及比它具有更大差別的那些子集,累積他們的概率,作為P值!,,比如,對于共7個個體、A組有2個時,在H0成立時,A組各種秩和的頻率圖為若現(xiàn)A組實際秩和為5,做單

38、側檢驗,則P值為?,,參數(shù)估計 假設檢驗 單參數(shù) 兩參數(shù)之差 總體與樣本 兩樣本 多樣本 均 數(shù) (幾何均數(shù))率(二項分布)事件數(shù)(Poisson分布)構成比(分布) - -等 級 -

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論