醫(yī)學(xué)統(tǒng)計學(xué)秩和檢驗_第1頁
已閱讀1頁,還剩93頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、,秩 和 檢 驗,rank sum test,分析資料的步驟:1、確定資料的類型: 分類資料、定量資料;2、選擇適當(dāng)?shù)慕y(tǒng)計方法;3、作出統(tǒng)計推斷結(jié)論。,定量資料的分析:,t檢驗 Z檢驗 F檢驗,分類資料的分析:,,檢驗,檢驗的應(yīng)用范圍 ① 比較兩個或多個樣本的總體率(構(gòu)成比)有無差異 ② 分析兩個分類變量之間的關(guān)聯(lián)性

2、 ③ 判斷頻數(shù)分布類型 ④ 分析率的線性趨勢,t 檢驗的應(yīng)用條件 ① σ 未知且n 較小 ② 樣本取自正態(tài)總體 ③ 兩樣本均數(shù)比較時,兩樣本總體方差相等Z 檢驗的應(yīng)用條件 ①樣本取自正態(tài)總體,兩樣本總體方差相等 ② σ未知但n 較大(如 n > 100), n 較小但σ 已知。F 檢驗的應(yīng)用條件 ①各樣本取

3、自正態(tài)總體 ②各樣本的總體方差相等 ③各樣本是相互獨立的隨機樣本,例 某實驗室觀察局部溫?zé)嶂委熜∈笠浦材[瘤的療效,以生存日數(shù)作為觀察指標(biāo),實驗結(jié)果見表1,試檢驗兩組小鼠生存日數(shù)有無差別?,表1 兩組小鼠發(fā)癌后生存日數(shù),內(nèi)容: 非參數(shù)檢驗的概念 Wilcoxon符號秩和檢驗 成組設(shè)計的兩樣本比較的秩和檢驗 多個樣本比較的秩和檢驗 多個樣本

4、兩兩比較的秩和檢驗 隨機區(qū)組設(shè)計的秩和檢驗,,參數(shù)統(tǒng)計和非參數(shù)統(tǒng)計,非參數(shù)檢驗適用范圍,1.等級資料(有序分類資料)。如療效按治愈、顯效、有效、無效分組的資料;臨床化驗結(jié)果按“-、±、+、++、+++、++++”分組的資料等。( 比較構(gòu)成比有無差異)2.偏態(tài)分布資料。當(dāng)觀察值呈偏態(tài)或極度偏態(tài)分布,而又未經(jīng)變量變換或雖經(jīng)變換但仍未達到正態(tài)或近似正態(tài)分布。3.分布不明的資料。如新指標(biāo)分布形態(tài)不明;小樣本,但不趨向正態(tài)分布

5、資料。4.各組方差明顯不齊,且不易變換達到齊性。5.組內(nèi)個別觀察值偏離過大的資料。6.開口分組資料。數(shù)據(jù)分組某一端或兩端無明確數(shù)值的資料,只給出一個下限或上限,而沒有具體數(shù)值,如≥60歲等。,,,非參數(shù)檢驗的優(yōu)缺點,優(yōu)點:1、不受總體分布的限制,適用范圍廣。2、不受資料類型的限制,可以是計量資料、等級資料以及一端或兩端無確切數(shù)據(jù)的資料。,缺點: 1、對于符合參數(shù)檢驗條件的資料,首先參數(shù)檢驗方法;如果用非參數(shù)檢驗,沒有充分利用

6、資料提供的信息,檢驗效能(power)低于參數(shù)檢驗。2、非參數(shù)檢驗一般犯第二類錯誤的概率β比參數(shù)檢驗大,若要使β相同,非參數(shù)檢驗要比參數(shù)檢驗需要更多的樣本例數(shù)。,非參數(shù)檢驗方法:秩和檢驗(rank sum test)等級相關(guān)分析符號檢驗游程檢驗 … …,秩、秩和,秩 ♀ ♂ ♀ ♀ ♀ ♂ ♂ ♀ ♀ ♂ ♂ ♂ 1 4 5 6 8 11 22 25 3

7、2 35 40 45 1 2 3 4 5 6 7 8 9 10 11 12秩和 ♀=1+3+4+5+8+9=30 ♂=2+6+7+10+11+12=48,秩和檢驗(rank sum test) 將數(shù)據(jù)從小到大排序,該序號在統(tǒng)計學(xué)上稱為秩(rank),用數(shù)據(jù)排序的秩來代替原數(shù)據(jù)進行假設(shè)檢驗,這種方法稱為秩和檢驗。,秩(rank)

8、,→ 秩和(rank sum),→秩和檢驗(rank sum test),,1,4,10,2,3,11,13,12,14,15,5,6,7,8,9,16,,Wilcoxon符號秩和檢驗(Wilcoxon signed rank test),配對設(shè)計計量差值比較 單一樣本與總體中位數(shù)比較,配對設(shè)計資料主要是對差值進行分析。通過檢驗配對樣本的差值是否來自中位數(shù)為0的總體,來推斷兩個總體中位數(shù)有無差別,即推斷兩種處理的效應(yīng)是否不

9、同。,配對設(shè)計兩樣本比較,配對設(shè)計的兩樣本比較例12.1 某研究用甲、乙兩種方法對某地方性砷中毒地區(qū)水源中砷含量(mg/L)進行測定,檢測10處,測量值如表12.1的(2)、(3)欄。問兩種方法的測定結(jié)果有無差別?,表12.1 甲、乙兩種方法測定某地區(qū)10處水源中砷含量的結(jié)果(mg/L),配對差值經(jīng)正態(tài)性檢驗得 W=0.717,P=0.001,,(1)建立檢驗假設(shè),確定檢驗水準(zhǔn)。H0:兩種方法測定結(jié)果差值的總體中位數(shù)為0

10、 H1:兩種方法測定結(jié)果差值的總體中位數(shù)不等于0 α=0.05,(2)計算檢驗統(tǒng)計量 T1、求差值,見表12.1(4)2、編秩 a:將差值的絕對值從小到大編秩 b: 當(dāng)差值為0,則不計該例(n隨之減少) c: 如兩差值相等,則取其平均秩次3、給秩添加正負(fù)號4、求秩和并確定檢驗統(tǒng)計量: 分別求出差值為正與負(fù)的秩和,任取差值為正或負(fù)秩和作為統(tǒng)計量。本例T=21.5。,,(3)確定P值

11、,并作出統(tǒng)計推斷。 A. 當(dāng)n≤50時,查附表10,T界值表。N=9 0.10 8-37 0.05 5-40 0.02 3-42 0.01 1-44 檢驗統(tǒng)計量T值在上、下界值范圍內(nèi),其P值大于相應(yīng)的概率水平;若T值在上、下界值范圍上或范圍外,則P值等于或小于相應(yīng)的概率水平。原則:內(nèi)

12、大外小 本例 T=21.5,以差值不等于0的數(shù)值對子數(shù)n=9查附表10, 得P>0.10, 按照?=0.05水準(zhǔn),不拒絕H0,差別無統(tǒng)計學(xué)意義。尚不能認(rèn)為甲、乙兩種方法測定水源中砷含量有差別。,由附表10可知,當(dāng)n50時,如何確定P值?,注意:,(2)正態(tài)近似法 隨著n的增大,T分布逼近均數(shù)為 n(n+1)/4 、方差為n(n+1)(2n+1)/24的正態(tài)分布,用正態(tài)近似法 (u檢驗)

13、,按式(12.1) 計算Z值。 (12.1),,當(dāng)相同秩次(相持tie)多時(不包括 差值等于0),則用(12.2)校正式:

14、 (12.2),Wilcoxon配對符號秩和檢驗的基本思想: 在配對樣本中,由于隨機誤差的存在,其對差值的影響不可避免。假定兩種處理的效應(yīng)相同,則差值的總體分布為對稱分布,并且差值的總體中位數(shù)為0。若此假設(shè)成立,樣本差值的正秩和與負(fù)秩和應(yīng)相差不大,均接近n (n+1)/4 ;當(dāng)正負(fù)秩和相差

15、懸殊,超出抽樣誤差可解釋的范圍時,則有理由懷疑該假設(shè),從而拒絕H0。,單一樣本與總體中位數(shù)比較Wilcoxon符號秩和檢驗 目的是推斷樣本中位數(shù)與已知總體中位數(shù)(常為標(biāo)準(zhǔn)值或大量觀察的穩(wěn)定值)有無差別 常用于不滿足單樣本檢驗應(yīng)用條件的資料。,例 某醫(yī)生從其接診的不明原因脫發(fā)患者中隨機抽取14例,測得其發(fā)銅含量(μg/g)見表2。已知該地健康人群發(fā)銅含量的中位數(shù)為11.2μg/g。問脫發(fā)患者發(fā)銅含量是否低于健

16、康人群?,,,(1)建立檢驗假設(shè),確定檢驗水準(zhǔn)。H0:差值的總體中位數(shù)等于0,即脫發(fā)患者發(fā)銅含 量與該地健康人群相同H1:差值的總體中位數(shù)小于0,即脫發(fā)患者發(fā)銅含 量低于該地健康人群 單側(cè)α =0.05,(2)計算檢驗統(tǒng)計量 T 求差值: 編秩:方法同例12.1。 求秩和:T+ =4,T- =101 確定檢驗統(tǒng)計量T,本例T=4或T=101 。,(3)確定P值

17、,并作出統(tǒng)計推斷。 查附表10 T界值表(配對比較的符號秩和檢驗用),本例n=14, 得單側(cè)P<0.005,按 α =0.05水準(zhǔn),拒絕H0, 接受H1,差別有統(tǒng)計學(xué)意義,故可以認(rèn)為脫發(fā)患者發(fā)銅含量低于該地健康人群 。,成組設(shè)計的兩樣本比較 (Wilcoxon rank sum test),目的是推斷連續(xù)型變量資料或有序變量資料的兩個獨立樣本代表的總體分布位置是否有差別。,(1)原始數(shù)據(jù)的兩樣本比較例3

18、 某地職業(yè)病防治欲比較使用二巰基丙磺酸鈉與二巰基丁二酸鈉的驅(qū)汞效果。將22例汞中毒患者隨機分配到兩組,分別測定并計算出兩組驅(qū)汞的排汞比值,并將結(jié)果列于表12.3。試問兩藥驅(qū)汞效果有無差別?,,表12.3 兩種驅(qū)汞藥物排汞效果比較,該資料為比值數(shù)據(jù),不服從正態(tài)分布,現(xiàn)采用Wilcoxon秩和檢驗。,,檢驗步驟:(1)建立檢驗假設(shè),確定檢驗水準(zhǔn)。 H0:兩種藥物排汞比值的總體分布位置相同 H1:兩種藥物排汞比值的

19、總體分布位置不同 α=0.05,(2)計算檢驗統(tǒng)計量 T 將兩組數(shù)據(jù)由小到大統(tǒng)一編秩 兩組中,相同數(shù)值在不同組,則必須取平均秩同 一 組內(nèi),可順次編秩次。 分別求出兩組秩次的和 取較小樣本的秩和記為T,本例n2 ≠ n1 ,T=75.5,(3)確定P值,并作出統(tǒng)計推斷。 查附表11 T界值表(兩樣本比較的秩和檢驗),P<0.01,按?=0.05水準(zhǔn)拒絕H0,可認(rèn)為兩種驅(qū)汞藥物的排汞效

20、果有差別。丁二酸納組平均秩次為75.5/10=7.55,丙磺酸鈉組平均秩次為177.5/12=14.79,可認(rèn)為丙磺酸鈉驅(qū)汞效果好于丁二酸鈉。,若n1、 n2- n1超出附表11的范圍, 則用正態(tài)近似法 ,可按式(12.3)計算Z值:

21、 (7.3) 式中,N= n1+n2, 0.5: 連續(xù)性校正系數(shù)。,若持較多(如超過25% ),則用式(12.4)校正。

22、 (12.4),tj為第j次相持時相同秩次的個數(shù)。,秩次(rank),秩統(tǒng)計量 是指全部觀察值按某種順序排列的位序; 在一定程度上反映了等級的高低;秩和(rank sum) 同組秩次之和; 在一定程度上反映了等級的分布位置。 對等級的分析,轉(zhuǎn)化為對秩次的分析。 秩和檢驗就是通過秩次的排列求出秩和,進行假設(shè)檢驗。,(2)等級資料

23、的兩樣本比較例12.4 某醫(yī)生欲比較中西醫(yī)療法與西醫(yī)療法治療急性腎盂腎炎的臨床療效,將患者隨機分為兩組,分別給予中西醫(yī)療法或西醫(yī)療法治療,并觀察療效,結(jié)果見表12.4,問兩種療法療效是否有差別?,表12.4 兩種療法治療急性腎盂腎炎的療效,檢驗步驟:(1)建立檢驗假設(shè),確定檢驗水準(zhǔn)。 H0:兩種療法治療急性腎盂腎炎的療效總體分布位置相同 H1:兩種療法治療急性腎盂腎炎的療效總體分布位置不同 α=0.05

24、,(2)計算檢驗統(tǒng)計量 T①求秩和:確定各等級的秩次范圍,計算平均秩次;將各組段的平均秩次分別與各等級例數(shù)相乘,再求和得到T1, T2。,表12.4 兩種療法治療急性腎盂腎炎的療效,,②計算Z值 由于相持較多,故按式(12.3)和式(12.4)計算Zc值。,,,(3)確定P值,并作出統(tǒng)計推斷。 Zc=2.1415, 0.02<P<0.05 ,按?=0.05水準(zhǔn),拒絕H0,差別有統(tǒng)計學(xué)意義,可認(rèn)為兩種療法

25、療效分布不同。 中西醫(yī)療法組平均秩次為6820/92=74.1,西醫(yī)療法組平均秩次為6060/68=89.1,可以認(rèn)為中西醫(yī)療法治療急性腎盂腎炎效果較好。,Wilcoxon秩和檢驗的基本思想: 假設(shè)含量為n1與n2的兩個樣本(且n1≤ n2 ),來自同一總體或分布相同的兩個總體,則n1樣本的秩和T1與其理論秩和n1(N+1)/2相差不大,即[T1- n1(N+1)/2]僅為抽樣誤差所致。當(dāng)二者相差懸殊

26、,超出抽樣誤差可解釋的范圍時,則有理由懷疑該假設(shè),從而拒絕。,,,,成組設(shè)計的多個樣本比較的秩和檢驗 Kruskal-Wallis test,用于推斷非正態(tài)分布定量變量或有序分類變量的多個總體分布位置有無差別。,(1)原始數(shù)據(jù)的多個樣本比較例12.5 某醫(yī)師檢測3種卵巢功能異?;颊哐逯写冱S體素的含量(U/L)資料見表12.5第(1)、(3)、(5)欄。問3種患者血清中促黃體素的含量(U/L)是否有差別?,表12.5 三種卵巢

27、功能異?;颊哐逯写冱S體素的含量(U/L),這是定量資料多組獨立樣本的比較,并且該數(shù)據(jù)屬于一端無確切值的資料,不能采用方差分析,現(xiàn)用Kruskal-Wallis H秩和檢驗進行分析。,檢驗步驟:(1)建立檢驗假設(shè),確定檢驗水準(zhǔn)。 H0:3種卵巢功能異?;颊哐逯写冱S體素的 含量總體分布位置相同 H1:3種卵巢功能異常患者血清中促黃體素的 含量總體分布位置不全相

28、同 α=0.05,(2)計算檢驗統(tǒng)計量 H 將三組數(shù)據(jù)由小到大統(tǒng)一編秩, 遇相同數(shù)值在同一組內(nèi),可順次編秩; 當(dāng)相同數(shù)值出現(xiàn)在不同組時,則必須求平均秩次。,表12.5 三種卵巢功能異?;颊哐逯写冱S體素的含量(U/L),(2)計算檢驗統(tǒng)計量 H,(12.5),本例,當(dāng)相持較多,按式(12.5)H值偏小,可用式(12.6)進行校正得Hc值。,(12.6),本例相同秩次較少,無

29、需校正。,其中,,tj為第j次相持時相同秩次的個數(shù)。,(3)確定P值,并作出統(tǒng)計推斷。,Kruskal-Wallis H檢驗的基本思想:,(2)等級資料的多樣本比較例:某醫(yī)院用三種復(fù)方小葉枇杷治療老年慢性支氣管炎,數(shù)據(jù)見表12.6第(1)(4)欄,試比較三種方劑的療效有無差異。,,(1)建立檢驗假設(shè),確定檢驗水準(zhǔn)。 H0:3種方劑療效的總體分布位置相同 H1:3種方劑療效的總體分布位置不全相同 ? =

30、0.05,(2)計算檢驗統(tǒng)計量 H ①編秩:與頻數(shù)表兩樣本比較類似。先計算各等級的合計,再確定秩次范圍,及平均秩次,見表第(5)、(6)、(7)欄。 ②求各組秩和:與等級資料兩樣本比較類似,計算各組各等級的頻數(shù)與平均秩次的乘積之和。,(3) 計算檢驗統(tǒng)計量值H,,,,由于相持出現(xiàn)較多,按式(12.6)計算Hc值。,(3)確定P值,并作出統(tǒng)計推斷。 因組數(shù)k=3, =k–1=2,近似服

31、從 =2的 分布,查 界值表,得P<0.005。按 ? =0.05水準(zhǔn)拒絕H0,接受H1,差別有統(tǒng)計學(xué)意義,故可以認(rèn)為3種復(fù)方小葉枇杷方劑治療老年慢性支氣管炎的療效有差別。 若要具體回答3種復(fù)方小葉枇杷方劑治療老年慢性支氣管炎的療效每兩種之間是否有差別,還需進一步做兩兩比較。,(三)成組設(shè)計多個樣本資料的兩兩比較,多個樣本的兩兩比較的秩和檢驗擴展的t檢驗法Nemenyi法等,擴展的t檢

32、驗,統(tǒng)計量t值,,(2) 列出兩兩比較計算表,求得t值。見表12.7。,3. 確定值,作出統(tǒng)計推斷,但上述這些方法目前在常用SPSS、SAS、Stata統(tǒng)計軟件中均無法直接實現(xiàn),現(xiàn)介紹兩種實際工作中借助軟件較易操作的方法。秩變換后進行方差分析及多重比較。調(diào)整 α 水準(zhǔn)法 采用Bonferroni法調(diào)整 α 水準(zhǔn),調(diào)整后的 水準(zhǔn)為:α’= α /需要比較的次數(shù),例如,三組間兩兩均需進行比較,則比較的次數(shù)為3次,檢驗水準(zhǔn)調(diào)

33、整為α’= α /3=0.017。,第四節(jié) 隨機區(qū)組設(shè)計的秩和檢驗,多個相關(guān)樣本比較的Friedman M 檢驗,,,總結(jié):非參數(shù)檢驗的正確應(yīng)用,非參數(shù)檢驗是不依賴總體分布類型,也不對總體參數(shù)進行推斷的一類統(tǒng)計方法。它具有廣泛的適應(yīng)性和較好的穩(wěn)定性;但若資料符合參數(shù)檢驗條件,用非參數(shù)檢驗會損失部分信息,降低檢驗效能,因而在符合參數(shù)檢驗的條件下首選參數(shù)檢驗。,總結(jié): 非參數(shù)檢驗的正確應(yīng)用,等級資料或者分布不明確資料進行分析;可用于任

34、意分布(distribution free)的資料;T檢驗與H檢驗的關(guān)系 T檢驗 H檢驗 t 檢驗 F檢驗,,,g ≥ 2,,,g=2,計量資料中: 極度偏態(tài)資料,或個別數(shù)值偏離過大 各組離散度相差懸殊 資

35、料中含有不確定值 大于5年 <0.001 1:1024以上,總結(jié): 非參數(shù)檢驗的正確應(yīng)用,秩和檢驗是將原數(shù)據(jù)轉(zhuǎn)換為秩次,比較各組秩和的一類非參數(shù)檢驗方法。不同設(shè)計類型的秩和檢驗其編秩、求秩和、計算統(tǒng)計量、確定 值的方法有所不同。注意編秩時相同數(shù)據(jù)一般取平均秩次,以及相持現(xiàn)象較多時需對統(tǒng)計量進行校正。,總結(jié): 非參數(shù)檢驗的正確應(yīng)用,需注意:有序分類變量資料運用秩和檢驗可推斷各等級強度的差別,而列聯(lián)表 ?2檢驗是比較

36、各組頻數(shù)分布之間的差別。,總結(jié): 非參數(shù)檢驗的正確應(yīng)用,心肌壞死面積例,用二種食物配方飼養(yǎng)大白鼠,觀察心肌壞死面積。分析二組間的差異。A組:(n=29, mean= 3.61) 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.2, 0.3, 0.4, 0.4, 0.6, 1, 1.6, 2.2, 2.6, 3.3, 4.3, 5.1, 5.4, 5.5, 6.1, 6.2, 9.7,

37、 13.8, 36B組: (n=28, mean=1.06) 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.2, 0.2, 0.2 0.3, 0.4, 0.4, 0.9, 0.9, 1.3, 1.7, 2.8, 7.4, 13,特點:,0特別多,無論用什么變換均不可能改變分布的偏性;0與其它數(shù)的區(qū)別是質(zhì)的區(qū)別。,分析一:二組心肌壞死率比較,按四格表作?2檢

38、驗:,無心肌壞死 有心肌壞死 合計 心肌壞死率 甲組 10 19 29 65.5% 乙組 15 13 28 46.4% ?c2= 1.404, P = 0.24,,分析二:二組平均心肌壞死面積的比較,二組平均心肌壞死面積的 t 檢

39、驗: t =-1.7755,P = 0.0814該分析是否恰當(dāng)?,分析三:按等級資料處理:,兩組秩和檢驗: n 秩和 理論秩和 A組29 968 841B組28 685 812合計57 1653 1653 Z =

40、2.119, P =0.0341。,成組設(shè)計兩樣本比較,如資料滿足 t 檢驗的條件,應(yīng)該用 t 檢驗進行分析。此時,如果對這類資料用Wilcoxon秩和檢驗,實際上是將觀察單位的具體數(shù)值舍棄不用,只保留了秩次的信息,使檢驗效能降低;尤其樣本含量較小時,降低更加明顯。 如資料不滿足 t 檢驗的條件,而用了t 檢驗,同樣降低了檢驗效能。,秩變換檢驗,基本思想:將等級轉(zhuǎn)換為秩次;對秩次作效應(yīng)的參數(shù)檢驗(t檢驗,方差分析,相關(guān)等)。在

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論