版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、分類變量資料的假設檢驗,一、u檢驗 (一)樣本率與總體率比較 (二)兩樣本率比較,二、χ2檢驗 (一)四格表資料的χ2檢驗 (二)行×列(R×C)表資料的χ2檢驗 (三)配對計數資料的χ2檢驗 (四)行×列表的χ2分割 (五)四格表的確切概率法,一、u檢驗,(一)樣本率與總體率比較 樣本率與總體率的假設檢驗的目的是推斷樣本率所代表的未知總體率π與已知總體率π0(一般指理論值、標準值或經
2、大量觀察得到的穩(wěn)定值)是否相等,其u檢驗公式為: 式中,p為樣本率,π0為已知總體率,為根據總體率求得的率的標準誤。,例5-6 由臨床經驗得知,一般潰瘍病患者的胃出血率為20%,現某醫(yī)師觀察65歲以上潰瘍病人250例,其中80例發(fā)生胃出血癥狀,問老年患者胃出血率與一般患者是否不同?,H0:?=?0 ,即老年患者胃出血率與一 般患者相同;H1:???0 ,即老年患
3、者胃出血率與一般患者不同;α=0.05,本例 ?0=20%,n=250,x=80將數據代入上式:,用絕對值查u界值表(t界值表中v =∞欄): 4.743 >3.29 = u0.001/2 P < 0.001 按α=0.05,拒絕H0,接受H1,可認為老年患者胃出血率與一般患者不同,老年潰瘍病患者更容易出現胃出血。,(二)兩樣本率比較 兩樣本率比較
4、的假設檢驗的目的是推斷兩樣本所來自的兩總體的總體率是否相等。,其u檢驗公式為:,例5-7 為比較工人和農民的高血壓患病率,分別調查了50—59歲男性工人和50—59歲男性農民1281人和387人,其高血壓患者分別為386人(患病率30.13%)和65人(患病率16.80%)。問工人與農民的高血壓患病率有無不同?,H0:?1=?2,即工人和農民高血壓患病 率相 同;H1:?1??2, 即工人和農民高血壓患病
5、 率不同;α=0.05,本例 p1=30.13%,x1=386,n1=1281;p2=16.80%,x2=65,n2=387;,將有關數據代入u檢驗公式查u界值表(雙側,t界值表中=∞欄): 5.174 >3.29 = u0.001/2 P < 0.001 按α=0.05,拒絕H0,接受H1,可認為50?59歲男性工人和 50?59歲男性農民高血壓患病率
6、不同,工人患病率高于農民。,二、χ2檢驗,χ2檢驗的基本公式為: 式中A為實際頻數(actual frequency),T為理論頻數(theoretical frequency).,(一)四格表資料的χ2檢驗 例5-8 為觀察藥物A、B治療某病的療效,某醫(yī)師將100例該病病人隨機分為兩組,一組40人,服用A藥;另一組60人,服用B藥。結果發(fā)現:
7、服用A藥40人中有30人治愈;服用B藥的60人中有11人治愈。問A、B兩藥的療效有無差別?,χ2檢驗的基本步驟如下: H0:?1=?2 ,即A、B兩藥療效相同; H1:?1??2 ,即A、B兩藥療效不同; α=0.05,計算理論頻數:理論頻數指的是在無效假設成立的前提下,理論上在實際頻數位置上的頻數。本例如無效假設成立,兩藥療效相同,則其合計的治愈率為41%。據此,A藥組理論治愈人數=40×41%=1
8、6.4,B藥組理論治愈人數=60×41%=24.6;同理,合計未愈率為59%,依此算得A藥組和B藥組未愈人數分別為23.6和35.4。各理論頻數計算見上表中括號內的數字。理論頻數的計算過程可用下式表示:,上式中,R(row)表示行,C(column)表示列;表示第R行第C列的理論數;nR和nC分別代表第R行和第C列的合計數;N為總合計數。,例如:第一行第一列的理論數 T12、T21、T22也可仿此算出。,
9、將表5-2中的理論數和實際數代入χ2檢驗公式: χ2檢驗自由度的計算公式為: v =(行數-1)(列數-1)=(R-1)(C-1)本例:(2-1)(2-1)=1,查附表4,χ2界值表: 31.86>7.88 χ2>χ2 0.005,1 P<0.005 P<0.005,按α=0.05,拒絕H0,接受H
10、1,可認為兩藥療效不同,A藥療效優(yōu)于B藥。,對于四格表資料,可用四格表專用公式簡化計算,省去求理論頻數的過程. 式中,a、b、c、d為四格表的四個實際頻數據,N為總合計數,N=a+b+c+d。對四格表資料與χ2檢驗公式完全等價。仍以上表資料為例:,將上表數據代入上式 計算結果與χ2檢驗公式計算結果相同,四格表χ2檢驗的條件: 1.最小的T≥5,N≥40,用普通χ2檢驗; 2.有1≤
11、T<5,N≥40,用校正的χ2檢驗; 3.有T<1或N<40,用確切概率法。,校正χ2檢驗的計算公式:,例5-9 某醫(yī)師比較甲、乙兩藥療效,甲藥治療患者31例,有效23例;乙藥治療同一種病患者48例,有效46例。試問兩藥療效是否相同?,H0: ?1=?2 ,即甲、乙兩藥療效相同;H1: ?1??2 ,即甲、乙兩藥療效不同; α=0.05,由于,故四格表中有一格140,所以χ2值需校正。將上表數據代入
12、校正檢驗公式v =(R-1)(C-1)=(2-1)(2-1)=1,查附表4,χ2界值表: 5.02 P > 0.01 按α=0.05,拒絕H0,接受H1,可認為甲、乙兩藥療效不同,乙藥療效優(yōu)于甲藥。,(二)行×列(R×C)表資料的χ2檢驗,檢驗統(tǒng)計量計算公式,本例為三個率的比較,3×2=6,為六格表,屬于行×列表,可用行×列表χ2檢驗。
13、 H0:?1=?2=?3,即三種方案有效率相同; H1:三種方案的有效率不同或不全同; α=0.05。,將上表數據代入行×列表卡方檢驗公式 v =(R-1)(C-1)=(3-1)(2-1)=2,查附表態(tài),χ2界值表: 22.80 > 10.60 χ2 > χ20.005,2 P &l
14、t; 0.005 P<0.005,按α=0.05,拒絕H0,接受H1,可認為三種方案治療病毒性肝炎有效率不同或不全同。,本例并非多個率的比較,而是兩組資料構成比的比較,2×4=8,為八格表,屬于行×列表,可用行×列表χ2檢驗。 H0:兩民族居民ABO血型構成相同; H1:兩民族居民ABO血型構成不同; α=0.05,將上表數據代入行×列表卡方檢驗公式
15、 v =(R-1)(C-1)=(2-1)(4-1)=3,查χ2界值表: 26.15 > 12.84 χ2 > χ20.005,3 P < 0.005 P<0.005,按α=0.05,拒絕H0,接受H1,可認為兩民族居民ABO血型構成不同,維吾爾族A、B型血者相對多些,回族O型者相對多些。,上表為同時按照兩個屬性進行交叉分類
16、所形成的雙向有序表(A屬性分為有序的R類,B屬性分為有序的C類),稱之為R×C列聯表(contingency table)。因其仍屬于R×C表,故χ2值的計算與普通R×C表χ2值計算無異。 H0:年齡與冠狀動脈粥樣硬化程度間 相互獨立(即兩者間無關聯); H1:年齡與冠狀動脈粥樣硬化程度間 有關聯; α=0.05,將上表數據代入行×列表卡方檢驗公式
17、v =(R-1)(C-1)=(4-1)(4-1)=9,查χ2界值表: 71.43 > 23.59 χ2 > χ20.005,9 P < 0.005 P<0.005,按α=0.05,拒絕H0,接受H1,可認為年齡與冠狀動脈粥樣硬化程度間有關聯。,若需進一步定量表達兩變量間關聯程度的大小,可選用列聯系數rp,其計算公式如下:,式中,χ2為
18、統(tǒng)計量,n為樣本含量。rp的取值在0∽1之間,0表示完全獨立,1表示完全關聯。本例列聯系數為: 表明年齡與冠狀動脈粥樣硬化之間存在一定的關聯性。,行×列表χ2檢驗注意事項:,1.χ2檢驗要求理論頻數不宜太小,否則將導致分析的偏性。R×C表資料不宜有1/5以上格子的理論頻數小于,或有一個格子的理論頻數小于1。對理論頻數太小的資料,有幾種處理方法:,(1)增大樣本含量;(2)刪去理論頻數太小的行
19、與列;(3)將太小的理論頻數所在的行或列的實際頻數與性質相近的鄰行鄰列的實際頻數進行合并。三種方法中,后兩法可能會損失部分信息,也會損害樣本的隨機性。不同的合并方式有可能影響推斷結論,故不宜作為常規(guī)方法使用。,2.多個樣本率(或構成比)比較的χ2檢驗,結論為拒絕檢驗假設,只能認為至少兩個相差大的樣本率(或構成比)所代表的總體率(或構成比)之間有差別,還不能說明它們彼此之間都有差別。進一步的分析可作χ2分割。,(三)配對計數資料的χ2檢
20、驗,1.兩種培養(yǎng)基培養(yǎng)結果之間有無聯系?,此時可將表5-8看成雙向有序列聯表,做關聯性分析。因此表只有四個格子,故用普通四格表χ2檢驗來分析。 H0:兩種培養(yǎng)基培養(yǎng)結果相互獨立 (無 聯系); H1:兩種培養(yǎng)基培養(yǎng)結果有關聯 (有聯系); α=0.05,將上表數據代入四格表卡方檢驗公式 V =(R-1)(C-1)=(2-1)(2-1)=1,查χ2界值表:
21、 3.84 P > 0.025 P<0.05,按α=0.05,拒絕H0,接受H1,可認為甲、乙兩種培養(yǎng)基培養(yǎng)結果有關聯(聯系)。,本例還可用φ(phi)系數進一步定量表達兩變量關聯程度的大小,φ系數的計算公式如下: 式中,χ2為χ2統(tǒng)計量,n為樣本含量。φ的取值在-1與+1之間,其絕對值越大,關聯程度越高;而符號則表示
22、相互關聯的方向,符號的正負與ad-bc的符號一致。,本例: 由于12×15>16×2,故φ取正值,因此兩種培養(yǎng)基培養(yǎng)結果之間存在正關聯性,即甲培養(yǎng)基培養(yǎng)結果陽性(或陰性),乙培養(yǎng)基培養(yǎng)結果也趨向于陽性(或陰性)。,2.兩種培養(yǎng)基培養(yǎng)結果之間有無差別?,檢驗統(tǒng)計量計算公式為: 分子中的1為連續(xù)性校正數,若b+c≥40是時,可省略。,H0:B=C,即兩種培養(yǎng)基培養(yǎng)結果
23、 陰性數相同; H1:B≠C,即兩種培養(yǎng)基培養(yǎng)結 果陰性數不同; α=0.05,將上表數據代入上式,查χ2界值表: 9.39 > 7.88 χ2 >χ20。005,1 P < 0.005 P<0.005,按α=0.05,拒絕H0,接受H1,兩培養(yǎng)基結果之間有差別,乙培養(yǎng)基陽性數高于
24、甲培養(yǎng)基。,(四)行×列表的χ2分割,例5-14 對例5-10三種方案治療急性無黃疸型病毒性肝炎的有效率作進一步的兩兩比較。 本例西藥組與中藥組兩組有效率差異最小,將它們分割出來,作χ2檢驗得χ2=0.936,v =1,P>0.05,差別無統(tǒng)計意義,可將兩有效率合并,資料重組為新的四格表,再作χ2檢驗得χ2=21.854,1,P<0.05。,χ2分割的原理是χ2值及其自由度的可加性。本例原總表χ2=22.
25、80,2;χ2分割法合計的χ2=22.79,v =2,兩者一致。若前后不一致,就說明分割方法可能有誤。,(五)四格表的確切概率法,本法的基本思想是:在四格表周邊合計不變的條件下,用下式直接計算表內四個數據的各種組合出現的概率。 式中a、b、c、d為四個實際頻數,N為總樣本含量,!這階乘的符號。,例5-15 為了解兩種治療方法對原發(fā)性肝癌的療效,某醫(yī)師隨機把病人分成兩組,一組使用5
26、-氟尿嘧啶+輔助治療(簡稱5-氟組),另一組使用安慰劑+輔助治療(簡稱安慰組)。治療結果按緩解死亡劃分。第1組12人,5人緩解,7人死亡;第2組11人,1人緩解,10人死亡。試問兩組療效是否不同?,本例n<40,且四格表中有兩格1<T<5,宜用四格表的確切概率法。 H0: ?1=?2 ,即兩種療法療效相 同; H1: ?1??2 ,即兩種療法療效不
27、 同; α=0.05,將上表數據代入上式,上表中兩組緩解率差值的絕對值|P1-P2|=|0.4167-0.0909|=0.3258。在周邊合計數不變的條件下,表內四個數據可能還有其它組合其緩解率差別≥0.3258,所有這些比樣本四格表更極端的情況都應考慮進去,因為這些極端情況在H0條件下都可能發(fā)生,其概率是支持H0的。,在周邊合計數不變的條件下,可得到多種不同組合的四格表。為方便起見,選定行合計與列合計均最小所對應的
28、格子為基礎。本例以C格為基礎,其取值的變動范圍從0到對應的最小周邊合計數。本例C格可變范圍為0—6,可得到7個四格表及其相應的概率見理下表。,上表顯示|p1-p2|≥0.3258的有序號為0,5,6的分表,這幾個分表與樣本四格表比,屬于更極端情況,加上樣本四格表,本例所求累計概率為:P=P(0)+P(1)+P(5)+P(6)=0.0092+0.0863 +0.0549+0.0046=0.155 P=0.155,按按α=
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論