總體率的區(qū)間估計與假設檢驗ppt課件_第1頁
已閱讀1頁,還剩67頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、第八章 總體率的區(qū)間估計和假設檢驗,1,,,[學習要求] 掌握:率的標準誤的計算方法,總體率的區(qū)間估計方法,樣本率與總體率比較的z檢驗、兩樣本率比較的z檢驗、獨立四格表資料的 檢驗、配對四格表資料的 檢驗,行×列表資料的 檢驗。 熟悉:率的抽樣誤差的概念,樣本率與總體率比較和兩樣本率比較的檢驗的適用條件,獨立四格表與配對四格表資料的連續(xù)性校正條件。 了解: 檢驗的基本思

2、想,行×列表 檢驗的注意事項。,,2,第一節(jié) 率的抽樣誤差與總體率的區(qū)間估計,3,4,5,6,7,8,9,10,11,第二節(jié) 率的z檢驗,12,13,14,第二節(jié) 率的z檢驗,15,16,17,18,19,第二節(jié) 率的z檢驗,20,21,22,23,24,25,26,27,28,29,檢驗是用途很廣的一種假設檢驗方法,可以用于兩個率或兩個構(gòu)成比比較的卡方檢驗;多個率或多個構(gòu)成比比較的卡方檢驗;分類資料的相關(guān)

3、分析;頻數(shù)分布的擬合優(yōu)度檢驗等。這里我們主要學習它在分類變量資料統(tǒng)計推斷中的應用,包括:獨立四格表資料的卡方檢驗;配對四格表資料卡方檢驗;行×列表資料卡方檢驗。,第三節(jié) 檢驗,30,卡方檢驗是用途很廣的一種假設檢驗方法,這里我們主要學習它在分類資料統(tǒng)計推斷中的應用,包括:兩個率或兩個構(gòu)成比比較的卡方檢驗;多個率或多個構(gòu)成比比較的卡方檢驗;分類資料的相關(guān)分析;頻數(shù)分布的擬合優(yōu)度檢驗等。,,31,χ2分布是一種連

4、續(xù)型隨機變量的概率分布。如果Z服從標準正態(tài)分布,那么,Z2服從自由度為1的χ2分布。設有k個相互獨立的標準正態(tài)分布隨機變量Z1、Z2……Zν,Z12+Z22+……+Zν2的分布稱為自由度為ν的χ2分布,記為χ2分布的形狀依賴于自由度ν的大小,當自由度ν>2時,隨著ν的增加,曲線逐漸趨于對稱,當自由度ν趨于∞時,χ2分布逼近正態(tài)分布。,32,在分類資料統(tǒng)計分析中我們常會遇到這樣的資料,如兩組大白鼠在不同致癌劑作用下的發(fā)癌率如下表

5、,問兩組發(fā)癌率有無差別?,一、卡方檢驗基本思想,33,上表資料又被稱之為四格表資料??ǚ綑z驗的統(tǒng)計量是卡方值,它是每個格子實際頻數(shù)(A)與理論頻數(shù)(T)差值平方與理論頻數(shù)之比的累計和。每個格子中的理論頻數(shù)T是在假定兩組的發(fā)癌率相等(均等于兩組合計的發(fā)癌率)的情況下計算出來的,如第一行第一列的理論頻數(shù)為71*91/113=57.18,故卡方值越大,說明實際頻數(shù)與理論頻數(shù)的差別越明顯,兩組發(fā)癌率不同的可能性越大。,34,假設檢驗事物的“實際

6、頻數(shù)”與“理論頻數(shù)”的相差是由于抽樣誤差所引起的,亦或是二者本質(zhì)上的差別。χ2檢驗的基本公式: A:表示實際頻數(shù)

7、 T:表示理論頻數(shù),,35,適用范圍,1、單個頻數(shù)分布的擬和優(yōu)度檢驗;2、完全隨機設計下兩組頻數(shù)分布的χ2檢驗和多組頻數(shù)分布的χ2檢驗;3、配對設計下兩組頻數(shù)分布的χ2檢驗。,,36,二 獨立四格表資料χ2檢驗,1、 χ2檢驗的基本公式,37,例8-3-1:某醫(yī)院分別用化學療法和化療結(jié)合放療治療卵巢癌腫患者,結(jié)果如下,問兩種療法有無差別?表1:兩種療法治療卵巢癌腫的療效比較組別

8、 有效 無效 合計 有效率(%)化療組 19 24 43 44.2化療+放療組 34 10 44 77.3合 計 53 34

9、 87 60.9表中的四個數(shù)據(jù)是整個表中的基本資料,其余數(shù)據(jù)均由此推算出來,這四格資料專稱四格表(fourfold table)。兩有效率的差別可能是抽樣誤差所致,亦可能是兩種治療方法有效率(總體率)確有不同。用χ2檢驗來確定其統(tǒng)計學意義。,,,,,,38,A為實際頻數(shù):表中四個數(shù)據(jù);T為理論頻數(shù):根據(jù)檢驗假設推斷出來的。即假設這兩種卵巢癌腫治療方法的有效率相同,差別僅是由于抽樣誤差所致。這里

10、可將兩種療法的合計有效率作為理論有效率,以此為依據(jù)便可推算出四格表中相應四格的理論頻數(shù)T。TRC表示第R行C列格子的理論頻數(shù)nR為與理論數(shù)同行的行合計數(shù)nC為與理論數(shù)同列的列合計數(shù)n為總例數(shù),39,(1)建立檢驗假設、確定檢驗水準H0:π1=π2H1:π1≠π2α=0.05(2)計算檢驗統(tǒng)計量χ2值 =10.01 (3)確定P值作出推斷性結(jié)論χ2檢驗的自由

11、度ν=(行數(shù)-1)(列數(shù)-1)本題ν=(2-1)(2-1)=1查χ2界值表: χ2 0.05,1 =3.84,χ2> χ2 0.05,1 ,P<0.05結(jié)論:按α=0.05檢驗水準拒絕H0接受H1,差異有統(tǒng)計學意義??梢哉J為采用放療加化療治療卵巢癌腫的療效比單用化療好。,40,2、四格表的專用公式:,式中a、b、c、d各代表四格表中的四個實際數(shù),標記如下:,表1 兩種療法治療卵巢癌腫的療效比較組別

12、 有效 無效 合計化療組 19(a) 24(b) 43 化療+放療組 34(c) 10(d) 44合 計 53

13、 34 87 (n),,,,,41,=10.01,結(jié)論同前。,42,3、獨立四格表的連續(xù)性校正公式:由于χ2界值表是根據(jù)連續(xù)性的理論分布計算出來的。但原始資料屬于分類變量資料,是不連續(xù)的。由此計算的χ2值也是不連續(xù)的,特別是自由度為1的四格表資料,在下列情況下需計算校正的χ2值,如不校正,所得的概率偏低。校正的條件:1≤T<5,且n≥40時,需計算校正的χ2值,43,校正χ2

14、值的計算公式:,基本公式的校正,專用公式的校正,,,44,例8-3-2 某醫(yī)師用甲、乙兩種療法治療小兒單純性消化不良,結(jié)果如下,試比較兩種療法有效率有無差異? 表2:兩種療法治療小兒單純性消化不良療效比較療法 痊愈數(shù) 未愈數(shù) 合計甲

15、 26(28.82) 7(4.18) 33乙 36(33.18) 2(4.82) 38合計 62 9 71,,,,,45,(1)建立檢驗假設、確定檢驗水準H0:π1=π2H1:π1≠π2α=0.05(2)計算χ2值,(3

16、)確定P值,作出推斷性結(jié)論。χ2 0.05,1 =3.84 , χ20.05結(jié)論:按α=0.05檢驗水準尚不能拒絕H0,差異無統(tǒng)計學意義,故尚不能認為兩種療法的有效率不同。,46,三 配對四格表資料的χ2檢驗,配對分類變量資料和配對數(shù)值變量資料從配對設計來說是相同的。對配對分類變量資料的統(tǒng)計分析,需用配對四格表資料的χ2檢驗。,47,例8-3-3 下表是28份咽喉涂抹標本,每份按同樣條件分別接種甲、乙兩種白喉桿菌培養(yǎng)基上,觀察

17、白喉桿菌生長情況,試比較兩種培養(yǎng)基的效果? 表3:兩種白喉桿菌培養(yǎng)基培養(yǎng)結(jié)果比較 甲培養(yǎng)基 乙培養(yǎng)基 合計 + - + 11(a) 9(b)

18、 20 - 1 ( c) 7(d) 8 合 計 12 16 28,,,,,,48,從表中資料可見有四種結(jié)果a:甲+乙+ b:甲+ 乙- c:甲- 乙+ d:甲- 乙

19、-我們的目的是比較兩種培養(yǎng)基的培養(yǎng)結(jié)果有無差異,則a、d 兩種結(jié)果是一致的,對差異比較毫無意義。故我們只考慮結(jié)果不同的b與c。若兩種培養(yǎng)基的培養(yǎng)結(jié)果沒有差別,則b應等于c,但是由于抽樣誤差的存在樣本的b和c可能不等,如何做出判斷可進行如下χ2檢驗當b+c≥40時當b+c<40時,49,(1)建立檢驗假設、確定檢驗水準H0:π1=π2H1:π1≠π2α=0.05(2)計算χ2值,(3)χ2 0.05,1 =3.84

20、 χ2>χ2 0.05,1 P<0.05結(jié)論:按α=0.05檢驗水準拒絕H0接受H1 ,差異有統(tǒng)計學意義。故可以認為甲培養(yǎng)基的白喉桿菌的生長效率較高。,50,作業(yè)1 用甲乙兩種方法檢查已確診的胰腺癌病人120例,結(jié)果如下表。問兩種方法檢出結(jié)果是否有差異? 甲乙兩法對胰腺癌的檢出結(jié)果,51,作業(yè)2 現(xiàn)對53例經(jīng)標準化診斷為原發(fā)性肝癌(HCC)病人和42例非原發(fā)性肝癌

21、病人采用血清胎盤酸性同功鐵蛋白(PAIF)進行鑒別診斷,結(jié)果見下表。問PAIF判斷結(jié)果與標準診斷結(jié)果是否一樣?對原發(fā)性肝癌的鑒別診斷,52,四、行×列資料χ2檢驗分類變量資料具有多分類時,兩個頻數(shù)分布的數(shù)據(jù)可表示為一個R*C列聯(lián)表。對這類資料進行χ2檢驗時統(tǒng)計量χ2按下式計算:,A為各格子實際頻數(shù) ni、mj為與各Aij值相對應的行合計、列合計。n有(i=1、2…R)R個取值;m有(j=1、2…C)C個取值。上式的適

22、用條件:不能有理論數(shù)T<1,并且1≤T<5的格子數(shù)不超過總格子數(shù)的1/5。自由度ν=(行數(shù)-1)×(列數(shù)-1),53,條件不足時有三種處理方法:(1)增大樣本例數(shù)使理論數(shù)變大;(2)刪去理論數(shù)太小的行或列;(3)將理論數(shù)太小的行或列與性質(zhì)相近的鄰行或鄰列合并,使重新計算的理論數(shù)增大。但如此處理有可能損失信息,也會損害樣本的隨機性。,54,適用范圍1、兩總體構(gòu)成比比較;2、多總體率比較;3、多總體構(gòu)成

23、比比較;,55,兩總體構(gòu)成比的比較,56,57,58,例8-3-5 某省觀察三個地區(qū)的花生污染黃曲霉毒素B1的情況,見下表。問三個地區(qū)花生的黃曲霉毒素B1污染率有無差別?,多個率的比較,59,表4:某省三個地區(qū)花生的黃曲霉毒素B1污染率比較地區(qū) 未污染 污染 合計 污染率(%) 甲 6

24、 23 29 79.3 乙 30 14 44 31.8 丙 8 3 11 27.

25、3合計 44 40 84 47.6,,,,,(1)建立檢驗假設、確定檢驗水準H0:三個地區(qū)花生污染黃曲霉毒素B1污染率相等H1:三個地區(qū)花生污染黃曲霉毒素B1污染率不等或不全相等α=0.05(2)計算χ2值,60,ν=(3-1)(2-1)=2(3)χ2 0.05,2 =5.99

26、 χ2>χ2 0.05,2 P<0.05結(jié)論:按α=0.05檢驗水準尚不能拒絕H0接受H1 ,故可認為三個地區(qū)花生污染黃曲霉毒素B1污染率不等或不全相等,有地區(qū)性差異。,61,多總體構(gòu)成比的比較,62,63,64,對于比較多組獨立樣本的χ2檢驗,拒絕H0只能說明各組總體概率不全相同,即多組中至少有兩組的有效概率是不同的,但并不是多組有效概率彼此之間均不相同。若要明確哪兩組間不同,還需進一步作多組間的兩

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論