2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩28頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、內(nèi)容,卡方檢驗(yàn)入門(mén),概 述,卡方檢驗(yàn)是以卡方分布為基礎(chǔ)的一種常用假設(shè)檢驗(yàn)方法,主要用于分類(lèi)變量,它基本的無(wú)效假設(shè)是(不包括配對(duì)資料):H0:行分類(lèi)變量與列分類(lèi)變量無(wú)關(guān)聯(lián)H1:行分類(lèi)變量與列分類(lèi)變量有關(guān)聯(lián)?=0.05統(tǒng)計(jì)量 ,其中Ai是樣本資料的計(jì)數(shù),Ti是在H0為真的情況下的理論數(shù)(期望值)。,卡方檢驗(yàn),在H0為真時(shí),實(shí)際觀察數(shù)與理論數(shù)之差A(yù)i-Ti 應(yīng)該比較接近0。所以在H0為真時(shí),檢驗(yàn)統(tǒng)計(jì)

2、量 服從自由度為k-1的卡方分布。 即: ,拒絕H0。 上述卡方檢驗(yàn)由此派生了不同應(yīng)用背景的各種問(wèn)題的檢驗(yàn),特別最常用的是兩個(gè)樣本率的檢驗(yàn)等。,方法原理,方法原理,理論頻數(shù)基于H0成立,兩樣本所在總體無(wú)差別的前提下計(jì)算出各單元格的理論頻數(shù)來(lái),,方法原理,從卡方的計(jì)算公式可見(jiàn),當(dāng)觀察頻數(shù)與期望頻數(shù)完全一致時(shí),卡方值為0;觀察頻數(shù)與期望頻數(shù)越接近,兩者之間的差異越小,卡方

3、值越?。环粗?,觀察頻數(shù)與期望頻數(shù)差別越大,兩者之間的差異越大,卡方值越大。當(dāng)然,卡方值的大小也和自由度有關(guān)。,方法原理,卡方分布 顯然,卡方值的大小不僅與A、E之差有關(guān),還與單元格數(shù)(自由度)有關(guān),,操作步驟,1. 建立檢驗(yàn)假設(shè)和確定檢驗(yàn)水準(zhǔn)H0:使用含氟牙膏和一般牙膏兒童齲患率相等H1:使用含氟牙膏和一般牙膏兒童齲患率不等2. ?=0.053.計(jì)算檢驗(yàn)統(tǒng)計(jì)量?2值,,操作步驟,4. 確定P值和作出推斷結(jié)論查附表8,?2

4、界值表,得p>0.05。按 ? = 0.05水準(zhǔn),不拒絕H0,尚不能認(rèn)為使用含氟牙膏比使用一般牙膏兒童的齲患率低。對(duì)于四格表,卡方的計(jì)算公式又可進(jìn)行簡(jiǎn)化,以方便手工計(jì)算,卡方檢驗(yàn)假設(shè)的等價(jià)性,兩組兒童的齲齒率相同兩組發(fā)生率的比較使用不同的牙膏并不會(huì)影響齲齒的發(fā)生(兩個(gè)分類(lèi)變量間無(wú)關(guān)聯(lián))兩變量的相關(guān)分析,四格表?2值的校正,英國(guó)統(tǒng)計(jì)學(xué)家Yates認(rèn)為,?2分布是一種連續(xù)型分布,而四格表資料是分類(lèi)資料,屬離散型分布,由此計(jì)算

5、的?2值的抽樣分布也應(yīng)當(dāng)是不連續(xù)的,當(dāng)樣本量較小時(shí),兩者間的差異不可忽略,應(yīng)進(jìn)行連續(xù)性校正(在每個(gè)單元格的殘差中都減去0.5)若n > 40 ,此時(shí)有 1< T ?5時(shí),需計(jì)算Yates連續(xù)性校正?2值T <1,或n<40時(shí),應(yīng)改用Fisher確切概率法直接計(jì)算概率,確切概率法,,分析實(shí)例,注意:確切概率法不屬于?2檢驗(yàn)的范疇,但常作為?2檢驗(yàn)應(yīng)用上的補(bǔ)充。,分析實(shí)例,1.建立檢驗(yàn)假設(shè)和確立檢驗(yàn)水準(zhǔn)H0:新

6、藥組與對(duì)照組療效相等,即 ?1 = ?2H1:新藥組與對(duì)照組療效不等,即 ?1 ? ?22.計(jì)算概率和確定P值本例n=a+b = 36 < 40,不滿足?2檢驗(yàn)的應(yīng)用條件,宜采用四格表確切概率法。,方法原理,在四格表周邊合計(jì)不變的條件下,在相應(yīng)的總體中進(jìn)行抽樣,四格表中出現(xiàn)各種排列組合情況的概率本例即28、8、22、14保持不變的條件下,若H0成立,計(jì)算出現(xiàn)各種四格表的概率,,方法原理,然后將其中小于等于現(xiàn)有樣本概率的概

7、率值相加,即為P值:本例中P值=P(0)+ P(6)+P(7)+P(8)=0.0361<0.05,一點(diǎn)補(bǔ)充,確切概率法可以考慮單邊檢驗(yàn)對(duì)于較大的行乘列表,確切概率法的計(jì)算量將變得十分驚人,有可能超出硬件系統(tǒng)可以支持的范圍,配對(duì)設(shè)計(jì)兩樣本率比較的 χ2檢驗(yàn),方法原理,例6.9 用A、B兩種方法檢查已確診的乳腺癌患者140名,A法檢出91名(65%),B法檢出77名(55%),A、B兩法一致的檢出56名(40%

8、),問(wèn)哪種方法陽(yáng)性檢出率更高?,方法原理,顯然,本例對(duì)同一個(gè)個(gè)體有兩次不同的測(cè)量,從設(shè)計(jì)的角度上講可以被理解為自身配對(duì)設(shè)計(jì)上述問(wèn)題為:兩種“處理”之差別分析,方法原理,注意考慮該例四格表中兩處理陽(yáng)性檢出率是否相同只要考慮四格表中的非對(duì)角元素的差異假設(shè)檢驗(yàn)步驟如下:H0:兩法總體陽(yáng)性檢出率無(wú)差別,即B = CH1:兩法總體陽(yáng)性檢出率有差別,即B ? C,方法原理,,注意事項(xiàng),McNemar檢驗(yàn)(配對(duì)卡方檢驗(yàn))只會(huì)利用非主對(duì)角

9、線單元格上的信息,即它只關(guān)心兩者不一致的評(píng)價(jià)情況,用于比較兩個(gè)評(píng)價(jià)者間存在怎樣的傾向。因此,對(duì)于一致性較好的大樣本數(shù)據(jù)(a,d較大且b,c較小時(shí)),McNemar檢驗(yàn)可能會(huì)失去實(shí)用價(jià)值。例如對(duì)1萬(wàn)個(gè)案例進(jìn)行一致性評(píng)價(jià),9995個(gè)都是完全一致的,在主對(duì)角線上,另有5個(gè)分布在左下的三角區(qū),顯然,此時(shí)一致性相當(dāng)?shù)暮?。但如果使用McNemar檢驗(yàn),此時(shí)反而會(huì)得出兩種評(píng)價(jià)有差異的結(jié)論來(lái)。此時(shí),可以考慮邊際卡方檢驗(yàn),見(jiàn)P130,注意事項(xiàng),配對(duì)

10、四格表卡方與成組設(shè)計(jì)卡方由于配對(duì)設(shè)計(jì)的資料同一對(duì)觀察結(jié)果間一般是非獨(dú)立的,而成組設(shè)計(jì)的資料一般可以認(rèn)為是獨(dú)立的,所以配對(duì)四格表資料不能用成組設(shè)計(jì)的?2或Fisher檢驗(yàn)的,而要用配對(duì)設(shè)計(jì)的?2或配對(duì)設(shè)計(jì)的直接計(jì)算概率法進(jìn)行檢驗(yàn)。,Poisson分布資料推斷,Poisson分布資料是離散型資料,但不具有分類(lèi)特征,故視為計(jì)量資料。Poisson分布兩樣本來(lái)自總體均數(shù)是否相等的比較1.兩樣本觀察單位相同:在每個(gè)樣本的觀察值大

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論