sas軟件應(yīng)用之一致性檢驗kappa_第1頁
已閱讀1頁,還剩43頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、第22章 一致性檢驗kappa,,學(xué)習(xí)目標(biāo),熟悉Kappa值的判斷標(biāo)準(zhǔn);掌握Kappa值的計算以及檢驗方法;掌握二分類資料和有序分類資料的一致性分析;,Kappa檢驗,在診斷試驗中,研究者希望考察不同的診斷方法在診斷結(jié)果上是否具有一致性。診斷試驗的一致性檢驗經(jīng)常用于下列兩種情況:一種是評價新的診斷試驗方法與金標(biāo)準(zhǔn)的一致性;另一種是評價兩種診斷試驗方法對同一個樣本或研究對象的化驗結(jié)果的一致性、兩個醫(yī)務(wù)工作者對同一組病人的診斷結(jié)論的一

2、致性、同一醫(yī)務(wù)工作者對同一組病人前后進行兩次觀察作出診斷的一致性等。1960年Cohen等提出用Kappa值作為評價判斷的一致性程度的指標(biāo)。實踐證明,它是一個描述診斷的一致性較為理想的指標(biāo),因此在臨床試驗中得到廣泛的應(yīng)用。,Kappa檢驗,Kappa是評價一致性的測量值。檢驗是否沿對角線格子中的計數(shù)(接收比率一樣的零件)與那些僅是偶然的期望不同。設(shè)Po =對角線單元中觀測值的總和,Pe=對角線單元中期望值的總和。則Kappa =(Po

3、- Pe)/(1 - Pe)。Kappa是測量而不是檢驗。其大小用一個漸進和標(biāo)準(zhǔn)誤差構(gòu)成的t統(tǒng)計量決定。一個通用的經(jīng)驗法則是Kappa大于0.75表示好的一致性(Kappa最大為1);小于0.4表示一致性差。Kappa不考慮評價人間的意見不一致性的程度,只考慮他們一致與否。,Kappa檢驗,對于用Kappa值判斷一致性的建議參考標(biāo)準(zhǔn)為:Kappa =+1,說明兩次判斷的結(jié)果完全一致;Kappa =-1,說明兩次判斷的結(jié)果完全不一致;

4、Kappa =0,說明兩次判斷的結(jié)果是機遇造成;Kappa0,此時說明有意義,Kappa愈大,說明一致性愈好;Kappa≥0.75,說明已經(jīng)取得相當(dāng)滿意的一致程度;Kappa<0.4,說明一致程度不夠理想;,二分類資料一致性分析,前面我們已經(jīng)介紹四格表資料的?2檢驗,本節(jié)需要介紹的是Kappa檢驗。那么Kappa檢驗與配對?2檢驗有什么區(qū)別呢?Kappa檢驗重在檢驗兩者的一致性,配對?2檢驗重在檢驗兩者間的差異。對同一樣本

5、數(shù)據(jù),這兩種檢驗可能給出矛盾的結(jié)論。主要原因是兩者對所提供的有統(tǒng)計學(xué)意義的結(jié)論要求非常嚴(yán)格所致。,KAPPA值的計算及檢驗,對兩法測定結(jié)果一致部分進行檢驗,看一致部分是否是由偶然因素影響的結(jié)果,它叫做“一致性檢驗”,也稱Kappa檢驗。說明兩種方法測定結(jié)果的實際一致率與隨機一致率之間的差別是否具有顯著性意義。需要計算反映兩法一致性程度高低的系數(shù),叫做Kappa統(tǒng)計量。具體公式如下:P0為實際一致率,Pe為理論一致率。,,KAPPA

6、值的計算及檢驗,Kappa是一個統(tǒng)計量,也有抽樣誤差,其漸進標(biāo)準(zhǔn)誤(ASE)。由于u=Kappa/ASE近似服從標(biāo)準(zhǔn)正態(tài)分布,故可借助正態(tài)分布理論。H0:Kappa=0,H1:Kappa≠0。如果拒絕H0認(rèn)為兩種方法具有較高的一致性。,KAPPA值的計算及檢驗,在診斷試驗的研究中,數(shù)據(jù)資料多為雙向有序的列聯(lián)表資料,即兩個變量都是有序變量,而且屬性相同。屬性相同分為三種情況,一種情況是屬性、分級水平數(shù)和分級水平都完全相同。如甲醫(yī)生和乙醫(yī)生

7、都把病人的檢查結(jié)果分為1、2、3、4四個等級。此時可直接作Kappa檢驗。當(dāng)這兩個變量都只有2個水平時,就成為配對設(shè)計的四格表資料,可使用配對χ2檢驗,即McNemar檢驗。,KAPPA值的計算及檢驗,第二種是屬性相同的分級水平數(shù)相同,但分級水平不全相同。如甲醫(yī)生和乙醫(yī)生都把病人的檢查結(jié)果分為四個等級,但甲醫(yī)生的分級為1、2、3、4,而乙醫(yī)生的分級為2、3、4、5。在這種情況下,由于列聯(lián)表的行數(shù)和列數(shù)仍然是一致的,即列聯(lián)表仍為方表,所以

8、也可計算出相應(yīng)的Kappa統(tǒng)計量。第三種是屬性相同,但分級水平數(shù)和分級水平不全相同。這種情況就是我們所說的列聯(lián)表的行列數(shù)不一致。由于收集上來的數(shù)據(jù)不能輕易刪除掉,所以我們考慮添加行或列使聯(lián)表成為方表。如行數(shù)為n,例數(shù)為n-1,則我們只需要添加第n列,在第n行第n列的格點中添加權(quán)值0001,而第n行的其它格點均設(shè)為0,就可以命名其成為方表,并計算Kappa統(tǒng)計量了。由于權(quán)值系數(shù)很小,所以不會影響Kappa值的計算結(jié)果。,KAPPA值的計算

9、及檢驗,另一方面,如果兩個變量中有一個變量是金標(biāo)準(zhǔn),那么我們不但能分析出檢驗結(jié)果的一致性,還可以計算出敏感度、特異度、誤診率和漏診率等指標(biāo)。如果有不同的診斷分界點,還可以繪制出ROC曲線。 診斷試驗的評價在醫(yī)學(xué)研究中具有十分重要的意義,目前大多數(shù)文獻都使用Kappa統(tǒng)計量來檢驗結(jié)果的一致性。所以本研究主要是對Kappa系數(shù)作一個探討和分析。診斷試驗評價的統(tǒng)計學(xué)方法還會隨著更多問題的提出和解決而不斷得到發(fā)展、修正和擴展。,有序分類資料一

10、致性分析,R×C表可以分為雙向無序、單向有序、雙向有序?qū)傩韵嗤碗p向有序?qū)傩圆煌?類。雙向無序R×C表 R×C表中兩個分類變量皆為無序分類變量,對于該類資料:①若研究目的為多個樣本率(或構(gòu)成比)的比較,可用行×列表資料的?2檢驗;②若研究目的為分析兩個分類變量之間有無關(guān)聯(lián)性以及關(guān)系的密切程度時,可以用行×列表資料的?2檢驗以及Pearson列聯(lián)系數(shù)進行分析。,有序分類資料一致性分析,

11、單向有序R×C表 有兩種形式。一種是R×C表中的分組變量是有序的,而指標(biāo)變量是無序的。此種單向有序R×C表資料可用行×列表資料的?2檢驗進行分析。另一種情況是R×C表中的分組變量是無序的,而指標(biāo)變量是有序的,此種單向有序R×C表資料宜用秩和檢驗進行分析。,有序分類資料一致性分析,雙向有序?qū)傩圆煌腞×C表 R×C表中的兩分類變量皆為有序且屬性不相同。對于

12、該類資料,需要分析兩有序分類變量間是否存在線性變化趨勢,宜用有序分組資料的線性趨勢檢驗。雙向有序?qū)傩韵嗤腞×C表中的兩分類變量皆為有序且屬性相同。實際上是2×2配對設(shè)計的擴展,此時宜用一致性檢驗(或稱Kappa檢驗)。所以,對于雙向有序且屬性相同的數(shù)據(jù),我們可以采用Kappa檢驗判斷其一致性。,本章小節(jié),1960年Cohen等提出用Kappa值作為評價判斷的一致性程度的指標(biāo)。實踐證明,它是一個描述診斷的一致性較

13、為理想的指標(biāo),因此在臨床試驗中得到廣泛的應(yīng)用。Kappa是評價一致性的測量值。檢驗是否沿對角線格子中的計數(shù)(接收比率一樣的零件)與那些僅是偶然的期望不同。設(shè)Po =對角線單元中觀測值的總和,Pe=對角線單元中期望值的總和。則Kappa =(Po - Pe)/(1 - Pe)。Kappa是測量而不是檢驗。其大小用一個漸進和標(biāo)準(zhǔn)誤差構(gòu)成的t統(tǒng)計量決定。一個通用的經(jīng)驗法則是Kappa大于0.75表示好的一致性(Kappa最大為1);小于0.4

14、表示一致性差。,本章小節(jié),對兩法測定結(jié)果一致部分進行檢驗,看一致部分是否是由偶然因素影響的結(jié)果,它叫做“一致性檢驗”,也稱Kappa檢驗。說明兩種方法測定結(jié)果的實際一致率與隨機一致率之間的差別是否具有顯著性意義。,本章小節(jié),SAS過程中也是用FREQ過程進行一致性檢驗,只需要在TABLES語句中添加agree選項即可輸出Kappa值,但是要進行一致性檢驗,需要編寫其它程序語句。雙向有序?qū)傩韵嗤腞×C表中的兩分類變量皆為有序且

15、屬性相同。實際上是2×2配對設(shè)計的擴展,此時宜用一致性檢驗(或稱Kappa檢驗)。,,,第23章 概率抽樣方法,,學(xué)習(xí)目標(biāo),掌握簡單隨機抽樣及SAS程序;掌握系統(tǒng)(機械、等距)抽樣及SAS程序;掌握分層抽樣及SAS程序;掌握整群抽樣及SAS程序。,概述,抽樣調(diào)查可以分為兩類,即概率抽樣和非概率抽樣。概率抽樣是按照隨機原則進行抽樣,不加主觀因素,組成總體的每個單位都有被抽中的概率(非零概率),可以避免樣本出現(xiàn)偏差,樣本對

16、總體有很強的代表性。非概率抽樣是按主觀意向進行的抽樣(非隨機的),組成總體的很大部分單位沒有被抽中的機會(零概率),使調(diào)查很容易出現(xiàn)傾向性偏差。,概述,現(xiàn)代被廣泛應(yīng)用的抽樣調(diào)查是概率抽樣。因此,現(xiàn)代的抽樣調(diào)查是指概率抽樣,其定義為:抽樣調(diào)查,又稱抽樣推斷,是一種重要的、科學(xué)的非全面調(diào)查方法。它根據(jù)調(diào)查的目的和任務(wù)要求,按照隨機原則,從若干單位組成的事物總體中,抽取部分樣本單位來進行調(diào)查、觀察,用所得到的調(diào)查標(biāo)志的數(shù)據(jù)來推斷總體。,概述,

17、概率抽樣的原則,就是總體中的每一個樣本被選中的概率相等。概率抽樣之所以能夠保證樣本對總體的代表性,其原理就在于它能夠很好的按總體內(nèi)在結(jié)構(gòu)中所蘊含的各種隨機事件的概率來構(gòu)成樣本,使樣本成為總體的縮影。,概述,抽樣調(diào)查按抽樣的組織形式劃分,有以下幾種主要方法:簡單隨機抽樣:按照等概率的原則,直接從含有N個元素的總體中抽取n個元素組成的樣本(N>n)。系統(tǒng)抽樣(等距抽樣或機械抽樣):把總體的單位進行排序,再計算出抽樣距離,然后按照這

18、一固定的抽樣距離抽取樣本。第一個樣本采用簡單隨機抽樣的辦法抽取。,概述,K(抽樣距離)=N(總體規(guī)模)/n(樣本規(guī)模)前提條件:總體中個體的排列對于研究的變量來說,應(yīng)是隨機的,即不存在某種與研究變量相關(guān)的規(guī)則分布。可以在調(diào)查允許的條件下,從不同的樣本開始抽樣,對比幾次樣本的特點。如果有明顯差別,說明樣本在總體中的分布承某種循環(huán)性規(guī)律,且這種循環(huán)和抽樣距離重合。,概述,分層抽樣(類型抽樣):先將總體中的所有單位按照某種特征或標(biāo)志(性別、

19、年齡等)劃分成若干類型或?qū)哟?,然后再在各個類型或?qū)哟沃胁捎煤唵坞S機抽樣或系用抽樣的辦法抽取一個子樣本,最后,將這些子樣本合起來構(gòu)成總體的樣本。分層抽樣是把異質(zhì)性較強的總體分成一個個同質(zhì)性較強的子總體,再抽取不同的子總體中的樣本分別代表該子總體,所有的樣本進而代表總體。,概述,分層標(biāo)準(zhǔn)為:以調(diào)查所要分析和研究的主要變量或相關(guān)的變量作為分層的標(biāo)準(zhǔn)。以保證各層內(nèi)部同質(zhì)性強、各層之間異質(zhì)性強、突出總體內(nèi)在結(jié)構(gòu)的變量作為分層變量。以那些有

20、明顯分層區(qū)分的變量作為分層變量。,概述,分層的比例問題:按比例分層抽樣:根據(jù)各種類型或?qū)哟沃械膯挝粩?shù)目占總體單位數(shù)目的比重來抽取子樣本的方法。不按比例分層抽樣:有的層次在總體中的比重太小,其樣本量就會非常少,此時采用該方法,主要是便于對不同層次的子總體進行專門研究或進行相互比較。如果要用樣本資料推斷總體時,則需要先對各層的數(shù)據(jù)資料進行加權(quán)處理,調(diào)整樣本中各層的比例,使數(shù)據(jù)恢復(fù)到總體中各層實際的比例結(jié)構(gòu)。,概述,整群抽樣:抽樣的單位不

21、是單個的個體,而是成群的個體。它是從總體中隨機抽取一些小的群體,然后由所抽出的若干個小群體內(nèi)的所有元素構(gòu)成調(diào)查的樣本。對小群體的抽取可采用簡單隨機抽樣、系統(tǒng)抽樣和分層抽樣的方法。優(yōu)點:簡便易行、節(jié)省費用,特別是在總體抽樣框難以確定的情況下非常適合。缺點:樣本分布比較集中、代表性相對較差。一般來說,類別相對較多、每一類中個體相對較少的做法效果較好。,概述,多階抽樣(分段抽樣):按照元素的隸屬關(guān)系后層次關(guān)系,把抽樣過程分為幾個階段進行

22、。適用于總體規(guī)模特別大,或者總體分布的范圍特別廣時。二重抽樣(又稱兩相抽樣):就是先抽取一個容量比較大的初始樣本,用初始樣本估計總體的某些參數(shù)或某些必要的信息作為分層的比例或再次抽樣的標(biāo)志,然后將抽出的初始大樣本作為“總體”,從中抽取容量合適的樣本進行比較詳細(xì)的調(diào)查。特點是,適合用于對總體信息了解比較少的調(diào)查。,概述,比率抽樣(PPS抽樣):就是將總體按一種準(zhǔn)確的標(biāo)準(zhǔn)劃分出容量不等的具有相同標(biāo)志的單位在總體中不同比率分配的樣本量進行的

23、抽樣。特點是總體中含量大的部分被抽中的概率也大,可以提高樣本的代表性。,概述,在抽樣調(diào)查的實際工作中,經(jīng)常是要將幾種抽樣方法結(jié)合起來應(yīng)用。比如,城市居民的收支調(diào)查,是將二重抽樣、多階段抽樣、分層抽樣、機械抽樣等多種方法結(jié)合起來使用。   在現(xiàn)實的商業(yè)性的市場調(diào)查中也有非概率抽樣的應(yīng)用。如,配額抽樣、隨意抽樣、志愿者抽樣、判斷抽樣、修正的概率抽樣和滾雪球抽樣等等,由于這些抽樣方法容易出現(xiàn)偏差,所以只在對共性特別強的群體的商業(yè)性

24、調(diào)查中應(yīng)用。,簡單隨機抽樣及SAS程序,SAS系統(tǒng)中利用SURVEYSELECT過程步進行簡單隨機抽樣。SURVEYSELECT過程的語法格式如下:PROC SURVEYSELECT DATA= OUT= METHOD= SAMPSIZE= SAMPRATE= REP= SEED= NOPRINT;ID variable;RUN;,簡單隨機抽樣及SAS程序,DATA語句指定要分析的數(shù)據(jù)集名及一些選項;OUT選擇項指

25、定輸出結(jié)果的SAS數(shù)據(jù)集名,用來保存抽樣輸出的結(jié)果;METHOD選擇項指定抽樣方法,其中SRS(simple random sampling)為簡單隨機抽樣,SYS(system random sampling)為系統(tǒng)隨機抽樣,等等;SAMPSIZE選擇項指定需要抽樣的樣本量;,簡單隨機抽樣及SAS程序,REP選擇項指定可以重復(fù)抽樣的次數(shù);SAMPRATE選擇項指定抽樣的比例;SEED選擇項指定產(chǎn)生隨機隨機數(shù)字的初始數(shù),缺省是0

26、或負(fù)值;NOPRINT選擇項指定不對輸出結(jié)果進行打?。籌D語句指定數(shù)據(jù)集中需要包含的變量指標(biāo)。,系統(tǒng)(機械、等距)抽樣及SAS程序,把總體的單位進行排序,再計算出抽樣距離,然后按照這一固定的抽樣距離抽取樣本。第一個樣本采用簡單隨機抽樣的辦法抽取。在SURVEYSELECT過程步中,只需要將METHOD選擇項設(shè)定為SYS(systematic random sampling)即可,通過CONTROL語句設(shè)定某個變量作為抽樣距離參考變量

27、,即抽樣之前按照CONTROL變量對原始樣本進行排序,然后按照規(guī)定的樣本量確定抽樣距離,隨機選取第一個樣本并進行系統(tǒng)抽樣。,整群抽樣及SAS程序,整群抽樣抽樣的單位不是單個的個體,而是成群的個體。它是從總體中隨機抽取一些小的群體,然后由所抽出的若干個小群體內(nèi)的所有元素構(gòu)成調(diào)查的樣本。把“成群的個體”當(dāng)作個體來看待,那么整群抽樣與簡單隨機抽樣的原理就是一樣的。,多階抽樣及SAS程序,是將總體分成若干小的群體,但并不在每一小的群體中抽取一個

28、樣本,而是將這些小群體稱為第一性抽樣單元,將它們看作個體進行抽樣,然后,再對抽中的第一性抽樣單元中的個體抽樣,這樣的抽樣當(dāng)然可以不止二階而是多階的,先抽第一性樣單元,再在第一性樣單元鐘抽第二性樣單元,再在第二性樣單元中抽第三性樣單元,如此直至最基層的個體。,多階抽樣及SAS程序,當(dāng)總體中個體數(shù)量太大,或其他技術(shù)上的原因,無法直接對個體編號時,可以采用多階抽樣,先按第一性單元編號,抽取若干個,再在抽得的第一性單元內(nèi)編號,抽取下一級單元。多

29、階抽樣會使現(xiàn)場觀測的樣本單元比較集中,有利于節(jié)省調(diào)查費用。多階抽樣的SAS程序也是以簡單隨機抽樣和系統(tǒng)性抽樣為基礎(chǔ)的,只是每一次抽樣過程編寫一個SAS程序而已,即需要編寫多個SAS程序以進行多次抽樣。,本章小節(jié),現(xiàn)代被廣泛應(yīng)用的抽樣調(diào)查是概率抽樣。因此,現(xiàn)代的抽樣調(diào)查是指概率抽樣,其定義為:抽樣調(diào)查,又稱抽樣推斷,是一種重要的、科學(xué)的非全面調(diào)查方法。它根據(jù)調(diào)查的目的和任務(wù)要求,按照隨機原則,從若干單位組成的事物總體中,抽取部分樣本單位

30、來進行調(diào)查、觀察,用所得到的調(diào)查標(biāo)志的數(shù)據(jù)來推斷總體。,本章小節(jié),概率抽樣的原則,就是總體中的每一個樣本被選中的概率相等。概率抽樣之所以能夠保證樣本對總體的代表性,其原理就在于它能夠很好的按總體內(nèi)在結(jié)構(gòu)中所蘊含的各種隨機事件的概率來構(gòu)成樣本,使樣本成為總體的縮影。,本章小節(jié),簡單隨機抽樣:按照等概率的原則,直接從含有N個元素的總體中抽取n個元素組成的樣本(N>n);系統(tǒng)抽樣(等距抽樣或機械抽樣):把總體的單位進行排序,再計算出抽樣

31、距離,然后按照這一固定的抽樣距離抽取樣本。第一個樣本采用簡單隨機抽樣的辦法抽??;分層抽樣(類型抽樣):先將總體中的所有單位按照某種特征或標(biāo)志(性別、年齡等)劃分成若干類型或?qū)哟?,然后再在各個類型或?qū)哟沃胁捎煤唵坞S機抽樣或系用抽樣的辦法抽取一個子樣本,最后,將這些子樣本合起來構(gòu)成總體的樣本;,本章小節(jié),整群抽樣:抽樣的單位不是單個的個體,而是成群的個體。它是從總體中隨機抽取一些小的群體,然后由所抽出的若干個小群體內(nèi)的所有元素構(gòu)成調(diào)查的樣本

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論