兩組二分類結(jié)局的響應(yīng)變量-適應(yīng)性隨機化方法的比較研究.pdf_第1頁
已閱讀1頁,還剩79頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、背景與目的:
  隨機對照試驗(randomized clinic trials,RCTs)被視為臨床研究的金標(biāo)準(zhǔn),其證據(jù)等級也是各研究類型中最高的,這是因為隨機化技術(shù)可使眾多影響結(jié)局的因素達(dá)致均衡,從而使研究結(jié)論更為確定。隨機化時不可避免地會涉及倫理問題,尤其是安慰劑對照試驗,如果試驗藥確實有效,則必然會給安慰劑治療的受試者帶來損害。可是,為了驗證新藥的有效性,就不得不損害少數(shù)受試者的利益而換取整個人類的幸福。盡管如此,我們還是

2、希望對受試者的損害降到最低程度。響應(yīng)變量-適應(yīng)性隨機化方法就是基于上述原則產(chǎn)生的,其基本思想是在確??茖W(xué)驗證的前提下,根據(jù)試驗前期的分組和處理結(jié)局的信息,不斷調(diào)整分組概率,使更多受試者分配到優(yōu)效的試驗組,同時使分配到安慰劑組的受試者盡可能少。
  目前,響應(yīng)變量-適應(yīng)性隨機化方法有很多,按數(shù)據(jù)類型,有二分類、多分類、連續(xù)型和生存分析數(shù)據(jù);按處理組數(shù),有兩組和多組的;按方法學(xué),有參數(shù)方法、非參數(shù)方法和Bayes方法。本研究將對兩平行

3、組設(shè)計、二分類結(jié)局變量的12種方法給予介紹,并采用模擬方法探討其參數(shù)值的確定,比較其統(tǒng)計性能和倫理性,為適應(yīng)性設(shè)計的臨床試驗提供隨機化方法的選擇依據(jù)。
  方法:
  首先介紹現(xiàn)有的12種響應(yīng)變量-適應(yīng)性隨機化方法,除了6種非參數(shù)方法:隨機化勝者優(yōu)先原則(RPW)、DY原則(DY)、“存亡”原則(BD)、劣者淘汰原則(DL)、廣義劣者淘汰原則(GDL)和隨機強化甕(RRU),它們還包括6種參數(shù)方法:序貫極大似然過程(SMLE

4、)、雙重偏幣設(shè)計(DBCD)和高效響應(yīng)適應(yīng)性設(shè)計(ERAD)依次采用Neyman和Optimal分配法,分別記為SMLE1和SMLE2、DBCD1和DBCD2,ERAD1和ERAD2。
  然后,采用Monte Carlo技術(shù)進(jìn)行模擬研究。本研究假設(shè)試驗組的療效優(yōu)于對照組。
  模擬過程大概思路:
  1)每當(dāng)有受試者入組等待分組,基于0-1均勻分布產(chǎn)生隨機數(shù)RV1;
  2)依據(jù)積累的試驗信息和特定隨機化方法的

5、分組概率計算公式計算分入試驗組的概率P(A),并與RV1比較決定分組情況;
  3)基于0-1均勻分布產(chǎn)生隨機數(shù)RV2,并與試驗組或?qū)φ战M的成功率比較決定結(jié)局(成功或失敗);
  4)依此類推直至總樣本量全部分配完成。模擬研究在3.1.2版本的R語言軟件環(huán)境下進(jìn)行。
  模擬研究分兩部分,第一部分探討8種含參數(shù)隨機化方法的參數(shù)如何確定。此部分模擬研究中的模擬參數(shù)設(shè)置為:總樣本量為120;試驗組和對照組的成功率組合為(P

6、A=0.7,PB=0.6)、(0.7,0.4)和(0.7,0.2)三種情況。
  第二部分通過模擬比較12種響應(yīng)變量-適應(yīng)性隨機化方法,并以非適應(yīng)性均衡設(shè)計隨機化方法為參照,考察其統(tǒng)計性能和倫理性。模擬參數(shù)設(shè)置為:總樣本量考慮120、240和480三個水平;兩組率差考慮0(無)、0.1、0.3和0.5四個水平,每種率差情況包含多組大小不同的成功率組合。每種組合模擬次數(shù)為10000次。
  統(tǒng)計性能和倫理性評價:
  1

7、)分組比例:最終分入試驗組的受試者人數(shù)占總樣本量之比,分組比例越高說明分配到優(yōu)效組的人數(shù)越多,倫理性越好。
  2)總失敗人數(shù):整個試驗失敗的受試者人數(shù),包括試驗組和對照組;同樣反映隨機化方法的倫理性,其含義更直觀,越小說明倫理性越好。
  3)檢驗效能:基于隨機化結(jié)果進(jìn)行組間成功率的差異檢驗,計算陽性檢驗結(jié)果的比例,以反映隨機化方法的統(tǒng)計性能。
  4)分組比例標(biāo)準(zhǔn)差:分組比例的波動程度,反映隨機化方法的穩(wěn)健性。

8、r>  結(jié)果:
  響應(yīng)變量-適應(yīng)性隨機化方法的參數(shù)確定
  由于SMLE和PW沒有參數(shù),且DBCD和ERAD僅以optimal分配方法為分配目標(biāo)。這一部分研究僅考慮需要設(shè)置參數(shù)的8種隨機化方法。
  DBCD過程的參數(shù)γ:隨著參數(shù)γ增大,分組比例增大,總失敗人數(shù)減少,檢驗效能保持在設(shè)定水平,分組比例標(biāo)準(zhǔn)差減小。當(dāng)參數(shù)γ≥4時,所有性能指標(biāo)達(dá)到穩(wěn)定。從公式上看,當(dāng)最優(yōu)分配比例大于實際分組比例時,將以更大的概率分到試驗組

9、;而參數(shù)γ是最優(yōu)分配比例與實際分組比例比值的次方,它決定了這一差距的對分配概率的影響程度。參數(shù)γ足夠大,DBCD將實現(xiàn)最優(yōu)分配比例,但當(dāng)參數(shù)γ為∞時,分配概率將是0或1,將破壞隨機性。根據(jù)模擬結(jié)果,為同時保證良好的統(tǒng)計性能、倫理性和隨機性,取γ=4為宜。
  ERAD過程的參數(shù)a:當(dāng)參數(shù)a<0.5時,性能指標(biāo)較為穩(wěn)定,且分組比例高、總失敗人數(shù)少、分組比例標(biāo)準(zhǔn)差小;隨著參數(shù)a增大,分組比例變小、總失敗人數(shù)增多、分組比例標(biāo)準(zhǔn)差增大,檢

10、驗效能不變。從公式上看,當(dāng)參數(shù)a越接近1,實現(xiàn)最優(yōu)分配比例的能力越弱,當(dāng)參數(shù)a>0.5時已經(jīng)不足以實現(xiàn)最優(yōu)分配比例。當(dāng)參數(shù)a=1時,ERAD等價于SMLE,說明SMLE是ERAD最糟糕的情況;而當(dāng)參數(shù)a=0時,分配概率是0或者1,隨機性已經(jīng)蕩然無存。因此ERAD過程的參數(shù)a<0.5,但不應(yīng)過小;根據(jù)模擬結(jié)果,取a=0.5為宜。
  RPW、DY、BD、DL、GDL和RRU的參數(shù)u:本文含有參數(shù)u的方法包括RRU、RPW、DY、BD

11、、DL和GDL原則;其中RPW和GDL原則含有多個參數(shù)。當(dāng)參數(shù)u<10時,分組比例較大、總失敗人數(shù)較少、檢驗效能水平較低、分組比例標(biāo)準(zhǔn)差較大。隨著參數(shù)u增大,分組比例、分組比例標(biāo)準(zhǔn)差均迅速減小、總失敗人數(shù)增多、檢驗效能升高,最后指標(biāo)都趨于穩(wěn)定。參數(shù)u對這些方法有相似的影響。甕中各類球初始數(shù)量的選擇十分重要。初始球數(shù)量太少,容易將太多的受試者分入優(yōu)效的試驗組,導(dǎo)致組間失衡程度大將導(dǎo)致統(tǒng)計方法檢驗效能降低;初始球個數(shù)過多,自適應(yīng)強度弱,總失

12、敗人數(shù)多的缺點。因此,相對于處理結(jié)局的增加球數(shù)量和抽到附加球的增加球數(shù)量,各類球的初始數(shù)量的選擇要把握合適的量。RPW、DY、BD和RRU建議采用u=5,DL和GDL原則時采用參數(shù)u=1,因為此時檢驗效能高,自適應(yīng)性強,總失敗人數(shù)少,且分組比例穩(wěn)定性好。
  RPW原則的參數(shù)a和b:當(dāng)參數(shù)a=0時,分組比例較小、總失敗人數(shù)較多、檢驗效能較高、分組比例標(biāo)準(zhǔn)差較小;隨著參數(shù)a增大,分組比例及其標(biāo)準(zhǔn)差表達(dá),總失敗人數(shù)和檢驗效能呈下降趨勢

13、。當(dāng)參數(shù)b<3時,分組比例及其標(biāo)準(zhǔn)差較大、失敗人數(shù)較少。隨著參數(shù)b增大,分組比例減小、總失敗人數(shù)增多、分組比例標(biāo)準(zhǔn)差減小。當(dāng)參數(shù)b>3時,性能指標(biāo)均趨于平穩(wěn)。參數(shù)a和b的選擇對于RPW原則也十分重要,但應(yīng)該注意的不是具體的數(shù)量,而是三個參數(shù)之間的相對大小關(guān)系。參數(shù)a和b相對于u過小,則RPW原則的效果接近等概率隨機化方法;參數(shù)a相對于參數(shù)u和b過大,容易導(dǎo)致分組比例過大和檢驗效能低下。當(dāng)參數(shù)u一定時,如果參數(shù)a相對于b過小,分組比例減小

14、,總失敗人數(shù)增多。因此參數(shù)a和b的選擇需要根據(jù)參數(shù)u具體討論。模擬結(jié)果發(fā)現(xiàn)RPW(μ=5,a=1,b=1)具有良好的統(tǒng)計性能和倫理性。
  GDL原則的參數(shù)C:隨著參數(shù)C增大,分組比例及其標(biāo)準(zhǔn)差減小,總失敗人數(shù)增多,檢驗效能無明顯變化。當(dāng)抽到附加球時,向甕中增加球A和B的數(shù)量分別是常數(shù)C與各自最優(yōu)分配比例的乘積。常數(shù)C越大,最優(yōu)分配比例對甕中球A和B的構(gòu)成比的影響越大,最終分配比例將趨近于最優(yōu)分配比例。參數(shù)u同樣影響分組概率與最終

15、分組比例:如果參數(shù)u增大,常數(shù)C的影響被削弱,最終分配比例與最優(yōu)分配比例也將有所偏差。因此,為了達(dá)到最優(yōu)分配比例的目標(biāo),參數(shù)C和u的選擇需要具體討論,考慮之間的大小關(guān)系。模擬結(jié)果發(fā)現(xiàn)GDL(μ=1,C=9)具有良好的統(tǒng)計性能和倫理性。
  隨機化方法的比較:
  除了介紹的12種響應(yīng)變量-適應(yīng)性隨機化方法,第二部分模擬研究還納入非適應(yīng)性均衡設(shè)計的隨機化方法—等概率隨機化方法。以它為參照,更客觀地考察響應(yīng)變量-適應(yīng)性隨機化方法

16、的統(tǒng)計性能和倫理性。
  分組比例:率差為0時,除了DY和BD原則的分組比例分別為0.54~0.55和0.51~0.54,其他隨機化方法的分配都是均衡的。率差為0.1時,等概率隨機化方法的分組比例依然是均衡的。參數(shù)方法的情況比較復(fù)雜。當(dāng)PA+PB>1時,以Neyman分配法為最優(yōu)分配比例的參數(shù)方法的分組比例均低于0.50;當(dāng)PA+PB<1時,分組比例大于0.50。SMLE2的分組比例范圍是0.51~0.53,而DBCD2和ERAD

17、2效果更好。非參數(shù)方法比參數(shù)方法的分組比例大,其中DY和BD原則最大(0.58~0.59),DL原則次之(0.54~0.59),其他最小(0.53~0.55)。率差為0.3時,分組比例側(cè)重程度更大。隨著處理組成功率增大,參數(shù)方法、DY、BD、GDL和RRU的分組比例是遞減的,而RPW和DL是遞增的;當(dāng)PA=0.8和PB=0.5時,DL原則的分組比例是0.69,與BD原則一樣,并超過了DY原則。率差為0.50時,分組比例的側(cè)重更加明顯。隨

18、著試驗總樣本量增大,DY、BD和RRU的最終分組比例越來越大,而其他方法的最終分組比例是穩(wěn)定的。
  總失敗人數(shù):率差為0時,所有隨機化方法有相同的總失敗人數(shù)。隨著處理成功率升高,總失敗人數(shù)減少。率差為0.1時,DY、BD和DL原則首先減少總失敗人數(shù)。率差為0.3時,大多數(shù)響應(yīng)變量-適應(yīng)性隨機化方法的總失敗人數(shù)都開始減少;而以Neyman分配法為目標(biāo)的參數(shù)方法只有在PA+PB<1時才減少總失敗人數(shù),否則反而增加總失敗人數(shù)。非參數(shù)方

19、法減少的總失敗人數(shù)大于4個,其中BD和DL原則最多,而參數(shù)方法稍顯遜色;率差為0.5時,挽救處理失敗人數(shù)最多達(dá)17位。當(dāng)樣本量越大,非參數(shù)方法減少總失敗人數(shù)的效果越明顯。
  檢驗效能:率差為0時,所有隨機化方法的檢驗效十分接近。率差為0.1時,120的樣本量相對較小,所有隨機化方法下檢驗方法的檢驗效能都處于低水平。參數(shù)方法中SMLE2和DBCD1檢驗效能略低于ER,其他方法均高于ER;非參數(shù)方法的檢驗效能均低于ER。率差為0.3

20、時,ER的檢驗效能90.30%~96.90%。參數(shù)方法中DBCD1、ERAD1和ERAD2的檢驗效能高于ER,分別平均高出0.200%、0.200%和0.067%,而其他低于ER;非參數(shù)方法的檢驗效能均低于ER,RPW、DY、BD、DL、GDL和RRU分別平均降低了-0.233%、-2.267%、-2.100%、-0.900%、-0.633%和-1.533%。可見非參數(shù)方法的檢驗效能低于參數(shù)方法,其中RPW、DL和GDL檢驗效能相對較高

21、。率差為0.5時,所有隨機化方法的檢驗效能均為100%。隨著總樣本量增大,檢驗效能得到較大的提高。響應(yīng)變量-適應(yīng)性隨機化方法的檢驗效能更接近ER,但DY和BD和RRU的平均檢驗效能均低于ER。
  分組比例標(biāo)準(zhǔn)差:率差為0時,ER的分組比例標(biāo)準(zhǔn)差為0.045~0.046,即分組比例變動10%不到。參數(shù)方法中SMLE的變動最大,為0.047~0.059; DBCD和ERAD的變動程度相近,分別0.016~0.041和0.007~0.

22、036。非參數(shù)方法的分組比例變動程度大不相同;其中DY、BD和RRU的分組比例變動大,分別是0.096~0.104、0.070~0.095和0.101~0.107。RPW、DL和GDL原則分組比例變動小,但略高于ER和參數(shù)方法,分別是0.048~0.078、0.031~0.061和0.064~0.064。隨著率差增大,參數(shù)方法的分組比例變動程度變大,但仍然保持在較低水平;非參數(shù)方法有所下降。隨著總樣本量變大,所有隨機化方法的分組比例變動

23、程度越來越小。
  分組比例vs檢驗效能:與ER相比,參數(shù)方法的檢驗效能并不遜色,而且分組比例更高;以optimal分配法為最優(yōu)分配目標(biāo)的參數(shù)方法中,DBCD2和ERAD2的分組比例和檢驗效能均優(yōu)于SMLE2。雖然參數(shù)方法的檢驗效能高于非參數(shù)方法,但分組比例顯然是它的劣勢。RPW、DL與GDL原則在絕大多數(shù)情況下分組比例都大于參數(shù)方法,而RRU、DY和BD原則的分組比例更高一些。然而,分組比例側(cè)重程度較大,DY和BD原則的檢驗效能

24、也相對較低。
  結(jié)論:
  通過模擬研究探討了8種含參數(shù)響應(yīng)變量-適應(yīng)性隨機化方法的參數(shù)值確定,并比較了12種隨機化方法的統(tǒng)計性能和倫理性。秉著保證統(tǒng)計性能為前提,盡可能提高倫理性的原則,提出參數(shù)選擇的建議:DBCD取參數(shù)γ=4,ERAD取參數(shù)a=0.5,RPW取參數(shù)u=5,α=1,b=1,DY、BD和RRU取參數(shù)u=5,DL原則取參數(shù)u=1,GDL原則取參數(shù)u=1,C=9。選擇RPW和GDL原則的參數(shù)時,應(yīng)考慮參數(shù)之間的

25、大小關(guān)系。
  率差較大于0.3時,非參數(shù)方法檢驗效能滿足要求且分組比例顯著優(yōu)于參數(shù)方法;率差小于0.3時,參數(shù)方法DBCD2和ERAD2檢驗效能更有優(yōu)勢且分組比例較為理想。成功率大于0.6時,DL原則檢驗效能和分組比例都有優(yōu)勢。響應(yīng)變量-適應(yīng)性隨機化方法的統(tǒng)計性能和倫理性:沒有方法同時在檢驗效能和分組比例都突出。等概率隨機化方法檢驗效能與參數(shù)方法、DL和GDL相近,略高于RPW、DY、BD和RRU;但在分組比例方面,響應(yīng)變量-適

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論