版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、隨著生物統(tǒng)計學(xué)方法學(xué)的發(fā)展進(jìn)步以及臨床研究對于統(tǒng)計方法的依賴性日益增強,越來越多的統(tǒng)計模型被廣泛地應(yīng)用于臨床研究的各個方面,如篩選影響因素、診斷試驗、預(yù)后評價以及個體化治療等。列線圖預(yù)測模型能夠通過整合多個預(yù)后變量信息從而計算個體生存率,并以人機友好的形式將結(jié)合了生物學(xué)信息以及臨床學(xué)信息的復(fù)雜模型表現(xiàn)出來,是個體化醫(yī)療中不可或缺的方法學(xué)工具,已經(jīng)開始廣泛應(yīng)用于臨床各個領(lǐng)域。在構(gòu)建列線圖預(yù)測模型時最廣泛應(yīng)用變量選擇方法為逐步回歸法,但是越
2、來越多的統(tǒng)計學(xué)家認(rèn)為應(yīng)用傳統(tǒng)的逐步回歸法所構(gòu)建的預(yù)測模型存在著一定的缺陷,如計算的R2偏大,P值偏小,未校正模型的不確定性,容易發(fā)生過度擬合的情況等等,并且這種方法太過于注重變量與事件的聯(lián)系,而并沒有考慮到模型的構(gòu)建過程。隨著貝葉斯學(xué)派的興起,貝葉斯模型平均法也開始越來越受到統(tǒng)計學(xué)家們的重視。貝葉斯模型平均法將模型的不確定性考慮在內(nèi),通過貝葉斯算法計算變量以及模型的后驗概率將模型科學(xué)地加權(quán)平均,從而推導(dǎo)變量與事件之間的效應(yīng)以及選擇正確合
3、適的模型形式。但是貝葉斯模型平均法在國內(nèi)外預(yù)測模型的建立中還處于初步探索階段,尤其是在生存數(shù)據(jù)中和傳統(tǒng)的逐步回歸法以及新興的懲罰類方法Lasso相比較的優(yōu)劣以及適用條件尚不明確,有待進(jìn)一步研究。
研究目的:
本研究通過模擬研究探索貝葉斯模型平均法的基本性質(zhì)和適用條件,同時比較在不同樣本量、不同殘差項以及不同的數(shù)據(jù)情境中貝葉斯模型平均法構(gòu)建模型的準(zhǔn)確性和穩(wěn)定性,并和傳統(tǒng)的逐步回歸法以及Lasso法相比較,探索不同情境下
4、模型的最佳構(gòu)建方法。最后,將以上幾種方法同時應(yīng)用于實例數(shù)據(jù)中,以驗證模擬研究結(jié)果,提高建立列線圖預(yù)測模型的穩(wěn)定性。
研究方法:
本研究采用Bender算法模擬縱向生存數(shù)據(jù)集,并考慮樣本量,殘差項以及模型的復(fù)雜性建立不同的數(shù)據(jù)情境,對于貝葉斯模型平均法通過設(shè)置均衡先驗信息來獲取自變量的后驗信息,將閾值設(shè)置為50%和95%分別構(gòu)建模型,對于Lasso法則根據(jù)交叉驗證法來選取最佳調(diào)整參數(shù),從而調(diào)整收縮系數(shù)選擇變量并構(gòu)建模型
5、,逐步回歸法則以P值小于0.05作為進(jìn)入標(biāo)準(zhǔn)0.15作為排除標(biāo)準(zhǔn),在各種數(shù)據(jù)條件下全面比較三種變量選擇方法建立模型的優(yōu)劣,并將貝葉斯模型平均法應(yīng)用到晚期肝癌實例數(shù)據(jù)中,探索穩(wěn)定的模型構(gòu)建形式。
研究結(jié)果:
當(dāng)樣本量較小時,以50%作為后驗概率閾值的貝葉斯模型平均法在選擇真實變量,剔除混雜變量以及構(gòu)建模型上和逐步回歸法并沒有明顯的區(qū)別,而相應(yīng)的,當(dāng)以95%作為后驗概率閾值時,貝葉斯模型平均法由于選擇變量標(biāo)準(zhǔn)過于嚴(yán)格其表
6、現(xiàn)要略差于逐步回歸法和Lasso法,但是當(dāng)樣本量較小時三種方法所構(gòu)建的模型都有比較嚴(yán)重的過度擬合,模型的實際應(yīng)用價值都有待商榷。
當(dāng)樣本量較大時,貝葉斯模型平均法在選擇變量、估計參數(shù)及構(gòu)建模型中都要明顯優(yōu)于其余兩種方法。首先,貝葉斯模型平均法在校正了模型的不確定性后,以95%作為后驗概率閾值時所選擇變量幾乎不可能為無關(guān)變量,即使將閾值下調(diào)到50%,貝葉斯模型平均法剔除無關(guān)變量的頻率也在70%以上,而逐步回歸法和Lasso法則分
7、別為60%和70%左右。其次,雖然貝葉斯模型平均法、Lasso法和逐步回歸法在選擇真實變量的能力上并沒有明顯的區(qū)別,但是由于貝葉斯模型平均法識別無關(guān)變量的能力較強,其選擇到真實模型的頻率也遠(yuǎn)遠(yuǎn)超過了其余兩種方法。而在參數(shù)估計方面,貝葉斯模型平均法對真實變量回歸系數(shù)估計的偏倚較小,覆蓋率也明顯優(yōu)于逐步回歸法和Lasso法,在參數(shù)估計的準(zhǔn)確性上有明顯的優(yōu)勢。最后,貝葉斯模型平均法所建立的模型更為穩(wěn)定,較好的避免了模型過度擬合的問題,而逐步回
8、歸法和Lasso法則均有不同程度的過度擬合。
但是,貝葉斯模型平均法也存在著一定的缺陷,由于其選擇變量標(biāo)準(zhǔn)較為嚴(yán)格,因此,當(dāng)樣本量較小或者殘差項較大時,貝葉斯模型平均法難以發(fā)現(xiàn)真實變量和事件之間的關(guān)聯(lián),并且估計參數(shù)的準(zhǔn)確性以及模型的穩(wěn)定性都有一定程度的下降,另外貝葉斯模型平均法難以處理具有真實變量間具有組內(nèi)相關(guān)效應(yīng)的數(shù)據(jù),而Lasso法在這一方面則有明顯改善。
實例數(shù)據(jù)分析中,貝葉斯模型平均法所建立的模型相對于其他兩
9、種方法更為穩(wěn)健,并且所選擇的晚期肝癌患者的危險因素也更具有可信度和臨床意義,而Lasso法和逐步回歸法都不同程度的納入了無關(guān)變量,并且建立的模型都有不同程度的過度擬合。
研究結(jié)論:
當(dāng)樣本量比較充分?jǐn)?shù)據(jù)質(zhì)量較好,且對危險因素有一定的前期探索,未知的危險因素較少的情況下,貝葉斯模型平均法所構(gòu)建的預(yù)測模型比較穩(wěn)健,參數(shù)估計也更為準(zhǔn)確,基于貝葉斯模型平均法構(gòu)建列線圖預(yù)測模型對于個體化治療以及臨床實踐中治療方法的決策具有很高
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 42763.貝葉斯模型平均法在水文模型綜合中的應(yīng)用研究
- 貝葉斯平均模型及其在醫(yī)學(xué)研究中的應(yīng)用探索.pdf
- 基于貝葉斯網(wǎng)絡(luò)模型的基因調(diào)控網(wǎng)絡(luò)的構(gòu)建.pdf
- 基于非參數(shù)貝葉斯方法的情感主題模型構(gòu)建.pdf
- 基于周期的貝葉斯網(wǎng)絡(luò)預(yù)測模型.pdf
- 基于貝葉斯網(wǎng)絡(luò)的預(yù)測模型研究.pdf
- 基于貝葉斯博弈的攻擊預(yù)測模型.pdf
- 多組比較資料貝葉斯傾向性評分模型的構(gòu)建及應(yīng)用.pdf
- 基于貝葉斯網(wǎng)絡(luò)的互動故事模型.pdf
- 基于動態(tài)貝葉斯模型的基因調(diào)控網(wǎng)絡(luò)構(gòu)建方法研究.pdf
- 混合模型的貝葉斯分析.pdf
- 基于貝葉斯網(wǎng)絡(luò)的動態(tài)預(yù)測模型研究及其應(yīng)用.pdf
- 多水平貝葉斯模型及應(yīng)用研究.pdf
- 基于貝葉斯因子的SV模型選擇.pdf
- 基于貝葉斯網(wǎng)絡(luò)的用戶模型研究.pdf
- 基于隨機森林特征選擇的貝葉斯分類模型及應(yīng)用.pdf
- 基于樸素貝葉斯算法的CLV優(yōu)化模型及應(yīng)用研究.pdf
- 正則化路徑上的支持向量機貝葉斯模型平均.pdf
- 基于貝葉斯網(wǎng)絡(luò)的智能檢索模型.pdf
- 樸素貝葉斯分類模型的研究與應(yīng)用.pdf
評論
0/150
提交評論