腦卒中類型與復(fù)發(fā)的Logistic回歸預(yù)測及SMOTE算法處理非平衡臨床數(shù)據(jù).pdf_第1頁
已閱讀1頁,還剩35頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、目的:腦卒中是一種突然起病的腦血液循環(huán)障礙性疾病,居全世界主要死因的第二位,分為缺血性腦卒中和出血性腦卒中,兩者的治療方法大不相同,目前臨床判斷卒中類型最準(zhǔn)確的方式是CT或MRI檢查,但在未能進(jìn)行影像檢查的情況下,只能依據(jù)臨床表現(xiàn)初步判斷類型,較容易誤診。本研究擬通過已有的臨床數(shù)據(jù),構(gòu)建腦卒中分型回歸模型、腦卒中復(fù)發(fā)回歸模型,用于臨床輔助診斷及出院后的健康管理,并評價(jià)預(yù)測效果,希望能夠?yàn)榕R床提供一種輔助診斷手段,提高診斷正確率。使用分類

2、模型分類時(shí)需要有分布較平衡的數(shù)據(jù)才能獲得良好效果,在多數(shù)類似的研究中,數(shù)據(jù)不平衡現(xiàn)象普遍存在,本研究引入了非平衡數(shù)據(jù)處理方法SMOTE(Synthetic Minority Over-sampling Technique)算法、隨機(jī)復(fù)制法及欠抽樣法,并對處理結(jié)果進(jìn)行了比較。
  方法:獲取石家莊市某醫(yī)院因腦卒中入院治療244例患者的病例及出院后健康監(jiān)測數(shù)據(jù)并整理,通過IBM SPSS進(jìn)行Logistic回歸分析,方法采用向前法,變

3、量入選水準(zhǔn)α入=0.05,α出=0.10,獲得構(gòu)建回歸模型所需參數(shù),獲得Logistic回歸方程。若數(shù)據(jù)中出現(xiàn)類別分布不平衡的現(xiàn)象,導(dǎo)致分類預(yù)測準(zhǔn)確率或靈敏度較低,則使用數(shù)據(jù)平衡方法平衡數(shù)據(jù),隨機(jī)復(fù)制過抽樣法及隨機(jī)欠抽樣法均使用SPSS中的隨機(jī)抽樣功能選擇,SMOTE算法則使用使用R語言DmWR程序包中的SMOTE函數(shù)調(diào)用SMOTE算法平衡數(shù)據(jù),
  結(jié)果:
  1獲得了腦卒中分型的回歸模型,其預(yù)測準(zhǔn)確率較高。腦卒中分型回歸

4、模型Cox& Snell R Square檢驗(yàn)擬合優(yōu)度為0.634,預(yù)測準(zhǔn)確率為86.1%。
  2得到了腦卒中復(fù)發(fā)預(yù)測的回歸模型,其預(yù)測靈敏度較低。缺血性腦卒中復(fù)發(fā)回歸模型Cox& Snell R Square檢驗(yàn)擬合優(yōu)度為0.236,其靈敏度為28.6%。出血性腦卒中復(fù)發(fā)回歸模型Cox& Snell R Square檢驗(yàn)擬合優(yōu)度為0.272,其靈敏度為60%。
  3得到了使用SMOTE算法、隨機(jī)復(fù)制過抽樣法及隨機(jī)欠抽樣

5、法平衡數(shù)據(jù)后缺血性腦卒中復(fù)發(fā)回歸模型的預(yù)測數(shù)據(jù)及ROC曲線。其中隨機(jī)復(fù)制過抽樣法處理獲得的回歸模型Cox& Snell R Square檢驗(yàn)擬合優(yōu)度為0.473,靈敏度為85.7%;隨機(jī)欠抽樣法處理獲得的回歸模型Cox& Snell RSquare檢驗(yàn)擬合優(yōu)度為0.576,靈敏度為85.7%;SMOTE算法處理獲得的回歸模型Cox& Snell R Square檢驗(yàn)擬合優(yōu)度為0.488,靈敏度為89.3%。經(jīng)卡方檢驗(yàn)三種方法的靈敏度無顯

6、著差異。ROC曲線下面積中SMOTE算法大于隨機(jī)過抽樣法和隨機(jī)欠抽樣法。
  結(jié)論:
  1缺血性與出血性腦卒中類型可以使用Logistic回歸進(jìn)行輔助診斷,以提高診斷準(zhǔn)確率。根據(jù)回歸式可知血壓的升高對發(fā)生出血性腦卒中有較大影響,而TIA史與出血性腦卒中呈負(fù)相關(guān)性,在腦卒中患者中,經(jīng)常運(yùn)動(dòng)的人患腦出血的可能性更高,有腦卒中家族史的患者患腦出血的概率較高。
  2腦卒中患者的復(fù)發(fā)可以根據(jù)出院后對其健康檢測的數(shù)據(jù)代入Log

7、istic回歸方程評估,若P<0.5則歸類為不復(fù)發(fā),若P≥0.5則歸類為復(fù)發(fā)。獲得結(jié)果后可對被判斷為復(fù)發(fā)組的人群進(jìn)行強(qiáng)化健康管理。
  3在研究非配對樣本類別問題時(shí),必須要重視不同類別樣本的平衡性,若不同類別樣本量不平衡,極易使得研究結(jié)果更傾向于樣本量大的類別,產(chǎn)生偏倚。綜合隨機(jī)復(fù)制過抽樣法、隨機(jī)欠抽樣法及SMOTE算法原理、預(yù)測靈敏度及ROC曲線,SMOTE算法即避免隨機(jī)復(fù)制過抽樣法產(chǎn)生的過度擬合,亦防止隨機(jī)欠抽樣法導(dǎo)致的信息缺

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論