基于流行病學、臨床癥狀、腫瘤標志和影像學特征的肺癌診斷模型的建立.pdf_第1頁
已閱讀1頁,還剩135頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、肺癌是一種涉及了基因和表觀遺傳改變的復雜疾病,是世界范圍內(nèi)癌癥死亡的主要原因。近年來,中國地區(qū)的肺癌發(fā)病率較前明顯增加,成為一個重大的公共衛(wèi)生挑戰(zhàn)。盡管隨著醫(yī)療水平的提高和臨床藥物應用的發(fā)展,肺癌的治療效果得到有效的改善,但是晚期肺癌患者的生存率和總體預后仍然在相對較低的水平。因此,提高早期診斷效率是改善肺癌患者預后的關鍵。
  流行病學表明肺癌和吸煙有強大的統(tǒng)計學關聯(lián)。據(jù)估計,全世界有12.5億煙民,每年超過一百萬人死于煙草導致

2、的肺癌。吸煙與肺癌的發(fā)生發(fā)展密切相關,85%的肺癌與吸煙有關,并且2年生存率<10%。美國肺癌篩查中心推薦對吸煙史>30年包,且禁煙<15年的患者進行肺癌篩查。
  腫瘤標志是反映存在于腫瘤中的生物化學物質。它們不存在于正常成人組織中,或只存在于胚胎組織。它們在腫瘤組織中的含量顯著超過正常組織。它們量或質的改變也許預示了腫瘤的本質,以便了解腫瘤組織、細胞分化和細胞功能,并幫助進行腫瘤的診斷、分類、判斷預后和治療。然而,單一腫瘤標志

3、檢測的敏感性和特異性通常低于由不同特性、敏感性和互補性的多個腫瘤標志組成的腫瘤標志群。因此,目前多采用多種腫瘤標志聯(lián)合診斷來提高早期肺癌的檢測。
  影像學是臨床肺癌診斷的一種重要的方法。但是低靈敏度的X線片也是肺癌診斷延誤的主要原因。近來,在美國肺癌篩查試驗研究表明,在肺癌高危人群中進行低劑量CT掃描相比X線降低了20%肺癌死亡率。因此,這項檢查被美國預防服務中心、美國癌癥協(xié)會和其他咨詢機構推薦?,F(xiàn)在,低劑量CT被用于高度懷疑肺

4、癌患者的檢測,而且擁有高度敏感性來幫助發(fā)現(xiàn)和確定早期肺癌。然而,CT對肺癌診斷的特異度太差。腫瘤標志比動態(tài)CT成像表現(xiàn)出較低的敏感度,而特異性高于CT掃描。因此,CT成像掃描結合腫瘤標志能夠有助于區(qū)分肺癌與良性肺疾病。
  數(shù)據(jù)挖掘技術作為建模工具已經(jīng)證明了其從多個來源吸收信息并精確分析及建立復雜模型的能力?,F(xiàn)在,許多研究將腫瘤特征同數(shù)據(jù)挖掘技術結合來診斷腫瘤。盡管肺癌診斷有很多因素并且它們之間有復雜的關系,數(shù)據(jù)挖掘技術能夠學習不

5、能通過數(shù)學方法描述的模糊評價,并且能夠解決一些復雜的、不確定和非線性問題,特別是當面對大樣品、多媒體、多變量時,數(shù)據(jù)挖掘技術在解決非線性和未知數(shù)據(jù)分布問題上顯示了更優(yōu)秀的能力。
  目的:
  本研究在課題組前期成果的基礎上,將血清腫瘤標志與流行病、臨床癥狀、影像學特征聯(lián)合,利用數(shù)據(jù)挖掘技術來建立肺癌-肺良性疾病輔助診斷模型,以期進一步提高肺癌診斷的準確率,并為肺癌診斷提供參考和輔助方法,改善肺癌患者的生存率和預后。

6、  方法:
  1.收集2014年10月至2016年3月鄭州大學第一附屬醫(yī)院呼吸內(nèi)科423例住院患者的血清學標本并測定血清腫瘤標志水平。從住院醫(yī)師或主治醫(yī)師修改并完成的住院病歷中提取住院患者的流行病學和臨床信息。包括性別、年齡、吸煙史、飲酒史、家族史(腫瘤方面);是否咳嗽、咳痰、痰中帶血、乏力、發(fā)熱出汗、聲音嘶啞。
  2.使用Fisher判別分析和Logistic回歸分析方法對血清腫瘤標志、流行病學和臨床癥狀指標進行篩選優(yōu)

7、化。
  3.將篩選優(yōu)化后指標通過數(shù)據(jù)挖掘技術(ANN、SVM、決策樹C5.0)和Fisher判別分析建立肺癌診斷模型。
  4.同時收集423例患者的CT影像學資料,并根據(jù)病例的納入和排除標準選取其中214例患者的CT影像作為研究對象。
  5.請3位高年資呼吸科主治醫(yī)師分別對214例患者的CT影像進行判斷,提取19項特征并評分。各個影像學特征的最后評分取3位醫(yī)師的平均分。
  6.將提取的19項影像學指標通過

8、Fisher判別分析和Logistic逐步回歸分析的方法來篩選優(yōu)化,并通過數(shù)據(jù)挖掘技術(ANN、SVM、決策樹C5.0)和Fisher判別分析建立肺癌診斷模型。
  7.采用Fisher判別分析和Logistic逐步回歸分析的方法對血清腫瘤標志、流行病及臨床癥狀、CT影像學特征一系列指標進行篩選優(yōu)化并通過數(shù)據(jù)挖掘技術(ANN、SVM、決策樹C5.0)和Fisher判別分析建立肺癌診斷模型。
  結果:
  1.腫瘤標志

9、聯(lián)合流行病學及臨床指標建立的各模型對預測集預測結果的靈敏度、特異度、準確度、陽性預測值和陰性預測值和AUC要明顯高于單獨腫瘤標志建立的各模型。
  2.腫瘤標志、流行病學、臨床癥狀指標建立的模型中,ANN模型的的靈敏度、特異度、準確度、陽性預測值和陰性預測值和AUC均高于其他3種模型,ROC曲線下面積對比差異有統(tǒng)計學意義(P<0.05)。
  3.腫瘤標志和流行病學及臨床癥狀聯(lián)合后各組指標建立的ANN模型之間AUC差異無統(tǒng)計

10、學意義,但10種腫瘤標志和流行病學及臨床癥狀全部Logistic逐步回歸分析優(yōu)化后的13項指標,即年齡、性別、吸煙史、咳痰、痰中帶血、發(fā)熱出汗和DNMT3B、DNMT1、HDAC1、胃泌素、NSE、CEA和鈣離子,建立的ANN模型訓練集準確度為100%,預測集準確度為94.33%,特異度95.5%,陽性預測值93.8%,均高于其他模型。
  4.Logistic逐步回歸分析篩選出的空洞征、棘突征和氣管狹窄3個變量建立的SVM模型對

11、預測集預測結果的靈敏度為92.3%、特異度81.8%、準確度86.9%、陽性預測值90.6%、陰性預測值91.8%、AUC0.857。
  5.將血清腫瘤標志、流行病學、臨床癥狀、影像學聯(lián)合,利用Logistic逐步回歸分析篩選出16項指標建立的SVM模型對肺癌預測結果的特異度、準確度、陽性預測值、AUC分別為95.5%、97.2%、95.4%、0.969,靈敏度和陰性預測值為99.0%和95.4%。
  6.血清腫瘤標志、

12、流行病學、臨床癥狀、影像學指標聯(lián)合建立的SVM和決策樹C5.0模型對肺癌診斷效能優(yōu)于單獨影像學建立的SVM模型和決策樹C5.0模型,AUC相比差異有統(tǒng)計學意義(P<0.05)。
  結論:
  1.用Fisher判別分析和Logistic逐步回歸分析分別對流行病學、臨床癥狀和血清腫瘤標志指標進行篩選優(yōu)化,優(yōu)化后的指標聯(lián)合建立肺癌ANN診斷模型,其靈敏度、特異度、準確度、陽性預測值、陰性預測值和AUC明顯高于單純血清腫瘤標志聯(lián)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論