基于人血漿microRNAs的數(shù)據(jù)挖掘技術構建肺癌預測系統(tǒng).pdf_第1頁
已閱讀1頁,還剩88頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、肺癌位居中國惡性腫瘤發(fā)病率和死亡率首位,肺癌預防的重要手段是開展早期發(fā)現(xiàn)、早期診斷和早期治療,有必要研究高敏感性和特異性的腫瘤生物標志物。microRNAs(miRNAs)可調控基因參與細胞的生長、增殖、分化和凋亡等過程,大量的研究表明循環(huán)miRNAs和多種腫瘤的發(fā)生和發(fā)展有關,具有作為包括肺癌在內的疾病診斷生物標志物的潛力。
  目的:
  該研究應用決策樹(Decision Tree,DT)、人工神經(jīng)網(wǎng)絡(Artific

2、ial Neual Networks,ANN)和支持向量機(SupportVector Machines,SVM)等數(shù)據(jù)挖掘方法聯(lián)合血漿miRNA生物標志、流行病學參數(shù)和臨床癥狀資料建立肺癌預測模型。
  對象和方法:
  1.研究對象:肺癌組為2016年6月至2017年2月取自鄭州大學第一附屬醫(yī)院呼吸內科、河南省腫瘤醫(yī)院胸外科、河南省胸科醫(yī)院呼吸內科和胸外科的148例初診的原發(fā)性肺癌患者;對照組為2016年7月取自淇縣疾病

3、預防控制中心體檢的148例健康人群。經(jīng)知情同意后收集研究對象的信息和血液標本。
  2.實驗方法:血漿miRNAs(miR-16、miR-21、miR-20a、miR-210、miR-145、miR-126、miR-223、miR-197、miR-30a、miR-30d、miR-25)表達水平的檢測采用實時熒光定量PCR法。
  3.數(shù)據(jù)挖掘:采用SPSS Clementine21.0軟件?;趩我蛩胤治鼋Y果和Logisti

4、c回歸分析優(yōu)化結果,先將數(shù)據(jù)預處理,按3:1的比例將所有樣本隨機分成訓練集和預測集,用訓練好的模型對預測集進行預測,應用Fisher判別分析、DT C5.0、ANN和SVM算法分別建立模型,并采用診斷試驗評價指標比較模型的預測結果。
  4.統(tǒng)計學分析:Excel2010建立數(shù)據(jù)庫,采用SPSS21.0軟件進行統(tǒng)計分析。定量資料分析符合正態(tài)分布時采用兩獨立樣本 t檢驗,不符合正態(tài)分布時采用Mann-Whitney U檢驗;定性資料

5、間的比較采用χ2檢驗;肺癌的影響因素采用二分類Logistic回歸分析。檢驗水準為α=0.05。
  結果:
  1.血漿miRNAs表達水平檢測結果:肺癌組的10種血漿miRNAs(miR-21、miR-20a、miR-210、miR-145、miR-126、miR-223、miR-197、miR-30a、miR-30d、miR-25)的表達水平高于對照組,差異有統(tǒng)計學意義(P<0.05)。
  11種血漿miRNA

6、s(miR-16、miR-21、miR-20a、miR-210、miR-145、miR-126、miR-223、miR-197、miR-30a、miR-30d、miR-25)的表達水平與年齡、肺癌的組織學類型無關(P>0.05);血漿中miR-30a和 miR-21表達水平與性別有關(P<0.05);血漿中miR-21和miR-25表達水平與吸煙程度、飲酒有關(P<0.05)。血漿中miR-210的表達水平和肺癌的分期有關(P<0.05

7、);血漿中miR-126的表達水平和肺癌淋巴結轉移有關(P<0.05)。
  2.肺癌影響因素分析結果:單因素分析結果顯示肺癌組和對照組間的流行病學參數(shù)和臨床癥狀(吸煙程度、發(fā)熱、胸悶胸痛、咳嗽、痰中帶血、咯血)的分布的差異和10種血漿miRNAs(miR-21、miR-20a、miR-210、miR-145、miR-126、miR-223、miR-197、miR-30a、miR-30d、miR-25)的表達水平的差異有統(tǒng)計學意義

8、(P<0.05);多因素Logistic回歸分析結果顯示,發(fā)熱、胸悶胸痛、咳嗽、血漿中miR-20a(P=0.016)和miR-223(P=0.001)相對表達量升高可能是肺癌的危險因素。
  3.數(shù)據(jù)挖掘模型的評價結果:由吸煙程度、發(fā)熱、胸悶胸痛、咳嗽、痰中帶血、咯血、10種血漿miRNAs(miR-21、miR-20a、miR-210、miR-145、miR-126、miR-223、miR-197、miR-30a、miR-30

9、d、miR-25)的表達水平這16個變量建立的16項DT C5.0模型和由發(fā)熱、胸悶胸痛、咳嗽、痰中帶血、咯血、血漿中miR-20a和miR-223表達水平建立的優(yōu)化DT C5.0模型的準確度分別為98.78%和87.80%,AUC分別為0.985和0.883;16項SVM模型和優(yōu)化SVM模型的準確度分別為98.78%和89.02%,AUC分別為0.985和0.893;16項ANN模型和優(yōu)化ANN模型的準確度分別為87.80%和84.1

10、5%,AUC分別為0.879和0.835;16項Fisher判別分析模型和優(yōu)化Fisher判別分析模型的準確度分別為82.93%和82.93%,AUC分別為0.828和0.824。16項DT C5.0模型和16項SVM模型的AUC均優(yōu)于其他6種模型(P<0.05);其他6種模型的AUC之間的差異沒有統(tǒng)計學意義(P>0.05)。
  結論:
  1.人血漿中10種miRNAs(miR-21、miR-20a、miR-210、mi

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論