版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、肺癌是當(dāng)今世界各國(guó)最常見(jiàn)的惡性腫瘤,其發(fā)病率和死亡率呈不斷上升趨勢(shì),對(duì)人類的健康和生命構(gòu)成了極大威脅。在中國(guó),肺癌每年大約導(dǎo)致40萬(wàn)例患者死亡,已成為發(fā)病率和死亡率最高的惡性腫瘤。研究顯示Ⅰ期肺癌術(shù)后10年生存率可達(dá)到92%。然而肺癌早期不易診斷,惡性程度高,一經(jīng)病理確診多數(shù)已屬晚期,失去手術(shù)治療的最佳時(shí)機(jī),總的5年生存率僅為15%左右。因此,要降低肺癌患者的死亡率關(guān)鍵在于肺癌的早期發(fā)現(xiàn)、早期診斷和早期治療。肺癌的發(fā)生是多因素、多基因和
2、多階段發(fā)展的復(fù)雜過(guò)程,由于傳統(tǒng)的影像學(xué)檢查和支氣管鏡等檢查手段存在敏感性、特異性和適用度等方面的局限,近年來(lái)國(guó)內(nèi)外學(xué)者對(duì)肺癌早期預(yù)警或診斷相關(guān)的分子標(biāo)志和多種腫瘤生物標(biāo)志的聯(lián)合檢測(cè)做了大量有益的探索,以期找到更合理、敏感性和特異性更高的分子聯(lián)合標(biāo)志。
肺癌的發(fā)生是環(huán)境因素和遺傳因素共同作用的結(jié)果,因此在尋找肺癌早期預(yù)警或診斷的生物標(biāo)志時(shí),也可以從兩方面著手,即反映機(jī)體先天具有或后天獲得的對(duì)外源性物質(zhì)產(chǎn)生反應(yīng)能力的易感性標(biāo)志
3、;反映早期生物效應(yīng)、結(jié)構(gòu)和/或功能改變以及疾病的效應(yīng)標(biāo)志。遺傳因素屬于前者,其作用體現(xiàn)在同一環(huán)境暴露中個(gè)體腫瘤易感性的差異,歸根到底由基因多態(tài)所代表的遺傳背景決定。另一方面,在很多情況下,許多分子事件的發(fā)生早于明顯惡性表型的出現(xiàn),因此,運(yùn)用分子生物學(xué)的方法檢測(cè)肺癌發(fā)生過(guò)程中的早期分子事件,從而發(fā)現(xiàn)癌前病變或早期癌變也被認(rèn)為是肺癌早期預(yù)警最具應(yīng)用前景的手段。腫瘤發(fā)生的早期生物效應(yīng)包括了DNA甲基化和端粒損傷在內(nèi)的遺傳學(xué)和表觀遺傳學(xué)改變。<
4、br> 數(shù)據(jù)挖掘(Data Mining),又稱數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn)(Knowledge Discovery fromDatabase,KDD),它是從大量數(shù)據(jù)中提取并挖掘未知的、有價(jià)值的模式或規(guī)律等知識(shí)的復(fù)雜過(guò)程。它通常與計(jì)算機(jī)科學(xué)有關(guān),并通過(guò)統(tǒng)計(jì)、在線分析處理、情報(bào)檢索、機(jī)器學(xué)習(xí)、專家系統(tǒng)(依靠過(guò)去的經(jīng)驗(yàn)法則)和模式識(shí)別等諸多方法來(lái)實(shí)現(xiàn)上述目標(biāo)。數(shù)據(jù)挖掘與傳統(tǒng)數(shù)據(jù)分析有著本質(zhì)的區(qū)別。數(shù)據(jù)挖掘是在沒(méi)有明確的假設(shè)的前提下挖掘信息和發(fā)現(xiàn)知
5、識(shí)。同時(shí),通過(guò)數(shù)據(jù)挖掘得到的信息具有先前未知、有效及可實(shí)用3個(gè)特征。數(shù)據(jù)挖掘中的決策樹(shù)和人工神經(jīng)網(wǎng)絡(luò)技術(shù)(Artificial Neural Networks,ANN)能夠?qū)?shù)據(jù)信息進(jìn)行大規(guī)模并行處理和分布式存儲(chǔ),且具有良好的自適應(yīng)性、自組織性及較強(qiáng)的學(xué)習(xí)功能、聯(lián)想功能和容錯(cuò)功能。在腫瘤的診斷方面,不僅能夠起到檢測(cè)可疑病變和分類的作用,還能挖掘用于檢測(cè)和分類的潛在特征標(biāo)志,為腫瘤的診斷做出建設(shè)性貢獻(xiàn)。
本研究檢測(cè)對(duì)象外周血
6、中CYP1A1,GSTM1,GSTT1,mEH,XRCC1基因多態(tài)性、p16和RASSF1A基因甲基化水平及端粒相對(duì)長(zhǎng)度,探討5種基因多態(tài)性與p16、RASSF1A基因甲基化和端粒相對(duì)長(zhǎng)度的相關(guān)關(guān)系,在此基礎(chǔ)上應(yīng)用數(shù)據(jù)挖掘技術(shù),檢測(cè)這些分子指標(biāo)對(duì)肺癌早期預(yù)警的相關(guān)性,抽取可用于肺癌預(yù)警的有效特征,構(gòu)建較為適合的預(yù)測(cè)模型,探討是否有助于提高肺癌早期預(yù)警或診斷的正確率及聯(lián)合檢測(cè)對(duì)肺癌輔助診斷的意義,以實(shí)現(xiàn)肺癌早期預(yù)警、診斷和分類的自動(dòng)化,為
7、高危人群的篩查和臨床肺癌診斷提供有價(jià)值的參考資料。
目的:
1.探討肺癌患者外周血I相代謝酶基因CYP1A1,Ⅱ相代謝酶基因GSTM1、GSTT1、mEH,及DNA修復(fù)酶基因XRCC1的多態(tài)基因型與肺癌易感之間的關(guān)系,探討抑癌基因p16、RASSF1A甲基化及端粒相對(duì)長(zhǎng)度與肺癌發(fā)生的關(guān)系,篩選出與肺癌發(fā)生相關(guān)的有效分子生物標(biāo)志,找出對(duì)肺癌早期預(yù)警意義最大的幾項(xiàng),為肺癌的早期預(yù)警提供基礎(chǔ)資料。
2
8、.將數(shù)據(jù)挖掘技術(shù)和上述分子標(biāo)志相結(jié)合,構(gòu)建可“自動(dòng)”處理信息的智能預(yù)警模型,為肺癌智能預(yù)警系統(tǒng)的研制開(kāi)辟一條新途徑,提高肺癌早期預(yù)警的準(zhǔn)確率。
材料與方法:
1.以251例肺癌患者和256例健康體檢者為研究對(duì)象。
2.采用等位基因特異性擴(kuò)增法(allele-specific amplification,ASA)檢測(cè)CYP1A1-exon7位點(diǎn)多態(tài)性,采用多重PCR法檢測(cè)GSTM1、GSTT1基因
9、多態(tài)性,采用聚合酶鏈反應(yīng)-限制性片段長(zhǎng)度多態(tài)性(polymerase chain reaction-restrictionfragment length polymorphism,PCR-RFLP)方法分別檢測(cè)CYP1A1-Msp1位點(diǎn)、mEH-exon3、mEH-exon4、XRCC1-194、XRCC1-280及XRCC1-399位點(diǎn)基因多態(tài)性。采用實(shí)時(shí)熒光定量甲基化特異PCR(real-time methylation speci
10、fic PCR,qMSP)技術(shù)檢測(cè)p16和RASSF1A基因甲基化水平,采用熒光定量PCR法檢測(cè)端粒相對(duì)長(zhǎng)度。
3.應(yīng)用SPSS12.0統(tǒng)計(jì)分析軟件,采用x2檢驗(yàn)、t檢驗(yàn)、秩和檢驗(yàn)、Logistic回歸分析等方法對(duì)基因多態(tài)、甲基化水平和端粒相對(duì)長(zhǎng)度的結(jié)果進(jìn)行一般統(tǒng)計(jì)學(xué)分析處理,探討基因多態(tài)性、DNA甲基化及端粒相對(duì)長(zhǎng)度變化與肺癌發(fā)生的關(guān)系,篩選可能用于肺癌早期判別模型的有效指標(biāo)。
4.將每組樣本按3:1的比例
11、隨機(jī)分為訓(xùn)練集和測(cè)試集,將CYP1A1-exon7、GSTM1、mEH-exon3、XRCC1-194和XRCC1-280位點(diǎn)基因多態(tài)性、p16基因和RASSF1A基因甲基化水平、端粒長(zhǎng)度及吸煙情況作為輸入?yún)?shù),用Fisher判別分析、決策樹(shù)C5.0和反向傳播神經(jīng)網(wǎng)絡(luò)算法(Back-Propagation,BP算法)分別對(duì)訓(xùn)練集進(jìn)行訓(xùn)練建立模型,用訓(xùn)練好的模型對(duì)相應(yīng)的測(cè)試集進(jìn)行盲法預(yù)測(cè),驗(yàn)證判別模型的優(yōu)劣,最終建立肺癌早期智能化預(yù)警模型
12、。
結(jié)果:
1.GSTM1基因缺失型,CYP1A1-exon7、mEH-exon3、XRCC1-194及XRCC1-280基因位點(diǎn)純和突變型在病例組與對(duì)照組中的分布頻率差異均有統(tǒng)計(jì)學(xué)意義(P<0.05),GSTM1基因缺失者與GSTM1基因陽(yáng)性者相比發(fā)生肺癌的危險(xiǎn)性升高(Oradj=1.727,95%CI:1.211-2.463);攜帶CYP1A1-exon7 Ile/val+val/val基因型的個(gè)體較攜帶
13、CYP1A1-exon7 Ile/Ile基因型的個(gè)體發(fā)生肺癌的危險(xiǎn)性升高(Oradj=1.727,95%CI:1.203-2.477):mEH-exon3突變基因型攜帶者與野生純合型的個(gè)體相比發(fā)生肺癌的危險(xiǎn)性升高(ORadj=1.758,95%CI:1.194-2.589):攜帶XRCCI-194 Arg/Trp+Trp/Trp基因型的個(gè)體較攜帶XRCC1-194 Arg/Arg基因型的個(gè)體發(fā)生肺癌的危險(xiǎn)性升高(ORadj=1.542,
14、95%CI:1.083-2.196);XRCC1-280His/His基因型攜帶者較XRCC1-280 Arg/Arg+Arg/His基因型攜帶者發(fā)生肺癌的危險(xiǎn)性升高(ORadj=2.941,95%CI:1.427-6.060)。CYP1A1-Msp1、GSTT1、mEH-exon4及XRCC1-399多態(tài)基因型在病例組與對(duì)照組中的分布頻率差異均無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05)。基于5種基因多態(tài)性建立肺癌判別模型,結(jié)果為Fisher判別分析
15、、決策樹(shù)及ANN對(duì)訓(xùn)練集和預(yù)測(cè)集的準(zhǔn)確率分別為63.59%、63.25%;95.64%、82.61%;84.1%、80.77%,Fisher判別分析、決策樹(shù)及ANN模型的ROC曲線下面積(AUC)分別為0.627、0.836、0.821。
2.肺癌組外周血p16基因和RASSF1A基因甲基化水平及端粒相對(duì)長(zhǎng)度分別為0.59(0.16~4.50)、27.62(9.09~52.86)、0.93±0.32,與對(duì)照組相比差異具有統(tǒng)
16、計(jì)學(xué)意義(P<0.05);p16基因和RASSF1A基因啟動(dòng)子區(qū)甲基化水平增高及端粒相對(duì)長(zhǎng)度縮短與肺癌發(fā)生危險(xiǎn)性增加有關(guān);性別、年齡、吸煙情況、肺癌分期和病理類型與p16基因、RASSF1A基因甲基化及端粒長(zhǎng)度無(wú)關(guān)(P>0.05)。基于上述指標(biāo)建立肺癌判別模型,結(jié)果為Fisher判別分析、決策樹(shù)及ANN對(duì)訓(xùn)練集和預(yù)測(cè)集的準(zhǔn)確率分別為66.34%、65.82%:77.26%、75.45%:72.15%、71.72%,3種模型的AUC分別為
17、0.660、0.782、0.759。
3.XRCC1-280位點(diǎn)不同基因型之間p16甲基化水平有差異,CYP1A1-exon7、GSTM1、mEH-exon3和XRCC1-280位點(diǎn)不同基因型之間RASSF1A基因甲基化水平不同,CYP1A1-exon7和GSTM1基因突變型與野生型相比端粒相對(duì)長(zhǎng)度差異?;谏鲜鼍C合指標(biāo)建立肺癌判別模型結(jié)果顯示,Fisher判別分析、決策樹(shù)及ANN對(duì)訓(xùn)練集和預(yù)測(cè)集的準(zhǔn)確率分別為72.15%
18、、70.59%:93.88%、93%:92.96%、89.62%,3種模型的AUC分別為0.722、0.929、0.894。決策樹(shù)模型對(duì)臨床早期(I+II期)肺癌的判別準(zhǔn)確率為96.36%,ANN模型為89.09%。
結(jié)論:
1.CYP1A1-exon7、GSTM1、mEH-exon3、XRCC1-194和XRCC1-280基因位點(diǎn)的變異、p16和RASSF1A基因甲基化水平異常增高、端粒相對(duì)長(zhǎng)度縮短與肺癌患
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于數(shù)據(jù)挖掘技術(shù)的客戶流失預(yù)警模型
- 基于數(shù)據(jù)挖掘的預(yù)警技術(shù)研究.pdf
- 基于數(shù)據(jù)挖掘的銷售預(yù)警模型分析與研究.pdf
- 基于數(shù)據(jù)挖掘的通信客戶流失預(yù)警模型研究.pdf
- 基于組織芯片和數(shù)據(jù)挖掘技術(shù)的早期非小細(xì)胞肺癌預(yù)后研究.pdf
- 基于數(shù)據(jù)挖掘技術(shù)的肺癌預(yù)后系統(tǒng)的研究.pdf
- 醫(yī)療數(shù)據(jù)挖掘在疾病早期預(yù)警中的關(guān)鍵技術(shù)研究.pdf
- 基于數(shù)據(jù)挖掘技術(shù)的表觀遺傳分子標(biāo)志在肺癌早期診斷中的應(yīng)用.pdf
- 基于數(shù)據(jù)挖掘技術(shù)的金融風(fēng)險(xiǎn)分類預(yù)警研究.pdf
- 基于數(shù)據(jù)挖掘技術(shù)的財(cái)務(wù)風(fēng)險(xiǎn)分析與預(yù)警研究.pdf
- 數(shù)據(jù)挖掘技術(shù)在冠心病早期預(yù)警系統(tǒng)中的應(yīng)用研究.pdf
- 基于數(shù)據(jù)挖掘技術(shù)的信用評(píng)估模型研究.pdf
- 基于數(shù)據(jù)挖掘技術(shù)的穩(wěn)態(tài)電能質(zhì)量數(shù)據(jù)預(yù)測(cè)預(yù)警研究.pdf
- 數(shù)據(jù)挖掘技術(shù)在冠心病早期預(yù)警系統(tǒng)中的應(yīng)用研究
- 基于向量空間模型的數(shù)據(jù)挖掘技術(shù)的研究.pdf
- 基于數(shù)據(jù)挖掘技術(shù)的投資能力預(yù)測(cè)模型研究.pdf
- 基于數(shù)據(jù)挖掘技術(shù)的客戶離網(wǎng)模型研究.pdf
- 基于數(shù)據(jù)挖掘技術(shù)的股市定價(jià)模型.pdf
- 基于數(shù)據(jù)挖掘技術(shù)的入侵檢測(cè)模型.pdf
- 基于數(shù)據(jù)挖掘技術(shù)的入侵檢測(cè)模型構(gòu)建.pdf
評(píng)論
0/150
提交評(píng)論