版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、人工智能的發(fā)展對科技和經(jīng)濟的發(fā)展起了重大的推動作用。尤其在解決復(fù)雜優(yōu)化、減少反應(yīng)時間和促進產(chǎn)品的開發(fā)等方面表現(xiàn)更為突出。隨著科技的進步,大量數(shù)據(jù)的產(chǎn)生需要有效的方法才能得出更加可行的結(jié)果,有利于促進科技的快速發(fā)展。因此研究新的高效數(shù)據(jù)挖掘方法和尋找規(guī)律已成為人工智能研究的迫切需要。 本文對一種新的數(shù)據(jù)挖掘方法:基因表達式編程(geneexpressionprogramming,GEP)進行研究,GEP是一種新的機器學(xué)習(xí)算法,具有
2、優(yōu)異的泛化能力,是由FerreiraC.于1999年根據(jù)遺傳算法和遺傳程序發(fā)展而來的。本論文主要對GEP的原理和在定量結(jié)構(gòu)—性質(zhì)/活性關(guān)系(QSPR/QSAR)和疾病診斷方面的進行了應(yīng)用研究。 第一章:對GEP算法原理、實現(xiàn)步驟以及研究現(xiàn)狀進行了詳細的綜述,并對GEP和支持向量機(supportvectormachines,SVM)在疾病診斷和QSAR中的應(yīng)用現(xiàn)狀進行了綜述。 第二章:應(yīng)用GEP和SVM方法對疾病的診斷和
3、發(fā)病率進行預(yù)測,包括:(1)用SVM方法對346例(冠心病172例,健康體檢174例)進行了分類判別,同時用線性判別分析方法(lineardiscriminantanalysis,LDA)作為對照研究,對訓(xùn)練集的預(yù)測準(zhǔn)確率分別是96.86%和78.18%,測試組的預(yù)測準(zhǔn)確率分別是90.57%和72.73%;(2)用SVM和LDA算法對70例(腎病綜合征50例,腎小球腎炎20例)進行了診斷,訓(xùn)練集的預(yù)測準(zhǔn)確率分別是94.6%和89.86%
4、,測試組的預(yù)測準(zhǔn)確率分別是78.18%和72.73%。表明用SVM方法建立的模型其預(yù)測能力要優(yōu)于LDA;(3)用GEP方法對2003年我國SARS的高發(fā)地區(qū)北京市和山西省的發(fā)病趨勢進行建模預(yù)測,其擬合情況與當(dāng)時SRAS實際發(fā)病和死亡情況基本一致,實驗結(jié)果表明其在精度和速度上都優(yōu)于神經(jīng)網(wǎng)絡(luò)算法。 第三章:GEP和SVM方法在藥物性質(zhì)方面的應(yīng)用研究:(1)應(yīng)用啟發(fā)式方法(HM)和支持向量機方法建立了70種藥物與血漿蛋白結(jié)合率的定量構(gòu)
5、效關(guān)系模型,研究了分子結(jié)構(gòu)對藥物與血漿蛋白結(jié)合率的影響。兩種方法均得到了較好的結(jié)果,交互檢驗的相關(guān)系數(shù)平方(R2)分別為0.80和0.82;通過對模型的穩(wěn)定性和預(yù)測能力比較表明,支持向量機建立的QSAR模型能夠更好地預(yù)測藥物與血漿蛋白結(jié)合率;(2)應(yīng)用GEP方法建立了抗艾滋病藥物核苷類的定量構(gòu)效關(guān)系模型,研究了分子結(jié)構(gòu)對此類藥物EC50的影響。用HM方法篩選5個描述符建立模型,平均誤差是0.41,而模型的相關(guān)系數(shù)(R)是091,對GEP
6、和SVM方法建立的模型進行了比較,GEP建立的模型中訓(xùn)練集和測試集的相關(guān)系數(shù)分別是0.91和0.63,而SVM方法建立的模型中訓(xùn)練集和測試集的相關(guān)系數(shù)分別是0.86和052,不論是測試集還是訓(xùn)練集的預(yù)測結(jié)果,GEP都優(yōu)于SVM,因此GEP可以作為一種有效的手段預(yù)測核苷類的抗艾滋病藥物的EC50;(3)基于GEP方法建立1,4-二氫吡啶鈣離子通道拮抗劑的半數(shù)有效抑制濃度(IC50),用啟發(fā)式方法篩選6個相關(guān)描述符,用GEP建立QSAR模型
7、,得到了很好的預(yù)測結(jié)果,均方誤差(MSE)是0.19,R2是0.92,本文為藥物篩選和設(shè)計提供了一種新而有效的方法。 第四章:GEP和SVM方法在分析化學(xué)方面的研究應(yīng)用:(1)建立了基于啟發(fā)式方法和支持向量機方法的QSAR模型,用于預(yù)測α-環(huán)糊精與單取代或1,4-二取代苯衍生物結(jié)合后包結(jié)物的穩(wěn)定常數(shù)。通過計算并用HM篩選6個參數(shù),用于啟發(fā)式方法和支持向量機方法建立QSAR模型,其R值分別是094和0.98,留一法(leave-o
8、ne-out,LOO)交互檢驗的相關(guān)系數(shù)(RCV)分別為0.92和0.95。因此,用支持向量機方法建立的模型要優(yōu)于啟發(fā)式方法,其預(yù)測能力更強,模型的穩(wěn)定性更好;(2)應(yīng)用啟發(fā)式方法和支持向量機方法建立了88種醛類化合物對大鼠急性毒性的定量構(gòu)效關(guān)系模型,研究了醛類化合物分子結(jié)構(gòu)對大鼠急性毒性的影響。兩種方法均得到了較好的結(jié)果,啟發(fā)式方法和支持向量機方法的交互檢驗的相關(guān)系數(shù)分別為0.90和0.93;通過對模型的穩(wěn)定性和預(yù)測能力比較,支持向量
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于支持向量機方法的QSAR-QSPR在化學(xué)、生物及環(huán)境科學(xué)中的應(yīng)用研究.pdf
- 基因表達式編程在電力負(fù)荷預(yù)測中的應(yīng)用研究.pdf
- 線性和非線性方法在QSAR-QSPR研究中的應(yīng)用.pdf
- 基因表達式編程在股票預(yù)測中的應(yīng)用與研究.pdf
- 基因表達式編程算法及其應(yīng)用研究.pdf
- 基因表達式編程在演化建模中的應(yīng)用研究.pdf
- 改進基因表達式編程在地鐵變形預(yù)測中的應(yīng)用研究.pdf
- 基因表達式編程算法的研究與應(yīng)用.pdf
- 基因表達式編程在軟件可靠性建模中的應(yīng)用研究.pdf
- 基因表達式編程的改進及其在知識發(fā)現(xiàn)中的應(yīng)用研究.pdf
- 基因表達式編程在電力負(fù)荷預(yù)測中的應(yīng)用.pdf
- 基因表達式編程研究及其在函數(shù)挖掘中的應(yīng)用.pdf
- 改進基因表達式編程在深基坑變形預(yù)測中的應(yīng)用研究.pdf
- 多表達式編程在規(guī)則挖掘中的應(yīng)用研究.pdf
- 改進基因表達式編程在礦山地表變形預(yù)測中的應(yīng)用研究.pdf
- 基因表達式編程在重金屬形態(tài)預(yù)測建模中的應(yīng)用研究.pdf
- 改進的基因表達式編程算法在負(fù)荷建模中的應(yīng)用.pdf
- 30861.基因表達式編程在gps高程擬合中的應(yīng)用
- 基于免疫策略的基因表達式編程在函數(shù)挖掘中的應(yīng)用.pdf
- 基因表達式編程技術(shù)及其在車間調(diào)度中的應(yīng)用研究.pdf
評論
0/150
提交評論