版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著后基因組時(shí)代的到來(lái),藥物研發(fā)已經(jīng)由傳統(tǒng)的研發(fā)模式轉(zhuǎn)向了基于系統(tǒng)藥理學(xué)的研發(fā)模式?;诖朔N模式,海量的數(shù)據(jù)在藥物研發(fā)過(guò)程中需要分析和處理。化學(xué)生物信息學(xué)是一門新興的用于研究藥物及藥物相關(guān)系統(tǒng)中信息內(nèi)容和信息流向的綜合系統(tǒng)學(xué)科。將化學(xué)生物信息學(xué)引入到藥物研究過(guò)程中,可以極大地加快新藥研究進(jìn)程,縮短研究周期,降低研究費(fèi)用。從藥物研究全過(guò)程來(lái)看,幾乎每一個(gè)環(huán)節(jié)都與化學(xué)生物信息學(xué)有著密切的關(guān)系,如藥物靶標(biāo)發(fā)現(xiàn),藥物先導(dǎo)化合物發(fā)現(xiàn),候選物結(jié)構(gòu)修
2、飾和優(yōu)化、藥代動(dòng)力學(xué)研究,藥物的臨床前研究和臨床研究,以及藥物投入市場(chǎng)后的不良反應(yīng)跟蹤等。不過(guò)面對(duì)如此復(fù)雜的數(shù)據(jù),化學(xué)生物信息學(xué)研究面臨諸多困難問(wèn)題:(1)高質(zhì)量QSAR/SAR模型的建立經(jīng)常涉及到奇異樣本檢測(cè)、特征選擇以及非線性等建模問(wèn)題;(2)如何提取不同水平上不同數(shù)據(jù)結(jié)構(gòu)信息并加以整合來(lái)建立一個(gè)假設(shè)可測(cè)試的模型已成為當(dāng)今化學(xué)生物信息學(xué)乃至系統(tǒng)生物學(xué)面臨的最大挑戰(zhàn);(3)在高通量掃描和藥物臨床實(shí)驗(yàn)數(shù)據(jù)中,經(jīng)常會(huì)伴隨有缺失值、混合數(shù)據(jù)
3、類型、數(shù)據(jù)不平衡、存在奇異樣本、特征多樣本少、非線性、以及多類別多模式等一系列問(wèn)題;(4)如何對(duì)常用藥物信息進(jìn)行提取和收集并轉(zhuǎn)化為藥物化學(xué)家容易使用的工具是化學(xué)生物信息學(xué)急切需要解決的問(wèn)題;(5)如何提取網(wǎng)絡(luò)中的特征信息以及建立高精度網(wǎng)絡(luò)預(yù)測(cè)模型是需要迫切解決的問(wèn)題。針對(duì)這些困難問(wèn)題,本論文發(fā)展了一些新型的化學(xué)生物信息學(xué)方法,并且基于這些新方法對(duì)藥物研發(fā)中關(guān)注的兩個(gè)問(wèn)題(藥物ADMET性質(zhì)評(píng)估和藥物靶標(biāo)發(fā)現(xiàn))進(jìn)行了研究。本論文研究?jī)?nèi)容主
4、要包括兩個(gè)部分:基礎(chǔ)研究部分(第二章-第五章)和實(shí)際應(yīng)用部分(第六章和第七章)。基礎(chǔ)研究部分包括化學(xué)生物信息學(xué)新型方法和藥物信息提取方法研究,實(shí)際應(yīng)用部分為藥物ADMET性質(zhì)評(píng)估和藥物-靶點(diǎn)相互作用網(wǎng)絡(luò)預(yù)測(cè)。本論文主要研究?jī)?nèi)容包括:
一、對(duì)化學(xué)生物信息學(xué)及其研究?jī)?nèi)容進(jìn)行了簡(jiǎn)要的介紹,比較了化學(xué)生物信息學(xué)與化學(xué)信息學(xué),生物信息學(xué)在藥物研發(fā)中的異同。明確地提出了化學(xué)生物信息學(xué)研究應(yīng)以系統(tǒng)的觀點(diǎn)對(duì)藥物信息進(jìn)行提取,即從分子水平、細(xì)胞
5、水平和組織乃至更高水平上對(duì)藥物進(jìn)行描述,并最終有機(jī)地整合在一起共同加深對(duì)藥物行為的理解。鑒于各種統(tǒng)計(jì)學(xué)習(xí)算法在藥物數(shù)據(jù)挖掘中的重要性,對(duì)化學(xué)生物信息學(xué)中常用的數(shù)據(jù)挖掘方法進(jìn)行了簡(jiǎn)要介紹。網(wǎng)絡(luò)建模在化學(xué)生物信息學(xué)中變得越來(lái)越重要,本章對(duì)網(wǎng)絡(luò)模型的構(gòu)建以及一些難點(diǎn)問(wèn)題進(jìn)行了分析。最后對(duì)化學(xué)生物信息學(xué)研究中的難點(diǎn)問(wèn)題進(jìn)行了總結(jié),在以下幾章中將通過(guò)發(fā)展各種化學(xué)生物信息學(xué)新型方法來(lái)解決這些難點(diǎn)問(wèn)題。(第一章)
二、提出了基于模型特征的分
6、布進(jìn)行奇異樣本診斷和特征選擇的新方法。通過(guò)研究樣本在模型種群中預(yù)測(cè)誤差的分布,發(fā)現(xiàn)預(yù)測(cè)誤差分布的統(tǒng)計(jì)特征能夠有效地區(qū)分正常樣本和各種類型奇異樣本。基于此,我們發(fā)展了一種用于奇異樣本診斷的蒙特卡洛方法。此方法能夠同時(shí)診斷數(shù)據(jù)中的各種類型的奇異樣本,并且降低了掩蔽效應(yīng)帶來(lái)的風(fēng)險(xiǎn)。通過(guò)和其它奇異樣本診斷和穩(wěn)健回歸方法進(jìn)行比較,證實(shí)了我們提出的方法的優(yōu)越性能??紤]到樣本空間和特征空間的相互作用,我們構(gòu)建了一個(gè)統(tǒng)一的框架來(lái)進(jìn)行奇異樣本診斷和變量選
7、擇。其主要思想是通過(guò)模型系數(shù)的統(tǒng)計(jì)分布進(jìn)行變量選擇,通過(guò)樣本預(yù)測(cè)誤差的分布進(jìn)行奇異樣本診斷,后項(xiàng)消除策略用來(lái)捕捉樣本空間和變量空間的交互作用。將此方法應(yīng)用到模擬數(shù)據(jù)和QSAR數(shù)據(jù)的分析,得到了非常顯著的性能提高。(第二章)
三、對(duì)核方法及核融合算法進(jìn)行了深入的研究,提出了幾種用于藥物數(shù)據(jù)挖掘的新型核方法。由核方法的模塊化可知,核函數(shù)的選擇和建模方法的選擇可以分離開(kāi)來(lái)考慮。通過(guò)選擇不同的核函數(shù)和建模方法,我們能夠構(gòu)建滿足不同需求
8、的核模型。基于此,我們發(fā)展了一種基于SMILES表征的字符串核支持向量機(jī)算法,并將其應(yīng)用到毒性數(shù)據(jù)的分類研究。通過(guò)和其它核函數(shù)及描述符的比較,證實(shí)了我們方法的高性能。基于SMILES表征的字符串核支持向量機(jī)模型不需要計(jì)算任何分子描述符,因此應(yīng)用簡(jiǎn)單方便。通過(guò)考慮不同的建模方法,我們?cè)诤丝蚣軆?nèi)發(fā)展了一種核k-近鄰算法,并將其和不同核函數(shù)結(jié)合,有效地克服了原始k-近鄰算法的缺點(diǎn)。在核方法中,核特征空間內(nèi)出現(xiàn)冗余特征時(shí),將會(huì)嚴(yán)重影響核方法的預(yù)
9、測(cè)性能。通過(guò)在核特征空間內(nèi)應(yīng)用核主成分分析,發(fā)展了一個(gè)兩步算法來(lái)解決核空間內(nèi)冗余特征問(wèn)題。核主成分分析首先用來(lái)在核特征空間內(nèi)進(jìn)行去噪處理,然后線性支持向量機(jī)在此空間內(nèi)進(jìn)行分類研究。將此算法應(yīng)用于QSAR數(shù)據(jù)的分析,獲得了高的預(yù)測(cè)性能。(第三章)
四、對(duì)決策樹(shù)及基于決策樹(shù)的集成算法進(jìn)行了深入的研究,提出了幾種用于藥物及組學(xué)數(shù)據(jù)挖掘的新方法。由于特征選擇在藥物數(shù)據(jù)建模中的重要性,我們研究了決策樹(shù)及基于決策樹(shù)的集成模型的特征選擇問(wèn)題
10、,發(fā)展了一個(gè)廣義的框架用來(lái)選擇有信息的變量子集。通過(guò)對(duì)隨機(jī)森林算法的原理進(jìn)行分析,發(fā)展了一種特征重要度采樣的自適應(yīng)隨機(jī)森林算法,并將其應(yīng)用于QSAR數(shù)據(jù)的分析,獲得了比原始隨機(jī)森林更高的預(yù)測(cè)性能。通過(guò)充分利用決策樹(shù)的自動(dòng)逐步特征選擇和樣本復(fù)雜度縮減的優(yōu)點(diǎn),我們結(jié)合蒙特卡洛采樣技術(shù)發(fā)展了一種蒙特卡洛樹(shù)算法用于分析代謝組學(xué)數(shù)據(jù)中的模式信息。將此算法應(yīng)用于兩個(gè)代謝組學(xué)數(shù)據(jù)分析,獲得了代謝組學(xué)數(shù)據(jù)中清晰的模式。最后我們發(fā)展了一種基于樹(shù)核的核Fi
11、sher判別分析算法,并將其應(yīng)用到代謝組學(xué)數(shù)據(jù)的分析中,獲得了顯著的效果。(第四章)
五、針對(duì)于分子特征表征在化學(xué)生物信息學(xué)中的重要性,我們開(kāi)發(fā)了四套用于分子特征提取的軟件包,并且構(gòu)建了基于web的分子特征計(jì)算服務(wù)器。四套軟件分別為:(1)用于化學(xué)小分子特征提取的ChemoPy軟件包;(2)用于蛋白質(zhì)序列特征提取的ProPy軟件包;(3)用于生物網(wǎng)絡(luò)特征提取的PyNet軟件包;(4)用于藥物-靶點(diǎn)相互作用及蛋白質(zhì)互作用描述符P
12、yDPI軟件包。應(yīng)用這些軟件包和網(wǎng)絡(luò)服務(wù)器能夠很好地輔助藥物化學(xué)家和生物學(xué)家進(jìn)行復(fù)雜分子數(shù)據(jù)的表征和分析。(第五章)
六、對(duì)藥物ADMET及物理化學(xué)性質(zhì)進(jìn)行了基于計(jì)算機(jī)輔助的預(yù)測(cè)研究,并最終構(gòu)建了一個(gè)藥物ADMET性質(zhì)數(shù)據(jù)庫(kù)和基于web的在線預(yù)測(cè)平臺(tái)。鑒于水溶性在藥物研發(fā)中的重要性,我們發(fā)展了三個(gè)預(yù)測(cè)模型用于化合物水溶性的預(yù)測(cè),通過(guò)對(duì)選擇的分子描述符進(jìn)行分析,發(fā)現(xiàn)了影響藥物水溶性的因素。運(yùn)用第四章發(fā)展的改進(jìn)隨機(jī)森林算法對(duì)藥物最
13、大日推薦劑量進(jìn)行結(jié)構(gòu)-活性關(guān)系預(yù)測(cè)研究,通過(guò)分析不同療效藥物的子結(jié)構(gòu)碎片,發(fā)現(xiàn)了一些相關(guān)藥物分子毒性的特征碎片。此方法能夠提前預(yù)估臨床一期實(shí)驗(yàn)中藥物的最大推薦劑量?;陔S機(jī)森林和子結(jié)構(gòu)模式,我們發(fā)展了一個(gè)結(jié)構(gòu)-活性關(guān)系模型框架對(duì)化合物毒性進(jìn)行計(jì)算機(jī)輔助預(yù)測(cè),此方法有助于化學(xué)家對(duì)化合物的毒性評(píng)估。通過(guò)發(fā)展2D-QSAR模型,研究了100個(gè)結(jié)構(gòu)多樣的天然產(chǎn)物對(duì)OATP1B1調(diào)控的雌酮硫酸鹽攝取的抑制效應(yīng),一些影響抑制效應(yīng)的結(jié)構(gòu)因素被識(shí)別。通
14、過(guò)研究天然產(chǎn)物結(jié)構(gòu)和抑制效應(yīng)間的定量關(guān)系,獲得了深入的天然產(chǎn)物-藥物相互作用潛在機(jī)制的視野。最后我們構(gòu)建了一個(gè)藥物ADMET性質(zhì)數(shù)據(jù)庫(kù)和基于web的在線預(yù)測(cè)平臺(tái),旨在方便藥物學(xué)家對(duì)ADMET性質(zhì)的分析和評(píng)估。(第六章)
七、基于化學(xué)基因組學(xué)框架,提出了基因標(biāo)度地預(yù)測(cè)藥物-靶點(diǎn)相互作用網(wǎng)絡(luò)的方法。通過(guò)藥物-靶點(diǎn)對(duì)的Ki結(jié)合常數(shù),我們區(qū)分了整個(gè)藥物-靶點(diǎn)對(duì)集為正樣本集和負(fù)樣本集。化學(xué)基因組學(xué)方法用來(lái)表征藥物-靶點(diǎn)相互作用關(guān)系,即一
15、個(gè)藥物-靶點(diǎn)對(duì)能夠通過(guò)同時(shí)考慮藥物描述符和蛋白質(zhì)描述符共同來(lái)表征。隨機(jī)森林模型用來(lái)構(gòu)建預(yù)測(cè)模型。預(yù)測(cè)結(jié)果和深入分析證實(shí)了我們提到的化學(xué)基因組學(xué)框架的合理性。通過(guò)對(duì)未知藥物-靶點(diǎn)對(duì)的預(yù)測(cè)和網(wǎng)絡(luò)分析,顯示了藥物在臨床上的多藥理特征。此方法提供了一種有效方式來(lái)研究藥物和靶點(diǎn)的行為?;趙eb的預(yù)測(cè)服務(wù)器PreDPI-Ki最后被構(gòu)建方便藥物學(xué)家對(duì)此研究成果的應(yīng)用。在此方法的基礎(chǔ)上,通過(guò)引入網(wǎng)絡(luò)特征描述符,藥物-靶點(diǎn)相互作用的預(yù)測(cè)精度能夠顯著地提
16、高。在四個(gè)標(biāo)準(zhǔn)數(shù)據(jù)集上的預(yù)測(cè)模型的比較證實(shí)了網(wǎng)絡(luò)特征在藥物-靶點(diǎn)相互作用網(wǎng)絡(luò)預(yù)測(cè)中的重要性?;诨瘜W(xué)、生物和網(wǎng)絡(luò)特征融合構(gòu)建的預(yù)測(cè)模型,我們掃描了未知的藥物-靶點(diǎn)對(duì),發(fā)現(xiàn)預(yù)測(cè)排序在前的藥物-靶點(diǎn)對(duì)大部分能夠被實(shí)驗(yàn)證實(shí)。此方法能夠?yàn)樗幬镏囟ㄏ蚍治龊桶悬c(diǎn)鑒別提供了一種可供選擇的方式。最后,基于構(gòu)建的藥物-靶點(diǎn)相互作用預(yù)測(cè)模型,我們?cè)u(píng)估了26種天然產(chǎn)物的升壓機(jī)制。通過(guò)預(yù)測(cè)天然產(chǎn)物和相關(guān)靶點(diǎn)間的關(guān)系,發(fā)現(xiàn)不同的升壓機(jī)制由不同的靶點(diǎn)所引起。因此通
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 化學(xué)信息學(xué)方法研究及其在環(huán)境、生物學(xué)中的應(yīng)用.pdf
- 生物信息學(xué)在分子診斷中的應(yīng)用
- 生物信息學(xué)應(yīng)用程序新方法:力場(chǎng)參數(shù)優(yōu)化和結(jié)構(gòu)域分析.pdf
- HMM及其在生物信息學(xué)中的應(yīng)用.pdf
- 化學(xué)計(jì)量學(xué)新算法及其在分析化學(xué)和生物信息學(xué)中的應(yīng)用.pdf
- 計(jì)算智能方法在生物信息學(xué)中的應(yīng)用.pdf
- 生物信息學(xué)在創(chuàng)新藥物研究中的應(yīng)用
- 生物信息學(xué)在分子進(jìn)化中的研究.pdf
- 生物信息學(xué)
- 生物信息學(xué)及其發(fā)展歷史
- 生物信息學(xué)方法研究MicroRNA.pdf
- 生物信息學(xué)數(shù)據(jù)庫(kù)及其利用方法
- 信號(hào)處理方法在波譜分析及生物信息學(xué)中的應(yīng)用研究.pdf
- 生物信息學(xué)課件
- 生物信息學(xué)導(dǎo)論
- 生物信息學(xué)教案
- 生物信息學(xué)課程信息
- 圖的染色與圖論方法在生物信息學(xué)中的應(yīng)用.pdf
- 56941.生物信息學(xué)在基因組學(xué)研究中的應(yīng)用
- 生物信息學(xué)中的算法問(wèn)題
評(píng)論
0/150
提交評(píng)論