版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、隨著后基因組時代的到來,藥物研發(fā)已經(jīng)由傳統(tǒng)的研發(fā)模式轉(zhuǎn)向了基于系統(tǒng)藥理學(xué)的研發(fā)模式。基于此種模式,海量的數(shù)據(jù)在藥物研發(fā)過程中需要分析和處理?;瘜W(xué)生物信息學(xué)是一門新興的用于研究藥物及藥物相關(guān)系統(tǒng)中信息內(nèi)容和信息流向的綜合系統(tǒng)學(xué)科。將化學(xué)生物信息學(xué)引入到藥物研究過程中,可以極大地加快新藥研究進程,縮短研究周期,降低研究費用。從藥物研究全過程來看,幾乎每一個環(huán)節(jié)都與化學(xué)生物信息學(xué)有著密切的關(guān)系,如藥物靶標發(fā)現(xiàn),藥物先導(dǎo)化合物發(fā)現(xiàn),候選物結(jié)構(gòu)修
2、飾和優(yōu)化、藥代動力學(xué)研究,藥物的臨床前研究和臨床研究,以及藥物投入市場后的不良反應(yīng)跟蹤等。不過面對如此復(fù)雜的數(shù)據(jù),化學(xué)生物信息學(xué)研究面臨諸多困難問題:(1)高質(zhì)量QSAR/SAR模型的建立經(jīng)常涉及到奇異樣本檢測、特征選擇以及非線性等建模問題;(2)如何提取不同水平上不同數(shù)據(jù)結(jié)構(gòu)信息并加以整合來建立一個假設(shè)可測試的模型已成為當(dāng)今化學(xué)生物信息學(xué)乃至系統(tǒng)生物學(xué)面臨的最大挑戰(zhàn);(3)在高通量掃描和藥物臨床實驗數(shù)據(jù)中,經(jīng)常會伴隨有缺失值、混合數(shù)據(jù)
3、類型、數(shù)據(jù)不平衡、存在奇異樣本、特征多樣本少、非線性、以及多類別多模式等一系列問題;(4)如何對常用藥物信息進行提取和收集并轉(zhuǎn)化為藥物化學(xué)家容易使用的工具是化學(xué)生物信息學(xué)急切需要解決的問題;(5)如何提取網(wǎng)絡(luò)中的特征信息以及建立高精度網(wǎng)絡(luò)預(yù)測模型是需要迫切解決的問題。針對這些困難問題,本論文發(fā)展了一些新型的化學(xué)生物信息學(xué)方法,并且基于這些新方法對藥物研發(fā)中關(guān)注的兩個問題(藥物ADMET性質(zhì)評估和藥物靶標發(fā)現(xiàn))進行了研究。本論文研究內(nèi)容主
4、要包括兩個部分:基礎(chǔ)研究部分(第二章-第五章)和實際應(yīng)用部分(第六章和第七章)?;A(chǔ)研究部分包括化學(xué)生物信息學(xué)新型方法和藥物信息提取方法研究,實際應(yīng)用部分為藥物ADMET性質(zhì)評估和藥物-靶點相互作用網(wǎng)絡(luò)預(yù)測。本論文主要研究內(nèi)容包括:
一、對化學(xué)生物信息學(xué)及其研究內(nèi)容進行了簡要的介紹,比較了化學(xué)生物信息學(xué)與化學(xué)信息學(xué),生物信息學(xué)在藥物研發(fā)中的異同。明確地提出了化學(xué)生物信息學(xué)研究應(yīng)以系統(tǒng)的觀點對藥物信息進行提取,即從分子水平、細胞
5、水平和組織乃至更高水平上對藥物進行描述,并最終有機地整合在一起共同加深對藥物行為的理解。鑒于各種統(tǒng)計學(xué)習(xí)算法在藥物數(shù)據(jù)挖掘中的重要性,對化學(xué)生物信息學(xué)中常用的數(shù)據(jù)挖掘方法進行了簡要介紹。網(wǎng)絡(luò)建模在化學(xué)生物信息學(xué)中變得越來越重要,本章對網(wǎng)絡(luò)模型的構(gòu)建以及一些難點問題進行了分析。最后對化學(xué)生物信息學(xué)研究中的難點問題進行了總結(jié),在以下幾章中將通過發(fā)展各種化學(xué)生物信息學(xué)新型方法來解決這些難點問題。(第一章)
二、提出了基于模型特征的分
6、布進行奇異樣本診斷和特征選擇的新方法。通過研究樣本在模型種群中預(yù)測誤差的分布,發(fā)現(xiàn)預(yù)測誤差分布的統(tǒng)計特征能夠有效地區(qū)分正常樣本和各種類型奇異樣本。基于此,我們發(fā)展了一種用于奇異樣本診斷的蒙特卡洛方法。此方法能夠同時診斷數(shù)據(jù)中的各種類型的奇異樣本,并且降低了掩蔽效應(yīng)帶來的風(fēng)險。通過和其它奇異樣本診斷和穩(wěn)健回歸方法進行比較,證實了我們提出的方法的優(yōu)越性能??紤]到樣本空間和特征空間的相互作用,我們構(gòu)建了一個統(tǒng)一的框架來進行奇異樣本診斷和變量選
7、擇。其主要思想是通過模型系數(shù)的統(tǒng)計分布進行變量選擇,通過樣本預(yù)測誤差的分布進行奇異樣本診斷,后項消除策略用來捕捉樣本空間和變量空間的交互作用。將此方法應(yīng)用到模擬數(shù)據(jù)和QSAR數(shù)據(jù)的分析,得到了非常顯著的性能提高。(第二章)
三、對核方法及核融合算法進行了深入的研究,提出了幾種用于藥物數(shù)據(jù)挖掘的新型核方法。由核方法的模塊化可知,核函數(shù)的選擇和建模方法的選擇可以分離開來考慮。通過選擇不同的核函數(shù)和建模方法,我們能夠構(gòu)建滿足不同需求
8、的核模型?;诖耍覀儼l(fā)展了一種基于SMILES表征的字符串核支持向量機算法,并將其應(yīng)用到毒性數(shù)據(jù)的分類研究。通過和其它核函數(shù)及描述符的比較,證實了我們方法的高性能?;赟MILES表征的字符串核支持向量機模型不需要計算任何分子描述符,因此應(yīng)用簡單方便。通過考慮不同的建模方法,我們在核框架內(nèi)發(fā)展了一種核k-近鄰算法,并將其和不同核函數(shù)結(jié)合,有效地克服了原始k-近鄰算法的缺點。在核方法中,核特征空間內(nèi)出現(xiàn)冗余特征時,將會嚴重影響核方法的預(yù)
9、測性能。通過在核特征空間內(nèi)應(yīng)用核主成分分析,發(fā)展了一個兩步算法來解決核空間內(nèi)冗余特征問題。核主成分分析首先用來在核特征空間內(nèi)進行去噪處理,然后線性支持向量機在此空間內(nèi)進行分類研究。將此算法應(yīng)用于QSAR數(shù)據(jù)的分析,獲得了高的預(yù)測性能。(第三章)
四、對決策樹及基于決策樹的集成算法進行了深入的研究,提出了幾種用于藥物及組學(xué)數(shù)據(jù)挖掘的新方法。由于特征選擇在藥物數(shù)據(jù)建模中的重要性,我們研究了決策樹及基于決策樹的集成模型的特征選擇問題
10、,發(fā)展了一個廣義的框架用來選擇有信息的變量子集。通過對隨機森林算法的原理進行分析,發(fā)展了一種特征重要度采樣的自適應(yīng)隨機森林算法,并將其應(yīng)用于QSAR數(shù)據(jù)的分析,獲得了比原始隨機森林更高的預(yù)測性能。通過充分利用決策樹的自動逐步特征選擇和樣本復(fù)雜度縮減的優(yōu)點,我們結(jié)合蒙特卡洛采樣技術(shù)發(fā)展了一種蒙特卡洛樹算法用于分析代謝組學(xué)數(shù)據(jù)中的模式信息。將此算法應(yīng)用于兩個代謝組學(xué)數(shù)據(jù)分析,獲得了代謝組學(xué)數(shù)據(jù)中清晰的模式。最后我們發(fā)展了一種基于樹核的核Fi
11、sher判別分析算法,并將其應(yīng)用到代謝組學(xué)數(shù)據(jù)的分析中,獲得了顯著的效果。(第四章)
五、針對于分子特征表征在化學(xué)生物信息學(xué)中的重要性,我們開發(fā)了四套用于分子特征提取的軟件包,并且構(gòu)建了基于web的分子特征計算服務(wù)器。四套軟件分別為:(1)用于化學(xué)小分子特征提取的ChemoPy軟件包;(2)用于蛋白質(zhì)序列特征提取的ProPy軟件包;(3)用于生物網(wǎng)絡(luò)特征提取的PyNet軟件包;(4)用于藥物-靶點相互作用及蛋白質(zhì)互作用描述符P
12、yDPI軟件包。應(yīng)用這些軟件包和網(wǎng)絡(luò)服務(wù)器能夠很好地輔助藥物化學(xué)家和生物學(xué)家進行復(fù)雜分子數(shù)據(jù)的表征和分析。(第五章)
六、對藥物ADMET及物理化學(xué)性質(zhì)進行了基于計算機輔助的預(yù)測研究,并最終構(gòu)建了一個藥物ADMET性質(zhì)數(shù)據(jù)庫和基于web的在線預(yù)測平臺。鑒于水溶性在藥物研發(fā)中的重要性,我們發(fā)展了三個預(yù)測模型用于化合物水溶性的預(yù)測,通過對選擇的分子描述符進行分析,發(fā)現(xiàn)了影響藥物水溶性的因素。運用第四章發(fā)展的改進隨機森林算法對藥物最
13、大日推薦劑量進行結(jié)構(gòu)-活性關(guān)系預(yù)測研究,通過分析不同療效藥物的子結(jié)構(gòu)碎片,發(fā)現(xiàn)了一些相關(guān)藥物分子毒性的特征碎片。此方法能夠提前預(yù)估臨床一期實驗中藥物的最大推薦劑量?;陔S機森林和子結(jié)構(gòu)模式,我們發(fā)展了一個結(jié)構(gòu)-活性關(guān)系模型框架對化合物毒性進行計算機輔助預(yù)測,此方法有助于化學(xué)家對化合物的毒性評估。通過發(fā)展2D-QSAR模型,研究了100個結(jié)構(gòu)多樣的天然產(chǎn)物對OATP1B1調(diào)控的雌酮硫酸鹽攝取的抑制效應(yīng),一些影響抑制效應(yīng)的結(jié)構(gòu)因素被識別。通
14、過研究天然產(chǎn)物結(jié)構(gòu)和抑制效應(yīng)間的定量關(guān)系,獲得了深入的天然產(chǎn)物-藥物相互作用潛在機制的視野。最后我們構(gòu)建了一個藥物ADMET性質(zhì)數(shù)據(jù)庫和基于web的在線預(yù)測平臺,旨在方便藥物學(xué)家對ADMET性質(zhì)的分析和評估。(第六章)
七、基于化學(xué)基因組學(xué)框架,提出了基因標度地預(yù)測藥物-靶點相互作用網(wǎng)絡(luò)的方法。通過藥物-靶點對的Ki結(jié)合常數(shù),我們區(qū)分了整個藥物-靶點對集為正樣本集和負樣本集?;瘜W(xué)基因組學(xué)方法用來表征藥物-靶點相互作用關(guān)系,即一
15、個藥物-靶點對能夠通過同時考慮藥物描述符和蛋白質(zhì)描述符共同來表征。隨機森林模型用來構(gòu)建預(yù)測模型。預(yù)測結(jié)果和深入分析證實了我們提到的化學(xué)基因組學(xué)框架的合理性。通過對未知藥物-靶點對的預(yù)測和網(wǎng)絡(luò)分析,顯示了藥物在臨床上的多藥理特征。此方法提供了一種有效方式來研究藥物和靶點的行為?;趙eb的預(yù)測服務(wù)器PreDPI-Ki最后被構(gòu)建方便藥物學(xué)家對此研究成果的應(yīng)用。在此方法的基礎(chǔ)上,通過引入網(wǎng)絡(luò)特征描述符,藥物-靶點相互作用的預(yù)測精度能夠顯著地提
16、高。在四個標準數(shù)據(jù)集上的預(yù)測模型的比較證實了網(wǎng)絡(luò)特征在藥物-靶點相互作用網(wǎng)絡(luò)預(yù)測中的重要性。基于化學(xué)、生物和網(wǎng)絡(luò)特征融合構(gòu)建的預(yù)測模型,我們掃描了未知的藥物-靶點對,發(fā)現(xiàn)預(yù)測排序在前的藥物-靶點對大部分能夠被實驗證實。此方法能夠為藥物重定向分析和靶點鑒別提供了一種可供選擇的方式。最后,基于構(gòu)建的藥物-靶點相互作用預(yù)測模型,我們評估了26種天然產(chǎn)物的升壓機制。通過預(yù)測天然產(chǎn)物和相關(guān)靶點間的關(guān)系,發(fā)現(xiàn)不同的升壓機制由不同的靶點所引起。因此通
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 化學(xué)信息學(xué)方法研究及其在環(huán)境、生物學(xué)中的應(yīng)用.pdf
- 生物信息學(xué)在分子診斷中的應(yīng)用
- 生物信息學(xué)應(yīng)用程序新方法:力場參數(shù)優(yōu)化和結(jié)構(gòu)域分析.pdf
- HMM及其在生物信息學(xué)中的應(yīng)用.pdf
- 化學(xué)計量學(xué)新算法及其在分析化學(xué)和生物信息學(xué)中的應(yīng)用.pdf
- 計算智能方法在生物信息學(xué)中的應(yīng)用.pdf
- 生物信息學(xué)在創(chuàng)新藥物研究中的應(yīng)用
- 生物信息學(xué)在分子進化中的研究.pdf
- 生物信息學(xué)
- 生物信息學(xué)及其發(fā)展歷史
- 生物信息學(xué)方法研究MicroRNA.pdf
- 生物信息學(xué)數(shù)據(jù)庫及其利用方法
- 信號處理方法在波譜分析及生物信息學(xué)中的應(yīng)用研究.pdf
- 生物信息學(xué)課件
- 生物信息學(xué)導(dǎo)論
- 生物信息學(xué)教案
- 生物信息學(xué)課程信息
- 圖的染色與圖論方法在生物信息學(xué)中的應(yīng)用.pdf
- 56941.生物信息學(xué)在基因組學(xué)研究中的應(yīng)用
- 生物信息學(xué)中的算法問題
評論
0/150
提交評論