

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著人類(lèi)基因組計(jì)劃的順利完成,科學(xué)家們獲得了大量的序列信息,進(jìn)而人類(lèi)由以基因組研究為主的時(shí)代踏進(jìn)了以研究功能基因組為標(biāo)志的后基因組時(shí)代。在后基因組時(shí)代里,蛋白質(zhì)組學(xué)研究是生物信息學(xué)的重要分支之一,這是因?yàn)樯矬w內(nèi)的各種生理功能的執(zhí)行都離不開(kāi)蛋白質(zhì)以及蛋白質(zhì)與其它配體之間的協(xié)同合作。
蛋白質(zhì)作為生命體的主要基本物質(zhì)之一,其蛋白質(zhì)間的相互作用不僅對(duì)細(xì)胞和生物通路的功能發(fā)揮著關(guān)鍵性的作用,而且理解這些相互作用對(duì)各種疾病的發(fā)病機(jī)理
2、和治療也具有極大的推進(jìn)作用。因此蛋白質(zhì)組學(xué)研究中一個(gè)最重要的挑戰(zhàn)就是如何從物理和結(jié)構(gòu)層次上大規(guī)模地了解蛋白質(zhì)-蛋白質(zhì)之間的相互作用和構(gòu)建相應(yīng)的蛋白質(zhì)相互作用網(wǎng)絡(luò),一般常見(jiàn)的研究方法是根據(jù)其已知的蛋白質(zhì)及其配體的一級(jí)結(jié)構(gòu)序列,提取出序列中所包含的有用信息,利用實(shí)驗(yàn)和計(jì)算方法結(jié)合這些信息來(lái)預(yù)測(cè)蛋白質(zhì)之間發(fā)生相互作用的可能性并建立蛋白質(zhì)相互作用網(wǎng)絡(luò)。隨著X 晶體衍射和核磁共振(NMR)實(shí)驗(yàn)技術(shù)的進(jìn)步,大量蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)被測(cè)定出來(lái),這些數(shù)據(jù)信息
3、進(jìn)一步促進(jìn)了開(kāi)發(fā)基于數(shù)據(jù)驅(qū)動(dòng)的方法(計(jì)算方法)來(lái)預(yù)測(cè)蛋白質(zhì)相互作用。
本文采用智能計(jì)算中相關(guān)的算法圍繞蛋白質(zhì)相互作用里的一些基本問(wèn)題進(jìn)行著重研究。主要內(nèi)容包括微觀(guān)層次上的蛋白質(zhì)相互作用位點(diǎn)的預(yù)測(cè)、宏觀(guān)層次上的蛋白質(zhì)相互作用預(yù)測(cè)以及蛋白質(zhì)相互作用網(wǎng)絡(luò)的構(gòu)建。針對(duì)這三方面的問(wèn)題,我們分別進(jìn)行了深入的分析并提出相對(duì)應(yīng)的預(yù)測(cè)方法,詳細(xì)內(nèi)容分別如下:
1.通過(guò)對(duì)蛋白質(zhì)相互作用所形成的界面中表面殘基和界面殘基的分析,將覆
4、蓋算法引入到蛋白質(zhì)相互作用位點(diǎn)預(yù)測(cè)中。該算法能夠很好地結(jié)合蛋白質(zhì)相互作用界面上界面殘基在空間結(jié)構(gòu)和一級(jí)序列結(jié)構(gòu)中有聚類(lèi)現(xiàn)象的特點(diǎn),首先分別將界面殘基樣本和表面殘基樣本設(shè)想成在一個(gè)n 維空間的球面上(通過(guò)某種方式的轉(zhuǎn)換),然后提取兩種基本的蛋白質(zhì)序列特征:序列譜和溶劑可及表面積。利用覆蓋算法從初始界面殘基樣本開(kāi)始計(jì)算以該樣本為中心,以與異類(lèi)樣本最近距離和與同類(lèi)樣本最遠(yuǎn)距離的一半作為半徑畫(huà)圓,構(gòu)造一個(gè)覆蓋用以覆蓋同類(lèi)樣本,然后再以異類(lèi)樣本為
5、中心,以相同方式構(gòu)造覆蓋,如此這樣交叉進(jìn)行。我們根據(jù)數(shù)據(jù)特點(diǎn),實(shí)驗(yàn)分別構(gòu)造了兩種數(shù)據(jù)集(完全集和平衡集),設(shè)計(jì)了該方法和傳統(tǒng)的機(jī)器學(xué)習(xí)算法(SVM,ME)在兩種數(shù)據(jù)集上的實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果顯示該算法在兩種數(shù)據(jù)集上的結(jié)果是有效的,可行的。最后給出幾種算法在兩個(gè)復(fù)合物上相互作用位點(diǎn)定位的實(shí)例,進(jìn)一步說(shuō)明該算法對(duì)未知蛋白質(zhì)相互作用位點(diǎn)具有較強(qiáng)的適應(yīng)性和預(yù)測(cè)能力。
2.可用于蛋白質(zhì)相互作用位點(diǎn)預(yù)測(cè)的特征非常之多,不同的研究者使用不同的
6、特征組合從而得到不同的結(jié)果。由于各種特征從不同角度對(duì)蛋白質(zhì)相互作用位點(diǎn)預(yù)測(cè)提供的信息都不盡相同,其中一些特征對(duì)分類(lèi)器的預(yù)測(cè)能力毫無(wú)作用,甚至可能會(huì)降低預(yù)測(cè)結(jié)果。因此,我們針對(duì)蛋白質(zhì)相互作用位點(diǎn)預(yù)測(cè)的特征選擇問(wèn)題,提出了一種新的基于遺傳算法(GA)和支持向量機(jī)(SVM)相組合的特征提取算法。該算法利用GA 從原始基本特征所組成的110維蛋白質(zhì)序列向量中提取出相對(duì)重要的68種特征,同時(shí)對(duì)提取出的特征采用SVM 進(jìn)行評(píng)估。我們將個(gè)體的適應(yīng)度評(píng)
7、價(jià)指標(biāo)設(shè)置為算法分類(lèi)能力的敏感度和特異度的均衡值F1-measure,這有利于尋找出對(duì)分類(lèi)器各種性能指標(biāo)相均衡的特征組合。實(shí)驗(yàn)分別設(shè)計(jì)了隨機(jī)分類(lèi)器、兩階段分類(lèi)器、SVM和GA/SVM分類(lèi)器。實(shí)驗(yàn)結(jié)果表明,這種基于GA/SVM 特征提取算法的蛋白質(zhì)相互作用位點(diǎn)預(yù)測(cè)方法具有較好的魯棒性,取得了比原始特征和其它方法更好的性能。
3.蛋白質(zhì)相互作用預(yù)測(cè)的一個(gè)關(guān)鍵問(wèn)題是如何有效地轉(zhuǎn)換相互作用的蛋白質(zhì)序列對(duì)信息,因?yàn)椴煌牡鞍踪|(zhì)序列信
8、息轉(zhuǎn)換方法所表達(dá)的信息量會(huì)大不相同,由此產(chǎn)生不同的分類(lèi)性能。為此,我們提出了一種稱(chēng)為氨基酸排序信息的蛋白質(zhì)序列轉(zhuǎn)換方法(偽氨基酸組成,PseAA),這種方法不僅考慮到蛋白質(zhì)序列的基本氨基酸組成,同時(shí)也把氨基酸間的短程、中程和遠(yuǎn)程相互作用的影響放入蛋白質(zhì)序列信息表達(dá)中。實(shí)驗(yàn)采用SVM對(duì)新的蛋白質(zhì)序列編碼方案進(jìn)行學(xué)習(xí)和分類(lèi),同時(shí)為了與其它方法進(jìn)行性能比較,實(shí)驗(yàn)也設(shè)計(jì)了另外三種轉(zhuǎn)換方法,相關(guān)系數(shù)變換(CC)、自協(xié)方差表達(dá)變換(AC)和氨基酸組
9、成(AAC)。實(shí)驗(yàn)結(jié)果表明,我們提出的序列編碼方案的分類(lèi)性能在四種方法中居于第二,四種方法中AC 方法變換所產(chǎn)生的維數(shù)最高,達(dá)到了840;CC 方法次之,為420;AAC 方法最低,僅為40;我們提出的方法維數(shù)也只有100。因此,綜合其性能和所需的代價(jià),我們提出的蛋白質(zhì)相互作用序列轉(zhuǎn)換方法是有效的,可行的。
4.蛋白質(zhì)相互作用預(yù)測(cè)僅僅是從蛋白質(zhì)層次進(jìn)行研究,而生命體的各種功能都與其細(xì)胞內(nèi)蛋白質(zhì)形成的相互作用網(wǎng)絡(luò)調(diào)控相關(guān)。為
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于序列的蛋白質(zhì)相互作用預(yù)測(cè)方法研究.pdf
- 蛋白質(zhì)相互作用預(yù)測(cè)方法的研究.pdf
- 13608.基于進(jìn)化計(jì)算的蛋白質(zhì)相互作用預(yù)測(cè)方法研究
- 蛋白質(zhì)-蛋白質(zhì)相互作用界面和熱點(diǎn)預(yù)測(cè)的方法研究.pdf
- 基于蛋白質(zhì)相互作用網(wǎng)絡(luò)的蛋白質(zhì)功能預(yù)測(cè).pdf
- 15854.蛋白質(zhì)相互作用預(yù)測(cè)方法研究
- 蛋白質(zhì)相互作用位點(diǎn)預(yù)測(cè)方法研究.pdf
- 基于貝葉斯方法的蛋白質(zhì)相互作用預(yù)測(cè)研究.pdf
- 用生物統(tǒng)計(jì)方法預(yù)測(cè)蛋白質(zhì)相互作用.pdf
- 基于信噪比的蛋白質(zhì)相互作用的預(yù)測(cè)研究.pdf
- 蛋白質(zhì)相互作用界面熱點(diǎn)殘基的預(yù)測(cè)研究方法.pdf
- 從蛋白質(zhì)相互作用網(wǎng)絡(luò)預(yù)測(cè)未知蛋白質(zhì)功能.pdf
- 基于蛋白質(zhì)相互作用網(wǎng)絡(luò)及聚類(lèi)算法的蛋白質(zhì)功能預(yù)測(cè)方法研究.pdf
- 蛋白質(zhì)相互作用
- 基于序列的蛋白質(zhì)-藥物相互作用預(yù)測(cè)研究.pdf
- 基于蛋白質(zhì)相互作用網(wǎng)絡(luò)的代謝pathway預(yù)測(cè).pdf
- 蛋白質(zhì)相互作用及其位點(diǎn)的預(yù)測(cè)方法研究.pdf
- 改進(jìn)的蛋白質(zhì)相互作用位點(diǎn)預(yù)測(cè)方法研究.pdf
- 基于機(jī)器學(xué)習(xí)的蛋白質(zhì)類(lèi)別及蛋白質(zhì)-配體相互作用預(yù)測(cè)研究.pdf
- 基于pairwise核的蛋白質(zhì)相互作用對(duì)稱(chēng)預(yù)測(cè)研究.pdf
評(píng)論
0/150
提交評(píng)論