

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、隨著人類基因組計劃的勝利完成,蛋白質(zhì)的結(jié)構(gòu)和功能預(yù)測已經(jīng)成為當今計算生物學(xué)研究面臨的最重要的挑戰(zhàn)之一。如何由蛋白質(zhì)的氨基酸序列預(yù)測蛋白質(zhì)的三維結(jié)構(gòu),這個問題不僅具有重大的科學(xué)意義,而且在醫(yī)學(xué)和生物工程領(lǐng)域都具有極大的應(yīng)用價值,對揭示人類生命的奧秘將產(chǎn)生深遠的影響。目前,已發(fā)展的預(yù)測技術(shù)大多是基于知識的數(shù)據(jù)挖掘和機器學(xué)習(xí)等方法,使用結(jié)構(gòu)片段作為構(gòu)建模塊,再進行蛋白質(zhì)片段的組裝。但事實上,有限數(shù)量的構(gòu)建模塊具有一定的離散屬性,是不能覆蓋蛋白
2、質(zhì)整個結(jié)構(gòu)構(gòu)象空間的。在搜索蛋白質(zhì)構(gòu)象空間時也存在著采樣瓶頸,特別是在連續(xù)的蛋白質(zhì)骨架角度空間,從而導(dǎo)致預(yù)測精度的丟失。因此,如何對待和處理蛋白質(zhì)局部結(jié)構(gòu)片段,正確識別和采樣這些局部片段的骨架構(gòu)象,將是進一步提高蛋白質(zhì)結(jié)構(gòu)預(yù)測精度的關(guān)鍵問題。本文聚焦在蛋白質(zhì)局部結(jié)構(gòu)基序片段的預(yù)測,通過對其兩個重要結(jié)構(gòu)屬性:骨架扭轉(zhuǎn)角BTA和溶液可及區(qū)域RSA的建模與真值預(yù)測,成功地構(gòu)造出基序片段的結(jié)構(gòu)構(gòu)象。再以基序片段的構(gòu)象采樣作為組裝蛋白質(zhì)三級結(jié)構(gòu)的
3、基礎(chǔ),形成了一個較為完整的片段識別定位與預(yù)測系統(tǒng),和對結(jié)構(gòu)屬性預(yù)測的集成整合系統(tǒng)。本文通過研究蛋白質(zhì)骨架扭轉(zhuǎn)角對(Φ,ψ)的分布特性,提出了BTA的二變量余弦分布混合模型,和用于蛋白質(zhì)結(jié)構(gòu)屬性預(yù)測的改進的HMM模型。在模型的應(yīng)用中,設(shè)計了一個回溯動態(tài)規(guī)劃采樣算法,用以采樣得到蛋白質(zhì)基序片段的結(jié)構(gòu)構(gòu)象。并在此基礎(chǔ)上,建議了一個蛋白質(zhì)局部片段的識別與預(yù)測系統(tǒng),用于蛋白質(zhì)基序模式的識別與定位,以及識別出來的基序建模與預(yù)測。提出了一種可變長度滑
4、動窗口掃描算法用于結(jié)構(gòu)基序片段的辨識。最后,對使用的HMM模型做了進一步的改進,開發(fā)了一個集成的蛋白質(zhì)局部結(jié)構(gòu)屬性真值預(yù)測系統(tǒng),同時得到基序片段的兩種結(jié)構(gòu)屬性RSA和BTA的真值。主要研究內(nèi)容包括:
⑴針對蛋白質(zhì)基序片段的結(jié)構(gòu)特性,提出了一個用于蛋白質(zhì)結(jié)構(gòu)屬性預(yù)測的改進的隱馬爾可夫HMM模型,更好地抓住局部結(jié)構(gòu)的偏好性。該模型為蛋白質(zhì)的每種結(jié)構(gòu)屬性建立了一種狀態(tài)。模型的每個隱節(jié)點代表了基序片段鏈中一個殘基的特定位置,密切聯(lián)系著
5、四類發(fā)散節(jié)點各自一定的概率分布。解決了該改進模型的評估、解碼、學(xué)習(xí)等幾個主要問題,并給出了相應(yīng)的算法。根據(jù)骨架扭轉(zhuǎn)角BTA和溶液可及區(qū)域RSA相應(yīng)的概率分布,改進的HMM模型能很好地抓住基序片段中相鄰殘基之間這兩個結(jié)構(gòu)屬性的關(guān)聯(lián)性和依賴性。
⑵針對蛋白質(zhì)基序片段骨架扭轉(zhuǎn)角(Φ,ψ)的偏好信息及分布特性,提出了一個二變量余弦分布混合模型,對每個殘基(Φ,ψ)的角度關(guān)聯(lián)性進行建模,并使用一個期望值最大化(EM)算法,得到其混合模型
6、的參數(shù)估計。用連續(xù)的方向統(tǒng)計分布來描述骨架扭轉(zhuǎn)角對(Φ,ψ)的概率密度函數(shù),而不是將角度劃分成多個區(qū)間狀態(tài),這種類似自然結(jié)構(gòu)的表達避免了其他傳統(tǒng)方法所采用的角度離散化。在一個連續(xù)的(Φ,ψ)空間中,用一個雙面角對(Φ,ψ)的序列來描述蛋白質(zhì)基序片段的骨架構(gòu)象,并使用改進的HMM模型和回溯動態(tài)規(guī)劃采樣算法,確保了一個無偏的蛋白質(zhì)空間構(gòu)象采樣。
?、轻槍?gòu)建模塊BBs的離散屬性與蛋白質(zhì)骨架構(gòu)象的連續(xù)特性不一致的問題,提出了一個基于H
7、MM模型的概率構(gòu)象采樣方法,將局部蛋白質(zhì)氨基酸序列和其相應(yīng)的二級結(jié)構(gòu)信息作為模型的混合輸入,在一個連續(xù)的(Φ,ψ)空間中采樣片段的骨架結(jié)構(gòu)構(gòu)象。同時,設(shè)計了一種新的回溯動態(tài)規(guī)劃采樣算法應(yīng)用到這個HMM模型,用以抓住蛋白質(zhì)基序片段鏈中相鄰兩個殘基之間結(jié)構(gòu)屬性的所有依賴關(guān)系。建議的方法能重復(fù)采樣骨架片段的一些類似自然的結(jié)構(gòu)構(gòu)象,較好地解決了在連續(xù)的(Φ,ψ)空間中搜索蛋白質(zhì)構(gòu)象時存在的瓶頸。在模型的最優(yōu)路徑上,一些知名的蛋白質(zhì)結(jié)構(gòu)基序片段能
8、被很好地重現(xiàn)。
?、柔槍Φ鞍踪|(zhì)結(jié)構(gòu)預(yù)測中局部結(jié)構(gòu)片段組裝的流程,提出了一個蛋白質(zhì)局部片段識別定位與預(yù)測系統(tǒng),以遵循蛋白質(zhì)結(jié)構(gòu)拓撲的等級層次組織。該系統(tǒng)沿著蛋白質(zhì)氨基酸序列搜索和定位其中的結(jié)構(gòu)基序片段,并在連續(xù)的構(gòu)象空間采樣其相應(yīng)的骨架扭轉(zhuǎn)角(Φ,ψ),從而構(gòu)造基序片段的結(jié)構(gòu)構(gòu)象,用以蛋白質(zhì)三級結(jié)構(gòu)的組裝??蚣艽篌w上分兩個部分:蛋白質(zhì)基序片段的識別與定位,辨識出來的基序建模與預(yù)測。在識別過程中,設(shè)計了一種可變長度滑動窗口掃描算法用
9、于結(jié)構(gòu)基序片段的辨識?;瑒哟翱诘拈L度變化從最小值7到最大值19不等,待測序列片段與82種標準模式中的每一個且長度相同的基序模式進行比對、匹配。這個系統(tǒng)可以作為獲得更好蛋白質(zhì)三級結(jié)構(gòu)預(yù)測服務(wù)的基礎(chǔ)。
⑸針對蛋白質(zhì)多數(shù)結(jié)構(gòu)屬性是連續(xù)變量的特性,開發(fā)了一個集成的蛋白質(zhì)局部結(jié)構(gòu)屬性的真值預(yù)測系統(tǒng),同時預(yù)測基序片段的兩種結(jié)構(gòu)屬性溶液可及區(qū)域RSA真值和骨架扭轉(zhuǎn)角BTA的真值,以代替將結(jié)構(gòu)屬性分類成幾個定義狀態(tài)的預(yù)測。并對之前的HMM模型
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于框架庫的蛋白質(zhì)局部結(jié)構(gòu)預(yù)測.pdf
- 蛋白質(zhì)結(jié)構(gòu)預(yù)測方法研究.pdf
- 基于同源建模的蛋白質(zhì)結(jié)構(gòu)預(yù)測方法的研究.pdf
- 基于統(tǒng)計建模方法的蛋白質(zhì)結(jié)構(gòu)預(yù)測研究.pdf
- 基于多肽片段中央氨基酸裝配的蛋白質(zhì)結(jié)構(gòu)預(yù)測.pdf
- 蛋白質(zhì)結(jié)構(gòu)預(yù)測新方法的研究.pdf
- 蛋白質(zhì)結(jié)構(gòu)預(yù)測方法學(xué)研究.pdf
- 無序蛋白質(zhì)結(jié)構(gòu)預(yù)測方法研究.pdf
- 基于空間約束的蛋白質(zhì)結(jié)構(gòu)預(yù)測方法概述
- 基于多視角特征融合的蛋白質(zhì)屬性預(yù)測.pdf
- 基于蛋白質(zhì)網(wǎng)絡(luò)與蛋白質(zhì)功能的關(guān)鍵蛋白質(zhì)預(yù)測研究.pdf
- 2359.基于概率圖模型hmm的蛋白質(zhì)二級結(jié)構(gòu)預(yù)測
- 蛋白質(zhì)結(jié)構(gòu)預(yù)測
- 基于多信息融合的蛋白質(zhì)結(jié)構(gòu)類預(yù)測方法研究.pdf
- 蛋白質(zhì)結(jié)構(gòu)預(yù)測模型的研究.pdf
- 蛋白質(zhì)結(jié)構(gòu)預(yù)測模型優(yōu)化方法研究.pdf
- 蛋白質(zhì)-蛋白質(zhì)復(fù)合物結(jié)構(gòu)預(yù)測.pdf
- 基于氨基酸序列的蛋白質(zhì)結(jié)構(gòu)功能預(yù)測方法研究.pdf
- 蛋白質(zhì)二級結(jié)構(gòu)預(yù)測方法研究.pdf
- 從頭預(yù)測蛋白質(zhì)結(jié)構(gòu)元啟發(fā)方法研究.pdf
評論
0/150
提交評論