版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著人類基因組計(jì)劃的勝利完成,蛋白質(zhì)的結(jié)構(gòu)和功能預(yù)測(cè)已經(jīng)成為當(dāng)今計(jì)算生物學(xué)研究面臨的最重要的挑戰(zhàn)之一。如何由蛋白質(zhì)的氨基酸序列預(yù)測(cè)蛋白質(zhì)的三維結(jié)構(gòu),這個(gè)問(wèn)題不僅具有重大的科學(xué)意義,而且在醫(yī)學(xué)和生物工程領(lǐng)域都具有極大的應(yīng)用價(jià)值,對(duì)揭示人類生命的奧秘將產(chǎn)生深遠(yuǎn)的影響。目前,已發(fā)展的預(yù)測(cè)技術(shù)大多是基于知識(shí)的數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)等方法,使用結(jié)構(gòu)片段作為構(gòu)建模塊,再進(jìn)行蛋白質(zhì)片段的組裝。但事實(shí)上,有限數(shù)量的構(gòu)建模塊具有一定的離散屬性,是不能覆蓋蛋白
2、質(zhì)整個(gè)結(jié)構(gòu)構(gòu)象空間的。在搜索蛋白質(zhì)構(gòu)象空間時(shí)也存在著采樣瓶頸,特別是在連續(xù)的蛋白質(zhì)骨架角度空間,從而導(dǎo)致預(yù)測(cè)精度的丟失。因此,如何對(duì)待和處理蛋白質(zhì)局部結(jié)構(gòu)片段,正確識(shí)別和采樣這些局部片段的骨架構(gòu)象,將是進(jìn)一步提高蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)精度的關(guān)鍵問(wèn)題。本文聚焦在蛋白質(zhì)局部結(jié)構(gòu)基序片段的預(yù)測(cè),通過(guò)對(duì)其兩個(gè)重要結(jié)構(gòu)屬性:骨架扭轉(zhuǎn)角BTA和溶液可及區(qū)域RSA的建模與真值預(yù)測(cè),成功地構(gòu)造出基序片段的結(jié)構(gòu)構(gòu)象。再以基序片段的構(gòu)象采樣作為組裝蛋白質(zhì)三級(jí)結(jié)構(gòu)的
3、基礎(chǔ),形成了一個(gè)較為完整的片段識(shí)別定位與預(yù)測(cè)系統(tǒng),和對(duì)結(jié)構(gòu)屬性預(yù)測(cè)的集成整合系統(tǒng)。本文通過(guò)研究蛋白質(zhì)骨架扭轉(zhuǎn)角對(duì)(Φ,ψ)的分布特性,提出了BTA的二變量余弦分布混合模型,和用于蛋白質(zhì)結(jié)構(gòu)屬性預(yù)測(cè)的改進(jìn)的HMM模型。在模型的應(yīng)用中,設(shè)計(jì)了一個(gè)回溯動(dòng)態(tài)規(guī)劃采樣算法,用以采樣得到蛋白質(zhì)基序片段的結(jié)構(gòu)構(gòu)象。并在此基礎(chǔ)上,建議了一個(gè)蛋白質(zhì)局部片段的識(shí)別與預(yù)測(cè)系統(tǒng),用于蛋白質(zhì)基序模式的識(shí)別與定位,以及識(shí)別出來(lái)的基序建模與預(yù)測(cè)。提出了一種可變長(zhǎng)度滑
4、動(dòng)窗口掃描算法用于結(jié)構(gòu)基序片段的辨識(shí)。最后,對(duì)使用的HMM模型做了進(jìn)一步的改進(jìn),開發(fā)了一個(gè)集成的蛋白質(zhì)局部結(jié)構(gòu)屬性真值預(yù)測(cè)系統(tǒng),同時(shí)得到基序片段的兩種結(jié)構(gòu)屬性RSA和BTA的真值。主要研究?jī)?nèi)容包括:
?、裴槍?duì)蛋白質(zhì)基序片段的結(jié)構(gòu)特性,提出了一個(gè)用于蛋白質(zhì)結(jié)構(gòu)屬性預(yù)測(cè)的改進(jìn)的隱馬爾可夫HMM模型,更好地抓住局部結(jié)構(gòu)的偏好性。該模型為蛋白質(zhì)的每種結(jié)構(gòu)屬性建立了一種狀態(tài)。模型的每個(gè)隱節(jié)點(diǎn)代表了基序片段鏈中一個(gè)殘基的特定位置,密切聯(lián)系著
5、四類發(fā)散節(jié)點(diǎn)各自一定的概率分布。解決了該改進(jìn)模型的評(píng)估、解碼、學(xué)習(xí)等幾個(gè)主要問(wèn)題,并給出了相應(yīng)的算法。根據(jù)骨架扭轉(zhuǎn)角BTA和溶液可及區(qū)域RSA相應(yīng)的概率分布,改進(jìn)的HMM模型能很好地抓住基序片段中相鄰殘基之間這兩個(gè)結(jié)構(gòu)屬性的關(guān)聯(lián)性和依賴性。
?、漆槍?duì)蛋白質(zhì)基序片段骨架扭轉(zhuǎn)角(Φ,ψ)的偏好信息及分布特性,提出了一個(gè)二變量余弦分布混合模型,對(duì)每個(gè)殘基(Φ,ψ)的角度關(guān)聯(lián)性進(jìn)行建模,并使用一個(gè)期望值最大化(EM)算法,得到其混合模型
6、的參數(shù)估計(jì)。用連續(xù)的方向統(tǒng)計(jì)分布來(lái)描述骨架扭轉(zhuǎn)角對(duì)(Φ,ψ)的概率密度函數(shù),而不是將角度劃分成多個(gè)區(qū)間狀態(tài),這種類似自然結(jié)構(gòu)的表達(dá)避免了其他傳統(tǒng)方法所采用的角度離散化。在一個(gè)連續(xù)的(Φ,ψ)空間中,用一個(gè)雙面角對(duì)(Φ,ψ)的序列來(lái)描述蛋白質(zhì)基序片段的骨架構(gòu)象,并使用改進(jìn)的HMM模型和回溯動(dòng)態(tài)規(guī)劃采樣算法,確保了一個(gè)無(wú)偏的蛋白質(zhì)空間構(gòu)象采樣。
?、轻槍?duì)構(gòu)建模塊BBs的離散屬性與蛋白質(zhì)骨架構(gòu)象的連續(xù)特性不一致的問(wèn)題,提出了一個(gè)基于H
7、MM模型的概率構(gòu)象采樣方法,將局部蛋白質(zhì)氨基酸序列和其相應(yīng)的二級(jí)結(jié)構(gòu)信息作為模型的混合輸入,在一個(gè)連續(xù)的(Φ,ψ)空間中采樣片段的骨架結(jié)構(gòu)構(gòu)象。同時(shí),設(shè)計(jì)了一種新的回溯動(dòng)態(tài)規(guī)劃采樣算法應(yīng)用到這個(gè)HMM模型,用以抓住蛋白質(zhì)基序片段鏈中相鄰兩個(gè)殘基之間結(jié)構(gòu)屬性的所有依賴關(guān)系。建議的方法能重復(fù)采樣骨架片段的一些類似自然的結(jié)構(gòu)構(gòu)象,較好地解決了在連續(xù)的(Φ,ψ)空間中搜索蛋白質(zhì)構(gòu)象時(shí)存在的瓶頸。在模型的最優(yōu)路徑上,一些知名的蛋白質(zhì)結(jié)構(gòu)基序片段能
8、被很好地重現(xiàn)。
⑷針對(duì)蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)中局部結(jié)構(gòu)片段組裝的流程,提出了一個(gè)蛋白質(zhì)局部片段識(shí)別定位與預(yù)測(cè)系統(tǒng),以遵循蛋白質(zhì)結(jié)構(gòu)拓?fù)涞牡燃?jí)層次組織。該系統(tǒng)沿著蛋白質(zhì)氨基酸序列搜索和定位其中的結(jié)構(gòu)基序片段,并在連續(xù)的構(gòu)象空間采樣其相應(yīng)的骨架扭轉(zhuǎn)角(Φ,ψ),從而構(gòu)造基序片段的結(jié)構(gòu)構(gòu)象,用以蛋白質(zhì)三級(jí)結(jié)構(gòu)的組裝??蚣艽篌w上分兩個(gè)部分:蛋白質(zhì)基序片段的識(shí)別與定位,辨識(shí)出來(lái)的基序建模與預(yù)測(cè)。在識(shí)別過(guò)程中,設(shè)計(jì)了一種可變長(zhǎng)度滑動(dòng)窗口掃描算法用
9、于結(jié)構(gòu)基序片段的辨識(shí)?;瑒?dòng)窗口的長(zhǎng)度變化從最小值7到最大值19不等,待測(cè)序列片段與82種標(biāo)準(zhǔn)模式中的每一個(gè)且長(zhǎng)度相同的基序模式進(jìn)行比對(duì)、匹配。這個(gè)系統(tǒng)可以作為獲得更好蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè)服務(wù)的基礎(chǔ)。
?、舍槍?duì)蛋白質(zhì)多數(shù)結(jié)構(gòu)屬性是連續(xù)變量的特性,開發(fā)了一個(gè)集成的蛋白質(zhì)局部結(jié)構(gòu)屬性的真值預(yù)測(cè)系統(tǒng),同時(shí)預(yù)測(cè)基序片段的兩種結(jié)構(gòu)屬性溶液可及區(qū)域RSA真值和骨架扭轉(zhuǎn)角BTA的真值,以代替將結(jié)構(gòu)屬性分類成幾個(gè)定義狀態(tài)的預(yù)測(cè)。并對(duì)之前的HMM模型
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于框架庫(kù)的蛋白質(zhì)局部結(jié)構(gòu)預(yù)測(cè).pdf
- 蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法研究.pdf
- 基于同源建模的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法的研究.pdf
- 基于統(tǒng)計(jì)建模方法的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)研究.pdf
- 基于多肽片段中央氨基酸裝配的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè).pdf
- 蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)新方法的研究.pdf
- 蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法學(xué)研究.pdf
- 無(wú)序蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法研究.pdf
- 基于空間約束的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法概述
- 基于多視角特征融合的蛋白質(zhì)屬性預(yù)測(cè).pdf
- 基于蛋白質(zhì)網(wǎng)絡(luò)與蛋白質(zhì)功能的關(guān)鍵蛋白質(zhì)預(yù)測(cè)研究.pdf
- 2359.基于概率圖模型hmm的蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)
- 蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)
- 基于多信息融合的蛋白質(zhì)結(jié)構(gòu)類預(yù)測(cè)方法研究.pdf
- 蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)模型的研究.pdf
- 蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)模型優(yōu)化方法研究.pdf
- 蛋白質(zhì)-蛋白質(zhì)復(fù)合物結(jié)構(gòu)預(yù)測(cè).pdf
- 基于氨基酸序列的蛋白質(zhì)結(jié)構(gòu)功能預(yù)測(cè)方法研究.pdf
- 蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)方法研究.pdf
- 從頭預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)元啟發(fā)方法研究.pdf
評(píng)論
0/150
提交評(píng)論