蛋白質的β-發(fā)夾、β(γ)-轉角及四類簡單超二級結構預測.pdf_第1頁
已閱讀1頁,還剩87頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、由于蛋白質的功能與其結構是密切相關的,因此研究蛋白質的結構是獲取功能信息的重要手段。隨著人類基因組計劃的順利實施,蛋白質序列信息的積累速度遠快于蛋白質結構數(shù)據(jù)的增長速度。然而,通過實驗手段確定蛋白質的結構,不但成本高、耗時,而且實驗中還會遇到一些目前無法解決的技術困難,因此人們非常希望能利用理論計算的方法直接從序列信息預測蛋白質結構,這也是生物信息學研究的重要課題。 目前,直接從序列信息預測蛋白質的三級結構還很困難。由于局域結構

2、有著較強的序列信號,且在三級結構中大量存在、頻繁出現(xiàn),對蛋白質的折疊、識別和穩(wěn)定性起重要作用,因此,局域結構的預測可以簡化結構預測問題,是蛋白質三級結構預測重要的中間步驟。 本文主要研究蛋白質局域結構中超二級結構的預測,重點研究β-發(fā)夾模體的預測;研究了部分規(guī)則二級結構中β-轉角和γ-轉角的預測。 1.提出了一種新的預測算法-基于離散增量的支持向量機算法,用該算法首次對超二級結構數(shù)據(jù)庫(ArchDB40)中β-發(fā)夾模體進

3、行了預測,取得較好效果。 2.利用離散增量和序列打分值構成的向量來表示序列信息,將離散增量和打分值作為向量輸入支持向量機,在向量空間中尋找最優(yōu)超平面,提出了一種新的組合向量預測算法。該算法首次應用于β-發(fā)夾模體的預測,對ArchDB40超二級結構數(shù)據(jù)庫中β-發(fā)夾數(shù)據(jù)集和文獻(Kumar and Bhasin,Nucleic Acids Research,2005,33:154-159)中已有的β-發(fā)夾數(shù)據(jù)集的預測結果顯示,我們的

4、算法可以實現(xiàn)比以往方法更高的預測成功率。與文獻中已有數(shù)據(jù)集的預測結果相比,對獨立的檢驗集預測精度提高4%,β-發(fā)夾的敏感性提高6%。另外,將這種算法首次用于ArchDB40數(shù)據(jù)庫中的四類簡單超二級結構分類,無論是對5-交叉檢驗的訓練集,還是對獨立的檢驗集都取得較好分類結果。 3.在離散增量和序列打分值的基礎上,進一步把預測的二級結構信息加入組合向量,將它們共同輸入支持向量機,對普遍使用的,分別包含426個和320個蛋白質序列的兩

5、數(shù)據(jù)集中的部分規(guī)則二級結構β-轉角和γ-轉角進行了預測。結果指出,對β-轉角的7-交叉檢驗預測精度達到79.8%、相關系數(shù)為0.47;對γ-轉角5-交叉檢驗預測的相關系數(shù)達到了0.18,這些結果都是目前最好的預測結果。 4.建立了一個新的包括2208個非冗余蛋白質鏈的數(shù)據(jù)庫,蛋白質結構分辨率高于2.5(A°),序列相似性小于40%。得到α-α模體6799個,α-β模體6711個,β-α模體6072個和β-β模體8163個,首次將

6、最小離散增量算法用于蛋白質四類簡單超二級結構預測,當序列模式固定長取8個氨基酸殘基,對“822型”序列模式3-交叉檢驗的平均預測精度達到78%,Jack-knife檢驗的平均預測精度達到76.8%;當序列模式固定長取10個氨基酸殘基,對“1041型”序列模式3-交叉檢驗的平均預測精度達到83%,Jack-knife檢驗的平均預測精度達到79.8%。 5.在蛋白質簡單超二級結構分類預測、β-發(fā)夾預測、β-轉角預測及γ-轉角的預測工

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論