基于計算智能的蛋白質三級結構預測.pdf_第1頁
已閱讀1頁,還剩60頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、蛋白質三級結構預測是由氨基酸序列預測蛋白質三級結構的過程。蛋白質結構預測的基本假設是蛋白質三級結構由其氨基酸序列唯一決定。研究蛋白質的結構意義重大,不但有助于了解蛋白質的作用,了解蛋白質如何行使其生物功能,認識蛋白質與蛋白質之間的相互作用,而且對生物學、醫(yī)學和藥學都有非常重要的作用。歷時十年的人類基因組計劃產生了海量的生物序列數(shù)據(jù),蛋白質序列數(shù)據(jù)與結構數(shù)據(jù)數(shù)量之間的差距越來越大,所以蛋白質結構預測變得日益緊迫和重要。
   本文

2、所要研究的是如何構建一個蛋白質三級結構預測模型,使之能夠更加準確有效的預測氨基酸對應的蛋白質三級結構。內容包括氨基酸序列的特征提取方式,神經(jīng)網(wǎng)絡結構設計及智能優(yōu)化算法的選擇。
   一、氨基酸序列特征提取。要對蛋白質結構進行預測,首先必須把氨基酸序列中的信息提取出來,轉換成計算機可以處理的數(shù)據(jù),即進行特征提取。選擇何種提取方式非常關鍵,不同的特征提取出的信息大不相同,現(xiàn)在的方法主要有氨基酸組成模型(AA)、二肽組成模型、多肽組成

3、模型、偽氨基酸組成(PseAA)、多特征融合、基于氨基酸物理化學性質等,從不同角度對氨基酸特征進行提取。本文采用了以上各種特征提取方式并進行了特征融合。實驗表明,不同的特征提取方式對于不同的數(shù)據(jù)集和分類模型效果不同。
   二、分類模型的建立。蛋白質三級結構預測實際上是根據(jù)提取出的有用信息,通過學習分析這些信息,總結出規(guī)律,實現(xiàn)對未知結構氨基酸序列的結構預測。對于蛋白質三級結構預測這種信息維數(shù)高,計算量大的問題,借助神經(jīng)網(wǎng)絡是非

4、常有效地。神經(jīng)網(wǎng)絡具有較強的自組織、自學習、自適應能力,能夠快速學習到序列中包含的特征,實現(xiàn)對結構的預測。而對于網(wǎng)絡,包括結構的優(yōu)化和參數(shù)的優(yōu)化兩部分。選擇何種優(yōu)化算法是至關重要的,不同的算法會產生不同的時間效率,不同的算法對應不同的預測正確率。本文中將對各種不同的優(yōu)化算法進行比較,選擇出更適合的優(yōu)化算法。實驗表明,參數(shù)優(yōu)化采用粒子群優(yōu)化算法(PSO)能取得較好的效果。BP神經(jīng)網(wǎng)絡在蛋白質三級結構預測中能大大提高預測準確率。針對蛋白質三

5、級結構預測這種多分類問題,本文提出將多類問題轉換成多個二分類問題的集成。通過試驗表明,單輸出方式比多輸出方式能有效的提高預測的正確率。為了尋找一種更優(yōu)的網(wǎng)絡結構,本文首次將靈活神經(jīng)樹( FNT)應用在蛋白質三級結構預測中,PSO對網(wǎng)絡參數(shù)進行優(yōu)化,概率增強式程序進化( PIPE)對網(wǎng)絡結構進行優(yōu)化。實驗表明,這種模型在預測25PDB這樣較大的蛋白質數(shù)據(jù)集中,效果理想。它不但解決了以前預測時只能提前固定網(wǎng)絡結構和采用試探法選擇隱層個數(shù)的問

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論