RNA二級結(jié)構(gòu)預(yù)測算法的研究.pdf_第1頁
已閱讀1頁,還剩100頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、RNA(Ribonucleic Acid,RNA)分子在生物細(xì)胞中不僅充當(dāng)著遺傳信息的載體和傳遞工具,還具有催化RNA的剪接,加工和修飾RNA前體,調(diào)控基因表達(dá)和生物體的生長發(fā)育等一系列重要的功能,而功能與結(jié)構(gòu)是密切相關(guān)的,因此對RNA分子結(jié)構(gòu)的研究就成為分子生物學(xué)的一個重要領(lǐng)域。由于RNA分子具有降解速度快,難以結(jié)晶等特點,通過X射線晶體衍射和核磁共振等實驗方法去測定RNA分子的立體結(jié)構(gòu)花費(fèi)的成本高、時間長,雖然測得的結(jié)果精確可靠,可

2、是面對當(dāng)前海量的生物序列,實驗方法顯然跟不上要求,因此RNA二級結(jié)構(gòu)預(yù)測就成為研究RNA分子結(jié)構(gòu)的主要手段。RNA二級結(jié)構(gòu)預(yù)測是指借助于計算機(jī)手段和各種數(shù)學(xué)方法從理論上去預(yù)測RNA的空間結(jié)構(gòu),可為揭示RNA結(jié)構(gòu)與功能的關(guān)系提供重要信息,大大提高認(rèn)識RNA空間結(jié)構(gòu)的效率。
   論文對目前主流的RNA二級結(jié)構(gòu)預(yù)測算法的理論和實現(xiàn)方法進(jìn)行了細(xì)致的研究。通過對基于熱力學(xué)的預(yù)測方法(包括Zuker的最小自由能算法、遺傳模擬退火算法、Ho

3、pfield神經(jīng)網(wǎng)絡(luò)方法、免疫粒子群算法)和比較序列分析方法(協(xié)同變異預(yù)測模型、隨機(jī)上下文無關(guān)語法預(yù)測)以及基于機(jī)器學(xué)習(xí)的分類預(yù)測方法的分析,對這些算法存在的優(yōu)缺點進(jìn)行了比較研究,總結(jié)出了RNA結(jié)構(gòu)預(yù)測方法發(fā)展的趨勢和要求,為本文的預(yù)測算法奠定了理論和實驗基礎(chǔ)。
   首先論文分析了人工魚群智能算法在優(yōu)化問題中的優(yōu)勢和不足,并針對基本人工魚群算法在解決離散問題的過程中存在的的缺陷進(jìn)行了相應(yīng)改進(jìn),首次將魚群算法應(yīng)用到RNA二級結(jié)構(gòu)

4、預(yù)測問題中,建立了一種基于人工魚群算法的最小自由能算法模型。在對算法編碼實現(xiàn)時,采用集合表示狀態(tài)點,能有效地縮小搜索空間,有利于算法在較短時間內(nèi)找到目標(biāo)解。仿真實驗與傳統(tǒng)的基于最小自由能的相關(guān)算法進(jìn)行了比較研究,結(jié)果表明,使用改進(jìn)魚群算法進(jìn)行RNA序列的二級結(jié)構(gòu)預(yù)測能獲得較理想的預(yù)測效果,能有效減少計算量、節(jié)省計算時間,特別當(dāng)待測序列長度大于500時,魚群算法在收斂速度上有著較明顯優(yōu)勢。
   其次,研究了粒子群優(yōu)化算法在組合優(yōu)

5、化問題中的應(yīng)用背景,針對基本粒子群算法的早熟收斂,容易陷入局部最優(yōu)且搜索精度不高等缺點,進(jìn)行了相應(yīng)的改進(jìn),提出了局部精英粒子群算法,在該算法中,通過改變粒子的鄰居拓?fù)浣Y(jié)構(gòu),使每個粒子擁有固定的局部鄰居,每次迭代都會根據(jù)自身在鄰居中的地位和狀態(tài)以及歷史最優(yōu)值來調(diào)整下一步的狀態(tài)。由于有效地保持粒子的多樣性,使得算法有較好地跳出局部極值的特性。
   本文根據(jù)局部精英粒子群算法的思想構(gòu)建了一套基于最小自由能思想的RNA二級結(jié)構(gòu)預(yù)測模型

6、。在對算法進(jìn)行編碼時,使用集合來表示粒子的狀態(tài),巧妙地將粒子運(yùn)動的速度和狀態(tài)函數(shù)使用集合之間的運(yùn)算來重載,避免了傳統(tǒng)粒子群算法參數(shù)選擇的煩惱。實驗數(shù)據(jù)有力地支持了改進(jìn)后的粒子群算法和新的粒子運(yùn)動狀態(tài)編碼方式。
   第三,通過擴(kuò)展NSSEL(New Secondary Structure Element Labels,NSSEL)標(biāo)簽,創(chuàng)建了一套能夠描述偽結(jié)結(jié)構(gòu)信息的eNSSEL(extended NSSEL,eNSSEL)標(biāo)簽

7、。一條RNA分子序列中的所有堿基都可以使用eNSSEL標(biāo)簽進(jìn)行標(biāo)記,從另一個角度來理解,即:任意一個堿基都可以被分類為某一個標(biāo)簽,因此,一條原始的RNA分子序列能與一條eNSSEL標(biāo)簽序列一一對應(yīng)。由于eNSSEL標(biāo)簽攜帶了結(jié)構(gòu)信息,因此,對于某一個RNA分子而言,只要得到其對應(yīng)的標(biāo)簽序列,就可以知道其二級結(jié)構(gòu)的組成。根據(jù)該思想,建立了基于SVMs(support vector machines,SVMs)的分類預(yù)測模型。該模型通過有效

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論