基于序列信息預測選擇性剪接位點和盒式外顯子.pdf_第1頁
已閱讀1頁,還剩82頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、真核生物基因序列包括編碼的外顯子序列和不編碼的內含子序列,在轉錄過程中內含子被切除,外顯子將有序的拼接在一起形成mRNA。而選擇性剪接使得一個基因序列有多種剪接方式,并能產生不同的mRNA,進而編碼多種蛋白質,選擇性剪接是蛋白質多樣性的重要來源。選擇性剪接普遍存在于真核生物基因組中,人類基因組中一半以上基因存在選擇性剪接,而且選擇性剪接存在于不同組織細胞和不同發(fā)育階段,貫穿整個生命過程,并與疾病密切相關。ESTs和微陣列實驗是目前確定選

2、擇性剪接事件的主要來源,但這些實驗方法操作復雜,并有很多不足之處。如何用理論和計算的方法識別和預測選擇性剪接是目前生物信息學研究工作的重要任務。 本文將基于基因組局部序列信息,用WebLogo、序列信息參量Mni和統(tǒng)計檢驗方法分析序列,并提取序列特征;用位置權重矩陣、離散增量、支持向量機和馬氏距離判別式對選擇性剪接事件進行了預測;并對剪接位點競爭機制和回文序列等選擇性剪接有關機制進行了進一步研究。論文主要研究內容如下:

3、1.首次運用位置權重矩陣和離散增量結合支持向量機的方法,基于序列信息預測分類了選擇性5'/3'剪接位點和假剪接位點。結果顯示,我們的方法特異性為85.62%(81.19%)時,能預測88.74%(90.86%)的選擇性5'(3')剪接位點。 2.基于剪接位點競爭機制,以序列特征為參數,用位置權重矩陣和離散增量結合支持向量機的方法預測了人類和小鼠的選擇性5'/3'剪接位點和組成性剪接位點。我們的方法可以對67.88%(71.63%

4、)的人類供體(受體)位點進行正確分類。供體位點的預測成功率接近目前最好的預測方法,受體位點的預測成功率高于目前最好的預測方法4~5%。并且我們的方法對小鼠選擇性5'/3'剪接位點預測成功率可達到72%,可知我們的方法預測性能好,并具有一定的普適性和推廣能力。 3.以位置權重矩陣打分函數值來表示剪接位點強度,以打分函數相減值來表示剪接位點競爭機制,并基于剪接位點競爭機制,以打分函數相減值為唯一參數,預測了選擇性5'/3'剪接位點。

5、預測成功率與目前最好的預測結果相當。預測結果證明我們找到了表示剪接位點競爭機制的一個最佳參數:打分函數相減值。 4.統(tǒng)計分析了盒式外顯子和組成性外顯子的序列長度、長度被3整除序列的比例、兩側剪接位點保守性等序列特征。用t檢驗方法統(tǒng)計計算了左側內含子序列、右側內含子序列和外顯子序列的三聯(lián)體組分信息,得到了CCT等差異顯著的三聯(lián)體。并基于上述序列特征用位置權重矩陣和離散增量結合支持向量機的方法,位置權重矩陣和離散增量結合馬氏距離的二次判別方

6、法對盒式外顯子進行了預測。兩種預測方法均約為60%。 5.統(tǒng)計了盒式外顯子兩側序列中的回文序列和兩側序列相互之間形成的回文序列,并與組成性外顯子和隨機序列的回文特征進行了比較。發(fā)現(xiàn)組成性外顯子回文密度高于盒式外顯子回文密度,并高于隨機序列回文密度2~3倍。此統(tǒng)計比較結果為選擇性剪接來源于組成性剪接的理論提供了又一個依據。 6.本文還統(tǒng)計了腫瘤特異性剪接位點的序列特征,運用位置權重矩陣和離散增量結合支持向量機的方法預測了腫

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論