版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、蛋白質折疊問題被列為“21世紀的生物物理學”的重要課題,是分子生物學中心法則尚未解決的一個重大生物學問題。其中重要任務之一便是確定蛋白質折疊速率的決定因素,從而理解蛋白質的折疊機理。目前,人們普遍認為決定蛋白質折疊速率的因素主要來自于構成蛋白質的氨基酸序列和各級結構以及環(huán)境和溫度。我們認為,除此之外,決定蛋白質折疊速率的信息還來自于蛋白質編碼序列,它們在調節(jié)蛋白質折疊過程中起到重要作用。本文將探討編碼序列對蛋白質折疊速率的影響。
2、 蛋白質編碼序列不僅包含了編碼蛋白的遺傳語言,還包含了其它豐富的信息內容。這主要表現在密碼子的“擺尾”現象,即密碼子第三位點堿基使用的自由度問題。同義密碼子使用的作用之一是調節(jié)編碼序列的高級結構,而最普遍的高級結構單元是回文結構。已有研究表明一些特殊分布的回文結構具有非常重要的生物學功能,而且許多疾病與回文結構相關。所以對回文結構的構成進行全面深入的研究,是全面了解核酸序列信息功能的重要方面之一。另外,回文結構在一定程度上反映了m
3、RNA的序列信息和結構信息。若編碼序列對蛋白質折疊速率有影響的話,則應該在編碼序列的回文結構和同義密碼子使用中體現出來。基于這個思路,我們的主要研究內容如下:
1.在蛋白質層面上探究氨基酸片段的平均極性與蛋白質折疊速率的關系。以四種病毒(SARS病毒、艾滋病病毒、丙型肝炎病毒和乙型肝炎病毒)的蛋白質序列以及大腸桿菌60個蛋白酶的所有α螺旋和β折疊片段為研究對象,計算了各片段的折疊速率和平均極性,分別在各物種的α螺旋和β折疊
4、兩類二級結構片段中分析了折疊速率和平均極性的相關性。得到結論:不論是病毒蛋白質還是大腸桿菌中的蛋白酶,其中兩類氨基酸片段的平均極性與折疊速率都是極顯著相關的:對于所有的α片段,二者呈線性正相關;而對于所有的β片段,二者成線性負相關。結果證實了在蛋白質折疊中,氨基酸的極性起著非常重要的作用。
2.編碼序列中回文GC含量和回文密度對氨基酸片段平均極性和折疊速率之間關系的影響。定義了蛋白編碼序列片段的回文GC含量及回文密度兩參量
5、?;谝陨纤姆N病毒蛋白質序列的α螺旋片段及β折疊片段的折疊速率與其平均極性之間的相關性,分析了回文GC含量及回文密度對這一相關性的影響。發(fā)現這兩個參量確實對氨基酸片段折疊速率和平均極性之間的關系有影響。統(tǒng)計分析表明這兩個來自編碼序列的參量與氨基酸片段的平均極性無顯著關系。這間接說明相應編碼序列片段的回文GC含量及回文密度影響了蛋白質的折疊速度,且蛋白質折疊速率與回文兩參量之間均呈正相關。進一步分析表明影響的根源來自于回文結構的復雜性或可
6、變性和同義密碼子的使用偏好,而不是來自于從密碼子到氨基酸的翻譯信息。這說明蛋白質編碼序列確實攜帶有影響肽鏈折疊速率乃至蛋白質結構的信息。
3.為了從多個角度印證mRNA結構和序列對蛋白質折疊速率的影響,先選擇編碼序列的序列參數-GC含量來做初步分析?;贕romiha給出的13個全β類蛋白質,得到相應編碼序列的GC含量并將它加入到Gromiha基于蛋白質序列4個參數的預測折疊速率回歸方程中來檢驗GC含量在蛋白質折疊過程中的
7、作用。與Gromiha的結果比較,預測值和實驗值之間的相關系數提高了2%,即從Gromiha的0.96增加到0.98,總體方差從0.50降到0.27,卡方檢驗值從3.53(p=0.01)降到3.35(p=0.008)。結果表明GC含量對預測蛋白質折疊速率是有效的,意味著蛋白質編碼序列的GC含量確實對蛋白質折疊速率有影響。進一步分析也表明這種影響主要來自于密碼子的第三位點以及它與第二位點的關聯,而不是來自于從密碼子到氨基酸的翻譯信息。
8、r> 4.雖然加入編碼序列的GC含量后預測蛋白質折疊速率的結果有所改善,但回歸方程的Jackknife檢驗(GC含量參數項的p=0.087)結果表明通常的GC含量并未完全涵蓋編碼序列中影響蛋白質折疊速率的主要信息。我們分析,出現這樣結果是由于編碼序列的GC含量不能反映編碼序列的結構信息。于是,我們定義了一個既能涵蓋序列又能包含序列結構的一個參數,稱為回文GC含量。用編碼序列中的回文GC含量代替GC含量做同樣的分析。與Gromiha
9、的結果比較,蛋白質折疊速率的預測值與實驗值之間的相關系數提高了3%,即從Gromiha的0.96增加到0.99,總體方差從0.50降到0.24,卡方檢驗值從3.53(p=0.01)降到2.86(p=0.004),而且我們新的結果通過了Jackknife檢驗。這表明蛋白質編碼序列中回文GC含量對蛋白質折疊速率有更大的影響。意味著蛋白質編碼序列的結構和序列組成是影響蛋白質折疊速率的主要因素。進一步分析也表明這種影響一部分來自于回文結構的復雜
10、性和可變性,另一部分來自于同義密碼子的使用或者說是密碼子第三位堿基的使用。
5.選擇已知折疊速率的18個全α類蛋白,18個全β類蛋白和18個混合類蛋白作為研究對象,直接分析蛋白質折疊速率與相應編碼序列中同義密碼子的使用之間的相關性。結果發(fā)現,對于全α類蛋白,5個密碼子的使用與蛋白質的折疊速率顯著線性相關;對于全β類蛋白,8個密碼子的使用與蛋白質的折疊速率顯著線性相關;對于混合類蛋白,4個密碼子的使用與蛋白質的折疊速率顯著線
11、性相關。而且發(fā)現同一個密碼子的使用對不同類蛋白質折疊速率的影響是不同的。如谷氨酸Glu,對于全β類和混合類蛋白質,雖然同義密碼子GAG和GAA的使用與蛋白質折疊速率都顯著相關,但是兩個密碼子的使用對兩類蛋白質折疊速率影響的趨勢均是截然相反的。同樣,對于精氨酸Arg,同義密碼子CGC的使用對全α類和混合類兩類蛋白質折疊速率的影響趨勢也是相反的。
6.除了GC含量、回文GC含量和同義密碼子的使用參量之外,我們又選取了描述遺傳語
12、言詞匯組成的信息參數D1(一階信息冗余)、描述遺傳語言語法結構的信息參數D2(二階信息冗余)及其衍生的信息參數X(X=D2/(D1+D2))作為刻畫編碼序列的特征參數,并基于一個較大的蛋白質數據集分析它們與蛋白質折疊速率之間的線性關系。結果表明,對于二態(tài)蛋白質,D2和X這一參量組與全α蛋白和全β蛋白的折疊速率均有極顯著的相關性,尤其對于全α蛋白,相關系數達到0.84。而對于多態(tài)蛋白,蛋白質編碼序列的GC含量這一參量對蛋白質折疊速率的影響
13、較為突出,進一步分析表明對于這種GC含量的影響,其中一部分來自于密碼子的第三位點,又一次證實了同義密碼子的使用對蛋白質折疊速率的影響。
7.統(tǒng)計分析和比較了艾滋病病毒(HIV-1)、丙型肝炎病毒、SARS病毒及其它幾種冠狀病毒的回文結構GC含量的特征和分布,發(fā)現了其中一些回文結構的特殊分布。綜合考慮幾種高致病病毒序列的一些特殊回文結構,如在GC含量,回文長度以及位置等方面特殊分布的回文結構,發(fā)現這些特殊回文結構往往分布在病
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 蛋白質折疊
- 蛋白質折疊速率預測方法研究.pdf
- 基于序列的蛋白質折疊速率與膜蛋白功能分類研究.pdf
- 蛋白質結構折疊分析與速率預測.pdf
- 基于扭轉參數預測蛋白質折疊速率.pdf
- 影響蛋白質折疊速率因素的統(tǒng)計分析.pdf
- 蛋白質動力學與蛋白質折疊的理論研究.pdf
- 基于神經網絡的蛋白質折疊速率預測.pdf
- 基于蛋白質網絡與蛋白質功能的關鍵蛋白質預測研究.pdf
- 蛋白質-蛋白質骨架柔性對接研究.pdf
- 使用蛋白質和mRNA序列信息預測蛋白質亞線粒體定位.pdf
- 24208.基于構象量子躍遷的蛋白質折疊速率研究
- 蛋白質逆折疊方法的研究.pdf
- 蛋白質折疊的網絡方法研究.pdf
- 蛋白質-蛋白質對接方法的研究.pdf
- 54973.蛋白質折疊若干研究
- 蛋白質-蛋白質復合物結構預測.pdf
- 蛋白質水平對鳡幼魚生長、消化和蛋白質代謝的影響.pdf
- 用復雜網絡研究蛋白質折疊.pdf
- 氨基酸蛋白質和蛋白質纖維
評論
0/150
提交評論