生物信息學(xué)概論第七章蛋白質(zhì)和rna結(jié)構(gòu)預(yù)測(cè)_第1頁(yè)
已閱讀1頁(yè),還剩80頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第七章 蛋白質(zhì)和RNA結(jié)構(gòu)預(yù)測(cè),生命科學(xué)與技術(shù)學(xué)院閻 愛(ài) 俠,蛋白質(zhì)是重要物質(zhì)基礎(chǔ),人體的所有組織器官都會(huì)有蛋白質(zhì),蛋白質(zhì)是生命的物質(zhì)基礎(chǔ)。蛋白質(zhì)是人體的主要“建筑材料”。沒(méi)有蛋白質(zhì)的供給,人就不可能從3~4千克的新生兒長(zhǎng)成50~60千克重的成年人。一般說(shuō),蛋白質(zhì)約占人體全部質(zhì)量的18%,最重要的還是其與生命現(xiàn)象有關(guān)。蛋白質(zhì)和核酸是生命存在的主要形式。,面對(duì)堆積如山的生物學(xué)數(shù)據(jù)……,蛋白質(zhì)的功能,蛋白質(zhì)是調(diào)控和實(shí)現(xiàn)所有生物功能的

2、分子機(jī)器。例如: 結(jié)構(gòu)蛋白-膠原酶-維持和增強(qiáng)結(jié)締組織 機(jī)械酶-肌漿球蛋白-實(shí)現(xiàn)宏觀(guān)和微觀(guān)上的運(yùn)動(dòng) 各種酶-參與生理功能 某些蛋白質(zhì)與DNA或RNA相互作用產(chǎn)生新的蛋白質(zhì),蛋白質(zhì)折疊,蛋白質(zhì)是線(xiàn)性的氨基酸合成的結(jié)果,但在生物體內(nèi)會(huì)迅速折疊成一個(gè)緊密的球狀結(jié)構(gòu)。1.大多數(shù)蛋白質(zhì)只有在折疊成天然球狀結(jié)構(gòu)的時(shí)候才能具有完全的生物活性。2.去折疊(變性)蛋白質(zhì)在允許重新折疊的實(shí)驗(yàn)條件下可以折疊到原來(lái)的結(jié)構(gòu)。,重大挑戰(zhàn)性問(wèn)題,

3、蛋白質(zhì)的結(jié)構(gòu)預(yù)測(cè)?。。壳埃€沒(méi)有一個(gè)算法能夠很好地預(yù)測(cè)出一個(gè)蛋白的三維結(jié)構(gòu)形狀),蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè),通過(guò)計(jì)算(如分子力學(xué)、分子動(dòng)力學(xué)等)來(lái)進(jìn)行結(jié)構(gòu)預(yù)測(cè)(1)對(duì)于天然蛋白結(jié)構(gòu)和未折疊結(jié)構(gòu),兩者之間的能量差非常?。?kcal/mol 數(shù)量級(jí))(2)研究蛋白質(zhì)結(jié)構(gòu)的計(jì)算量非常大,7.1 氨基酸,,蛋白質(zhì)由20種不同大小、形狀和化學(xué)特性的氨基酸組成。氨基酸結(jié)構(gòu):,蛋白質(zhì)是由二十種不同的氨基酸構(gòu)成的 20種標(biāo)準(zhǔn)氨基酸都是L-氨基

4、酸特征:L-氨基酸分子中的α碳(分子中第2個(gè)碳)結(jié)合著一個(gè)堿性的氨基和一個(gè)酸性的羧基,此外Cα還結(jié)合著一個(gè)H原子和一個(gè)側(cè)鏈基團(tuán)(用R表示)。 每一種氨基酸的R都是不同的,側(cè)鏈上的碳依次是第3、4、5和6位碳。,A.疏水氨基酸(hydrophobic amino acid)B.極性氨基酸(polar amino acid)C.帶電氨基酸(charged amino acid),氨基酸通常按性質(zhì)被分為3類(lèi),Company

5、 Logo,疏水性氨基酸,這類(lèi)氨基酸的側(cè)鏈大多或者全部由碳原子和氫原子組成,因此這些氨基酸就不太可能與水分子形成氫鍵。如:酪氨酸、色氨酸、苯丙氨酸等。,酪氨酸,苯丙氨酸,色氨酸,Company Logo,極性氨基酸,這類(lèi)氨基酸的側(cè)鏈通常由氧原子和/或氮原子組成,它們比較容易與水分子形成氫鍵。如甘氨酸、半胱氨酸、酪氨酸等。,甘氨酸,半胱氨酸,酪氨酸,pH值表示溶液中H+濃度的負(fù)對(duì)數(shù)。55,000,000個(gè)水分子中有一個(gè)水分子離解成H+和

6、OH-,與之相對(duì)應(yīng)的濃度是1×10-7M,因此中性溶液的pH=7。生理?xiàng)l件(pH7附近)下氨基酸呈現(xiàn)兼性離子形式,pH,和水分子相似,許多氨基酸的側(cè)鏈也含有可離解的質(zhì)子。氨基酸的pKa值是一個(gè)表示氨基酸釋放其可離解質(zhì)子的相對(duì)難易程度的量。 當(dāng)pH值比氨基酸的pKa值小一個(gè)pH單位時(shí),大約會(huì)有90%的氨基酸被質(zhì)子化;當(dāng)pH值比氨基酸的pKa值小兩個(gè)pH單位時(shí),大約會(huì)有99%的氨基酸被質(zhì)子化。,pKa,,pKa,

7、,,pKa,利用Handerson-Hasselalch公式,可算出在任一pH條件下一種氨基酸的各種離子的比例: [質(zhì)子受體]pH = pKa + log ------------ [質(zhì)子供體],蛋白質(zhì)的等電點(diǎn)是指當(dāng)這種蛋白質(zhì)在溶液中的靜電荷為零時(shí)溶液的pH值。蛋白質(zhì)的等電點(diǎn)可以反映組成這種蛋白質(zhì)的氨基酸的總體信息。例如如果蛋

8、白質(zhì)的pI>7,我們就可以知道蛋白質(zhì)中的堿性氨基酸比酸性氨基酸多。,對(duì)R側(cè)鏈基不解離的氨基酸:pI = (pKa1+pKa2)/2,pI,,甘氨酸滴定曲線(xiàn),幾種氨基酸的解離常數(shù)和等電點(diǎn),7.2 多肽的組成(一級(jí)結(jié)構(gòu)),幾個(gè)氨基酸組成的氨基酸鏈稱(chēng)作肽,一條較長(zhǎng)的氨基酸鏈通常稱(chēng)為多肽或者蛋白質(zhì)。當(dāng)兩個(gè)氨基酸實(shí)現(xiàn)共價(jià)結(jié)合的時(shí)候,一個(gè)氨基酸的氨基丟失一個(gè)氫,同時(shí)另一個(gè)氨基酸丟失一個(gè)氧和一個(gè)氫,脫水生成肽鍵。,7.2 多肽的組成(一級(jí)結(jié)構(gòu)),

9、與DNA 分子和 RNA 分子一樣,多肽也具有特定的方向性。多肽的氨基端(N端)具有一個(gè)氨基,同時(shí)在羧基端(C端)具有一個(gè)羧基。 蛋白質(zhì)序列通常被認(rèn)為是從N端起始,然后逐漸向C端發(fā)展的。 組成蛋白質(zhì)的氨基酸序列完全決定了蛋白質(zhì)的三維形狀和理化特性,也最終決定了它的生物功能。,7.3 二級(jí)結(jié)構(gòu),作用 估計(jì)蛋白的結(jié)構(gòu)類(lèi)型 提高同源模建的準(zhǔn)確性 三級(jí)結(jié)構(gòu)預(yù)測(cè)的起點(diǎn)方法 Chou-Fasman(經(jīng)驗(yàn)參數(shù)法) Garnier

10、(GOR法),二級(jí)結(jié)構(gòu),7.3 二級(jí)結(jié)構(gòu)的類(lèi)型,(1) α螺旋: 肽鏈主鏈繞假想的中心軸盤(pán)繞成螺旋狀,一般都是右手螺旋結(jié)構(gòu),螺旋是靠鏈內(nèi)氫鍵維持的。每個(gè)氨基酸殘基(第n個(gè))的羰基與多肽鏈 C 端方向的第4個(gè)殘基(第4+n個(gè))的酰胺氮形成氫鍵。,7.3 二級(jí)結(jié)構(gòu)的類(lèi)型,(2)β折疊: 肽鍵平面折疊成鋸齒狀, 相鄰肽鏈主鏈的N-H 和 C=O 之間形成有規(guī)則的氫鍵, 在β-折疊中, 所有的肽鍵都參與鏈間氫鍵的形成, 氫鍵

11、與β-折疊的長(zhǎng)軸呈垂直關(guān)系.,7.3 二級(jí)結(jié)構(gòu)的類(lèi)型,(3)β轉(zhuǎn)角: 蛋白質(zhì)二級(jí)結(jié)構(gòu)類(lèi)型之一,由4個(gè)氨基酸殘基組成,其中第一個(gè)殘基的 CO 基團(tuán)和第四個(gè)殘基的 NH基團(tuán)之間形成氫鍵,使多肽鏈的方向發(fā)生“U”形改變。,有些蛋白質(zhì)中含有大量的α螺旋如血紅蛋白和肌紅蛋白而一些蛋白質(zhì)中則不含或者僅含很少的α 螺旋如鐵氧蛋白有些蛋白質(zhì)的二級(jí)結(jié)構(gòu)以β折疊為主如免疫球蛋白例:肽鏈Ala(A)-Glu(E)-Leu(L)-M

12、et(M) 傾向于形成α螺旋 肽鏈Pro(P)-Gly(G)-Tyr(Y)-Ser(S)則不會(huì)形成α螺旋,7.3.1 骨架柔性,多肽鏈中氨基酸的非側(cè)鏈原子構(gòu)成了蛋白骨架。骨架中共價(jià)鍵的鍵長(zhǎng)和平面鍵角或多或少都是固定的。只有兩個(gè)鍵可以旋轉(zhuǎn):(1) 氨基氮原子和α碳原子之間形成的鍵的旋轉(zhuǎn)角 (Φ); (2)α碳原子和羧基碳原子之間形成的鍵的旋轉(zhuǎn)角 (Ψ);,旋轉(zhuǎn)角,phi (N-Cα) psi (C α –C(羥基)

13、),Company Logo,一個(gè)蛋白質(zhì)的構(gòu)象可以通過(guò)每個(gè)氨基酸的Φ和Ψ角來(lái)表示,但是物理上并不能確實(shí)觀(guān)察到所有的Φ和Ψ角,因?yàn)橐恍│岛挺方堑慕M合可能導(dǎo)致骨架上相鄰殘基側(cè)鏈原子的空間碰撞。Ramachandran圖顯示了除甘氨酸殘基外的其他氨基酸殘基中允許出現(xiàn)的Φ和Ψ值。,Ramachandran圖,甘氨酸沒(méi)有側(cè)鏈,因此甘氨酸殘基允許出現(xiàn)的Φ和Ψ值的范圍比其他氨基酸殘基都要大。,Company Logo,預(yù)測(cè)二級(jí)結(jié)構(gòu)的算法中使用了多

14、種計(jì)算方法如神經(jīng)網(wǎng)絡(luò)、離散態(tài)模型、隱馬爾科夫模型、最近鄰分類(lèi)和進(jìn)化計(jì)算等。 目前大多數(shù)二級(jí)結(jié)構(gòu)預(yù)測(cè)的算法都是對(duì)一系列由BLAST、FASTA和CLUSTALW算法產(chǎn)生的經(jīng)過(guò)比對(duì)的序列進(jìn)行二級(jí)結(jié)構(gòu)預(yù)測(cè)。 現(xiàn)在的二級(jí)結(jié)構(gòu)預(yù)測(cè)算法,如 PHD 和 Predator,將蛋白序列和每個(gè)氨基酸的相對(duì)保守程度作為輸入,預(yù)測(cè)準(zhǔn)確率能達(dá)到70%-75%。,7.3.2 預(yù)測(cè)的準(zhǔn)確度,每種氨基酸出現(xiàn)在各種二級(jí)結(jié)構(gòu)中傾向或者頻率是不同的例如:Glu

15、主要出現(xiàn)在α螺旋中 Asp 和 Gly 主要分布在轉(zhuǎn)角中 Pro 也常出現(xiàn)在轉(zhuǎn)角中,但是絕不會(huì)出現(xiàn)在α螺旋中所以可以根據(jù)每種氨基酸殘基形成二級(jí)結(jié)構(gòu)的傾向性(Chou-Fasman)或者統(tǒng)計(jì)規(guī)律(GOR)進(jìn)行二級(jí)結(jié)構(gòu)預(yù)測(cè),蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)方法,該方法由 Chou 和 Fasman 在 70年代提出來(lái),是一種基于單個(gè)氨基酸殘基統(tǒng)計(jì)的經(jīng)驗(yàn)預(yù)測(cè)方法。通過(guò)統(tǒng)計(jì)分析,獲得的每個(gè)殘基出現(xiàn)于特定二級(jí)結(jié)構(gòu)

16、構(gòu)象的傾向性因子,進(jìn)而利用這些傾向性因子預(yù)測(cè)蛋白質(zhì)的二級(jí)結(jié)構(gòu).每個(gè)氨基酸都有幾個(gè)構(gòu)成參數(shù),P(a),P(b) 和 P(turn), 分別表示相應(yīng)的氨基酸形成α螺旋、β折疊和β轉(zhuǎn)角的偏向性。另外,每個(gè)氨基酸同時(shí)也有4個(gè)轉(zhuǎn)角參數(shù)f(i), f(i+1), f(i+2), f(i+3), 分別對(duì)應(yīng)于這種氨基酸出現(xiàn)在發(fā)夾轉(zhuǎn)角第一、第二、第三和第四位的頻率。,Chou-Fasman法,(1) 尋找所有相鄰的6個(gè)殘基中至少4個(gè)殘基的 P(a)

17、 >100的區(qū)域。(2) 對(duì)于 (1) 中發(fā)現(xiàn)的每一個(gè)區(qū)域,從區(qū)域兩端向外延伸,直至出現(xiàn) 4 個(gè)連續(xù)殘基的P (a) 5,并且區(qū)域的ΣP(a) > ΣP(b),那么這樣的一個(gè)區(qū)域就被預(yù)測(cè)為α螺旋。,α螺旋的預(yù)測(cè)規(guī)則,β折疊的預(yù)測(cè)規(guī)則,(1) 尋找所有相鄰的6個(gè)殘基中至少4個(gè)殘基的P(b) >100的區(qū)域。(2) 對(duì)于(1) 中發(fā)現(xiàn)的每一個(gè)區(qū)域,從區(qū)域兩端向外延伸,一旦所有的區(qū)域延伸結(jié)束后,當(dāng)一個(gè)區(qū)域中所有

18、殘基的P(b)的均值大于100 并且ΣP(b) > ΣP(a) 時(shí),這個(gè)區(qū)域就預(yù)測(cè)為β折疊。,假如預(yù)測(cè)出的螺旋區(qū)域與預(yù)測(cè)出的折疊區(qū)域有重疊的話(huà),那么如果重疊區(qū)域的ΣP(b) > ΣP(a),就預(yù)測(cè)為β折疊;反之,則預(yù)測(cè)為α螺旋。,(1)對(duì)于每個(gè)位于i位置上的殘基計(jì)算它的轉(zhuǎn)角偏向性P(t)。計(jì)算方法如下: P(t) = 第i位上的殘基的 f(i) 值 × 第 i+1位上的殘基的 f(i+1)值 × 第i+

19、2位上的殘基的 f(i+2) 值×第 i+3 位上的殘基的 f(i+3)值(2)若一段區(qū)域內(nèi)的氨基酸滿(mǎn)足如下條件,就預(yù)測(cè)這段區(qū)域是一個(gè)從第i位氨基酸開(kāi)始的發(fā)夾轉(zhuǎn)角。 a. P(t) > 0.000075; b. 從第i位到第i+3位的4個(gè)殘基的P(turn)參數(shù)的平均值>100; c. 從第i位到第i+3位的4個(gè)殘基的ΣP(turn) > ΣP(a),且

20、ΣP(turn) > ΣP(b);,β轉(zhuǎn)角的預(yù)測(cè)規(guī)則,是一種基于信息論和貝葉斯統(tǒng)計(jì)學(xué)的方法。 GOR將蛋白質(zhì)序列當(dāng)作一連串的信息值來(lái)處理。 GOR方法不僅考慮被預(yù)測(cè)位置本身氨基酸殘基種類(lèi)的影響,而且考慮相鄰殘基種類(lèi)對(duì)該位置構(gòu)象的影響。,GOR方法,GOR方法將序列中的每一個(gè)殘基與和它N端緊鄰的8個(gè)殘基以及和它 C 端緊鄰的 8個(gè)殘基一起考慮,通過(guò)對(duì)已知的二級(jí)結(jié)構(gòu)的蛋白樣本的分析,計(jì)算出中心殘基的二級(jí)結(jié)構(gòu)分別為螺旋、折疊和轉(zhuǎn)

21、角時(shí)每種氨基酸出現(xiàn)在窗口中各個(gè)位置的頻率,產(chǎn)生一個(gè) 17×20 的得分矩陣。然后預(yù)測(cè)序列中每個(gè)殘基形成這些二級(jí)結(jié)構(gòu)的概率。GOR 方法的預(yù)測(cè)準(zhǔn)確率約為 65%。,GOR方法,序列窗口 中心殘基,,GOR方法考慮窗口中各個(gè)殘基對(duì)中心殘基二級(jí)結(jié)構(gòu)的支持程度,,,,,,,,,,,,,,,,,,,,(1)三級(jí)結(jié)構(gòu) 一個(gè)折疊的多肽鏈的整體三維形狀稱(chēng)為蛋白質(zhì)的三級(jí)結(jié)構(gòu)。,7.4 三級(jí)結(jié)構(gòu)和四級(jí)結(jié)構(gòu),(2)四級(jí)

22、結(jié)構(gòu) 幾個(gè)多肽相互作用形成一個(gè)功能蛋白質(zhì),多酶復(fù)合物中也會(huì)出現(xiàn)蛋白質(zhì)與蛋白質(zhì)的相互作用,這種分子間相互作用稱(chēng)為蛋白質(zhì)的四級(jí)結(jié)構(gòu)。,7.4 三級(jí)結(jié)構(gòu)和四級(jí)結(jié)構(gòu),(1) 理論分析方法通過(guò)理論計(jì)算(如分子力學(xué)、分子動(dòng)力學(xué)計(jì)算)進(jìn)行結(jié)構(gòu)預(yù)測(cè)。(2)統(tǒng)計(jì)的方法 對(duì)已知結(jié)構(gòu)的蛋白質(zhì)進(jìn)行統(tǒng)計(jì)分析,建立序列到結(jié)構(gòu)的映射模型,進(jìn)而對(duì)未知結(jié)構(gòu)的蛋白質(zhì)根據(jù)映射模型直接從氨基酸序列預(yù)測(cè)結(jié)構(gòu)。 包括:經(jīng)驗(yàn)性方法結(jié)構(gòu)規(guī)律提取方法

23、同源模型化方法,7.4 三級(jí)結(jié)構(gòu)和四級(jí)結(jié)構(gòu)預(yù)測(cè)方法,影響三、四級(jí)結(jié)構(gòu)的幾類(lèi)作用力:,(1)疏水性 疏水作用力通常被認(rèn)為是蛋白質(zhì)折疊成一個(gè)緊密球狀結(jié)構(gòu)的幾種基礎(chǔ)力之一。 大多數(shù)蛋白質(zhì)的天然結(jié)構(gòu)都有一個(gè)疏水核心和一個(gè)與溶液相接觸的表面,疏水核心中掩藏了疏水殘基,使得它們與溶液相隔離,而與溶液相接觸的表面大多或者全部由極性殘基和帶電殘基組成。 鐮刀形細(xì)胞貧血癥正是由于β球蛋白表面的單個(gè)殘基由帶電的谷氨酸突變到疏水的纈氨酸,就導(dǎo)致

24、了細(xì)胞形態(tài)的徹底變化,最終使人產(chǎn)生貧血、勞累甚至是壞疽的嚴(yán)重病癥。,(2)二硫鍵 當(dāng)兩個(gè)半胱氨酸殘基中的巰基相互靠近時(shí),它們可以被氧化而產(chǎn)生共價(jià)的二硫鍵,從而將在蛋白質(zhì)一級(jí)結(jié)構(gòu)中可能相距很遠(yuǎn)的殘基交叉連接起來(lái)。 二硫鍵是蛋白質(zhì)中唯一非骨架原子的共價(jià)交聯(lián)結(jié)合,它們對(duì)穩(wěn)定蛋白質(zhì)的折疊起著非常明顯的作用。,影響三、四級(jí)結(jié)構(gòu)的幾類(lèi)作用力:,(3)活性結(jié)構(gòu)與最穩(wěn)定結(jié)構(gòu) 由于蛋白質(zhì)折疊過(guò)程中的自由度非常大,因此一般不可能評(píng)價(jià)蛋

25、白質(zhì)的天然狀態(tài)是不是實(shí)際中最穩(wěn)定(能量最優(yōu))的構(gòu)象。但是,自然選擇很明顯會(huì)選擇既有活性又有穩(wěn)定性的蛋白質(zhì)。 如果蛋白質(zhì)一級(jí)結(jié)構(gòu)中的突變降低了蛋白質(zhì)的穩(wěn)定性,在進(jìn)化中就會(huì)產(chǎn)生不利因素,那么在選擇的時(shí)候這些突變體就會(huì)被剔除。,影響三、四級(jí)結(jié)構(gòu)的幾類(lèi)作用力:,Levinthal悖論,1968年,C. Levinthal 在他的一篇論文中指出,即使一個(gè)多肽鏈的長(zhǎng)度不長(zhǎng),它可能采取的折疊方式也非常多。如果要對(duì)一個(gè)多肽的所有可能出現(xiàn)的構(gòu)象進(jìn)行隨

26、機(jī)搜索,那么可能要花費(fèi)很多年的時(shí)間。這個(gè)發(fā)現(xiàn)被稱(chēng)為L(zhǎng)evinthal悖論。 Levinthal 悖論認(rèn)為蛋白折疊的過(guò)程是從未折疊的狀態(tài)開(kāi)始,然后逐漸經(jīng)過(guò)一系列越來(lái)越穩(wěn)定的中間態(tài),最終折疊成蛋白質(zhì)的天然狀態(tài)。至于這樣的折疊途徑是否最終在構(gòu)象的能量處于全局最小點(diǎn)時(shí)結(jié)束,目前還有很多爭(zhēng)論。,7.5 蛋白質(zhì)折疊建模算法,(1)    網(wǎng)格模型(2)    去網(wǎng)格模型(3)&

27、#160;   能量函數(shù)和優(yōu)化,7.5.1 網(wǎng)格模型,H-P(疏水-極性)模型:該模型有三種簡(jiǎn)化:(1)蛋白質(zhì)中各個(gè)氨基酸殘基的α碳原子都位于二維網(wǎng)格 或三維網(wǎng)格的格點(diǎn)上;(2)疏水作用是蛋白折疊中唯一的重要因素;(3)通過(guò)計(jì)算疏水殘基接觸的數(shù)目代替構(gòu)象的能量計(jì)算。雖然這樣的處理非常簡(jiǎn)單,但是通過(guò)H-P模型的計(jì)算分析,能夠發(fā)現(xiàn)蛋白質(zhì)折疊的一些機(jī)制。,H-P模型,H-P模

28、型是基于疏水殘基接觸來(lái)進(jìn)行打分的。除了多肽鏈中相鄰的疏水殘基之外,每一個(gè)相互靠近的疏水接觸對(duì)能量的貢獻(xiàn)都設(shè)為 -1,最優(yōu)的構(gòu)象就是所有可能的構(gòu)象中具有最多疏水接觸的那個(gè)構(gòu)象。上圖中二維和三維構(gòu)象的得分都是-3。,黑色為疏水殘基,白色為極性殘基。N端為1號(hào)殘基,位于(0,0)處,下一個(gè)位于(1,0) 處。,疏水拉鏈 (hydrophobic zipper) 機(jī)制,K.Dill 提出了疏水拉鏈機(jī)制作為形成二級(jí)結(jié)構(gòu)的可能折疊機(jī)制。疏水拉鏈

29、機(jī)制是指蛋白鏈上的疏水殘基(表示為黑色圓圈)由于疏水作用移到一起,從而使得極性殘基產(chǎn)生了一個(gè)環(huán)。當(dāng)這個(gè)過(guò)程不斷重復(fù),就形成了一個(gè)反平行β折疊片。P145:圖7.9,網(wǎng)格模型中的構(gòu)象表示方法,(1) 絕對(duì)方向表示法 (absolute direction representation) 將第一個(gè)殘基放在網(wǎng)格的(0,0)位置上,然后描述前面一個(gè)殘基到下一個(gè)殘基的移動(dòng)方向。二維模型中,每一個(gè)位置上可選擇的方向包括上下左

30、右四個(gè)方向,用 U、D、L、R表示。,(R,R,D,L,D,L,U,L,U,U,R),網(wǎng)格模型中的構(gòu)象表示方法,(1) 絕對(duì)方向表示法 (absolute direction representation) 三維模型中,每一個(gè)位置上可選擇的方向包括上下左右前后六個(gè)方向,分別用 U、D、L、R、F、B 表示。,(R,B,U,F,L,U,R,B,L,L,F),網(wǎng)格模型中的構(gòu)象表示方法,(2) 相對(duì)方向表示法: 將第一個(gè)殘基放在

31、網(wǎng)格的(0,0)位置上,然后利用每個(gè)殘基主鏈的轉(zhuǎn)動(dòng)方向來(lái)表示每個(gè)位置上的殘基的方向。二維模型中,每一個(gè)位置上可選擇的方向包括左、右、前三個(gè)方向,用 L、R、F 表示。,(F,F,R,R,L,R,R,L,R,F,R),網(wǎng)格模型中的構(gòu)象表示方法,(2) 相對(duì)方向表示法: 三維模型中,每一個(gè)位置上可選擇的方向包括上、下、左、右、前五個(gè)方向,分別用 U、D、L、R、F表示。,(F,L,U,U,R,U,U,L,L,F,L),殘基碰撞問(wèn)題,使

32、用上述兩種方法表示時(shí),會(huì)遇到一個(gè)關(guān)鍵問(wèn)題,那就是一些構(gòu)象中兩個(gè)殘基會(huì)出現(xiàn)在同一個(gè)位置上。比如, 一個(gè)二維構(gòu)象用相對(duì)法表示法表示時(shí),如果它的起始前四個(gè)殘基是 (L,L,L,L),那么這個(gè)構(gòu)象就會(huì)有兩個(gè)殘基位于原點(diǎn)(0,0)上,從而導(dǎo)致殘基碰撞(bump),或原子空間碰撞。解決這個(gè)問(wèn)題的方法包括:(1)給每一個(gè)具有碰撞的構(gòu)象分配一個(gè)非常高的能量值,因而在搜索能量最低構(gòu)象時(shí)可以有效地去除這些碰撞的構(gòu)象。(2)優(yōu)先排序法,即每個(gè)殘基對(duì)應(yīng)

33、的方向不唯一,比如, 在二維模型中,某一殘基對(duì)應(yīng)的方向可能會(huì)是 {L,F,R},表示這個(gè)殘基最可能對(duì)應(yīng)的方向?yàn)樽?,其次為前,再次為右?7.5.2 去網(wǎng)格模型,如果在蛋白質(zhì)模型中取消氨基酸定位于網(wǎng)格點(diǎn)的限制,那么蛋白模型就可以更真實(shí)地模擬出蛋白的實(shí)際構(gòu)象。如果采取完整骨架模型,并將模型中的 phi 角和 psi 角的取值范圍定義為Ramachandran 圖中所用允許出現(xiàn)的phi 角和 psi 角的值,那么這種去網(wǎng)格折疊模型模擬出的小多

34、肽的構(gòu)象與實(shí)驗(yàn)測(cè)出的真實(shí)構(gòu)象會(huì)非常接近。 去網(wǎng)格模型的誤差通常用預(yù)測(cè)構(gòu)象和實(shí)際構(gòu)象中α碳原子的均方根偏差 (RMSD) 來(lái)計(jì)算。α碳原子的RMSD是指當(dāng)預(yù)測(cè)構(gòu)象和實(shí)際構(gòu)象重疊在一起時(shí),兩種構(gòu)象中每個(gè)α碳原子位置的Euclidean平方距離的總和。,7.5.2 去網(wǎng)格模型,隨著蛋白模型與實(shí)際情況越來(lái)越相符,模型的復(fù)雜性也越來(lái)越大??梢灾豢紤]α碳原子,也可以考慮所有的骨架原子,甚至所有的骨架原子和側(cè)鏈原子。側(cè)鏈也可以考慮剛性、

35、半柔性和完全柔性。側(cè)鏈 剛性側(cè)鏈:X-射線(xiàn)晶體結(jié)構(gòu)中每種氨基酸出現(xiàn)最多的構(gòu)象; 半柔性側(cè)鏈:可以采用類(lèi)似的經(jīng)驗(yàn)性方法得到; 從一系列 的X-射線(xiàn)晶體結(jié)構(gòu)得到側(cè)鏈的多種構(gòu)象,形狀類(lèi)似的為一組。每一組的平均構(gòu)象稱(chēng)為一個(gè)旋轉(zhuǎn)異構(gòu)體。在半柔性模型中,每個(gè)側(cè)鏈的構(gòu)象可以采用任意一種最常出現(xiàn)的旋轉(zhuǎn)異構(gòu)體 (rotamer)。,,分子疊合圖,除了要考慮疏水作用,蛋白折疊的能量函數(shù)中還要考慮到氫鍵、二硫橋的形成、靜電作用、范德華力

36、以及溶劑作用。由于這些力中每一個(gè)力的相對(duì)作用還很難通過(guò)實(shí)驗(yàn)來(lái)計(jì)算,因此尋找一個(gè)合適的蛋白折疊復(fù)合能量函數(shù)仍然是一個(gè)研究熱點(diǎn)。 我們可以通過(guò)理論方法,針對(duì)范德華力、氫鍵、溶劑、靜電和其它力對(duì)一個(gè)已折疊蛋白總體穩(wěn)定性的相對(duì)作用來(lái)建立能量函數(shù)。它的目標(biāo)是得到一個(gè)近似的能量函數(shù)或者力場(chǎng),那些已知結(jié)構(gòu)的蛋白質(zhì)結(jié)晶構(gòu)象在這個(gè)能量函數(shù)中處于一個(gè)最小能量的狀態(tài)。例如: ΔG = ΔGvanderwaals + ΔGH-bonds + ΔGsol

37、vent + ΔGcoulomb,7.5.3 能量函數(shù)和優(yōu)化,如何尋找一些可行的能量函數(shù),本質(zhì)上是分子力學(xué)的問(wèn)題。而且,科學(xué)家確實(shí)已經(jīng)設(shè)計(jì)出了許多有效的能量函數(shù)。但是從頭開(kāi)始預(yù)測(cè)蛋白結(jié)構(gòu)的方法由于種種原因還得不到令人滿(mǎn)意的結(jié)果。Folding@Home程序利用CPU的空閑時(shí)間來(lái)對(duì)蛋白折疊進(jìn)行計(jì)算。對(duì)于一個(gè)特定蛋白質(zhì)的計(jì)算,它首先被分成幾個(gè)不同的部分,然后這些不同的計(jì)算部分通過(guò)Internet被分配給不同的運(yùn)行Folding@Home

38、程序的計(jì)算機(jī)來(lái)計(jì)算。最后,每個(gè)機(jī)器將得到的結(jié)果返回給服務(wù)器,服務(wù)器再對(duì)這些結(jié)果進(jìn)行合并和處理。,7.5.3 能量函數(shù)和優(yōu)化,7.6結(jié)構(gòu)預(yù)測(cè),雖然很多蛋白折疊模型使得我們能夠越來(lái)越多地了解蛋白質(zhì)的折疊過(guò)程以及蛋白質(zhì)折疊過(guò)程中涉及的各種分子力,但是目前還沒(méi)有一種從頭開(kāi)始進(jìn)行蛋白質(zhì)折疊的算法能夠很準(zhǔn)確地模擬出一些大蛋白質(zhì)的空間結(jié)構(gòu)。蛋白質(zhì)預(yù)測(cè)方法:(1)比較建模(同源建模)(2)線(xiàn)索法:反向折疊蛋白,7.6.1 同源建模,同源建模是通

39、過(guò)與相近蛋白的結(jié)構(gòu)進(jìn)行比較來(lái)預(yù)測(cè)目標(biāo)蛋白的結(jié)構(gòu)的方法。這種方法依賴(lài)于目標(biāo)序列和已知結(jié)構(gòu)蛋白的序列相似度的強(qiáng)弱,依賴(lài)于折疊編碼。也就是說(shuō),蛋白質(zhì)氨基酸序列間的變化如果很小的話(huà),那么蛋白質(zhì)的三級(jí)結(jié)構(gòu)的變化也很小。,序列 結(jié)構(gòu) 功能,,功能,,,,蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)問(wèn)題,,功能,,,,,,….-Gly-Ala-Glu-Phe-….,,功能,,,,,計(jì)算機(jī)輔助同源建模,同源建模的過(guò)程,(1)尋找一系列與目標(biāo)蛋白相近的蛋白質(zhì)的

40、結(jié)構(gòu)集。 通常利用像BLAST和FASTA這樣的序列數(shù)據(jù)庫(kù)搜索工具看來(lái)得到與目標(biāo)蛋白相近的序列集,進(jìn)而得到這些序列的結(jié)構(gòu)集。由于這些結(jié)構(gòu)在建模中是用作模板結(jié)構(gòu)的,因此這些結(jié)構(gòu)也稱(chēng)為模板結(jié)構(gòu)。,同源建模的過(guò)程,(2)將目標(biāo)序列與模板蛋白的序列進(jìn)行比對(duì)。 用像CLUSTALW這樣的多重比對(duì)工具產(chǎn)生比對(duì),發(fā)現(xiàn)目標(biāo)序列中與所有模板結(jié)構(gòu)高度保守的區(qū)域以及保守性不高的區(qū)域。當(dāng)目標(biāo)序列和模板序列相似度小于30%時(shí),

41、自動(dòng)多重比對(duì)方法就不能得到高質(zhì)量的比對(duì)。此時(shí),必須對(duì)序列不必對(duì)進(jìn)行人工調(diào)節(jié)。,同源建模的過(guò)程,(3)建立模型。 最普遍的方法就是將模板結(jié)構(gòu)疊加起來(lái),然后找到結(jié)構(gòu)上保守的區(qū)域。接著,這些模板結(jié)構(gòu)中保守的區(qū)域和與之相對(duì)應(yīng)的蛋白骨架比對(duì)排列,為要建立的模型形成一個(gè)核心。當(dāng)模板蛋白的結(jié)構(gòu)相似性比較低時(shí),就必須利用目標(biāo)蛋白二級(jí)結(jié)構(gòu)預(yù)測(cè)的方法、序列相似性方法和人工評(píng)估的方法為這一模型選擇正確的結(jié)構(gòu)。先建立模型的核心,再為L(zhǎng)oop區(qū)建模

42、。,同源建模的過(guò)程,(4)Loop區(qū)建模: 使用最多的兩種方法是: a.從已知的Loop區(qū)構(gòu)象庫(kù)中選擇一個(gè)最優(yōu)的環(huán)區(qū)構(gòu)象; b.實(shí)行構(gòu)想搜索和評(píng)估。 盡管有很多方法可以用來(lái)對(duì)環(huán)區(qū)建模,但要得到一個(gè)長(zhǎng)于6個(gè)殘基的環(huán)區(qū)的準(zhǔn)確構(gòu)象仍然是相當(dāng)困難的。,同源建模的過(guò)程,(5)側(cè)鏈建模: 一旦建立了骨架的模型,仍然必須決定側(cè)鏈原子的位置。同樣地,可以采用許多不同的方法,包括對(duì)旋轉(zhuǎn)異構(gòu)

43、體庫(kù)進(jìn)行搜索的方法、有限分子動(dòng)力學(xué)的方法以及其他的一些方法。,同源建模的過(guò)程,(6)對(duì)模型的評(píng)估: 許多軟件包可以實(shí)現(xiàn)對(duì)預(yù)測(cè)出的蛋白結(jié)構(gòu)的質(zhì)量進(jìn)行評(píng)估,這些軟件包括PROCHECK、WHATCHECK、Verify-3D等。評(píng)估的算法通常是尋找結(jié)構(gòu)中出現(xiàn)的一些異常構(gòu)象,比如φ和ψ角的值是否位于Ramachandran圖中允許出現(xiàn)的范圍之內(nèi)、是否出現(xiàn)原子空間碰撞以及是否有一些不經(jīng)常出現(xiàn)的鍵長(zhǎng)和鍵角。,7.6.2 線(xiàn)索法:

44、反向蛋白折疊,對(duì)于一個(gè)目標(biāo)蛋白,可以通過(guò)搜索那些假設(shè)與目標(biāo)蛋白具有相同構(gòu)象的蛋白而快速建立起這個(gè)未知蛋白三維結(jié)構(gòu)的大致模型。假設(shè)得到了一個(gè)特定的構(gòu)象,那么就能使用蛋白折疊算法中同樣的評(píng)估方法來(lái)決定是否接受這一構(gòu)象。這種先假設(shè)一個(gè)特定構(gòu)象然后對(duì)這一構(gòu)象進(jìn)行評(píng)估的過(guò)程稱(chēng)為蛋白折疊的線(xiàn)索法,有時(shí)也被認(rèn)為是蛋白質(zhì)折疊的逆過(guò)程,故稱(chēng)為反向蛋白折疊。一些數(shù)據(jù)庫(kù)將具有相似結(jié)構(gòu)的蛋白劃成不同的分類(lèi)。要決定一個(gè)蛋白屬于哪個(gè)折疊家族,可以先將一個(gè)家族中

45、所有結(jié)構(gòu)的平均構(gòu)象作為這個(gè)家族的結(jié)構(gòu),然后得到目標(biāo)蛋白采用這一構(gòu)象時(shí)的結(jié)構(gòu),再進(jìn)行質(zhì)量評(píng)估。,7.7 RNA二級(jí)結(jié)構(gòu)的預(yù)測(cè),一級(jí)結(jié)構(gòu): 構(gòu)成RNA分子的核苷酸序列。二級(jí)結(jié)構(gòu): 單鏈RNA分子自身纏繞配,通過(guò)氫鍵作用等形成的諸如莖區(qū)、發(fā)夾、突出、偽結(jié)等結(jié)構(gòu)。,點(diǎn)矩陣法作圖動(dòng)態(tài)規(guī)劃法最大匹配法最小自由能法等。Zuker的Mfold程序是使用最多的程序包之一,它通過(guò)一系列最近鄰能量規(guī)則計(jì)算一個(gè)結(jié)

46、構(gòu)的能量來(lái)預(yù)測(cè)RNA的二級(jí)結(jié)構(gòu)。,7.7 RNA二級(jí)結(jié)構(gòu)的預(yù)測(cè)方法,蛋白質(zhì)是具有各種各樣不同三維結(jié)構(gòu)的復(fù)雜生物大分子。利用神經(jīng)網(wǎng)絡(luò)等模型可以通過(guò)蛋白質(zhì)的一級(jí)結(jié)構(gòu)來(lái)預(yù)測(cè)二級(jí)結(jié)構(gòu),并且準(zhǔn)確率已經(jīng)相當(dāng)高(>75%)三級(jí)結(jié)構(gòu)和四級(jí)結(jié)構(gòu)的預(yù)測(cè)還很困難,但已經(jīng)有許多不同的算法可以在不同的抽象水平上來(lái)解決蛋白折疊預(yù)測(cè)問(wèn)題。蛋白折疊算法、同源建模法和線(xiàn)索法使我們?cè)絹?lái)越了解蛋白質(zhì)的折疊過(guò)程,越來(lái)越準(zhǔn)確的預(yù)測(cè)蛋白的結(jié)構(gòu)。,本章小結(jié),P154:

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論