蛋白質相互作用數據整合與網絡模塊研究.pdf_第1頁
已閱讀1頁,還剩158頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、在分子水平,生命的功能主要通過各種蛋白質的相互作用來實現,研究人員已開發(fā)出酵母雙雜交、串聯親和純化等多種高通量蛋白質相互作用檢測技術,并產出了大規(guī)模的蛋白質相互作用數據。這些數據的管理和挖掘成為當前生物信息學領域的一項重要而緊迫的任務。由此,本課題針對蛋白質相互作用數據管理和應用開展了如下四個方面的研究。
 ?。?)蛋白質相互作用數據整合方法研究及數據平臺建設。目前蛋白質相互作用數據分散在眾多的異質數據庫中,各數據庫在相互作用類型

2、和數據覆蓋度等方面都存在較強互補性,有必要對數據進行整合。本文建立了整合生物分子通路(Pathway)和蛋白質-蛋白質相互作用(PPI)兩類數據庫的方法。該方法包括建立統(tǒng)一的數據模型,以及建立從通路模型(BioPAX和KGML)到新數據模型的轉換規(guī)則。新數據模型采用作用對形式表示蛋白質相互作用,區(qū)分了生物相互作用(BiolPPI)和技術相互作用(TechPPI),同時增加生物事件和功能效應參數以保留更多的相互作用信息。基于該方法將人類蛋

3、白質的7個通路數據庫( PID、BioCarta、Reactome、NetPath、INOH、KEGG和SPIKE)和5個PPI數據庫(HPRD、IntAct、BioGRID、MINT和DIP)進行了整合,得到了整合數據集PathPPI。PathPPI包含13,411個人類蛋白質的23,041個BiolPPI和72,473個TechPPI。
 ?。?)蛋白質屬性數據整合及挖掘。近年來,基因及其產物(RNA、蛋白質)的注釋數據快速增

4、長,如基本序列信息、高級結構、序列修飾位點、分子量、等電點、染色體定位、亞細胞定位、分子功能、生物過程、進化參數、表型、組織表達特異性、信號通路及蛋白質穩(wěn)定性等。這些數據分散在海量文獻及公共數據庫中,對這些數據進行收集、整理將為組學研究提供有力支持。基于收集的數據,本文進一步開展了生物挖掘研究。本部分內容包括四方面工作:第一,本文通過公共數據庫、文獻搜集以及自己計算的方式全面搜集了目前可獲得的蛋白質屬性,并對屬性的分類及存儲格式標準化問

5、題進行了探討,提出了四種屬性分類原則和兩種適合作為軟件輸入的存儲格式。第二,考察了蛋白質屬性值的分布特性。該分析有助于對各種蛋白質屬性的整體認識,如分子量服從單峰分布,等電點、疏水性服從多峰分布等等。第三,考察了不同生物功能的蛋白質在起源時間、進化速率、穩(wěn)定性、分子量等15種理化屬性上的特點,重點關注了具有極端特性的功能類別,如最早起源蛋白質集中在遺傳和物質代謝功能相關的功能類別,而較晚起源的蛋白質集中在免疫、趨化因子分子功能類別等。該

6、分析有助于更好認識和理解蛋白質的生物功能與理化屬性之間的關系。第四,考察了不同染色體定位蛋白質的理化特性,以及各種生物功能蛋白質集合分布特點。獲得了不同染色體定位上的富集功能組,如CHR1-2、CHR4、CHR6及CHR9有較多通路富集,CHRX有多類疾病基因集合富集等。
  (3)蛋白質相互作用網絡模塊研究。蛋白質相互作用網絡具有模塊化組織結構特性,模塊研究是探索網絡結構和功能的一種有效手段。與傳統(tǒng)的基于網絡拓撲的模塊研究模式不

7、同,本文從生物特性角度描述網絡模塊,定義了代謝通路調控模塊和等表達量模塊兩類新的網絡模塊,并對其進行了識別和特性研究。第一,代謝通路調控模塊研究。在傳統(tǒng)生物化學和分子生物學中,代謝通路的研究往往只關注代謝酶與代謝小分子的關系,而很少關注其他分子對代謝通路酶的調控。但對于整個生物分子系統(tǒng),調控分子和代謝通路一定存在緊密聯系,并且是最基礎、最重要的關系之一。因此,為了突出代謝通路上游調控通路的重要性,本文將代謝通路及其上游調控通路看做一個整

8、體,定義為代謝通路調控模塊。然后利用當前公共數據庫的信號轉導及轉錄調控作用,構建了代謝通路調控模塊。所構建模塊可應用于探討基因功能等研究。第二,等表達量模塊研究。實驗室在前期數據分析中發(fā)現,在信號轉導及代謝網絡通路中存在大量鄰接蛋白質表達豐度相近的子網絡。此類子網絡中蛋白質豐度相近是隨機現象,還有具有特殊生物學意義?豐度一致蛋白質在功能上是否更為緊密?子網絡是否可以作為基本功能單元?值得深入探究。針對這些問題,本文首先將此類子網絡定義為

9、等表達量模塊,然后分別對五組不同蛋白質定量數據下的信號轉導和代謝網絡的等表達量模塊進行了識別,并證實等表達量模塊內的蛋白質作用對之間比總體蛋白質作用對有更高的共表達一致性、GO(gene ontology)功能相似性及轉錄共調控特性。
 ?。?)肝癌轉移相關的網絡模塊挖掘。肝癌轉移是肝癌致死的重要因素之一,但其分子機制還遠遠未研究清楚,最近的組學技術提供了從系統(tǒng)層次研究肝癌轉移的分子篩選、分子診斷等問題的新思路。本文首先提出一種整

10、合GO功能屬性的表達差異模塊搜索方法,利用兩組乳腺癌轉移 mRNA表達譜數據進行性能評估,結果表明,與現有的兩種主流方法相比較,本文提出的方法在模塊準確性和對已知乳腺癌基因的識別精確性上得到了提高。將該方法應用于復旦大學中山醫(yī)院肝癌研究所的58例臨床樣本(轉移36例,非轉移22例)的mRNA表達譜數據,以及復旦大學生物醫(yī)學研究院的8種肝癌非轉移(2種)和轉移(6種)細胞株的mRNA表達譜數據和蛋白質組表達譜數據,得到不同數量的表達差異網

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論