腫瘤Biomarker的計算系統(tǒng)生物學(xué)研究及生物網(wǎng)絡(luò)可視化軟件的開發(fā).pdf_第1頁
已閱讀1頁,還剩165頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、背景和目的
   近年來,大規(guī)模的生物分子相互作用數(shù)據(jù),特別是利用高通量手段研究并整理的蛋白質(zhì)相互作用(Protein-protein interaction,PPI)數(shù)據(jù)庫和海量數(shù)據(jù)的發(fā)布,對于疾病,特別是腫瘤的研究著眼于在病理狀態(tài)下整個分子系統(tǒng)網(wǎng)絡(luò)的動態(tài)變化;同時,開始從系統(tǒng)、全局的角度出發(fā),研究疾病臨床綜合癥群和內(nèi)在的生物分子網(wǎng)絡(luò)之間的關(guān)系,進(jìn)一步改進(jìn)疾病的分類標(biāo)準(zhǔn),重新對疾病進(jìn)行更準(zhǔn)確的定義。
   腫瘤蛋白分子

2、標(biāo)記(Protein Biomarker)的應(yīng)用對腫瘤的診斷、預(yù)后和靶向治療有重要的作用;也為疾病的分類提供了有效依據(jù)。然而,由于腫瘤發(fā)生和發(fā)展過程中復(fù)雜病理機(jī)制,腫瘤Biomarker發(fā)掘的過程非常艱巨;到目前為止,只有9個腫瘤相關(guān)蛋白通過FDA認(rèn)證,作為臨床檢測Biomarker用于癌癥的診斷檢測。在系統(tǒng)生物學(xué)蓬勃發(fā)展的背景下,作為候選的Biomarker應(yīng)該從系統(tǒng)水平上進(jìn)行研究,需要大規(guī)模收集數(shù)據(jù),探討腫瘤發(fā)生過程中關(guān)鍵的致病基因

3、和其下游的效應(yīng)基因,選擇有效的診斷和治療Biomarker,盡量避免Biomarker選擇中高假陽性和假陰性等一系列問題。
   本課題,我們從系統(tǒng)生物學(xué)角度,探討了腫瘤蛋白Biomarker發(fā)掘的一系列問題。1)首次,從人類分子相互作用網(wǎng)絡(luò)、基因組、蛋白質(zhì)組學(xué),以及癌癥的疾病臨床綜合癥群的宏觀角度,分析1000多個經(jīng)驗型腫瘤蛋白Biomarker的性質(zhì),為腫瘤蛋白Biomarker發(fā)掘計算模型的構(gòu)建,提供了生物學(xué)依據(jù);2)探討

4、腫瘤蛋白Biomarker發(fā)掘的算法,利用人類全局PPI網(wǎng)絡(luò)的信息和疾病表型關(guān)聯(lián)網(wǎng)絡(luò)的信息,進(jìn)行模型構(gòu)建,較傳統(tǒng)的有效的計算方法,效率進(jìn)一步提高;3)以原發(fā)性肝細(xì)胞癌(HCC)和其重要的蛋白Biomarker-甲胎蛋白(AFP)為例,深入探討AFP在HCC發(fā)生和發(fā)展中的關(guān)系,比較AFP陽性、陰性HCC臨床樣本中基因表達(dá)差異并推斷了相關(guān)的分子機(jī)制;4)設(shè)計和研發(fā)面向多級(Muti-scale)生物網(wǎng)絡(luò)的可視化數(shù)據(jù)發(fā)掘工具--ProteoL

5、ens,通過兼容SQL語句,改進(jìn)了傳統(tǒng)可視化工具的兼容性差,不能方便、有效的處理多樣的系統(tǒng)生物學(xué)數(shù)據(jù)的弱點;能夠更加有效的建立包含豐富注解信息的和多級生物學(xué)網(wǎng)絡(luò),來理解復(fù)雜的生物學(xué)網(wǎng)絡(luò)的結(jié)構(gòu),從中挖掘有效的信息。我們的研究,旨在溝通生物學(xué)基礎(chǔ)研究和臨床醫(yī)學(xué)研究;并構(gòu)架計算分析的平臺,使計算生物學(xué)家也能夠有效的參與腫瘤的診斷和治療這一重大問題中來。主要研究方法
   1、數(shù)據(jù)的收集和整理
   1)疾病基因,癌癥基因,腫瘤

6、蛋白Biomarker,必要基因,藥物靶分子基因;
   2)PPI網(wǎng)絡(luò),TF-基因調(diào)節(jié)網(wǎng)絡(luò),Pathway,基因共表達(dá)網(wǎng)絡(luò);
   3)組織特異性數(shù)據(jù),組織表達(dá)數(shù)據(jù),Gene Ontology數(shù)據(jù),健康人血漿蛋白肽的圖譜數(shù)據(jù);
   4)分子ID映射,疾病術(shù)語,分子注解信息;
   2、腫瘤蛋白Biomarker的性質(zhì)分析
   1)PPI網(wǎng)絡(luò)中拓?fù)湫再|(zhì)比較;
   2)組織特異性比較;

7、
   3)表達(dá)范圍比較;
   4)Gene Ontology關(guān)鍵詞比較;
   5)Co-Pathway統(tǒng)計;
   6)共表達(dá)統(tǒng)計;
   3、癌癥表型特異性分子網(wǎng)絡(luò)的構(gòu)建
   1)PPI網(wǎng)絡(luò)子網(wǎng);
   2)TF-基因調(diào)節(jié)子網(wǎng);
   4、腫瘤表型關(guān)聯(lián)網(wǎng)絡(luò)的定義與比較
   1)腫瘤疾病基因定義的疾病表型關(guān)聯(lián)網(wǎng)絡(luò);
   2)腫瘤蛋白Biomark

8、er定義的疾病表型關(guān)聯(lián)網(wǎng)絡(luò);
   3)GWAS疾病相關(guān)位點定義的疾病表型關(guān)聯(lián)網(wǎng)絡(luò);
   4)網(wǎng)絡(luò)間通過構(gòu)建相似性得分和鄰接矩陣聚類進(jìn)行比較;
   5、SW-RWR算法設(shè)計和評估
   1)覆蓋率:
   2)敏感性;
   3)準(zhǔn)確度;
   6、AFP分子演化的分析
   1)進(jìn)化樹構(gòu)建;
   2)結(jié)構(gòu)域分析;
   3)基因調(diào)節(jié)區(qū)序列分析;

9、>   7、AFP+/-原發(fā)性肝細(xì)胞癌臨床樣本的基因表達(dá)差異分析
   1)肝細(xì)胞癌表達(dá)譜數(shù)據(jù)收集與整理;
   2)Meta-analysis;
   3)貝葉斯網(wǎng)絡(luò)和PPI網(wǎng)絡(luò)比較;
   4)基因功能分析;
   8、網(wǎng)絡(luò)可視化軟件ProteoLens的設(shè)計和實現(xiàn)
   1)基礎(chǔ)框架;
   2)Java編程實現(xiàn);
   3)系統(tǒng)生物學(xué)研究示例。
   研究

10、結(jié)果
   第一部分
   腫瘤蛋白Biomarker的性質(zhì)分析
   為評估腫瘤蛋白Biomarker的特性,我們選擇疾病基因、癌癥基因、藥物靶蛋白和必要基因作為參照。
   1)各個功能集合之間的重疊的基因數(shù)目較少;
   2)腫瘤Biomarker在PPI網(wǎng)絡(luò)中的節(jié)點的平均度數(shù)小于癌癥基因和必要基因在PPI網(wǎng)絡(luò)中節(jié)點的平均度數(shù),但高于疾病基因和藥物靶蛋白的平均數(shù);
   3)腫瘤蛋白

11、Biomarker包含較多的組織特異性基因;
   4)腫瘤蛋白Biomarker中基因平均表達(dá)的組織數(shù)目甚至多于必要基因集合中的平均水平;
   5)腫瘤蛋白Biomarker集中共有385個顯著的GO術(shù)語,包括26個細(xì)胞模塊術(shù)語,0個分子功能術(shù)語和359個生物過程術(shù)語;
   6)腫瘤蛋白Biomarker在以疾病基因為種子擴(kuò)張的PPI和PPI-TF-調(diào)節(jié)基因網(wǎng)絡(luò)中的分布:當(dāng)選擇更加精確的的種子蛋白(接近癌癥

12、基因的時候)進(jìn)行PPI和PPI-TF-調(diào)節(jié)基因網(wǎng)絡(luò)構(gòu)建,與腫瘤蛋白Biomarker的交集占總腫瘤蛋白Biomarker集的比率顯著增大;
   7)腫瘤蛋白Biomarker和相應(yīng)表型的疾病基因易于共表達(dá)并參與同一Pathway。
   構(gòu)建基于腫瘤蛋白Biomarker疾病表型網(wǎng)絡(luò)(DBN)
   762個腫瘤蛋白Biomarker對應(yīng)于59類不同的癌癥表型中,包含820個“Biomarker-疾病表型”關(guān)聯(lián)

13、,平均兩個癌癥表型有8個相同的Biomarer;每個Biomarker出現(xiàn)在13個癌癥表型中。所有59個結(jié)點,連接成一個聯(lián)通圖,沒有孤立結(jié)點或子網(wǎng)。
   比較DBN和基于疾病基因的疾病表型網(wǎng)絡(luò)(DAN)
   疾病基因和蛋白Biomarker描述的腫瘤表型之間關(guān)系具有等效性。
   第二部分
   SW-RWR算法
   是在隨機(jī)行走算法(Random Walks Ranking,RWR)的基礎(chǔ)

14、上,利用腫瘤表型關(guān)聯(lián)網(wǎng)絡(luò)的先驗知識,指導(dǎo)PPI網(wǎng)絡(luò)中隨機(jī)行走策略。SW-RWR是為解決腫瘤蛋白Biomarker發(fā)掘的問題對RWR算法的改進(jìn)。
   SW-RWR算法對白血病蛋白Biomarker的排序
   1)從基于腫瘤Biomarker的表型關(guān)聯(lián)網(wǎng)絡(luò)中,依據(jù)相似性得分提取白血病相關(guān)的疾病表型;
   2)分析白血病與選擇的表型之間的相關(guān)性:與白血病相關(guān)聯(lián)的這5個癌癥表型,其疾病基因與白血病疾病基因之間通過蛋

15、白質(zhì)相互作用緊密關(guān)聯(lián);
   3)SW-RWR選擇的20個蛋白的生物學(xué)意義分析,顯示出與白血病分子機(jī)制的強(qiáng)相關(guān)性;
   4)通過敏感性和準(zhǔn)確率(使用陽性預(yù)測值,PPV)評估對白血病蛋白Biomarker的預(yù)測效力:SW-RWR優(yōu)于ZRWR。
   SW-RWR算法對肺癌蛋白Biomarker的排序
   1)建立基于GWAS的疾病表型關(guān)聯(lián)網(wǎng)絡(luò):分別創(chuàng)建了3個疾病相關(guān)網(wǎng)絡(luò)(DAN),網(wǎng)絡(luò)結(jié)點為疾病表型,網(wǎng)

16、絡(luò)關(guān)聯(lián)分別定義為:疾病表型之間有相同的SNP位點(DAS)-DAN1,相同的DAS對應(yīng)基因-DAN2,或相同的DAs對應(yīng)的染色體區(qū)域-DAN3。共包含85個不同的節(jié)點,代表85個獨立疾病表型。
   2)DAN中抽取與肺癌關(guān)聯(lián)的子網(wǎng):確定5個肺癌相關(guān)的疾病表型,這5個疾病和肺癌在遺傳學(xué)上有相同的異?;?;這些疾病基因之間通過直接或間接地PPI相互連接,表示了疾病之間的分子機(jī)制的內(nèi)在關(guān)聯(lián);同時,在病理研究上,這5個疾病也有與肺癌關(guān)

17、聯(lián)緊密的證據(jù)。
   3)SW-RWR選擇的20個蛋白的生物學(xué)意義分析;
   4)通過敏感性和準(zhǔn)確率評估對肺癌蛋白Biomarker的預(yù)測效力:SW-RWR優(yōu)于RWR。
   第三部分
   AFP以及類自蛋白家族分子演化分析
   1)進(jìn)化樹顯示,蛋白的進(jìn)化與物種的進(jìn)化是一致的,就AFP分支來看,雞較人、狗、大鼠、小鼠同源性較低,而更相似于其旁系同源物--雞ALB;大鼠與小鼠之間AFP同源性較

18、高,人與狗之間AFP同源性較高。類白蛋白家族成員,在魚類只存在一個,兩棲類有兩個,鳥類有三個,哺乳類有四個。
   2)結(jié)構(gòu)域分析。在七鰓鰻中發(fā)現(xiàn)了具有多個結(jié)構(gòu)域的白蛋白,由此可以推測,在原索動物或無脊椎動物中存在單個的類似白蛋白結(jié)構(gòu)域的蛋白。來自于同一個蛋白的不同白蛋白結(jié)構(gòu)域之間較與其直系同源蛋白對應(yīng)的白蛋白結(jié)構(gòu)域差別較大,可以推測,基因復(fù)制事件是以蛋白為單位的。類白蛋白家族成員,第一和第二結(jié)構(gòu)域較第三結(jié)構(gòu)域更為相似,可推斷最

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論