基于系統(tǒng)生物學(xué)的前列腺癌生物靶點(diǎn)的整合分析.pdf_第1頁
已閱讀1頁,還剩275頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、目的:
  前列腺癌是歐美等發(fā)達(dá)國家和地區(qū)最常見的男性惡性腫瘤之一,其死亡率已居各種癌癥的第二位。前列腺癌的發(fā)生是多種調(diào)控因子共同作用的結(jié)果,然而前列腺癌的發(fā)生機(jī)制至今尚未明確。那么如何尋找治療前列腺癌的有效靶點(diǎn)成為了亟待解決的問題。隨著生物大規(guī)模分型技術(shù)的發(fā)展使全基因組范圍尋找前列腺癌風(fēng)險(xiǎn)靶點(diǎn)成為可能,如單核苷酸多態(tài)性(SingleNucleotidePolymorphism,SNP)位點(diǎn)分型。在這項(xiàng)研究中,全基因組關(guān)聯(lián)研究(G

2、enome-WideAssociationStudies,GWAS)通過大量比較疾病患者(病例,case)和相同條件下的無該疾病的人(對(duì)照,control)的SNP-表型關(guān)聯(lián)來尋找疾病的潛在風(fēng)險(xiǎn)靶點(diǎn)。另外一種方法是通過基因芯片技術(shù)大規(guī)模篩選前列腺癌的差異表達(dá)基因,然后通過基因本體、通路富集分析或基因網(wǎng)絡(luò)分析對(duì)這些差異表達(dá)基因進(jìn)一步篩選以獲得潛在的基因治療靶點(diǎn)。但以上兩種研究方法都具有一定的局限性。雖然全基因組關(guān)聯(lián)研究發(fā)現(xiàn)了大量的疾病風(fēng)險(xiǎn)

3、SNPs,但相對(duì)全基因組SNPs來說仍然只是極小的一部分。而且研究發(fā)現(xiàn)絕大部分報(bào)導(dǎo)的SNPs都不處于基因編碼區(qū),這就意味著如何來解釋這些SNPs的功能是整個(gè)研究最大的難題。另外,基因差異表達(dá)篩選旨在尋找單個(gè)或多個(gè)最具可能的致病基因,然而這些基因的致病機(jī)制卻沒有得到有效的闡明,如在整個(gè)疾病的生物學(xué)過程中這些基因之間或與其他基因是否有相互作用,是如何相互作用的?
  方法:
  一、前列腺癌風(fēng)險(xiǎn)位點(diǎn)的后GWAS功能分析
 

4、 1.提取GWASCatalog數(shù)據(jù)庫報(bào)導(dǎo)的前列腺癌的風(fēng)險(xiǎn)SNPs,通過連鎖不平衡(linkagedisequilibrium,LD)獲得所有可能的風(fēng)險(xiǎn)SNPs;從文獻(xiàn)及公共數(shù)據(jù)庫搜集淋巴細(xì)胞系(lymphoblastoidcelllines,LCLs)相關(guān)的表達(dá)數(shù)量性狀座(expressionQuantitativeTraitLoci,eQTL)數(shù)據(jù);
  2.使用ANNOVAR軟件對(duì)所有SNPs進(jìn)行注釋分析;使用UCSC數(shù)據(jù)庫

5、現(xiàn)有的已知調(diào)控?cái)?shù)據(jù)對(duì)所有SNPs進(jìn)行注釋分析;使用eQTL對(duì)非編碼區(qū)的SNPs進(jìn)行注釋分析;獲得前列腺癌關(guān)聯(lián)基因;
  3.對(duì)前列腺癌關(guān)聯(lián)基因進(jìn)行基因本體(GeneOntology,GO)、通路富集分析;建立并分析前列腺癌特有的轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)。
  二、前列腺癌關(guān)聯(lián)SNPs顯著富集在cis-eQTL和轉(zhuǎn)錄因子結(jié)合位點(diǎn)(transcriptionfactorbindingsites,TFBS)
  1.定義前列腺癌GWAS

6、中p<10-3的SNPs為高關(guān)聯(lián)SNPs;從美國國家生物技術(shù)信息中心(NationalCenterforBiotechnologyInformation,NCBI)dbGaP數(shù)據(jù)庫下載GWAS數(shù)據(jù):TheCancerGeneticMarkersofSusceptibility(CGEMS)和TheMultiethnicCohort(MEC);從公共數(shù)據(jù)庫seeQTL和RegulomeDB中分別提取eQTL和TFBS數(shù)據(jù);
  2.

7、分別使用randomization和permutation方法檢驗(yàn)高關(guān)聯(lián)SNPs是否顯著富集于eQTL和/或TFBS;
  3.從GWASCatalog數(shù)據(jù)庫提取報(bào)導(dǎo)的癌癥關(guān)聯(lián)SNPs,使用randomization檢驗(yàn)這些SNPs的eQTL和TFBS富集情況;
  4.對(duì)eQTL和TFBS的富集結(jié)果進(jìn)行整合分析,獲得潛在功能SNPs靶點(diǎn)。
  三、基于GO的前列腺癌基因共表達(dá)模塊
  1.從前列腺癌基因表達(dá)芯片

8、數(shù)據(jù)和GO中生物過程(biologicalprocess,GO_BP)基因集(term)出發(fā),構(gòu)建每個(gè)term的基因表達(dá)矩陣;
  2.利用WGCNA計(jì)算每個(gè)GO_BPterm在兩個(gè)獨(dú)立前列腺癌基因表達(dá)矩陣間的保守程度;
  3.利用WGCNA對(duì)每個(gè)保守的BP_term建立共表達(dá)scale-free網(wǎng)絡(luò)并進(jìn)行聚類分析,獲得共表達(dá)模塊;
  4.計(jì)算共表達(dá)模塊的顯著性:1)計(jì)算每個(gè)共表達(dá)模塊的eigengene表達(dá),并判

9、斷模塊是否在疾病-對(duì)照(case-control)組間存在差異表達(dá),2)如果模塊存在差異表達(dá),則進(jìn)一步計(jì)算模塊的保守程度;
  5.對(duì)4中得到的重要模塊進(jìn)行基因富集分析,如eQTL、拷貝數(shù)變異(CopyNumberVariation,CNV)和突變(Mutation)基因集;
  6.如果模塊在顯著富集eQTL基因的前提下,也能在CNV和/或Mutation基因集中顯著富集,這個(gè)模塊將被定義為前列腺癌風(fēng)險(xiǎn)性模塊。我們進(jìn)一步對(duì)

10、這些風(fēng)險(xiǎn)性模塊進(jìn)行轉(zhuǎn)錄因子(transcriptionfactor,TF)和小RNA(microRNA,miRNA)富集,獲得能調(diào)控這些模塊的TF和miRNA。同時(shí)我們也檢驗(yàn)了這些富集的TF基因的差異表達(dá)情況。
  結(jié)果:
  一、前列腺癌風(fēng)險(xiǎn)位點(diǎn)的后GWAS功能分析
  從GWASCatalog中我們一共提取了49個(gè)SNPs,經(jīng)過LD計(jì)算一共獲得1828個(gè)前列腺癌潛在風(fēng)險(xiǎn)SNPs。ANNOVAR注釋表明有8,599,

11、377,4,12,6和10個(gè)SNPs分別位于外顯子,內(nèi)含子,剪切位點(diǎn),非編碼RNA,3’UTR,5’UTR,基因上游,基因下游區(qū)域,而其余的852個(gè)SNPs則位于非基因區(qū)。UCSC注釋結(jié)果表明1828個(gè)SNPs中,有284個(gè)SNPs位于UCSC定義的調(diào)控區(qū)域內(nèi),而這284個(gè)SNPs僅包含了86個(gè)非基因區(qū)的SNPs。對(duì)所有非基因區(qū)SNPs而言,eQTL比對(duì)解釋了其中138個(gè)SNPs。綜合ANNOVAR注釋,eQTL比對(duì)結(jié)果及GWASCat

12、alog本身報(bào)導(dǎo)的基因,我們共得到了205個(gè)前列腺癌風(fēng)險(xiǎn)基因,其中41個(gè)來自ANNOVAR注釋,151個(gè)來自于eQTL比對(duì),33個(gè)來自GWAS文獻(xiàn)報(bào)導(dǎo)。通過GO及通路富集,我們發(fā)現(xiàn)這些基因能有效的富集在癌癥相關(guān)的通路上,如細(xì)胞死亡調(diào)控,細(xì)胞凋亡,細(xì)胞增殖等。通過分析前列腺癌調(diào)控網(wǎng)絡(luò),我們發(fā)現(xiàn)了一些重要的癌癥調(diào)控因子,如IGF-1/IGF-2受體,SP1,CREB1,AR等轉(zhuǎn)錄因子。
  二、前列腺癌關(guān)聯(lián)SNPs顯著富集在cis-e

13、QTL和轉(zhuǎn)錄因子結(jié)合位點(diǎn)(transcriptionfactorbindingsites,TFBS)
  通過randomization和permutation計(jì)算結(jié)果對(duì)比,我們發(fā)現(xiàn)在前列腺癌GWASSNPs含有相對(duì)較少eQTLSNPs(eSNPs)情況下,randomization會(huì)導(dǎo)致假陰性,permutation則更為準(zhǔn)確。富集分析發(fā)現(xiàn)白種人群的GWASSNPs顯著地富集在cis-eQTL和TFBS,但在美國黑人和日本人群中

14、,我們卻并沒有發(fā)現(xiàn)這種顯著的富集模式。同時(shí)我們對(duì)GWASCatalog的SNPs進(jìn)行分析,也發(fā)現(xiàn)了這一種群差異性的富集模式。另外對(duì)CGEMS數(shù)據(jù)的整合分析我們發(fā)現(xiàn)了2個(gè)并沒有在GWAS平臺(tái)中出現(xiàn)的功能SNPs,rs2861405和rs4766642,可以通過eQTL和TFBS行駛調(diào)控功能。
  三、基于GO的前列腺癌基因共表達(dá)模塊
  首先我們發(fā)現(xiàn)了118個(gè)GO_BPterms在兩個(gè)數(shù)據(jù)集間(GSE17951,GSE6956

15、)具有較高的保守性(Zsummary>5)。利用這118個(gè)term的基因表達(dá)矩陣,我們共建立了548個(gè)共表達(dá)模塊,其中有294個(gè)模塊和前列腺癌有顯著關(guān)聯(lián)(p<0.05)。對(duì)這294個(gè)模塊進(jìn)一步分析,我們發(fā)現(xiàn)有55個(gè)模塊在GSE17951和GSE6956間具有很好的保守性(Zsummary>5)。然后我們使用eQTL、CNV和Mutation基因集對(duì)這55個(gè)模塊進(jìn)行富集分析,并發(fā)現(xiàn)了5個(gè)前列腺癌風(fēng)險(xiǎn)模塊M1~M5。TF富集分析結(jié)果表明M1

16、和M5模塊主要被NFAT調(diào)控,M2,M3和M4模塊主要被SP1調(diào)控;miRNA富集分析表明M1和M3被has-miR-19a調(diào)控,M4和M5被has-miR-15a調(diào)控,M2被has-miR-200b調(diào)控。
  結(jié)論:
  一、我們建立了系統(tǒng)生物學(xué)水平上前列腺癌GWASSNPs的整合分析。通過注釋、GO/通路富集和調(diào)控網(wǎng)絡(luò)構(gòu)建能有效闡明SNPs的作用機(jī)制,特別是那些位于非基因區(qū)的SNPs的調(diào)控功能。
  二、前列腺癌關(guān)

17、聯(lián)SNPs的調(diào)控機(jī)制具有種群差異性,即白種人群的關(guān)聯(lián)SNPs主要通過eQTL和TFBS這兩種方法來調(diào)控基因的表達(dá),而美國黑人或日本人群的關(guān)聯(lián)SNPs可能通過其他方法來進(jìn)行調(diào)控。
  三、通過建立及分析基于GO的前列腺癌共表達(dá)模塊,我們回答了(1)哪些GO項(xiàng)與前列腺癌潛在相關(guān),(2)GO項(xiàng)的哪些基因的可以形成共表達(dá)模塊,(3)哪些共表達(dá)模塊與前列腺癌相關(guān),(4)哪些共表達(dá)模塊能顯著富集癌基因的信號(hào)以及最終發(fā)現(xiàn)的共表達(dá)模塊又是由什么遺

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論