人類轉錄因子靶基因預測、分析及數(shù)據(jù)庫構建.pdf_第1頁
已閱讀1頁,還剩123頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、生命體在不同發(fā)育時期和不同組織部位,所表達基因的種類和數(shù)量不同,從而導致細胞分化、個體發(fā)育及不同組織器官的不同結構和生理功能。轉錄因子(Transcription factor,TF)是這種在特定的時間和空間條件下,基因選擇性表達的重要調控因子,它能結合到特定DNA序列上發(fā)揮基因轉錄調控作用。獲得轉錄因子的靶基因是轉錄因子調控研究的基礎,不同組織條件下的轉錄因子靶基因對該轉錄因子的調控研究也有重要參考意義。本項目中我們收集了人類轉錄因子

2、的多種公共數(shù)據(jù),采用改進的預測方法進行靶基因預測,綜合考慮和分析了表觀修飾狀態(tài)對轉錄因子結合的影響,預測了相對可靠的人類轉錄因子靶基因,并構建了開源的人類轉錄因子靶基因數(shù)據(jù)庫,同時分析了轉錄因子的細胞系特異性調控、轉錄因子間的協(xié)作調控和轉錄因子對lncRNA的調控等,取得了如下研究成果。
  第一、我們獲得了較大規(guī)模的人類轉錄因子靶基因數(shù)據(jù),并構建了相應數(shù)據(jù)庫。我們使用了ChIP-Seq分析和轉錄因子結合位點(Transcript

3、ion Factor Binding Sites,TFBS)掃描兩種方法預測轉錄因子的靶基因。第一種方法是基于ChIP-Seq高通量測序的實驗數(shù)據(jù)。首先,我們從ENCODE和NCBI等數(shù)據(jù)庫收集了488個人類轉錄因子的3231組ChIP-Seq數(shù)據(jù),預測該轉錄因子在基因組上的結合峰(Peak)。然后根據(jù)前1000個結合峰預測并過濾出至多5個可信的模體(Motif),再在所有結合峰中掃描可信模體獲得轉錄因子的結合位點(TFBS),并根據(jù)T

4、FBS與轉錄起始位點的距離,采用指數(shù)衰減的BETA模型量化轉錄因子對靶基因的調控能力,得到轉錄因子靶基因。最后,匯總每個轉錄因子在多個樣本中的靶基因預測結果及考慮靶基因的表觀修飾狀態(tài),進一步過濾得到轉錄因子整合的靶基因預測結果,轉錄因子靶基因的中位數(shù)是342。第二種方法使用轉錄因子已知的結合模體預測靶基因。我們從TRANSFAC、JASPAR、HOCOMOCO等轉錄因子數(shù)據(jù)庫收集了699個轉錄因子的2737個模體的位置權重矩陣(Posi

5、tion Weight Matrix,PWM),通過掃描人類、小鼠、大鼠的基因組保守區(qū)域預測轉錄因子的潛在靶基因?;谏鲜鼋Y果,我們構建了人類轉錄因子靶基因的數(shù)據(jù)庫hTFtarget(http://bioinfo.life.hust.edu.cn/hTFtarget),方便用戶查詢和使用。用戶可以通過多種查詢方式方便地獲取預測結果,包括查詢轉錄因子靶基因和查詢靶基因的轉錄因子,也可以進行聯(lián)合查詢、批量查詢或者對預測結果進行篩選。

6、  第二、我們根據(jù)預測結果對轉錄因子的調控機理進行了探索。首先,我們探索了轉錄因子結合位點與表觀修飾狀態(tài)的關聯(lián),發(fā)現(xiàn)在多數(shù)情況下轉錄因子排序靠前的結合峰傾向于結合到活化的轉錄起始位點及其擴展區(qū)域附近,并且同一轉錄因子的多個樣本或者同一家族的轉錄因子,它們的結合峰傾向于富集到相似的表觀修飾狀態(tài)。其次,我們分析了14個轉錄因子在10個不同細胞系中普遍性調控和特異性調控的靶基因,并根據(jù)這些靶基因功能富集的結果討論了這些轉錄因子在一般狀態(tài)下和特

7、定組織中的功能。最后,我們使用機器學習的方法分析了各細胞系中轉錄因子間的協(xié)同作用,得到了伴侶因子對轉錄因子的相對重要系數(shù)(Relative Importance,RI),定量地描述了轉錄因子間協(xié)同作用的強弱。
  第三,我們分析了轉錄因子對lncRNA的調控作用,及SNP對轉錄因子結合的影響。首先,我們分析了轉錄因子對不同類型基因的調控情況,發(fā)現(xiàn)轉錄因子更傾向于調控蛋白編碼基因和lncRNA基因。其次,我們預測得到了可能造成調控關

8、系失效的9,815,083個SNP位點,其中231,558個SNP位于lncRNA基因的啟動子區(qū)域,這些SNP位點可能導致轉錄因子對lncRNA調控的丟失。最后,我們將這些導致調控關系失效的SNP位點,與我們另一個收集整理lncRNA與SNP關系的數(shù)據(jù)庫lncRNASNP中的lncRNA-SNP數(shù)據(jù)進行了比較,其中68,597個SNP位于lncRNASNP中。
  本研究采用系統(tǒng)的方法預測了人類轉錄因子的靶基因,構建了人類轉錄因子

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論