人類細胞系中遠程增強子--啟動子相互作用的識別研究.pdf_第1頁
已閱讀1頁,還剩103頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、真核細胞中,基因表達精準的時間和空間調控對于不同生物學進程尤為關鍵。其中,眾多的DNA反應活動受到不同順式調控元件的協(xié)同調控,如轉錄啟動子、增強子和絕緣子等。由于染色質折疊,空間染色質結構使得增強子能夠在三維空間中作用于距離自身數(shù)十甚至上百Kb堿基的靶啟動子并調控相關基因的表達。增強子-啟動子相互作用在組織特異性基因表達調控中起關鍵作用并可能導致人類相關疾病的發(fā)生。近年來,大量高通量染色體構象捕獲技術的發(fā)展使人們深入研究這些相互作用成為

2、可能,比如:染色體構象捕獲(3C),4C(circular3C),5C(3C-carboncopy),Hi-C(3C variant)和ChIA-PET。與此同時,隨著各種高通量測序技術的發(fā)展,各個實驗平臺產生了大量基因組信號的深測序文件,這些組學數(shù)據(jù)使人們在不同的基因組范圍內研究遠程相互作用和不同類基因組信號之間的調控關系成為可能。
  本文開發(fā)了新的計算方法并用來識別人類四個細胞系GM12878,H1-hESC,HeLa-S3

3、和K562中遠程增強子-啟動子相互作用。我們不僅發(fā)現(xiàn)了許多潛在的影響遠程互作用識別的重要基因組信號,還分析了它們的位置,分布,關聯(lián)等屬性。最后,我們通過多種模型研究了組蛋白修飾,轉錄因子,增強子RNA,DNA甲基化等多種基因組信號與遠端增強子靶基因的表達調控關系,并在遠端增強子調控靶基因的機制中發(fā)現(xiàn)了組蛋白修飾,轉錄因子等不同類基因組信號對應不同的調控特點。論文主要的研究內容概括如下:
  一、基于前人構建的5C技術數(shù)據(jù)庫,我們從

4、不同類別的信號中提取增強子,啟動子,loop區(qū)域的對應特征,比如轉錄因子,組蛋白修飾,DNA甲基化,增強子RNA,核小體位置,染色質狀態(tài),拓撲關聯(lián)域等等。然后組合上述特征,提出BRCFS特征選擇方法和隨機森林分類器在人類四個細胞系中預測遠程增強子-啟動子相互作用。和Roy等的結果比較,我們的10折交叉檢驗AUPR精度提高了11%-16%,獨立檢驗的AUPR精度提高了4%-8%。通過分析識別中的特征重要性,我們發(fā)現(xiàn)了很多潛在特征的重要作用

5、,比如:增強子RNA,核小體位置等。并且我們發(fā)現(xiàn)loop區(qū)域的特征對遠程互作用的識別起著很大的作用;另外,不同類信號對于遠程互作用的識別具有調控區(qū)域特異性和細胞系特異性。最后我們發(fā)現(xiàn)這些重要的特征在正負集樣本中有很大的分布差異。
  二、考慮到遠程增強子-啟動子相互作用受到不同基因組信號,序列元件以及DNA空間結構等多方面協(xié)同作用;我們整合轉錄因子,組蛋白修飾,DNA甲基化,增強子RNA,核小體位置,DNA結構屬性,轉錄因子結合模

6、體等信號特征,開發(fā)了一種更加高效的方法去預測增強子-啟動子相互作用?;谠鰪娮?,啟動子,loop區(qū)域的組合特征,我們使用隨機森林和梯度提升算法在人類細胞系中對增強子-啟動子相互作用進行了有效的預測?;谕瑯拥臄?shù)據(jù)庫,與Roy等的結果比較,我們在同一個細胞系中10折交叉檢驗結果提高了15%-24%;在新的細胞系中獨立檢驗的結果提高了9%-14%。期間,我們綜合學習了不同類型重要特征的貢獻特點,并進一步發(fā)現(xiàn)了DNA結構屬性,轉錄因子結合模體

7、對于遠程相互作用識別的重要貢獻。我們對重要的基因組信號特征做了偏相關網(wǎng)絡模型分析,并發(fā)現(xiàn)了它們之間重要的關聯(lián)屬性。
  三、在人類四個細胞系中,我們使用多種回歸模型研究了增強子靶基因表達水平與不同基因組信號的關系,這些信號包括11種組蛋白修飾,大于120種轉錄因子,染色質可及性,增強子RNA,DNA甲基化和核小體位置。通過結果分析,我們發(fā)現(xiàn)基因表達的預測值和觀測值之間有很強的關聯(lián)性。然而,有增強子調控的基因樣本集的關聯(lián)系數(shù)比無調控

8、的基因樣本集要高很多,說明遠程增強子會協(xié)同多類基因組信號促進相關基因的表達。
  四、通過分析不同信號對遠端增強子靶基因表達水平的貢獻能力,我們發(fā)現(xiàn)遠端增強子調控的基因中,轉錄因子在增強子和啟動子區(qū)域對基因表達水平具有較強的影響;而組蛋白修飾在啟動子和loop調控區(qū)域對基因表達水平具有較強的影響。對比同一個細胞系正負數(shù)據(jù)集中不同信號特征的重要性分值變化,我們發(fā)現(xiàn)很多組蛋白修飾和部分特異性的轉錄因子發(fā)生了很大的變化,說明這些特征協(xié)同

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論