基于高通量測序技術的全基因組甲基化研究.pdf_第1頁
已閱讀1頁,還剩92頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、高通量測序技術具有測序速度快、成本低、通量高等優(yōu)點,其發(fā)展給生物學多個領域的研究帶來了一場空前的革命。DNA甲基化和基因表達、基因印跡、發(fā)育、衰老、癌癥發(fā)生等生物過程有著密切的關系。DNA甲基化在全基因組上的分布,對于系統(tǒng)性的研究DNA甲基化在上述生物過程中的作用有著重要的作用。以往,基因組DNA甲基化的研究由于受限于檢測方法,往往僅限于基因組的局部區(qū)域和位點。即使將高密度基因芯片應用到DNA甲基化研究領域,由于全基因組覆蓋式芯片價格昂

2、貴,所以一些研究往往也只能覆蓋有限的CpG島或者是部分染色體。高通量測序技術的問世,為真正意義上的全基因組甲基化檢測提供了一個有力的工具。本論文以白血病細胞系K562為研究對象,結(jié)合高通量測序技術和甲基化DNA免疫沉淀技術(MeDIP-Seq)對全基因組DNA甲基化檢測進行了研究,重點研究了MeDIP-Seq的文庫制備方法、數(shù)據(jù)分析方法以及K562細胞系的全基因組甲基化分布特征。主要研究內(nèi)容和成果如下:
   1.用于全基因組D

3、NA甲基化分析的MeDIP-Seq文庫制備方法。
   MeDIP-Seq是一種全新的全基因組甲基化分析方法。它是將甲基化DNA免疫沉淀和高通量DNA測序技術結(jié)合在一起的一種策略。甲基化DNA免疫沉淀技術,使用甲基化胞嘧啶抗體,或者甲基化結(jié)合蛋白,將甲基化DNA片段從非甲基化片段中有效的分離出來。甲基化DNA免疫沉淀技術和高通量測序技術相結(jié)合,可以有效的識別基因組中甲基化的片段,從而繪制全基因組的DNA甲基化圖譜。該方法相比較與

4、亞硫酸氫鹽反轉(zhuǎn)測序的優(yōu)點在于,不需要較多的測序通量、成本低,數(shù)據(jù)處理方法簡單,無需高性能運算服務器用于大規(guī)模的基因組拼接。但是,在實際應用中MeDIP技術和高通量測序技術結(jié)合主要存在兩點障礙:1)MeDIP的產(chǎn)物量太少。4-5μg的全基因組DNA底物,經(jīng)過MeDIP免疫沉淀后,大約能夠得到200ng左右的MeDIP產(chǎn)物。這個量對于制備高通量測序文庫有一定的難度。2)基因組DNA經(jīng)過MeDIP反應之后,由原來的雙鏈DNA變成單鏈DNA。因

5、為anti-5mC抗體識別單鏈DNA上甲基化胞嘧啶效果較好,所以在免疫沉淀之前,基因組DNA經(jīng)過了變性的過程,而單鏈DNA并不適合制備高通量測序文庫。為此,我們設計了一對帶有酶切位點的通用接頭,在MeDIP之前將接頭連接到DNA片段兩端。MeDIP完成后,利用通用引物對MeDIP產(chǎn)物進行擴增,再利用特異性內(nèi)切酶將接頭完全切除,以制備高通量測序文庫。我們用該方法成功的制備了白血病細胞系K562的MeDIP-Seq測序文庫,并用亞硫酸氫鹽反

6、轉(zhuǎn)測序結(jié)果驗證了所制備文庫的測序結(jié)果,結(jié)果顯示兩者呈現(xiàn)顯著相關性(R2=0.92,Pearson檢驗)。我們用兩次重復實驗驗證了文庫制備方法的可重復性,結(jié)果顯示兩次實驗的測序reads分布呈顯著相關性(R2=0.92,Pearson檢驗)。結(jié)果證明我們的方法提供了一種穩(wěn)定、可靠的MeDIP-Seq文庫制備策略。
   2.基于SOLiD測序方法的改進型MeDIP-Seq文庫制備方法。
   我們開發(fā)的原始MeDIP-Se

7、q文庫制備方法使用了包含內(nèi)切酶識別位點的通用接頭。這種接頭的使用克服了MeDIP文庫量少、單鏈,這兩個不利于制備測序文庫的缺點。同時這種接頭也引入了另外一些風險,主要包括:1)酶切不完全,導致測序文庫包含接頭序列;2)酶切可能破壞文庫中其他包含有該酶切位點的區(qū)域:3)酶切以及酶切完成后的文庫純化造成測序文庫損失。為此,我們設計了一種無需切除通用接頭的MeDIP-Seq文庫的制備方法。這種方法借助了制備測序文庫的SOLiD接頭來擴增MeD

8、IP文庫,而取代了外源接頭。且該方法制備的測序文庫只包含MeDIP產(chǎn)物的兩端序列,不包含MeDIP產(chǎn)物的中間序列,提高了MeDIP產(chǎn)物的測序效率,同時為從測序reads定位MeDIP產(chǎn)物提供了更準確的方法。我們比較了該方法和原始方法制備的兩組文庫的測序reads,證明該制備方法并沒有產(chǎn)生任何偏向性,且和原始方法制備的文庫有顯著相關性(R2=0.92,Pearson檢驗)。同時結(jié)果顯示該方法制備的文庫相對于原始方法,可用reads的比例有

9、一定程度的提高。結(jié)果證明優(yōu)化后的方法能夠提供更好的MeDIP-Seq文庫制備方法。
   3.MeDIP-Seq測序數(shù)據(jù)的生物信息學分析研究。
   利用MeDIP-Seq技術來繪制全基因組甲基化圖譜的一個重要的關鍵點在于如何從龐大的、復雜無序的測序數(shù)據(jù)中提取DNA甲基化的分布信息。本論文提出了一種基于泊松分布的搜峰方法,通過MeDIP-Seq數(shù)據(jù)在全基因組范圍內(nèi)識別甲基化區(qū)域。在這項研究中,我們分別比較了不同的分布模型

10、和搜峰窗寬對結(jié)果的影響。我們用泊松分布和負二項分布來擬合MeDIP-Seq數(shù)據(jù),比較研究的結(jié)果顯示泊松分布更適合于MeDIP-Seq數(shù)據(jù)的分析。我們對不同搜峰窗寬對結(jié)果的影響進行比較,結(jié)果顯示取MeDIP產(chǎn)物的長度(500bp)為搜峰窗寬可得到最好的效果。另外,我們還研究了用MeDIP-Seq數(shù)據(jù)推算DNA的絕對甲基化水平。結(jié)果顯示相對于我們開發(fā)的基于泊松分布的搜峰方法,該工作需要更多量的測序數(shù)據(jù)。研究結(jié)果表明,基于泊松分布的搜峰方法可

11、以作為一種可靠、準確的MeDIP-Seq數(shù)據(jù)分析工具。
   4.K562細胞系全基因組甲基化分析。
   我們以白血病細胞K562為研究對象,利用MeDIP-Seq的測序結(jié)果,繪制了K562細胞的全基因組甲基化圖譜,識別了約1.4×105個不短于500bp的甲基化區(qū)域,并對甲基化區(qū)域在轉(zhuǎn)錄起始位點上游區(qū)(TSS-upstream)、轉(zhuǎn)錄終止位點下游區(qū)(TES-downstream)、3’非翻譯區(qū)(3’untransla

12、ted region,3'UTR)、5’非翻譯區(qū)(5’untranslated region,5’UTR)、內(nèi)含子(Intron)、外顯子(Exon)等特征區(qū)域的分布進行了描述。我們還對基因啟動子區(qū)、CpG島的甲基化進行了研究。研究結(jié)果表明DNA甲基化更趨向于分布在基因的3’末端、基因間區(qū)而非基因的5’末端,同時我們發(fā)現(xiàn)了部分已經(jīng)被證明和癌癥、白血病相關的抑癌基因的啟動子區(qū)發(fā)生甲基化。同時我們分析了DNA甲基化和CpG位點密度的關系,結(jié)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論