版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、病毒是一類只能夠在活著的宿主細(xì)胞內(nèi)復(fù)制的感染源。病毒個(gè)體微小、構(gòu)造簡(jiǎn)單,除朊病毒(僅由蛋白構(gòu)成)外,病毒均由一種作為遺傳物質(zhì)的核酸(DNA或RNA)與蛋白質(zhì)構(gòu)成。病毒種類多樣,宿主范圍廣,具有細(xì)胞結(jié)構(gòu)的生物均可以是病毒的宿主。病毒基因組作為病毒遺傳信息的載體,是研究病毒的核心數(shù)據(jù)。隨著高通量測(cè)序技術(shù)的普及,對(duì)病毒基因組進(jìn)行高通量測(cè)序已成為研究病毒遺傳、進(jìn)化的主要手段。面對(duì)高通量測(cè)序產(chǎn)出的大量數(shù)據(jù),就要求生物信息學(xué)分析能夠盡可能多地挖掘出
2、其中病毒基因組的有效信息。本文的研究目的即是探索出不同數(shù)據(jù)類型下,高通量測(cè)序數(shù)據(jù)中病毒基因組的生物信息學(xué)分析方法。
本文從課題組積累的高通量測(cè)序數(shù)據(jù)及分析需求出發(fā),探索了從高通量測(cè)序數(shù)據(jù)中挖掘病毒基因組中有效信息的分析方法。本文圍繞病原微生物,分析其測(cè)序數(shù)據(jù)中病毒基因組的相關(guān)信息,具體分為兩個(gè)部分:
1、細(xì)菌高通量測(cè)序數(shù)據(jù)中溶原性噬菌體的分析;
2、復(fù)雜測(cè)序樣品中的病毒發(fā)現(xiàn)及基因組分析。
細(xì)菌高通
3、量測(cè)序數(shù)據(jù)中溶原性噬菌體的分析
溶原性噬菌體是一類能夠整合入宿主菌基因組中,隨宿主菌的復(fù)制而傳代的病毒。在某些條件的誘導(dǎo)下,也能夠脫離宿主基因組,產(chǎn)生子代噬菌體釋放出來。溶原性噬菌體的復(fù)制特性決定了它具有介導(dǎo)基因水平轉(zhuǎn)移的功能,往往能夠?qū)λ拗骶闹虏⌒援a(chǎn)生重要影響,如德國(guó)發(fā)現(xiàn)的腸出血性大腸桿菌O104:H4的主要毒力基因就是由前噬菌體所編碼。本文以分離自足部潰爛病人的72株細(xì)菌基因組測(cè)序數(shù)據(jù)為研究對(duì)象,以溶原性噬菌體復(fù)制機(jī)制為
4、理論模型,研究發(fā)現(xiàn)新的溶原性噬菌體基因組及其整合特征,為了解噬菌體的生物學(xué)特性及防控高致病性細(xì)菌感染提供基礎(chǔ)。
采用生物信息學(xué)軟件與自編程序相結(jié)合的方式進(jìn)行數(shù)據(jù)處理與分析。使用NGS QC Toolkit v2.3.3對(duì)原始測(cè)序數(shù)據(jù)進(jìn)行質(zhì)量控制,去除短讀長(zhǎng)及低質(zhì)量數(shù)據(jù)。針對(duì)Ion Torrent平臺(tái)數(shù)據(jù)特點(diǎn),選擇了商業(yè)軟件Newbler v3.0作為數(shù)據(jù)組裝軟件。使用perl腳本編程,搭建前噬菌體預(yù)測(cè)分析流程,對(duì)組裝得到的co
5、ntigs進(jìn)行前噬菌體預(yù)測(cè)。為得到活躍的前噬菌體基因組,選用兩種輔助拼接工具,ContigScape插件顯示組裝后contigs之間的連接信息,商業(yè)軟件CLC Genomics Workbench9進(jìn)行序列調(diào)整及拼接結(jié)果檢查。使用實(shí)驗(yàn)室內(nèi)部軟件對(duì)contigs進(jìn)行連接。同時(shí)使用RAST在線注釋工具對(duì)得到的溶原性噬菌體基因組進(jìn)行注釋。最后,綜合分析得到的溶原性噬菌體基因組結(jié)構(gòu)、整合位點(diǎn)、進(jìn)化關(guān)系等信息,挖掘其中的潛在信息。
在7
6、2株細(xì)菌基因組數(shù)據(jù)中,共有11株細(xì)菌數(shù)據(jù)中發(fā)現(xiàn)了前噬菌體脫離細(xì)菌基因組進(jìn)行復(fù)制的現(xiàn)象。對(duì)能夠脫離細(xì)菌基因組進(jìn)行復(fù)制的噬菌體序列進(jìn)行拼接,共得到14個(gè)活化的前噬菌體全基因組序列,其中11株與目前已知的噬菌體序列同源性很低,為本文新發(fā)現(xiàn)的噬菌體序列。新序列的發(fā)現(xiàn)表明本文研究方法可用于新溶原性噬菌體的發(fā)現(xiàn),增加科研人員對(duì)噬菌體的認(rèn)知。分析發(fā)現(xiàn),整合狀態(tài)下噬菌體整合酶基因均與其整合位點(diǎn)緊鄰。溶原性噬菌體的整合位點(diǎn)序列長(zhǎng)短特征不一,但表現(xiàn)出與其整
7、合酶具有相關(guān)性。同一整合位點(diǎn)可供多種具有相似整合酶的溶原性噬菌體整合,提供了前噬菌體預(yù)測(cè)的新思路。宿主為同一屬內(nèi)的細(xì)菌的溶原性噬菌體具有相似的基因組結(jié)構(gòu)。
復(fù)雜測(cè)序樣品中的病毒發(fā)現(xiàn)及基因組分析
由于病毒分離培養(yǎng)周期長(zhǎng),成功率低,我們常常要對(duì)一些復(fù)雜樣品進(jìn)行高通量測(cè)序,然后獲取其中的有效病毒信息,這就給數(shù)據(jù)分析帶來了一定的挑戰(zhàn)。課題組近年來開展了使用高通量測(cè)序?qū)εR床樣品進(jìn)行病原檢測(cè)的工作,要求數(shù)據(jù)分析能夠快速準(zhǔn)確地發(fā)現(xiàn)
8、臨床樣品中的病原。目前單一的生物信息學(xué)軟件不能滿足我們對(duì)于復(fù)雜測(cè)序樣品的分析需求,鑒于此開發(fā)了分析軟件《高通量測(cè)序數(shù)據(jù)病原體歸類分析軟件v1.0》。該軟件能夠?qū)?xì)菌、真菌、原蟲、病毒4種類型的病原進(jìn)行檢測(cè),同時(shí)在應(yīng)對(duì)復(fù)雜樣品中已知或未知病毒的發(fā)現(xiàn)工作表現(xiàn)出良好的效果。
復(fù)雜樣品中已知病毒的發(fā)現(xiàn),以2016年7月北京發(fā)現(xiàn)的輸入性裂谷熱病例為例。通過使用分析軟件對(duì)測(cè)序數(shù)據(jù)分析,發(fā)現(xiàn)了大量的裂谷熱病毒序列,確認(rèn)了裂谷熱病毒為致病原,
9、并在第一時(shí)間獲得了該株裂谷熱病毒的全基因組序列。該株裂谷熱病毒與2009年南非發(fā)現(xiàn)的Kakamas株同源性最高,進(jìn)化分析提示該株病毒沒有發(fā)生重組。
復(fù)雜樣品中未知病毒的發(fā)現(xiàn),以勐海彈狀病毒的發(fā)現(xiàn)為例。該株病毒分離自云南勐海地區(qū)捕獲的白紋伊蚊,以C6/36細(xì)胞培養(yǎng)后,使用常見病毒引物無法鑒定出是何種病毒。通過對(duì)其高通量測(cè)序數(shù)據(jù)的分析,排除掉宿主細(xì)胞、其他細(xì)菌、病毒等干擾因素,獲得了該株病毒的全基因組序列。序列分析顯示其為一株新型
10、的彈狀病毒,命名為勐海彈狀病毒,與發(fā)現(xiàn)于秘魯?shù)牧硗鈨芍晡妹綇棤畈《咀顬橄嗨啤?br> 在對(duì)勐海彈狀病毒的基因組分析中,本文還對(duì)選取的93株彈狀病毒參考序列進(jìn)行了病毒末端序列分析。發(fā)現(xiàn)其中的45株均具有短反向重復(fù)末端序列的特點(diǎn),分布于不同的屬中??袢《緦賰?nèi)具有非常一致的末端序列“ACGCTTAAC”,而Ephemerovirus、Vesiculovirus、Tibrovirus和Sprivivirus四個(gè)屬的病毒則均有“ACGAAGA
11、”的一致末端序列。病毒基因組的末端序列常常與其基因組復(fù)制相關(guān),其末端序列往往是相對(duì)嚴(yán)格的,這表明短反向重復(fù)末端序列很可能是彈狀病毒科病毒基因組的一類特點(diǎn)。
綜上,本文在現(xiàn)有病毒基因組分析方法的基礎(chǔ)上,提出了以細(xì)菌測(cè)序數(shù)據(jù)分析活化的前噬菌體全基因組及其整合位點(diǎn)的分析方法,能夠用于新溶原性噬菌體發(fā)現(xiàn),為了解溶原性噬菌體提供新知識(shí)。開發(fā)了高通量測(cè)序數(shù)據(jù)病原體歸類分析軟件,取得軟件著作權(quán),并在未知病原檢測(cè)中發(fā)揮良好的作用。通過數(shù)據(jù)分析
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 利用Ion Torren測(cè)序平臺(tái)和生物信息學(xué)分析幾株細(xì)菌和病毒基因組.pdf
- 副粘病毒Tianjin株全基因組測(cè)序及生物信息學(xué)分析.pdf
- Pannonibacter phragmitetus 31801的基因組測(cè)序和生物信息學(xué)分析.pdf
- 溶血不動(dòng)桿菌的全基因組測(cè)序及生物信息學(xué)分析.pdf
- 尿道致病性大腸埃希菌全基因組高通量測(cè)序及生物信息學(xué)數(shù)據(jù)分析.pdf
- 牛丘疹性口炎病毒的分離、全基因組測(cè)序及其生物信息學(xué)分析.pdf
- 人乙肝病毒基因組多態(tài)性的生物信息學(xué)分析及意義.pdf
- 2株溶血不動(dòng)桿菌全基因組測(cè)序及生物信息學(xué)分析.pdf
- 鏈狀亞歷山大藻microRNA高通量測(cè)序及生物信息學(xué)分析.pdf
- 水稻基因組結(jié)構(gòu)變異的生物信息學(xué)分析.pdf
- 東農(nóng)冬麥1號(hào)越冬期間的microRNA高通量測(cè)序及生物信息學(xué)分析.pdf
- 115株SARS冠狀病毒全基因組序列的生物信息學(xué)分析.pdf
- 多耐藥Myroides odoratimimus PR63039的全基因組測(cè)序和生物信息學(xué)分析.pdf
- SARS冠狀病毒基因組及其編碼結(jié)構(gòu)蛋白的生物信息學(xué)研究.pdf
- 11574.高通量測(cè)序數(shù)據(jù)誤差分析方法研究
- 高通量測(cè)序數(shù)據(jù)存儲(chǔ)系統(tǒng)
- 川牛膝全基因組高通量測(cè)序及初步數(shù)據(jù)分析.pdf
- microRNA深度測(cè)序數(shù)據(jù)分析的生物信息學(xué)算法及應(yīng)用.pdf
- 1型鴨肝炎病毒基因組測(cè)序及基因組結(jié)構(gòu)分析.pdf
- myc基因的生物信息學(xué)分析
評(píng)論
0/150
提交評(píng)論