版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、基因組序列拼接是生物信息學領域的核心問題,測序產(chǎn)生的讀取片段 reads經(jīng)過序列拼接組裝,生成基因組的堿基序列。新一代測序技術的快速發(fā)展,為生命科學重大問題的研究提供巨大幫助的同時,其數(shù)據(jù)海量、讀取片段 reads長度短、精確度低等特點也為全基因組序列拼接提出了相當嚴峻的挑戰(zhàn),而傳統(tǒng)的序列拼接算法已不再適用。針對新一代測序的數(shù)據(jù)特點,研發(fā)能滿足實際應用需要的基因組序列拼接軟件,已顯得極為迫切。
本文首先簡要介紹了新一代測序技術
2、的產(chǎn)生背景、測序策略及技術特點等,認真分析了基因組序列拼接所面臨的主要挑戰(zhàn),比如大量重復片段的存在,reads數(shù)據(jù)海量、長度短及含有測序錯誤等,深入探討了當前基因組序列拼接所采用的主要策略,即貪心策略,交疊-排序-生成共有序列(OLC)策略和De Bruijn圖策略等,總結了不同算法的優(yōu)勢及不足,并提出了序列拼接算法的改進方向。
接著,本文提出了基于reads引導的基因組序列拼接算法,以整條reads為拼接的基本單位,并率先在
3、拼接算法中提出了基于信息累計和數(shù)據(jù)特征相結合的評分方法。該算法分為reads拼接和contigs組裝兩個階段,contigs是由reads拼接生成的長序列片段。reads拼接階段主要包括數(shù)據(jù)預處理、De Bruijn圖的建立、contigs構建等,而contigs組裝階段則主要有contigs相對位置的確定、交疊overlap檢測、contigs連接及空隙gaps填充等過程,其中在確定contigs的相對位置時首次提出了配對數(shù)目數(shù)組PE
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于序列拼接的基因組插入變異集成檢測.pdf
- 基因組短序列片段拼接算法研究.pdf
- 13769.宏基因組的序列拼接算法研究
- 基因組序列denovo拼接系統(tǒng)的設計與實現(xiàn)
- 2284.基于debruijn圖的宏基因組序列拼接算法實現(xiàn)
- 基因組序列片段快速拼接及其可視化.pdf
- 基因組序列快速拼接算法及可視化技術的研究.pdf
- 木瓜核基因組和線粒體基因組的拼接和初步分析.pdf
- 基于全基因組的DNA序列詞語挖掘.pdf
- 基因組序列特征分析.pdf
- 基于基因組序列比對信息挖掘的基因結構預測.pdf
- 基于錨點的多基因組序列比對算法.pdf
- 基于高通量測序的Klebsiella pneumoniae基因組拼接的研究.pdf
- 高通量全基因組DNA序列拼接的并行算法關鍵技術研究.pdf
- 26560.酵母基因組序列分析
- 水稻線粒體基因組——序列多態(tài)性和基因組進化,以及線粒體、葉綠體和細胞核基因組間的基因遷移.pdf
- 基于線粒體基因組序列研究江蘇地區(qū)的小家鼠.pdf
- 基于葉綠體基因組序列的小麥族系統(tǒng)發(fā)育分析.pdf
- 基于De Bruijn圖的宏基因組序列組裝算法研究.pdf
- 人基因組近端粒序列克隆解析.pdf
評論
0/150
提交評論