

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、單核苷酸多態(tài)性(Single Nucleotide Polymorphism,SNP)作為第三代分子標記,具有分布豐富、穩(wěn)定遺傳、快速檢測等特點,在分子標記輔助選擇、種子純度鑒定、目標基因定位、遺傳圖譜構建和全基因組關聯分析(Genome Wide Association Study,GWAS)等方面均具有廣泛的應用。玉米經過長期的自然選擇與人工馴化,形成了豐富的遺傳變異,已成為作物遺傳學研究的經典模式植物。然而,其基因組中大量重復序列
2、和轉座子的存在也為玉米變異檢測帶來了困難與挑戰(zhàn)。
為揭示不同SNP檢測流程、測序覆蓋度及測序讀長對玉米SNP檢測結果的影響,本研究利用玉米基因組的堿基編碼分布、GC偏好性等特征模擬不同覆蓋度及測序讀長的高通量測序數據,分別利用4個流程SAMtools、GATK-UnifiedGenotyper、VarScan和FreeBayes進行SNP檢測,進一步從SNP檢出率、假陽性率、程序運行效率等方面綜合比較不同覆蓋度、測序讀長以及不
3、同檢測流程對玉米SNP檢測效率的影響,從而獲得玉米SNP檢測的最佳流程和較高的“價效比”測序組合。
首先,本研究利用pIRS程序根據玉米參考基因組序列構建了玉米特征譜,模擬了不同覆蓋度和不同讀長的Illumina測序數據,隨后使用4種不同流程進行SNP檢測。結果發(fā)現,VarScan、SAMtools和GATK-UnifiedGenotyper流程SNP檢測正確率較高,而FreeBayes流程假陽性率較高。在低覆蓋度(<8倍)時
4、,SAMtools與GATK-UnifiedGenotyper的正確率較高,然而,SAMtools流程的SNP檢出率較之后者高約15%;當覆蓋度在8倍及以上時,FreeBayes、SAMtools和GATK-UnifiedGenotyper流程SNP檢出率較高,而VarScan流程SNP檢出率則較低;在較高覆蓋度(≥30倍)時,4個流程的SNP檢出率趨于一致。此外,在高覆蓋度下對4個不同流程的檢測數據進一步取交集,發(fā)現SNP檢測正確率可
5、高達99.98%。因此,低覆蓋度(<8倍)下,利用SAMtools流程檢測較為適宜;而中高覆蓋度(≥8倍)下,不同檢測程序均保持較高的檢出率和正確率,其中GATK-UnifiedGenotyper流程有較佳的性能表現,對不同檢測結果進行交集處理可進一步提高SNP檢測的準確率。
其次,相應的最優(yōu)流程對不同覆蓋度和不同讀長數據的SNP檢測結果表明,在玉米中,雙端100 bp(basepair)長、15倍覆蓋度測序組合,GATK-U
6、nifiedGenotyper流程的SNP檢出率約為85.9%,正確率約為99.84%;雙端150 bp長、8倍覆蓋度測序組合,GATK-UnifiedGenotyper流程的SNP檢出率約為86.4%,正確率約為99.92%;雙端250 bp長、5倍覆蓋度測序組合,SAMtools流程SNP檢出率約為81.6%,正確率約為99.82%。因此,采用雙端150bp測序長度、8倍覆蓋度測序組合可得到玉米SNP檢測的較高“價效比”。
7、 為了進一步驗證玉米優(yōu)化的SNP檢測流程的可靠性,本研究分別利用VarScan流程和中高覆蓋度較優(yōu)流程GATK-UnifiedGenotyper對玉米自交系H99(Paired-end100×2 bp,~11x)重測序數據進行了SNP檢測,分別檢測到4,878,937個SNP和6,885,936個SNP。隨后,從檢測結果中選取GATK-UnifiedGenotyper流程檢測,而VarScan流程未檢測到的SNP位點設計引物并測序驗證。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 高通量測序數據存儲系統(tǒng)
- 高通量DNA測序數據的分布密度分析及其應用.pdf
- 基于高通量測序數據的遺傳調控元件識別及算法研究.pdf
- 11574.高通量測序數據誤差分析方法研究
- 基于一下代測序的玉米高通量SNP開發(fā)及關聯分析.pdf
- 高通量測序
- Docker生物云計算平臺分析松材線蟲高通量測序數據的應用研究.pdf
- 高通量RNA-seq測序數據的基因表達水平分析研究.pdf
- 基于微陣列技術的功能SNP高通量檢測及其應用.pdf
- 基于二代測序數據的SNP發(fā)現策略及其初步應用.pdf
- 高通量測序技術簡介
- 高通量測序在腫瘤臨床中的應用
- 新發(fā)病毒性傳染病病原體高通量測序數據分析.pdf
- 高通量測序在乙肝相關肝癌患者HBV變異檢測中的應用.pdf
- 基于高通量測序技術的miRNA分析策略及數據挖掘研究.pdf
- 高通量測序數據中病毒基因組的生物信息學分析方法探索.pdf
- 高通量基因篩選技術的應用及優(yōu)化.pdf
- 高通量SSR檢測方法在玉米遺傳圖譜構建中的應用.pdf
- 基于高通量測序的芥菜結構變異(SV)標記開發(fā)及應用.pdf
- 桉樹基因測序數據SNP的模式識別方法的研究.pdf
評論
0/150
提交評論