版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、單核苷酸多態(tài)性(Single Nucleotide Polymorphism,SNP)作為第三代分子標(biāo)記,具有分布豐富、穩(wěn)定遺傳、快速檢測(cè)等特點(diǎn),在分子標(biāo)記輔助選擇、種子純度鑒定、目標(biāo)基因定位、遺傳圖譜構(gòu)建和全基因組關(guān)聯(lián)分析(Genome Wide Association Study,GWAS)等方面均具有廣泛的應(yīng)用。玉米經(jīng)過(guò)長(zhǎng)期的自然選擇與人工馴化,形成了豐富的遺傳變異,已成為作物遺傳學(xué)研究的經(jīng)典模式植物。然而,其基因組中大量重復(fù)序列
2、和轉(zhuǎn)座子的存在也為玉米變異檢測(cè)帶來(lái)了困難與挑戰(zhàn)。
為揭示不同SNP檢測(cè)流程、測(cè)序覆蓋度及測(cè)序讀長(zhǎng)對(duì)玉米SNP檢測(cè)結(jié)果的影響,本研究利用玉米基因組的堿基編碼分布、GC偏好性等特征模擬不同覆蓋度及測(cè)序讀長(zhǎng)的高通量測(cè)序數(shù)據(jù),分別利用4個(gè)流程SAMtools、GATK-UnifiedGenotyper、VarScan和FreeBayes進(jìn)行SNP檢測(cè),進(jìn)一步從SNP檢出率、假陽(yáng)性率、程序運(yùn)行效率等方面綜合比較不同覆蓋度、測(cè)序讀長(zhǎng)以及不
3、同檢測(cè)流程對(duì)玉米SNP檢測(cè)效率的影響,從而獲得玉米SNP檢測(cè)的最佳流程和較高的“價(jià)效比”測(cè)序組合。
首先,本研究利用pIRS程序根據(jù)玉米參考基因組序列構(gòu)建了玉米特征譜,模擬了不同覆蓋度和不同讀長(zhǎng)的Illumina測(cè)序數(shù)據(jù),隨后使用4種不同流程進(jìn)行SNP檢測(cè)。結(jié)果發(fā)現(xiàn),VarScan、SAMtools和GATK-UnifiedGenotyper流程SNP檢測(cè)正確率較高,而FreeBayes流程假陽(yáng)性率較高。在低覆蓋度(<8倍)時(shí)
4、,SAMtools與GATK-UnifiedGenotyper的正確率較高,然而,SAMtools流程的SNP檢出率較之后者高約15%;當(dāng)覆蓋度在8倍及以上時(shí),F(xiàn)reeBayes、SAMtools和GATK-UnifiedGenotyper流程SNP檢出率較高,而VarScan流程SNP檢出率則較低;在較高覆蓋度(≥30倍)時(shí),4個(gè)流程的SNP檢出率趨于一致。此外,在高覆蓋度下對(duì)4個(gè)不同流程的檢測(cè)數(shù)據(jù)進(jìn)一步取交集,發(fā)現(xiàn)SNP檢測(cè)正確率可
5、高達(dá)99.98%。因此,低覆蓋度(<8倍)下,利用SAMtools流程檢測(cè)較為適宜;而中高覆蓋度(≥8倍)下,不同檢測(cè)程序均保持較高的檢出率和正確率,其中GATK-UnifiedGenotyper流程有較佳的性能表現(xiàn),對(duì)不同檢測(cè)結(jié)果進(jìn)行交集處理可進(jìn)一步提高SNP檢測(cè)的準(zhǔn)確率。
其次,相應(yīng)的最優(yōu)流程對(duì)不同覆蓋度和不同讀長(zhǎng)數(shù)據(jù)的SNP檢測(cè)結(jié)果表明,在玉米中,雙端100 bp(basepair)長(zhǎng)、15倍覆蓋度測(cè)序組合,GATK-U
6、nifiedGenotyper流程的SNP檢出率約為85.9%,正確率約為99.84%;雙端150 bp長(zhǎng)、8倍覆蓋度測(cè)序組合,GATK-UnifiedGenotyper流程的SNP檢出率約為86.4%,正確率約為99.92%;雙端250 bp長(zhǎng)、5倍覆蓋度測(cè)序組合,SAMtools流程SNP檢出率約為81.6%,正確率約為99.82%。因此,采用雙端150bp測(cè)序長(zhǎng)度、8倍覆蓋度測(cè)序組合可得到玉米SNP檢測(cè)的較高“價(jià)效比”。
7、 為了進(jìn)一步驗(yàn)證玉米優(yōu)化的SNP檢測(cè)流程的可靠性,本研究分別利用VarScan流程和中高覆蓋度較優(yōu)流程GATK-UnifiedGenotyper對(duì)玉米自交系H99(Paired-end100×2 bp,~11x)重測(cè)序數(shù)據(jù)進(jìn)行了SNP檢測(cè),分別檢測(cè)到4,878,937個(gè)SNP和6,885,936個(gè)SNP。隨后,從檢測(cè)結(jié)果中選取GATK-UnifiedGenotyper流程檢測(cè),而VarScan流程未檢測(cè)到的SNP位點(diǎn)設(shè)計(jì)引物并測(cè)序驗(yàn)證。
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 高通量測(cè)序數(shù)據(jù)存儲(chǔ)系統(tǒng)
- 高通量DNA測(cè)序數(shù)據(jù)的分布密度分析及其應(yīng)用.pdf
- 基于高通量測(cè)序數(shù)據(jù)的遺傳調(diào)控元件識(shí)別及算法研究.pdf
- 11574.高通量測(cè)序數(shù)據(jù)誤差分析方法研究
- 基于一下代測(cè)序的玉米高通量SNP開(kāi)發(fā)及關(guān)聯(lián)分析.pdf
- 高通量測(cè)序
- Docker生物云計(jì)算平臺(tái)分析松材線蟲(chóng)高通量測(cè)序數(shù)據(jù)的應(yīng)用研究.pdf
- 高通量RNA-seq測(cè)序數(shù)據(jù)的基因表達(dá)水平分析研究.pdf
- 基于微陣列技術(shù)的功能SNP高通量檢測(cè)及其應(yīng)用.pdf
- 基于二代測(cè)序數(shù)據(jù)的SNP發(fā)現(xiàn)策略及其初步應(yīng)用.pdf
- 高通量測(cè)序技術(shù)簡(jiǎn)介
- 高通量測(cè)序在腫瘤臨床中的應(yīng)用
- 新發(fā)病毒性傳染病病原體高通量測(cè)序數(shù)據(jù)分析.pdf
- 高通量測(cè)序在乙肝相關(guān)肝癌患者HBV變異檢測(cè)中的應(yīng)用.pdf
- 基于高通量測(cè)序技術(shù)的miRNA分析策略及數(shù)據(jù)挖掘研究.pdf
- 高通量測(cè)序數(shù)據(jù)中病毒基因組的生物信息學(xué)分析方法探索.pdf
- 高通量基因篩選技術(shù)的應(yīng)用及優(yōu)化.pdf
- 高通量SSR檢測(cè)方法在玉米遺傳圖譜構(gòu)建中的應(yīng)用.pdf
- 基于高通量測(cè)序的芥菜結(jié)構(gòu)變異(SV)標(biāo)記開(kāi)發(fā)及應(yīng)用.pdf
- 桉樹(shù)基因測(cè)序數(shù)據(jù)SNP的模式識(shí)別方法的研究.pdf
評(píng)論
0/150
提交評(píng)論