版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、新一代測(cè)序技術(shù)具有高通量、低成本等優(yōu)勢(shì),在動(dòng)物和植物的基因組測(cè)序及基因表達(dá)研究中被廣泛應(yīng)用。棉花不僅是一種重要的經(jīng)濟(jì)作物,其纖維細(xì)胞也是理想的研究植物細(xì)胞生長發(fā)育的模型。但由于其基因組較大、多倍性等原因,全基因組的測(cè)序及拼接工作難度較大。因此,為了解讀基因的功能,更好的研究基因在棉花生理代謝活動(dòng)中的作用,利用新一代測(cè)序技術(shù)對(duì)棉花基因表達(dá)進(jìn)行研究已成為近些年來的研究熱點(diǎn)。然而如何利用生物信息學(xué)工具從新一代測(cè)序產(chǎn)生的海量數(shù)據(jù)中挖掘有效的信息
2、,成為目前急需解決的問題。據(jù)此本研究建立了一個(gè)基于新一代測(cè)序的數(shù)字基因表達(dá)譜生物信息學(xué)分析平臺(tái),并應(yīng)用于棉花RNA測(cè)序數(shù)據(jù)。
此分析平臺(tái)的流程包括對(duì)測(cè)序原始數(shù)據(jù)的預(yù)處理,與參考序列的比對(duì),基因表達(dá)量和測(cè)序覆蓋度的統(tǒng)計(jì),對(duì)多個(gè)樣本的基因表達(dá)差異分析以及后續(xù)的功能注釋和代謝通路分析。然后應(yīng)用此分析平臺(tái),對(duì)陸地棉YZ1正常株系和PDF1基因RNAi株系開花當(dāng)天的胚珠RNA測(cè)序數(shù)據(jù),共四個(gè)樣本(DF1-DF4),進(jìn)行了全面的分析。
3、主要的研究結(jié)果如下:
1.分析平臺(tái)的建立:利用FASTX-Toolkit對(duì)測(cè)序原始數(shù)據(jù)進(jìn)行質(zhì)量控制,去掉低質(zhì)量的序列后得到待分析數(shù)據(jù)(clean reads),接著利用Maq和Bowtie將clean reads比對(duì)到參考序列上,并編寫python腳本統(tǒng)計(jì)RPKM值和測(cè)序覆蓋度,合并多個(gè)樣本的比對(duì)統(tǒng)計(jì)值之后利用DESeq進(jìn)行差異表達(dá)分析,最后將差異表達(dá)的基因利用Blast2GO進(jìn)行GO功能注釋,WEGO進(jìn)行功能分類統(tǒng)計(jì),K
4、EGG進(jìn)行代謝通路分析。
2.成功應(yīng)用于DF1-DF4四個(gè)樣本的測(cè)序數(shù)據(jù)分析:對(duì)DF1-DF4進(jìn)行質(zhì)量處理后,均保留了99.6%的數(shù)據(jù);比對(duì)到參考序列上的基因,其RPKM值小于100的分別占了92.2%,91.7%,91.7%,91.0%;DF1與DF2進(jìn)行水平內(nèi)去除差異后,與DF3的比較得到27個(gè)差異表達(dá)基因,其中23個(gè)上調(diào)表達(dá),4個(gè)下調(diào)表達(dá):與DF4的比較得到345個(gè)差異表達(dá)基因,其中51個(gè)上調(diào)表達(dá),294個(gè)下調(diào)表達(dá);
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于新一代測(cè)序的microRNA生物信息學(xué)分析及其平臺(tái)的建立.pdf
- 973 2012 基于新一代測(cè)序的生物信息學(xué)理論與方法
- 基于Web頁面的生物信息學(xué)分析平臺(tái)的建立及其應(yīng)用.pdf
- 肝癌易感相關(guān)基因及組織基因表達(dá)譜生物信息學(xué)分析.pdf
- myc基因的生物信息學(xué)分析
- 人類成熟精子mRNA表達(dá)譜的新一代測(cè)序研究.pdf
- 溶血不動(dòng)桿菌的全基因組測(cè)序及生物信息學(xué)分析.pdf
- Pannonibacter phragmitetus 31801的基因組測(cè)序和生物信息學(xué)分析.pdf
- 睡眠剝奪差異表達(dá)基因的篩選及生物信息學(xué)分析.pdf
- 打頂前后煙草miRNA表達(dá)譜的生物信息學(xué)分析及靶基因的電子克隆.pdf
- 黃瓜dvr基因的生物信息學(xué)分析
- 軟骨發(fā)生過程中基因表達(dá)譜的測(cè)定及生物信息學(xué)分析.pdf
- 食管鱗癌表達(dá)譜數(shù)據(jù)的挖掘和生物信息學(xué)分析.pdf
- 小鼠肺組織鉤蟲感染時(shí)間序列基因表達(dá)譜的生物信息學(xué)分析.pdf
- 水稻osssr基因的生物信息學(xué)分析
- 果蠅基因ecp的生物信息學(xué)分析及其轉(zhuǎn)基因模型的建立.pdf
- 金黃地鼠頰癌差異表達(dá)基因譜的構(gòu)建及相關(guān)生物信息學(xué)分析.pdf
- 副粘病毒Tianjin株全基因組測(cè)序及生物信息學(xué)分析.pdf
- 結(jié)直腸癌電子表達(dá)譜的生物信息學(xué)分析及差異表達(dá)基因研究.pdf
- 綿羊mhc classⅱ基因的生物信息學(xué)分析
評(píng)論
0/150
提交評(píng)論