版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、棉花作為纖維的重要來(lái)源,是一種重要的經(jīng)濟(jì)作物,在世界經(jīng)濟(jì)中發(fā)揮著重要的作用。隨著測(cè)序技術(shù)和生物信息學(xué)的快速發(fā)展,GenBank等重要分子生物數(shù)據(jù)庫(kù)中登陸的序列呈指數(shù)增長(zhǎng),截至2007年4月,NCBI、EMBL和DDBJ3大數(shù)據(jù)庫(kù)收錄的核酸序列已經(jīng)達(dá)到67,218,344條,共計(jì)71,292,211,453堿基時(shí),其中棉花EST有281,233條,利用生物信息學(xué)手段對(duì)棉纖維發(fā)育相關(guān)的EST進(jìn)行大規(guī)模分析顯得日益重要。本實(shí)驗(yàn)利用138,08
2、6條與棉纖維發(fā)育相關(guān)的ESTs進(jìn)行生物信息學(xué)研究,開(kāi)發(fā)新標(biāo)記和功能分析,為加密遺傳圖譜、基因定位、發(fā)掘新基因,比較基因組、基因網(wǎng)絡(luò)分析和分子進(jìn)化奠定堅(jiān)實(shí)的基礎(chǔ)。 為了在棉花中開(kāi)發(fā)EST-SSR功能性標(biāo)記,利用生物信息學(xué)方法對(duì)NCBI網(wǎng)上公開(kāi)的63485條雷蒙德氏棉(Gossypium raimondii Ulbrich)ESTs序列進(jìn)行EST-SSRs特征分析。剔除冗余序列,得到非冗余序列58906條。在非冗余序列中發(fā)現(xiàn)含不同重
3、復(fù)基元SSRs的EST序列有2620條,共2818個(gè)EST-SSRs,EST-SSRs序列的頻率是4.45%,平均相隔14.8kb出現(xiàn)一個(gè)SSR。在1-6bp的重復(fù)基元中,三核苷酸重復(fù)基元的SSRs出現(xiàn)頻率最高(38.31%),其次是二核苷酸(24.09%)、單核苷酸(23.35%)。統(tǒng)計(jì)所有的重復(fù)基元類型,所占比例最大的是A/T(18.67%),其次是AT/TA(14.83%)。在復(fù)合型(Compound)發(fā)現(xiàn)三核苷酸串聯(lián)三核苷酸的重
4、復(fù)基元出現(xiàn)頻率最高,為48.65%。利用Prime 3軟件,設(shè)計(jì)了1554對(duì)EST-SSRs引物,應(yīng)用這些引物對(duì)我室四倍體作圖親本陸地棉TM-1和海島棉海7124進(jìn)行多態(tài)性檢測(cè),其中744對(duì)有多態(tài)性,多態(tài)性頻率為47.9%。這些EST-SSRs已有效用于不同棉種間的分布特征比較及染色體定位等方面研究。 對(duì)來(lái)自A組、D組和AD組的12個(gè)棉纖維發(fā)育時(shí)期混合cDNA文庫(kù)的138,086條ESTs序列進(jìn)行不同棉種間EST序列同源性比較,
5、其中A組(G. arboreum,7-10dpa)39,117條、D組(G. raimondii,-3 to 3dpa)32,316條和AD組(G. hirsutum,10個(gè)文庫(kù),覆蓋-3-25dpa)66,653條,通過(guò)同一種內(nèi)EST序列拼接分析,分別得到A、D和AD三個(gè)棉種的Unigenes16,100條、11,912條和14,307條,共42,319unigenes。經(jīng)過(guò)對(duì)不同基因組間的Unigenes序列相似性分析,得到七個(gè)集合
6、(D∩一A∩一AD、AD ∩一A ∩D、A ∩ D ∩ AD、A ∩ D ∩一AD、A ∩ AD ∩一D、A ∩-D ∩一AD和D ∩ AD ∩一A)的相似序列,分別對(duì)A組和D組間共有而在AD組間沒(méi)有相似性(A ∩ D ∩-AD)的序列937條,A組和AD組間有而在D組間沒(méi)有的(A∩ AD ∩一D)2,717條,D組和AD組間有而在A組間沒(méi)有的(D ∩ AD ∩-A)2188條,三個(gè)組間相似性高的序列(A ∩ D ∩ AD)共有2441
7、條,D組獨(dú)有(D ∩-A ∩-AD)的6346,A組獨(dú)有(A ∩ D ∩-AD)的7996和AD組獨(dú)有的(ADN ∩-A ∩ D)4467條Unigenes進(jìn)行了功能注釋和代謝分析。結(jié)果表明: (1)A組、D組和AD組間不同關(guān)系(D ∩-A ∩-AD、AD ∩ A ∩ D、A ∩ D ∩ AD、A ∩ D ∩-AD、A ∩ AD ∩-D、A ∩-D ∩-AD和D ∩ AD ∩-A七個(gè)集合)的相似性序列進(jìn)行功能分類分成生物進(jìn)程(B
8、iological Process)、細(xì)胞組分(Cellular Component)和分子功能(Molecular Function)3個(gè)類型。在同一功能類型不同集合中所占比例最大的前兩種功能基本相同,生物進(jìn)程中所占比例最大的是cellular process,其次是metabolicprocess;細(xì)胞組分中所占比例最大的是cell/cell part,其次是organelle;分子功能中所占比例最大的兩個(gè)是catalytic ac
9、tivity和binding,即在棉纖維發(fā)育進(jìn)程中,具有催化活性的基因在不同棉種中均發(fā)揮著重要作用。 (2)對(duì)A、D、AD基因組七個(gè)集合27,092和陽(yáng)似性序列進(jìn)行功能和代謝分析。功能分析表明,13,845條功能已知,13,247條未知功能.利用KEGG數(shù)據(jù)庫(kù)進(jìn)一步對(duì)已知功能的13,845條序列進(jìn)行代謝分析,2,543條Unigenes有代謝途徑,其中能量和碳水化合物代謝最多(1607,63.19%),其次是氨基酸代謝(718,
10、28.23%)。在已知功能的13,845條序列中與棉纖維發(fā)育相關(guān)的重要基因如膨脹素、纖維素合酶、蔗糖合酶、UDP、磷酸烯醇丙酮酸羧化酶、蔗糖轉(zhuǎn)運(yùn)蛋白、MYB家族和液泡H+-ATPases(V-ATPase)都存在。通過(guò)對(duì)D(D5)基因組扣AD(A2D5)基因組間的與棉纖維發(fā)育相關(guān)的Unigenes功能分析發(fā)現(xiàn),D組38.86%((2188+2441)/11912)的Unigenes與AD組中的Unigenes具有相同的功能。說(shuō)明在D基因
11、組和AD基因組中在棉纖維起始發(fā)育階段有很多相似的表達(dá)基因,盡管D基因組的種子上只有短絨沒(méi)有生產(chǎn)上可利用的纖維,但D基因組和AD基因組在轉(zhuǎn)錄水平上的高同源性表明D基因組蘊(yùn)含著決定纖維發(fā)育的基因。A基因組和AD基因組間有5158條Unigenes有相似性。5158條序列中有847(16.42%)條序列有代謝途徑。在代謝方面主要以碳水化合物和能量代謝與氨基酸代謝為主。對(duì)A基因組(7 to10dpa)和D基因組(-3 to 3dpa)中3378
12、條相似性序列進(jìn)行代謝和功能分析,2916條序列有功能,748條序列在KEGG數(shù)據(jù)庫(kù)中找到代謝途徑。通過(guò)分析A、D基因組問(wèn)的相似序列來(lái)源說(shuō)明上述基因在纖維啟動(dòng)和伸長(zhǎng)階段均在表達(dá)。 (3)四倍體AD基因組與二倍體A和D基因組的轉(zhuǎn)錄產(chǎn)物比較發(fā)現(xiàn)有4522(31.61%,A ∩ D ∩ AD)Unigenes在A和D基因組共同表達(dá),表明這些基因是來(lái)源比較保守的祖先基因,它們并合到四倍體AD基因組中仍然轉(zhuǎn)錄,發(fā)揮相應(yīng)的功能及參與相應(yīng)的代謝
13、進(jìn)程。在A ∩ AD ∩ D中有2717(18.99%)Unigenes在A基因組中找到相似序列而在D基因組中沒(méi)有,說(shuō)明這些Unigenes僅在纖維發(fā)育伸長(zhǎng)階段表達(dá)或在A和AT基因組專化表達(dá);在D ∩ AD ∩-A中有2601(18.18%)條Unigenes在D基因組中找到相似序列而在A基因組中沒(méi)有,說(shuō)明這些Unigenes僅在纖維起始階段特異表達(dá)或在D和DT基因組專化表達(dá);而在AD ∩-A ∩-D中有4467(31.22%)Unig
14、enes在A和D基因組中均未找到相似序列,是AD基因組中特有的轉(zhuǎn)錄產(chǎn)物,可能是由于多倍化后產(chǎn)生新的轉(zhuǎn)錄產(chǎn)物,進(jìn)而在功能上發(fā)生了變化。 (4)通過(guò)A和D基因組相互比較發(fā)現(xiàn)A基因組有4797(29.77%)Unigenes在D基因組中有相似序列,D基因組在A基因組中有3378(28.36%)Unigenes存在相似性,表明相似Unigenes在纖維發(fā)育起始階段和伸長(zhǎng)期均表達(dá)。在A和D基因組中沒(méi)有相似性的序列分別是11303(70.20%)和
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 胃癌相關(guān)基因EST序列的生物信息學(xué)分析.pdf
- 鹿茸發(fā)育相關(guān)基因篩選和生物信息學(xué)分析.pdf
- 棗樹(shù)cDNA文庫(kù)EST序列的生物信息學(xué)分析.pdf
- 棉花纖維發(fā)育相關(guān)基因時(shí)空表達(dá)及其生物信息學(xué)分析.pdf
- 肺癌相關(guān)EST序列的生物信息學(xué)分析和新基因發(fā)現(xiàn)研究.pdf
- 肺癌相關(guān)MAGE家族的生物信息學(xué)分析.pdf
- 高原高血壓相關(guān)基因的生物信息學(xué)分析.pdf
- myc基因的生物信息學(xué)分析
- 荔枝果皮發(fā)育cDNA文庫(kù)構(gòu)建與生物信息學(xué)分析.pdf
- 胃癌相關(guān)新基因的克隆及生物信息學(xué)分析.pdf
- 黃瓜dvr基因的生物信息學(xué)分析
- 孤獨(dú)癥的生物信息學(xué)分析.pdf
- 水稻osssr基因的生物信息學(xué)分析
- 基于錨定RT-PCR的青蒿EST克隆、測(cè)序及生物信息學(xué)分析.pdf
- 宮頸癌相關(guān)基因的篩選及生物信息學(xué)分析.pdf
- 菠菜Y染色體特異EST序列的快速克隆及生物信息學(xué)分析.pdf
- 帕金森病相關(guān)基因的篩選及生物信息學(xué)分析.pdf
- 胞外多肽的生物信息學(xué)分析與應(yīng)用.pdf
- 綿羊mhc classⅱ基因的生物信息學(xué)分析
- 水稻AGO基因家族的生物信息學(xué)分析.pdf
評(píng)論
0/150
提交評(píng)論