版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、1.建樹前的準(zhǔn)備工作1.1相似序列的獲得——BLASTBLAST是目前常用的數(shù)據(jù)庫(kù)搜索程序,它是BasicLocalAlignmentSearchTool的縮寫,意為“基本局部相似性比對(duì)搜索工具”(Altschuletal.1990[62]1997[63])。國(guó)際著名生物信息中心都提供基于Web的BLAST服務(wù)器。BLAST算法的基本思路是首先找出檢測(cè)序列和目標(biāo)序列之間相似性程度最高的片段,并作為內(nèi)核向兩端延伸,以找出盡可能長(zhǎng)的相似序列
2、片段。首先登錄到提供BLAST服務(wù)的常用網(wǎng)站,比如國(guó)內(nèi)的CBI、美國(guó)的NCBI、歐洲的EBI和日本的DDBJ。這些網(wǎng)站提供的BLAST服務(wù)在界面上差不多,但所用的程序有所差異。它們都有一個(gè)大的文本框,用于粘貼需要搜索的序列。把序列以FASTA格式(即第一行為說(shuō)明行,以“”符號(hào)開始,后面是序列的名稱、說(shuō)明等,其中“”是必需的,名稱及說(shuō)明等可以是任意形式,換行之后是序列)粘貼到那個(gè)大的文本框,選擇合適的BLAST程序和數(shù)據(jù)庫(kù),就可以開始搜索
3、了。如果是DNA序列,一般選擇BLASTN搜索DNA數(shù)據(jù)庫(kù)。這里以NCBI為例。登錄NCBI主頁(yè)點(diǎn)擊BLAST點(diǎn)擊NucleotidenucleotideBLAST(blastn)在Search文本框中粘貼檢測(cè)序列點(diǎn)擊BLAST!點(diǎn)擊Fmat得到resultofBLAST。BLASTN結(jié)果如何分析(參數(shù)意義):gi|28171832|gb|AY155203.1|Nocardiasp.ATCC4987216SribosomalRNAgen
4、ecompletesequenceSce=2020bits(1019)Expect=0.0Identities=13821497(92%)Gaps=81497(0%)Str=PlusPlusQuery:1gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggaaaggccctttcgggggt60||||||||||||||||||||||||||||||||||||||||||||||||||||||||
5、Sbjct:1gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggtaaggcccttcggggt58Query:61actcgagcggcgaacgggtgagtaacacgtgggtaacctgccttcagctctgggataagc120|||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct:59acacgagcggcgaacgggtga
6、gtaacacgtgggtgatctgcctcgtactctgggataagc118Sce:指的是提交的序列和搜索出的序列之間的分值,越高說(shuō)明越相似;Expect:比對(duì)的期望值。比對(duì)越好,expect越小一般在核酸層次的比對(duì),expect小于1e10,就比對(duì)很好了,多數(shù)情況下為0;Identities:提交的序列和參比序列的相似性,如上所指為1497個(gè)核苷酸中二者有1382個(gè)相同;Gaps:一般翻譯成空位,指的是對(duì)不上的堿基數(shù)目;Str
7、:鏈的方向,PlusMinus意味著提交的序列和參比序列是反向互補(bǔ)的,如果是PlusPlus則二者皆為正向。1.2序列格式:FASTA格式由于EMBL和GenBank數(shù)據(jù)格式較為復(fù)雜,所以為了分析方便也出現(xiàn)了十分簡(jiǎn)單的FASTA數(shù)據(jù)格式。FASTA格式又稱為Pearson格式,該種序列格式要求序列的標(biāo)題行以大于號(hào)“”開頭,下一行起為具體的序列。一般建議每行的字符數(shù)不超過(guò)60或80個(gè),以TreesBootstrapNJTree:Romnu
8、mbergeneratseed(11000):111Numberofbootstraptrails(11000):1000SAVECLUSTALTREEAS:C:tempjca.njbSAVEPHYLIPTREEAS:C:tempjca.njbphbOK→waiting……等待時(shí)間與序列長(zhǎng)度、數(shù)量以及計(jì)算機(jī)配置有關(guān)。在此過(guò)程中,生成進(jìn)化樹文件.njbphb,可以用TreeView打開查看。(6)TreesDrawNJTreesSAVEC
9、LUSTALTREEAS:C:tempjca.njSAVEPHYLIPTREEAS:C:tempjca.njphSAVEDISTANCEMATRIXAS:C:tempjca.njphdstOK此過(guò)程中生成的報(bào)告文件.nj比較有用,里面列出了比對(duì)序列兩兩之間的相似度,以及轉(zhuǎn)換和顛換分別各占多少。(7)TreeViewFileOpenC:tempjca.njbphbTreephylogram(unrootedslantedcladogram
10、,Rectangularcladogram多種樹型)TreeShowinternaledgelabels(Bootstrapvalue)(顯示數(shù)值)TreeDefineoutgroup…→ingroupoutgroup→OK(定義外群)TreeRootwithoutgroup通常需要對(duì)進(jìn)化樹進(jìn)行編輯,這時(shí)首先要EditCopy至PowerPoint上,然后Copy至Wd上,再進(jìn)行圖片編輯。如果直接Copy至Wd則顯示亂碼,而進(jìn)化樹不能正
11、確顯示。2.2Mega建樹雖然ClustalX可以構(gòu)建系統(tǒng)樹,但是結(jié)果比較粗放,現(xiàn)在一般很少用它構(gòu)樹,Mega因?yàn)椴僮骱?jiǎn)單,結(jié)果美觀,很多研究者選擇用它來(lái)建樹。(1)首先用ClustalX進(jìn)行序列比對(duì),剪切后生成C:tempjca.aln文件;(同上)(2)打開BioEdit程序,將目標(biāo)文件格式轉(zhuǎn)化為FASTA格式,F(xiàn)ileOpenC:tempjca.aln,F(xiàn)ileSaveAsC:tempjcb.fas;(3)打開Mega程序,轉(zhuǎn)化為
12、mega格式并激活目標(biāo)文件,F(xiàn)ileConvertToMEGAFmatC:tempjcb.fas→C:tempjcb.meg,關(guān)閉TextEdit窗口(DoyouwanttosaveyourchangesbefeclosingYes);ClickmetoactivateadatafileC:tempjcb.megOK(ProteincodingnucleotidesequencedataNo);PhylogenyNeighbJoinin
13、g(NJ)DistanceOptionsModelsNucleotide:Kimura2parameter√d:TransitionsTransversionsIncludeSites⊙PairwiseDeletionTestofPhylogeny⊙BootstrapReplications1000RomSeed64238OK;開始計(jì)算-得到結(jié)果;(4)ImageCopytoClipboard粘貼至Wd文檔進(jìn)行編輯。此外,Subtree
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 分子進(jìn)化樹構(gòu)建方法
- 系統(tǒng)進(jìn)化樹構(gòu)建的算法
- 生物序列進(jìn)化樹的構(gòu)建.pdf
- 基于距離的進(jìn)化樹構(gòu)建算法研究.pdf
- 進(jìn)化樹構(gòu)建算法的研究與改進(jìn).pdf
- 構(gòu)建進(jìn)化樹的鄰接法的改進(jìn)算法.pdf
- 基于距離矩陣的進(jìn)化樹構(gòu)建方法研究.pdf
- NJ進(jìn)化樹構(gòu)建方法的改進(jìn)及其應(yīng)用.pdf
- 基于DNA序列的進(jìn)化樹構(gòu)建算法的研究.pdf
- 25212.基于離散度量的進(jìn)化樹構(gòu)建方法研究
- 多叉進(jìn)化樹構(gòu)建方法的研究與實(shí)現(xiàn).pdf
- 利用進(jìn)化樹研究基因序列的進(jìn)化.pdf
- 基于層次聚類的進(jìn)化樹構(gòu)建算法研究.pdf
- 9312.基于hadoop的大規(guī)模dna進(jìn)化樹構(gòu)建算法
- 基于線粒體基因組構(gòu)建生物系統(tǒng)進(jìn)化樹.pdf
- 兩種新的基于距離構(gòu)建進(jìn)化樹的方法.pdf
- 生物學(xué)利用mega5.0和clustalx軟件構(gòu)建進(jìn)化樹
- 矩陣奇異值分解在構(gòu)建物種進(jìn)化樹中的應(yīng)用.pdf
- 基于多目標(biāo)優(yōu)化的進(jìn)化樹重建方法.pdf
- 東方鲀生長(zhǎng)激素基因進(jìn)化樹構(gòu)建及其遺傳多樣性研究.pdf
評(píng)論
0/150
提交評(píng)論