版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、系統(tǒng)進(jìn)化分析是生物信息學(xué)中的重要研究領(lǐng)域,它的主要研究手段是從一組同源的DNA或蛋白質(zhì)序列出發(fā),計(jì)算各個(gè)序列之間的進(jìn)化距離,進(jìn)而構(gòu)建反映物種進(jìn)化關(guān)系的進(jìn)化樹。構(gòu)建進(jìn)化樹的方法主要分為三類,即距離法、簡約法和似然法。本文將對距離法做一些探索性的改進(jìn)研究。 傳統(tǒng)的距離法一般通過多序列比對計(jì)算距離矩陣,而多序列比對是一個(gè)NP難問題,在序列數(shù)目較多時(shí)難以獲得最優(yōu)比對結(jié)果。一種解決方法是采用啟發(fā)式的多序列比對算法,另一種方法是通過計(jì)算某種
2、序列之間的兩兩距離代替多序列比對。對于計(jì)算兩兩距離的方法而言,Hansan H.Out和Khalid Sayood提出了一種基于LZ復(fù)雜度的距離,能夠正確地重構(gòu)某些進(jìn)化樹。本文則試圖通過利用一種滿足三角不等式的歸一化編輯距離來繞過多序列比對的困難,但仍然需要對序列進(jìn)行兩兩比對分析。 序列的兩兩比對通常采用Needle-Wunschman算法,其時(shí)間和空間復(fù)雜度均為O(mn)(m,n為比對兩序列的長度),對長序列容易超過計(jì)算機(jī)的內(nèi)
3、存限制。Hirschberg算法具有線性空間復(fù)雜度,可以用來解決Needle-Wunschman算法的內(nèi)存問題,但是計(jì)算時(shí)間需求要多一倍,約為O(2mn)。本文試圖在時(shí)間和空間復(fù)雜度之間進(jìn)行折衷,通過引入一種新的檢查點(diǎn)(Check_Point)計(jì)算方法,提出了基于分塊遞歸的序列比對算法。理論分析表明,該算法的空間需求大約在O(5(m+n)+Ls×min(m-1,n-1)+C2)至O(5(m+n)+Ls×(m+n-2)+C2)之間,時(shí)間需
4、求介于O(1.5mn)到O(3mn)之間,但在序列相似度較高時(shí)介于O(1.5mn)到O(2mn)之間。同源物種的線粒體全基因組序列比對實(shí)驗(yàn)進(jìn)一步證明了新算法的正確性,表明在序列之間的歸一化編輯距離小于0.25時(shí),新算法能夠比Hirschberg算法快10%以上。因此分塊遞歸序列比對算法在諸如同源序列分析、系統(tǒng)進(jìn)化樹構(gòu)造等領(lǐng)域具有一定的應(yīng)用價(jià)值。 由于直接通過序列比對得到的距離易受序列長度影響,與真實(shí)進(jìn)化距離的差別較大,因此需要進(jìn)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 兩種新的基于距離構(gòu)建進(jìn)化樹的方法.pdf
- 利用進(jìn)化樹研究基因序列的進(jìn)化.pdf
- 生物序列進(jìn)化樹的構(gòu)建.pdf
- 基于DNA序列的進(jìn)化樹構(gòu)建算法的研究.pdf
- 分子進(jìn)化樹構(gòu)建方法
- 基于距離矩陣的進(jìn)化樹構(gòu)建方法研究.pdf
- 基于神經(jīng)網(wǎng)絡(luò)的多叉系統(tǒng)進(jìn)化樹構(gòu)造.pdf
- 構(gòu)建進(jìn)化樹
- 兩兩nqd序列和ρ39;序列的收斂性質(zhì)
- 基于多目標(biāo)優(yōu)化的進(jìn)化樹重建方法.pdf
- 基于距離的進(jìn)化樹構(gòu)建算法研究.pdf
- 25212.基于離散度量的進(jìn)化樹構(gòu)建方法研究
- 539.兩兩多重比較的fdr控制
- 多叉進(jìn)化樹構(gòu)建方法的研究與實(shí)現(xiàn).pdf
- 兩兩NQD序列部分和收斂性質(zhì)的研究.pdf
- DNA序列3D圖形表示及進(jìn)化樹算法研究.pdf
- 系統(tǒng)進(jìn)化樹構(gòu)建的算法
- 序列分析平臺的建立:模擬PCR及快速進(jìn)化樹重建.pdf
- NJ進(jìn)化樹構(gòu)建方法的改進(jìn)及其應(yīng)用.pdf
- 兩兩NQD序列部分和之和的收斂性質(zhì).pdf
評論
0/150
提交評論