

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、1基因識(shí)別問題及其算法實(shí)現(xiàn)基因識(shí)別問題及其算法實(shí)現(xiàn)一、背景介紹一、背景介紹DNA是生物遺傳信息的載體,其化學(xué)名稱為脫氧核糖核酸(Deoxyribonucleicacid,縮寫為DNA)。DNA分子是一種長鏈聚合物,DNA序列由腺嘌呤(AdenineA),鳥嘌呤(GuanineG),胞嘧啶(CytosineC),胸腺嘧啶(ThymineT)這四種核苷酸(nucleotide)符號(hào)按一定的順序連接而成。其中帶有遺傳訊息的DNA片段稱為基因(
2、Gene)(見圖1第一行)。其他的DNA序列片段,有些直接以自身構(gòu)造發(fā)揮作用,有些則參與調(diào)控遺傳訊息的表現(xiàn)。在真核生物的DNA序列中,基因通常被劃分為許多間隔的片段(見圖1第二行),其中編碼蛋白質(zhì)的部分,即編碼序列(CodingSequence)片段,稱為外顯子(Exon),不編碼的部分稱為內(nèi)含子(Intron)。外顯子在DNA序列剪接(Splicing)后仍然會(huì)被保存下來,并可在圖1真核生物DNA序列(基因序列)結(jié)構(gòu)示意圖蛋白質(zhì)合成過
3、程中被轉(zhuǎn)錄(tranion)、復(fù)制(replication)而合成為蛋白質(zhì)(見圖2)。DNA序列通過遺傳編碼來儲(chǔ)存信息,指導(dǎo)蛋白質(zhì)的合成,把遺傳信息準(zhǔn)確無誤地傳遞到蛋白質(zhì)(protein)上去并實(shí)現(xiàn)各種生命功能。圖2蛋白質(zhì)結(jié)構(gòu)示意圖對(duì)大量、復(fù)雜的基因序列的分析,傳統(tǒng)生物學(xué)解決問題的方式是基于分子實(shí)驗(yàn)的方法,其代價(jià)高昂。諾貝爾獎(jiǎng)獲得者W.吉爾伯特(WalterGilbert,1932—;【美】,第一個(gè)制備出混合脫氧核糖核酸的科學(xué)家)199
4、1年曾經(jīng)指出:“現(xiàn)在,基于全部基因序列都將知曉,并以電子可操作的方式駐留在數(shù)據(jù)庫中,新的生物學(xué)研究模式的出發(fā)點(diǎn)應(yīng)是理論的。一個(gè)DNA序列外顯子(Exon)內(nèi)含子(Intron)DNA序列基因(Gene)蛋白質(zhì)序列剪接、轉(zhuǎn)錄、復(fù)制基因(Gene)3例如,假設(shè)給定的一段DNA序列片段為S=ATCGTACTG,則所生成的四個(gè)01序列分別為::;:;[]Aun100001000[]Gun000100001:;:。[]Cun001000100[]
5、Tun010010010這樣產(chǎn)生的四個(gè)數(shù)字序列又稱為DNA序列的指示序列(indicatSequence)。2.頻譜頻譜3周期性周期性為研究DNA編碼序列(外顯子)的特性,對(duì)指示序列分別做離散Fourier變換(DFT)(1)210[[]]011nkNjNbbnUkunekN?????????以此可得到四個(gè)長度均為N的復(fù)數(shù)序列,。計(jì)算每個(gè)復(fù)序列的平[]bUkbI?[]bUk方功率譜,并相加則得到整個(gè)DNA序列的功率譜序列:S[]Pk(2
6、)2222[][][][][]011ATGCPkUkUkUkUkkN???????對(duì)于同一段DNA序列,其外顯子與內(nèi)含子序列片段的功率譜通常表現(xiàn)出不同的特性01002003004005006000500010000kP(k)01002003004005006000500010000kP(k)圖3編號(hào)為BK006948.2的酵母基因DNA序列的功率譜(因?yàn)閷?duì)稱性,實(shí)際這里只給出了功率譜圖因?yàn)閷?duì)稱性,實(shí)際這里只給出了功率譜圖的一半的一半)。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 11496.基于統(tǒng)計(jì)的基因識(shí)別問題及其算法研究
- DNA序列模體識(shí)別問題的迭代算法.pdf
- 轉(zhuǎn)錄因子結(jié)合位點(diǎn)識(shí)別問題的算法研究.pdf
- 模體識(shí)別問題的優(yōu)化遺傳算法研究.pdf
- 事件類型識(shí)別問題研究.pdf
- 熱傳導(dǎo)方程參數(shù)識(shí)別問題.pdf
- 識(shí)別問題的工具——流程改進(jìn)模型
- 基于CUDA的動(dòng)載荷識(shí)別問題的并行算法研究.pdf
- 年齡相關(guān)的人臉識(shí)別問題研究.pdf
- 周期拋物方程的系數(shù)識(shí)別問題.pdf
- 52485.關(guān)于真核基因受體位點(diǎn)識(shí)別問題的研究
- 高維熱傳導(dǎo)方程熱源識(shí)別問題的正則化方法和算法.pdf
- 摻假食品識(shí)別問答
- 基于GEP的參數(shù)識(shí)別問題的研究.pdf
- 多模態(tài)及異質(zhì)人臉識(shí)別問題研究.pdf
- 網(wǎng)絡(luò)入侵異常檢測(cè)與識(shí)別問題研究.pdf
- 基于DSP的空瓶缺陷識(shí)別問題研究.pdf
- 中文時(shí)態(tài)關(guān)鍵詞識(shí)別問題研究.pdf
- 覆蓋型網(wǎng)絡(luò)的關(guān)鍵設(shè)施識(shí)別問題研究.pdf
- 遺傳關(guān)聯(lián)分析中的SNPs識(shí)別問題研究.pdf
評(píng)論
0/150
提交評(píng)論