人類基因組A1u序列的研究.pdf_第1頁
已閱讀1頁,還剩46頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、Alu重復(fù)序列是靈長類動物基因組中SINE家族的一員,約有100萬份拷貝。由于這種DNA序列中含有限制性內(nèi)切酶AluI識別的序列AGCT,所以稱為Alu重復(fù)序列。典型的人類基因組Alu序列長282 bp,由兩個同源但有差別的亞基構(gòu)成。在所有己知的基因內(nèi)含子中,幾乎都發(fā)現(xiàn)了Alu序列。由于Alu序列存在的普遍性及其可能具有的生物學(xué)功能,成為人們研究的熱點。
   研究表明,Alu序列可能與調(diào)控網(wǎng)絡(luò)有關(guān),調(diào)控散置在基因組中的基因協(xié)同

2、表達(dá)。我們知道DNA中編碼序列是以三聯(lián)體的形式編碼蛋白質(zhì),那么Alu序列如果參與基因的調(diào)控,以什么樣的方式編碼序列呢?為此,我們應(yīng)用非均勻指數(shù),分析了外顯化Alu序列的閱讀性框架,并以人類基因組中的外顯子,內(nèi)含子的序列作為對照,發(fā)現(xiàn)Alu序列可能存在8重性閱讀框架,具有8聯(lián)體的編碼性質(zhì),這一結(jié)論支持了人們曾經(jīng)提出的Alu序列參與基因調(diào)控的結(jié)論。另外,通過與其它短散在性重復(fù)元件的對比分析,顯示存在8重性閱讀框架可能是Alu序列所特有的。進(jìn)

3、一步,我們統(tǒng)計了Alu序列每個周期位置上各堿基出現(xiàn)的概率,沒有發(fā)現(xiàn)特別的規(guī)律,這與編碼區(qū)統(tǒng)計性分析獲得的經(jīng)驗,即DNA中密碼子使用不是均勻分布的結(jié)論是比較吻合的。同時,我們還發(fā)現(xiàn)Alu序列中堿基的構(gòu)成也是不對稱的,G+C的含量大于A+T的含量。
   接下來基于Alu序列中堿基分布的不對稱性,及Alu序列本身保守的結(jié)構(gòu)特性,應(yīng)用多樣性增量的方法(ID方法)對Alu序列進(jìn)行了識別分析:分別以人類基因組中內(nèi)含子(intron)和外顯

4、子(exon)兩類序列作為負(fù)集,外顯化的Alu序列作為正集進(jìn)行預(yù)測,建立序列單堿基含量(ID1),緊鄰與非緊鄰二聯(lián)體(ID2),三聯(lián)體(ID3),四聯(lián)體(ID4),八聯(lián)體(ID5)共五個標(biāo)準(zhǔn)多樣性源,采用3-fold交叉的檢驗方法,得到的敏感性(Sn)多數(shù)在99%以上,特異性(Sp)多數(shù)在96%以上,總精度(TA)多數(shù)也在90%以上。其中以k=4mer識別的結(jié)果最好,特異性、敏感性總精度都超過了98%,相關(guān)系數(shù)也超過了0.92,很好的體

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論