版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、目的:
長(zhǎng)鏈非編碼RNA研究目前面臨幾個(gè)重要的適合于計(jì)算分析的問(wèn)題:(1)具有重要功能的IncRNA起源于哺乳動(dòng)物進(jìn)化的什么時(shí)期。(2)長(zhǎng)鏈非編碼RNA如何獲得多個(gè)外顯子以及功能域。(3)如何預(yù)測(cè)長(zhǎng)鏈非編碼RNA的DNA結(jié)合域和結(jié)合位點(diǎn),從而預(yù)測(cè)長(zhǎng)鏈非編碼RNA的靶基因。(4)長(zhǎng)鏈非編碼RNA的DNA結(jié)合域是否有一個(gè)逐漸進(jìn)化的過(guò)程。(5)長(zhǎng)鏈非編碼RNA呈現(xiàn)怎樣的種系特異性,尤其是,人類(lèi)與靈長(zhǎng)類(lèi)有哪些特異性的長(zhǎng)鏈非編碼RNA。
2、針對(duì)這些問(wèn)題,本研究的主要目的是:(1)揭示若干重要長(zhǎng)鏈非編碼RNA的起源;(2)揭示這些長(zhǎng)鏈非編碼RNA的進(jìn)化特點(diǎn),包括轉(zhuǎn)座子對(duì)長(zhǎng)鏈非編碼RNA的進(jìn)化影響:(3)揭示長(zhǎng)鏈非編碼RNA的種系特異性,尤其是靈長(zhǎng)類(lèi)或人類(lèi)特異的長(zhǎng)鏈非編碼RNA;(4)揭示長(zhǎng)鏈非編碼RNA功能域起源與進(jìn)化的特性;(5)設(shè)計(jì)開(kāi)發(fā)預(yù)測(cè)長(zhǎng)鏈非編碼RNA:DNA的結(jié)合域與結(jié)合位點(diǎn)的算法與軟件,分析典型長(zhǎng)鏈非編碼RNA的DNA結(jié)合域與結(jié)合位點(diǎn)。
方法:
3、 針對(duì)上述研究目的,本研究采用并發(fā)展了如下研究方法。
1.識(shí)別人類(lèi)長(zhǎng)鏈非編碼RNA在其它物種的直系同源物
根據(jù)基因組搜索來(lái)確定GENCODE項(xiàng)目報(bào)道的13562個(gè)人類(lèi)長(zhǎng)鏈非編碼RNA和其它實(shí)驗(yàn)研究報(bào)道的重要長(zhǎng)鏈非編碼RNA在其它物種的同源序列。鑒于補(bǔ)償性突變使得長(zhǎng)鏈非編碼RNA的同源序列具有序列保守性低而結(jié)構(gòu)保守性高的特性,BLAST/BLAT不能可靠地搜索長(zhǎng)鏈非編碼RNA的同源序列,我們用基于結(jié)構(gòu)比對(duì)的RNA搜索
4、軟件Infernal來(lái)搜索長(zhǎng)鏈非編碼RNA在多個(gè)物種的同源序列。大規(guī)模的基因組搜索在本地服務(wù)器和廣州超級(jí)計(jì)算中心的天河二號(hào)計(jì)算機(jī)進(jìn)行。
2.分析長(zhǎng)鏈非編碼RNA的序列特征與進(jìn)化特征
用Phylip、MrBayes、 MEGA等構(gòu)建進(jìn)化樹(shù),用PAML軟件分析進(jìn)化速度,用EvoNC分析長(zhǎng)鏈非編碼RNA相對(duì)于參照基因所受的選擇壓力,用Phylip及MEGA和不同模型計(jì)算序列間距離(選用12S和16S rRNA作為中性參考序
5、列),用Pmmulti和RNAalifold進(jìn)行外顯子結(jié)構(gòu)比對(duì),用RNAfold和Mfold預(yù)測(cè)外顯子的保守結(jié)構(gòu)。
3.根據(jù)人類(lèi)長(zhǎng)鏈非編碼RNA的同源基因揭示人類(lèi)與靈長(zhǎng)類(lèi)特異性長(zhǎng)鏈非編碼RNA
我們將13562個(gè)人類(lèi)長(zhǎng)鏈非編碼RNA在16個(gè)哺乳類(lèi)動(dòng)物的直系同源狀態(tài)轉(zhuǎn)為離散數(shù)據(jù),1表示該基因在某物種中存在直系同源基因,0表示該基因在某物種中不存在直系同源基因,然后基于這些離散狀態(tài)估計(jì)長(zhǎng)鏈非編碼RNA在系統(tǒng)發(fā)育樹(shù)下的ga
6、in/loss事件。
4.設(shè)計(jì)開(kāi)發(fā)預(yù)測(cè)長(zhǎng)鏈非編碼RNA的DNA結(jié)合域與結(jié)合位點(diǎn)的軟件LongTarget
LongTarget軟件主要立足于三點(diǎn):全面的Hoogsteen和反Hoogsteen堿基配對(duì)規(guī)則、局部比對(duì)、以及對(duì)所有TFO/TTS預(yù)測(cè)的分析。我們通過(guò)系統(tǒng)回顧相關(guān)文獻(xiàn)整理出24條Hoogsteen和反Hoogsteen堿基配對(duì)規(guī)則集,對(duì)于一段感興趣的雙鏈DNA區(qū)域,根據(jù)每一條堿基配對(duì)規(guī)則集重構(gòu)四條RNA序列,
7、根據(jù)局部比對(duì)同時(shí)識(shí)別一個(gè)長(zhǎng)鏈非編碼RNA的DNA結(jié)合域和這段DNA區(qū)域中的長(zhǎng)鏈非編碼RNA結(jié)合位點(diǎn)。我們用置換檢驗(yàn)來(lái)評(píng)估預(yù)測(cè)結(jié)果的敏感性與專一性。
5.考察長(zhǎng)鏈非編碼RNA功能域的進(jìn)化特性
使用LongTarget,我們不僅預(yù)測(cè)人類(lèi)HOTAIR的DNA結(jié)合域,還預(yù)測(cè)其它物種HOTMR的DNA結(jié)合域,從而揭示HOTMR DNA結(jié)合域的種系差異和進(jìn)化特性。
結(jié)果:
1.HOTMR的分析結(jié)果
8、HOTAIR的直系同源基因僅存在于真哺乳動(dòng)物中,且外顯子表現(xiàn)出種系特異性缺失,HOTMR exon2在dog、mouse和rat中沒(méi)有找到直系同源序列,而且HOTAIR的功能域與保守區(qū)也表現(xiàn)出種系特異性缺失,長(zhǎng)達(dá)1800bp的人類(lèi)HOTMR exon6在靈長(zhǎng)類(lèi)中有得分較高的較完整的匹配,但在其它哺乳動(dòng)物匹配的得分很低,尤其是在mouse和rat中僅有很短的匹配,一大段的保守區(qū)在mouse和rat HOTAIR缺失。
2.ANR
9、IL的分析結(jié)果
與HOTAIR類(lèi)似,沒(méi)有在非哺乳脊椎動(dòng)物、單孔目哺乳動(dòng)物和有袋類(lèi)哺乳動(dòng)物中發(fā)現(xiàn)ANRIL的直系同源物。ANRIL的直系同源序列最早出現(xiàn)于貧齒目(sloth)和非洲獸總目(elephant)中,其基因結(jié)構(gòu)逐漸在勞亞獸總目中豐富起來(lái)。但是,一方面,在免形目和嚙齒目的分枝中ANRIL的外顯子逐漸丟失,進(jìn)而在mouse和rat中完全丟失,另一方面,在類(lèi)人猿中ANRIL獲得完整的基因結(jié)構(gòu)和19個(gè)外顯子。
ANR
10、IL外顯子在早期靈長(zhǎng)類(lèi)(tree shrew,tarsier)呈現(xiàn)出特殊和活躍的進(jìn)化。多個(gè)轉(zhuǎn)座子主要在類(lèi)人猿插入ANRIL,轉(zhuǎn)座子插入增進(jìn)了ANRIL外顯子序列與二級(jí)結(jié)構(gòu)的保守性。
3.人類(lèi)長(zhǎng)鏈非編碼RNA的種系特異性分析結(jié)果
由GENCODE項(xiàng)目第一期確定的13562個(gè)人類(lèi)長(zhǎng)鏈非編碼RNA在其它物種的直系同源基因數(shù)目統(tǒng)計(jì)如下:單孔目哺乳動(dòng)物platypus有1008個(gè)(7%),chimpanzee有13239個(gè)(9
11、8%),嚙齒目動(dòng)物中的mouse和rat分別為4416個(gè)(30%)和4099個(gè)(28%)。
用mix軟件估計(jì)了長(zhǎng)鏈非編碼RNA在各個(gè)祖先節(jié)點(diǎn)的gain/loss數(shù)量,嚙齒目、兔類(lèi)、樹(shù)鼩目和靈長(zhǎng)目的早期共同祖先有7458個(gè)(55%)同源基因,在此之后,同源基因的數(shù)量在嚙齒目和兔類(lèi)祖先有逐漸降低的趨勢(shì),而在靈長(zhǎng)目和樹(shù)鼩目的祖先則迅速增多,在靈長(zhǎng)目祖先增加到10498個(gè)(77%)。
4.長(zhǎng)鏈非編碼RNA的DNA結(jié)合域與結(jié)合
12、位點(diǎn)預(yù)測(cè)算法
基于24條Hoogsteen和反Hoogsteen堿基配對(duì)規(guī)則集,開(kāi)發(fā)了預(yù)測(cè)長(zhǎng)鏈非編碼RNA的DNA結(jié)合域和結(jié)合位點(diǎn)的軟件LongTarget,該算法表現(xiàn)出高敏感性和專一性。
5.典型長(zhǎng)鏈非編碼RNA的DNA結(jié)合域與結(jié)合位點(diǎn)預(yù)測(cè)
用LongTarget分析了逾20個(gè)典型長(zhǎng)鏈非編碼RNA,并和Triplexator的預(yù)測(cè)結(jié)果進(jìn)行了比較,我們發(fā)現(xiàn)LongTarget預(yù)測(cè)出來(lái)的DNA結(jié)合位點(diǎn)位于目標(biāo)
13、基因的啟動(dòng)子區(qū)域、CpG島和轉(zhuǎn)座子區(qū)域,而且與ChIP-seq實(shí)驗(yàn)揭示的染色質(zhì)組蛋白甲基化區(qū)域高度吻合。相比而言,Triplexator的許多預(yù)測(cè)結(jié)果偏離了啟動(dòng)子區(qū)域等重要已知調(diào)控元件。
結(jié)論:
1.HOTAIR和ANRIL起源于真哺乳動(dòng)物,HOTAIR在進(jìn)化中獲得功能域,而ANRIL則在進(jìn)化中獲得外顯子,兩個(gè)基因都表現(xiàn)出種系特異性進(jìn)化特征,提示長(zhǎng)鏈非編碼RNA序列與功能的種系特異性,也提示長(zhǎng)鏈非編碼RNA與種系形成
14、可能有密切關(guān)系。
2.ANRIL以及其它許多長(zhǎng)鏈非編碼RNA的形成與進(jìn)化與轉(zhuǎn)座子有密切的聯(lián)系,轉(zhuǎn)座子的插入及馴化對(duì)ANRIL外顯子的序列、結(jié)構(gòu)、保守性有顯著的影響。長(zhǎng)鏈非編碼RNA與轉(zhuǎn)座子的關(guān)系也是長(zhǎng)鏈非編碼RNA種系特異性的一個(gè)重要方面。
3.根據(jù)對(duì)13562個(gè)人類(lèi)長(zhǎng)鏈非編碼RNA同源基因的分析,我們發(fā)現(xiàn)它們表現(xiàn)出明顯的種系特異性,且大量人類(lèi)長(zhǎng)鏈非編碼RNA是靈長(zhǎng)類(lèi)特有的,其中約2%是人類(lèi)特有的。特別是,在單孔目哺
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 小鼠成骨細(xì)胞特異性長(zhǎng)鏈非編碼RNA影響其功能的研究.pdf
- 基于轉(zhuǎn)錄組數(shù)據(jù)的昆蟲(chóng)特異性序列及非編碼RNA基因的發(fā)現(xiàn).pdf
- 基于高通量RNA-seq數(shù)據(jù)的水稻亞種特異性編碼基因鑒定及長(zhǎng)非編碼RNA識(shí)別.pdf
- 面孔整體加工的種系特異性
- 面孔整體加工的種系特異性.pdf
- 帶你走進(jìn)神秘的長(zhǎng)鏈非編碼rna
- 基于序列-結(jié)構(gòu)信息的長(zhǎng)非編碼RNA預(yù)測(cè)方法.pdf
- 長(zhǎng)鏈非編碼RNA調(diào)控小鼠卵巢發(fā)育的初步研究.pdf
- 長(zhǎng)鏈非編碼RNA在肝癌中的研究進(jìn)展.pdf
- 特異性腰痛與非特異性腰痛的對(duì)比研究.pdf
- 長(zhǎng)鏈非編碼RNA PTENP1對(duì)PTEN基因表達(dá)的影響.pdf
- 抗豬囊尾蚴特異性單鏈抗體基因的克隆與序列分析.pdf
- 長(zhǎng)鏈非編碼RNA LOC728228作用機(jī)制的探索.pdf
- 長(zhǎng)鏈非編碼RNA在肝癌中作用的研究進(jìn)展.pdf
- 長(zhǎng)鏈非編碼RNA基因變異與冠心病的遺傳易感性研究.pdf
- 長(zhǎng)鏈非編碼RNA與醛固酮瘤發(fā)病機(jī)制相關(guān)性的研究.pdf
- 長(zhǎng)鏈非編碼RNA在胰腺導(dǎo)管腺癌表達(dá)譜分析.pdf
- 長(zhǎng)鏈非編碼RNA GAS5逆轉(zhuǎn)肺腺癌對(duì)吉非替尼耐藥的研究.pdf
- 長(zhǎng)鏈非編碼RNA ENST00000434223抑制非小細(xì)胞肺癌的機(jī)制研究.pdf
- 長(zhǎng)鏈非編碼RNA ICR促進(jìn)肝癌發(fā)生的作用及機(jī)制研究.pdf
評(píng)論
0/150
提交評(píng)論