PAP1基因和PAP2基因的克隆及其相關生物信息學研究.pdf_第1頁
已閱讀1頁,還剩216頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、目的:腫瘤抑制蛋白P53是一個通用轉錄因子,通過激活或抑制其下游基因的表達,在應答諸如癌基因表達、缺氧以及DNA損傷等細胞脅迫信號方面起著關鍵作用。P53及其下游基因組成了一個復雜的調(diào)控網(wǎng)絡,了解該調(diào)控網(wǎng)絡無論對于理解P53的生理功能、腫瘤臨床基因治療或是藥物發(fā)現(xiàn)等都具有十分重大的意義。而了解P53調(diào)控網(wǎng)絡的關鍵是鑒定p53下游基因。本研究首先利用分子生物學的方法克隆新的p53下游基因,并對其功能進行初步研究;其次利用生物信息學方法對整

2、個人類基因組DNA中存在的p53下游基因進行預測分析;從而進一步完善p53基因調(diào)控網(wǎng)絡。 方法:利用哺乳動物基因誘導表達系統(tǒng),Tet-On<'TM>基因表達系統(tǒng),以人腦膠質(zhì)瘤細胞株U251為實驗材料,建立p53基因可誘導表達的轉p53基因細胞系,并構建p53基因過度表達的cDNA文庫。通過差異顯示、測序、同源性比較及cDNA文庫篩選等方法克隆新的p53下游基因。對新克隆的p53下游基因利用生物信息學方法進行結構與功能預測,通過凝

3、膠滯留實驗研究新克隆的p53下游基因調(diào)控序列與P53蛋白結合狀態(tài),并利用Northern blot、原位雜交等分子生物學實驗技術研究克隆的基因在小鼠胚胎發(fā)育過程中表達規(guī)律。 結果:主要包括以下五個方面: 一、建立了p53基因可誘導表達的轉p53基因細胞系,命名為U251-pTet-p53。該細胞系在強力霉素誘導下,外源性p53基因過度表達,在沒有強力霉素的培養(yǎng)基條件下,外源性p53基因幾乎不表達。差異顯示結果表明:外源性

4、p53基因過度表達,能引起細胞內(nèi)許多基因的差異表達,有的基因表達上調(diào),有的基因表達下調(diào)。所有這些差異表達的基因都有可能是p53下游基因。對觀察到的有差異表達的11個EST進行測序,其中2個代表未報道的新基因。 二、建立了p53基因過度表達時的cDNA文庫。并對第一部分差異顯示獲得的兩個新的EST,進一步通過cDNA文庫篩選獲得全序列,分別命名為PAP1(p53 activated protein 1)(GenBank 收錄號:A

5、F497245)和 PAP2(p53 actirated protein 2)(GenBank 收錄號:AY093673)。 三、PAP1基因的結構與功能: 1、PAP1基因的生物信息學分析表明: (1)、PAP1基因定位于人類染色體16p12-13,整個基因由6個外顯子和5個內(nèi)含子組成; (2)、PAP1基因啟動子和前3個內(nèi)含子中含有許多P53蛋白結合位點; (3)、PAP1基因cDNA全長27

6、79 bp,開放閱讀框起始第282 nt,終止位點第1130nt,全長846bp。預測其編碼蛋白分子量為32.9KD,理論等電點pI為5.81,化學方程式為C<,1505>H<,2309>N<,385>O<,421>S<,11>。 (4)、PAP1蛋白的二級結構:40%為α螺旋,17%為β折疊,43%為其它類型的二級結構。PAP1蛋白為親水性蛋白,存在一個跨膜區(qū),大約在42-79氨基酸片段,沒有信號肽。 (5)、PAP1

7、 基因?qū)倜庖咔虻鞍壮易?IGSF)成員,與黑猩猩、狗、小鼠、雞、牛等物種具有高度同源性,在進化過程中十分保守。 2、分子生物學實驗結果表明: (1)、內(nèi)含子 2 中的P53 蛋白結合位點,GAGCTTGTCCcccGAtCAAGCCC,能與P53蛋白結合,說明PAP1基因是p53下游基因; (2)、PCNA 免疫組織化學和細胞凋亡檢測結果表明:小鼠胚胎發(fā)育的第9-10天主要以細胞增殖為主的時期;胚胎第11-14

8、天是細胞增殖和凋亡的逐漸趨于平衡的階段;不同組織的發(fā)育進程不同。 (3)、Northern blot結果表明PAP1基因(實際上是PAP1在小鼠中的同源基因IGSF6)在小鼠胚胎不同的發(fā)育時期表達有差異。 (4)、原位雜交顯示:PAP1基因(實際上是PAP1在小鼠中的同源基因IGSF6)在第11-14天中,肺、腎、腸及脊柱組織中特異性表達,說明PAP1基因參與了這些主要器官的發(fā)育過程,通過與發(fā)育過程的細胞增殖與凋亡趨勢比

9、較,該基因很可能與胚胎發(fā)育過程中的細胞凋亡有關。 四、PAP2基因的生物信息學分析表明: (1)、PAP2基因定位于人類17號染色體上; (2)、mRNA全長2007bp轉錄調(diào)控區(qū)域起始位167bp處,啟動子序列在反鏈1998-1748處,開放閱讀范952bp-146lbp,全長 510bp; (3)、它編碼蛋白全長 169aa,分子量為19247.3,理論等電點為12.56,化學式為C<,818>H<,

10、1355>N<,317>O<,208>S<,9>。沒有發(fā)現(xiàn)信號肽和跨膜螺旋結構,屬于親水性,非分泌性蛋白; (4)、PAP2蛋白亞細胞定位在核內(nèi); (5)、PAP2 蛋白二級結構:α螺旋20.71%,β折疊4.14%,其他75.15%。 五、本研究共收集已報道的49個p53下游基因及72條P53蛋白結合序列。 1、統(tǒng)計分析結果: (1)、基本上與El-Deiry等定義的一致性保守序列特征吻合,但在

11、十聚體的絕大多數(shù)位點都存在錯配,錯配率在10-20%; (2)、對于整個十聚體,錯配數(shù)為3的基因占34.4%,錯配數(shù)為4的基因占12.7%,錯配數(shù)為5的基因占6.35%。因此,我們認為用一致性序列模型預測p53下游基因時,整個十聚體的允許的錯配數(shù)為4比較恰當; (3)、在一致性序列中,插入的堿基數(shù)與錯配數(shù)呈正相關。 2、建立logistic回歸模結果如下: (1)、采用兩個PWM矩陣來分別對前后十聚體建模

12、,并采用交叉驗證法確定已報道的結合序列中的模體,將確定位置的模體特征信息作為logistic回歸分析的對象,通過SPSS提供的logistic回歸分析模型對特征逐步選取,最終確定以前后十聚體的PWM得分作為特征信息建立了logistic回歸模型,閾值設為0.1076,其中hpwmsc,tpwmsc分別表示motif的前后十聚體中PWM模型得分。 (2)、用已報道的P53結合序列作為正數(shù)據(jù)集,隨機挑選的CDS序列作為負數(shù)據(jù)集,并對

13、正數(shù)據(jù)集和負數(shù)據(jù)集進行刀切法測試驗證了方法的有效性,平均正確率達到了93.91%。 (3)、利用我們總結的保守性一致性序列模型、修正后一致性序列模型及建立的logistic回歸模型,采用Perl語言編寫程序,對人類基因組數(shù)據(jù)中P53結合位點進行分析比較,表明logistic回歸模型的識別性能更加優(yōu)異,而且該模型還具有良好的可擴展性,能夠方便地容納新特征,使識別性能不斷提高。 3、對人類基因組DNA進行p53下游基因預測分析結果:

14、 (1)、利用保守性一致性序列預測到p53下游基因1693個; (2)、利用允許錯配數(shù)為4的一致性序列(串模型)預測到p53下游基因22107個; (3)、利用logistic回歸模型預測到p53下游基因15182個; 4、基于GO對p53下游基因進行功能分類結果: (1)、細胞組分:p53下游基因主要的功能集中在細胞、細胞器及蛋白復合物等幾個區(qū)域。 (2)、分子功能:p53下游基因功能主

15、要有結合、催化活性、酶調(diào)節(jié)活性、信號轉導活性、結構分子行為、轉譯調(diào)節(jié)活性、運輸行為和未知分子功能等幾個方面。而在轉譯調(diào)節(jié)活性、運輸行為和未知分子功能等功能區(qū)域中有非常多p53下游基因還沒有被發(fā)現(xiàn)。 (3)、生物過程:p53下游基因參與的生物過程主要包括細過程胞內(nèi)一生理過程、生物學過程調(diào)節(jié)、刺激應答等,在發(fā)育、未知的生物學過程等有非常多的p53下游基因還沒有被發(fā)現(xiàn)。 結論:主要包括如下: (1)建立了p53基因可誘

16、導表達的轉p53基因細胞系,命名為U251-pTet-p53。該細胞系中外源性p53基因可以被強力霉素誘導過度表達。 (2)構建了p53基因過度表達時的cDNA文庫。 (3)PAP1基因是新克隆的p53下游基因,定位于人類染色體16p12-13,由6個外顯子和5個內(nèi)含子組成。PAP1基因編碼的蛋白屬免疫球蛋白超家族(IGSF)成員,在進化過程中十分保守。PAP1基因在小鼠胚胎發(fā)育過程中,肺、腎、腸及脊柱組織中有特異性表達

17、,很可能與這些器官發(fā)育過程中的細胞凋亡有關。 (4)PAP2基因是新克隆的p53下游基因,定位于人類17號染色體上,其編碼的蛋白在進化過程中十分保守; (5)對已報道的p53下游基因分析表明,用一致性序列模型預測p53下游基因時,整個十聚體允許的錯配數(shù)為4比較恰當; (6)建立了預測p53下游基因的logistic回歸模型,閾值設為0.1076,其中hpwmsc,tpwmsc分別表示motif(decamers)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論