版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、后基因組(post-genome)生物醫(yī)學(xué)的一個關(guān)鍵目標(biāo)就是對活細(xì)胞內(nèi)的所有分子及其相互間的作用進(jìn)行全面和系統(tǒng)地研究。理解細(xì)胞系統(tǒng)的一個關(guān)鍵步驟是對DNA、RNA、蛋白質(zhì)和化學(xué)小分子等相關(guān)的物理相互作用網(wǎng)絡(luò)進(jìn)行映射,從而對特定的物種形成一個盡可能完整和準(zhǔn)確的相互作用組網(wǎng)絡(luò)(interactome network)。研究者們采用高通量技術(shù)的實驗,基于計算的預(yù)測,以及文獻(xiàn)挖掘等方法得到了大量的、有價值的相互作用組數(shù)據(jù)。同時,為了管理和利用這
2、些數(shù)據(jù),研究者們建立了許多相互作用組數(shù)據(jù)庫。但是,現(xiàn)有的相互作用組數(shù)據(jù)庫相互隔離,形成了所謂的“信息孤島”,不能實現(xiàn)數(shù)據(jù)共享(data sharing)和更有效的利用。為了更好地管理和更有效地利用現(xiàn)有的相互作用組數(shù)據(jù),需要將這些相互獨(dú)立的數(shù)據(jù)庫有機(jī)地集成在一起。這對于增加相互作用組研究的整體知識水平,以及對該領(lǐng)域更深入、更全面的理解是十分重要的。數(shù)據(jù)集成(data integration)已經(jīng)成為相互作用組研究的重要方向之一。
3、 本研究建立了相互作用組數(shù)據(jù)倉庫InteractomeDW。InteractomeDW包括相互作用組數(shù)據(jù)庫集合,生物實體映射數(shù)據(jù)庫,生物學(xué)本體和受控詞表數(shù)據(jù)庫集合,以及生物學(xué)注釋數(shù)據(jù)庫等四大部分。InteractomeDW存儲了62779056條相互作用記錄,涉及51個相互作用組數(shù)據(jù)源,9個輔助數(shù)據(jù)源,5個相互作用組數(shù)據(jù)類型(蛋白質(zhì)相互作用,結(jié)構(gòu)域相互作用,分子間相互作用,復(fù)合物和通路),2426個物種,170個相互作用鑒定方法,4
4、4個相互作用類型,以及85212篇參考文獻(xiàn)。就我們所知,InteractomeDW比現(xiàn)有相關(guān)研究建立的數(shù)據(jù)倉庫的規(guī)模都要大。
本研究首次提出融合了基于數(shù)據(jù)倉庫(data warehouse)和基于中介(mediation)這兩種方法的新型異構(gòu)數(shù)據(jù)集成方法WM。WM方法采用數(shù)據(jù)倉庫方式進(jìn)行數(shù)據(jù)管理,以確保數(shù)據(jù)源的可用性、提高系統(tǒng)查詢效率和數(shù)據(jù)質(zhì)量。待集成的所有相互作用組數(shù)據(jù)庫都存儲在本地服務(wù)器上,這樣可以最大限度地確保數(shù)據(jù)源
5、的可用性。同時,本地存儲策略顯著提高了系統(tǒng)的查詢效率和響應(yīng)能力。相互作用組數(shù)據(jù)倉庫提供的數(shù)據(jù)清洗功能可以檢測、修正或刪除所有相互作用組數(shù)據(jù)庫中己損壞、不完整或不準(zhǔn)確的臟數(shù)據(jù),進(jìn)而提高所集成數(shù)據(jù)的質(zhì)量。WM方法采用中介方式實現(xiàn)具體的數(shù)據(jù)集成工作,以提高系統(tǒng)的擴(kuò)展性和可維護(hù)性。在WM方法中,可以方便地通過向中介器模塊的映射關(guān)系表注冊新的數(shù)據(jù)源,并構(gòu)建相應(yīng)包裝器的方式實現(xiàn)數(shù)據(jù)集成范圍的擴(kuò)展。這種擴(kuò)展方式對數(shù)據(jù)集成系統(tǒng)的其他部分沒有任何影響,實
6、現(xiàn)了可插拔式的數(shù)據(jù)集成。這種低耦合度、靈活的集成方式使得數(shù)據(jù)集成系統(tǒng)的可維護(hù)性大大加強(qiáng)。WM方法結(jié)合了上述兩種數(shù)據(jù)集成方法的優(yōu)點(diǎn),很好地兼顧了數(shù)據(jù)集成的效率和靈活性,為相互作用組數(shù)據(jù)集成提供了基礎(chǔ)架構(gòu)和解決方案。
本研究利用WM方法成功地構(gòu)建了一個可靠性高、數(shù)據(jù)質(zhì)量高、查詢效率高和可擴(kuò)展性強(qiáng)的基于網(wǎng)絡(luò)的相互作用組異構(gòu)數(shù)據(jù)集成系統(tǒng)IMbase。建立IMbase的目的就是讓生物學(xué)家可以透明地訪問相互作用組異構(gòu)數(shù)據(jù)庫,更有效地利
7、用其中的數(shù)據(jù)。IMbase是一個共享和利用相互作用組數(shù)據(jù)的基礎(chǔ)平臺,為生物學(xué)家提供了相互作用組數(shù)據(jù)集成、相互作用網(wǎng)絡(luò)分析和推理,以及相應(yīng)的Web Service開發(fā)接口等多種功能,進(jìn)而可以幫助生物學(xué)家生成相互作用假說和實現(xiàn)知識發(fā)現(xiàn)(knowledgediscovery)。IMbase對相互作用組相關(guān)數(shù)據(jù)進(jìn)行了垂直集成。這樣做可以通過及時總結(jié)和整理現(xiàn)有數(shù)據(jù),實現(xiàn)相互作用組研究領(lǐng)域內(nèi)更廣泛的數(shù)據(jù)共享,進(jìn)而提高相互作用組研究領(lǐng)域的總體知識水平
8、。以相互作用組數(shù)據(jù)的垂直集成為基礎(chǔ),可以進(jìn)一步實現(xiàn)跨領(lǐng)域和學(xué)科數(shù)據(jù)的水平集成,以實現(xiàn)更有價值的知識發(fā)現(xiàn)。就我們所知,IMbase是現(xiàn)有數(shù)據(jù)規(guī)模最大,功能最為完善的相互作用組數(shù)據(jù)集成系統(tǒng)。用戶可以通過網(wǎng)址http://122.70.220.98/imbase/index.gr免費(fèi)訪問IMbase。
本研究將IMbase系統(tǒng)應(yīng)用于小鼠神經(jīng)管缺陷(NTDs)的研究。以表達(dá)譜芯片篩選出的差異表達(dá)基因為誘餌,利用IMbase獲得與這
9、些差異表達(dá)基因有相互作用的生物實體對應(yīng)的基因,并構(gòu)建相應(yīng)的相互作用網(wǎng)絡(luò)。本研究建立了已知小鼠NTDs候選基因數(shù)據(jù)庫MouseNTDs。通過MouseNTDs數(shù)據(jù)庫對潛在NTDs候選基因進(jìn)行篩選,以確定已被認(rèn)定和尚未被認(rèn)定為小鼠NTDs候選基因的潛在NTDs候選基因。最后,通過研究這些篩選出的潛在NTDs候選基因的注釋信息和通路信息,本研究提出了小鼠NTDs候選基因假說,為進(jìn)一步的分子生物學(xué)實驗提供可能的方向。
本研究的主要
10、創(chuàng)新之處在于:
1.提出了一種新的異構(gòu)數(shù)據(jù)集成的方法WM。WM方法結(jié)合了基于數(shù)據(jù)倉庫和基于中介這兩種數(shù)據(jù)集成方法的優(yōu)點(diǎn),很好地兼顧了數(shù)據(jù)集成的效率和靈活性,為相互作用組異構(gòu)數(shù)據(jù)集成提供了基礎(chǔ)架構(gòu)和解決方案。
2.建立了一個相互作用組數(shù)據(jù)倉庫InteractomeDW。InteractomeDW共存儲了超過62百萬(62779056)條相互作用記錄,涉及51個相互作用組數(shù)據(jù)源,9個輔助數(shù)據(jù)源,5個相互作用組數(shù)據(jù)
11、類型(蛋白質(zhì)相互作用,結(jié)構(gòu)域相互作用,分子間相互作用,復(fù)合物和通路),2426個物種,170個相互作用鑒定方法,44個相互作用類型,以及85212篇參考文獻(xiàn)。
3.建立了一個生物實體映射數(shù)據(jù)庫BEM。BEM是由5個相關(guān)數(shù)據(jù)源集成而來,共存儲了超過1.8億(180328282)條非冗余的映射記錄,涉及4個實體類型(基因,蛋白質(zhì),小分子物質(zhì)和化合物),可以實現(xiàn)90個常用生物醫(yī)學(xué)數(shù)據(jù)庫之間的實體映射。
4.利用WM
12、方法,構(gòu)建了一個基于網(wǎng)絡(luò)的相互作用組異構(gòu)數(shù)據(jù)集成系統(tǒng)IMbase。IMbase是一個共享和利用相互作用組數(shù)據(jù)的計算平臺,提供相互作用組數(shù)據(jù)集成、相互作用網(wǎng)絡(luò)分析和推理、生物實體映射等多種服務(wù),可以幫助研究者生成相互作用假說和實現(xiàn)知識發(fā)現(xiàn)。
5.構(gòu)建的異構(gòu)數(shù)據(jù)集成系統(tǒng)IMbase不但提供了基于網(wǎng)絡(luò)應(yīng)用程序的訪問方式,而且還提供了基于Web Service的訪問方式,以便為相關(guān)軟件開發(fā)者提供編程接口,實現(xiàn)軟件復(fù)用和可互操作性。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 異構(gòu)數(shù)據(jù)集成平臺研究.pdf
- 光致異構(gòu)聚合物中光學(xué)空間孤子相互作用研究.pdf
- 異構(gòu)數(shù)據(jù)集成技術(shù)研究.pdf
- 基于集成神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)相互作用研究.pdf
- 藥物相互作用
- 異構(gòu)數(shù)據(jù)集成管理平臺研究.pdf
- APP與NCAM異構(gòu)體選擇性相互作用的初步研究.pdf
- 油砂瀝青四組份在甲苯中相互作用研究.pdf
- lncrnamirnamrna相互作用初步研究
- 4 相互作用
- 異構(gòu)數(shù)據(jù)集成的研究與實現(xiàn).pdf
- 蛋白質(zhì)相互作用數(shù)據(jù)整合與網(wǎng)絡(luò)模塊研究.pdf
- 基于服務(wù)數(shù)據(jù)對象的異構(gòu)數(shù)據(jù)集成研究.pdf
- 結(jié)核分枝桿菌DNA拓?fù)洚悩?gòu)酶Ⅰ與DNA的相互作用研究.pdf
- 5206.分子間相互作用與其磁耦合相互作用的關(guān)聯(lián)研究
- 基于組學(xué)數(shù)據(jù)挖掘的微生物檢測、基因組注釋及與宿主相互作用的研究.pdf
- 孤立子相互作用的研究.pdf
- 膠體間相互作用的研究.pdf
- 基于XML異構(gòu)數(shù)據(jù)集成的研究.pdf
- 自旋相關(guān)相互作用的研究.pdf
評論
0/150
提交評論