版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、隨著基因組研究的深入和生物信息學的發(fā)展,對基因調(diào)控信息的分析和研究引起人們越米越多的重視。目前基因表達調(diào)控是分子生物學研究的一個重點,基因轉(zhuǎn)錄水平上的調(diào)控是最重要的環(huán)節(jié)。人類基因組計劃的順利實施和其它模式生物基因組測序工作逐步的進行,為研究人類基因及基因表達打下了堅實的基礎。而基因芯片技術的迅速發(fā)展,已使大規(guī)模檢測基因轉(zhuǎn)錄水平、研究基因表達時時空規(guī)律、分析基因之間的相互作用關系成為現(xiàn)實。 本文以建立一個完善、系統(tǒng)的基因調(diào)控信息
2、平臺為目標,分析了國際生物分子數(shù)據(jù)庫系統(tǒng)的發(fā)展狀況,研究了像GenBank、Transfac、EPD、SCPD、dbSNP等知名數(shù)據(jù)庫系統(tǒng)的實現(xiàn)機制,對基因調(diào)控信息集成數(shù)據(jù)庫系統(tǒng)GRID進行了后續(xù)設計、數(shù)據(jù)獲取和融合、系統(tǒng)管理、復雜查詢和數(shù)據(jù)可視化等工作。雖然我們的數(shù)據(jù)來源于這些知名的生物學數(shù)據(jù)庫,可是我們并不是簡單地將數(shù)據(jù)導入到GRID系統(tǒng)中,我們對這些數(shù)據(jù)進行了大量的分析和處理工作,并把這些不同來源的數(shù)據(jù)整合成為一個生物數(shù)據(jù)系統(tǒng)。
3、 GRID數(shù)據(jù)庫系統(tǒng)數(shù)據(jù)主體是基因調(diào)控信息數(shù)據(jù),主要包括從DNA到RNA的轉(zhuǎn)錄過程的信息以及其他過程中與基因調(diào)控相關的所有信息。具體到數(shù)據(jù)類型,主要是啟動子區(qū)域數(shù)據(jù)、轉(zhuǎn)錄基因數(shù)據(jù)、轉(zhuǎn)錄因子數(shù)據(jù)、調(diào)控元件數(shù)據(jù)、保守序列數(shù)據(jù)、矩陣數(shù)據(jù)、調(diào)控信息數(shù)據(jù)、單核苷酸多態(tài)性數(shù)據(jù)、下游區(qū)域數(shù)據(jù)。所有類型的數(shù)據(jù)之間都存在著聯(lián)系,并且這些聯(lián)系不是單向、單一的,而是雙向、多重的、有機的。并且我們還給出了相應的動態(tài)聯(lián)接將某些本系統(tǒng)尚未涉及的數(shù)據(jù)聯(lián)接到一
4、些相關生物學數(shù)據(jù)庫,使用戶的視野更加開闊。 GRID數(shù)據(jù)庫系統(tǒng)不僅能夠容納各種類型的基因調(diào)控信息,還能對不同數(shù)據(jù)源的數(shù)據(jù)格式進行兼容,完成多種相關數(shù)據(jù)庫數(shù)據(jù)源的分析和整合。在這個基礎上,我們對數(shù)據(jù)庫進行了后續(xù)表的設計并添加了新的數(shù)據(jù)類型,有機地擴充了數(shù)據(jù)庫系統(tǒng)??傊?,GRID是一個不斷發(fā)展的系統(tǒng),我們需要不斷的對它擴充和豐富。在數(shù)據(jù)庫的開發(fā)之余,作為數(shù)據(jù)庫的設計和管理員我們對整個數(shù)據(jù)庫的物理結構進行了有效的管理和優(yōu)化,完成了不
5、同用戶間的權限管理。 GRID數(shù)據(jù)庫系統(tǒng)在設計完成后,一項非常重要的工作就是將來自于各種數(shù)據(jù)源的數(shù)據(jù)導入到GRID數(shù)據(jù)庫當中,這是一項非常復雜的工作,因為數(shù)據(jù)導入具有較強的連續(xù)性。在數(shù)據(jù)不斷的導入過程中,前一條數(shù)據(jù)的錯誤導入或終止可能會對下面所有數(shù)據(jù)的正確性產(chǎn)生影響,導致后面所有數(shù)據(jù)的錯誤,進而影響到相關的GRID連接表,從而導致整個GRID數(shù)據(jù)庫系統(tǒng)數(shù)據(jù)的錯誤。因此,如何保證導入數(shù)據(jù)的正確性和安全性,是我們著重需要解決的問題
6、。出于這一點考慮,我們完成了一種新的安全準確的導入方案。 本文在現(xiàn)有數(shù)據(jù)的基礎上,根據(jù)生物信息學研究的需要,開發(fā)了相關復雜查詢的功能。我們還詳細分析了單核苷酸多態(tài)性數(shù)據(jù)并完成了相關數(shù)據(jù)的可視化工作,使用戶對數(shù)據(jù)庫所提供的信息有一個直觀的理解后再根據(jù)自己的需要選擇感興趣的信息進行進一步的查詢、下載和分析,并且可以方便的從一種信息數(shù)據(jù)得到在轉(zhuǎn)錄和翻譯過程中牽涉到的其他所有的信息數(shù)據(jù)。在實現(xiàn)中,沒有盲目采用國外生物信息數(shù)據(jù)庫的可視化
7、方法,而是根據(jù)本系統(tǒng)的實際情況,提出并實現(xiàn)了全新的Servlet+Applet可視化方法,大大節(jié)省了服務器的資源并且快速安全。將來我們還要在GRID系統(tǒng)的基礎上從事更多的基因調(diào)控信息分析和數(shù)據(jù)挖掘等方面的工作。 目前GRID數(shù)據(jù)庫系統(tǒng)已經(jīng)初具規(guī)模并進入試運行階段。總之,GRID數(shù)據(jù)庫系統(tǒng)是一個真正自主開發(fā)研制的基因調(diào)控信息數(shù)據(jù)庫系統(tǒng),它不是單純的國外數(shù)據(jù)庫的鏡像,而是一個能夠兼容不同數(shù)據(jù),可以從不同數(shù)據(jù)源自動下載和更新數(shù)據(jù)的集
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基因表達數(shù)據(jù)的集成、分析和可視化.pdf
- 采礦信息可視化集成系統(tǒng)研究.pdf
- 雷達-紅外的可視化仿真與目標信息的獲取.pdf
- 空間信息的可視化表達——以紅水河土地利用信息可視化表達為例.pdf
- 基因表達熱點信息可視化工具的開發(fā).pdf
- 可視化知識獲取研究與實現(xiàn).pdf
- 基于脈動信息獲取的中醫(yī)脈診數(shù)字化、可視化探討.pdf
- 可視化集成開發(fā)環(huán)境研究.pdf
- 基于GIS的可視化交通管理信息集成系統(tǒng)設計.pdf
- 基于深度信息的三維集成成像可視化研究.pdf
- 基于臨近空間平臺的立體信息獲取及可視化技術研究.pdf
- 信息可視化圖表設計.pdf
- 可視化脈診信息獲取與識別技術的應用與比較研究.pdf
- 地震信息共享和可視化平臺研究.pdf
- 大景深集成成像的可視化研究.pdf
- 道路養(yǎng)護地理信息可視化表達模型和應用研究.pdf
- 基于XML的可視化知識獲取與模式驗證.pdf
- 基于XML的信息系統(tǒng)集成的可視化匹配研究.pdf
- 可視化集成采礦CAD技術研究.pdf
- 可視化代謝數(shù)據(jù)集成系統(tǒng)研究.pdf
評論
0/150
提交評論