2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩79頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、隨著基因組研究的深入和生物信息學(xué)的發(fā)展,對基因調(diào)控信息的分析和研究引起人們越米越多的重視。目前基因表達(dá)調(diào)控是分子生物學(xué)研究的一個重點(diǎn),基因轉(zhuǎn)錄水平上的調(diào)控是最重要的環(huán)節(jié)。人類基因組計劃的順利實(shí)施和其它模式生物基因組測序工作逐步的進(jìn)行,為研究人類基因及基因表達(dá)打下了堅實(shí)的基礎(chǔ)。而基因芯片技術(shù)的迅速發(fā)展,已使大規(guī)模檢測基因轉(zhuǎn)錄水平、研究基因表達(dá)時時空規(guī)律、分析基因之間的相互作用關(guān)系成為現(xiàn)實(shí)。 本文以建立一個完善、系統(tǒng)的基因調(diào)控信息

2、平臺為目標(biāo),分析了國際生物分子數(shù)據(jù)庫系統(tǒng)的發(fā)展?fàn)顩r,研究了像GenBank、Transfac、EPD、SCPD、dbSNP等知名數(shù)據(jù)庫系統(tǒng)的實(shí)現(xiàn)機(jī)制,對基因調(diào)控信息集成數(shù)據(jù)庫系統(tǒng)GRID進(jìn)行了后續(xù)設(shè)計、數(shù)據(jù)獲取和融合、系統(tǒng)管理、復(fù)雜查詢和數(shù)據(jù)可視化等工作。雖然我們的數(shù)據(jù)來源于這些知名的生物學(xué)數(shù)據(jù)庫,可是我們并不是簡單地將數(shù)據(jù)導(dǎo)入到GRID系統(tǒng)中,我們對這些數(shù)據(jù)進(jìn)行了大量的分析和處理工作,并把這些不同來源的數(shù)據(jù)整合成為一個生物數(shù)據(jù)系統(tǒng)。

3、 GRID數(shù)據(jù)庫系統(tǒng)數(shù)據(jù)主體是基因調(diào)控信息數(shù)據(jù),主要包括從DNA到RNA的轉(zhuǎn)錄過程的信息以及其他過程中與基因調(diào)控相關(guān)的所有信息。具體到數(shù)據(jù)類型,主要是啟動子區(qū)域數(shù)據(jù)、轉(zhuǎn)錄基因數(shù)據(jù)、轉(zhuǎn)錄因子數(shù)據(jù)、調(diào)控元件數(shù)據(jù)、保守序列數(shù)據(jù)、矩陣數(shù)據(jù)、調(diào)控信息數(shù)據(jù)、單核苷酸多態(tài)性數(shù)據(jù)、下游區(qū)域數(shù)據(jù)。所有類型的數(shù)據(jù)之間都存在著聯(lián)系,并且這些聯(lián)系不是單向、單一的,而是雙向、多重的、有機(jī)的。并且我們還給出了相應(yīng)的動態(tài)聯(lián)接將某些本系統(tǒng)尚未涉及的數(shù)據(jù)聯(lián)接到一

4、些相關(guān)生物學(xué)數(shù)據(jù)庫,使用戶的視野更加開闊。 GRID數(shù)據(jù)庫系統(tǒng)不僅能夠容納各種類型的基因調(diào)控信息,還能對不同數(shù)據(jù)源的數(shù)據(jù)格式進(jìn)行兼容,完成多種相關(guān)數(shù)據(jù)庫數(shù)據(jù)源的分析和整合。在這個基礎(chǔ)上,我們對數(shù)據(jù)庫進(jìn)行了后續(xù)表的設(shè)計并添加了新的數(shù)據(jù)類型,有機(jī)地擴(kuò)充了數(shù)據(jù)庫系統(tǒng)??傊?,GRID是一個不斷發(fā)展的系統(tǒng),我們需要不斷的對它擴(kuò)充和豐富。在數(shù)據(jù)庫的開發(fā)之余,作為數(shù)據(jù)庫的設(shè)計和管理員我們對整個數(shù)據(jù)庫的物理結(jié)構(gòu)進(jìn)行了有效的管理和優(yōu)化,完成了不

5、同用戶間的權(quán)限管理。 GRID數(shù)據(jù)庫系統(tǒng)在設(shè)計完成后,一項(xiàng)非常重要的工作就是將來自于各種數(shù)據(jù)源的數(shù)據(jù)導(dǎo)入到GRID數(shù)據(jù)庫當(dāng)中,這是一項(xiàng)非常復(fù)雜的工作,因?yàn)閿?shù)據(jù)導(dǎo)入具有較強(qiáng)的連續(xù)性。在數(shù)據(jù)不斷的導(dǎo)入過程中,前一條數(shù)據(jù)的錯誤導(dǎo)入或終止可能會對下面所有數(shù)據(jù)的正確性產(chǎn)生影響,導(dǎo)致后面所有數(shù)據(jù)的錯誤,進(jìn)而影響到相關(guān)的GRID連接表,從而導(dǎo)致整個GRID數(shù)據(jù)庫系統(tǒng)數(shù)據(jù)的錯誤。因此,如何保證導(dǎo)入數(shù)據(jù)的正確性和安全性,是我們著重需要解決的問題

6、。出于這一點(diǎn)考慮,我們完成了一種新的安全準(zhǔn)確的導(dǎo)入方案。 本文在現(xiàn)有數(shù)據(jù)的基礎(chǔ)上,根據(jù)生物信息學(xué)研究的需要,開發(fā)了相關(guān)復(fù)雜查詢的功能。我們還詳細(xì)分析了單核苷酸多態(tài)性數(shù)據(jù)并完成了相關(guān)數(shù)據(jù)的可視化工作,使用戶對數(shù)據(jù)庫所提供的信息有一個直觀的理解后再根據(jù)自己的需要選擇感興趣的信息進(jìn)行進(jìn)一步的查詢、下載和分析,并且可以方便的從一種信息數(shù)據(jù)得到在轉(zhuǎn)錄和翻譯過程中牽涉到的其他所有的信息數(shù)據(jù)。在實(shí)現(xiàn)中,沒有盲目采用國外生物信息數(shù)據(jù)庫的可視化

7、方法,而是根據(jù)本系統(tǒng)的實(shí)際情況,提出并實(shí)現(xiàn)了全新的Servlet+Applet可視化方法,大大節(jié)省了服務(wù)器的資源并且快速安全。將來我們還要在GRID系統(tǒng)的基礎(chǔ)上從事更多的基因調(diào)控信息分析和數(shù)據(jù)挖掘等方面的工作。 目前GRID數(shù)據(jù)庫系統(tǒng)已經(jīng)初具規(guī)模并進(jìn)入試運(yùn)行階段??傊珿RID數(shù)據(jù)庫系統(tǒng)是一個真正自主開發(fā)研制的基因調(diào)控信息數(shù)據(jù)庫系統(tǒng),它不是單純的國外數(shù)據(jù)庫的鏡像,而是一個能夠兼容不同數(shù)據(jù),可以從不同數(shù)據(jù)源自動下載和更新數(shù)據(jù)的集

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論