基于生物知識的生物芯片表達譜數據分析研究.pdf_第1頁
已閱讀1頁,還剩108頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、20世紀的最后十年中,一項重大的生物學技術問世,這就是生物芯片技術。生物芯片技術能同時并行地檢測大量基因的表達水平,從而提供了研究蛋白質合成的高通量手段?,F(xiàn)在生物芯片實驗一般都在各物種全基因組水平上進行,由此產生的海量數據給芯片表達譜數據分析帶來了巨大的挑戰(zhàn)。如何從這些數據中找出基因之間的表達調控關系,揭示生物現(xiàn)象的內部分子機制,是目前生物信息學領域研究中的難點和熱點。 基因表達譜和生物功能之間存在密切的聯(lián)系,在相同實驗條件下表

2、達變化相關的基因一般都有相似的功能或參與相同的細胞過程,而且被共同的轉錄因子所調控。因此,結合先驗的生物知識已成為目前芯片表達譜數據分析的發(fā)展趨勢。生物知識包括序列信息、蛋白質結構和生物功能等。生物知識可以給表達譜數據分析提供指導,從而減少傳統(tǒng)純數學表達譜分析方法的盲目性,得到更有意義的結果。 結合生物知識的生物芯片表達譜數據分析還處于起步階段,已有的研究針對各自的分析目的都取得了一定成果,但是這些研究方法都缺乏對信息的整合?;?/p>

3、于此,我們提出了三種基于生物知識的生物芯片表達譜數據分析方法:基于Gene Ontology的聚類、改進的基因集合富集分析和功能模塊分析,主要研究成果如下: (1)設計并實現(xiàn)了基于Gene Ontology的芯片表達譜數據的聚類分析方法。在這種聚類方法中,GO的樹形結構被作為聚類的框架,待分析表達譜中的基因通過其對應的GO條目映射到GO樹上。通過對GO樹節(jié)點的逐層搜索,完成同時考慮表達模式相似性和功能相似性的基因聚類,并同時將聚

4、類結果用GO條目做功能注釋。通過兩組公共數據的驗證,我們證明了該聚類算法可以得到在表達模式一致性和注釋精度上都令人滿意的結果。而與當前平行軟件GO-Cluster的比較則顯示出該聚類方法在表達同質性和功能一致性上都有相當大的優(yōu)勢。 (2)改進了表達譜數據分析中的基因集合富集分析算法。將基因集合中成員的表達相關性信息結合到原基因集合富集分析中,從成員基因的差異表達程度和表達相關度兩個方面同時評價基因集合。與原分析結果的對比顯示,改

5、進后的結果不僅有更高的統(tǒng)計顯著性,而且誤發(fā)現(xiàn)率也明顯降低,并且,改進的基因集合富集分析可以比原基因集合富集分析找出更多的顯著差異表達基因集合,其中有一部分是與樣本類型密切相關但原基因集合富集分析無法檢驗得到的。 (3)用功能模塊法分析了在多種實驗條件下小鼠全基因組的表達譜數據,初步驗證了雌激素在缺血再灌注情況下對哺乳動物心臟的保護作用,并找到了一些與心臟保護作用機制相關的通路。在這個實驗中共有三個因素:性別,是否基因敲除(P-4

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論