基于主成分分析和神經網絡的癌癥驅動基因預測模型.pdf_第1頁
已閱讀1頁,還剩60頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、癌癥是人類生命和健康的主要威脅之一,它不僅給個人和家庭造成沉重的精神壓力和經濟負擔,也嚴重影響了全球的經濟發(fā)展和社會進步。癌癥產生機制及其控制研究已經成為全球性的衛(wèi)生戰(zhàn)略研究重點。既往癌癥的研究主要集中在尋找其外部誘因,對于內在的致癌機理知之甚少,直到高通量測序技術等方法的出現,使得從基因水平分析內因成為可能。通過分析癌癥形成過程中細胞內基因表達水平的變化,人們發(fā)現有些基因能夠對腫瘤起控制作用,如果抑制這些基因表達或基因通路,就可以終止

2、腫瘤發(fā)展的相關事件,這些基因被稱為癌癥驅動基因。驅動基因是決定癌癥的最主要內部原因,針對驅動基因靶向治療,癌癥治療就可能事半功倍。
  目前,我們主要通過分析大量樣本的序列比對結果來預測癌癥驅動基因,這種基于生物學的方法易于理解,但往往需要對大量的癌癥樣本進行測序,花費昂貴。隨著分子生物學的快速發(fā)展,諸如TCGA(The Cancer Genome Atlas)等組織為研究者提供了數量龐大且更新及時的數據資源,此外,機器學習、數據

3、挖掘等技術的涌現為分析這些數據提供了強大的支撐。驅動基因預測逐漸向數據化方向發(fā)展。
  本文介紹了驅動基因的研究背景、意義和方法,并對主成分分析方法和神經網絡的基本原理及在本文中的應用做詳細分析介紹。基于這兩種方法,我們提出了一種用于預測癌癥驅動基因的系統(tǒng)生物學模型,該模型能夠從微陣列數據出發(fā)逐步得到驅動基因預測集,降低實驗過程中相關步驟的系統(tǒng)誤差和人為誤差,可以有效地減少經費支出和實驗周期,為癌癥的靶向治療提供依據。本文選取多形

4、性膠質母細胞瘤作為實驗對象進行驗證。首先,對實驗樣本數據進行預處理,對腫瘤表達譜數據進行歸一化等處理,之后利用主成分分析方法進一步過濾無表達信息或者表達信息過低的表達數據;其次,受模塊網絡的啟發(fā),對篩選出的基因進行劃分,將具有相似突變率的基因劃分在同一個塊中,并對塊進行排序;最后,通過受限玻爾茲曼機學習得到驅動基因的預測集,并將預測結果和文本挖掘的結果進行比較,發(fā)現有80%左右的基因符合文本挖掘的結果,證明本文提出的模型具有一定的可行性

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論