關(guān)于提高T細胞表位預(yù)測性能的智能計算方法的研究.pdf_第1頁
已閱讀1頁,還剩143頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、大量研究表明:病原體感染、腫瘤發(fā)生發(fā)展、自身免疫性疾病的發(fā)生發(fā)展和組織器官移植排斥都與T細胞抗原識別和活化異常或偏離相關(guān)。T細胞表位(Tcellepitope)是指抗原經(jīng)過抗原提呈細胞(APC)加工后,由主要組織相容性復(fù)合體(MHC)分子提呈給T細胞受體(TCR)的短肽。T細胞表位預(yù)測是指借助于計算機的海量數(shù)據(jù)處理能力,從數(shù)百萬的蛋白質(zhì)里找出既能與特定的MHC分子結(jié)合,又能與特定TCR結(jié)合的抗原肽;并在此基礎(chǔ)上通過生物實驗判斷找到的抗原

2、肽能否使得T細胞活化;若能,則確定該抗原肽為T細胞抗原表位。T細胞表位預(yù)測技術(shù)對于減少實驗合成重疊肽、理解T細胞介導(dǎo)的免疫特異性和研制亞單位多肽及基因疫苗具有重要意義?! ”菊n題是國家自然科學(xué)基金重點項目“T細胞特異性識別和活化信息數(shù)量化和可視化研究(No.30230350)”中的一個重要子課題?! ”疚尼槍ΜF(xiàn)有基于機器學(xué)習(xí)的T細胞表位預(yù)測中亟待解決的4個問題(即預(yù)測模型的收斂速度慢、預(yù)測錯誤率尚可降低、可理解性差和增量學(xué)習(xí)難)進行

3、了研究。本論文的研究工作是在利用初級錨點知識和遺傳算法將MHC結(jié)合肽的親和力預(yù)測問題轉(zhuǎn)化成為一個可供計算的模式分類問題的基礎(chǔ)上展開的。其主要創(chuàng)新性成果如下:  1)針對目前比較流行的基于誤差反傳神經(jīng)網(wǎng)絡(luò)(BPNN)的T細胞表位預(yù)測模型存在訓(xùn)練速度慢和難以增量學(xué)習(xí)等不足,本文選取了排序?qū)W習(xí)前向掩蔽模型(SLAM)作為預(yù)測模型,極大加快了模型的收斂速度。與此同時,本文還基于SLAM模型提出了快速增量學(xué)習(xí)算法,成功實現(xiàn)了對新增樣本的快速增量

4、學(xué)習(xí)。實驗結(jié)果表明,基于SLAM模型的T細胞表位預(yù)測模型能夠在很短的時間內(nèi)快速實現(xiàn)增量學(xué)習(xí)?! ?)為進一步降低T細胞表位預(yù)測錯誤率,本文首次提出了基于神經(jīng)網(wǎng)絡(luò)集成的預(yù)測模型。實驗結(jié)果顯示該模型在預(yù)測錯誤率上較單個神經(jīng)網(wǎng)絡(luò)模型有明顯降低?! ?)模型的可理解性對于幫助生物學(xué)專家理解MHC分子與抗原肽的結(jié)合機理肓著重要意義。于是,本文提出了基于粗集的T細胞表位預(yù)測模型,其中包含了基于信息熵的屬性約簡完備算法和結(jié)合錨點知識的屬性值順序約

5、簡算法。該模型將MHC結(jié)合肽的領(lǐng)域知識巧妙地融入到了基于粗集理論的知識獲取方法中,從而使得該模型在基本維持了與神經(jīng)網(wǎng)絡(luò)預(yù)測模型同等預(yù)測錯誤率的情況下,提取出了易于專家理解的產(chǎn)生式規(guī)則。這些規(guī)則有助于生物學(xué)專家將其注意力集中于某些很可能的關(guān)鍵模式上,并便于生物學(xué)專家通過對這些很可能的關(guān)鍵模式的驗證和分析來進一步理解蘊含于其中的免疫學(xué)機理。  4)為了進一步降低預(yù)測錯誤率,受神經(jīng)網(wǎng)絡(luò)集成思想的啟發(fā),本文提出了規(guī)則集集成算法(RSEN),并

6、構(gòu)造出了基于該算法的T細胞表位預(yù)測模型。該模型能夠充分利用來自各種不同的屬性約簡和屬性值約簡算法的多樣性優(yōu)勢。實驗結(jié)果表明,基于RSEN算法的T細胞表位預(yù)測模型不僅繼續(xù)保持了所獲取到的規(guī)則的易理解性,而且具有比基于BPNN或粗集的T細胞表位預(yù)測模型更低的預(yù)測錯誤率?! ?)為了進一步增強T細胞表位預(yù)測模型的可理解性,本文在設(shè)計出了一整套描述規(guī)則與決策表的定量指標(biāo)的基礎(chǔ)上,提出了基于粗集的順序規(guī)則預(yù)剪枝算法,并將MHC結(jié)合肽的領(lǐng)域知識融

7、合到了該算法中。MHCⅡ類分子結(jié)合肽的實驗結(jié)果表明,該算法能夠在降低或維持原有預(yù)測錯誤率的同時,大大減少了所獲取到的順序規(guī)則集中規(guī)則的數(shù)目和長度?! ?)在研究基于粗集理論的知識獲取方法的過程中,本文發(fā)現(xiàn)了現(xiàn)有大部分屬性約簡算法的共同特征(即過度依賴“保持決策表的原有分類能力不變”的基本思想)在一定程度上會削弱獲取到的規(guī)則的推廣能力,于是,提出了一種新穎的基于粗集和主成分分析的知識獲取方法。該方法在進行知識獲取的過程中,利用主成分分析

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論