基于圖和網(wǎng)絡(luò)的學(xué)習(xí)算法及其在系統(tǒng)生物學(xué)中的一些應(yīng)用.pdf_第1頁(yè)
已閱讀1頁(yè),還剩126頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、隨著社會(huì)和科學(xué)技術(shù)的不斷發(fā)展,人們正在積累越來(lái)越多的各個(gè)層次的數(shù)據(jù)和信息,但是這并沒有從根本上解決許多具有挑戰(zhàn)性的問題。最典型的例子是,二十世紀(jì)分子生物學(xué)的迅速發(fā)展只是獲得了細(xì)胞各個(gè)組分的知識(shí),而并沒有攻克很多復(fù)雜的疾病,比如癌癥等。這意味著我們需要從系統(tǒng)的水平整合不同的知識(shí)和數(shù)據(jù),研究它們內(nèi)部的相互關(guān)系和作用,從而才能最終掌握復(fù)雜系統(tǒng)的規(guī)律,對(duì)它們進(jìn)行控制和優(yōu)化。同時(shí)由于海量數(shù)據(jù)的復(fù)雜性,我們需要機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘技術(shù)對(duì)信息進(jìn)行自動(dòng)加

2、工。圖和網(wǎng)絡(luò)是表達(dá)復(fù)雜系統(tǒng)內(nèi)部不同尺度、不同組分之間相互作用和關(guān)聯(lián)的最直觀的方式。因此,我們迫切需要結(jié)合實(shí)際應(yīng)用領(lǐng)域,例如系統(tǒng)生物學(xué),發(fā)展基于圖和網(wǎng)絡(luò)的學(xué)習(xí)算法對(duì)系統(tǒng)進(jìn)行研究。
   本文針對(duì)基于圖和網(wǎng)絡(luò)的學(xué)習(xí)算法,以實(shí)際分類問題和系統(tǒng)生物學(xué)中的一些應(yīng)用為驅(qū)動(dòng)背景,以圖論、統(tǒng)計(jì)、優(yōu)化方法為基本工具,以數(shù)據(jù)整合為核心,以結(jié)點(diǎn)分類、鏈接預(yù)測(cè)、子網(wǎng)發(fā)現(xiàn)和圖匹配問題為對(duì)象和目標(biāo),對(duì)基于圖和網(wǎng)絡(luò)的學(xué)習(xí)算法進(jìn)行了深入的研究。本文的主要研究?jī)?nèi)

3、容和創(chuàng)新點(diǎn)包括以下幾個(gè)方面:
   1.本文綜述了基于圖和網(wǎng)絡(luò)的學(xué)習(xí)算法,介紹了系統(tǒng)生物學(xué)的定義和當(dāng)前的發(fā)展,闡述了圖和網(wǎng)絡(luò)在當(dāng)前系統(tǒng)生物學(xué)中的核心作用,指出了圖和網(wǎng)絡(luò)的方法在以系統(tǒng)生物學(xué)為代表的實(shí)際應(yīng)用中的巨大潛力。
   2.考慮基于鏈接的半監(jiān)督結(jié)點(diǎn)分類問題,以圖的拉普拉斯矩陣的譜變換來(lái)構(gòu)造半監(jiān)督核為目標(biāo),本文提出了一種基于圖的同時(shí)學(xué)習(xí)最優(yōu)非參數(shù)譜變換和構(gòu)建分類器的半監(jiān)督學(xué)習(xí)方法。該算法的基本思想是以最大化特征空間的

4、Fisher判別率作為譜變換圖核學(xué)習(xí)和分類器構(gòu)建的共同準(zhǔn)則,并轉(zhuǎn)化為一個(gè)半定規(guī)劃的凸優(yōu)化問題來(lái)求解。與利用核配準(zhǔn)進(jìn)行半監(jiān)督核學(xué)習(xí)的算法比較,該算法不需要再進(jìn)行分類器訓(xùn)練,因?yàn)榉诸惼鞯膶W(xué)習(xí)和最優(yōu)核的構(gòu)造是同時(shí)完成的。在7個(gè)分類數(shù)據(jù)集上,該算法性能均優(yōu)于或相當(dāng)于當(dāng)前基于核校準(zhǔn)準(zhǔn)則的半監(jiān)督學(xué)習(xí)算法。
   3.考慮藥物—蛋白相互作用網(wǎng)絡(luò)的預(yù)測(cè)問題,本文以最大化集成網(wǎng)絡(luò)中結(jié)點(diǎn)屬性、鏈接信息以及未標(biāo)記樣本的信息為目標(biāo),提出應(yīng)用流形正則化的

5、半監(jiān)督學(xué)習(xí)算法,并利用核方法整合藥物化學(xué)分子結(jié)構(gòu)信息、蛋白質(zhì)序列信息和藥物—蛋白網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)信息來(lái)對(duì)未知的藥物.蛋白相互作用進(jìn)行預(yù)測(cè),從而提高了預(yù)測(cè)的精度。用我們提出的方法預(yù)測(cè)的一些藥物—蛋白相互作用已經(jīng)被最新的藥物數(shù)據(jù)庫(kù)證實(shí)。
   4.從系統(tǒng)生物學(xué)的角度出發(fā),考慮把蛋白質(zhì)—DNA和蛋白質(zhì)—蛋白質(zhì)相互作用網(wǎng)絡(luò)整合到基因微陣列數(shù)據(jù)的分析中。為了辨識(shí)與疾病相關(guān)的基因功能模塊,本文提出了一個(gè)新的基于相互作用網(wǎng)絡(luò)的正則化項(xiàng)來(lái)鼓勵(lì)系數(shù)的

6、絕對(duì)值在網(wǎng)絡(luò)上的平滑,結(jié)合l1范數(shù)的稀疏特性,得到一種基于圖的彈性網(wǎng)算法,并從理論上分析了新的正則化項(xiàng)的數(shù)學(xué)特性,開發(fā)了一種新的求解算法,該算法具有全路徑計(jì)算的優(yōu)點(diǎn)。理論分析和仿真結(jié)果表明,基于圖的彈性網(wǎng)算法能得到更小的預(yù)測(cè)誤差。最后,將我們的算法應(yīng)用到一個(gè)阿爾茨海默病的微陣列基因表達(dá)數(shù)據(jù)集上,辨識(shí)出了四個(gè)與阿爾茨海默病相關(guān)的基因功能模塊。
   5.為了融合不同尺度和模態(tài)的信息,考慮把反映分子功能信息的三維熒光分子斷層掃描(F

7、MT)圖像和反映解剖結(jié)構(gòu)的CT圖像進(jìn)行配準(zhǔn),從而在一幅圖像上同時(shí)表達(dá)多方面的信息。但是直接配準(zhǔn)最大直徑只有幾個(gè)毫米的腫瘤的三維FMT圖像和體長(zhǎng)有近十厘米的整個(gè)小鼠的三維CT圖像是非常困難的。由于我們可以得到二維平面圖像跟FMT圖像的坐標(biāo)關(guān)系。因此本文提出一個(gè)新的思路,即先對(duì)FMT成像過(guò)程中得到的二維平面圖像與三維的CT圖像進(jìn)行預(yù)配準(zhǔn),預(yù)配準(zhǔn)的結(jié)果再作為下一步FMT和CT三維配準(zhǔn)的初始值,這樣就減小了最終三維配準(zhǔn)時(shí)兩個(gè)對(duì)象的大小差異所導(dǎo)致

8、的配準(zhǔn)難度。在配準(zhǔn)過(guò)程中,對(duì)兩個(gè)對(duì)象分別進(jìn)行分割得到點(diǎn)集,將問題轉(zhuǎn)化為點(diǎn)集圖匹配,使配準(zhǔn)完全不同模態(tài)的圖像成為可能。對(duì)于匹配的優(yōu)化算法,結(jié)合全局和局部?jī)?yōu)化的思想,提出了兩種優(yōu)化方法:結(jié)合最小二乘進(jìn)行局部搜索的序貫蒙特卡羅采樣算法;結(jié)合差分進(jìn)化和把最小二乘作為另一種搜索方式的單純形法。大量的仿真實(shí)驗(yàn)結(jié)果驗(yàn)證了結(jié)合全局搜索和局部搜索優(yōu)化算法在減少迭代次數(shù)和尋優(yōu)能力上的優(yōu)越性。最后,在兩個(gè)實(shí)際小鼠數(shù)據(jù)上的運(yùn)行結(jié)果顯示這種預(yù)配準(zhǔn)的方法為下一步三

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論