基于蛋白質(zhì)網(wǎng)絡(luò)的復(fù)合體識(shí)別算法研究.pdf_第1頁
已閱讀1頁,還剩120頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、蛋白質(zhì)是一種十分重要的生物分子。生物學(xué)研究表明,蛋白質(zhì)很少單獨(dú)參與生命活動(dòng),而是通過多個(gè)蛋白質(zhì)之間的物理相互作用形成多分子聚合體——蛋白質(zhì)復(fù)合體。復(fù)合體是蛋白質(zhì)執(zhí)行其功能的主要形式。在細(xì)胞中很多重要的生物過程都是由蛋白質(zhì)復(fù)合體參與執(zhí)行的。因此,準(zhǔn)確識(shí)別細(xì)胞中蛋白質(zhì)復(fù)合體對(duì)于揭示蛋白質(zhì)活動(dòng)規(guī)律、理解蛋白質(zhì)的功能具有十分重要的意義。蛋白質(zhì)網(wǎng)絡(luò)是一種用來刻畫細(xì)胞中蛋白質(zhì)之間相互作用的生物網(wǎng)絡(luò)。利用計(jì)算方法從蛋白質(zhì)網(wǎng)絡(luò)中識(shí)別蛋白質(zhì)復(fù)合體,是當(dāng)前

2、生物信息學(xué)領(lǐng)域的研究熱點(diǎn)之一。本課題即圍繞以蛋白質(zhì)網(wǎng)絡(luò)為基礎(chǔ)的復(fù)合體識(shí)別問題,針對(duì)局部搜索、離散和連續(xù)優(yōu)化以及采用時(shí)序蛋白質(zhì)網(wǎng)絡(luò)等不同類型識(shí)別方法分別展開研究。具體研究內(nèi)容包括以下四個(gè)方面:
  (1)研究基于標(biāo)簽傳播思想的復(fù)合體識(shí)別方法。
  在局部搜索類方法方面,本文提出了一種基于多標(biāo)簽傳播的識(shí)別算法。該算法中引入了標(biāo)簽傳播機(jī)制,利用標(biāo)簽表示蛋白質(zhì)所屬復(fù)合體類別,并通過蛋白質(zhì)之間相互傳播標(biāo)簽的過程識(shí)別蛋白質(zhì)網(wǎng)絡(luò)中復(fù)合體對(duì)

3、應(yīng)的模塊。具體來講,本文針對(duì)蛋白質(zhì)復(fù)合體的特點(diǎn),對(duì)傳統(tǒng)標(biāo)簽傳播算法進(jìn)行了相應(yīng)的改進(jìn)與拓展,主要體現(xiàn)在如下幾方面:采用蛋白質(zhì)的多標(biāo)簽存儲(chǔ)與傳播機(jī)制,解決復(fù)合體之間的重疊問題;定義標(biāo)簽的傳播強(qiáng)度,強(qiáng)化共有鄰居蛋白質(zhì)的作用,提高傳播效率;提出基于自適應(yīng)閾值的多標(biāo)簽更新策略,以合理控制復(fù)合體規(guī)模;確定了以蛋白質(zhì)度為基礎(chǔ)的標(biāo)簽更新順序,增強(qiáng)了算法的魯棒性。實(shí)驗(yàn)結(jié)果表明,上述算法在識(shí)別蛋白質(zhì)復(fù)合體方面具有一定的優(yōu)勢。該算法的提出為從蛋白質(zhì)網(wǎng)絡(luò)中識(shí)別

4、復(fù)合體提供了一種新的有效啟發(fā)式手段。
 ?。?)研究基于離散模塊度函數(shù)的復(fù)合體識(shí)別方法。
  模塊度函數(shù)是度量網(wǎng)絡(luò)模塊劃分質(zhì)量的離散函數(shù),是引導(dǎo)層次聚類簇合并的重要指標(biāo)。針對(duì)復(fù)合體相互重疊和規(guī)模小等特點(diǎn),本文提出了一種蛋白質(zhì)模塊度函數(shù)用以度量網(wǎng)絡(luò)中復(fù)合體模塊劃分質(zhì)量,并利用該函數(shù)作為引導(dǎo)簇合并的指導(dǎo)準(zhǔn)則。與傳統(tǒng)模塊度函數(shù)相比,該新型模塊度函數(shù)具有兩方面特點(diǎn):一是在重疊模塊方面具有更強(qiáng)的描述能力;二是可以避免分辨率限制問題,更

5、加適合于規(guī)模較小的復(fù)合體。此外,在層次聚類算法設(shè)計(jì)方面,還提出了一種基于度相關(guān)性的初始簇選擇方法。文中通過實(shí)驗(yàn)驗(yàn)證了該算法的有效性,證明其更適合于解決蛋白質(zhì)復(fù)合體識(shí)別問題。本工作對(duì)于基于模塊度函數(shù)識(shí)別復(fù)合體的相關(guān)研究具有重要意義。
 ?。?)研究面向復(fù)合體識(shí)別的連續(xù)優(yōu)化模型及相應(yīng)算法。
  在連續(xù)優(yōu)化方法方面,本文提出一種以最小二乘法為基礎(chǔ)的最優(yōu)化模型,用以在輸入蛋白質(zhì)網(wǎng)絡(luò)數(shù)據(jù)和未知復(fù)合體模塊劃分之間建立合理聯(lián)系。該模型的優(yōu)

6、化目標(biāo)是最小化所有蛋白質(zhì)對(duì)的相互作用與參與共同復(fù)合體系數(shù)之間的差異。此外,通過對(duì)蛋白質(zhì)相互作用強(qiáng)度進(jìn)行加權(quán)以及引入懲罰項(xiàng)等相應(yīng)策略進(jìn)一步提高模型描述能力。在所構(gòu)建模型基礎(chǔ)上,給出了一種基于小粒度稠密子網(wǎng)絡(luò)和乘法更新規(guī)則的快速優(yōu)化算法以將該模型與給定輸入蛋白質(zhì)網(wǎng)絡(luò)相擬合,從而推測得到蛋白質(zhì)隸屬不同復(fù)合體的隸屬系數(shù)。通過實(shí)驗(yàn)測試及與其它基于連續(xù)優(yōu)化算法的對(duì)比,驗(yàn)證了上述模型及算法的有效性。
 ?。?)研究基于時(shí)序蛋白質(zhì)網(wǎng)絡(luò)的復(fù)合體識(shí)別

7、方法。
  在基于時(shí)序蛋白質(zhì)網(wǎng)絡(luò)的識(shí)別方法方面,關(guān)鍵問題是如何利用基因表達(dá)數(shù)據(jù)構(gòu)建能夠客觀描述蛋白質(zhì)動(dòng)態(tài)活動(dòng)規(guī)律的時(shí)序蛋白質(zhì)網(wǎng)絡(luò)。現(xiàn)有相關(guān)方法普遍假設(shè)所有蛋白質(zhì)都是動(dòng)態(tài)變化。然而,除動(dòng)態(tài)蛋白質(zhì)外細(xì)胞中還包含豐度相對(duì)穩(wěn)定的靜態(tài)蛋白質(zhì)。因此,本文提出一種基于動(dòng)態(tài)-靜態(tài)蛋白質(zhì)混合思想的方法構(gòu)建時(shí)序蛋白質(zhì)網(wǎng)絡(luò),并將這種網(wǎng)絡(luò)應(yīng)用于復(fù)合體識(shí)別問題。該方法不僅考慮動(dòng)態(tài)蛋白質(zhì)之間的相互作用,而且同時(shí)關(guān)注動(dòng)態(tài)蛋白質(zhì)與靜態(tài)蛋白質(zhì)之間的相互作用關(guān)系。實(shí)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論