版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、蛋白質(zhì)是生命的物質(zhì)基礎(chǔ),參與眾多的生命活動(dòng)過程,包括DNA復(fù)制、轉(zhuǎn)錄、翻譯、物質(zhì)代謝、信號(hào)傳導(dǎo)和細(xì)胞周期控制等,它是生命現(xiàn)象的直接體現(xiàn)者。因此,蛋白質(zhì)功能研究是蛋白質(zhì)組學(xué)領(lǐng)域的研究熱點(diǎn),然而蛋白質(zhì)亞細(xì)胞位置決定了蛋白質(zhì)功能。蛋白質(zhì)只有被運(yùn)轉(zhuǎn)到特定的亞細(xì)胞中,才能參與細(xì)胞的各種生命活動(dòng),如果運(yùn)轉(zhuǎn)發(fā)生偏差,將會(huì)導(dǎo)致細(xì)胞功能紊亂,甚至?xí)?duì)生命安全構(gòu)成威脅,因此蛋白質(zhì)亞細(xì)胞定位的預(yù)測(cè)對(duì)研究蛋白質(zhì)功能具有非常重要的意義。此外明確蛋白質(zhì)亞細(xì)胞位點(diǎn),
2、對(duì)癌癥病發(fā)機(jī)理的研究和靶細(xì)胞藥物的發(fā)現(xiàn)都起到至關(guān)重要的作用。在一些關(guān)于蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)的研究中,發(fā)現(xiàn)越來越多的蛋白質(zhì)同時(shí)存在于兩個(gè)或多個(gè)亞細(xì)胞位置上或者在多個(gè)亞細(xì)胞間移動(dòng)以實(shí)現(xiàn)它的生物學(xué)功能。因此,蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)的研究就由單位點(diǎn)蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)逐漸轉(zhuǎn)向多位點(diǎn)蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè),并且它已成為生物信息學(xué)的一個(gè)研究熱點(diǎn)。
巨量蛋白質(zhì)序列的出現(xiàn)給亞細(xì)胞定位預(yù)測(cè)研究帶來很大挑戰(zhàn)和困難,因此需要借助計(jì)算機(jī)技術(shù)實(shí)現(xiàn)蛋白質(zhì)亞細(xì)
3、胞定位的自動(dòng)預(yù)測(cè)。而傳統(tǒng)的蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)方法通常分為四大步:第一步,構(gòu)建蛋白質(zhì)數(shù)據(jù)集,為順利完成亞細(xì)胞定位預(yù)測(cè)提供可靠數(shù)據(jù);第二步,蛋白質(zhì)的特征提取,是亞細(xì)胞定位預(yù)測(cè)的關(guān)鍵步驟,而傳統(tǒng)的方法制約著定位預(yù)測(cè)精度;第三步,預(yù)測(cè)算法的選取,選擇恰當(dāng)?shù)念A(yù)測(cè)算法是研究過程的最重要的一步,直接影響最后的預(yù)測(cè)結(jié)果;第四步,預(yù)測(cè)算法的評(píng)估,通過分析評(píng)估結(jié)果來確定特征提取方法和預(yù)測(cè)算法選取的好壞,以便于預(yù)測(cè)精度的提高。
本文圍繞蛋白質(zhì)亞細(xì)
4、胞定位預(yù)測(cè),研究了蛋白質(zhì)特征提取、亞細(xì)胞定位預(yù)測(cè)算法等。論文主要工作總結(jié)如下:(1)本文采用同時(shí)含有單位點(diǎn)蛋白質(zhì)和多位點(diǎn)蛋白質(zhì)序列的數(shù)據(jù)集,如Virus-mPLoc和Gpos-mPLoc兩個(gè)數(shù)據(jù)集。(2)本文針對(duì)熵密度、偽氨基酸組成(PseAAC)和兩性偽氨基酸組成(AmPseAAC)三種特征提取方法,開展了如下三個(gè)方面的研究。第一方面是改進(jìn)兩性偽氨基酸組成特征提取方法,并與兩性偽氨基酸組成進(jìn)行比較,評(píng)價(jià)改進(jìn)方法的有效性。第二方面是改進(jìn)
5、特征融合規(guī)則,本文在簡(jiǎn)單的特征融合規(guī)則基礎(chǔ)上,將熵密度所提取的20維特征向量取代兩性偽氨基酸組成所提取的前20維向量,稱之為特殊融合方法。第三方面是結(jié)合二肽組成模型和氨基酸指數(shù)分布模型(AAID)兩種特征提取方法,提出了一種基于氨基酸理化特征的新型特征提取方法,同時(shí)蛋白質(zhì)定位預(yù)測(cè)結(jié)果證明了該特征提取方法的有效性。(3)采用多標(biāo)簽k近鄰算法(ML-KNN)作為預(yù)測(cè)算法,同時(shí)又考慮到數(shù)據(jù)不平衡的問題,使用改進(jìn)版的多標(biāo)簽k近鄰算法(wML-K
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于融合特征的蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè).pdf
- 基于多特征融合的蛋白質(zhì)亞細(xì)胞多位點(diǎn)定位預(yù)測(cè).pdf
- 基于mRNA等融合特征的單定位和多定位細(xì)胞凋亡蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè).pdf
- 基于多信息融合的蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)方法研究.pdf
- 基于多類特征融合的蛋白質(zhì)亞線粒體定位預(yù)測(cè)研究.pdf
- 基于離散特征的蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)方法研究.pdf
- 基于融合信息的蛋白質(zhì)亞葉綠體定位預(yù)測(cè)研究.pdf
- 蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)方法研究.pdf
- 基于直推學(xué)習(xí)的蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè).pdf
- 基于多標(biāo)記學(xué)習(xí)的蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè).pdf
- 基于糾錯(cuò)輸出編碼的蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè).pdf
- 基于圖像的蛋白質(zhì)亞細(xì)胞定位.pdf
- 9015.基于多信息融合預(yù)測(cè)單定位和多定位凋亡蛋白質(zhì)亞細(xì)胞位置
- 蛋白質(zhì)序列特征表達(dá)及其在亞細(xì)胞定位預(yù)測(cè)中的應(yīng)用.pdf
- 蛋白質(zhì)亞細(xì)胞定位的識(shí)別.pdf
- 基于機(jī)器學(xué)習(xí)的多定位點(diǎn)蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)方法研究.pdf
- 基于GO語義相似性的蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)研究.pdf
- 基于多視角特征融合的蛋白質(zhì)屬性預(yù)測(cè).pdf
- 蛋白質(zhì)亞細(xì)胞定位特征表達(dá)與分類算法研究.pdf
- 使用蛋白質(zhì)和mRNA序列信息預(yù)測(cè)蛋白質(zhì)亞線粒體定位.pdf
評(píng)論
0/150
提交評(píng)論