2023年全國(guó)碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩61頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、蛋白質(zhì)是生命的物質(zhì)基礎(chǔ),參與眾多的生命活動(dòng)過程,包括DNA復(fù)制、轉(zhuǎn)錄、翻譯、物質(zhì)代謝、信號(hào)傳導(dǎo)和細(xì)胞周期控制等,它是生命現(xiàn)象的直接體現(xiàn)者。因此,蛋白質(zhì)功能研究是蛋白質(zhì)組學(xué)領(lǐng)域的研究熱點(diǎn),然而蛋白質(zhì)亞細(xì)胞位置決定了蛋白質(zhì)功能。蛋白質(zhì)只有被運(yùn)轉(zhuǎn)到特定的亞細(xì)胞中,才能參與細(xì)胞的各種生命活動(dòng),如果運(yùn)轉(zhuǎn)發(fā)生偏差,將會(huì)導(dǎo)致細(xì)胞功能紊亂,甚至?xí)?duì)生命安全構(gòu)成威脅,因此蛋白質(zhì)亞細(xì)胞定位的預(yù)測(cè)對(duì)研究蛋白質(zhì)功能具有非常重要的意義。此外明確蛋白質(zhì)亞細(xì)胞位點(diǎn),

2、對(duì)癌癥病發(fā)機(jī)理的研究和靶細(xì)胞藥物的發(fā)現(xiàn)都起到至關(guān)重要的作用。在一些關(guān)于蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)的研究中,發(fā)現(xiàn)越來越多的蛋白質(zhì)同時(shí)存在于兩個(gè)或多個(gè)亞細(xì)胞位置上或者在多個(gè)亞細(xì)胞間移動(dòng)以實(shí)現(xiàn)它的生物學(xué)功能。因此,蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)的研究就由單位點(diǎn)蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)逐漸轉(zhuǎn)向多位點(diǎn)蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè),并且它已成為生物信息學(xué)的一個(gè)研究熱點(diǎn)。
  巨量蛋白質(zhì)序列的出現(xiàn)給亞細(xì)胞定位預(yù)測(cè)研究帶來很大挑戰(zhàn)和困難,因此需要借助計(jì)算機(jī)技術(shù)實(shí)現(xiàn)蛋白質(zhì)亞細(xì)

3、胞定位的自動(dòng)預(yù)測(cè)。而傳統(tǒng)的蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)方法通常分為四大步:第一步,構(gòu)建蛋白質(zhì)數(shù)據(jù)集,為順利完成亞細(xì)胞定位預(yù)測(cè)提供可靠數(shù)據(jù);第二步,蛋白質(zhì)的特征提取,是亞細(xì)胞定位預(yù)測(cè)的關(guān)鍵步驟,而傳統(tǒng)的方法制約著定位預(yù)測(cè)精度;第三步,預(yù)測(cè)算法的選取,選擇恰當(dāng)?shù)念A(yù)測(cè)算法是研究過程的最重要的一步,直接影響最后的預(yù)測(cè)結(jié)果;第四步,預(yù)測(cè)算法的評(píng)估,通過分析評(píng)估結(jié)果來確定特征提取方法和預(yù)測(cè)算法選取的好壞,以便于預(yù)測(cè)精度的提高。
  本文圍繞蛋白質(zhì)亞細(xì)

4、胞定位預(yù)測(cè),研究了蛋白質(zhì)特征提取、亞細(xì)胞定位預(yù)測(cè)算法等。論文主要工作總結(jié)如下:(1)本文采用同時(shí)含有單位點(diǎn)蛋白質(zhì)和多位點(diǎn)蛋白質(zhì)序列的數(shù)據(jù)集,如Virus-mPLoc和Gpos-mPLoc兩個(gè)數(shù)據(jù)集。(2)本文針對(duì)熵密度、偽氨基酸組成(PseAAC)和兩性偽氨基酸組成(AmPseAAC)三種特征提取方法,開展了如下三個(gè)方面的研究。第一方面是改進(jìn)兩性偽氨基酸組成特征提取方法,并與兩性偽氨基酸組成進(jìn)行比較,評(píng)價(jià)改進(jìn)方法的有效性。第二方面是改進(jìn)

5、特征融合規(guī)則,本文在簡(jiǎn)單的特征融合規(guī)則基礎(chǔ)上,將熵密度所提取的20維特征向量取代兩性偽氨基酸組成所提取的前20維向量,稱之為特殊融合方法。第三方面是結(jié)合二肽組成模型和氨基酸指數(shù)分布模型(AAID)兩種特征提取方法,提出了一種基于氨基酸理化特征的新型特征提取方法,同時(shí)蛋白質(zhì)定位預(yù)測(cè)結(jié)果證明了該特征提取方法的有效性。(3)采用多標(biāo)簽k近鄰算法(ML-KNN)作為預(yù)測(cè)算法,同時(shí)又考慮到數(shù)據(jù)不平衡的問題,使用改進(jìn)版的多標(biāo)簽k近鄰算法(wML-K

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論