版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、動(dòng)物、植物等真核生物的蛋白質(zhì)學(xué)、蛋白質(zhì)組學(xué)方面的研究在后基因組時(shí)代變得越來(lái)越重要,由于多種生物(包括果樹(shù)中的蘋(píng)果、葡萄在內(nèi))基因測(cè)序工程的完成,研究的重心開(kāi)始向確定基因的蛋白質(zhì)產(chǎn)物功能方向移動(dòng)。果樹(shù)蛋白質(zhì)亞細(xì)胞定位是果樹(shù)蛋白質(zhì)組學(xué)、果樹(shù)細(xì)胞生物學(xué)和果樹(shù)分子生物信息學(xué)的重要研究?jī)?nèi)容。果樹(shù)蛋白質(zhì)分子生物功能的實(shí)現(xiàn)一方面與代謝、信號(hào)傳導(dǎo)等果樹(shù)生物過(guò)程緊密相關(guān),另一方面果樹(shù)蛋白質(zhì)分子必須處于特定的亞細(xì)胞區(qū)域才能行使其生物功能。對(duì)于未知功能的果樹(shù)
2、蛋白質(zhì)獲取其亞細(xì)胞的位置信息對(duì)進(jìn)一步研究該蛋白質(zhì)的分子功能是十分必要的。通過(guò)生物實(shí)驗(yàn)技術(shù)手段獲取一個(gè)果樹(shù)蛋白質(zhì)亞細(xì)胞定位信息是通常的做法,但是這種做法消耗時(shí)間較長(zhǎng)且實(shí)驗(yàn)成本較高,同時(shí)由于果樹(shù)蛋白質(zhì)序列的快速增長(zhǎng),在短時(shí)間內(nèi)獲取規(guī)模化蛋白質(zhì)亞細(xì)胞定位信息(例如:蘋(píng)果全基因組蛋白質(zhì)亞細(xì)胞定位信息)只能依靠生物信息技術(shù)手段來(lái)完成。另一方面,從生物數(shù)據(jù)角度來(lái)看生物信息學(xué)主要可以分為三個(gè)研究領(lǐng)域:大量生物序列數(shù)據(jù)的生成與管理、生物數(shù)據(jù)的使用與分析
3、、生物數(shù)據(jù)分析平臺(tái)工具的研究與開(kāi)發(fā)。由于生物信息數(shù)據(jù)大量的產(chǎn)生以及生命科學(xué)研究的迅猛發(fā)展,無(wú)論是從科學(xué)研究還是生產(chǎn)實(shí)踐,人們急需能滿(mǎn)足需求的生物數(shù)據(jù)分析平臺(tái)工具,在一些研究課題中生物數(shù)據(jù)分析平臺(tái)工具甚至成為制約深入研究的瓶頸問(wèn)題。同時(shí),由于生物數(shù)據(jù)分析平臺(tái)工具研究與開(kāi)發(fā)往往需要來(lái)自生物、數(shù)學(xué)、物理、化學(xué)、信息科學(xué)等多領(lǐng)域的知識(shí),這也增加生物數(shù)據(jù)分析平臺(tái)工具研究與開(kāi)發(fā)的復(fù)雜性。所以在果樹(shù)生物數(shù)據(jù)分析平臺(tái)工具方面開(kāi)展深入的研究是十分必要的,
4、并且也具有重要的實(shí)踐應(yīng)用價(jià)值,這也是我們研究工作的目的之一。
本文以量子算法為主,針對(duì)PCD相關(guān)蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)中的生物信息技術(shù)問(wèn)題和蘋(píng)果蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)的實(shí)現(xiàn)問(wèn)題進(jìn)行了深入的分析與研究,結(jié)合生物物理和物理的知識(shí),提出了具體的解決辦法和實(shí)現(xiàn)方案。本文的主要工作和創(chuàng)新之處概括如下:
1.從蛋白質(zhì)氨基酸序列的組成出發(fā),利用物理學(xué)中粒度的思想,提出了蛋白質(zhì)氨基酸序列的粒度概念,結(jié)合具體氨基酸序列片段詳細(xì)闡述
5、了蛋白粒度的構(gòu)成。使用蛋白粒度對(duì)氨基酸序列進(jìn)行分析,進(jìn)一步給出了蛋白粒度的階、蛋白粒度的界、蛋白粒度的極限、蛋白粒度增量等概念。在深入的研究時(shí)發(fā)現(xiàn):蛋白粒度沿序列不均勻分布;每條蛋白序列都有各自的蛋白粒度的極限;對(duì)于所有蛋白來(lái)講,蛋白的各階粒度都有共同的界。如果從蛋白預(yù)測(cè)的應(yīng)用來(lái)講,還可以得出:蛋白粒度包含了氨基酸序列的組成信息,包含了氨基酸序列的排列信息,還包含了同種氨基酸的互鄰信息,同時(shí)蛋白粒度增量自然包含了氨基酸序列的長(zhǎng)度信息。對(duì)
6、于如何利用蛋白粒度的理論和知識(shí)來(lái)構(gòu)造蛋白序列的特征向量,本文給出了一種具體的構(gòu)造方法并對(duì)有關(guān)參數(shù)進(jìn)行了詳細(xì)的說(shuō)明。根據(jù)蛋白粒度增量的信息對(duì)標(biāo)準(zhǔn)數(shù)據(jù)集的蛋白質(zhì)二級(jí)結(jié)構(gòu)類(lèi)以及植物蛋白亞葉綠體定位進(jìn)行預(yù)測(cè),得到比前人更好的結(jié)果,這些進(jìn)一步說(shuō)明了蛋白粒度是反映蛋白質(zhì)屬性的非常有用的指標(biāo)。
2.選擇ZD98、ZW225、CL317凋亡蛋白標(biāo)準(zhǔn)數(shù)據(jù)集,利用蛋白粒度對(duì)凋亡蛋白序列進(jìn)行特征提取,得到38維蛋白序列特征向量,對(duì)量子神經(jīng)網(wǎng)絡(luò)算
7、法(QNN)進(jìn)行改進(jìn)后,對(duì)凋亡蛋白進(jìn)行亞細(xì)胞定位預(yù)測(cè),分別獲得了87.8%、83.1%、85.5%的總體預(yù)測(cè)精度,這些預(yù)測(cè)精度等于或高于原作者的預(yù)測(cè)精度,說(shuō)明蛋白粒度與QNN結(jié)合的方法在凋亡蛋白亞細(xì)胞定位預(yù)測(cè)上是有效的。
3.利用已經(jīng)公布的蘋(píng)果全基因組蛋白序列,對(duì)蘋(píng)果全基因組蛋白序列進(jìn)行粒度等特征提取,分別得到蘋(píng)果全基因組蛋白二階粒度組成、三階粒度組成、粒度多空間融合等特征向量,然后根據(jù)量子力學(xué)中波函數(shù)的疊加思想研制了新的
8、量子算法(QSVM),對(duì)蘋(píng)果全基因組蛋白63541條氨基酸序列進(jìn)行了亞細(xì)胞定位預(yù)測(cè),獲得了相應(yīng)的定位信息,并形成了蘋(píng)果全基因組蛋白亞細(xì)胞位點(diǎn)數(shù)據(jù)庫(kù)1。
4.在Chou構(gòu)造的一個(gè)高質(zhì)量的植物蛋白細(xì)胞多定位基準(zhǔn)數(shù)據(jù)集的基礎(chǔ)之上,本文提出分別處理的預(yù)測(cè)模式,對(duì)多標(biāo)簽蛋白和單標(biāo)簽蛋白分別進(jìn)行預(yù)測(cè),同時(shí)利用GO注釋對(duì)蛋白序列進(jìn)行特征提取,取得了較高的預(yù)測(cè)精度,為蛋白的多定位預(yù)測(cè)找到了一種新的方法。
5.在蘋(píng)果全基因組蛋
9、白數(shù)據(jù)集的基礎(chǔ)上,對(duì)有GO注釋的蘋(píng)果蛋白進(jìn)行了GO注釋特征提取,結(jié)合本文提出的蛋白粒度的有關(guān)理論和知識(shí),再進(jìn)行蛋白粒度特征提取,研制了新的量子算法(SQSVM),對(duì)在蘋(píng)果全基因組上篩選出來(lái)的含GO注釋的15297條蛋白氨基酸序列進(jìn)行了亞細(xì)胞定位預(yù)測(cè),給出了相應(yīng)的定位結(jié)果,在此基礎(chǔ)之上構(gòu)建了蘋(píng)果全基因組蛋白亞細(xì)胞位點(diǎn)數(shù)據(jù)庫(kù)2。
6.作為生物數(shù)據(jù)分析平臺(tái)具體體現(xiàn)的亞細(xì)胞定位網(wǎng)站——蘋(píng)果蛋白亞細(xì)胞定位系統(tǒng)網(wǎng)站和植物蛋白亞細(xì)胞多定
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于圖像的蛋白質(zhì)亞細(xì)胞定位.pdf
- 基于機(jī)器學(xué)習(xí)的蛋白亞細(xì)胞定位預(yù)測(cè).pdf
- 基于機(jī)器學(xué)習(xí)的凋亡蛋白亞細(xì)胞定位預(yù)測(cè)研究.pdf
- 蛋白質(zhì)亞細(xì)胞定位特征表達(dá)與分類(lèi)算法研究.pdf
- P18蛋白的亞細(xì)胞定位及其對(duì)細(xì)胞骨架相關(guān)蛋白的影響.pdf
- 核蛋白的亞核定位和植物、非植物及小鼠蛋白質(zhì)的亞細(xì)胞定位預(yù)測(cè)研究.pdf
- 基于熒光顯微圖像的亞細(xì)胞定位算法.pdf
- 基于混合編碼的蛋白質(zhì)亞細(xì)胞定位研究.pdf
- 蛋白質(zhì)亞細(xì)胞定位的序列分析和理論預(yù)測(cè)算法研究.pdf
- 基于融合特征的蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè).pdf
- 基于機(jī)器學(xué)習(xí)的多定位點(diǎn)蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)方法研究.pdf
- 蛋白質(zhì)亞細(xì)胞定位的識(shí)別.pdf
- 基于序列編碼的蛋白質(zhì)亞細(xì)胞定位及相互作用研究.pdf
- 基于數(shù)據(jù)挖掘技術(shù)的亞細(xì)胞定位點(diǎn)預(yù)測(cè)算法研究.pdf
- 36520.中心體復(fù)制調(diào)控相關(guān)蛋白亞細(xì)胞結(jié)構(gòu)定位的研究
- 蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)方法研究.pdf
- 基于相關(guān)法的多重成像亞像素定位算法的研究與實(shí)現(xiàn).pdf
- 基于直推學(xué)習(xí)的蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè).pdf
- 基于序列裂解位點(diǎn)的凋亡蛋白亞細(xì)胞定位方法研究.pdf
- 基于離散特征的蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)方法研究.pdf
評(píng)論
0/150
提交評(píng)論