基于神經(jīng)網(wǎng)絡和支持向量機的生物數(shù)據(jù)分類.pdf_第1頁
已閱讀1頁,還剩33頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、在過去的幾年時間里,人工智能在生命科學和醫(yī)學等各個領(lǐng)域都發(fā)揮著無可替代的重要作用。起初最主要應用在序列分析中,這個方面時至今日也仍有很多重要問題亟待解決。
  隨著DNA測序技術(shù)的發(fā)展,新興的技術(shù)使得DNA和蛋白質(zhì)的線性序列數(shù)據(jù)呈幾何級數(shù)增長。蛋白質(zhì)二級結(jié)構(gòu)預測(PSSP)這個領(lǐng)域的研究促進了機器學習方法在序列分析中的應用。本文有關(guān)蛋白質(zhì)二級結(jié)構(gòu)預測部分就是在這個研究背景的基礎(chǔ)上繼續(xù)進行了探究。我們設計了新型集成網(wǎng)絡,新型網(wǎng)絡對所

2、占比例較多的結(jié)構(gòu)C卷曲結(jié)構(gòu)預測準確率較高,其余兩種結(jié)構(gòu)α螺旋與β折疊預測準確率和Q3準確率表現(xiàn)平平。本文除了介紹神經(jīng)網(wǎng)絡和支持向量機等機器學習算法在蛋白質(zhì)二級結(jié)構(gòu)預測方面的應用,還探索了基于這兩種算法的乳腺癌早期篩查。
  針對蛋白質(zhì)二級結(jié)構(gòu)的數(shù)據(jù)是完成對其未知結(jié)構(gòu)的預測,而針對乳腺癌患者和健康人的一些指標來對其是否患有乳腺癌做出早期的診斷。乳腺癌是一種發(fā)生在乳腺上皮的常發(fā)性惡性腫瘤,因此為臨床乳腺癌篩查診斷建立一種簡單、快速、高

3、效的方法具有很強的實際意義。
  本文提出了一種基于神經(jīng)網(wǎng)絡與支持向量機的乳腺癌早期篩查方法。文中首先應用PCA(主成分分析)對原始數(shù)據(jù)進行降維處理,然后運用神經(jīng)網(wǎng)絡與支持向量機分別進行訓練最后達到預測的目的。文中所包含的實驗數(shù)據(jù)是由258例新診斷為乳腺癌的病人和159例乳腺癌診斷為良性的病人,其中包含78例健康病例,選取的每個代謝組學的血斑點樣本包含23個氨基酸和26個酰基肉堿。實驗結(jié)果顯示,結(jié)合神經(jīng)網(wǎng)絡的方法得到最高的敏感度可

4、達到97.1%,特異度可達到93.9%,精確度可達到91.5%;結(jié)合支持向量機的方法得到的實驗結(jié)果中,敏感度最高可達到93.5%,特異度最高為93.8%,精確度可達到93.6%。因此,兩種智能化算法各有千秋,在訓練集數(shù)量與測試集數(shù)量相等或稍多于測試集數(shù)量時,神經(jīng)網(wǎng)絡方法表現(xiàn)較好;在訓練集數(shù)量明顯多于測試集時,支持向量機方法表現(xiàn)較好。相比于之前參考文獻[42]中的蛋白標記物的方法所達到的92.2%的敏感性和84.4%的特異性,文中方法有了

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論