基于壓縮感知的醫(yī)學(xué)數(shù)據(jù)分類(lèi)研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩89頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、在信息技術(shù)的推動(dòng)下,計(jì)算機(jī)輔助醫(yī)療診斷的技術(shù)被廣泛地應(yīng)用。研究表明,計(jì)算機(jī)輔助醫(yī)療診斷技術(shù)能夠減少漏診,提高診斷準(zhǔn)確率。隨著醫(yī)療水平的不斷提高,DNA微陣列技術(shù)作為一項(xiàng)重要的基因測(cè)序技術(shù)可以使我們從基因?qū)用鎸?duì)疾病病理進(jìn)行分析和研究。尋求一種方法從海量的醫(yī)學(xué)數(shù)據(jù)中挖掘出有效的生物信息,成為了現(xiàn)代人類(lèi)的迫切需求。
  當(dāng)前對(duì)醫(yī)學(xué)數(shù)據(jù)特別是基因表達(dá)數(shù)據(jù)分類(lèi)的研究已引起大量研究者的關(guān)注。一些傳統(tǒng)的機(jī)器學(xué)習(xí)方法,如神經(jīng)網(wǎng)絡(luò)、決策樹(shù)、支持向量

2、機(jī)等方法被用于處理醫(yī)學(xué)數(shù)據(jù)分類(lèi)問(wèn)題,但是由于醫(yī)學(xué)數(shù)據(jù)存在著樣本少、維度高、噪聲強(qiáng)等特點(diǎn),傳統(tǒng)的方法無(wú)法很好地處理該問(wèn)題。近年來(lái)壓縮感知作為一種非常有前景的方法已經(jīng)在許多領(lǐng)域取得成功,本文基于壓縮感知理論,針對(duì)醫(yī)學(xué)數(shù)據(jù)分類(lèi)困難的特點(diǎn),分別在字典學(xué)習(xí)、稀疏表達(dá)、多核學(xué)習(xí)三個(gè)方面進(jìn)行深入研究。本文的研究工作和取得的主要研究成果如下:
  (1)提出一種基于字典學(xué)習(xí)算法(K-SVD)的分類(lèi)方法。該方法首先在字典更新時(shí),采用組更新的方式優(yōu)化

3、了K-SVD算法,實(shí)現(xiàn)超完備字典的優(yōu)化;其次在信號(hào)重構(gòu)時(shí),改進(jìn)了正交匹配追蹤算法,實(shí)現(xiàn)了多元同時(shí)更新;最后,在樣本類(lèi)別判斷時(shí),優(yōu)化后的超完備字典不再具備直接的類(lèi)別信息,但是字典學(xué)習(xí)算法得到的稀疏系數(shù)矩陣可以看作是訓(xùn)練樣本集在優(yōu)化字典上的稀疏表示,而通過(guò)重構(gòu)可以得到測(cè)試樣本在優(yōu)化字典上的稀疏表示,因此可以利用稀疏表示的相似性分析實(shí)現(xiàn)醫(yī)學(xué)數(shù)據(jù)分類(lèi)。該方法的優(yōu)點(diǎn)在于可以?xún)?yōu)化超完備字典,去除超完備字典的冗余性,使得學(xué)到的字典趨近于正交,有效地處

4、理了醫(yī)學(xué)樣本少的問(wèn)題,不僅提高了分類(lèi)準(zhǔn)確率,而且可以實(shí)現(xiàn)對(duì)降維后的醫(yī)學(xué)數(shù)據(jù)的二次特征提取。
  (2)提出一種雙向壓縮感知模型,改進(jìn)常用的重構(gòu)算法,并將其應(yīng)用到雙向壓縮感知模型的求解和醫(yī)學(xué)數(shù)據(jù)的分類(lèi)中。模型提出了三種通用的形式:l1范數(shù),F(xiàn)范數(shù)和l2,1范數(shù),在重構(gòu)算法和實(shí)驗(yàn)中進(jìn)行了具體的分析和比較。該模型求解醫(yī)學(xué)數(shù)據(jù)的雙向稀疏表達(dá),行向稀疏表示特征基因選取,列向稀疏表示樣本選擇。該模型的求解降低了數(shù)據(jù)的冗余性,去除了部分噪聲,提

5、高了分類(lèi)的準(zhǔn)確率。而且行向稀疏矩陣可以用來(lái)研究基因間的關(guān)系,為生物信息的研究提供新的知識(shí)。
  (3)提出一種基于多核學(xué)習(xí)的壓縮感知模型,改進(jìn)常用的重構(gòu)算法,并將其應(yīng)用到基于多核學(xué)習(xí)的壓縮感知模型求解和醫(yī)學(xué)數(shù)據(jù)的分類(lèi)中。本文引入核方法,因?yàn)楹嘶蟮臄?shù)據(jù)與樣本數(shù)有關(guān),與樣本維度無(wú)關(guān),所以核方法有效地解決了醫(yī)學(xué)數(shù)據(jù)維度高的問(wèn)題。而多核學(xué)習(xí)具有更優(yōu)秀的性能,因此引入多核學(xué)習(xí)思想。首先采用粗網(wǎng)格搜索法對(duì)訓(xùn)練樣本進(jìn)行訓(xùn)練,得到最優(yōu)的核組合參

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論