基于圖的半監(jiān)督學(xué)習(xí)和維數(shù)約簡:方法及其應(yīng)用研究.pdf_第1頁
已閱讀1頁,還剩119頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、半監(jiān)督學(xué)習(xí)和維數(shù)約簡已經(jīng)成為當(dāng)前機(jī)器學(xué)習(xí)領(lǐng)域的研究熱點。半監(jiān)督學(xué)習(xí)研究的是整個數(shù)據(jù)集中只有一部分樣本有標(biāo)記的情況下如何對數(shù)據(jù)進(jìn)行分類,本文主要研究的是基于圖的半監(jiān)督學(xué)習(xí)。維數(shù)約簡是在盡可能多的保持?jǐn)?shù)據(jù)集結(jié)構(gòu)的前提下,將數(shù)據(jù)集轉(zhuǎn)換成一個新的數(shù)據(jù)集,新數(shù)據(jù)集的維數(shù)是原始數(shù)據(jù)集的本征維數(shù)。本文對基于圖的半監(jiān)督學(xué)習(xí)和維數(shù)約簡進(jìn)行了系統(tǒng)的研究,具體來說,全文的主要工作概括如下:
   (1)提出了一種新的多步驟降維方法對基因表達(dá)譜進(jìn)行降維

2、。首先采用秩和檢驗方法進(jìn)行差異表達(dá)的基因選擇,然后將排在前面的一定數(shù)量的基因再進(jìn)行離散余弦變換,并采用主成分分析對變換后的系數(shù)進(jìn)行主成分提取。我們首先將基于圖的半監(jiān)督方法引入到腫瘤分類中,采用基于圖的半監(jiān)督學(xué)習(xí)算法對抽取的主成分特征進(jìn)行分類性能評估。
   (2)針對基于圖的半監(jiān)督學(xué)習(xí)方法提出了一種新的自適應(yīng)權(quán)值。傳統(tǒng)的基于圖的半監(jiān)督學(xué)習(xí)算法采用高斯函數(shù)來計算圖的邊權(quán)。我們提出一種新穎的針對基于圖的半監(jiān)督學(xué)習(xí)方法的邊權(quán)設(shè)計方式。

3、該方法添加了標(biāo)簽信息,并且采用測地距離而不是歐氏距離計算兩個數(shù)據(jù)之間的距離。此外,我們還添加類的先驗信息。
   我們針對基于局部和全局一致性的學(xué)習(xí)來改進(jìn)邊權(quán)。實驗結(jié)果表明,我們提出的方法優(yōu)于原算法。
   (3)提出了一種基于局部保持投影的監(jiān)督特征提取方法局部保持判別投影。
   局部保持投影(LPP)是從拉普拉斯特征譜推導(dǎo)的線性子空間學(xué)習(xí)方法。與許多流形學(xué)習(xí)算法相比,LPP 擁有一個顯著的優(yōu)點是能產(chǎn)生清晰的映

4、射,然而LPP 沒有加入判別信息,LPP在分類或聚類時僅僅考慮局部信息。我們將類內(nèi)散度矩陣和類間散度矩陣加入到LPP的目標(biāo)函數(shù),提出局部保持判別投影(LPDP)。LPDP能夠最大化類間距離和最小化類內(nèi)距離,同時保持LPP的局部保持特性。LPDP可被看作是一種組合了流形準(zhǔn)則和Fisher 準(zhǔn)則的新方法。因此,與LPP相比,LPDP 能夠成功找到具有更好判別性能的子空間,更適合做分類,從而有效提高識別率。
   (4)提出了基于譜回

5、歸的判別分析(Spectral Regression Discriminant Analysis,SRDA)和基于譜回歸的核化判別分析(Spectral Regression Kernel DiscriminantAnalysis,SRKDA)的正則化參數(shù)估計方法。SRDA是最近提出的一種有效的子空間學(xué)習(xí)方法,只有一個自由參數(shù),正則化參數(shù)。然而在SRDA的原始論文中,這個參數(shù)被設(shè)置為常數(shù),這顯然是次優(yōu)的。該正則化參數(shù)的估計在以往的研究中

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論