基于重構信息保持的降維算法研究.pdf_第1頁
已閱讀1頁,還剩46頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著網絡和存儲技術的不斷發(fā)展,越來越多的數據呈現出數據量大、維數高等新的特點。這些海量的高維數據包含更加豐富信息的同時,也帶來了如維數災難、計算量大等問題,對數據分析提出了新的挑戰(zhàn)。因此,如何能夠有效地描述高維數據并挖掘出其中有意義的信息成為亟待解決的問題。降維作為解決該問題的有效手段之一,在人臉識別、生物信息學、圖像檢索等領域都有著廣泛的應用。近年來,隨著降維技術的發(fā)展,人們對降維算法的要求逐漸提高,降維算法的優(yōu)劣直接關系到對數據信息

2、提取和分析的準確性。本文以提高維數據在降維后的可分性為目標,針對數據集的特殊性,在保持數據重構信息的基礎上,提出兩種不同的降維算法,并分別在不同數據集上對所提出方法的準確性和可靠性進行驗證及分析。
  本文的主要工作及創(chuàng)新點概括如下:
  1.提出一種基于全局距離和類別信息的鄰域保持嵌入算法(Neighborhood Preserving Embedding Algorithm based on Global Distanc

3、e and Label Information, GLI-NPE)。GLI-NPE算法在鄰域保持嵌入算法通過傳統(tǒng)歐氏距離構造鄰域圖的公式中,加入表征全局距離的全局因子和表示數據類別信息的函數項。全局因子使分布不均勻的樣本變得平滑均勻,使鄰域保持嵌入算法在分布不均勻的樣本上更為魯棒。類別信息使類內樣本點且緊湊類間樣本點疏離,通過提高所選鄰近點的質量,優(yōu)化數據的局部鄰域,使降維后的數據具有更好的可分性。實驗結果表明,GLI-NPE算法能夠有

4、效提高數據降維后的分類準確率。
  2.針對高維的基因表達數據,立足于對數據進行維數約減的同時提高腫瘤數據的可分性,同時分析稀疏表示與近鄰表示各自的局限性以及腫瘤數據中分類的獨特性,提出一種基于判別混合結構保持投影(Discriminative Hybrid Structure Preserving Projections, DHSPP)的特征提取算法。DHSPP算法將稀疏表示與近鄰表示線性組合成一種混合表示,然后根據類別信息將混

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論