版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、隨著科學(xué)技術(shù)的迅速發(fā)展和網(wǎng)絡(luò)技術(shù)的普及,人類社會已經(jīng)進入到大數(shù)據(jù)時代。在很多領(lǐng)域中人們需要從海量數(shù)據(jù)中得到有用的知識和信息,因此產(chǎn)生了數(shù)據(jù)挖掘的概念,仿射傳播聚類算法作為一種重要的數(shù)據(jù)挖掘算法,以相似度矩陣作為輸入,構(gòu)造吸引度矩陣和歸屬度矩陣,數(shù)據(jù)點之間通過吸引度和歸屬度交換有真實價值的消息,直到一個最優(yōu)的類代表點集合和聚類逐漸形成。仿射傳播聚類算法具有不用指定初始聚類中心及聚類的個數(shù)不需要設(shè)定等優(yōu)點,但對結(jié)構(gòu)復(fù)雜和維數(shù)較高的數(shù)據(jù)集存在
2、聚類結(jié)果比較差、精度低、且聚類個數(shù)易受到偏向參數(shù)的影響。本文主要圍繞仿射傳播聚類算法的不足,從以下幾個方面展開分析與研究:
1.針對仿射傳播聚類算法處理結(jié)構(gòu)復(fù)雜數(shù)據(jù)集時存在聚類效果差、精度低等問題,提出了一種基于核函數(shù)的半監(jiān)督仿射傳播聚類算法,該算法首先利用核函數(shù)將結(jié)構(gòu)復(fù)雜的輸入數(shù)據(jù)集映射到特征空間,改變相似性度量,且映射后的數(shù)據(jù)集呈現(xiàn)線性特征;然后計算映射到特征空間數(shù)據(jù)的相似度矩陣,通過半監(jiān)督學(xué)習(xí)進行調(diào)整,使屬于同簇內(nèi)的數(shù)據(jù)
3、更容易成為近鄰;最后將得到的相似度矩陣作為仿射傳播聚類算法的輸入,迭代更新得到全局最優(yōu)。仿真結(jié)果比對,可以看出改進后的算法處理結(jié)構(gòu)復(fù)雜數(shù)據(jù)集時聚類效果更好、精度更高。
2.針對運用半監(jiān)督仿射傳播聚類算法處理高維數(shù)據(jù)時存在聚類精度低和計算量大的問題,提出一種基于局部線性嵌入的半監(jiān)督仿射傳播聚類算法,該算法首先通過局部線性嵌入算法將輸入的高維數(shù)據(jù)集映射到低維空間得到低維數(shù)據(jù)集,且映射后的數(shù)據(jù)集呈現(xiàn)線性特征,計算低維數(shù)據(jù)集的相似度矩
4、陣,再用半監(jiān)督算法調(diào)整相似度矩陣,最后用仿射傳播聚類算法對低維數(shù)據(jù)進行聚類分析。仿真結(jié)果表明改進后的算法在處理高維數(shù)據(jù)時聚類效果更好、精度更高、迭代次數(shù)更少。
3.由于仿射傳播聚類算法中偏向參數(shù)對聚類精度和聚類個數(shù)有著直接的影響,但其偏向參數(shù)通常都是經(jīng)驗取值,很可能導(dǎo)致得不到最優(yōu)的聚類結(jié)果,針對這一問題提出了基于差分進化的仿射傳播聚類算法,該算法首先進行仿射傳播聚類分析,其偏向參數(shù)取經(jīng)驗值;然后根據(jù)得到的聚類結(jié)果判斷偏向參數(shù)是
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于仿射變換的船舶軌跡譜聚類算法研究.pdf
- 基于入侵雜草算法的數(shù)據(jù)挖掘聚類算法研究.pdf
- 數(shù)據(jù)挖掘聚類算法研究.pdf
- 基于數(shù)據(jù)挖掘聚類算法的研究及其應(yīng)用.pdf
- 基于聚類算法的數(shù)據(jù)挖掘技術(shù)的研究.pdf
- 數(shù)據(jù)挖掘中的聚類算法研究.pdf
- 基于Storm的流數(shù)據(jù)聚類挖掘算法的研究.pdf
- 仿射傳播聚類在遙感圖像分類中的應(yīng)用研究.pdf
- 基于圖聚類的社會網(wǎng)絡(luò)數(shù)據(jù)挖掘算法研究.pdf
- 類仿射投影算法的改進研究.pdf
- 數(shù)據(jù)挖掘中的演化數(shù)據(jù)聚類算法研究.pdf
- 數(shù)據(jù)挖掘中聚類算法研究.pdf
- 基于聚類和核方法的數(shù)據(jù)挖掘算法研究.pdf
- 基于混合蛙跳的數(shù)據(jù)挖掘模糊聚類算法研究.pdf
- 數(shù)據(jù)挖掘中聚類算法的研究.pdf
- 數(shù)據(jù)挖掘中增量聚類算法的研究.pdf
- 數(shù)據(jù)挖掘中模糊聚類算法的研究.pdf
- 數(shù)據(jù)挖掘中模糊聚類算法研究.pdf
- 基于密度的數(shù)據(jù)流聚類挖掘算法.pdf
- 基于密度聚類的空間數(shù)據(jù)挖掘算法研究.pdf
評論
0/150
提交評論