基于流形距離和蜂群的聚類算法研究.pdf_第1頁
已閱讀1頁,還剩64頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、現(xiàn)在的生活在數(shù)據(jù)時代,數(shù)據(jù)已經處在身邊的每一處,且以爆炸式的的方式在增長,甚至已無法計算,那么如何從這么多數(shù)據(jù)中獲取所需要的潛在有用得到知識,來幫住人們做出準確的判斷,此時就有必要來挖掘這些數(shù)據(jù)。在數(shù)據(jù)挖掘中,比較重要的一種數(shù)據(jù)分析方式是聚類算法,其在研究領域十分受到研究者的青睞,但還是存在一些缺陷,這就需要更進一步的改進算法來彌補這些不足,且對解決社會實踐中遇到的難點也具有非比尋常的價值。
  本文主要以傳統(tǒng)聚類算法中的相似度測

2、度為基礎,探討了以歐氏距離作為相似度測度對一些特殊數(shù)據(jù)集聚類時的不足,主要討論了現(xiàn)已提出的基于流形距離為相似度測度對特殊數(shù)據(jù)集聚類的優(yōu)勢,當然也存在缺陷,在這里就更進一步研究了粗糙集、蜂群算法等的實質,并在此基礎上作改進然后與改進的流形距離相結合,以改善原來算法的性能。主要工作如下:
  (1)針對K-means算法的初始聚類中心隨機選取,將流形距離作為相似度測度時其參數(shù)在表現(xiàn)數(shù)據(jù)集的全局一致性方面有缺陷等問題,本文引入粒計算理論

3、中的知識,對數(shù)據(jù)集的屬性進行劃分,隨后根據(jù)最大最小距離的方法選取代表點;然后再利用流形距離及準則函數(shù)得到最佳的初始中心并得到最終聚類結果。實驗結果表明:該算法在運行時間上減少了并在數(shù)據(jù)的全局一致性上得到了很好的體現(xiàn)。
  (2)現(xiàn)在提出的以流形距離為相似度測度的聚類算法主要是針對具有“絕對流形”分布特點的數(shù)據(jù)集聚類,沒有考慮到這種分布為“相對流形”的數(shù)據(jù)集,于是本文根據(jù)粗糙集的特點,首先對數(shù)據(jù)集的屬性進行劃分然后根據(jù)最大最小距離來

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論