Affinity Propagation聚類算法的改進及其應用研究.pdf_第1頁
已閱讀1頁,還剩92頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、聚類作為一種無監(jiān)督學習方法,一直是機器學習、數據挖掘、模式識別等領域的一個重要、活躍的研究方向。Affinity Propagation(即AP)是一種新型的exemplar-based聚類算法,由Frey和Dueck在2007年提出,其將所有樣本點均看作潛在類代表點,通過信息傳遞自動確定完成聚類,避免初始聚類中心選取不當造成的不良后果,在某些應用方面相較于目前常用的聚類算法(例如K-means、K-medoids等)效果更好。該算法一

2、經提出便得到廣泛的關注,目前已應用于人臉分類、圖像分割、文本挖掘等領域,大量基于AP的改進和擴展算法也被相繼提出。作為一種新型聚類算法,AP算法仍有問題有待解決,其中一個比較關鍵的問題就是偏向參數P(P={pk},其各元素反映各點成為類代表點的偏向程度)的取值問題。偏向參數的大小直接影響聚類結果,在標準AP以及基于AP的算法中,pk一般被賦為一個相同的常數,在聚類過程中保持不變。但對于某些實際問題,賦予所有樣本點以相同的偏向參數并不十分

3、恰當,忽視了數據本身蘊含的一些信息,可能造成信息迭代更新過程中不必要的計算。
  本文針對AP的上述問題進行了AP算法研究和改進工作,并將所提出的改進算法應用于標準實測數據的聚類以及氣液兩相流流型辨識中。本文主要工作和創(chuàng)新點如下:
  1.提出一種新的AP算法——偏向參數自動更新的AP(AdjustablePreference AP,APAP)算法。該算法針對目前AP算法存在的問題,從偏向參數的賦值和偏向參數的自動更新兩個方

4、面進行研究和改進。首先,各點對應的偏向參數初值由對應近鄰相似度集合確定;其次,在聚類實施的信息更新過程中,增加類代表點相互作用約束條件,改變AP信息傳播的因子圖模型,使偏向參數根據類代表點的相互作用自動調整。經過人工數據集的實驗測試研究發(fā)現,APAP算法的四項有效性指標——Classification Rate(CR)、Rand Index(RI)、Normalized Mutual Information(NMI)和Number of

5、 Interaction(NI)整體優(yōu)于AP算法。同時,將所提出的APAP算法與多類代表點AP算法(MEAP算法)、自適應AP算法(adAP算法)進行對比。實驗結果驗證了所提出算法的可行性、有效性。
  2.將所提出的APAP算法應用于實際測試數據中,選取加州大學歐文分校提供的標準測試數據庫(UCI機器學習庫,the UC Irvine Machine LearningRepository)中的四類常用且具有代表性的實測數據,進行

6、了聚類應用研究。結果表明,與AP算法相比APAP算法的聚類性能更好,利用APAP算法在四種代表性數據集上得到的多數有效性指標(CR、RI、NMI和NI)均好于AP;與其他AP改進型算法(MEAP算法、adAP算法)相比,APAP算法所需的迭代次數和時間更少,穩(wěn)定性更好。
  3.將所提出的APAP算法應用于氣液兩相流流型辨識中,針對目前流型辨識中存在的問題,提出了一種基于APAP算法的流型辨識新方法。該方法首先對傳感器采集的數據提

7、取特征矢量,然后利用所提出的APAP算法對數據進行聚類得到典型流型對應的類代表點,最后基于近鄰原則進行流型辨識。本文分別利用兩種傳感器(12×6維的光電池陣列傳感器、徑向C4D(CapacitivelyCoupled Contactless Conductivity Detection)傳感器)對所提出的流型辨識方法進行了實驗研究。結果表明,APAP聚類結果符合實際流型分類,同時采用APAP聚類這種無監(jiān)督的流型辨識方法對三種典型流型(泡

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論