模糊聚類理論發(fā)展及研究畢業(yè)論文_第1頁
已閱讀1頁,還剩13頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、模糊聚類理論發(fā)展及研究模糊聚類理論發(fā)展及研究摘要摘要從模糊聚類準(zhǔn)則函數(shù)的演化、算法實(shí)現(xiàn)的途徑、有效性度量方式以及在模式識別與圖像處理中的應(yīng)用等4個方面對模糊聚類理論的研究進(jìn)展做了綜述和評價(jià),指出模糊聚類進(jìn)一步研究的幾個重要方向及其應(yīng)用前景.關(guān)鍵詞關(guān)鍵詞聚類分析聚類分析模糊聚類模糊聚類聚類有效性聚類有效性模式識別模式識別圖像處理圖像處理聚類就是按照事物間的相似性進(jìn)行區(qū)分和分類的過程,在這一過程中沒有教師指導(dǎo),因此是一種無監(jiān)督的分類.聚類分

2、析則是用數(shù)學(xué)方法研究和處理所給定對象的分類.“人以群分,物以類聚”,聚類是一個古老的問題,它伴隨著人類社會的產(chǎn)生和發(fā)展而不斷深化,人類要認(rèn)識世界就必須區(qū)別不同的事物并認(rèn)識事物間的相似性[1].傳統(tǒng)的聚類分析是一種硬劃分,它把每個待辨識的對象嚴(yán)格地劃分到某個類中,具有非此即彼的性質(zhì),因此這種分類的類別界限是分明的.而實(shí)際上大多數(shù)對象并沒有嚴(yán)格的屬性,它們在性態(tài)和類屬方面存在著中介性,適合進(jìn)行軟劃分.Zadeh[2]提出的模糊集理論為這種軟

3、劃分提供了有力的分析工具,人們開始用模糊的方法來處理聚類問題,并稱之為模糊聚類分析.由于模糊聚類得到了樣本屬于各個類別的不確定性程度,表達(dá)了樣本類屬的中介性,即建立起了樣本對于類別的不確定性的描述,能更客觀地反映現(xiàn)實(shí)世界,從而成為聚類分析研究的主流.模糊劃分的概念最早由Ruspini[3]提出,利用這一概念人們提出了多種聚類方法,比較典型的有:基于相似性關(guān)系和模糊關(guān)系的方法(包括聚合法和分裂法)[4],基于模糊等價(jià)關(guān)系的傳遞閉包方法[5

4、]、基于模糊圖論最大樹方法[6],以及基于數(shù)據(jù)集的凸分解、動態(tài)規(guī)劃和難以辨識關(guān)系等方法.然而由于上述方法不適用于大數(shù)據(jù)量情況,難以滿足實(shí)時(shí)性要求高的場合,因此其實(shí)際的應(yīng)用不夠廣泛,故在該方面的研究也就逐步減少了.實(shí)際中受到普遍歡迎的是基于目標(biāo)函數(shù)的方法,該方法設(shè)計(jì)簡單、解決問題的范圍廣,最終還可以轉(zhuǎn)化為優(yōu)化問題而借助經(jīng)典數(shù)學(xué)的非線性規(guī)劃理論求解,并易于計(jì)算機(jī)實(shí)現(xiàn).因此,隨著計(jì)算機(jī)的應(yīng)用和發(fā)展,該類方法成為聚類研究的熱點(diǎn).以下將從目標(biāo)函數(shù)

5、的演化、算法的實(shí)現(xiàn)途徑、有效性度量方式以及在實(shí)際中的應(yīng)用等4個方面綜述基于目標(biāo)函數(shù)的模糊聚類方法的研究進(jìn)展.有關(guān)傳統(tǒng)聚類分析以及其他的模糊聚類方法的系統(tǒng)總結(jié)可參見文獻(xiàn)[1,7~10].1模糊聚類目標(biāo)函數(shù)的演化模糊聚類目標(biāo)函數(shù)的演化模糊聚類問題可以用數(shù)學(xué)語言描述為:把一組給定的模式O=o1o2…,on劃分為c個模糊子集(聚類)S1S2…Sc.如果用μik(1≤i≤c1≤k≤n)表示模式ok隸屬于模糊子集Si的程度,那么就得到了這組模式的模

6、糊c劃分U=μik|1≤i≤c1≤k≤n.完成這樣一組無類別標(biāo)記模式集模糊劃分的操作就是模糊聚類分析.為了獲得有收斂速度慢較慢快較快對初始化的敏感性很敏感不很敏感敏感不很敏感抗噪性能強(qiáng)較強(qiáng)弱較強(qiáng)如何提高可能性劃分的收斂速度并降低它對初始化的敏感程度,仍然是從模糊劃分角度進(jìn)一步研究模糊聚類的一個重要方向.如果在這方面有所突破,就可以得到一種既具有良好的抗噪魯棒性,同時(shí)又能快速收斂到滿意解的空間劃分方法,不僅能從理論上完善現(xiàn)有的模糊軟聚類方

7、法,也必將縮短它的實(shí)用化進(jìn)程.1.21.2對相似性準(zhǔn)則對相似性準(zhǔn)則D(D(.)的研究的研究單一的聚類準(zhǔn)則不能解決所有可能的無監(jiān)督分類問題,因此人們提出了多種相似性函數(shù),比如:最大似然準(zhǔn)則[15]、最大熵準(zhǔn)則[16]、最小體積準(zhǔn)則[17]和信息論準(zhǔn)則[18]等.不過,實(shí)際中最常用的還是基于最小類內(nèi)加權(quán)平方誤差和準(zhǔn)則.經(jīng)典的類內(nèi)平方誤差和(WGSS:withingroupsumofsquarederr)準(zhǔn)則函數(shù)最早被用來定義傳統(tǒng)的硬c均值聚

8、類算法和ISODATA算法.隨著模糊集理論的提出,Dunn[19]首先把它推廣到加權(quán)的WGSS函數(shù),后由Bezdek[20]擴(kuò)展到加權(quán)WGSS的無限族,形成了模糊c均值類型算法的通用聚類準(zhǔn)則,形式如式(1)所示.對該準(zhǔn)則函數(shù)的研究主要集中在相似性測度或者誤差度量D(.)上,一般用樣本與原型間的距離表示.不同距離度量用來檢測不同結(jié)構(gòu)的數(shù)據(jù)子集,常用的距離函數(shù)見表2.表2常見的距離函數(shù)及特點(diǎn)名稱距離函數(shù)特點(diǎn)功能Minkowski對應(yīng)1≤p≤

9、∞為一族距離測度,可用來檢測從◇形超立方體到□形超立方體結(jié)構(gòu)的數(shù)據(jù)子集Euclidean對應(yīng)p=2的Minkowski距離,可用以檢測特征空間中○形超球體結(jié)構(gòu)的數(shù)據(jù)子集Hamming對應(yīng)p=1的Minkowski距離,可用以檢測特征空間中◇形超立方體結(jié)構(gòu)的數(shù)據(jù)子集Maximum對應(yīng)p=∞的Minkowski距離,可用以檢測特征空間中□形超立方體結(jié)構(gòu)的數(shù)據(jù)子集MahalanobisDA(ab)=(ab)TA(ab)A為正定矩形可用來檢測特

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論