圖結(jié)構(gòu)數(shù)據(jù)聚類分析平臺的研究及原型實現(xiàn).pdf_第1頁
已閱讀1頁,還剩59頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、圖作為一種常用的數(shù)據(jù)結(jié)構(gòu),它是由結(jié)點及其之間的邊組成的,能夠表達豐富的語義信息。近年來,圖數(shù)據(jù)挖掘已成為數(shù)據(jù)挖掘領(lǐng)域的研究重點和研究熱點。圖聚類分析技術(shù)作為一種重要的圖數(shù)據(jù)挖掘技術(shù),是在大規(guī)模復雜網(wǎng)絡中進行社區(qū)發(fā)現(xiàn)的關(guān)鍵技術(shù)。其目的在于利用圖聚類算法在圖中尋找那些聯(lián)系緊密的子圖,使得子圖內(nèi)的結(jié)點之間的聯(lián)系非常緊密,而子圖與子圖之間的結(jié)點聯(lián)系相對松散。圖聚類已在化學化合物結(jié)構(gòu)、生物信息、機器視覺、視頻索引、文本檢索和Web分析中得到了廣泛

2、的應用。
   本文針對圖聚類的應用需求,對若干經(jīng)典的圖聚類算法進行了分析,在此基礎上設計并實現(xiàn)了一套基于SSH(Struts+Spring+Hibernate)架構(gòu)的圖結(jié)構(gòu)數(shù)據(jù)聚類分析平臺。該平臺集成了多種經(jīng)典的圖聚類算法,并可根據(jù)使用者的要求對算法的參數(shù)進行修改,使得數(shù)據(jù)的輸入輸出具有統(tǒng)一標準,及實現(xiàn)聚類結(jié)果可視化展現(xiàn)。另外,平臺還考慮到未來系統(tǒng)的可擴展性,提供了可擴展的接口,以便新算法可在平臺上實現(xiàn)方便的添加與部署,從而為

3、圖數(shù)據(jù)挖掘研究者提供了一個開放的、可擴展性的良好的基礎平臺?;谏鲜龅难芯磕繕?,本文的研究內(nèi)容主要包括:
   1、首先介紹了本文所涉及到的數(shù)據(jù)挖掘、圖結(jié)構(gòu)數(shù)據(jù)挖掘、Eclipse、MVC以及SSH架構(gòu)等相關(guān)知識,以為后續(xù)的平臺設計與實現(xiàn)奠定良好的技術(shù)基礎。
   2、接著在經(jīng)典的位置敏感哈希算法基礎上,結(jié)合大規(guī)模圖數(shù)據(jù)的應用需求,提出了一種適用于大規(guī)模圖數(shù)據(jù)的基于位置敏感哈希的圖結(jié)構(gòu)數(shù)據(jù)聚類的算法G-LSH,并對該算法

4、的基本思想和具體設計進行了詳細的說明。
   3、然后給出了本文的圖聚類分析平臺的設計與實現(xiàn)。具體而言,圍繞如何提高圖聚類分析平臺的可擴展性和易用性等方面的問題,提出了平臺的總體框架設計,并對平臺的接口設計做了詳細的說明。在平臺實現(xiàn)階段,討論了平臺的實現(xiàn)細節(jié)和實現(xiàn)方法,包括平臺的數(shù)據(jù)持久層的實現(xiàn)、算法庫的實現(xiàn)以及最后聚類結(jié)果的可視化展示模塊等。
   4、最后以生物數(shù)據(jù)集為具體應用背景,在本平臺上對本文提出的G-LSH算

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論