

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、社交網絡中由于用戶年齡、職業(yè)、興趣等的不同會呈現出社區(qū)結構特性,社區(qū)發(fā)現是社區(qū)結構特性的研究基礎和核心。社區(qū)發(fā)現可以分析不同社群間用戶的關系、發(fā)現隱藏在社區(qū)內部的規(guī)律、追蹤網絡中的熱點話題等,對好友推薦、精準營銷等都具有非常重要的作用。
目前有大量的社區(qū)發(fā)現方法,而譜聚類方法是基于圖理論的社區(qū)發(fā)現算法,適用于社交網絡這種可以抽象成用戶關系圖的數據。傳統(tǒng)的譜聚類算法因為時間復雜度高等原因大多應用在節(jié)點規(guī)模比較小的網絡上,而社交網
2、絡則是具有海量用戶的網絡,這對傳統(tǒng)的譜聚類算法提出了挑戰(zhàn)。本文主要研究內容就是將現在應用非常廣泛的分布式大數據計算框架 Hadoop應用到大規(guī)模社區(qū)發(fā)現中,針對社交網絡數據的特性,設計了合理的用戶相似度模型,彌補了傳統(tǒng)的譜聚類算法無法確定聚類個數、計算耗時長等缺陷,使其在大規(guī)模社區(qū)發(fā)現問題上的效率得以提高,以解決傳統(tǒng)譜聚類算法只能適用于小規(guī)模社區(qū)發(fā)現等問題。
本文針對譜聚類算法無法確定社區(qū)個數的缺點,提出了在社區(qū)結構明顯的場景
3、下應用基于PageRank的社區(qū)數目發(fā)現算法,得益于PageRank算法良好的并行性,使其可以在大規(guī)模數據集中運用并行計算來提高發(fā)現社區(qū)數目的效率;在社區(qū)結構不明顯的網絡中,提出基于模塊度優(yōu)化的譜聚類算法來發(fā)現社區(qū)數目。本文選用被公眾使用較多的微博社交網絡作為實驗驗證,微博中用戶有微博內容、關注、粉絲、交互、個人信息等眾多的屬性。
本文綜合四類用戶屬性信息,構建了更加合理的用戶相似度模型。針對譜聚類算法應用于社交網絡這個特殊場
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于MapReduce的分布式聚類算法在社交網絡上的應用研究.pdf
- 基于MapReduce的分布式社區(qū)發(fā)現算法研究.pdf
- 分布式聚類算法研究與應用.pdf
- 分布式聚類算法研究及其應用.pdf
- 基于數據流的分布式并行譜聚類算法的研究.pdf
- 基于MapReduce的分布式聚類算法的研究.pdf
- 基于分布式平臺的聚類算法研究.pdf
- 分布式聚類及其在入侵檢測中的應用研究.pdf
- 基于DLP+VRML分布式虛擬環(huán)境的虛擬社區(qū)的研究與實現.pdf
- 基于譜聚類的社區(qū)發(fā)現技術研究.pdf
- 基于置信半徑的分布式聚類算法的研究與應用.pdf
- 基于MapReduce的分布式快速聚類算法研究.pdf
- 基于隱私保護的分布式聚類算法研究.pdf
- 基于隱私保護的分布式聚類算法折研究.pdf
- 隱私保護的分布式聚類算法研究.pdf
- 基于拓撲勢和譜聚類的社區(qū)發(fā)現研究.pdf
- 基于Spark的分布式社區(qū)發(fā)現算法設計與實現.pdf
- 基于改進譜聚類算法在醫(yī)學圖像中的應用研究.pdf
- 基于Hadoop平臺的分布式EM聚類算法.pdf
- 基于密度聚類的網絡社區(qū)發(fā)現算法.pdf
評論
0/150
提交評論