面向社會網(wǎng)絡的關系挖掘算法研究.pdf_第1頁
已閱讀1頁,還剩124頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、社會網(wǎng)絡分析已經(jīng)成為數(shù)據(jù)挖掘領域中研究的熱點之一。隨著研究的深入,社會網(wǎng)絡的概念也被逐步擴大,也出現(xiàn)了大量的社會網(wǎng)絡平臺。例如以好友關系為基礎的Facebook、人人等,以信息傳播為基礎的Twitter、新浪微博等,以用戶興趣為基礎的Flick,豆瓣等,還包括以學者合作為基礎的DBLP等等。用戶每天在社會網(wǎng)絡平臺中產(chǎn)生大量的實體及關系。社會網(wǎng)絡中實體之間的關系是錯綜復雜的,通過挖掘實體間的潛在關系,能夠深入理解社會網(wǎng)絡中的社區(qū)結構、信息

2、傳播、群體行為和社會輿情等。因此,社會網(wǎng)絡中的關系挖掘已經(jīng)成為相關領域研究的的基礎。
  傳統(tǒng)社會網(wǎng)絡中的關系挖掘主要關注人及人之間的關系,而真實社會網(wǎng)絡中的實體除了包括人之外,還包含很多其他實體。例如知識圖譜研究關注的概念實體,信息推薦關注的項目、位置等。社會網(wǎng)絡中的關系主要包括兩類:同質(zhì)關系和異質(zhì)關系。兩類關系通常同時存在,并且是相互關聯(lián)的。因此,實體和關系是社會網(wǎng)絡關系挖掘算法關注的焦點。從數(shù)據(jù)挖掘的視角出發(fā),針對社會網(wǎng)絡中

3、實體間的復雜關系進行挖掘分析,能夠從結構、內(nèi)容、行為等多角度理解社會網(wǎng)絡。
  本文從關系挖掘的角度出發(fā),主要針對以下幾個方面開展研究:
  首先,社會網(wǎng)絡中用戶之間的社區(qū)特征、消息的話題相似性、用戶行為的趨同性等表現(xiàn)出大量的同質(zhì)關系。針對社會網(wǎng)絡中的同質(zhì)關系很難在單一尺度下分析的問題,提出了基于擴散小波的多尺度分析框架。在統(tǒng)一的框架下針對社會網(wǎng)絡中的社區(qū)結構、話題、用戶行為等進行多尺度分析。
  其次,針對大規(guī)模異質(zhì)

4、關系數(shù)據(jù)中的稀疏性和非平衡問題,提出了基于關聯(lián)矩陣的稀疏非負矩陣分解算法 HSNMF-CM。算法中選擇異質(zhì)關系對應的較小一類實體的相關關系構建關聯(lián)矩陣,既降低了矩陣的稀疏度,又提高了算法的處理效率。HSNMF-CM在塊坐標下降的框架下,通過稀疏約束下的高效投射算法快速求解矩陣分解。針對高階異質(zhì)關系,算法通過聚類指示矩陣融合的方法處理復雜的異質(zhì)關系數(shù)據(jù)。
  再次,針對大規(guī)模微博消息流的突發(fā)話題檢測問題,在動態(tài)窗口劃分的基礎上,通過

5、聯(lián)合聚類算法挖掘用戶、消息和特征實體之間的關系,實現(xiàn)快速、準確的突發(fā)話題檢測。從實體影響力的角度定義突發(fā)話題,充分考慮話題的動態(tài)性。針對中文微博,以字為特征實體,實現(xiàn)高效的實體關系建模。最后以突發(fā)字為基礎構建詞、有意義串。因此能夠檢測新詞、口語化詞等誘導的突發(fā)現(xiàn)象。
  最后,針對微博中的異常檢測問題,從同、異質(zhì)關系協(xié)同的角度開展研究,提出了基于異質(zhì)關系矩陣分解的異常檢測算法。從內(nèi)容、交互行為、用戶屬性等方面定量度量用戶和消息對應

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論