一種輿情數(shù)據(jù)挖掘平臺的研究.pdf_第1頁
已閱讀1頁,還剩54頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、隨著計算機及網(wǎng)絡(luò)技術(shù)發(fā)展的日新月異,互聯(lián)網(wǎng)成為消息傳播的重要媒體,然而這種媒體具有直接性、突發(fā)性、偏差性、自由性等特點,需要有關(guān)部門通過高效的輿情分析系統(tǒng)予以適當(dāng)?shù)谋O(jiān)督和管控。傳統(tǒng)的輿情數(shù)據(jù)挖掘系統(tǒng)處理效率低,實時性差,建設(shè)周期長,維護困難,擴展性差且建設(shè)維護成本高。對于互聯(lián)網(wǎng)上具有實時性強、數(shù)據(jù)維度高、語義不確定等特點的海量輿情數(shù)據(jù)已不能夠滿足需求。
   為此本文提出將云計算與數(shù)據(jù)挖掘平臺結(jié)合。文中分析了輿情數(shù)據(jù)挖掘平臺的需

2、求,不僅利用云計算平臺理論上無限的擴展能力解決了計算能力不足的制約,并且將整個平臺設(shè)計為面向服務(wù)的模式,引入了SOA的架構(gòu)來管理云計算平臺中的大量基礎(chǔ)操作及其相關(guān)調(diào)用,解決了云計算平臺中大量應(yīng)用管理混亂耦合性高的問題。并通過SOA架構(gòu),實現(xiàn)快速、高效、低成本的應(yīng)對系統(tǒng)功能需求的變更。本系統(tǒng)采用服務(wù)注冊表與企業(yè)服務(wù)總線結(jié)合的模式進行設(shè)計,基于web服務(wù)實現(xiàn)SOA更加加強了云計算平臺虛擬化和面向服務(wù)這兩個方面的特性。
   本文首先

3、比較了現(xiàn)有的分布式數(shù)據(jù)挖掘平臺架構(gòu),以及各自的優(yōu)勢,隨后吸取各家的長處,提出了基于云計算的輿情數(shù)據(jù)挖掘平臺的設(shè)計方案,并從平臺的特點及需求、整體方案、輿情數(shù)據(jù)存儲層、輿情挖掘任務(wù)調(diào)配層、輿情挖掘應(yīng)用層和SOA應(yīng)用的方面進行了闡述。系統(tǒng)還設(shè)計了輿情挖掘算法植入的插件結(jié)構(gòu),使得系統(tǒng)更加具有靈活性。用戶可以根據(jù)自身的需要和系統(tǒng)的權(quán)限,上傳算法到系統(tǒng)平臺。本文設(shè)計了一種插件注冊查詢體系及其與系統(tǒng)對接的接口。使得系統(tǒng)中的輿情挖掘算法以插件的形式動

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論