

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、本文探討了數(shù)據(jù)挖掘領(lǐng)域中序貫?zāi)J酵诰虻哪康?、一般方法及其并行化方?針對并行序貫?zāi)J酵诰蛑行枰獣r間最長的部分——并行計算節(jié)點之間的通信問題,提出了一種新的并行序貫?zāi)J酵诰蛩惴?"基于預(yù)聚類的并行序貫?zāi)J綌?shù)據(jù)挖掘CLUSP算法(Pre-Clustered Sequential Pattern Data Mining)".CLUSP算法首先對原始數(shù)據(jù)序列進行"預(yù)聚類"處理,根據(jù)數(shù)據(jù)序列之間的相似程度(以同一個順序出現(xiàn)的子序列的長度與原序列長
2、度之間的比值)不同,把原始數(shù)據(jù)序列劃分為不同的"類",使得類內(nèi)數(shù)據(jù)序列間的相似度較大而類間數(shù)據(jù)序列間的相似度較小.然后把這些類分布到各個計算節(jié)點中,并把同一個類分到一個或者一組節(jié)點中,不同的類分布到不同的節(jié)點(組)中.然后,在調(diào)度并行序貫?zāi)J剿惴▓?zhí)行的時候,根據(jù)以上信息,將大部分通信限制在緊密聯(lián)結(jié)的節(jié)點(組)之內(nèi),從而減少了整個計算網(wǎng)絡(luò)上的通信量,達到減少通信時間開銷、提高整體執(zhí)行效率的目的.經(jīng)過模擬數(shù)據(jù)實驗證明,在一般適于劃分聚類的數(shù)
3、據(jù)集上,CLUSP算法能使序貫?zāi)J酵诰虻恼w性能顯著提高.本文還將CLUSP算法整合到"基于集群式計算機的并行數(shù)據(jù)挖掘系統(tǒng)"平臺中,利用平臺提供的資源對用戶提供決策支持.具體用于對某電梯公司銷售的電梯的維護/維修歷史數(shù)據(jù)序列進行序貫?zāi)J降耐诰?應(yīng)用結(jié)果表明,CLUSP算法在實際數(shù)據(jù)挖掘和決策支持上取得較好的效果.本文由上海市科委"基于高性能計算的數(shù)據(jù)挖掘和知識發(fā)現(xiàn)"項目(01JC14022)和上海市教委"第四期重點學(xué)科"項目(20515
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 大數(shù)據(jù)的序貫預(yù)測和聚類研究.pdf
- 數(shù)據(jù)挖掘中聚類算法的并行優(yōu)化研究.pdf
- 數(shù)據(jù)挖掘分類與聚類算法并行化研究.pdf
- 基于數(shù)據(jù)挖掘聚類算法的研究及其應(yīng)用.pdf
- 隱私保護序貫?zāi)J酵诰蜓芯?pdf
- 基于聚類的增量數(shù)據(jù)挖掘研究.pdf
- 數(shù)據(jù)挖掘中聚類算法的研究與應(yīng)用.pdf
- 基于模糊聚類的數(shù)據(jù)挖掘研究.pdf
- 并行化流式數(shù)據(jù)聚類及其在交通熱點挖掘中的應(yīng)用.pdf
- 基于SOM聚類的數(shù)據(jù)挖掘方法及其應(yīng)用研究.pdf
- 基于數(shù)據(jù)挖掘的生物序列聚類研究.pdf
- 基于Spark平臺的空間數(shù)據(jù)挖掘DBSCAN聚類算法并行化研究.pdf
- 基于數(shù)據(jù)倉庫的聚類數(shù)據(jù)挖掘工具的研究.pdf
- 模糊聚類在電信數(shù)據(jù)挖掘中的研究與應(yīng)用.pdf
- 數(shù)據(jù)挖掘聚類算法在CRM中的研究與應(yīng)用.pdf
- 基于聚類的空間數(shù)據(jù)挖掘方法與應(yīng)用研究.pdf
- 基于MapReduce的醫(yī)學(xué)數(shù)據(jù)并行聚類算法研究.pdf
- 基于聚類的數(shù)據(jù)挖掘技術(shù)在材料信息中的研究與應(yīng)用.pdf
- 基于醫(yī)學(xué)影像的模式分類與聚類挖掘技術(shù)的研究與應(yīng)用.pdf
- 基于聚類算法的數(shù)據(jù)挖掘技術(shù)的研究.pdf
評論
0/150
提交評論