2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩60頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、聚類分析是數(shù)據(jù)挖掘領(lǐng)域的一項重要研究內(nèi)容,它在金融、電信、保險業(yè)、市場營銷、異常檢測、網(wǎng)絡(luò)安全、科學(xué)決策等方面具有十分重要的應(yīng)用價值,因此受到研究人員的高度重視。已有的聚類算法大多只適用于集中式數(shù)據(jù)的聚類。由于網(wǎng)絡(luò)帶寬、站點(diǎn)存儲量、信息安全及隱私保護(hù)等限制,把不同站點(diǎn)的數(shù)據(jù)全部集中到某一個中心站點(diǎn)進(jìn)行全局聚類幾乎是不可能的。所有站點(diǎn)數(shù)據(jù)集中在一起,數(shù)據(jù)量會非常龐大,聚類效率會顯著降低。本文對分布式聚類方法作了一些較深入的研究,取得了如下

2、成果: 1.提出了高效的分布式k均值聚類方法DK-Means。該方法在站點(diǎn)間只傳送少量聚簇信息,有效降低了分布式聚類過程中的數(shù)據(jù)通信量,并能達(dá)到與k均值算法等效的聚類質(zhì)量。理論分析及實(shí)驗結(jié)果表明,DK-Means是一種有效可行的分布式聚類算法,對于高維數(shù)據(jù)集同樣有效。 2.針對聚類數(shù)目難以確定的問題,提出了分布式聚類方法α-DK-Means,通過分割和合并聚簇將訓(xùn)練數(shù)據(jù)集劃分成適當(dāng)數(shù)目的聚簇而不必預(yù)設(shè)聚簇半徑。實(shí)驗結(jié)果表

3、明,該方法是有效可行的。 3.針對基于密度的分布式聚類算法DBDC通信量大、效率低的缺點(diǎn),提出了一種基于密度的分布式聚類方法DBDC*。有效降低了分布式聚類過程中的數(shù)據(jù)通信量,全局聚類時綜合考慮了各站點(diǎn)數(shù)據(jù)的分布情況,能夠?qū)θ我庑螤罘植嫉臄?shù)據(jù)進(jìn)行聚類。實(shí)驗結(jié)果表明,該方法是有效可行的,對于高維數(shù)據(jù)集同樣有效。 4.提出了一種適用于入侵檢測的數(shù)據(jù)預(yù)處理方法,定義了類別型屬性各取值之間的差異度,使得在對訓(xùn)練集進(jìn)行無監(jiān)督學(xué)習(xí)生

4、成檢測模型過程中,能夠同時有效地處理數(shù)值型屬性和類別型屬性。理論分析表明,我們所定義的類別型屬性值差異度既保留了類別型屬性各取值之間的本質(zhì)特征,同時也沒有改變數(shù)據(jù)集的原始維數(shù)。實(shí)驗結(jié)果表明,采用該數(shù)據(jù)預(yù)處理方法進(jìn)行聚類所建立的入侵檢測模型能更有效的檢測攻擊。 5.提出了一種基于分布式聚類的異常入侵檢測方法ID-DC,該方法建立在一種無中心的多Agent分布式體系結(jié)構(gòu)之上,通過對訓(xùn)練集進(jìn)行分布式聚類產(chǎn)生聚簇模型,采用基于雙參考點(diǎn)的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論