面向概念漂移數(shù)據(jù)流的在線集成分類算法研究與應用.pdf_第1頁
已閱讀1頁,還剩84頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、在過去的幾十年里,數(shù)據(jù)挖掘分類算法發(fā)展迅速,出現(xiàn)了許許多多性能較好的算法。然而,隨著大數(shù)據(jù)時代的到來,由于數(shù)據(jù)量的增大,數(shù)據(jù)的多樣性增加以及數(shù)據(jù)的產(chǎn)生速度加快,這些基于靜態(tài)數(shù)據(jù)挖掘的傳統(tǒng)分類算法已經(jīng)很難再保證良好的應用可行性以及較高的分類準確率。因此,針對大數(shù)據(jù)流,需要提出新的分類算法。本次研究所依賴的車聯(lián)網(wǎng)項目正是需要這類新的算法。
  本文的研究內容是集成分類方法的改進與應用,主要包含三個方面的內容。首先,本文將對現(xiàn)有兩類集成

2、方法進行研究,歸納兩類集成方法為適應動態(tài)數(shù)據(jù)流所做的努力,并基于這些研究提出改進集成方法的通用策略。然后,基于第一項工作中所提出的改進策略,本文還將對兩個典型的集成方法 AUE、OSBoost進行改進。AUE算法作為塊集成方法的代表,本次研究將主要考慮將它轉變?yōu)樵诰€方法。OSBoost作為在線方法的代表,本次研究將主要考慮提升該算法的準確率。最后,本文還將研究如何把現(xiàn)有集成方法應用到實踐中去。
  本文的主要成果如下:
  

3、1、基于現(xiàn)有算法,提出了三種改進集成方法的通用策略。首先,使用增量式賦權機制能夠確保模型對最近最新的數(shù)據(jù)有較高的適應能力。其次,使用自適應分類器作為集成組件能夠大幅度提升集成方法對突變型概念漂移的適應能力。最后,概念漂移檢測器的使用,使得集成方法能夠更精確的識別概念漂移并適應概念漂移。實驗表明,這三種策略對集成方法的泛化準確率具有不同程度的提升。
  2、基于上一結論,對兩種集成方法進行了改進。首先,針對塊集成方法AUE,本文通過

4、設計并對比四種改進方案的結果,提出了在線集成算法OAUEAdwin。然后,針對在線方法 OSBoost算法,本文通過增加概念漂移檢測器并修改其賦權機制將其改進為OSBoostAdwin算法。實驗結果表明,新的算法具有更高的泛化準確率。同時,也再次證明了三種改進策略的可行性。
  3、為了探索集成方法的應用可行性,本次研究還基于VRSS平臺與MOA平臺整合出了實時數(shù)據(jù)流挖掘平臺 VRSS-MOA?;?VRSS-MOA平臺,本文對比

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論