版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、現(xiàn)代互聯(lián)網(wǎng)、物聯(lián)網(wǎng)的廣泛應(yīng)用,產(chǎn)生了海量的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),對這些大規(guī)模數(shù)據(jù)的快速處理和有價(jià)值信息的挖掘,是大數(shù)據(jù)處理領(lǐng)域研究的熱點(diǎn)。多數(shù)據(jù)流的分類分析、關(guān)聯(lián)分析、聚類分析以及壓縮處理等內(nèi)容是大數(shù)據(jù)處理的重要研究內(nèi)容,對多數(shù)據(jù)流分類壓縮并行算法進(jìn)行研究,為大數(shù)據(jù)處理提供優(yōu)化的解決方法,具有非常重要的意義。
針對多數(shù)據(jù)流分類壓縮問題,我們根據(jù)基因表達(dá)式編程(GeneExpressionProgramming,GEP)能夠克服
2、遺傳算法中個(gè)體(染色體)存活率不高、收斂速度較慢,以及搜索速度較遺傳算法快2-4個(gè)數(shù)量級的特點(diǎn),將其應(yīng)用于多數(shù)據(jù)流的分類并行算法和多數(shù)據(jù)流壓縮并行算法的研究,并將多數(shù)據(jù)流的分類與壓縮算法進(jìn)行融合,提出更優(yōu)化的基于GEP的多數(shù)據(jù)流壓縮并行算法。各種算法的仿真實(shí)驗(yàn)驗(yàn)證結(jié)果表明,我們提出的基于GEP的多數(shù)據(jù)流壓縮并行算法是多數(shù)據(jù)流等大規(guī)模數(shù)據(jù)與分布式處理的一種有效的方法。
本文主要工作及創(chuàng)新點(diǎn):
(1)采用粒度計(jì)算模型對訓(xùn)
3、練數(shù)據(jù)建立目標(biāo)概念,通過改進(jìn)粒度劃分規(guī)則求解極小粒度空間并將相似屬性實(shí)施合并,然后將數(shù)據(jù)樣本建立GEP分類器,提出基于GEP的多數(shù)據(jù)流分類并行算法(MSA-GEP),在多核并行模型下實(shí)現(xiàn)多數(shù)據(jù)流的分類,實(shí)驗(yàn)結(jié)果表明MSA-GEP算法比傳統(tǒng)的分類方法的精確度更高。
(2)對流數(shù)據(jù)實(shí)施壓縮處理的前期,在n-of-N模型基礎(chǔ)上加以改進(jìn),形成閾值滑動機(jī)制有效的控制數(shù)據(jù)分段,并使用直方圖技術(shù)加以優(yōu)化;然后利用GEP的函數(shù)發(fā)現(xiàn)功能對數(shù)據(jù)進(jìn)
4、行函數(shù)替代,提出基于GEP的多數(shù)據(jù)流壓縮并行算法;最后在PC與PC機(jī)群中對算法進(jìn)行對比試驗(yàn),其中并行部分采用MPI通信機(jī)制與主從式交互模型,對數(shù)據(jù)流實(shí)現(xiàn)快速壓縮,在壓縮比方面與小波變換方法有100~135倍的提高。
(3)基于(1)與(2)的研究,為降低CPU讀取外存數(shù)據(jù)的代價(jià),使用動態(tài)記錄集轉(zhuǎn)存方式使數(shù)據(jù)由內(nèi)存(或指定位置)提供,不僅加速數(shù)據(jù)的處理進(jìn)程,也為異構(gòu)數(shù)據(jù)分類提供了保障。因此,提出一種更優(yōu)化的基于記錄集轉(zhuǎn)存的GEP
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于數(shù)據(jù)流的分類算法研究.pdf
- 基于EP的數(shù)據(jù)流分類算法研究.pdf
- 基于eEP的數(shù)據(jù)流分類算法研究.pdf
- 基于CAPE的數(shù)據(jù)流分類算法研究.pdf
- 多數(shù)據(jù)流頻繁項(xiàng)集挖掘算法研究.pdf
- 基于知識整合的數(shù)據(jù)流分類算法研究.pdf
- 數(shù)據(jù)流系綜分類算法研究.pdf
- 基于壓縮與并行技術(shù)的數(shù)據(jù)流處理方法研究.pdf
- 基于集成分類器的數(shù)據(jù)流分類算法研究.pdf
- 數(shù)據(jù)流概念漂移檢測和不平衡數(shù)據(jù)流分類算法研究.pdf
- 適應(yīng)概念漂移的數(shù)據(jù)流分類算法研究.pdf
- 隱含概念漂移的數(shù)據(jù)流分類算法研究.pdf
- 基于網(wǎng)格的并行聚類算法及數(shù)據(jù)流聚類算法研究.pdf
- 數(shù)據(jù)流集成分類器算法研究.pdf
- 基于小波變換的圖像壓縮并行算法研究.pdf
- 基于數(shù)據(jù)流模式表示的半懶惰式分類算法研究.pdf
- 基于窗口機(jī)制的概念漂移數(shù)據(jù)流分類算法研究.pdf
- 基于JPEG2000圖像壓縮的并行算法研究.pdf
- 數(shù)據(jù)流頻繁模式和分類挖掘算法研究.pdf
- 針對網(wǎng)絡(luò)數(shù)據(jù)流的實(shí)時(shí)分類算法研究.pdf
評論
0/150
提交評論