版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、近年來(lái),隨著我國(guó)經(jīng)濟(jì)建設(shè)持續(xù)不斷的高速發(fā)展和人們生活水平的不斷提高,城市機(jī)動(dòng)車保有量連年持續(xù)增長(zhǎng),機(jī)動(dòng)車已成為各城鎮(zhèn)居民出行的主要交通工具之一。但與此同時(shí),利用機(jī)動(dòng)車進(jìn)行的違法犯罪活動(dòng)也越來(lái)越多,如:機(jī)動(dòng)車假牌假證、機(jī)動(dòng)車伴隨、機(jī)動(dòng)車違章逃逸及盜搶等。由于涉案機(jī)動(dòng)車輛往往具有靈活、隱蔽性強(qiáng)、機(jī)動(dòng)性高等特點(diǎn),這給公安交警部門對(duì)犯罪嫌疑車輛的偵查和追蹤增大了難題。目前,隨著道路監(jiān)控技術(shù)的發(fā)展,我國(guó)各大城市普遍布設(shè)了車牌識(shí)別監(jiān)控點(diǎn),其不斷積累
2、的交通信息流過(guò)車記錄為涉案車輛的檢測(cè)、追蹤或預(yù)測(cè)預(yù)警提供了有效的數(shù)據(jù)支持。序列模式挖掘作為數(shù)據(jù)挖掘的一個(gè)重要研究領(lǐng)域,可用于分析和挖掘帶時(shí)間特征的交通信息流中隱藏的有價(jià)值模式,從而為社會(huì)有關(guān)部門提供更好的決策與服務(wù)。然而,由于交通信息流數(shù)據(jù)量的不斷增大,傳統(tǒng)的序列模式挖掘算法在數(shù)據(jù)存儲(chǔ)空間和處理效率上已無(wú)法滿足實(shí)際應(yīng)用需求,分布式計(jì)算平臺(tái)的出現(xiàn)解決了海量數(shù)據(jù)的存儲(chǔ)和計(jì)算瓶頸,從而使針對(duì)海量交通信息流的序列模式挖掘成為可能。
H
3、adoop作為一個(gè)方便、快速的分布式計(jì)算平臺(tái),利用分布式文件系統(tǒng)HDFS實(shí)現(xiàn)了對(duì)大文件或超大文件的存儲(chǔ)和容錯(cuò),并使用MapRedcue編程模型實(shí)現(xiàn)了快速運(yùn)算。但是,由于傳統(tǒng)的序列模式挖掘算法只適用于對(duì)集中存儲(chǔ)的數(shù)據(jù)進(jìn)行分析處理,因此如何設(shè)計(jì)適合在Hadoop平臺(tái)上運(yùn)行的分布式序列模式挖掘算法是有效實(shí)現(xiàn)海量數(shù)據(jù)處理的關(guān)鍵。針對(duì)分布式平臺(tái)特性,深入研究序列模式挖掘的具體實(shí)現(xiàn)步驟并盡可能增大算法并行化實(shí)現(xiàn)部分,有利于提高海量數(shù)據(jù)的序列模式挖掘
4、效率。本文將基于Hadoop的分布式序列模式挖掘與針對(duì)交通信息流領(lǐng)域的實(shí)際應(yīng)用相結(jié)合,利用Hadoop分布式平臺(tái)的優(yōu)勢(shì)來(lái)解決傳統(tǒng)序列模式挖掘在海量數(shù)據(jù)處理上的不足。
首先,本文詳細(xì)介紹了分布式文件系統(tǒng)HDFS的存儲(chǔ)設(shè)計(jì)原理及文件讀寫(xiě)流程,并據(jù)此實(shí)現(xiàn)了交通信息流的數(shù)據(jù)預(yù)處理。通過(guò)對(duì)過(guò)車記錄數(shù)據(jù)進(jìn)行有效的清理、轉(zhuǎn)換和歸約,實(shí)現(xiàn)了其從傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)到分布式文件系統(tǒng)HDFS中的轉(zhuǎn)移與轉(zhuǎn)換,以方便后續(xù)的分布式序列模式挖掘。
5、然后,本文剖析了MapReduce編程模式的運(yùn)行機(jī)制,給出了序列模式挖掘相關(guān)概念在交通信息流中的新定義,并設(shè)計(jì)了基于MapReduce的交通信息流分布式序列模式挖掘算法。本文給出了算法的詳細(xì)實(shí)現(xiàn)過(guò)程及算法優(yōu)缺點(diǎn),并針對(duì)該算法挖掘結(jié)果的局限性,結(jié)合閉合序列模式挖掘的BIDE算法,實(shí)現(xiàn)了BIDE算法的并行化及到Hadoop分布式平臺(tái)的有效移植,從而滿足更完整、更全面的應(yīng)用需求。
最后,本文搭建了Hadoop集群實(shí)驗(yàn)環(huán)境,并將相關(guān)算
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 面向海量服務(wù)數(shù)據(jù)的分布式skyline服務(wù)選擇研究.pdf
- 面向海量天文數(shù)據(jù)的分布式存儲(chǔ)引擎的研究.pdf
- 面向海量數(shù)據(jù)的分布式OLAP引擎的研究與實(shí)現(xiàn).pdf
- 分布式序列模式挖掘算法研究.pdf
- 面向海量郵件存儲(chǔ)的分布式文件系統(tǒng)研究.pdf
- mba論文面向海量服務(wù)數(shù)據(jù)的分布式skyline服務(wù)選擇研究pdf
- 面向海量高清視頻的高性能分布式存儲(chǔ)系統(tǒng).pdf
- 面向海量數(shù)據(jù)的分布式文件系統(tǒng)設(shè)計(jì)和實(shí)現(xiàn).pdf
- 面向海量數(shù)據(jù)管理的分布式倒排索引研究與應(yīng)用.pdf
- 分布式融合結(jié)構(gòu)與信息流機(jī)理研究.pdf
- 面向海量數(shù)據(jù)的快速挖掘算法研究.pdf
- 基于隱私保護(hù)的分布式序列模式挖掘算法研究.pdf
- 面向海量商品數(shù)據(jù)的分布式層次聚類算法設(shè)計(jì)與實(shí)現(xiàn).pdf
- 利用.net技術(shù)構(gòu)建企業(yè)分布式信息流支撐系統(tǒng)
- 面向海量數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘算法研究.pdf
- 分布式序列模式挖掘中隱私保護(hù)技術(shù)研究.pdf
- 面向海量遙感影像數(shù)據(jù)的分布式文件系統(tǒng)管理技術(shù)研究.pdf
- 分布式環(huán)境下基于文本的海量數(shù)據(jù)挖掘.pdf
- 基于SOA的分布式交通信息共享平臺(tái)研究.pdf
- 面向分布式IDS的海量數(shù)據(jù)存儲(chǔ)系統(tǒng).pdf
評(píng)論
0/150
提交評(píng)論