版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、近年來(lái),隨著互聯(lián)網(wǎng)用戶越來(lái)越多,用戶行為信息量不斷增加,其增長(zhǎng)速度讓人感到不可思議,根據(jù)一個(gè)互聯(lián)網(wǎng)企業(yè)的統(tǒng)計(jì),用戶在網(wǎng)絡(luò)上購(gòu)買某一商品前,平均需要打開五個(gè)不同網(wǎng)店地址,瀏覽網(wǎng)頁(yè)超過(guò)三十個(gè),搜索次數(shù)大于十次。這些信息具有較大的分析價(jià)值,從中可以分析出用戶的相關(guān)特征,從而可以為用戶提供周到的推薦服務(wù),這對(duì)公司和用戶自身都是有益的。目前,面向用戶特征數(shù)據(jù)分析的應(yīng)用越來(lái)越多,導(dǎo)致數(shù)據(jù)分散、工作量重復(fù)等問(wèn)題,缺少一個(gè)統(tǒng)一的方案來(lái)解決此類問(wèn)題,因此
2、開發(fā)一個(gè)用戶特征數(shù)據(jù)統(tǒng)一分析平臺(tái)變得越來(lái)越有必要。
本文首先簡(jiǎn)介了Hadoop大數(shù)據(jù)處理的研究現(xiàn)狀,然后闡述了用戶特征數(shù)據(jù)分析的研究現(xiàn)狀,為開發(fā)該系統(tǒng)提供了必要的參考,同時(shí)介紹了用戶特征數(shù)據(jù)分析相關(guān)的應(yīng)用。在需求分析階段,制定了該平臺(tái)的各項(xiàng)需求,根據(jù)其需求,對(duì)平臺(tái)做了詳細(xì)的設(shè)計(jì),從功能的不同的角度出發(fā),將平臺(tái)劃分為數(shù)據(jù)采集模塊、數(shù)據(jù)預(yù)處理模塊、模型建立模塊和用戶特征查詢模塊。數(shù)據(jù)采集模塊支持不同方式的采集。預(yù)處理模塊提供了一個(gè)
3、預(yù)處理框架,可以根據(jù)需求自定義操作順序和操作內(nèi)容,使得預(yù)處理過(guò)程更加方便和靈活,目前平臺(tái)支持封裝、切詞、特征提取、權(quán)值計(jì)算、數(shù)據(jù)格式化等預(yù)處理操作。在模型建立階段,平臺(tái)利用支持向量機(jī)分類算法、樸素貝葉斯分類算法和Adaboost算法,通過(guò)訓(xùn)練生成模型,以供預(yù)測(cè)需要。特征查詢模塊對(duì)外提供了遠(yuǎn)程調(diào)用的接口,內(nèi)部實(shí)現(xiàn)了LRU緩沖區(qū),提高了平臺(tái)性能。為了體現(xiàn)平臺(tái)的可用性,基于平臺(tái)實(shí)現(xiàn)了用戶性別識(shí)別、用戶年齡識(shí)別和用戶消費(fèi)能力識(shí)別的具體應(yīng)用。在平
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 安全統(tǒng)一分析平臺(tái)的研究與設(shè)計(jì).pdf
- 汽車營(yíng)銷服務(wù)集團(tuán)企業(yè)數(shù)據(jù)統(tǒng)一分析處理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- DEM地形可視性統(tǒng)一分析模型構(gòu)建與實(shí)現(xiàn).pdf
- 自適應(yīng)迭代譜估計(jì)的統(tǒng)一分析與拓展.pdf
- 統(tǒng)一分析梁和有限節(jié)線法的若干應(yīng)用.pdf
- 基于Hadoop用戶行為分析系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于Hadoop平臺(tái)和查詢?nèi)罩镜挠脩粜袨榉治鱿到y(tǒng)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 動(dòng)力吸振及阻振統(tǒng)一分析方法研究.pdf
- 時(shí)間統(tǒng)一分系統(tǒng)方案設(shè)計(jì)與系統(tǒng)實(shí)現(xiàn).pdf
- 基于Hadoop的煤炭企業(yè)數(shù)據(jù)共享平臺(tái)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于大數(shù)據(jù)平臺(tái)的用戶行為分析系的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于目錄服務(wù)的統(tǒng)一用戶標(biāo)識(shí)管理平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于Hadoop的海量數(shù)據(jù)存儲(chǔ)和計(jì)算平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于數(shù)據(jù)倉(cāng)庫(kù)與Hadoop的移動(dòng)廣告平臺(tái)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于Hadoop的XBRL數(shù)據(jù)分析系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于ETL的統(tǒng)一數(shù)據(jù)交換平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 統(tǒng)一數(shù)據(jù)交換平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 統(tǒng)一分析梁與有限節(jié)線法在開口厚壁截面構(gòu)件分析中的應(yīng)用.pdf
- 企業(yè)級(jí)統(tǒng)一用戶管理平臺(tái)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于Hadoop的百度游戲數(shù)據(jù)平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn).pdf
評(píng)論
0/150
提交評(píng)論