基于通信數(shù)據(jù)的移動用戶行為分析_第1頁
已閱讀1頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、基于通信數(shù)據(jù)的移動用戶行為分析基于通信數(shù)據(jù)的移動用戶行為分析[摘要]認為分析移動用戶行為特征與分類,對移動應(yīng)用個性化服務(wù)的改進具有重要的參考價值?;趪鴥?nèi)電信運營商隨機抽取某市一萬移動用戶一周的日志記錄,其中含有4萬余條通話記錄和200余萬條網(wǎng)絡(luò)請求,每條請求包含對應(yīng)的基站標號以及基站地理位置。本研究從消費能力、通話量、網(wǎng)絡(luò)請求量、位移量四個維度從這批數(shù)據(jù)中提取14種基本特征指標。利用KMeans聚類方法將移動用戶區(qū)分成規(guī)律通話型、隨機

2、上網(wǎng)型、居家節(jié)約型和隨機高消費型等四類用戶模型。[關(guān)鍵詞]用戶行為分析移動用戶研究聚類分析數(shù)據(jù)挖掘[分類號]G351引言引言隨著移動通信技術(shù)的迅猛發(fā)展和廣泛應(yīng)用,移動終端大量普及于民眾,也產(chǎn)生了大量用戶信息記錄,如何利用大數(shù)據(jù)來了解移動用戶行為與習慣特征的研究不斷涌現(xiàn)。通過對移動用戶的分析與了解,許多企業(yè)與政府部門可以依據(jù)結(jié)果提供各式各樣的服務(wù)與應(yīng)用方案。移動用戶行為分析通常是指基于地理信息涉及用戶訪問網(wǎng)絡(luò)、通話的行為規(guī)律與活動研究。電

3、信運營商通過獲取用戶訪問移動互聯(lián)網(wǎng)、使用移動應(yīng)用及通話的行為規(guī)律能夠有效地配置網(wǎng)絡(luò)資源并提供具有針對性的服務(wù)。近年來,針對桌面端日志挖掘的研究層出不窮,[151617]都是針對桌面端web服務(wù)的后臺日志挖掘入手,通過分析用戶訪問頁面的占比、用戶訪問的頁面順序等對用戶的行為進行建模。而針對移動用戶的行為分析研究則在很多方面借鑒了桌面端的研究,同時利用移動端設(shè)備的地理位置位置記錄,挖掘出用戶移動軌跡模式,找出軌跡中重要的位置并結(jié)合通信數(shù)據(jù)、

4、互聯(lián)網(wǎng)日志數(shù)據(jù)以及移動應(yīng)用數(shù)據(jù)作為研究的基礎(chǔ),分析挖掘移動用戶的需求、行為、興趣,甚至是通過預(yù)測用戶的目的地、推測用戶下一步即將到達的位置以便提供針對性的推薦服務(wù)[1,13]。傳統(tǒng)的移動用戶軌跡分析,多數(shù)利用軟件采集仿真數(shù)據(jù),屬于細時空粒度下的數(shù)據(jù),即可以采集到用戶一天中連續(xù)時間段的位置數(shù)據(jù)。Y.Zhu等作者著眼于用戶位置數(shù)據(jù)中經(jīng)常出現(xiàn)的地點,并根據(jù)出現(xiàn)時間來推測用戶所處的位置是家還是公司[2]。此外,S.Akoush和A.Sameh則

5、通過指定時間粒度,聚類用戶在多日同一時間段的行動軌跡,利用稀疏數(shù)據(jù)擬合出用戶在這時間段移動軌跡的目的[3]。研究用戶的移動軌跡,實現(xiàn)預(yù)測用戶下一步位置目的的方法,包括利用貝葉斯算法、聚類、數(shù)據(jù)挖掘方法等。實際上,電信運營商服務(wù)器上的數(shù)據(jù)是粗時間粒度的,唯有請求通信或上網(wǎng)時才會被記錄,因此用戶位置變化是不連貫的,具有隨機性、稀疏性的特點,不能支持用戶行為軌跡直接且連續(xù)的刻畫描述。譚均元等人提出了生活熵概念作為用戶移動軌跡規(guī)律程度的度量[4

6、],采用了個人多天時段移動序列的算法來彌補實際數(shù)據(jù)的這種不足,即通過對多天數(shù)據(jù)的分析來獲得更準確的用戶移動軌跡。S.A.Shad則結(jié)合地理信息與用戶提供的上下文語義信息來增加預(yù)測準確性[5]。梁鵬等作者則透過在WAP網(wǎng)關(guān)進行數(shù)據(jù)采集,并對數(shù)據(jù)進行數(shù)值分析和擬合最后得到用析處理的類庫Numpy、Pas[14]等大大降低了的我們的工作難度。3特征選取特征選取本研究通過特征選取與統(tǒng)計結(jié)果來挖掘移動用戶的特征,并利用這特征作為聚類的參數(shù),將移動

7、用戶行為分類。本研究利用消費能力、通話量、網(wǎng)絡(luò)請求量、位移量四個維度作為分析用戶行為的基礎(chǔ)。根據(jù)這四個維度的特征從該批數(shù)據(jù)中提取相關(guān)的評價指標,分別包含。消費能力:通過客戶品牌、系統(tǒng)、話費三種來綜合用戶的消費階層;通話量:利用每日通話次數(shù)、通話時長、每次通話時長、以及各時間段通話時長分布等作為用戶通話習慣的評價指標;網(wǎng)絡(luò)請求量:利用網(wǎng)絡(luò)請求次數(shù)、各時間段的網(wǎng)絡(luò)請求分布等統(tǒng)計結(jié)果作為描述用戶上網(wǎng)習慣的特征參數(shù);位移量:使用每日出現(xiàn)的基站數(shù)

8、、位置位移量與生活熵的統(tǒng)計和計算結(jié)果來描述用戶一天中位置變化參數(shù)。3.1消費能力本研究通過客戶品牌、手機系統(tǒng)、話費三種特征來綜合評價,評量用戶的消費階層。該批數(shù)據(jù)的電信運營商提供主要三個客戶品牌:動感地帶、全球通和神州行,動感地帶是面向年輕群體的客戶品牌,目標用戶是每月月話費值低,但是數(shù)據(jù)業(yè)務(wù)比重高的用戶。全球通則面向中高端用戶,較早地推出國際漫游和手機銀行等加值服務(wù)。神州行則是面向大眾用戶,客戶群的職業(yè)、年齡等跨度都較大,資費注重實惠

9、、大眾化。由此可知,客戶品牌作為用戶個人消費能力的一種特征。該批數(shù)據(jù)中,屬于“動感地帶”客戶品牌的用戶占全部的66%,使用“全球通”的用戶占全部的13%,而“神州行”的用戶占全部的21%。因此,主要手機移動用戶以年輕用戶為居多,并數(shù)據(jù)業(yè)務(wù)比重高的需求大。由于每個用戶移動裝置的具體消費型號無法取得,本研究通過該用戶手機的品牌與操作系統(tǒng)作為該用戶的手機消費喜好參考特征之一,依據(jù)用戶使用的系統(tǒng)與品牌主要分成安卓(roid)、蘋果(iOS)、微

10、軟(Windows)、黑莓(Blackberry)以及其他(Other)。由于安卓系統(tǒng)占很大比例,而且該系統(tǒng)的手機消費分布廣泛,因此在切分成三星(Samsung)、小米魅族,以及其他安卓(Othersofroid)。小米手機和魅族在價位及使用的用戶群方面類似,因此本研究將其歸為一類。盡管黑莓系統(tǒng)手機數(shù)量很少,但較多專業(yè)人員使用,本研究仍單獨劃為一類。經(jīng)統(tǒng)計使用系統(tǒng)的用戶比例分別為:蘋果,22.02%。微軟,2.32%。黑莓,0.25%。

11、三星,19.39%。小米魅族,7.92%。其他安卓,20.12%。其它系統(tǒng),27.93%。由此可知,多數(shù)用戶仍選用安卓與蘋果系統(tǒng)的手機。用戶在使用移動服務(wù)的過程中,消費主要分為三類:通話費、流量費和增值業(yè)務(wù)費。本研究將這三種消費的總和作為移動用戶的消費金額。統(tǒng)計發(fā)現(xiàn),用戶月話費額的均值為51.01元,中位數(shù)為33.20元,并且半數(shù)的用戶話費介于12.77至66.52元之間。3.2通話量利用平均每日通話次數(shù)、平均通話時長、每次平均通話時長

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論