

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著智能移動(dòng)設(shè)備的普及,移動(dòng)互聯(lián)網(wǎng)得到迅猛的發(fā)展。互聯(lián)網(wǎng)的發(fā)展使得社交網(wǎng)絡(luò)(Social Network)應(yīng)運(yùn)而生。而定位技術(shù)的多樣化使得人們無論在室內(nèi)還是室外都很容易通過智能移動(dòng)設(shè)備獲取他們自身的物理位置。當(dāng)社交網(wǎng)絡(luò)和多樣化定位技術(shù)融合在一起,便促發(fā)了位置社交網(wǎng)絡(luò)(Location-based SocialNetwork,LBS)的出現(xiàn)。在位置社交網(wǎng)絡(luò)上,由于它的諸多優(yōu)勢(shì),用戶的位置數(shù)據(jù)得到了大量的積累。大規(guī)模的位置數(shù)據(jù)背后一定隱藏著
2、人們各式各樣的生活模式和個(gè)人偏好。因而,對(duì)于這些數(shù)據(jù)的挖掘,可以發(fā)現(xiàn)出這些數(shù)據(jù)背后的模式、規(guī)律和偏好,從而利用這些知識(shí)來給人們帶去生活上的便利,讓他們學(xué)習(xí)到更多新鮮的知識(shí),而且同時(shí)也可以讓商家通過更為精準(zhǔn)的廣告、推薦的方式高效地獲取更多的利益。為此,本文的工作重點(diǎn)著眼于從過去、現(xiàn)在和將來三個(gè)角度進(jìn)行大規(guī)模位置數(shù)據(jù)的挖掘工作,具體包括用戶的位置命名、位置預(yù)測(cè)、位置推薦三個(gè)大類問題。然而,在這種大規(guī)模數(shù)據(jù)上進(jìn)行這些挖掘工作,需要應(yīng)對(duì)諸多挑戰(zhàn)
3、,包括了數(shù)據(jù)規(guī)模、數(shù)據(jù)稀疏性、多源數(shù)據(jù)融合和分布不均勻性等等。針對(duì)這些挑戰(zhàn),我們提出了相應(yīng)的應(yīng)對(duì)辦法,來解決位置命名、位置預(yù)測(cè)和位置推薦等相關(guān)問題。具體而言,本文的主要研究成果、貢獻(xiàn)和創(chuàng)新點(diǎn)可概括為以下幾點(diǎn):
1)我們提出位置命名問題,將其中從物理位置到興趣點(diǎn)位置的映射問題歸結(jié)為機(jī)器學(xué)習(xí)中的排序?qū)W習(xí)問題,從而可以自動(dòng)地根據(jù)用戶的當(dāng)前位置提供適合時(shí)機(jī)的語義名字。在方法中,我們把位置命名和本地搜索做類比,設(shè)計(jì)了一個(gè)本地搜索的框架,
4、基于此提出用戶時(shí)空偏好模型(STUP)來做位置命名。STUP基于排序?qū)W習(xí)算法結(jié)合了三個(gè)部分的模型,分別是用戶偏好模型,空間偏好模型以及時(shí)間偏好模型。在提取用戶偏好模型時(shí),為了克服用戶簽到數(shù)據(jù)的稀疏性,我們利用排序優(yōu)化的協(xié)同過濾來學(xué)習(xí)用戶興趣以增強(qiáng)用戶偏好。另外,為了融合來自于社交網(wǎng)絡(luò)中的社交關(guān)系,我們?yōu)榕判騼?yōu)化的目標(biāo)添加朋友間行為模式的相近性約束。在基于點(diǎn)評(píng)網(wǎng)上的簽到數(shù)據(jù)進(jìn)行算法的評(píng)測(cè)。我們發(fā)現(xiàn)STUP會(huì)優(yōu)于所提出的基準(zhǔn)算法,可以給23
5、.6%-26.6%的測(cè)試查詢返回準(zhǔn)確的語義名字。
2)我們提出探索預(yù)測(cè)問題,來預(yù)測(cè)人們下個(gè)訪問位置是否是他們以前未訪問過的位置,并把它歸結(jié)為一個(gè)二分類問題。在這個(gè)二分類問題中,我們提出三類特征,也就是基于歷史特征、基于時(shí)間的特征和基于空間的特征,這些特征不僅反映了人們追求新奇的個(gè)性特質(zhì),也體現(xiàn)了人們當(dāng)時(shí)的追求新奇的狀態(tài)?;谶@個(gè)探索預(yù)測(cè)問題,我們提出協(xié)同探索周期回歸的位置預(yù)測(cè)模型來融合位置預(yù)測(cè)和位置推薦,從而利用相似用戶的行為
6、模式來緩解數(shù)據(jù)的稀疏性給位置預(yù)測(cè)帶來的影響。當(dāng)人們被預(yù)測(cè)去做探索的時(shí)候,借助位置推薦算法找到他們可能感興趣并且與他們活動(dòng)區(qū)域相近的位置;當(dāng)人們被預(yù)測(cè)去做回歸的時(shí)候,借助常規(guī)的位置預(yù)測(cè)算法來找出他們下一個(gè)最有可能會(huì)出現(xiàn)的地方。針對(duì)這種對(duì)位置訪問歷史進(jìn)行分治的必要性,我們從多個(gè)角度進(jìn)行了全面分析。另外,在常規(guī)位置預(yù)測(cè)算法的學(xué)習(xí)中,針對(duì)位置訪問頻率的不均勻性,我們采用了能產(chǎn)生這種不均勻性的先驗(yàn)分布來做貝葉斯學(xué)習(xí)。在兩個(gè)大規(guī)模的分別具有6M和3
7、6M簽到的數(shù)據(jù)集上進(jìn)行實(shí)例研究和評(píng)測(cè)。評(píng)測(cè)結(jié)果表明探索預(yù)測(cè)在兩個(gè)數(shù)據(jù)集上的誤分類率只有20%左右,遠(yuǎn)遠(yuǎn)地優(yōu)于基準(zhǔn)方法;相比于常規(guī)的位置預(yù)測(cè)方法,CEPR可以提高位置預(yù)測(cè)的性能多達(dá)30%。此外,我們還分析了常規(guī)位置的可預(yù)測(cè)性,并驗(yàn)證了序列屬性、時(shí)間規(guī)律性在位置歷史中的存在性。
3)我們提出基于地理建模內(nèi)嵌的矩陣分解模型來做位置推薦,以應(yīng)對(duì)來自于用戶-興趣點(diǎn)矩陣極其稀疏的特性帶來的挑戰(zhàn)。這個(gè)模型從簽到數(shù)據(jù)提供隱式反饋出發(fā),提出利用
8、加權(quán)矩陣分解來做興趣點(diǎn)推薦,而且給從矩陣分解中學(xué)習(xí)得到的用戶隱向量和興趣點(diǎn)隱向量進(jìn)行擴(kuò)展,分別增加了用戶活動(dòng)區(qū)域向量和興趣點(diǎn)影響向量。基于這個(gè)增強(qiáng)模型,我們不僅能從二維密度估計(jì)的角度來刻畫空間聚集效應(yīng),而且還解釋了為何對(duì)這個(gè)效應(yīng)的建模可以來解決矩陣稀疏的問題。我們?cè)谝粋€(gè)大規(guī)模的位置社交網(wǎng)絡(luò)數(shù)據(jù)上進(jìn)行了評(píng)測(cè)。評(píng)測(cè)的結(jié)果發(fā)現(xiàn)這個(gè)加權(quán)矩陣分解會(huì)比其他形式的分解模型和基于用戶的協(xié)同過濾方法好,而且把空間聚集效應(yīng)整合到矩陣分解之后提高了推薦的性能
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于大數(shù)據(jù)的社交網(wǎng)絡(luò)數(shù)據(jù)挖掘.pdf
- 基于社交網(wǎng)絡(luò)的數(shù)據(jù)挖掘研究.pdf
- 基于社交網(wǎng)絡(luò)的數(shù)據(jù)挖掘技術(shù)研究.pdf
- 基于用戶特征的社交網(wǎng)絡(luò)數(shù)據(jù)挖掘研究.pdf
- 基于位置服務(wù)(LBS)的社交網(wǎng)絡(luò)數(shù)據(jù)挖掘與可視化研究.pdf
- 基于大數(shù)據(jù)的社交網(wǎng)絡(luò)數(shù)據(jù)挖掘-畢業(yè)論文
- 基于大數(shù)據(jù)的社交網(wǎng)絡(luò)數(shù)據(jù)挖掘-畢業(yè)論文
- 社交網(wǎng)絡(luò)中的數(shù)據(jù)挖掘與分析.pdf
- 社交網(wǎng)絡(luò)中的多媒體數(shù)據(jù)挖掘.pdf
- 基于自然語言處理的社交網(wǎng)絡(luò)數(shù)據(jù)挖掘研究.pdf
- 基于數(shù)據(jù)集的社交特性挖掘.pdf
- 基于數(shù)據(jù)挖掘在社交網(wǎng)絡(luò)中熱點(diǎn)話題的研究.pdf
- 基于手機(jī)網(wǎng)絡(luò)數(shù)據(jù)挖掘的用戶社交移動(dòng)行為模式分析.pdf
- 基于位置社交網(wǎng)絡(luò)的朋友關(guān)系預(yù)測(cè)研究.pdf
- 基于位置的社交網(wǎng)絡(luò)用戶簽到行為研究.pdf
- WEB數(shù)據(jù)挖掘及其在社交網(wǎng)絡(luò)的應(yīng)用研究.pdf
- 基于社交網(wǎng)絡(luò)的數(shù)據(jù)過濾與數(shù)據(jù)推送.pdf
- 基于位置的社交網(wǎng)絡(luò)興趣點(diǎn)推薦策略研究.pdf
- 基于位置的社交網(wǎng)絡(luò)用戶行為分析與研究.pdf
- 基于位置社交網(wǎng)絡(luò)的興趣點(diǎn)推薦方法研究.pdf
評(píng)論
0/150
提交評(píng)論