基于軌跡數(shù)據(jù)挖掘的語義化位置感知計算研究.pdf_第1頁
已閱讀1頁,還剩161頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、普適計算是信息空間與物理空間的融合,在這個融合的空間中人們可以隨時隨地和透明地獲得數(shù)字化服務(wù)。普適計算最大的特點在于具有上下文感知這一基本特性。上下文感知計算是指信息空間獲得物理空間的上下文信息,從而察覺物理空間中狀態(tài)的改變,然后自動觸發(fā)相應(yīng)操作或提供相應(yīng)服務(wù),從而主動適應(yīng)用戶需求的變化。位置感知計算是上下文感知計算中最重要的基礎(chǔ)性課題之一,是指系統(tǒng)能夠獲取用戶的位置信息,并根據(jù)環(huán)境中用戶位置和空間關(guān)系的變化,進(jìn)行位置上下文推理和融合,

2、分析用戶上下文歷史和現(xiàn)狀,預(yù)測用戶未來狀態(tài),從而非侵入式地自動調(diào)整自己的狀態(tài)和行為來適應(yīng)系統(tǒng)和用戶的需求。
   如何基于位置上下文設(shè)計智能、自然、高效的位置感知計算系統(tǒng)是普適計算領(lǐng)域亟待解決的重要問題。由于用戶的運動通常具有很強(qiáng)的時空規(guī)律,分析用戶歷史運動數(shù)據(jù)(即軌跡數(shù)據(jù)),從中挖掘用戶運動規(guī)律,并結(jié)合用戶當(dāng)前上下文進(jìn)行信息適應(yīng)被認(rèn)為是提高位置感知系統(tǒng)交互效率和智能化程度的有效手段。然而,軌跡數(shù)據(jù)分析和應(yīng)用的現(xiàn)有工作主要存在兩

3、方面的問題:第一,現(xiàn)有軌跡數(shù)據(jù)挖掘算法主要針對規(guī)律性較強(qiáng)的時空數(shù)據(jù),但是在普適計算環(huán)境下,軌跡數(shù)據(jù)具有異構(gòu)性、不可靠性、不完整性等特點,現(xiàn)有挖掘算法無法適應(yīng)這些特點。第二,現(xiàn)有軌跡數(shù)據(jù)分析主要集中在運動規(guī)律挖掘的層面上,沒有提取出隱含在軌跡數(shù)據(jù)中用戶相關(guān)的深層次知識(如目的意圖、生活習(xí)慣、社會關(guān)系),導(dǎo)致挖掘結(jié)果抽象程度較低、難以表示用戶高級語義。此外,現(xiàn)有工作缺乏針對基于軌跡挖掘的位置感知應(yīng)用的設(shè)計指導(dǎo)方法。
   針對這些問

4、題,本文提出基于軌跡數(shù)據(jù)挖掘的語義化位置感知計算方法,即在軌跡數(shù)據(jù)挖掘的基礎(chǔ)上,提取用戶的目的意圖、行為規(guī)律和社會關(guān)系三方面的語義信息,并基于用戶語義提供合理、高效的信息適應(yīng),從而解決位置感知系統(tǒng)可用性低和交互效率不高的問題。為此,本文著重從訪問地點和運動模式挖掘,用戶目的意圖、行為規(guī)律和社會關(guān)系等高級語義的提取以及相應(yīng)的信息適應(yīng)方式等方面展開研究。主要研究內(nèi)容和成果包括以下幾個方面:
   (1)在訪問地點挖掘方面,本文提出了

5、一種從GPS軌跡數(shù)據(jù)中挖掘語義化訪問地點的方法。該方法首先根據(jù)軌跡數(shù)據(jù)的時序特性,采用一種結(jié)合基于時間的聚類算法和基于密度的聚類算法的層次化聚類算法從中挖掘出訪問地點,然后結(jié)合機(jī)器學(xué)習(xí)技術(shù)和一個定制的POI數(shù)據(jù)庫對訪問地點的時間和空間特征分別進(jìn)行分析,進(jìn)而獲取訪問地點的分類語義。相比于現(xiàn)有的訪問地點挖掘技術(shù),該方法可獲得語義化程度較高的訪問地點信息。
   (2)在運動模式挖掘方面,本文提出了從兩種不同定位技術(shù)(即GPS定位技術(shù)

6、和蜂窩基站定位技術(shù))獲得的軌跡數(shù)據(jù)中分別挖掘運動模式的算法。在GPS軌跡數(shù)據(jù)運動模式挖掘方面,算法對原始GPS軌跡數(shù)據(jù)進(jìn)行路徑分割、候選起點/終點提取、基于空間劃分的抽象化等預(yù)處理,然后采用一種改進(jìn)的PrefixSpan算法從抽象結(jié)果中挖掘出運動模式。該算法可在保持運動模式連續(xù)性的基礎(chǔ)上極大程度地容忍軌跡數(shù)據(jù)的不確定性,從而獲得更長、更完整的模式。在蜂窩基站軌跡數(shù)據(jù)運動模式挖掘方面,算法對原始GSM基站軌跡數(shù)據(jù)進(jìn)行分割、窗口化、分組、聚

7、類等預(yù)處理,然后采用關(guān)聯(lián)規(guī)則挖掘算法從處理結(jié)果中挖掘出運動模式。該算法可克服蜂窩基站軌跡數(shù)據(jù)的不精確、振蕩、交疊等一系列問題,從而有效地挖掘出運動模式。
   (3)在用戶目的語義提取方面,本文提出了預(yù)測用戶未來運動行為的方法,包括一種用于改進(jìn)位置預(yù)測性能的自適應(yīng)多階Markov模型,以及一種基于運動模式挖掘的目的地和未來路徑聯(lián)合預(yù)測方法。自適應(yīng)多階Markov模型可根據(jù)訓(xùn)練數(shù)據(jù)與輸入數(shù)據(jù)的相關(guān)度,自動適配合適階數(shù)的Markov

8、模型進(jìn)行預(yù)測,從而在提高預(yù)測性能的同時降低訓(xùn)練數(shù)據(jù)質(zhì)量對預(yù)測結(jié)果的影響。聯(lián)合預(yù)測方法基于前綴樹數(shù)據(jù)結(jié)構(gòu)對運動模式建立索引,然后通過模式匹配尋找候選運動模式,最后根據(jù)概率模型聯(lián)合預(yù)測目的地和未來路徑。該方法在預(yù)測更長的未來路徑方面具有較強(qiáng)的優(yōu)勢。
   (4)在用戶行為語義提取方面,本文提出了一種基于訪問地點挖掘的日程行為規(guī)律建模及挖掘方法。該方法采用地點偏好矩陣對用戶日程行為進(jìn)行建模,并對偏好矩陣進(jìn)行聚類以獲得其日程行為模式。在

9、此基礎(chǔ)之上,我們提出了一種基于日程行為模式的用戶相似度計算方法,對用戶間長期生活習(xí)慣的相似度進(jìn)行度量。實驗結(jié)果表明基于提出的相似度度量方法可有效地區(qū)分用戶職業(yè)背景,從而證明了日程行為模式表示用戶長期生活規(guī)律的有效性。
   (5)在用戶關(guān)系語義提取方面,本文提出了一種針對移動社會網(wǎng)絡(luò)的用戶社會關(guān)系推理方法和一種針對基于位置社會網(wǎng)絡(luò)的興趣地點個性化推薦方法。在社會關(guān)系推理方面,基于語義化訪問地點挖掘和接近數(shù)據(jù)對用戶間的相遇模式進(jìn)行

10、分析,進(jìn)而估計其可能的真實社會關(guān)系類型。在興趣地點個性化推薦方面,基于多用戶軌跡數(shù)據(jù)協(xié)同挖掘獲得興趣地點、用戶間社會關(guān)系強(qiáng)度及用戶間興趣相似度等信息,并同時考慮用戶社會關(guān)系和興趣偏好對真實世界中的興趣地點進(jìn)行個性化推薦,從而提高推薦的可接受程度。
   (6)基于提出的軌跡數(shù)據(jù)挖掘和用戶語義提取方法,實現(xiàn)了一個語義化位置感知計算平臺原型系統(tǒng)。在此基礎(chǔ)之上,設(shè)計并實現(xiàn)了一個基于用戶目的語義的智能化任務(wù)提醒系統(tǒng)iReminder作為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論