2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩62頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、近年來,隨著移動互聯(lián)網(wǎng)技術的發(fā)展和智能移動終端的普及,人們越來越習慣于通過智能移動終端上的應用隨時隨地獲取或分享信息。研究中形象地將這些由人們標注而產生的含有地理位置信息的數(shù)據(jù)稱為標繪數(shù)據(jù)。人們在使用此類應用的過程中,產生了海量的含有地理位置信息的標繪數(shù)據(jù),這些數(shù)據(jù)的規(guī)模呈爆炸性增長并且與人們的生活越來越緊密相關。標繪數(shù)據(jù)大規(guī)模的增長出現(xiàn),為許多研究領域帶來了新的機遇和挑戰(zhàn),吸引了研究人員的興趣和廣泛關注。
  與其他數(shù)據(jù)相比,標

2、繪數(shù)據(jù)具有獨特性質,它不僅僅具有地理位置,同時具有時間屬性,在科技的發(fā)展與推動下,標繪數(shù)據(jù)同時還具有數(shù)據(jù)量巨大,增長速度快,數(shù)據(jù)結構多樣,質量高低不一等特點。此外,標繪數(shù)據(jù)蘊含的信息豐富,很有挖掘價值,通過數(shù)據(jù)挖掘手段發(fā)現(xiàn)其隱藏的知識,能夠更好的提供支持決策服務。
  首先本文研究了Web數(shù)據(jù)獲取方法,實現(xiàn)了封裝HTTP請求的標繪數(shù)據(jù)抓取中間件;根據(jù)標繪數(shù)據(jù)的特性及其關聯(lián)特征,利用空間數(shù)據(jù)庫PostGIS實現(xiàn)了海量標繪數(shù)據(jù)的存儲。

3、然后利用已獲取的標繪數(shù)據(jù)的空間位置特征、用戶信息以及位置POI類別信息等,對海量標繪數(shù)據(jù)進行了初步的清洗和篩選;利用中文分詞將標繪數(shù)據(jù)中的非結構化的文本信息轉換為文本特征向量,并通過關系數(shù)據(jù)庫的關鍵詞篩選手段對標繪數(shù)據(jù)進行深層次的清洗,實現(xiàn)了面向主題的標繪數(shù)據(jù)提取。最后基于K-means算法、核密度估計法和Apriori算法,將其運用于標繪數(shù)據(jù)熱點挖掘和時空關聯(lián)規(guī)則發(fā)現(xiàn),計算標繪數(shù)據(jù)在空間上的熱點分布區(qū)域,分析標繪數(shù)據(jù)蘊含的空間事件共現(xiàn)

4、等關聯(lián)模式。
  基于上述提出的標繪數(shù)據(jù)熱點挖掘與時空關聯(lián)規(guī)則發(fā)現(xiàn)方法,本文以新浪位置微博為例,獲取了我國五一、十一假期間旅游標繪數(shù)據(jù),運用熱點挖掘方法,分析了我國五一、十一假期間旅游熱點分布和熱力態(tài)勢情況,運用時空關聯(lián)規(guī)則挖掘方法,研究了旅游目的地與目的地之間的關聯(lián)規(guī)則,客源地與客源地之間的關聯(lián)規(guī)則以及旅游時間與旅游目的與客源地的空間關系之間的關聯(lián)規(guī)則。
  結果表明,標繪數(shù)據(jù)的時空屬性特征可應用于數(shù)據(jù)挖掘研究中,本文形成

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論