不確定性時(shí)間序列的降維與相似性匹配研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩73頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、時(shí)間序列是按時(shí)間順序排列的實(shí)數(shù)序列,它反映了實(shí)體屬性在時(shí)間順序上的特征。時(shí)間序列的降維、相似性匹配及聚類(lèi)研究是數(shù)據(jù)挖掘領(lǐng)域的重要研究方面,在位置定位系統(tǒng)、環(huán)境監(jiān)測(cè)、物聯(lián)網(wǎng)等領(lǐng)域中有廣泛的應(yīng)用。并且隨著信息技術(shù)的發(fā)展和現(xiàn)實(shí)應(yīng)用需求的不斷擴(kuò)大,在無(wú)線傳感器網(wǎng)絡(luò)、無(wú)線射頻識(shí)別網(wǎng)絡(luò)、移動(dòng)對(duì)象跟蹤、氣象雷達(dá)網(wǎng)絡(luò)和隱私保護(hù)等應(yīng)用中逐漸涌現(xiàn)出一類(lèi)特殊的數(shù)據(jù),即不確定性數(shù)據(jù),不確定性時(shí)間序列是一條在每個(gè)時(shí)間點(diǎn)上有多個(gè)觀察值的序列。
  由于對(duì)時(shí)間

2、序列的研究主要集中在序列的降維、相似性匹配、存儲(chǔ)和索引方面,并未涉及時(shí)間序列相似的基本性質(zhì),為了彌補(bǔ)該領(lǐng)域的不足,對(duì)時(shí)間序列相似的交換性、傳遞性和分配性進(jìn)行研究,證明時(shí)間序列相似具有交換性,不具有傳遞性和分配性,為時(shí)間序列的相似性研究奠定了基礎(chǔ);隨后提出了序列最優(yōu)相似集合的概念,并且證明尋找時(shí)間序列的最優(yōu)相似集合是NP完全問(wèn)題,為時(shí)間序列在聚類(lèi)挖掘中尋找啟發(fā)式算法提供了理論依據(jù)。
  由于不確定時(shí)間序列的長(zhǎng)度很大,并且每個(gè)采樣點(diǎn)的

3、取值具有不確定性,導(dǎo)致了維度災(zāi)難和龐大的可能世界集,所以對(duì)不確定時(shí)間序列降維是實(shí)現(xiàn)對(duì)其方便存儲(chǔ)、快速查詢(xún)和相似性匹配的首要任務(wù)。不確定時(shí)間序列普遍采用小波變換的降維方法,但是該方法沒(méi)有考慮到采樣點(diǎn)之間的相關(guān)性,并且小波變換不能處理任意長(zhǎng)度的時(shí)間序列,為解決該問(wèn)題,提出基于概率統(tǒng)計(jì)和數(shù)據(jù)相關(guān)性的降維方法,該方法將不確定時(shí)間序列分為概率維度和時(shí)間維度,并分別對(duì)兩維度進(jìn)行降維。在時(shí)間維度,根據(jù)采樣點(diǎn)之間的相關(guān)性,使用某個(gè)采樣點(diǎn)代表后續(xù)相關(guān)度高

4、的采樣點(diǎn);在概率維度,使用大概率點(diǎn)表示相鄰的小概率點(diǎn),實(shí)驗(yàn)效果表明,使用該方法對(duì)不確定時(shí)間序列進(jìn)行降維后,降維序列可以保持原序列的變化趨勢(shì),壓縮程度顯著,并且可近似的恢復(fù)原序列。
  不確定時(shí)間序列固有的維度災(zāi)難和龐大的可能世界集問(wèn)題同樣給序列的相似性匹配和聚類(lèi)過(guò)程帶來(lái)巨大的困難,為解決該問(wèn)題,分別提出了基于桶分割和算術(shù)編碼的相似性匹配算法和基于趨勢(shì)的相似性匹配及聚類(lèi)算法,其中基于編碼的相似性匹配算法不僅可以將不確定時(shí)間序列規(guī)約為

5、一條確定的時(shí)間序列,并通過(guò)距離度量完成相似性匹配,而且可以通過(guò)規(guī)約后的確定時(shí)間序列近似的恢復(fù)原不確定時(shí)間序列;基于趨勢(shì)的相似性度量方法根據(jù)時(shí)間序列的整體變化趨勢(shì),將時(shí)間序列映射為短的趨勢(shì)符號(hào)序列,并利用一階連接性指數(shù)和塔尼莫特系數(shù)完成相似性度量;基于趨勢(shì)的聚類(lèi)方法通過(guò)定義趨勢(shì)高度,并對(duì)趨勢(shì)符號(hào)序列迭代進(jìn)行區(qū)間劃分和趨勢(shì)判斷,并以此構(gòu)建趨勢(shì)樹(shù),最后將趨勢(shì)樹(shù)根結(jié)點(diǎn)中趨勢(shì)符號(hào)相同的時(shí)間序列聚集為一類(lèi)。實(shí)驗(yàn)結(jié)果表明,基于編碼的相似性匹配算法不僅

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論