聚類算法在時間序列中的研究與應(yīng)用.pdf_第1頁
已閱讀1頁,還剩67頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、時間序列數(shù)據(jù)是普遍存在的,對時間序列進(jìn)行聚類分析的研究可以獲得大量時間序列數(shù)據(jù)中隱藏的與時間有關(guān)的有價值的信息,達(dá)到知識的獲取,進(jìn)而進(jìn)行在知識指導(dǎo)下的活動。但是,實(shí)際生活中時間序列數(shù)據(jù)量非常大,因此,在時間序列聚類分析之前需要對其進(jìn)行維度約減。
   本文的主要工作為:
   (1)給出了一種帶權(quán)值的矩陣相似性度量方法。多元時間序列用奇異值分解方法獲得特征矩陣和奇異值向量,分別作為矩陣和權(quán)值。哈達(dá)瑪變換后的特征矩陣和其相

2、關(guān)系數(shù)矩陣的特征值分別作為矩陣和權(quán)值。
   (2)給出了一種基于EMD和SVD的多元時間序列聚類分析方法。對原始數(shù)據(jù)進(jìn)行補(bǔ)缺值以及規(guī)范化后,先利用EMD實(shí)現(xiàn)多元時間序列的趨勢提取,對序列進(jìn)行平滑處理,然后利用SVD進(jìn)行多元時間序列長度降維,最后對原多元時間序列的特征矩陣和相應(yīng)的權(quán)值進(jìn)行改進(jìn)的K-means算法聚類分析。
   (3)給出了一種基于哈達(dá)瑪變換的多元時間序列聚類分析方法。對原始數(shù)據(jù)進(jìn)行補(bǔ)缺值以及規(guī)范化后,先

3、利用哈達(dá)瑪變換實(shí)現(xiàn)多元時間序列的降維,同時利用小波變換也進(jìn)行序列降維。然后求出不同長度的特征矩陣所對應(yīng)的權(quán)值,最后對于預(yù)處理后的數(shù)據(jù)進(jìn)行改進(jìn)的K-means算法聚類分析。
   本文主要介紹了基于EMD和SVD的多元時間序列聚類方法和基于哈達(dá)瑪變換的多元時間序列聚類方法。這兩種方法各有其優(yōu)點(diǎn):第一種方法,首先,對時間序列進(jìn)行EMD分解,提取時間序列的趨勢。由于EMD可對時間序列中的噪音進(jìn)行過濾,產(chǎn)生的趨勢序列能夠準(zhǔn)確反映原序列的

4、趨勢走向,使得序列可以變得更加清晰,而信息丟失相對較少,所以在趨勢序列的基礎(chǔ)上進(jìn)行降維,進(jìn)而提高聚類效果。其次,對趨勢序列進(jìn)行SVD分解,可以將長度不同的序列統(tǒng)一到同一尺度。通常情況下時間序列大都不等長,通過SVD特征提取后序列特征的維數(shù)只與參數(shù)有關(guān),而與序列的長度無關(guān)。這使得不等長的序列的聚類成為可能;第二種方法,首先,通過哈達(dá)瑪變換進(jìn)行序列降維。因?yàn)楣_(dá)瑪變換后序列數(shù)據(jù)能量集中性比較高,它可以用很短的數(shù)據(jù)表示原始序列且保持原始序列的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論