多尺度關(guān)聯(lián)規(guī)則挖掘方法.pdf_第1頁
已閱讀1頁,還剩83頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘領(lǐng)域的重要組成部分,旨在發(fā)掘數(shù)據(jù)背后隱藏的、潛在的、頻現(xiàn)的相關(guān)關(guān)系與模式。多尺度科學(xué)是一個(gè)新興的科研領(lǐng)域,核心是剖析研究客體多層次、多尺度的構(gòu)成特點(diǎn),以及多尺度表現(xiàn)形式背后的原因和各個(gè)表現(xiàn)尺度之間更深層的關(guān)系。多尺度理論已被引入到空間數(shù)據(jù)挖掘中,針對(duì)空間數(shù)據(jù)的多尺度特性進(jìn)行了初步的研究。論文將多尺度理論引入數(shù)據(jù)挖掘領(lǐng)域,并將其拓展到更為廣泛的數(shù)據(jù)類型中,以關(guān)聯(lián)規(guī)則挖掘?yàn)榍腥朦c(diǎn),研究更為普適的多尺度數(shù)據(jù)理論與多尺度數(shù)

2、據(jù)挖掘方法。圍繞多尺度科學(xué)的研究核心,研究以相關(guān)概念為主體的多尺度數(shù)據(jù)理論,給出了多尺度數(shù)據(jù)挖掘指導(dǎo)框架,并在理論和方法框架的基礎(chǔ)上,提出了多尺度關(guān)聯(lián)規(guī)則的尺度上推和尺度下推挖掘算法,實(shí)現(xiàn)了關(guān)聯(lián)規(guī)則的多尺度挖掘,為用戶的多尺度決策提供了理論與方法的支持。
  本文以多尺度關(guān)聯(lián)規(guī)則挖掘?yàn)檠芯亢诵?,主要完成了下述幾方面工?
  1)研究多尺度數(shù)據(jù)挖掘理論。
  針對(duì)目前多尺度數(shù)據(jù)挖掘領(lǐng)域缺少體系完整、普適的理論基礎(chǔ)這一問

3、題,從數(shù)據(jù)的多尺度,多尺度數(shù)據(jù)挖掘和多尺度數(shù)據(jù)挖掘過程框架三個(gè)方面研究了多尺度數(shù)據(jù)挖掘理論。首先,基于概念分層的思想提出了數(shù)據(jù)尺度劃分、數(shù)據(jù)尺度和元尺度數(shù)據(jù)集的概念,據(jù)此引申出多尺度數(shù)據(jù)集間祖孫、父子、兄弟、上下層等關(guān)系,初步形成了數(shù)據(jù)多尺度的概念體系;其次,給出多尺度數(shù)據(jù)挖掘的定義,將知識(shí)的多尺度轉(zhuǎn)換作為多尺度數(shù)據(jù)挖掘的核心,根據(jù)廣義的尺度轉(zhuǎn)換分類,將多尺度數(shù)據(jù)挖掘算法分為尺度上推挖掘算法和尺度下推挖掘算法,確定了多尺度數(shù)據(jù)挖掘的本質(zhì)

4、和方向;最后,分階段構(gòu)建了多尺度數(shù)據(jù)挖掘過程框架,用來指導(dǎo)和規(guī)范多尺度數(shù)據(jù)挖掘過程。
  2)提出尺度上推關(guān)聯(lián)規(guī)則挖掘算法。
  針對(duì)目前尚無明確的多尺度數(shù)據(jù)挖掘算法問題,從關(guān)聯(lián)規(guī)則挖掘入手,以多尺度轉(zhuǎn)換為核心,基于采樣理論和Jaccard相似性系數(shù)提出了尺度上推關(guān)聯(lián)規(guī)則挖掘算法SU-ARMA(Scaling-Up Association Rules Mining Algorithm),算法實(shí)現(xiàn)了多尺度數(shù)據(jù)間知識(shí)的向上推導(dǎo)。

5、
  3)提出尺度下推關(guān)聯(lián)規(guī)則挖掘算法。
  同樣針對(duì)關(guān)聯(lián)規(guī)則挖掘,并以尺度轉(zhuǎn)換為核心,基于插值法中的距離倒數(shù)加權(quán)法提出了尺度下推關(guān)聯(lián)規(guī)則挖掘算法SD-ARMA(Scaling-Down Association Rules MiningAlgorithm),算法實(shí)現(xiàn)了多尺度數(shù)據(jù)間知識(shí)的向下推導(dǎo)。并利用相關(guān)統(tǒng)計(jì)學(xué)原理和機(jī)器學(xué)習(xí)理論對(duì)SU-ARMA和SD-ARMA算法錯(cuò)誤率的置信區(qū)間給出了推導(dǎo)和證明;分析了兩算法較傳統(tǒng)關(guān)聯(lián)規(guī)則挖

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論