基于負(fù)頻繁項(xiàng)集的負(fù)關(guān)聯(lián)規(guī)則挖掘研究.pdf_第1頁
已閱讀1頁,還剩54頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、近年來,隨著微型機(jī)以及網(wǎng)絡(luò)的普及和數(shù)據(jù)存儲技術(shù)的發(fā)展,很多領(lǐng)域的數(shù)據(jù)庫中都可儲備了海量數(shù)據(jù),通過利用數(shù)據(jù)挖掘工具來分析和進(jìn)一步理解儲備的數(shù)據(jù),發(fā)現(xiàn)數(shù)據(jù)中后面的有用知識成為目前計(jì)算機(jī)領(lǐng)域中最為活躍的一個(gè)研究領(lǐng)域。顯然,位列其中的關(guān)聯(lián)規(guī)則挖掘是一個(gè)重要分支,具有相當(dāng)重要的價(jià)值和十分廣泛的領(lǐng)域應(yīng)用前景。
   關(guān)聯(lián)規(guī)則有正、負(fù)關(guān)聯(lián)規(guī)則。目前而言,正關(guān)聯(lián)規(guī)則研究已經(jīng)受到了研究人員相當(dāng)?shù)年P(guān)注,而對含負(fù)項(xiàng)的負(fù)規(guī)則的研究力度仍然不夠。然而,在

2、相當(dāng)多研究領(lǐng)域中,事物否定因素也可以用來作為重要信息來源有著相當(dāng)重要的作用,因此為了達(dá)到更客觀決策的目的,我們完全有必要對負(fù)屬性的關(guān)聯(lián)進(jìn)行研究。
   本文基于正關(guān)聯(lián)規(guī)則和對負(fù)關(guān)聯(lián)規(guī)則定義的修改,提出了關(guān)聯(lián)模式表達(dá)式的左端或者右端或者左右端含有正、負(fù)混合項(xiàng)關(guān)聯(lián)規(guī)則?,F(xiàn)有負(fù)關(guān)聯(lián)規(guī)則及算法數(shù)目不夠多,而且大都基于Apriori 思想的算法,需要對我們存儲的數(shù)據(jù)集進(jìn)行掃描多次,也會生成大量候選項(xiàng)集。本文提出了新方法,用來從正頻繁項(xiàng)集中

3、挖掘負(fù)頻繁項(xiàng)集的算法,即e-NFIS算法。為了得到正頻繁項(xiàng)集,我們借用FP_growth算法,利用這個(gè)算法中頻繁模式樹壓縮存儲數(shù)據(jù)結(jié)構(gòu),然后基于容斥原理的公式來計(jì)算挖掘出研究所需的含負(fù)項(xiàng)目的頻繁項(xiàng)集?;谠撍惴ǖ幕舅枷耄惴ň哂辛吮苊舛啻螔呙钄?shù)據(jù)庫和生成大量候選項(xiàng)集的優(yōu)點(diǎn)。在時(shí)間和空間的開銷上跟目前的大多數(shù)據(jù)挖掘算法相比都具有一定的優(yōu)勢。實(shí)驗(yàn)證明,算法具有很好的效率。
   另外,論文對現(xiàn)有的研究含正、負(fù)混合項(xiàng)的負(fù)關(guān)聯(lián)規(guī)則算法

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論