關(guān)聯(lián)規(guī)則相關(guān)技術(shù)研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩124頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、在數(shù)據(jù)挖掘技術(shù)發(fā)展繁榮的大背景下,關(guān)聯(lián)規(guī)則技術(shù)得到了蓬勃發(fā)展,并正朝更為廣泛而深入的方向繼續(xù)發(fā)展。關(guān)聯(lián)規(guī)則挖掘的目的是為了從大量數(shù)據(jù)中發(fā)現(xiàn)項(xiàng)之間有趣的關(guān)聯(lián)和相關(guān)關(guān)系,其應(yīng)用背景從開(kāi)始的狹義購(gòu)物籃分析擴(kuò)展到網(wǎng)站設(shè)計(jì)與優(yōu)化、網(wǎng)絡(luò)入侵檢測(cè)、關(guān)聯(lián)規(guī)則分類、交通事故模式分析、藥物成份關(guān)聯(lián)分析、蛋白質(zhì)結(jié)構(gòu)分析、軟件byg挖掘,設(shè)備故障診斷等等,其理論研究?jī)?nèi)容也從最初的頻繁模式挖掘擴(kuò)展到閉合模式挖掘、最大模式挖掘、擴(kuò)展型關(guān)聯(lián)規(guī)則、衍生型關(guān)聯(lián)規(guī)則、隱私

2、保護(hù)、增量挖掘、挖掘后處理、主觀興趣度度量、相關(guān)模式、數(shù)據(jù)流等多種類型數(shù)據(jù).卜的關(guān)聯(lián)規(guī)則挖掘等等。因此,有必要對(duì)關(guān)聯(lián)規(guī)則相關(guān)技術(shù)進(jìn)行比較深入的研究和探討。 本文針對(duì)現(xiàn)有關(guān)聯(lián)規(guī)則技術(shù)的一些不足,提出了相應(yīng)的解決方案,取得了一定的創(chuàng)新性成果。本文的主要研究工作包括以下幾個(gè)方面: (1)提出了一種新的相關(guān)性興趣度量A11-item-confidence,研究了該度鼉所具有的性質(zhì),如:合適的上下界,模式中任意一項(xiàng)的發(fā)生均可提高其

3、余項(xiàng)發(fā)生的可能性,良好的反單調(diào)性等。然后闡述了該度量與A11-set-confidence度量之間的關(guān)系,以及該度量的適用范圍。 (2)針對(duì)普通關(guān)聯(lián)規(guī)則在解決前后項(xiàng)集對(duì)稱型應(yīng)用問(wèn)題上的不足,提出了項(xiàng)項(xiàng)正相關(guān)關(guān)聯(lián)規(guī)則挖掘問(wèn)題。首先采用A11-confidence關(guān)聯(lián)興趣度度量和All-item-confidence相關(guān)興趣度度量挖掘關(guān)聯(lián)且項(xiàng)項(xiàng)正相關(guān)頻繁模式,然后進(jìn)一步得到項(xiàng)項(xiàng)止相關(guān)關(guān)聯(lián)規(guī)則。給出了項(xiàng)項(xiàng)正相關(guān)關(guān)聯(lián)規(guī)則挖掘問(wèn)題相關(guān)定義

4、、描述和實(shí)例,提出了兩種挖掘算法:ItomCoMine.AP和ItemCoMinc cT算法。并對(duì)算法性能、相關(guān)度量減枝效果、實(shí)際應(yīng)用效果進(jìn)行了測(cè)試。 (3)針對(duì)普通關(guān)聯(lián)規(guī)則在解決前后項(xiàng)集非對(duì)稱型應(yīng)用問(wèn)題上的不足,進(jìn)一步提出了項(xiàng)項(xiàng)且項(xiàng)集正相關(guān)關(guān)聯(lián)規(guī)則挖掘問(wèn)題。在得到關(guān)聯(lián)且項(xiàng)項(xiàng)正相關(guān)頻繁模式后,采用項(xiàng)集相關(guān)性度量對(duì)關(guān)聯(lián)規(guī)則進(jìn)行減枝,從而得到項(xiàng)項(xiàng)且項(xiàng)集正相關(guān)關(guān)聯(lián)規(guī)則。給出了項(xiàng)項(xiàng)且項(xiàng)集正相關(guān)關(guān)聯(lián)規(guī)則挖掘相關(guān)定義、描述和實(shí)飼,進(jìn)一步提出

5、了相應(yīng)的挖掘算法:l&lSCoMine AP和I&ISCoMino CT算法,測(cè)試了算法的性能、項(xiàng)集相關(guān)性度量的減技效果,以及在實(shí)際零售數(shù)據(jù)集中的應(yīng)用效果。 (4)對(duì)動(dòng)態(tài)關(guān)聯(lián)規(guī)則技術(shù)進(jìn)行了相應(yīng)的研究,提出了動(dòng)態(tài)關(guān)聯(lián)規(guī)則新定義,進(jìn)一步闡述了兩種動(dòng)態(tài)關(guān)聯(lián)規(guī)則挖掘新算法:改進(jìn)的兩階段挖掘ITS算法和基于擴(kuò)展FP樹(shù)的EFP-Crowth算法,并對(duì)算法性能進(jìn)行了評(píng)測(cè)。 (5)提出了挖掘帶使用信息的動(dòng)態(tài)關(guān)聯(lián)規(guī)則(DAR-C)新問(wèn)題,給出了D

6、ARC規(guī)則的候選有效時(shí)段的表示方法,并對(duì)DAR-C規(guī)則進(jìn)行了定義;然后進(jìn)一步提出了相應(yīng)的挖掘算法:ITS2和EFP-Growth2算法,實(shí)驗(yàn)驗(yàn)證了算法的有效性和可伸縮性,應(yīng)用實(shí)例表明DAR-C規(guī)則應(yīng)用的可行性。DAR-C規(guī)則對(duì)于具有動(dòng)態(tài)和數(shù)據(jù)分布歪斜性質(zhì)的數(shù)據(jù)庫(kù),有較好的指示作用。 (6)在帶有模糊分類結(jié)構(gòu)的層次型模糊關(guān)聯(lián)規(guī)則基礎(chǔ)上,引入了加權(quán)擴(kuò)展,提出了一種布爾型數(shù)據(jù)庫(kù)中的加權(quán)模糊層次型關(guān)聯(lián)規(guī)則(WGF-AR】模型。采用概化權(quán)

7、重來(lái)描述不同葉子結(jié)點(diǎn)得到的卜層概念項(xiàng)目的權(quán)重,建立事務(wù)塒項(xiàng)集的支持度度量,從而提出相應(yīng)的規(guī)則加權(quán)支持度度量和加權(quán)置信度度量。證明WGF-AR模型中,加權(quán)向下閉包性質(zhì)成立,提出相應(yīng)的WGF-AR挖掘W-Apicri算法。 (7)提出了基十模糊分類結(jié)構(gòu)的關(guān)聯(lián)規(guī)則聚類新方法。首先闡述模糊分類結(jié)構(gòu)中多個(gè)有向無(wú)環(huán)圖的合并方法,以及構(gòu)建帶語(yǔ)義差別信息的模糊分類結(jié)構(gòu)的方法;進(jìn)一步提出基于模糊分類結(jié)構(gòu)的項(xiàng)間距離、項(xiàng)集問(wèn)距離、關(guān)聯(lián)規(guī)則距離計(jì)算方法

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論