版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、隨著信息技術(shù)和計算機技術(shù)的發(fā)展,數(shù)據(jù)的產(chǎn)生和收集方式越來越多,處理數(shù)據(jù)的能力越來越強,然而“數(shù)據(jù)豐富而知識缺乏”卻成為信息管理面對的一個窘境。數(shù)據(jù)挖掘能夠從海量數(shù)據(jù)中提取有用的信息,對海量的數(shù)據(jù)進行有效地管理和利用。
作為數(shù)據(jù)挖掘的重要應(yīng)用之一,關(guān)聯(lián)規(guī)則挖掘旨在從大量的、復(fù)雜的各類數(shù)據(jù)入手,將有意義的數(shù)據(jù)關(guān)聯(lián)和頻繁模式以一種簡單、直接的方式表達出來,協(xié)助用戶明確了解屬性之間聯(lián)系的緊密程度。實際數(shù)據(jù)庫中屬性值之間的層次差異較
2、大,形式概念分析中的概念格可以反映出數(shù)據(jù)屬性之間的多層、多元聯(lián)系,符合現(xiàn)實情況,成為提取關(guān)聯(lián)規(guī)則的有效方法。從大規(guī)模的形式背景中高效地構(gòu)造概念格并應(yīng)用到實踐中是目前研究的熱點問題。
本文沿著建立概念、查找關(guān)聯(lián)、分析變化這條主線,綜合地進行了基于概念格的關(guān)聯(lián)規(guī)則提取和變化研究,包含了對形式背景的概念層次的構(gòu)造、到概念格上的關(guān)聯(lián)規(guī)則提取、再到對提取出來的關(guān)聯(lián)規(guī)則的變化模式研究這三個步驟,并對每個步驟進行了詳細的設(shè)計和深入的研究
3、。
本文通過對概念格的主要構(gòu)造方法進行綜述,發(fā)現(xiàn)以往的分布式構(gòu)造方法在對形式背景進行拆分的過程中并沒有考慮到形式背景的數(shù)據(jù)分布特點。為了提高概念格的構(gòu)造效率,給出了基于屬性排序的形式背景的橫向和縱向兩種拆分策略,分析了拆分策略的適用范圍,并提出了基于稀疏度對子形式背景構(gòu)造概念格的方法。針對子概念格合并過程出現(xiàn)的五種情況,提出了相應(yīng)的處理策略。最后設(shè)計了基于稀疏度的分布式構(gòu)造概念格的算法,并通過實例和對比試驗證明了該算法的正
4、確性和有效性。
在對概念格進行關(guān)聯(lián)規(guī)則提取時,傳統(tǒng)方法都是由人工設(shè)置固定的最小支持度min_sup,然而對于數(shù)據(jù)項集分布差異比較大的情況下,使用單一的min_sup產(chǎn)生的規(guī)則并不一定獲得可信而適當?shù)年P(guān)聯(lián)規(guī)則。如何恰當?shù)卦O(shè)置min_sup是我們面對的另一個問題。本文提出了自適應(yīng)支持度的設(shè)置和修正,與傳統(tǒng)人工設(shè)置方面相比,提高了關(guān)聯(lián)規(guī)則的準確性。本文總結(jié)了從概念格中提取無冗余關(guān)聯(lián)規(guī)則的三種規(guī)則,并給出了NARMC算法,實例說明
5、該算法比Apriori算法更為有效和準確。
本文解決的第三個問題是變化數(shù)據(jù)的挖掘問題。在從概念格中提取出關(guān)聯(lián)規(guī)則之后,還需要對不同時期出現(xiàn)的關(guān)聯(lián)規(guī)則進行分析,發(fā)現(xiàn)變化的趨勢。本文以某醫(yī)療單位對老年居民健康查體的兩期數(shù)據(jù)為研究對象,通過對變化挖掘的理論研究,根據(jù)識別變化模式的三個參數(shù):相似度、意外度和規(guī)則匹配閾值來匹配關(guān)聯(lián)規(guī)則的變化模式。用相似度來判斷新興模式、增加模式和消退模式,用意外度來判斷條件意外模式和結(jié)果意外模式。本
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于概念格的關(guān)聯(lián)規(guī)則挖掘.pdf
- 基于概念格的關(guān)聯(lián)規(guī)則挖掘的研究.pdf
- 基于本體與概念格的關(guān)聯(lián)規(guī)則挖掘.pdf
- 基于概念格擴展模型的關(guān)聯(lián)規(guī)則挖掘.pdf
- 基于概念格的關(guān)聯(lián)規(guī)則挖掘方法的研究.pdf
- 基于概念格模型的關(guān)聯(lián)規(guī)則挖掘算法研究及實現(xiàn).pdf
- 基于概念格的關(guān)聯(lián)規(guī)則挖掘研究與實現(xiàn).pdf
- 基于量化概念格的關(guān)聯(lián)規(guī)則挖掘模型研究.pdf
- 基于概念格模型關(guān)聯(lián)規(guī)則挖掘的關(guān)鍵問題研究.pdf
- 基于粗集約簡構(gòu)造概念格的關(guān)聯(lián)規(guī)則挖掘.pdf
- 基于區(qū)別度概念格的關(guān)聯(lián)規(guī)則挖掘算法設(shè)計.pdf
- 基于粗糙集和概念格的關(guān)聯(lián)規(guī)則挖掘研究.pdf
- 基于概念格模型的分布式關(guān)聯(lián)規(guī)則挖掘研究.pdf
- 量化概念格關(guān)聯(lián)規(guī)則挖掘的主題地圖方法研究.pdf
- 基于粗糙集和概念格的數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則的研究.pdf
- 基于格論的關(guān)聯(lián)規(guī)則挖掘的研究.pdf
- 基于概念格的多值屬性關(guān)聯(lián)規(guī)則可視化挖掘.pdf
- 基于形式概念分析的關(guān)聯(lián)規(guī)則挖掘.pdf
- 基于量化規(guī)則格的關(guān)聯(lián)規(guī)則挖掘及其分布處理研究.pdf
- 基于概念格的序列模式挖掘研究.pdf
評論
0/150
提交評論