版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、淺析數(shù)據(jù)挖掘概念與技術(shù)淺析數(shù)據(jù)挖掘概念與技術(shù)摘要:隨著信息技術(shù)的迅速發(fā)展,數(shù)據(jù)庫的規(guī)模不斷擴大,而傳摘要:隨著信息技術(shù)的迅速發(fā)展,數(shù)據(jù)庫的規(guī)模不斷擴大,而傳統(tǒng)的查詢、報表工具無法滿足挖掘有效信息的需求,因此,需要一統(tǒng)的查詢、報表工具無法滿足挖掘有效信息的需求,因此,需要一種新的數(shù)據(jù)分析技術(shù)處理大量數(shù)據(jù),并從中抽取有價值的潛在知種新的數(shù)據(jù)分析技術(shù)處理大量數(shù)據(jù),并從中抽取有價值的潛在知識,即數(shù)據(jù)挖掘技術(shù)。本文深入淺出地闡述了數(shù)據(jù)挖掘技術(shù)的產(chǎn)
2、識,即數(shù)據(jù)挖掘技術(shù)。本文深入淺出地闡述了數(shù)據(jù)挖掘技術(shù)的產(chǎn)生,概念以及數(shù)據(jù)挖掘的常用技術(shù)。生,概念以及數(shù)據(jù)挖掘的常用技術(shù)。關鍵詞:數(shù)據(jù)庫關鍵詞:數(shù)據(jù)庫數(shù)據(jù)挖掘數(shù)據(jù)挖掘知識發(fā)現(xiàn)知識發(fā)現(xiàn)DMKDD一、一、數(shù)據(jù)挖掘技術(shù)概述數(shù)據(jù)挖掘技術(shù)概述隨著信息技術(shù)的迅速發(fā)展,數(shù)據(jù)庫的規(guī)模不斷擴大,從而產(chǎn)生隨著信息技術(shù)的迅速發(fā)展,數(shù)據(jù)庫的規(guī)模不斷擴大,從而產(chǎn)生了大量的數(shù)據(jù)。為了給決策者提供一個統(tǒng)一的全局視角,在許多領了大量的數(shù)據(jù)。為了給決策者提供一個統(tǒng)一的全局
3、視角,在許多領域建立了數(shù)據(jù)倉庫,但大量的數(shù)據(jù)往往使人們無法辨別隱藏在其中域建立了數(shù)據(jù)倉庫,但大量的數(shù)據(jù)往往使人們無法辨別隱藏在其中的能對決策提供支持的信息,而傳統(tǒng)的查詢、報表工具無法滿足挖的能對決策提供支持的信息,而傳統(tǒng)的查詢、報表工具無法滿足挖掘這些信息的需求。因此,需要一種新的數(shù)據(jù)分析技術(shù)處理大量數(shù)掘這些信息的需求。因此,需要一種新的數(shù)據(jù)分析技術(shù)處理大量數(shù)據(jù),并從中抽取有價值的潛在知識,數(shù)據(jù)挖掘(據(jù),并從中抽取有價值的潛在知識,數(shù)據(jù)
4、挖掘(DataMining)技)技術(shù)由此應運而生,數(shù)據(jù)挖掘技術(shù)也正是伴隨著數(shù)據(jù)倉庫技術(shù)的發(fā)展術(shù)由此應運而生,數(shù)據(jù)挖掘技術(shù)也正是伴隨著數(shù)據(jù)倉庫技術(shù)的發(fā)展而逐步完善起來的。但是并非所有的信息發(fā)現(xiàn)任務都被視為數(shù)據(jù)挖而逐步完善起來的。但是并非所有的信息發(fā)現(xiàn)任務都被視為數(shù)據(jù)挖掘,例如,使用數(shù)據(jù)庫管理系統(tǒng)查找個別的記錄,或通過因特網(wǎng)的掘,例如,使用數(shù)據(jù)庫管理系統(tǒng)查找個別的記錄,或通過因特網(wǎng)的搜索引擎查找特定的搜索引擎查找特定的Web頁面,則是信息檢
5、索(頁面,則是信息檢索(infmationretrieval)領域的任務。)領域的任務。數(shù)據(jù)挖掘是一個以數(shù)據(jù)庫、人工智能、數(shù)理統(tǒng)計、可視化四大數(shù)據(jù)挖掘是一個以數(shù)據(jù)庫、人工智能、數(shù)理統(tǒng)計、可視化四大支柱技術(shù)為基礎,我們知道,描述或說明一個算法設計分為三個部支柱技術(shù)為基礎,我們知道,描述或說明一個算法設計分為三個部分:輸入、輸出和處理過程。數(shù)據(jù)挖掘算法的輸入是數(shù)據(jù)庫,算法分:輸入、輸出和處理過程。數(shù)據(jù)挖掘算法的輸入是數(shù)據(jù)庫,算法規(guī)律的搜索。
6、傳統(tǒng)的查詢和報表處理只是得到事件發(fā)生的結(jié)果,并規(guī)律的搜索。傳統(tǒng)的查詢和報表處理只是得到事件發(fā)生的結(jié)果,并沒有深入研究發(fā)生的原因,而數(shù)據(jù)挖掘則主要了解發(fā)生的原因,并沒有深入研究發(fā)生的原因,而數(shù)據(jù)挖掘則主要了解發(fā)生的原因,并且以一定的置信度對未來進行預測,用來為決策行為提供有利的支且以一定的置信度對未來進行預測,用來為決策行為提供有利的支持。持。二、數(shù)據(jù)挖掘的常用技術(shù)二、數(shù)據(jù)挖掘的常用技術(shù)機器學習、數(shù)理統(tǒng)計等方法是數(shù)據(jù)挖掘進行知識學習的重要
7、方機器學習、數(shù)理統(tǒng)計等方法是數(shù)據(jù)挖掘進行知識學習的重要方法。數(shù)據(jù)挖掘算法的好壞將直接影響到所發(fā)現(xiàn)知識的好壞,目前對法。數(shù)據(jù)挖掘算法的好壞將直接影響到所發(fā)現(xiàn)知識的好壞,目前對數(shù)據(jù)挖掘的研究也主要集中在算法及其應用方面。統(tǒng)計方法應用于數(shù)據(jù)挖掘的研究也主要集中在算法及其應用方面。統(tǒng)計方法應用于數(shù)據(jù)挖掘主要是進行數(shù)據(jù)評估;機器學習是人工智能的另一個分數(shù)據(jù)挖掘主要是進行數(shù)據(jù)評估;機器學習是人工智能的另一個分支,也稱為歸納推理,它通過學習訓練數(shù)據(jù)集
8、,發(fā)現(xiàn)模型的參數(shù),支,也稱為歸納推理,它通過學習訓練數(shù)據(jù)集,發(fā)現(xiàn)模型的參數(shù),并找出數(shù)據(jù)中隱含的規(guī)則。其中關聯(lián)分析法、人工神經(jīng)元網(wǎng)絡、決并找出數(shù)據(jù)中隱含的規(guī)則。其中關聯(lián)分析法、人工神經(jīng)元網(wǎng)絡、決策樹和遺傳算法在數(shù)據(jù)挖掘中的應用很廣泛。策樹和遺傳算法在數(shù)據(jù)挖掘中的應用很廣泛。(一)關聯(lián)分析法。從關系數(shù)據(jù)庫中提取關聯(lián)規(guī)則是幾種主要(一)關聯(lián)分析法。從關系數(shù)據(jù)庫中提取關聯(lián)規(guī)則是幾種主要的數(shù)據(jù)挖掘方法之一。挖掘關聯(lián)是通過搜索系統(tǒng)中的所有事物,并的
9、數(shù)據(jù)挖掘方法之一。挖掘關聯(lián)是通過搜索系統(tǒng)中的所有事物,并從中找到出現(xiàn)條件概率較高的模式。關聯(lián)實際上就是數(shù)據(jù)對象之間從中找到出現(xiàn)條件概率較高的模式。關聯(lián)實際上就是數(shù)據(jù)對象之間相關性的確定,用關聯(lián)找出所有能將一組數(shù)據(jù)項和另一組數(shù)據(jù)項相相關性的確定,用關聯(lián)找出所有能將一組數(shù)據(jù)項和另一組數(shù)據(jù)項相聯(lián)系的規(guī)則,這種規(guī)則的建立并不是確定的關系,而是一個具有一聯(lián)系的規(guī)則,這種規(guī)則的建立并不是確定的關系,而是一個具有一定置信度的可能值,即事件發(fā)生的概率。
10、關聯(lián)分析法直觀、易理定置信度的可能值,即事件發(fā)生的概率。關聯(lián)分析法直觀、易理解,但對于關聯(lián)度不高或相關性復雜的情況不太有效。解,但對于關聯(lián)度不高或相關性復雜的情況不太有效。(二)人工神經(jīng)元網(wǎng)絡((二)人工神經(jīng)元網(wǎng)絡(ANN),是數(shù)據(jù)挖掘中應用最廣泛的,是數(shù)據(jù)挖掘中應用最廣泛的技術(shù)。神經(jīng)網(wǎng)絡的數(shù)據(jù)挖掘方法是通過模仿人的神經(jīng)系統(tǒng)來反復訓技術(shù)。神經(jīng)網(wǎng)絡的數(shù)據(jù)挖掘方法是通過模仿人的神經(jīng)系統(tǒng)來反復訓練學習數(shù)據(jù)集,從待分析的數(shù)據(jù)集中發(fā)現(xiàn)用于預測和分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 淺析數(shù)據(jù)挖掘概念及技術(shù)
- 1new多元統(tǒng)計分析實驗1 多元數(shù)據(jù)的假設檢驗
- 淺析計算機網(wǎng)絡信息安全及其防護對策1new
- 淺析web日志數(shù)據(jù)挖掘技術(shù)
- 數(shù)據(jù)挖掘概念與技術(shù)(第2版)習題答案
- 淺析計算機數(shù)據(jù)挖掘技術(shù)
- 數(shù)據(jù)挖掘基本概念
- 未成年人侵權(quán)責任之研究1new
- 中文系本科生學年論文的排版規(guī)范1new
- 數(shù)據(jù)挖掘概念與技術(shù)第三版部分習題答案
- 數(shù)據(jù)挖掘概念與技術(shù)第三版部分習題答案
- 數(shù)據(jù)挖掘理論與技術(shù)
- 數(shù)據(jù)挖掘與大數(shù)據(jù)技術(shù)應用
- 基于數(shù)據(jù)挖掘技術(shù)的機械產(chǎn)品概念設計研究.pdf
- chapter 6. classification and prediction 數(shù)據(jù)挖掘:概念與技術(shù)--ppt 英文版
- 淺析硬盤數(shù)據(jù)丟失如何恢復new
- 數(shù)據(jù)挖掘課件第3章關聯(lián)規(guī)則挖掘理論和算法(new)
- 數(shù)據(jù)挖掘中概念格關鍵技術(shù)應用研究.pdf
- 傳播效果與受眾研究期末論文——世博與數(shù)據(jù)挖掘new
- 基于概念格的數(shù)據(jù)挖掘的研究與實現(xiàn).pdf
評論
0/150
提交評論