數(shù)據(jù)挖掘技術(shù)及應(yīng)用.pdf_第1頁
已閱讀1頁,還剩56頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、該文主要由以下四個部分組成:第一章,數(shù)據(jù)挖掘簡介.從數(shù)據(jù)挖掘的概念、功能、目的、主要方法以及數(shù)據(jù)挖掘步驟,發(fā)現(xiàn)統(tǒng)計學(xué)與數(shù)據(jù)挖掘有著密切的關(guān)系:統(tǒng)計學(xué)和數(shù)據(jù)挖掘有著共同的目標(biāo)即發(fā)現(xiàn)數(shù)據(jù)中的結(jié)構(gòu),但數(shù)據(jù)挖掘并不是統(tǒng)計學(xué)的分支,因為數(shù)據(jù)挖掘還應(yīng)用了其它領(lǐng)域的思想、工具和方法,尤其是計算機學(xué)科.數(shù)據(jù)挖掘的出現(xiàn)為統(tǒng)計學(xué)提供了一個嶄新的應(yīng)用領(lǐng)域,雖然統(tǒng)計學(xué)不可能給出數(shù)據(jù)挖掘所有問題的答案,但它可以為數(shù)據(jù)挖掘提供非常有參考價值的框架,能夠極大地豐富數(shù)

2、據(jù)挖掘的方法.第二章,數(shù)據(jù)預(yù)處理及數(shù)據(jù)庫的壓縮.數(shù)據(jù)的清理有三種方法:空缺值的填充、異常點分析以及不一致數(shù)據(jù)的處理.數(shù)據(jù)庫的壓縮方法有很多,在介紹了主成份分析、信息增益分析技術(shù)和屬性相關(guān)分析等進行維歸約之后,引入了粗糙集理論.粗糙集理論既可以用于壓縮數(shù)據(jù)庫,又可以對屬性的重要性程度進行測量及排序.第三章,數(shù)據(jù)挖掘的常用技術(shù).數(shù)據(jù)挖掘技術(shù)可分為描述型數(shù)據(jù)挖掘和預(yù)測型數(shù)據(jù)挖掘兩種,描述型數(shù)據(jù)挖掘包括數(shù)據(jù)總結(jié)、聚類及關(guān)聯(lián)分析等.預(yù)測型數(shù)據(jù)挖掘

3、包括分類、回歸及時間序列分析等.這里主要介紹了常用的技術(shù):決策樹和決策規(guī)則、關(guān)聯(lián)規(guī)則和聚類分析.第四章,數(shù)據(jù)挖掘技術(shù)的應(yīng)用.該文的應(yīng)用案例有兩個,數(shù)據(jù)挖掘在移動通信中的應(yīng)用以及對一份調(diào)查問卷的分析.針對移動通信客戶眾多,信息量大的特點,需要對手機用戶消費水平的數(shù)據(jù)庫進行壓縮,對壓縮后的新數(shù)據(jù)庫可以運用決策樹進行分類和關(guān)聯(lián)規(guī)則以期找出幾項費用與繳費總額之間的聯(lián)系.而在"大學(xué)生素質(zhì)培養(yǎng)的調(diào)查問卷"案例中,首先將24個影響一個人成長和發(fā)展的因

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論