版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、數(shù)據(jù)挖掘是一個年輕、活躍的研究領域,不同專業(yè)背景的研究者側重于不同方面對數(shù)據(jù)挖掘展開了研究。從目前國內外的研究現(xiàn)狀看,從事數(shù)據(jù)挖掘研究的主要是計算機領域的學者和專家,統(tǒng)計界的學者和專家對數(shù)據(jù)挖掘的研究相對較少。而隨著數(shù)據(jù)存儲技術的不斷發(fā)展,可用于數(shù)據(jù)分析的數(shù)據(jù)量越來越大,對傳統(tǒng)的統(tǒng)計分析技術提出了極大的挑戰(zhàn)。筆者認為數(shù)據(jù)挖掘的出現(xiàn),正是統(tǒng)計學適應這一變化的新的發(fā)展方向,數(shù)據(jù)挖掘并不是為了替代傳統(tǒng)的統(tǒng)計分析技術,而是統(tǒng)計分析方法的延伸和擴
2、展。本文從統(tǒng)計學視角研究數(shù)據(jù)挖掘,以期從統(tǒng)計學角度對數(shù)據(jù)挖掘理論的研究有所突破和創(chuàng)新,同時對統(tǒng)計學理論在數(shù)據(jù)挖掘方向的發(fā)展做出探索。 全文除了緒論,共分為七章。 第一章為:基于統(tǒng)計視角的數(shù)據(jù)挖掘理論體系研究。通過對數(shù)據(jù)挖掘與統(tǒng)計學理論基礎、方法等方面的比較,清晰地提出了基于統(tǒng)計視角的數(shù)據(jù)挖掘體系,改變了目前研究中人們對統(tǒng)計學與數(shù)據(jù)挖掘之間理解的模糊認識。 第二章為:數(shù)據(jù)挖掘統(tǒng)計方法綜述。首先對數(shù)據(jù)挖掘數(shù)據(jù)源、屬性
3、類型和功能三個基本問題作了界定,然后對實現(xiàn)其中的關聯(lián)、聚類、分類和回歸四項功能的統(tǒng)計方法進行綜述,并對其中一些統(tǒng)計方法從數(shù)據(jù)挖掘應用角度作了一些完善和改進。 第三章為:數(shù)據(jù)挖掘統(tǒng)計方法進一步研究。主要進行了特征描述統(tǒng)計方法研究和聚類挖掘距離函數(shù)和相似系數(shù)研究。在特征描述統(tǒng)計方法研究中,提出了在本文設計的可視化數(shù)據(jù)挖掘系統(tǒng)LaVaMiner中將把特征描述作為一個獨立的挖掘功能模塊來實現(xiàn)的思路,提出了特征描述過程模型,進而根據(jù)建立的
4、過程模型系統(tǒng)地研究了各個步驟可采用的統(tǒng)計方法。在聚類挖掘距離函數(shù)和相似系數(shù)研究中,系統(tǒng)地研究了各類屬性的距離函數(shù)和相似系數(shù),并分析了各個距離函數(shù)和相似系數(shù)的優(yōu)缺點或適用性。 第四章為:數(shù)據(jù)挖掘質量問題研究。從數(shù)據(jù)挖掘整個過程考慮把數(shù)據(jù)挖掘質量問題分為以下三類:源數(shù)據(jù)的質量問題、數(shù)據(jù)集成時的質量問題和數(shù)據(jù)分析時的質量問題,并針對不同問題從統(tǒng)計學的角度分別提出了相應有效的解決方法。 第五章為:可視化數(shù)據(jù)挖掘原型實現(xiàn)。首先從數(shù)
5、據(jù)挖掘原型的應用場景、使用對象、過程模型和模型表示四個方面研究了數(shù)據(jù)挖掘原型設計基礎,然后設計并部分實現(xiàn)了可視化數(shù)據(jù)挖掘原型系統(tǒng)LavaMiner,這是本文的另一項重要研究內容。該系統(tǒng)具有靈活的操作過程、便捷的擴展方式和全面的接口封裝三大特點。 第六章為:數(shù)據(jù)挖掘在實際數(shù)據(jù)庫上的應用示例。完成了數(shù)據(jù)挖掘在浙江省聯(lián)通炫鈴用戶實際數(shù)據(jù)庫中的應用示例,首先介紹了實驗數(shù)據(jù)庫,然后分不同時間段來實現(xiàn)最有價值客戶的挖掘,最后作了鈴音關聯(lián)挖掘
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于統(tǒng)計視角的數(shù)據(jù)挖掘應用研究.pdf
- 數(shù)據(jù)挖掘中的聚類方法及其應用——基于統(tǒng)計學視角的研究.pdf
- 基于數(shù)據(jù)挖掘的統(tǒng)計過程控制項目研究.pdf
- 基于統(tǒng)計密度的流數(shù)據(jù)頻繁模式挖掘.pdf
- 基于數(shù)據(jù)挖掘模式下的電力數(shù)據(jù)統(tǒng)計創(chuàng)新思考
- 數(shù)據(jù)挖掘的統(tǒng)計模型和算法的研究.pdf
- 基于數(shù)據(jù)挖掘技術下的衛(wèi)生統(tǒng)計信息工作研究
- 數(shù)據(jù)挖掘中的統(tǒng)計學
- 基于統(tǒng)計的數(shù)據(jù)挖掘技術在CRM系統(tǒng)中的應用研究.pdf
- 基于統(tǒng)計分析的微陣列數(shù)據(jù)挖掘技術.pdf
- 基于XBRL的數(shù)據(jù)挖掘研究.pdf
- 基于HADOOP的數(shù)據(jù)挖掘研究.pdf
- 基于XML的數(shù)據(jù)挖掘研究.pdf
- 基于數(shù)據(jù)挖掘的Web挖掘系統(tǒng)的研究.pdf
- 基于數(shù)據(jù)挖掘的CRM的研究.pdf
- 基于數(shù)據(jù)挖掘與關聯(lián)規(guī)則的月度統(tǒng)計線損計算.pdf
- 統(tǒng)計體制視角下的我國統(tǒng)計數(shù)據(jù)質量研究.pdf
- 基于數(shù)據(jù)挖掘的超市客戶消費數(shù)據(jù)研究.pdf
- 基于XML數(shù)據(jù)庫的數(shù)據(jù)挖掘研究.pdf
- 數(shù)據(jù)挖掘中的統(tǒng)計方法及其應用研究
評論
0/150
提交評論