版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、在移動互聯(lián)網(wǎng)高速發(fā)展的今天,人類已經(jīng)不可避免地生活在了海量數(shù)據(jù)日積月累的年代,諸如社交網(wǎng)絡(luò)、證券交易以及氣象變化等領(lǐng)域每天都有千兆兆字節(jié)(Peta-Byte,PB)的數(shù)據(jù)注入我們的計算機網(wǎng)絡(luò)、萬維網(wǎng)和計算機存儲設(shè)備。面對洪流般的數(shù)據(jù),數(shù)據(jù)挖掘、機器學習和人工智能等學科蓬勃發(fā)展,這些工具幫助我們從海量數(shù)據(jù)中發(fā)現(xiàn)有價值的信息。其中,使用特定的學習模型根據(jù)已知數(shù)據(jù)來預測將來未知數(shù)據(jù)是目前研究的熱點,這使得我們可以使用預測的結(jié)果對事物做出更加正
2、確的決策。但是實踐中產(chǎn)生的大量數(shù)據(jù)通常具有不完整、冗余性、有噪聲等特性,如果不對數(shù)據(jù)進行預處理就直接使用模型方法進行處理,那么我們得到的結(jié)果肯定是受到一定損失的。以屬性選擇算法為代表的數(shù)據(jù)預處理則可以在一定程度上解決這一問題。通過屬性選擇,對數(shù)據(jù)的預測精度以及學習的效率都有諸多好處。
本文正是基于這一理論基礎(chǔ),將目前比較流行的支持向量機學習器和幾種屬性選擇算法結(jié)合起來,設(shè)計出一種預測數(shù)據(jù)的組合模型并得到了不錯的結(jié)果。本文具體工
3、作如下:(1)研究了常見的三種屬性選擇算法:鄰域粗糙集屬性選擇算法、基于灰度關(guān)聯(lián)分析的屬性選擇算法以及基于線性相關(guān)性分析的屬性選擇算法。使用屬性選擇方法將高維度數(shù)據(jù)中冗余的屬性、對決策結(jié)果影響極弱的屬性以及某些噪聲屬性刪除,這對后續(xù)分析處理大有益處。(2)研究了支持向量機學習模型。支持向量機基于自身完善的理論基礎(chǔ)能夠很好的解決小樣本情況下的非線性學習問題,并最終得到全局最優(yōu)解。但是當樣本數(shù)據(jù)量過大、樣本維度過高時,則會導致學習時間過長甚
4、至可能由于冗余數(shù)據(jù)產(chǎn)生過度擬合的情況,由此造成學習的精度和效率受到一定程度的折扣。(3)本文結(jié)合屬性選擇算法和支持向量機各自的優(yōu)點將兩者結(jié)合起來得到組合預測模型“屬性選擇-PSO-SVM”:分別將鄰域粗糙集、灰度關(guān)聯(lián)分析和線性相關(guān)分析這三種屬性選擇算法作為支持向量機學習模型的前端,首先將待處理的數(shù)據(jù)進行降維操作,然后將預處理得到的結(jié)果作為支持向量機學習模型的輸入并得到學習結(jié)果。(4)本文使用來自UCI機器學習數(shù)據(jù)庫的10組數(shù)據(jù)集對設(shè)計的
5、組合模型進行了驗證,實驗證明“屬性選擇-PSO-SVM”組合模型相比于單一的支持向量機學習模型,在預測精度和學習效率兩方面都有很大程度的改善。(5)本文通過實驗對鄰域粗糙集、灰度關(guān)聯(lián)分析和線性相關(guān)性分析三種屬性選擇算法做了分析比較。實驗證明:鄰域粗糙集屬性選擇算法對應的組合模型在預測精度方面具有最大程度的提高;線性相關(guān)性分析屬性選擇算法對應的組合模型對預測精度提高最小,但是該組合模型的整體學習時間卻是最少的;灰度關(guān)聯(lián)分析對應的組合模型對
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于支持向量機和模糊積分的組合預測研究.pdf
- 基于支持向量機的組合預測模型及其應用研究.pdf
- 支持向量機模型和算法研究.pdf
- 基于支持向量機的基因選擇算法研究.pdf
- 基于支持向量機的稅收預測模型研究
- 基于支持向量機的稅收預測模型研究.pdf
- 基于支持向量機和遺傳算法股市預測.pdf
- 支持向量機模型選擇研究.pdf
- 基于支持向量機的霧霾預測模型研究.pdf
- 支持向量機的模型選擇研究.pdf
- 基于支持向量機和遺傳算法的混凝土碳化預測研究.pdf
- 基于支持向量機和覆蓋算法的經(jīng)濟預警模型.pdf
- 支持向量機模型選擇方法研究.pdf
- 基于支持向量機的交通安全預測模型研究.pdf
- 基于lasso和支持向量機的組合預測及其在糧價預測中的應用.pdf
- 基于支持向量機的組合預測模型及其個人信用評價方法.pdf
- 基于支持向量機的廣義預測控制算法研究.pdf
- 孿生支持向量機模型選擇問題研究.pdf
- 基于支持向量機的特征選擇及其分類算法研究.pdf
- 基于支持向量回歸機模型的股市預測研究.pdf
評論
0/150
提交評論