版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、基于數據的機器學習一直是智能系統(tǒng)技術中的一個重要和極為活躍的研究方向和熱點,其內容主要為研究如何從觀測數據(樣本)中發(fā)現規(guī)律,利用獲得的規(guī)律對未來數據或無法觀測的數據進行預測。包括模式識別、函數擬合及概率密度估計等在內的現有的基于數據的機器學習方法共同的重要理論基礎之一就是統(tǒng)計學。傳統(tǒng)統(tǒng)計學研究的是樣本數目趨于無窮大時的漸近理論,現有的諸如神經網絡等機器學習方法也多是基于此假設。但對于大多數實際問題來說,樣本數目往往是有限的,因此一些在
2、理論上很優(yōu)秀的機器學習方法在實際應用中的表現卻可能不盡人意。 統(tǒng)計學習理論(Statisticallearningtheory,SLT)是一門研究小樣本情況下基于數據的機器學習理論的科學,其核心歸納原則為結構風險最小化(Structuralriskminimization,SRM)原則。支撐矢量機(Supportvectormachine,SVM)是統(tǒng)計學習理論中最實用、最年輕的部分,是基于結構風險最小化的普適而有效的統(tǒng)計學習理
3、論最具代表性的新型小樣本學習機,是結構風險最小化原則的具體實現。作為統(tǒng)計學習理論中最年輕、最具代表性的核心內容,SVM是機器學習領域研究與應用的熱點之一,仍處在不斷發(fā)展與豐富階段。 針對支撐矢量機面向實際應用的幾個關鍵問題,展開了相應的研究,主要內容包括下面四個方面:將模糊邏輯技術引入傳統(tǒng)的SVM中以加速傳統(tǒng)SVM的學習速度及提高其性能;提出了基于遺傳算法的SVM模型自動選擇方法;系統(tǒng)客觀地評價了幾種常用的SVM泛化性能指標;提
4、出了一種簡單高效的SVM泛化性能指標。主要工作可概括為如下五個創(chuàng)新點: (1)由于在多數支撐矢量機中采用全部數據進行優(yōu)化計算得到稀疏的支撐矢量,在優(yōu)化過程中不僅對支撐矢量進行優(yōu)化,也對非支撐矢量進行優(yōu)化,大大增加了不必要的計算。將模糊邏輯技術與傳統(tǒng)SVM相結合,提出了小樣本快速學習的模糊預選支撐矢量機(FuzzySVM,FSVM)。通過提出的模糊規(guī)則,利用近似SVM(ProximalSVM,PSVM)的快速性在原始數集上預選支撐
5、矢量,然后再利用標準SVM在訓練樣本數大大降低的預抽取的數集上獲得通常意義的稀疏的支撐矢量。不但提高了SVM的學習速度,同時保持其原有的較好的泛化能力。人造數據與Iris、Wine和Soy基準數集的實驗結果證明了所提方法的有效性。(2)針對現有的多類SVM有可能出現多個兩類分類器無法判別(即拒分)或一個數據屬于多類(即誤分)的情況,在研究支撐矢量機分類機理的基礎上,詳細分析了SVM多類分類問題中存在的誤分、拒分現象,結合模糊理論,提出了
6、更加簡單明確、易于計算的模糊隸屬度函數,給出拒分區(qū)域和誤分區(qū)域中的決策函數,提出了模糊多類支撐矢量機(Fuzzymulti-SVM,FMSVM)?;鶞蕯祿⑹謱戵w數據以及殘缺不全的高分辨窄脈沖雷達目標一維距離像的識別實驗結果驗證了所提出的FMSVM的有效性。 (3)正如大多數學習機算法,SVM中的模型選擇問題在解決過匹配和欠匹配的折衷問題上也是一個關鍵所在,特別是在小樣本學習中,內嵌超參數的SVM如果參數選擇不當,會導致系統(tǒng)性
7、能惡化。實際應用時,多采用試湊的實驗方法來確定SVM模型參數,不但帶有一定的隨機性而且不一定獲得最優(yōu)的模型參數,并且不斷的試湊又浪費大量寶貴的時間。鑒于此,針對困擾著SVM研究與實際應用的模型選擇這一尚待解決的公開問題,提出了基于實值遺傳算法(Real-codedgeneticalgorithm,RGA)的SVM模型自動選擇方法。Heart基準數集與二值遙感軍事目標的分類識別實驗證明了所提出的基于RGA的SVM模型自動選擇方法的高效性。
8、 (4)在基于RGA實現SVM模型自動選擇的基礎上,進一步提出了指數編碼實值遺傳算法(Exponentional-codedgeneticalgorithm,EGA)SVM模型自動選擇方法,使之對大數集與較大的搜索空間仍然有效。進而在很大的參數空間范圍內系統(tǒng)地比較了幾種常用的SVM模型選擇泛化性能指標。由于避免了人為確定模型參數對SVM性能的影響,從而使對這幾種泛化性能指標的比較評價更客觀準確。機器學習領域基準數集的實驗結果證明
9、了支撐矢量數界對一階軟間隔SVM來說,是一個比較理想的泛化性能指標。 (5)在上述工作的基礎上,提出了一種簡單高效的SVM泛化性能指標?;赟VM是對經驗風險和VC置信區(qū)間的一個折衷,將經驗風險與支撐矢量數界顯式結合,提出了一種新的高效SVM泛化性能指標。根據少數離群點對SVM的泛化性能貢獻不大甚至有負面的影響,且離群點的拉格朗日乘子都較大的特點,所提出的泛化性能指標僅計算拉格朗日乘子較小的一級支撐矢量,進一步提高了其計算效率。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 地圖掃描矢量化關鍵技術研究.pdf
- 面向公眾服務的矢量WebGIS關鍵技術研究.pdf
- HFC網絡交互業(yè)務支撐關鍵技術研究.pdf
- 隔水套管支撐井口平臺關鍵技術研究.pdf
- 矢量電子圖紙密級標識系統(tǒng)關鍵技術研究.pdf
- 起毛機CAD系統(tǒng)關鍵技術研究及其應用.pdf
- 63821.柵格地圖矢量化關鍵技術研究
- 家用炒菜機的關鍵技術研究.pdf
- CPM收發(fā)機的關鍵技術研究.pdf
- 轉載機監(jiān)控關鍵技術研究.pdf
- 主鏡液壓支撐系統(tǒng)關鍵技術研究.pdf
- 壓縮接收機的關鍵技術研究.pdf
- 睡眠呼吸機的關鍵技術研究.pdf
- 胎帶機布料臂架、上料及支撐系統(tǒng)關鍵技術研究.pdf
- 面向共享的矢量地理數據安全關鍵技術研究.pdf
- 基于HBase的矢量空間數據存取關鍵技術研究.pdf
- 聲矢量陣水下目標被動探測關鍵技術研究.pdf
- 氣象傳真圖矢量化關鍵技術研究.pdf
- 自動裝配線(機)設計的關鍵技術研究及應用.pdf
- 32774.gps接收機及其應用的關鍵技術研究
評論
0/150
提交評論