面向不平衡數(shù)據(jù)的支持向量機(jī)分類(lèi)方法研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩124頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、支持向量機(jī)是一種建立在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上的機(jī)器學(xué)習(xí)方法,同神經(jīng)網(wǎng)絡(luò)等傳統(tǒng)方法相比,能夠較好地解決高維數(shù)、非線性、局部極小等實(shí)際問(wèn)題,已成為機(jī)器學(xué)習(xí)領(lǐng)域的研究熱點(diǎn)。支持向量機(jī)具有堅(jiān)實(shí)的理論基礎(chǔ),即使在樣本數(shù)量較少的情況下依然能夠獲得良好的應(yīng)用效果,比較適合解決故障診斷等典型的小樣本學(xué)習(xí)問(wèn)題。因此,將支持向量機(jī)應(yīng)用于故障診斷具有重要的理論意義和工程實(shí)用價(jià)值。
  通常情況下,支持向量機(jī)在診斷數(shù)據(jù)集呈現(xiàn)平衡分布時(shí)能夠取得良好的診斷效果。

2、然而在實(shí)際應(yīng)用中由于故障數(shù)據(jù)難以獲得,診斷數(shù)據(jù)集常表現(xiàn)為嚴(yán)重的不平衡特性。研究表明,支持向量機(jī)在樣本數(shù)量不平衡情況下分類(lèi)效果不佳。因此本文針對(duì)支持向量機(jī)在不平衡數(shù)據(jù)集上分類(lèi)準(zhǔn)確率降低的問(wèn)題展開(kāi)研究,重點(diǎn)研究基于數(shù)據(jù)預(yù)處理的不平衡數(shù)據(jù)分類(lèi)方法和基于支持向量機(jī)算法改進(jìn)的不平衡數(shù)據(jù)分類(lèi)方法,并將其應(yīng)用于模擬電路故障診斷中,解決了實(shí)際過(guò)程中由于訓(xùn)練數(shù)據(jù)嚴(yán)重不平衡造成的分類(lèi)準(zhǔn)確率下降的問(wèn)題,提高了支持向量機(jī)方法的適用范圍。
  論文的主要研

3、究工作包括以下幾方面的內(nèi)容:
  1.原始 SMOTE方法在產(chǎn)生新的少類(lèi)合成樣本的過(guò)程中,沒(méi)有考慮少類(lèi)樣本真實(shí)的分布特性,也沒(méi)有考慮少類(lèi)樣本附近多類(lèi)樣本的分布情況,存在一定的盲目性。針對(duì)該問(wèn)題本文提出了一種改進(jìn)的 SMOTE方法——自適應(yīng) SMOTE。該方法根據(jù)數(shù)據(jù)集內(nèi)部樣本分布特性,自適應(yīng)地調(diào)整原始過(guò)采樣方法中近鄰選擇策略,控制合成樣本的質(zhì)量。仿真實(shí)驗(yàn)表明,采用該方法對(duì)數(shù)據(jù)集進(jìn)行預(yù)處理能夠有效提高支持向量機(jī)分類(lèi)方法的分類(lèi)性能。<

4、br>  2.單邊采樣技術(shù)等傳統(tǒng)樣本集修剪方法在處理邊界樣本的過(guò)程中簡(jiǎn)單地將邊界樣本從樣本集中刪除,造成分類(lèi)信息的部分丟失。針對(duì)該問(wèn)題本文提出了一種基于 K-近鄰方法的模糊樣本集修剪技術(shù);針對(duì)傳統(tǒng)隨機(jī)欠采樣方法中存在的分類(lèi)信息丟失嚴(yán)重的問(wèn)題,提出了一種基于非監(jiān)督學(xué)習(xí)方法的指導(dǎo)型欠采樣技術(shù)。使用以上兩種方法對(duì)數(shù)據(jù)集中多類(lèi)樣本進(jìn)行欠采樣處理,能夠有效緩解樣本集不平衡對(duì)支持向量機(jī)分類(lèi)方法造成的不良影響。
  3.在SVM算法改進(jìn)方面,本

5、文首先詳細(xì)分析了支持向量機(jī)在不平衡數(shù)據(jù)集上針對(duì)少類(lèi)樣本分類(lèi)準(zhǔn)確率較低的本質(zhì)原因,并以此為基礎(chǔ)提出了一種改進(jìn)的支持向量機(jī)方法——μSVM。這種方法通過(guò)引入新參數(shù)μ調(diào)整分類(lèi)決策函數(shù)中的距離度量準(zhǔn)則,使分類(lèi)超平面向多類(lèi)樣本傾斜,增大少類(lèi)樣本的決策空間,提高了少類(lèi)樣本的分類(lèi)準(zhǔn)確率。
  4.支持向量機(jī)的理論基礎(chǔ)是使用非線性映射將樣本映射到高維特征空間使其線性可分,然而在實(shí)際應(yīng)用過(guò)程中常常難以獲得高維空間中具體的映射關(guān)系,對(duì)高維特征空間的幾

6、何結(jié)構(gòu)缺乏本質(zhì)的認(rèn)識(shí),因此難以在特征空間中對(duì)支持向量機(jī)進(jìn)行有效的改進(jìn)來(lái)處理不平衡數(shù)據(jù)分類(lèi)問(wèn)題。針對(duì)這一問(wèn)題,提出了一種新型支持向量機(jī)改進(jìn)方法——BEF-SVM。該方法使用偏置判別分析準(zhǔn)則作為核優(yōu)化的目標(biāo)函數(shù),在經(jīng)驗(yàn)特征空間中增大不平衡數(shù)據(jù)集的類(lèi)可分性,從而獲得最佳的整體分類(lèi)準(zhǔn)確率。
  5.在電路故障診斷應(yīng)用研究方面,以?xún)蓚€(gè)典型電路作為診斷對(duì)象,在PSPICE軟件環(huán)境下進(jìn)行仿真,產(chǎn)生電路的輸出波形,并使用Haar小波變換等數(shù)據(jù)預(yù)處

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論