可適應(yīng)不良數(shù)據(jù)的數(shù)據(jù)分類若干方法研究.pdf_第1頁
已閱讀1頁,還剩118頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、在對數(shù)據(jù)進(jìn)行分類時(shí),數(shù)據(jù)本身所具有的某些不良特點(diǎn),如噪聲影響、簇間密度變差顯著、類間不平衡和特征維方差各不相同等問題都會(huì)影響分類效果。因此,研究適應(yīng)不良數(shù)據(jù)特點(diǎn)的分類算法,具有重要的理論和應(yīng)用價(jià)值。目前,雖然有DBSCAN,Trimmed k-means等算法也能處理一些不良特點(diǎn)的數(shù)據(jù),但是渴求一種通用的處理所有不良類型數(shù)據(jù)的分類算法是不現(xiàn)實(shí)的,根據(jù)數(shù)據(jù)的特點(diǎn)研究一些有針對性的抗干擾算法逐漸形成一種共識。
  本文受分子動(dòng)力學(xué)原理

2、的啟發(fā),在數(shù)據(jù)點(diǎn)之間引入引力和斥力的相互作用機(jī)制,并結(jié)合數(shù)據(jù)點(diǎn)在原始特征空間和迭代空間的距離、簇密度差和近鄰性等信息,提出了仿分子動(dòng)力學(xué)數(shù)據(jù)聚類法;同樣考慮近鄰性和特征維方差等因素提出了橢球-平面分類法,并改進(jìn)了基于核密度估計(jì)的數(shù)據(jù)分類算法。新的聚類方法除是對帶噪聲、簇間密度變差明顯的數(shù)據(jù)具有好的適應(yīng)力外,不需要預(yù)先設(shè)置簇個(gè)數(shù),可自動(dòng)發(fā)現(xiàn)數(shù)據(jù)中可能包含的簇,并解決了引力模型中的黑洞問題。
  基于核密度估計(jì)的數(shù)據(jù)分類法是實(shí)際應(yīng)用中

3、的常見分類法,它在處理不平衡類時(shí)可能出現(xiàn)諸如少數(shù)類的數(shù)據(jù)點(diǎn)錯(cuò)分到多數(shù)類的問題。為了使該方法可處理不平衡類帶來的影響,并在不平衡類問題嚴(yán)重時(shí)也能發(fā)揮好的效果,本文對其進(jìn)行了改進(jìn),在基于核密度估計(jì)的數(shù)據(jù)分類法中引入具有較小搜索區(qū)間的平滑因子,增強(qiáng)了其對不平衡類的適應(yīng)力。實(shí)驗(yàn)表明這種改進(jìn)是有效的,它提高了原方法對不平衡類的適應(yīng)力。
  事實(shí)上,像基于核密度估計(jì)一類的分類方法在預(yù)測階段由于可能涉及整個(gè)樣本集的計(jì)算,當(dāng)數(shù)據(jù)集規(guī)模較大時(shí)其預(yù)測

4、開銷可能會(huì)很大。為了達(dá)到減小預(yù)測開銷,同時(shí)又使模型兼?zhèn)浒瑪?shù)據(jù)在特征維上方差信息的特點(diǎn),本文提出了一種新的橢球-平面分類法,它是一個(gè)兩階段的監(jiān)督型分類方法。該方法利用橢球面和平面分類參考面進(jìn)行分類,由于分類時(shí)待測點(diǎn)只需與相應(yīng)的參考面進(jìn)行計(jì)算,使其時(shí)間開銷小于基于距離的 k最近鄰點(diǎn)方法和基于核密度估計(jì)一類的方法,并且強(qiáng)化了鄰近性原則。
  以上算法除理論分析外,基于標(biāo)準(zhǔn)數(shù)據(jù)集都與其他現(xiàn)有方法進(jìn)行了對比試驗(yàn),確認(rèn)了理論推導(dǎo)的正確性,為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論