版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、分類是數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)領(lǐng)域的一個(gè)熱點(diǎn)問題,傳統(tǒng)的分類問題主要關(guān)注數(shù)據(jù)分布平衡的情況,但是在實(shí)際應(yīng)用當(dāng)中數(shù)據(jù)不平衡的情況時(shí)有發(fā)生。數(shù)據(jù)的不平衡給分類直接或間接地帶來了很多困難,傳統(tǒng)的方法在對(duì)不平衡數(shù)據(jù)集進(jìn)行分類時(shí)往往變得不再適用。由于不平衡數(shù)據(jù)集分類問題的挑戰(zhàn)性和在現(xiàn)實(shí)中的廣泛應(yīng)用,吸引了越來越多的人對(duì)其進(jìn)行研究。目前對(duì)不平衡數(shù)據(jù)集分類的解決方法主要分三種:?jiǎn)栴}定義層的解決方法、數(shù)據(jù)層的解決方法和算法層的解決方法。
在對(duì)不平衡
2、數(shù)據(jù)集分類中的主要問題進(jìn)行分析后,該文介紹了兩種傳統(tǒng)的分類方法,即層次分類模型和數(shù)據(jù)引力模型,并分析了將它們用于不平衡數(shù)據(jù)集分類的可行性:將兩者結(jié)合可以同時(shí)降低類間不平衡和小析取項(xiàng)對(duì)分類影響。然后在此基礎(chǔ)上對(duì)兩者進(jìn)行了修改,提出了一種用于不平衡數(shù)據(jù)集分類的層次引力模型,即HDGC。本文的主要工作如下:
1.將層次分類模型和數(shù)據(jù)引力模型相結(jié)合,在吸納兩者優(yōu)點(diǎn)的同時(shí)使兩者彌補(bǔ)了彼此的不足,即層次分類模型精確分類能力的不足和數(shù)據(jù)引力
3、模型分類代價(jià)較高的問題。
2.改變了傳統(tǒng)層次分類模型中采用新生成樣本代替原始樣本的做法,將劃分后位于同一區(qū)域的樣本看作一個(gè)數(shù)據(jù)單元,根據(jù)數(shù)據(jù)單元距離邊界的遠(yuǎn)近對(duì)其進(jìn)行不同標(biāo)記,并使用標(biāo)記結(jié)果輔助分類。
3.采用了局部引力和全局引力相結(jié)合進(jìn)行分類的方法。局部引力只采用相鄰的訓(xùn)練樣本對(duì)測(cè)試樣本進(jìn)行分類,在有足夠信息的情況下提高了分類的效率,而使用全局引力則可以利用盡可能多的信息對(duì)難分樣本進(jìn)行分類。
為了驗(yàn)證HD
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 面向不平衡數(shù)據(jù)集的分類算法研究.pdf
- 不平衡數(shù)據(jù)集分類問題研究.pdf
- 不平衡數(shù)據(jù)集分類算法的研究.pdf
- 面向不平衡數(shù)據(jù)集分類的改進(jìn)k-近鄰法研究.pdf
- 面向流數(shù)據(jù)的不平衡樣本分類研究.pdf
- 基于不平衡數(shù)據(jù)集的數(shù)據(jù)挖掘分類算法研究.pdf
- 不平衡數(shù)據(jù)分類問題研究.pdf
- 面向不平衡數(shù)據(jù)集的對(duì)比模式挖掘算法研究
- 數(shù)據(jù)不平衡分類問題研究.pdf
- 基于不平衡數(shù)據(jù)集的文本分類技術(shù).pdf
- 面向不平衡數(shù)據(jù)集的對(duì)比模式挖掘算法研究.pdf
- 不平衡數(shù)據(jù)集分類的Random-SMOTE方法研究.pdf
- 面向不平衡數(shù)據(jù)的支持向量機(jī)分類方法研究.pdf
- 基于支持向量機(jī)的不平衡數(shù)據(jù)集分類算法研究.pdf
- 半監(jiān)督學(xué)習(xí)中不平衡數(shù)據(jù)集分類研究.pdf
- 半監(jiān)督不平衡數(shù)據(jù)的分類.pdf
- 不平衡數(shù)據(jù)的最優(yōu)分類閾值研究.pdf
- 面向不平衡樣本的Boosting分類算法研究.pdf
- 面向不平衡分類的邏輯回歸算法.pdf
- 基于不平衡數(shù)據(jù)的分類方法研究.pdf
評(píng)論
0/150
提交評(píng)論