基于雙標(biāo)簽支持向量機的快速多標(biāo)簽分類算法.pdf_第1頁
已閱讀1頁,還剩52頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、分類問題是指通過對已知類別的樣本集的學(xué)習(xí),來預(yù)測未知類別樣本的問題。對于分類問題而言,根據(jù)樣本集合所擁有的標(biāo)簽數(shù),可分為兩類問題和多類問題;而按樣本所擁有的標(biāo)簽數(shù),可分為單標(biāo)簽分類問題和多標(biāo)簽分類問題。這里所說的多標(biāo)簽分類問題,是指一個樣本可以同時擁有多個標(biāo)簽或者一個樣本同時屬于多個類別。在實際生活中,多標(biāo)簽問題越來越多的得到人們的廣泛關(guān)注和認(rèn)可,例如,蛋白質(zhì)分類、文本分類和景觀分類等。目前,廣泛使用的處理多標(biāo)簽問題的方法有基于數(shù)據(jù)分解

2、的方法和基于單個優(yōu)化問題的方法。
   對于多標(biāo)簽分類問題,采用“一對一”的分解策略與支持向量機相結(jié)合的算法已經(jīng)逐漸成為一種行之有效的處理方法。但如何提高算法的訓(xùn)練和測試的效率卻仍然是一個富有挑戰(zhàn)性的課題。為了提高多標(biāo)簽分類算法的效率,本文推廣經(jīng)典兩類支持向量機提出了一種兩類雙標(biāo)簽支持向量機。在算法中,將同時擁有正類標(biāo)簽和負(fù)類標(biāo)簽的樣本看作為雙標(biāo)簽樣本,將雙標(biāo)簽樣本置于正類樣本和負(fù)類樣本的中間區(qū)域。我們采用投票策略集成子分類器設(shè)

3、計出快速多標(biāo)簽分類算法。本文中基于雙標(biāo)簽支持向量機的快速多標(biāo)簽分類算法通過用著名的SVMlight算法來實現(xiàn)。
   在算法的實驗部分,本文歸納了一些常用的多標(biāo)簽分類算法的評價準(zhǔn)則,并在四個基準(zhǔn)數(shù)據(jù)集酵母數(shù)據(jù)集、景觀數(shù)據(jù)集、情感數(shù)據(jù)集和基因數(shù)據(jù)集上來進行實驗,并通過與現(xiàn)存的一些多標(biāo)簽分類算法在分類性能上的比較得出,沒有一個多標(biāo)簽分類算法在所有的評價準(zhǔn)則上均保持最優(yōu),而我們的算法無論是在哪個基準(zhǔn)數(shù)據(jù)集上,總體上均居于前列,這說明我

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論