2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩5頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、<p>  企業(yè)管理二分類問題研究綜述</p><p>  摘要:通過梳理企業(yè)管理領(lǐng)域的二分類問題,發(fā)現(xiàn)二分類支持向量機廣泛應用于客戶流失預測、上市公司財務困境預警和信用風險評估。并且為了提高預測精度,學者不斷改進該模型:為適應具體數(shù)據(jù)特征,如數(shù)據(jù)存在外點或噪聲點、非平衡性、重疊性、錯分代價差異性等,相應引入模糊、加權(quán)、雙隸屬支持向量機以及代價敏感性學習機制等。 </p><p>

2、;  關(guān)鍵詞:二分類支持向量機(SVM) 企業(yè)管理 綜述 </p><p><b>  1 概述 </b></p><p>  當前,企業(yè)管理領(lǐng)域中的客戶流失預測、公司財務困境預警、信用風險評估已成為學術(shù)界和業(yè)界關(guān)注的焦點,能否科學合理的對其進行預測,關(guān)乎企業(yè)生存和發(fā)展。利用客戶靜態(tài)屬性數(shù)據(jù),預測客戶是否流失;利用公司財務、經(jīng)營情況,預測上市公司是“財務狀況正?!被颉?/p>

3、財務狀況異?!?;利用借款人財務、非財務狀況,預測其信用狀況是“正?!被颉斑`約”。雖然上述3領(lǐng)域研究方向差異性大,但研究使用方法相似,因此將上述3領(lǐng)域研究統(tǒng)稱為經(jīng)濟與管理科學領(lǐng)域二分類問題研究,簡稱二分類問題研究。 </p><p>  以上二分類問題研究利用判別分析,取得了相對準確的理論結(jié)果,但該方法需要很強的假設和限制條件,而這些條件在實際分析中通常得不到滿足。近年來,隨著人工智能學科的發(fā)展,學者引入神經(jīng)網(wǎng)絡,

4、并取得了優(yōu)于判別分析法的結(jié)果。但神經(jīng)網(wǎng)絡很可能陷入局部最優(yōu),無法得到全局最優(yōu),同時它是基于經(jīng)驗風險最小化原理,經(jīng)常出現(xiàn)“過擬合”現(xiàn)象。1995年Vapnik提出支持向量機模型(Support Vector Machine,SVM),一種基于結(jié)構(gòu)風險最小化的算法。之后學者將SVM進入上述二分類問題研究,發(fā)現(xiàn)其泛化能力、預測精度都高于判別分析、神經(jīng)網(wǎng)絡。 </p><p>  近年來,為提高二分類問題研究中SVM預測

5、精度,學者不斷探索如何改進二分類SVM,有效降低樣本數(shù)據(jù)外點或噪聲點、非平衡性、重疊性及錯分代價差異性的影響。 </p><p>  本文結(jié)構(gòu)安排如下:第一部分是引言,第二部分是考慮樣本特征的改進支持向量機,第三部分是結(jié)論與展望。 </p><p>  2 改進支持向量機 </p><p>  隨著人工智能領(lǐng)域的快速發(fā)展,學者將傳統(tǒng)支持向量機(C-SVM)引入二分類

6、問題研究:Min和Lee將C-SVM引入上市公司財務困境預測,夏國恩等將C-SVM引入客戶流失預測,發(fā)現(xiàn)C-SVM優(yōu)于傳統(tǒng)判別分析、神經(jīng)網(wǎng)絡。但此階段僅限于對模型的簡單應用,未充分考慮樣本數(shù)據(jù)存在外點或噪聲點、非平衡性、重疊性、錯分代價差異性等。 </p><p>  2.1 外點或噪聲點 </p><p>  當數(shù)據(jù)集中存在外點或噪聲點時,容易使二分類SVM結(jié)果不理想,為此Liu和Hua

7、ng將模糊化思想引入SVM,提出了模糊支持向量機(FSVM),根據(jù)數(shù)據(jù)點對所在類(正類、負類)的相對重要程度,分配不同的權(quán)重,以降低外點和噪聲點影響。楊海軍、太雷將模糊支持向量機(FSVM)算法引入上市公司財務困境預測,對滬深兩市按行業(yè)板塊分類的上市公司實證分析,顯示該模型預測優(yōu)于C-SVM。 </p><p><b>  2.2 重疊性 </b></p><p> 

8、 傳統(tǒng)SVM將樣本集絕對分為互斥的兩類,但現(xiàn)實世界中這種分類不存在經(jīng)濟意義,即樣本很可能存在重疊性,例如財務困境預測時,財務指標既定的企業(yè),可能由于經(jīng)營遠離財務困境,也可能由于經(jīng)營不力而陷入財務困境。 </p><p>  考慮樣本數(shù)據(jù)重疊性、外點或噪聲點,Wang等構(gòu)建了雙隸屬模糊支持向量機(B-FSVM),使每個樣本點依據(jù)隸屬函數(shù)同時屬于兩類,并利用3個公開信用數(shù)據(jù)庫實證分析,發(fā)現(xiàn)B-FSVM判別能力高于C-

9、SVM和FSVM。闞寶奎、劉志新等[1]將B-FSVM引入上市公司虛擬財務報告識別,其中樣本點對于兩類樣本的隸屬程度確定采用譜聚類方法。研究發(fā)現(xiàn),該模型的判別準確率、泛化能力都顯著優(yōu)于C-SVM、BP神經(jīng)網(wǎng)絡,且可以顯著降低將虛假財務報告識別為真實財務報告的錯誤。 </p><p>  張目、周宗放[2]采用多目標規(guī)劃,減少兩類樣本企業(yè)信用狀況的重疊?;赥OPSIS法,分別以“正常企業(yè)”樣本逼近理想點、“違約企

10、業(yè)”樣本逼近負理想點為目標,構(gòu)建多目標規(guī)劃模型;運用實碼加速遺傳算法求解得出指標綜合權(quán)重,通過構(gòu)造加權(quán)樣本,減少兩類樣本企業(yè)信用狀況的重疊,進而提高SVM預測精度。選取滬、深股市中具有“高新技術(shù)概念”上市公司作為實驗樣本,實證分析得出,該方法一定程度上利于兩類樣本的正確區(qū)分,使SVM的預測精度提高。 </p><p><b>  2.3 非平衡性 </b></p><p&

11、gt;  經(jīng)濟與管理科學中的二分類問題數(shù)據(jù)大多存在非平衡性,而非平衡性會對C-SVM分類效果產(chǎn)生不利影響,即C-SVM只會對數(shù)量上占優(yōu)的類別具有很強的識別能力[3]。解決數(shù)據(jù)非平衡性可使用向下采樣方法或構(gòu)建相應模型。向下采樣方法:以客戶流失預測為例,從非流失客戶中抽取部分樣本與流失客戶樣本構(gòu)成k:1的訓練集。這種方法雖然平衡了訓練集類分布,但損失了很多信息,且抽取比例、k取值確定需要多次嘗試和實驗。 </p><p&

12、gt;  應維云、覃正等[4]考慮到流失客戶和非流失客戶正負樣本數(shù)據(jù)不平衡,引入分類加權(quán)支持向量機算法(CW-SVM),對深圳市某銀行個人信貸部的客戶信貸數(shù)據(jù)分析,結(jié)果表明CW-SVM要好于神經(jīng)元網(wǎng)絡和決策樹方法。其中CW-SVM算法,能夠通過調(diào)整類權(quán)重參數(shù),改變分類面位置,進而提高算法分類準確性。 </p><p>  2.4 錯分代價差異性 </p><p>  二分類問題研究,很難使

13、用傳統(tǒng)的基于預測準確率的模型解決,如客戶流失、信用評估等,這些問題中不同類別樣本的錯分代價相差很大。解決錯分代價差異問題,可以通過樣本數(shù)據(jù)的預處理,也可以通過引入錯分代價差異:闞寶奎、劉志新等考慮到人們對于兩種判別錯誤的“厭惡程度差異”,在雙隸屬SVM建立時,對訓練樣本進行“非對稱”處理(將虛假財務報告視為絕對屬于虛假財務報告,而所謂的真實報告“謹慎”對待,進行雙隸屬分析)。這種新方法在公司財務報告真?zhèn)闻袆e時,表現(xiàn)出了高于C-SVM和B

14、P神經(jīng)網(wǎng)絡的判別準確率、泛化能力,并且顯著降低了將虛假財務報告識別為真實財務報告的錯誤。錢蘇麗、何建敏等[5]將錯分代價納入分類算法,同時考慮數(shù)據(jù)不平衡問題,建立了代價敏感支持向量機,使算法基于代價而非基于準確率。利用中國電信某分公司預付費小靈通用戶數(shù)據(jù)實證,顯示改進SVM能顯著提高模型效能,且模型能夠在兩類錯誤(將流失客戶錯誤預測為不流失客戶、將不流失客戶預測為流失客戶)中找到一個平衡點使代價最小,彌補了傳統(tǒng)模型默認代價相同、一味追求

15、準確率的不足。 </p><p><b>  3 結(jié)論與展望 </b></p><p>  當前,對客戶流失預測、財務困境預警、信用風險評估的研究方興未艾,繼傳統(tǒng)統(tǒng)計模型、神經(jīng)網(wǎng)絡等,學者引入支持向量機??傮w看來,二分類支持向量機預測精度、泛化能力都高于其他模型,同時為了進一步提高其效果,學者不斷研究:針對數(shù)據(jù)特征(存在外點或噪聲點、非平衡性、重疊性、錯分代價差異性等

16、)相應引入模糊支持向量機、加權(quán)支持向量機、雙隸屬支持向量機以及代價敏感性學習機制等。雖然有關(guān)二分類支持向量機的研究趨于成熟,但仍存在一定的局限性:目前仍沒有很好的方法指導針對具體問題的核函數(shù)選擇,缺乏有效方式將二分類問題擴展為多分類問題研究,將是未來研究方向。 </p><p><b>  參考文獻: </b></p><p>  [1]闞寶奎,劉志新,宋曉東,楊眾.

17、改進支持向量機在虛假財務報告識別中的應用[J].管理評論,vol.24,2012(5). </p><p>  [2]張目,周宗放.基于多目標規(guī)劃和支持向量機的企業(yè)信用評估模型[J].中國軟科學,vol.4,2009(5). </p><p>  [3]Gang Wu,Edward Y.Chang.Class-Boundary Alignment for Imbalanced Datase

18、t Learning[C].ICML Workshop on Learning from Imbalanced Data Sets II,Washington DC.2003. </p><p>  [4]應維云,覃正,趙宇,李兵,李秀.SVM方法及其在客戶流失預測中的應用研究[J].系統(tǒng)工程理論與實踐,Vol.7,2007(7). </p><p>  [5]錢蘇麗,何建敏,王純麟.基于

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論