基于數(shù)據(jù)挖掘的個人信用風險評估單一模型與集成模型的研究.pdf_第1頁
已閱讀1頁,還剩54頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、個人信用是集體信用和國家信用的基礎(chǔ),代表一個人遵守約定的程度,影響著社會和他人對其的信任度。建立個人信用風險評估系統(tǒng)能在一定程度上降低銀行的信貸風險,提高銀行市場競爭力。在我國,個人信用制度的建立是從2000年起步,典型方法要求申請人填寫一個表格,根據(jù)預(yù)定義的計分表評分每個指標,銀行直接確定是否接受申請人的請求。得分表中每一項的分數(shù)僅根據(jù)專家的主觀經(jīng)驗給出,因此并不是那么的公平可靠。此外,若要修改某條評分條件再調(diào)整得分表是很麻煩的。因此

2、,銀行要降低信貸風險、發(fā)展個人信貸業(yè)務(wù),必須科學而有效的對個人信用風險狀況進行評估。
  本文所完成的主要工作如下:
  利用統(tǒng)計模型(C4.5決策樹、樸素貝葉斯)和非統(tǒng)計模型(SVM和BP神經(jīng)網(wǎng)絡(luò))建立個人信用風險評估模型,對它們進行比較分析,在三個UCI數(shù)據(jù)集上采用分類準確率、模型穩(wěn)定性和可解釋性三個指標來評價幾個模型的分類效果。實驗結(jié)果表明:SVM模型的總分類精度最高(82.65%),第二類錯誤率最低(14%),但其穩(wěn)

3、定性最差;BP神經(jīng)網(wǎng)絡(luò)模型除了穩(wěn)定性略優(yōu)于SVM,其余的性能均比SVM差;樸素貝葉斯模型的平均總精度變化最小(3.7%),穩(wěn)定性最佳,但分類精度最低,第二類錯誤率最高;C4.5模型在分類精度和穩(wěn)定性上的表現(xiàn)都不是最出色,對于可解釋性來說,統(tǒng)計模型占有絕對的優(yōu)勢。綜上所述,現(xiàn)有的信用風險評估模型都各有特點,但沒有任何一種模型能讓各個統(tǒng)計量都達到較高的水平。
  利用集成思想在三個信用數(shù)據(jù)集上構(gòu)建了同態(tài)并行結(jié)構(gòu)集成模型(bagging

4、集成和boosting集成)和異態(tài)并行結(jié)構(gòu)集成模型。實驗表明使用集成思想能有效提高單一分類模型分類精度和穩(wěn)定性。對于同態(tài)集成算法,使用bagging集成后模型的分類精度高于boosting集成;使用bagging集成和boosting集成模型兩者穩(wěn)定性效果相當;使用boosting集成后模型第二類錯誤率比使用bagging集成低。對于異態(tài)集成算法,調(diào)參前使用集成模型比單一模型的分類精度高4%,調(diào)參后集成模型相比于單一模型分類精度提高了2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論