基于數(shù)據(jù)挖掘技術(shù)的P2P借貸違約風(fēng)險識別模型研究.pdf_第1頁
已閱讀1頁,還剩70頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、在互聯(lián)網(wǎng)經(jīng)濟(jì)日益擴(kuò)張的今天,為滿足多樣化的投資和借貸需求,互聯(lián)網(wǎng)金融產(chǎn)業(yè)下的P2P借貸業(yè)務(wù)快速擴(kuò)張。但近年來,P2P借貸業(yè)務(wù)發(fā)展遇到了一系列問題,尤其是較高的違約率帶來的壞賬問題,導(dǎo)致P2P平臺和投資者遭受損失。建立有效的P2P借貸違約風(fēng)險識別模型,對于平臺的風(fēng)險控制和行業(yè)的長遠(yuǎn)發(fā)展,有著重要的意義。本文旨在運(yùn)用當(dāng)前較為主流的數(shù)據(jù)挖掘方法,尋找并構(gòu)建能夠有效識別P2P借貸違約風(fēng)險的模型,從而實(shí)現(xiàn)P2P平臺中潛在違約情況的及時預(yù)測,有效降

2、低P2P平臺因高違約率而帶來的損失,進(jìn)而提高生存能力。
  本文首先對P2P借貸業(yè)務(wù)進(jìn)行了基本分析,闡述了所采用的幾類數(shù)據(jù)挖掘模型的基本思想和特點(diǎn)。然后,以“拍拍貸”公開的借款人數(shù)據(jù)集為例進(jìn)行數(shù)據(jù)采集,對所采集得到的P2P借貸記錄數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗和特征工程。此后,對清洗以后的數(shù)據(jù)集分別建立邏輯回歸(Logistic)、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(SVM)、C50決策樹、隨機(jī)森林、GBDT迭代樹和XGBoost等P2P違約風(fēng)險識別的數(shù)據(jù)挖

3、據(jù)模型,并且選擇準(zhǔn)確度、精確度、召回度和F1統(tǒng)計值等評估指標(biāo)來對各個模型的預(yù)測效果進(jìn)行評估和對比。最后,分別選擇其中表現(xiàn)效果較佳的XGBoost模型和邏輯回歸模型作為基模型和第二階段的模型,采用Stacking集成學(xué)習(xí)的方法,建立最終的違約識別組合模型。
  本文的最終研究結(jié)果表明,運(yùn)用開源工具R語言,基于包含P2P借款用戶的基本信息、網(wǎng)絡(luò)行為、教育信息、社交網(wǎng)絡(luò)和第三方數(shù)據(jù)等多維度數(shù)據(jù),采用當(dāng)前流行的數(shù)據(jù)挖據(jù)模型XGBoost建

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論