數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)在銀行業(yè)中的研究與應(yīng)用.pdf_第1頁
已閱讀1頁,還剩52頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、隨著計算機軟、硬件技術(shù)的不斷發(fā)展,數(shù)據(jù)倉庫(DW)、數(shù)據(jù)挖掘(DM)技術(shù)已經(jīng)開始走向成熟。同時金融領(lǐng)域進一步開放,行業(yè)競爭越來越激烈,對信息化建設(shè)提出了更高的要求。銀行信息化歷程經(jīng)歷了三個階段:業(yè)務(wù)信息化、數(shù)據(jù)大集中、管理信息化。目前大多數(shù)銀行已完成了數(shù)據(jù)大集中—第二歷程。而銀行管理信息化的需求變得非常迫切,數(shù)據(jù)倉庫及數(shù)據(jù)挖掘技術(shù)為銀行管理信息化提供了技術(shù)支撐平臺。
  國內(nèi)金融企業(yè)數(shù)據(jù)管理應(yīng)用的普遍現(xiàn)狀是:匯集了海量的數(shù)據(jù)信息,

2、但是不能很好的發(fā)現(xiàn)數(shù)據(jù)中存在的關(guān)系和業(yè)務(wù)規(guī)律及預(yù)測未來業(yè)務(wù)發(fā)展趨勢,而國際性金融企業(yè)廣泛使用數(shù)據(jù)挖掘技術(shù)在同業(yè)競爭中獲得了優(yōu)勢地位,并且正在創(chuàng)新金融服務(wù)和產(chǎn)品。因此,國內(nèi)金融企業(yè)需要加快實現(xiàn)客戶資源整合、經(jīng)營分析及投資決策的信息化的腳步。
  本文主要做了如下工作:
  1.對國內(nèi)外銀行業(yè)信息化的研究現(xiàn)狀進行了系統(tǒng)的綜述和分析。對銀行業(yè)中的數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)進行了深入研究,結(jié)合國內(nèi)銀行業(yè)的特點提出一種基于DB/ODS/D

3、W的數(shù)據(jù)倉庫三層體系結(jié)構(gòu),用來平衡一些數(shù)據(jù)倉庫難以解決的查詢、分析應(yīng)用,減輕數(shù)據(jù)倉庫系統(tǒng)的管理負荷。
  2.立足于整個商業(yè)銀行的業(yè)務(wù)和管理角度,通過對銀行業(yè)務(wù)流程及銀行各部門應(yīng)用需求的詳細分析,構(gòu)建了NCR數(shù)據(jù)模型,確定了當事人、產(chǎn)品、協(xié)議等十個主題。
  3.詳細介紹了數(shù)據(jù)倉庫建立過程中的ETL過程,研究ETL過程中缺損數(shù)據(jù)和相似記錄的清洗方法。提出基于分詞技術(shù)的相似記錄判定方式,以及簡單殘缺記錄處理算法并進行設(shè)計實現(xiàn)。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論