版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、大規(guī)模、跨領(lǐng)域數(shù)據(jù)倉(cāng)庫(kù)的出現(xiàn),使數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)量日益增多,數(shù)據(jù)模式日趨復(fù)雜,清洗過程設(shè)計(jì)更加繁瑣。這些變化使數(shù)據(jù)清洗軟件的開發(fā)出現(xiàn)了很多新的需求,如動(dòng)態(tài)構(gòu)建、頻繁的修改以及更多的用戶交互等。因此,如何設(shè)計(jì)能夠可重用的數(shù)據(jù)清洗過程以滿足數(shù)據(jù)清洗軟件新的需求,成為數(shù)據(jù)清洗軟件設(shè)計(jì)和開發(fā)人員的新挑戰(zhàn)。
為解決上述問題,本文深入地研究了數(shù)據(jù)清洗的邏輯模型以及構(gòu)件化物理實(shí)現(xiàn),完成了如下兩部分工作:
一是提出數(shù)據(jù)清洗過
2、流程模型DCPM(Data Cleansing Process Model),并證明基于該模型使用工作流網(wǎng)建模技術(shù)對(duì)數(shù)據(jù)清洗過程進(jìn)行建模的可行性。這使得設(shè)計(jì)數(shù)據(jù)清洗過程可以遵照統(tǒng)一的模型,并使用成熟的建模技術(shù)進(jìn)行建模。該模型描述了數(shù)據(jù)清洗流程中內(nèi)部各個(gè)元素,元素之間的關(guān)系和元素的屬性。通過使用統(tǒng)一的模型對(duì)數(shù)據(jù)清洗流程進(jìn)行建模,顯著地提高了清洗流程的可復(fù)用性。
二是分析了目前開發(fā)數(shù)據(jù)清洗軟件所出現(xiàn)的新需求和已有的開發(fā)手段的不
3、足,提出并實(shí)現(xiàn)了基于構(gòu)件的數(shù)據(jù)清洗框架C+ADC(Component——extended Agile Data Cleaning),包括運(yùn)行時(shí)平臺(tái)和框架服務(wù)構(gòu)件集。基于該框架,能夠輕松、靈活地構(gòu)建基于擴(kuò)展構(gòu)件的數(shù)據(jù)清洗應(yīng)用,顯著地降低開發(fā)成本和周期。定義了集成與該框架的構(gòu)件模型和數(shù)據(jù)清洗流程業(yè)務(wù)空間向構(gòu)件空間映射策略,以更好地實(shí)現(xiàn)數(shù)據(jù)清洗應(yīng)用。
實(shí)際的開發(fā)案例證明:使用DCPM模型建模數(shù)據(jù)清洗流程并基于C+ADC框架進(jìn)行數(shù)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 構(gòu)件框架研究與應(yīng)用.pdf
- 數(shù)據(jù)清洗技術(shù)研究及清洗框架的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 數(shù)據(jù)清洗算法的研究與應(yīng)用.pdf
- 數(shù)據(jù)清洗框架與缺失值重構(gòu)方法的研究.pdf
- ETL框架及數(shù)據(jù)清洗的研究.pdf
- ICA-EJB構(gòu)件在數(shù)據(jù)挖掘框架中的應(yīng)用與研究.pdf
- 基于本體的數(shù)據(jù)清洗系統(tǒng)框架研究.pdf
- 基于Web的數(shù)據(jù)清洗及轉(zhuǎn)換通用框架的研究及應(yīng)用.pdf
- 基于Struts框架的構(gòu)件組裝技術(shù)的研究與應(yīng)用.pdf
- WebGIS構(gòu)件化研究與應(yīng)用.pdf
- 數(shù)據(jù)清洗技術(shù)的研究及其應(yīng)用.pdf
- 基于Spark的大數(shù)據(jù)清洗框架設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于Hadoop的交通數(shù)據(jù)清洗研究與應(yīng)用研究.pdf
- 數(shù)據(jù)清洗在構(gòu)建POI數(shù)據(jù)倉(cāng)庫(kù)中的研究與應(yīng)用.pdf
- 數(shù)據(jù)倉(cāng)庫(kù)化中數(shù)據(jù)清洗問題的研究.pdf
- XML與數(shù)據(jù)清洗的研究.pdf
- 數(shù)據(jù)庫(kù)集群自動(dòng)化測(cè)試框架(DCTAF)的研究與應(yīng)用.pdf
- 面向構(gòu)件框架的研究與設(shè)計(jì)
- 基于構(gòu)件化軟件的動(dòng)態(tài)演化研究與應(yīng)用.pdf
- 基于.net框架視頻構(gòu)件的開發(fā)與應(yīng)用
評(píng)論
0/150
提交評(píng)論