基于遷移學習的跨項目軟件缺陷預測.pdf_第1頁
已閱讀1頁,還剩88頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、缺陷預測技術(shù)被廣泛運用于軟件開發(fā)過程提前發(fā)現(xiàn)與鎖定軟件缺陷,但是由于數(shù)據(jù)集的缺乏使得項目初期的缺陷預測遇到冷啟動的問題,無法構(gòu)建一個有效的預測模型。一種可能的解決方法是使用其他項目數(shù)據(jù)建立預測模型,預測目標項目的軟件缺陷??珥椖寇浖毕蓊A測不僅有利于解決項目初期缺乏數(shù)據(jù)集的問題,而且能減少創(chuàng)建和提取特征所花費的時間與代價,并能從各類相似項目中獲得目標項目所忽視的特征信息。然而,跨項目缺陷預測技術(shù)仍然處于初期,項目差異性是導致其預測準確率

2、降低的重要原因。本文從項目差異性問題出發(fā),基于遷移學習,從數(shù)據(jù)集優(yōu)化、特征選擇、預測算法等角度,研究提出了跨項目缺陷預測統(tǒng)一框架和兩種較高精度的跨項目缺陷預測方法。
  本文首先提出一個跨項目缺陷預測總體框架。框架以目標項目數(shù)據(jù)樣本和其他項目數(shù)據(jù)集為基礎(chǔ),通過遷移學習,進行跨項目缺陷預測建模,構(gòu)建預測模型,并最終對目標項目進行有效的缺陷預測。接著,本文分別采用特征遷移和實例遷移技術(shù),提出了兩種基于遷移學習的跨項目缺陷預測建模的方法

3、。
  方法1為基于特征遷移的跨項目缺陷預測方案評估與模型訓練(TrSchemaEval),它基于部分目標數(shù)據(jù)集樣本篩選和遷移其他項目訓練集;逐一檢驗不同的預測方案,選擇最佳的特征選擇算法和預測算法;基于篩選遷移的訓練集和評估得出的預測方案,訓練并建立跨項目缺陷預測模型。
  方法2為基于實例遷移的跨項目缺陷預測模型訓練,在現(xiàn)有TrAdaBoost算法基礎(chǔ)上,本文進行了多源適應性改進,提出了兩種預測模型訓練算法――Merge

4、TrAdaBoost和MultiTrAdaBoost。其中,MergeTrAdaBoost引入篩選概念,減少無關(guān)聯(lián)數(shù)據(jù)量,并提高訓練的效率;MultiTrAdaBoost利用多次迭代,訓練自適應單源單目標模型并整合成一個強分類模型。
  最后,為了驗證基于遷移學習的跨項目軟件缺陷預測框架和方法的有效性,本文進行了一系列實驗。實驗一,將 TrSchemaEval方法與項目內(nèi)缺陷預測進行對比。實驗結(jié)果表明 TrSchemaEval方法

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論