003-項目的研究內容-v1.0_20190119_第1頁
已閱讀1頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、研究內容研究內容圍繞研究目標,研究內容如下:1、面向面向roidroid代碼反混淆基于代碼反混淆基于BigBigCodeCode遷移分析的代碼背景信息增強方法遷移分析的代碼背景信息增強方法對于存在的大規(guī)模程序資源BigCode,研究基于代碼分析多任務(包括代碼克隆檢測、代碼摘要和代碼補全等)代碼語義模型的構建與訓練方法,有效提煉面向roid代碼反混淆的多任務代碼語義背景信息。研究基于深度學習的roid代碼反混淆模型的構建方法,基于遷移學

2、習思想將從BigCode訓練得到的代碼語義模塊引入到roid代碼反混淆模型中,增強反混淆分析過程中的代碼語義信息(codesemanticaugmentation),有效支撐反混淆。研究roid代碼反混淆的優(yōu)化方法,提高反混淆結果代碼的語義準確性、可讀性和可執(zhí)行性等。研究roid代碼反混淆的質量評估方法,針對反混淆結果的多樣性特點,實現對于結果代碼的客觀評價?!緦懙娇尚行岳锩妫撼浞掷肂igCode資源挖掘代碼背景增強信息為基本線索,研

3、究roid代碼背景語義信息增強(semanticenrichment)、代碼背景信息增強支持下的反混淆與優(yōu)化,以及反混淆結果的評價技術。】2、基于代碼分析多任務的代碼語義模型基于代碼分析多任務的代碼語義模型2.1)BigBigCodeCode多種代碼分析任務梳理與反混淆任務背景信息代碼集構建多種代碼分析任務梳理與反混淆任務背景信息代碼集構建面向roid代碼反混淆,研究大規(guī)模程序資源BigCode中存在的多種代碼分析任務,包括代碼克隆檢測

4、(codeclonedetection)、代碼摘要(codesummary)、代碼補全(codecompletion)等。從BigCode中收集不同任務對應的代碼集(多任務代碼集S1),進行分類整理與代碼清洗。研究不同代碼分析任務中的輸入、輸出及其對應的相關性,支持構建基于代碼分析多任務的代碼語義模型。研究如何構建反混淆任務背景信息代碼集,合理選取多種混淆工具對多任務代碼集進行混淆,得到不同任務下對應于不同混淆工具的混淆代碼集S2。綜合

5、多任務代碼集S1和混淆代碼集S2,用于后繼挖掘反混淆過程中代碼背景語義信息?!荆檎Z義充實做準備)(為語義充實做準備)(inputinput)(構建預訓練的代碼集,相關代碼片段的特征映射(構建預訓練的代碼集,相關代碼片段的特征映射語義充實語義充實semanticsemanticenrichmentenrichment)】2.2)基于代碼分析多任務的代碼語義模型構建基于代碼分析多任務的代碼語義模型構建研究如何構建具有遷移性的代碼語義模塊,

6、借鑒深度學習中的語義表示方法,利用BigCode構建的反混淆任務背景信息代碼集,提煉面向反混淆任務的代碼背景語義信息。根據不同代碼分析任務的輸入與輸出,研究如何構建對應的代碼語義模型,包括對應的輸入與輸出模塊以及共享的代碼語義模塊(承載面向反混淆任務的代碼背景3.3)基于基于混淆差異性的反混淆代碼分析混淆差異性的反混淆代碼分析研究混淆差異性對roid代碼反混淆結果的影響,基于不同混淆工具之間存在的混淆差異性,選取幾種流行的混淆工具分別混

7、淆相同的源代碼,構建不同的反混淆任務數據集,再使用提出的roid代碼反混淆模型分別進行反混淆處理,通過反混淆代碼的質量評估分析不同混淆工具的影響,研究并深入挖掘其中可能存在的原因,以支撐后續(xù)roid代碼反混淆的深度優(yōu)化工作。4、roidroid代碼反混淆代碼反混淆的深度優(yōu)化的深度優(yōu)化(余方案(余方案執(zhí)行反混淆與結果優(yōu)化)執(zhí)行反混淆與結果優(yōu)化)(優(yōu)化反混淆結(優(yōu)化反混淆結果加強代碼可讀性加強代碼可讀性適當重構)適當重構)4.1)谷歌谷歌J

8、avaJava代碼規(guī)范指導的反混淆代碼優(yōu)化代碼規(guī)范指導的反混淆代碼優(yōu)化研究如何根據谷歌代碼規(guī)范約束優(yōu)化反混淆代碼。考慮將利用代碼規(guī)范約束優(yōu)化反混淆代碼,分為兩種方案:(1)選取谷歌代碼樣例庫中roid代碼,研究如何人工分析谷歌代碼規(guī)范,并根據合理的認知研究構建啟發(fā)式規(guī)則方法。研究如何將上述啟發(fā)式規(guī)則方法優(yōu)化反混淆代碼,使得能夠將反混淆后的代碼遵循谷歌代碼規(guī)范;(2)爬取谷歌代碼樣例庫中大量roid代碼,研究如何通過機器自動學習這些代碼具

9、有的谷歌代碼規(guī)范,并將這些代碼具有的谷歌代碼規(guī)范知識遷移到反混淆的代碼中,使得能夠將反混淆后的代碼遵循谷歌代碼規(guī)范。4.2)基于多源數據的代碼反混淆性能優(yōu)化基于多源數據的代碼反混淆性能優(yōu)化研究如何通過綜合多源代碼優(yōu)化反混淆的性能。一方面,在BigCode背景信息表征過程中,通過其他途徑引入大量Java項目工程代碼和其他的roid代碼,進一步擴充BigCode;另一方面,在roid代碼反混淆任務中,研究如何通過Java反混淆任務代碼來增強

10、roid代碼反混淆模型的性能,使得學習的反混淆模型能夠具有更強的泛化性。4.3)基于混淆差異性的代碼反混淆性能優(yōu)化基于混淆差異性的代碼反混淆性能優(yōu)化根據不同混淆工具的差異性對代碼反混淆結果的影響分析,研究如何利用這種差異性及其影響改善反混淆模型的性能??紤]將該差異性增強反混淆模型的性能分為兩步:第一步,綜合多種代碼混淆工具產生的混淆代碼,構建更大的反混淆訓練代碼集,以增強反混淆模型的魯棒性,使得反混淆模型能夠優(yōu)化反混淆多種代碼混淆工具產

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論