2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩61頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、計算機程序代碼相似度的自動度量,不僅可以幫助教師檢查學(xué)生作業(yè)中的抄襲現(xiàn)象,還可以輔助實現(xiàn)作業(yè)批改或試卷評閱的自動化,對程序代碼版權(quán)的輔助鑒別也具有很重要的現(xiàn)實意義。 本文討論了目前常用的程序代碼相似度度量技術(shù):屬性計數(shù)技術(shù)和結(jié)構(gòu)度量技術(shù),并介紹了幾個國外已有的程序代碼抄襲檢測系統(tǒng)。 本研究主要是針對程序代碼進行相似度度量,由于程序設(shè)計語言固有的特性,如:語言成分較少,針對每門具體的語言都只有有限多個關(guān)鍵字,結(jié)構(gòu)簡單等,且

2、國外的相關(guān)技術(shù)也比較成熟,所以與自然語言文本相似度的度量相比要簡單一些。 本研究設(shè)計了一個實驗系統(tǒng),主要用于檢查用C/C++語言編寫的程序代碼文件之間的相似度。 實驗系統(tǒng)首先對程序代碼作預(yù)處理,去掉對相似度度量結(jié)果無影響的成分,如程序中的注釋、空行以及文字部分等。然后掃描預(yù)處理后的程序代碼并對其作簡單的語法分析,將其轉(zhuǎn)換為包含程序結(jié)構(gòu)信息的標(biāo)記字符串??紤]到系統(tǒng)的擴展性,所以使用了XML文檔描述程序設(shè)計語言的語法,即用X

3、ML文檔定義什么是標(biāo)記以及程序代碼與標(biāo)記字符串之間的轉(zhuǎn)換規(guī)則。最后通過GST字符串匹配算法對得到的標(biāo)記字符串作比較,并根據(jù)比較結(jié)果給出它們之間匹配程度的數(shù)值表示,以此作為程序代碼相似度的度量值。該值越大說明程序代碼越相似,存在抄襲的可能性也越高。GST算法的一個最大優(yōu)點是,程序代碼中某些代碼段位置的變化并不影響最終的匹配結(jié)果。對于相似度度量結(jié)果值較高的程序?qū)Γ瑢嶒炏到y(tǒng)會根據(jù)用戶的選擇自動打開每對程序代碼文件,并用醒目的顏色標(biāo)記出相似或相

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論