基于后綴語(yǔ)法樹(shù)的代碼抄襲檢測(cè)研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩57頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、學(xué)校代碼:10135論文分類(lèi)號(hào):學(xué)號(hào):20084019005研究生類(lèi)別:全日制幽喜之卸貉犬謦碩士學(xué)位論文基于后綴語(yǔ)法樹(shù)的代碼抄襲檢測(cè)研究CodePlagiarismDetectionResearchBasedonSuffiXTree學(xué)科門(mén)類(lèi):一級(jí)學(xué)科:學(xué)科、專(zhuān)業(yè):研究方向:申請(qǐng)人姓名:指導(dǎo)教師姓名:工學(xué)計(jì)算機(jī)科學(xué)與技術(shù)計(jì)算機(jī)應(yīng)用技術(shù)多媒體與gAI李彥臣劉東升2010年3月30日,Lr|7,r中文摘要隨著信息技術(shù)的不斷發(fā)展,抄襲正變得越來(lái)

2、越容易和難以防范。在程序設(shè)計(jì)類(lèi)課程作業(yè)和在線測(cè)試的考評(píng)中,學(xué)生相互抄襲的現(xiàn)象也普遍存在。澳大利亞蒙納什(Monash)大學(xué)對(duì)其學(xué)生中的代碼抄襲現(xiàn)象進(jìn)行調(diào)查統(tǒng)計(jì)顯示:高達(dá)854%的學(xué)生承認(rèn)抄襲過(guò)他人的作業(yè)。日益嚴(yán)重的抄襲現(xiàn)象已經(jīng)嚴(yán)重地破壞了正常的教學(xué)秩序,也影響了教學(xué)質(zhì)量和學(xué)生素質(zhì)的提高。為了扼制不良學(xué)風(fēng),對(duì)高效率的代碼抄襲檢測(cè)方法進(jìn)行研究顯得日趨必要。本文在分析目前國(guó)內(nèi)外程序代碼抄襲檢測(cè)研究的基礎(chǔ)上,針對(duì)學(xué)生C語(yǔ)言程序代碼作業(yè)中常見(jiàn)的抄

3、襲方法,提出一種基于后綴樹(shù)的程序代碼抄襲檢測(cè)方法。首先制定基于ANTLR的C語(yǔ)言文法文件,利用ANTLR生成C語(yǔ)言的詞法及語(yǔ)法分析器,’并對(duì)程序代碼進(jìn)行詞法和語(yǔ)法分析,生成C程序代碼的后綴語(yǔ)法樹(shù)。其次對(duì)生成的后綴語(yǔ)法樹(shù)進(jìn)行遍歷和優(yōu)化,去除語(yǔ)法樹(shù)中的冗余信息,得到一個(gè)字符串序列,該字符串序列標(biāo)準(zhǔn)化地表示了程序代碼中的信息。第三,采用改進(jìn)后的貪婪字符串匹配算法,對(duì)后綴樹(shù)字符串序列進(jìn)行了匹配計(jì)算,通過(guò)一個(gè)確定了決策函數(shù)計(jì)算出兩個(gè)字符串序列的相

4、似值,并以此為依據(jù)來(lái)度量?jī)蓚€(gè)程序代碼之間相似程度。最后根據(jù)給定的閾值來(lái)判斷兩個(gè)程序之間是否存在抄襲嫌疑?;谏鲜龇椒?,設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)C語(yǔ)言程序代碼抄襲檢測(cè)實(shí)驗(yàn)系統(tǒng),該實(shí)驗(yàn)系統(tǒng)可以檢測(cè)程序集合中任意兩個(gè)程序代碼之間的相似度。選用了不同的方法對(duì)實(shí)驗(yàn)系統(tǒng)的有效性和可靠性進(jìn)行測(cè)評(píng)。實(shí)驗(yàn)結(jié)果表明,該方法能夠檢測(cè)出C語(yǔ)言代碼中存在的多種抄襲手段,并有較高的檢測(cè)效率。與國(guó)外成熟的的檢測(cè)系統(tǒng)MOSS對(duì)比,該實(shí)驗(yàn)系統(tǒng)在檢測(cè)精度和準(zhǔn)確性方面都有較高的優(yōu)越

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論