版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、<p> 開題題目:基于關(guān)鍵字的交換內(nèi)容過濾技術(shù)的研究與實現(xiàn)</p><p> 1、選題描述:包括選題的背景、依據(jù)和意義、研究目標(biāo)、研究內(nèi)容以及對國內(nèi)外相關(guān)領(lǐng)域研究現(xiàn)狀的分析(可附頁)選題背景、依據(jù)和意義:進入21世紀以來,計算機在我國開始普及并迅速發(fā)展,在國家有關(guān)政策的積極鼓勵推進下,我國的信息化建設(shè)獲得了巨大的成就。隨著互聯(lián)網(wǎng)的不斷快速發(fā)展,信息個體之間的互聯(lián)互通和信息共享已經(jīng)成為人們迫切需要解決的
2、問題,企事業(yè)單位、政府和軍隊等部門內(nèi)部積累了大量的基礎(chǔ)數(shù)據(jù)。但是,出于內(nèi)外網(wǎng)和不對等區(qū)域之間數(shù)據(jù)交換安全性問題的考慮,這些部門無法實時和充分地利用這些基礎(chǔ)數(shù)據(jù)作為信息化建設(shè)應(yīng)用擴展,因而只能相互獨立、數(shù)據(jù)分散地形成一個個“信息孤島”、“數(shù)據(jù)孤島”,嚴重影響了其信息化建設(shè)的進一步發(fā)展,也為信息化工作的開展帶來了不便。此外,因病毒的瘋狂肆虐、黑客日益猖獗、軟件本身漏洞和設(shè)計缺陷而導(dǎo)致的泄密事件也越來越多,對黨政機關(guān)、軍隊等單位的信息安全構(gòu)成
3、了極大的威脅。然而,傳統(tǒng)的技術(shù)手段很難兼顧安全隔離和信息交換兩者的需求,更缺乏對信息安全的嚴格審查,極易導(dǎo)致攻擊代碼的流入和重要信息的泄漏。簡單的物理隔離、網(wǎng)閘技術(shù)等都不能從根本上解決問題,并且缺少對進程的交換數(shù)據(jù)中敏感的、涉密的信息</p><p> 2、擬解決的關(guān)鍵問題和擬采取的研究方案(可附頁)關(guān)鍵問題及解決方案:由于文件安全交換系統(tǒng)中傳輸?shù)奈募赡馨舾行畔⒒蛘呱婷苄畔?,因此,在文件發(fā)送之前在發(fā)送方進行
4、文件內(nèi)容的敏感、涉密信息檢測過濾是十分必要的。敏感信息過濾主要針對文本類文件(.txt/.doc/.docx/.rtf等)攜帶的內(nèi)容進行掃描過濾。保證交換的內(nèi)容符合文件安全交換系統(tǒng)中的定制策略。研究一,信息過濾的幾種方法,主要有:1)基于黑白名單的過濾。 所謂白名單,有時候也被稱為安全名單。例如對服務(wù)器管理員、網(wǎng)絡(luò)服務(wù)商或公司來說,都會有一系列對自己來說是安全的網(wǎng)絡(luò)服務(wù)器域名或IP地址列表,從這些網(wǎng)絡(luò)服務(wù)器獲取的信息通常被認為是安全的。
5、這樣,如果網(wǎng)絡(luò)信息對應(yīng)地址處在這個安全名單中,系統(tǒng)就會讓這些信息不經(jīng)過過濾器就直接到達客戶端。所謂黑名單技術(shù),即利用國內(nèi)外很多組織提供的不良信息制造者或策源地的“黑名單”,過濾器得到信息請求后,先到“黑名單”上去查找。如果對應(yīng)地址在名單中,就拒絕連接。白名單和黑名單通常是結(jié)合起來使用的。這種技術(shù)的優(yōu)點是速度快,并可以動態(tài)更新;缺點是,會拒絕指向同一個黑名單的所有信息,誤判率高。2)基于規(guī)則的過濾</p><p>
6、 PaodingPaoding(庖丁解牛分詞)基于Java的開源中文分詞組件,提供lucene和solr接口,具有極 高效率和 高擴展性。引入隱喻,采用完全的面向?qū)ο笤O(shè)計,構(gòu)思先進。高效率:在PIII 1G內(nèi)存?zhèn)€人機器上,1秒可準(zhǔn)確分詞 100萬漢字。采用基于不限制個數(shù)的詞典文件對文章進行有效切分,使能夠?qū)υ~匯分類定義。能夠?qū)ξ粗脑~匯進行合理解析MMSEG4JMMSEG4J基于Java的開源中文分詞組件
7、,提供lucene和solr 接口1.mmseg4j 用 Chih-Hao Tsai 的 MMSeg 算法實現(xiàn)的中文分詞器,并實現(xiàn) lucene 的 analyzer 和 solr 的TokenizerFactory 以方便在Lucene和Solr中使用。2.MMSeg 算法有兩種分詞方法:Simple和Complex,都是基于正向最大匹配。Complex 加了四個規(guī)則過慮。官方說:詞語的正確識別率達到了 98.41%。mmseg4j
8、已經(jīng)實現(xiàn)了這兩種分詞算法。由于文件安全交換系統(tǒng)初始默認過濾詞匯較少,我準(zhǔn)備采用的基于文本內(nèi)容分詞的敏感信息過濾方式,即采用分詞結(jié)合關(guān)鍵字過濾方式對安全交</p><p> 3、時間進度安排(可附頁)</p><p> 4、參考文獻(可附頁)[1]李松林,陳華清,任鑫. Eclipse寶典.電子工業(yè)出版社,2007年6月[2]張紅旗,王魯. 信息安全技術(shù).高等教育出版社,2008年[3]Br
9、uce Eckel. Java 編程思想.機械工業(yè)出版社,2007年6月[4]皮德常,張鳳林. Java2簡明教程(第二版).清華大學(xué)出版社,2006年7月[5]林鴻飛. 基于混合模式的文本過濾模型.計算機研究與發(fā)展.2001年09月[6]曲德祥,基于分詞的關(guān)鍵詞過濾技術(shù)研究.山東師范大學(xué)學(xué)報(自然科學(xué)版),2010年09月[7]劉紅芝,中文分詞技術(shù)的研究. 電腦開發(fā)與應(yīng)用,2010年[8]蔡曉妍,戴冠中,楊黎斌, 改進的多模式字符串匹
10、配算法.計算機應(yīng)用,2010年06月[9]張家勇,劉建輝,基于中文分詞技術(shù)的信息智能過濾系統(tǒng).信息技術(shù),2006年12月[10]劉楊,陳暉,陳遠江,中文文本信息過濾技術(shù)研究 .船電技術(shù),2010年07月[11]姚磊岳,熊建英, 一種基于中文分詞算法的信息過濾技術(shù).科技廣場,2007年07月[12]段立娟,Web挖掘的敏感信息過濾模型.前沿技術(shù),2007年[13]程妮,崔建海,王軍(編</p><p> 5、導(dǎo)師意
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- XML關(guān)鍵字過濾技術(shù).pdf
- 基于linux操作系統(tǒng)的關(guān)鍵字過濾防火墻研究與實現(xiàn).pdf
- 基于內(nèi)容和結(jié)構(gòu)的關(guān)鍵字圖查詢研究.pdf
- 網(wǎng)頁關(guān)鍵字過濾研究及改進.pdf
- 垃圾郵件關(guān)鍵字過濾算法
- 基于關(guān)鍵字的模糊查詢技術(shù)的研究.pdf
- kFilter-基于關(guān)鍵字查詢的XML流過濾系統(tǒng).pdf
- 基于關(guān)鍵字的P2P流量識別技術(shù)的研究與實現(xiàn).pdf
- 基于布魯姆過濾器的P2P多關(guān)鍵字搜索技術(shù)研究.pdf
- 基于SLCA的XML關(guān)鍵字查詢技術(shù)研究.pdf
- 基于DHT的多關(guān)鍵字檢索系統(tǒng)的研究與實現(xiàn).pdf
- 基于語義相關(guān)性的XML關(guān)鍵字查詢的研究與實現(xiàn).pdf
- 關(guān)鍵字
- 基于時態(tài)關(guān)鍵字的倒排索引技術(shù)問題研究與應(yīng)用.pdf
- 模糊關(guān)鍵字可搜索加密算法的研究與實現(xiàn)
- 基于關(guān)鍵字的XML查詢.pdf
- 基于XML的關(guān)鍵字查詢算法研究.pdf
- XML關(guān)鍵字查詢中包含關(guān)鍵字的最小片段問題的研究.pdf
- 文本內(nèi)容過濾的關(guān)鍵技術(shù)研究及實現(xiàn).pdf
- 網(wǎng)頁內(nèi)容過濾的關(guān)鍵技術(shù)研究及實現(xiàn).pdf
評論
0/150
提交評論