版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、近年來(lái),數(shù)據(jù)流作為一種普遍存在的數(shù)據(jù)形式,吸引了越來(lái)越多數(shù)據(jù)挖掘研究者的關(guān)注,快速有效地針對(duì)數(shù)據(jù)流的一遍掃描式數(shù)據(jù)挖掘算法給人們提供日漸豐富的有價(jià)值信息,幫助提供決策支持,然而,數(shù)據(jù)流挖掘技術(shù)的飛速發(fā)展,也不可避免的給數(shù)據(jù)隱私和信息安全帶來(lái)了威脅。敏感信息有時(shí)可能就是原始數(shù)據(jù)或數(shù)據(jù)挖掘所發(fā)現(xiàn)的知識(shí)本身,或者可能通過(guò)數(shù)據(jù)挖掘知識(shí)中的非敏感信息被推理得到。面向信息共享的數(shù)據(jù)流隱私保護(hù)方法研究,不僅可以在數(shù)據(jù)流環(huán)境下,實(shí)現(xiàn)對(duì)敏感信息的保護(hù),消
2、除信息擁有者共享信息時(shí)的擔(dān)憂(yōu),從而營(yíng)造更加安全、開(kāi)放的信息共享環(huán)境;而且在保護(hù)敏感信息的同時(shí),充分考慮對(duì)非敏感信息完整性的影響,最大程度的降低隱私保護(hù)方法給非敏感信息所帶來(lái)的信息損失,從而使得被共享的信息保持較高的價(jià)值及有用性。
本文立足于實(shí)現(xiàn)數(shù)據(jù)流環(huán)境下安全的信息共享,在保證共享信息高可用性的前提下,對(duì)原始數(shù)據(jù)流以及關(guān)聯(lián)規(guī)則挖掘知識(shí)的隱私保護(hù)技術(shù)進(jìn)行更加細(xì)致有效的研究:
首先,針對(duì)傳統(tǒng)的k-匿名方法無(wú)法表現(xiàn)數(shù)據(jù)流的
3、特征以及無(wú)法動(dòng)態(tài)解決數(shù)據(jù)流共享時(shí)所存在的鏈接攻擊問(wèn)題,提出自上而下具體化樹(shù)結(jié)構(gòu)來(lái)完成多數(shù)據(jù)類(lèi)型的準(zhǔn)標(biāo)識(shí)符屬性的泛化,通過(guò)樹(shù)的分支及剪枝動(dòng)態(tài)實(shí)現(xiàn)數(shù)據(jù)流的k-匿名保護(hù);同時(shí),針對(duì)數(shù)據(jù)流匿名保護(hù)往往伴隨較高信息損失的問(wèn)題,引入數(shù)據(jù)的分布密度以及延遲共享兩個(gè)限制參數(shù),并以此來(lái)選擇滿(mǎn)足k-匿名且產(chǎn)生信息損失最小的樹(shù)節(jié)點(diǎn)進(jìn)行共享;在此基礎(chǔ)上,結(jié)合滑動(dòng)窗口技術(shù),提出數(shù)據(jù)流k-匿名保護(hù)算法(KIDS);最后,通過(guò)實(shí)驗(yàn)表明:與傳統(tǒng)的k-匿名方法相比,KI
4、DS算法在匿名數(shù)據(jù)流時(shí)不僅所產(chǎn)生的時(shí)間代價(jià)更小,而且KIDS在不同的k參數(shù)和不同的數(shù)據(jù)量下所產(chǎn)生的信息損失也更小,能夠很好的保持共享原始數(shù)據(jù)流的高可用性。
其次,針對(duì)靜態(tài)數(shù)據(jù)的敏感規(guī)則隱藏方法應(yīng)用于數(shù)據(jù)流時(shí)無(wú)法保持敏感規(guī)則安全性的問(wèn)題,提出一種基于改進(jìn)項(xiàng)頭表的頻繁模式樹(shù)(IMFP-Tree),并以此為基礎(chǔ),提出面向數(shù)據(jù)流的敏感關(guān)聯(lián)規(guī)則隱藏算法(HSRDS)?;诟倪M(jìn)的頻繁項(xiàng)頭表來(lái)解決傳統(tǒng)頻繁模式樹(shù)(FP-Tree)需要不斷統(tǒng)計(jì)
5、項(xiàng)的支持度計(jì)數(shù)而不適用于數(shù)據(jù)流的問(wèn)題,并增加節(jié)點(diǎn)域ListTi來(lái)解決傳統(tǒng)頻繁模式樹(shù)因無(wú)法表示交易數(shù)據(jù)與項(xiàng)的包含關(guān)系,而很難快速確定敏感交易的問(wèn)題;另外,定義了兩個(gè)信息損失度量閾值來(lái)選擇被清洗的數(shù)據(jù)項(xiàng),解決數(shù)據(jù)清洗技術(shù)帶來(lái)的高信息損失問(wèn)題;最后,通過(guò)實(shí)驗(yàn)表明:IMFP-Tree相較于傳統(tǒng)的頻繁模式樹(shù)FP-Tree可以更快的完成數(shù)據(jù)流清洗,并且,與算法Algo2a和SWA相比,算法HSRDS會(huì)產(chǎn)生更小的負(fù)面效應(yīng),能夠有效的保持敏感規(guī)則隱藏與
6、數(shù)據(jù)有用性之間的平衡。
再次,針對(duì)數(shù)據(jù)流共享時(shí),數(shù)據(jù)清洗方法實(shí)現(xiàn)敏感規(guī)則隱藏后,被隱藏的敏感規(guī)則仍然面臨隔離攻擊問(wèn)題,提出了一種被隱藏敏感規(guī)則的k-匿名保護(hù)方法(SRA),完成對(duì)敏感規(guī)則的雙重保護(hù);同時(shí),針對(duì)現(xiàn)有的規(guī)則匿名方法需要二次清洗數(shù)據(jù)不適用數(shù)據(jù)流的問(wèn)題,結(jié)合了時(shí)間滑動(dòng)窗口技術(shù),采用追加交易的流數(shù)據(jù)處理方式;并且,提出對(duì)數(shù)據(jù)項(xiàng)采用素?cái)?shù)編碼的方法,進(jìn)一步提高算法效率、降低空間復(fù)雜度;針對(duì)SRA算法在k值偏高時(shí)產(chǎn)生過(guò)高信息損
7、失的問(wèn)題,提出改進(jìn)的敏感規(guī)則k-匿名算法(ASRA);最后,通過(guò)實(shí)驗(yàn)表明:與算法ARH相比,算法SRA和ASRA產(chǎn)生更小的時(shí)間代價(jià)以及更低的信息損失,當(dāng)數(shù)據(jù)量增大時(shí)尤其如此。同時(shí),算法ASRA相比于SRA產(chǎn)生的信息損失更低,能夠更好地保證挖掘結(jié)果的高有用性。
最后,針對(duì)數(shù)據(jù)流環(huán)境下被共享的關(guān)聯(lián)規(guī)則間所存在的相關(guān)性易對(duì)敏感規(guī)則造成推理攻擊威脅,基于規(guī)則凈化的思路,提出一種快速有效的、最小化信息損失的敏感規(guī)則推理攻擊阻塞算法(BI
8、A)。由于現(xiàn)有的頻繁模式推理通道不足以定義關(guān)聯(lián)規(guī)則的所有推理攻擊,通過(guò)分析關(guān)聯(lián)規(guī)則的推理特征,定義了四種可能存在的敏感規(guī)則的推理攻擊渠道:分解式推理攻擊、聚合式推理攻擊、傳遞式推理攻擊、鏈?zhǔn)酵评砉?;并且,針?duì)基于頻繁模式的推理攻擊阻塞方法會(huì)對(duì)非敏感規(guī)則產(chǎn)生較高的信息損失問(wèn)題,提出基于關(guān)聯(lián)規(guī)則的推理攻擊渠道的阻塞方法;最后,通過(guò)實(shí)驗(yàn)表明:算法BIA不僅能更加全面的阻塞敏感規(guī)則的推理攻擊渠道,比算法DSA和BINFCH更適合數(shù)據(jù)流環(huán)境,并
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 面向共享的數(shù)據(jù)隱私保護(hù)匿名方法研究.pdf
- 事務(wù)型數(shù)據(jù)流發(fā)布的隱私保護(hù)方法研究.pdf
- 面向數(shù)據(jù)流的差分隱私直方圖發(fā)布.pdf
- 數(shù)據(jù)共享中隱私保護(hù)方法研究.pdf
- 面向?qū)崟r(shí)數(shù)據(jù)流的匿名化隱私保護(hù)發(fā)布技術(shù)研究.pdf
- 一種面向隱私保護(hù)的分布式數(shù)據(jù)流挖掘算法.pdf
- 面向動(dòng)態(tài)數(shù)據(jù)流的分類(lèi)方法研究.pdf
- 面向數(shù)據(jù)挖掘的隱私保護(hù)方法研究.pdf
- 面向數(shù)據(jù)發(fā)布的隱私保護(hù)方法研究.pdf
- 云環(huán)境下基于動(dòng)態(tài)數(shù)據(jù)流跟蹤的用戶(hù)隱私數(shù)據(jù)保護(hù)研究.pdf
- 基于控制流與數(shù)據(jù)流的面向方面測(cè)試方法研究.pdf
- 面向聚類(lèi)分析的數(shù)據(jù)隱私保護(hù)方法研究.pdf
- 數(shù)據(jù)挖掘環(huán)境中隱私保護(hù)數(shù)據(jù)共享混合方法研究.pdf
- 面向協(xié)議數(shù)據(jù)流的數(shù)據(jù)抽取研究.pdf
- 面向類(lèi)不均衡數(shù)據(jù)流的分類(lèi)方法研究.pdf
- 面向數(shù)據(jù)挖掘的隱私保護(hù)方法研究與應(yīng)用.pdf
- 面向Storm的數(shù)據(jù)流編程模型與優(yōu)化方法研究.pdf
- 面向數(shù)據(jù)流的數(shù)據(jù)聚類(lèi)算法研究.pdf
- 面向分類(lèi)分析的數(shù)據(jù)發(fā)布隱私保護(hù)方法研究.pdf
- 面向分布式的數(shù)據(jù)挖掘隱私保護(hù)方法研究.pdf
評(píng)論
0/150
提交評(píng)論