2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、現(xiàn)實中,出于統(tǒng)計和研究等目的,一些機構(gòu)和組織往往需要發(fā)布一些包含敏感信息的個人數(shù)據(jù),如醫(yī)療信息、人口普查信息等。怎樣在發(fā)布個人數(shù)據(jù)的同時又能防止個人敏感信息泄露成為數(shù)據(jù)發(fā)布隱私保護中的一個重要問題。
   k-匿名模型常用來解決數(shù)據(jù)發(fā)布中的隱私保護問題,但它并沒有考慮敏感屬性值的分布,容易受到同質(zhì)攻擊和知識背景攻擊。l-diversity模型考慮了敏感屬性字面上的差異,但忽略了敏感屬性值之間的語義相似關(guān)系,同樣容易受到相似性攻擊

2、。相似性攻擊是指在同一個等價類中的敏感屬性值雖然不同,但它們語義上相似,攻擊者仍然能獲取目標(biāo)個體大致的敏感信息。相似性攻擊作為屬性泄露的一種方式是普遍存在的,并會對個人隱私保護構(gòu)成嚴(yán)重威脅。
   針對以上存在的問題,本文提出以下解決方法:
   (1)為了有效地解決屬性泄露問題,防止相似性攻擊的發(fā)生,本文提出了基于敏感屬性語義關(guān)系的α-similarity k-anonymity隱私保護模型。該模型在k-匿名有效解決身

3、份泄露的基礎(chǔ)上,增加對敏感屬性語義關(guān)系的限制,要求等價類中敏感屬性值的語義關(guān)系不大于預(yù)先給定的參數(shù)α;并根據(jù)敏感屬性值的相似度對等價類進行反聚類處理,避免語義關(guān)系相似的敏感屬性值密集發(fā)布所帶來的相似性攻擊問題。
   (2)敏感屬性按照其屬性域的不同可以分為數(shù)值屬性和分類屬性兩種。對于數(shù)值屬性,屬性值之間的數(shù)值差異自然的描述了它們之間的不相似程度。對于分類屬性,由于屬性值并不是嚴(yán)格意義上有序的,目前缺少一種有效的方法對分類敏感屬

4、性值的語義相似性進行計算。在此,本文從語義學(xué)角度構(gòu)建分類樹模型,并使用該模型來衡量分類敏感屬性值之間的語義相似程度。
   (3)關(guān)于算法方面,本文首先提出改進的Incognito算法來獲取符合α-similarity k-anonymity要求的匿名數(shù)據(jù)集。由于Incognito算法采用的是自底向上全域泛化方式,在匿名過程中會造成嚴(yán)重的信息丟失。為此,本文又提出了基于局部重編碼的多維空間分割算法來解決匿名過程中的信息丟失問題。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論