2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩150頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著信息技術的不斷發(fā)展,數字圖書館的資源日益豐富和各項服務不斷創(chuàng)新,用戶隱私問題也日益突出。面向各種應用的數據共享和分析服務的數據匿名發(fā)布技術一方面具有較好的適用性、通用性和實用性等優(yōu)勢,另一方面又能夠充分尊重用戶的隱私,有利于數字圖書館應用數據的充分利用和信息共享,從而促進圖書館開展各項服務工作。然而,數字圖書館的應用數據有一定的具體領域特征,隱私保護訴求和數據形式存在多樣性。本文通過對現有各種匿名模型及匿名化技術的研究和分析后,指出

2、目前通常的數據匿名發(fā)布技術不足以解決數字圖書館敏感數據發(fā)布多種場景下的隱私保護問題。因而,本文對數字圖書館敏感數據匿名發(fā)布的若干關鍵技術進行了一些研究,論文的主要工作如下:
   (1)面向應用的敏感數據匿名發(fā)布框架的研究
   針對當前敏感數據隱私保護中所面臨的種種挑戰(zhàn),創(chuàng)新地提出了一種適應應用需求的數據發(fā)布體系結構框架方案--基于領域知識面向應用的敏感數據匿名發(fā)布框架,并對框架模塊進行了初步介紹,同時還給出了一個個性

3、化自適應的隱私保護數據發(fā)布算法。該框架嘗試使用自適應的機制,不但能滿足不同的數據應用需求而且又能滿足數據所有者不同的隱私保護需求。在自適應數據發(fā)布算法中,聯合采用了準標識屬性QI泛化和敏感屬性SA泛化以獲得符合匿名發(fā)布原則的匿名數據表,從而在滿足隱私保護需求的同時減少了發(fā)布數據的信息損失,即盡可能地提高了發(fā)布數據的信息精度。
   (2)基于泛化的個性化匿名數據發(fā)布技術的研究
   本文結合匿名模型的最新發(fā)展,提出了一個

4、可以應用于數字圖書館敏感數據發(fā)布的個性化敏感數據發(fā)布模型--(P,α,k)-匿名模型和基于泛化技術的數據匿名化實現算法,從面向個體和敏感屬性值角度出發(fā),充分考慮了圖書館特殊用戶隱私保護訴求和大眾用戶的普遍性隱私保護需求。文中首先介紹了相關工作并在分析現有個性化匿名原則的基礎上對個性化隱私約束參數進行了建模,并提出了(P,α,k)-匿名模型;接著提出了一個基于泛化技術的啟發(fā)式TopDown-LA算法,并介紹了該算法應用的局部重編碼和特化處

5、理技術,保證了算法獲取最小k-泛化,最大限度地提高匿名化表精度,而后還分析了算法復雜性和正確性。最后通過真實數據實驗,驗證了這種啟發(fā)式的個性化匿名算法可行性。該算法能充分滿足個性化隱私保護需求進行匿名發(fā)布數據,相比Basic Incognito和IMondrian算法信息損失少,算法性能良好。
   (3)用戶身份保留的匿名數據發(fā)布技術的研究
   本文提出了三種具體的身份保留匿名化原則,并重點介紹了基于聚類的匿名發(fā)布和

6、有損分解IDAnatomy兩種數據發(fā)布方法的實現。數字圖書館應用數據的分析在絕大多數情況下不僅需要發(fā)布的數據保留用戶身份,而且還需要考慮用戶的個體隱私保護需求。針對此種情況,本文首先考慮數字圖書館領域應用數據通常存在單一個體對應多條記錄的情況,特別分析了此情況下用戶敏感數據的侵犯情況,并提出了三種具體的身份保留匿名化原則。接著介紹了應用加權層次距離信息損失評估方式實現數據匿名的基于聚類的(P,α,β)-clustering算法,并分析了

7、算法復雜度;另外還介紹了有損分解IDAnatomy數據發(fā)布方法,其通過將原始關系的準標識符屬性和敏感屬性以兩個不同的關系發(fā)布,利用它們之間的有損連接來保護隱私數據的安全,并且給出了基本的IDAnatomy算法保證發(fā)布的數據滿足隱私保護和實用性要求。最后在實驗環(huán)境中從多個方面比較了原有匿名方法和身份保留的匿名化方法,檢驗了方法的有效性。
   (4)敏感數據圖發(fā)布相關技術的研究
   本文主要提出了一種新的圖聚類安全分組策

8、略和兩種不同實現策略的匿名數據發(fā)布算法。文中首先分析了數字圖書館復雜個體交互關系數據發(fā)布的隱私保護問題,同時根據背景知識對圖攻擊問題進行了增量式知識查詢建模和量化。接著在建立二分圖圖模型和相關定義的基礎上,初步對圖的數據匿名集成和數據匿名化問題進行了探討,同時介紹了簡單匿名化、列舉和劃分等二分圖基本數據匿名發(fā)布方法。而后結合最新研究成果,提出了一種新的圖聚類安全分組策略來提高二分圖發(fā)布數據的可用性,并從實現策略上比較了先聚后分的CKG算

9、法和邊分邊聚的KGC算法,其間還重點分析了兩個關鍵問題--圖泛化信息損失和聚類分組超頂點的描述。最后通過實驗表明,基于聚類安全分組策略匿名方法能為圖中的個體提供隱私保護的同時還能在一定程度上提高匿名圖數據的可用性。
   本文研究了數字圖書館領域幾個常見應用場景下的數據發(fā)布若干關鍵技術,給出了一些可行解決方案,并且對提出的各種算法不僅都作了詳細的性能分析,而且使用數字圖書館運行的實際數據集或綜合數據集對算法進行了詳細實驗。經實驗

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論