淺談對差分隱私的理解


       在聽完第五組的報告之后,淺談一下對差分隱私的認識,主要針對差分隱私的思想做一個大致的梳理。

  • 為什么會產生差分隱私?

       由於有些“聰明”的用戶為了知道某些信息,可以通過兩次查詢結果的差異進行對比,從而在兩次數據的對比中找到有用的信息。正如在楊頊組的報告中提到的查詢二等兵約瑟夫阿倫是否陣亡的信息,可以通過查詢D5和D6兩次數據結果,將兩次數據結果進行對比就可以知道約瑟夫阿倫是否陣亡的消息。

  • 差分隱私的主要思想:

        差分隱私是基於噪音的安全計算方法,它的思想是:對計算過程用噪音干擾,讓原始數據淹沒在噪音中,使別有用心者無法從得到的結果反推原始數據。

         為了達到保護隱私的目的,就必須使得數據集的計算處理結果對於具體某個記錄的變化是不敏感的,單個記錄在數據集中或不在數據集中,對計算結果的影響微乎其微,攻擊者或其他惡意用戶無法通過觀察結果獲取准確的個體信息。

  • 那么如何才能做到插分隱私呢?

       差分隱私的一般操作是加噪音,也就是在輸入或輸出上加入隨機化的噪音,以期將真實數據掩蓋掉,最常用的是拉普拉斯噪音。假設在輸出的時候加隨機化的噪音,使得對方在竊取到兩次輸出的結果基本一致,從而達到保護隱私的目的。

       總的來說,差分隱私是針對統計數據庫的隱私泄露問題提出的一種新的隱私定義。使用差分隱私的條件比較苛刻,從上面的介紹中可以看到在加噪音的時候需要使用與原數據分布比較類似的噪音函數,而這一條件就限制了大多數數據其實不滿足插分隱私的使用條件。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM