最近一直在学习差分隐私,刚开始学的时候由于对这方面的知识不太清楚,一直处于模模糊糊的理解状态。现在学习了一段时间后开始有了一些初步的认识,所以把学习过程中的一些知识总结一下,方便以后复习,也为其他的小伙伴提供一些思路。由于我也是初学者,所以难免会出现一些错误,希望各位大佬可以指出。 本文 ...
数据的隐私保护问题最早由统计学家Dalenius 在 世纪 年代末提出,他认为,保护数据库中的隐私信息,就是要使任何用户 包括合法用户和潜在的攻击者 在访问数据库的过程中无法获取关于任意个体的确切信息 。 从已有的研究来看,k anonymity及其扩展模型在隐私保护领域影响深远且被广泛应用。这些模 型的基本思想是将数据集里与攻击者背景知识相关的属性定义为准标识符,通过对记录的准标识符值进行泛化 ...
2021-01-16 10:27 0 471 推荐指数:
最近一直在学习差分隐私,刚开始学的时候由于对这方面的知识不太清楚,一直处于模模糊糊的理解状态。现在学习了一段时间后开始有了一些初步的认识,所以把学习过程中的一些知识总结一下,方便以后复习,也为其他的小伙伴提供一些思路。由于我也是初学者,所以难免会出现一些错误,希望各位大佬可以指出。 本文 ...
差分隐私的由来 想要在一个统计数据库里面保护用户的隐私,那么理想的隐私定义是这样的:访问一个统计数据库而不能够泄露在这个数据库中关于个人的信息。也就是说统计数据库应该提供一个统计值,但是对于个人的信息不应该被查询到。 但是,这个理想的定义是不可行的,它并没有考虑到辅助信息。比如这么一个 ...
差分隐私是为了在敏感数据上进行数据分析而发展起来的一套机制,通过混淆数据库查询结果,来实现数据在个人层面的隐私性,并且保证查询结果近似正确。这篇文章通过一些例子简要介绍差分隐私的提出动机和思想,主要参考Dwork的The Algorithmic Foundations ...
差分隐私采用了一种随机机制,使得当输入中的单个样本改变之后,输出的分布不会有太大的改变。比如两个数据集中只有1条记录有差别,查询这两个数据集且获得相同输出的概率非常接近。因此,用户即便获取了输出结果,也无法通过结果推测出输入数据来自哪一方。 在现有的隐私保护方法中,差 ...
在听完第五组的报告之后,浅谈一下对差分隐私的认识,主要针对差分隐私的思想做一个大致的梳理。 为什么会产生差分隐私? 由于有些“聪明”的用户为了知道某些信息,可以通过两次查询结果的差异进行对比,从而在两次数据的对比中找到有用的信息。正如在杨顼组的报告中提 ...
差分隐私报告 汇报人:倪元元、曾文丽、杨顼 时间:2020.3.3 1.背景. 2 2.以往的工作及其局限性. 2 3.差分隐私模型. 2 4.差分隐私的性质发展. 3 5.相关定义的发展. 3 6.实现机制. 4 总结. 5 参考文献. 5 1.背景 ...
摘要:本文将先简单介绍Bandit 问题和本地差分隐私的相关背景,然后介绍基于本地差分隐私的 Bandit 算法,最后通过一个简单的电影推荐场景来验证 LDP LinUCB 算法。 Bandit问题是强化学习中一类重要的问题,由于它定义简洁且有大量的理论分析,因此被广泛应用于新闻推荐,医学 ...
...