前言
隐私保护数据分析的问题由来已久,涉及多个学科。随着有关个人的电子数据变得越来越详细,并且随着技术能够更强大地收集和管理这些数据,对隐私的鲁棒性、隐私的意义和隐私在数学上严格的定义需求不断增长,对满足隐私定义的算法需求也在不断增长。差分隐私就是这样的定义。
在讨论了差分隐私的含义之后,本书主要介绍了实现差分隐私的基本技术,并将这些技术应用于创造性的结合中(第3-7节),其中使用了'查询发布问题'作为示例。其中最重要的是:对比单纯用差分隐私计算替换非隐私的每个计算步骤这种实现方法,通过重新思考计算目标能有更好的结果。
尽管有一些惊人的强大的计算结果,但仍然存在根本的局限性——不仅局限于使用差分隐私可以实现什么目标,而且还局限于什么方法可以防止隐私被完全破坏(泄露)(第8节)。
实际上,本书中讨论的所有算法都针对不同计算能力的对手保持着不同的隐私。某些算法是计算密集型的,其他算法则为高效率的。攻击者和算法的计算复杂度均在第9节中讨论。
在第10节和第11节中,我们从基础知识转向查询发布以外的应用程序,讨论了用于机制设计和机器学习的差分私有方法。关于差分私有算法的绝大多数文献都考虑了要进行大量分析的单个静态数据库。在第12节中讨论了其他模型中的差分隐私,包括分布式数据库和数据流计算。
最后,这本书是对差分隐私问题和技术的全面介绍,但并不是要进行详尽的调查,因为到目前为止,在差分隐私方面有大量研究,我们可以只覆盖一小部分。
最后更新于