3.6.2 稀疏算法
最后更新于
最后更新于
现在,我们展示如何使用合成技术处理多个“高于阈值”的查询。
稀疏算法可以认为是:当查询进入时,它会反复调用 AboveThreshold。 每次报告高于阈值的查询后,该算法仅在 AboveThreshold 的新实例上重新启动剩余的查询流。在重新启动AboveThreshold 次之后停止(即在出现 个高于阈值的查询之后)。 由于 AboveThreshold 的每个实例都是- 差分隐私的,因此适用合成定理。
定理 3.25 稀疏算法是 -差分隐私的。
【证明】 我们发现到 Sparse 算法完全等同于以下过程:我们对查询流 运行 AboveThreshold 算法 ,并设置:
需要证明 包含 个 AboveThreshold 算法 的 Sparse 算法的准确性。我们注意到,如果对于每个 AboveThreshold 算法 精确的,那么 Sparse 算法将是 精确的。
【定理 3.25 证毕】
定理 3.26 对于 k 个查询的任何序列, 使得 。如果 ,当:
Sparse 算法是 精确的。
如果 ,当:
Sparse 算法是 精确的。
使用 AboveThreshold 算法提供答案。当 AboveThreshold 算法停止时(在回答了1个超过阈值的查询之后),我们只需在剩余的查询流上重新启动 Sparse算法 ,并继续这个过程直到我们重新启动 AboveThreshold 算法 次。第 次 AboveThreshold 算法停止后,Sparse算法 也停止。我们已经证明了AboveThreshold 算法 是-差分隐私的。最后,根据高级合成定理(), 个 -差分隐私算法的合成是 -差分隐私,并且 个 - 差分隐私算法的合成是 -差分隐私。
【证明】 运用 的证明方法,将 设为,并分别根据 或 将 设为 和 即可。