合成定理

既然我们已经有了几个用于设计差分隐私算法的模块,那么了解如何将它们结合起来设计更复杂的算法就变得非常重要。为了使用这些工具,我们希望两个差分隐私算法的组合本身是差分隐私的。事实上,两个差分隐私算法的组合确实是差分隐私的。当然,参数 ε\varepsilonδ\delta 必然会降级的——考虑使用拉普拉斯机制重复计算相同的统计,每次都是ε-差分隐私。每一个机制实例给出的答案的平均值最终会收敛到统计的真实值,因此我们不能避免我们的隐私保护强度会随着重复使用而降低。在这一节中,我们给出了一些定理,说明当组合差分隐私子程序时,参数 ε\varepsilonδ\delta 是如何精确组合的。

让我们先从一个简单的预热开始:我们将看到独立的 (ε1,0)(\varepsilon_1,0) -差分隐私算法和((ε2,0)(\varepsilon_2,0) -差分隐私算法使用在一起是 (ε1+ε2,0)(\varepsilon_1 + \varepsilon_2,0) -差分隐私算法。

定理 3.14M1:NXR1\mathcal{M}_1:\mathbb{N}^{|\mathcal{X}|}\to \mathcal{R}_1ε1\varepsilon_1 -差分隐私算法,设 M2:NXR2\mathcal{M}_2:\mathbb{N}^{|\mathcal{X}|}\to \mathcal{R}_2ε2\varepsilon_2 -差分隐私算法。然后将它们的组合,定义为M1,2:NXR1×R2\mathcal{M}_{1,2}:\mathbb{N}^{|\mathcal{X}|}\to \mathcal{R}_1 \times \mathcal{R}_2 ,映射为: M1,2(x)=(M1(x),M2(x))\mathcal{M}_{1,2}(x) = (\mathcal{M}_{1}(x),\mathcal{M}_{2}(x))(ε1+ε2)(\varepsilon_1 + \varepsilon_2) -差分隐私算法。

【证明】x,yNXx,y \in \mathbb{N}^{|\mathcal{X}|} 满足 xy11\Vert x-y\Vert _1 \leq 1,任意 (r1,r2)R1×R2(r_1,r_2) \in \mathcal{R}_1 \times \mathcal{R}_2,则:

Pr[M1,2(x)=(r1,r2)]Pr[M1,2(y)=(r1,r2)]=Pr[M1(x)=r1]Pr[M2(x)=r2]Pr[M1(y)=r1]Pr[M2(x)=r2]=(Pr[M1(x)=r1]Pr[M1(y)=r1])(Pr[M2(x)=r2]Pr[M2(x)=r2])exp(ε1)exp(ε2)=exp(ε1+ε2)\begin{aligned} \frac{\text{Pr}[\mathcal{M}_{1,2}(x)=(r_1,r_2)]}{\text{Pr}[\mathcal{M}_{1,2}(y)=(r_1,r_2)]} &= \frac{\text{Pr}[\mathcal{M}_{1}(x)=r_1]\text{Pr}[\mathcal{M}_{2}(x)=r_2]}{\text{Pr}[\mathcal{M}_{1}(y)=r_1]\text{Pr}[\mathcal{M}_{2}(x)=r_2]}\\ &= \Big(\frac{\text{Pr}[\mathcal{M}_{1}(x)=r_1]}{\text{Pr}[\mathcal{M}_{1}(y)=r_1]}\Big)\Big(\frac{\text{Pr}[\mathcal{M}_{2}(x)=r_2]}{\text{Pr}[\mathcal{M}_{2}(x)=r_2]}\Big)\\ &\leq \exp(\varepsilon_1)\exp(\varepsilon_2)\\ &= \exp(\varepsilon_1+\varepsilon_2) \end{aligned}

由对称性,Pr[M1,2(y)=(r1,r2)]Pr[M1,2(x)=(r1,r2)]exp((ε1+ε2))\frac{\text{Pr}[\mathcal{M}_{1,2}(y)=(r_1,r_2)]}{\text{Pr}[\mathcal{M}_{1,2}(x)=(r_1,r_2)]} \geq \exp(-(\varepsilon_1+\varepsilon_2)) 也成立。

【定理 3.14 证毕】

组合定理能反复应用以获得以下推论:

推论 3.15Mi:NXRi\mathcal{M}_i:\mathbb{N}^{|\mathcal{X}|}\to \mathcal{R}_i(εi,0)(\varepsilon_i,0)- 差分隐私算法(i[k]i \in [k])。如果将 M[k]:NXi=1kRi\mathcal{M}_{[k]}:\mathbb{N}^{|\mathcal{X}|}\to \prod_{i=1}^{k}\mathcal{R}_i 定义为 :(M1(x),...,Mk(x))(\mathcal{M}_{1}(x),...,\mathcal{M}_{k}(x)),则 M[k]\mathcal{M}_{[k]}(i=1kεi,0)(\sum_{i=1}^{k}\varepsilon_i,0)- 差分隐私。

该定理推广到 (ε,δ)(\varepsilon,\delta)-差分隐私的证明见附录B:

定理 3.16Mi:NXRi\mathcal{M}_i:\mathbb{N}^{|\mathcal{X}|}\to \mathcal{R}_i(εi,δi)(\varepsilon_i,\delta_i)- 差分隐私算法(i[k]i \in [k])。如果将 M[k]:NXi=1kRi\mathcal{M}_{[k]}:\mathbb{N}^{|\mathcal{X}|}\to \prod_{i=1}^{k}\mathcal{R}_i 定义为 :(M1(x),...,Mk(x))(\mathcal{M}_{1}(x),...,\mathcal{M}_{k}(x)),则 M[k]\mathcal{M}_{[k]}(i=1kεi,i=1kδi)(\sum_{i=1}^{k}\varepsilon_i,\sum_{i=1}^{k}\delta_i)- 差分隐私。

差异隐私的一个优点:其合成是“自动”的,因为获得的限制是保持不变,无需数据提供者对其做任何修改。

最后更新于