在本节中,我们将推导出隐私累加权重算法的离线泛化算法,可以使用任何适当定义的学习算法将这个算法进行实例化。一般来说,数据库更新算法维护一系列数据结构 D 1 , D 2 , . . . D^1,D^2,... D 1 , D 2 , ... x x x f f f f f f x x x D t D^t D t f ( D t ) f(D^t) f ( D t ) f ( x ) f(x) f ( x ) 
从语法上讲,我们将考虑形式为 U : D × Q × R → D U:\mathcal{D}\times\mathcal{Q}\times\mathbb{R}\to \mathcal{D} U : D × Q × R → D D \mathcal{D} D Q \mathcal{Q} Q U U U D \mathcal{D} D D t D^t D t f f f Q \mathcal{Q} Q x x x f ( x ) f(x) f ( x ) 数据库更新序列 D 1 , D 2 , . . . D^1,D^2,... D 1 , D 2 , ... U U U 
定义 5.3 数据库更新序列  设 x ∈ N ∣ X ∣ x\in \mathbb{N}^{|\mathcal{X}|} x ∈ N ∣ X ∣ { ( D t , f t , v t ) } t = 1 , . . . , L ∈ ( D × Q × R ) L \{(D^t,f_t,v_t)\}_{t=1,...,L}\in(\mathcal{D}\times\mathcal{Q}\times\mathbb{R})^L {( D t , f t  , v t  ) } t = 1 , ... , L  ∈ ( D × Q × R ) L 
1、D 1 = U ( ⊥ , ⋅ , ⋅ ) D^1=U(\bot,\cdot,\cdot) D 1 = U ( ⊥ , ⋅ , ⋅ ) 
2、任意 t = 1 , 2 , . . . , L , ∣ f t ( x ) − f t ( D t ) ∣ ≥ α t=1,2,...,L,|f_t(x)-f_t(D^t)|\geq \alpha t = 1 , 2 , ... , L , ∣ f t  ( x ) − f t  ( D t ) ∣ ≥ α 
3、任意 t = 1 , 2 , . . . , L , ∣ f t ( x ) − v t ∣ < α t=1,2,...,L,|f_t(x)-v_t| < \alpha t = 1 , 2 , ... , L , ∣ f t  ( x ) − v t  ∣ < α 
4、任意 t = 1 , 2 , . . . , L − 1 , D t + 1 = U ( D t , f t , v t ) t=1,2,...,L-1,D^{t+1}=U(D^t,f_t,v_t) t = 1 , 2 , ... , L − 1 , D t + 1 = U ( D t , f t  , v t  ) 
则将其这个序列称之为:( U , x , Q , α , T ) (U,x,\mathcal{Q},\alpha,T) ( U , x , Q , α , T ) ( U , x , Q , α , T ) − d a t a b a s e   u p d a t e   s e q u e n c e (U,x,\mathcal{Q},\alpha,T)-database\ update \ sequence ( U , x , Q , α , T ) − d a t aba se   u p d a t e   se q u e n ce 
注意,对于数据库更新算法,近似响应 v t v_t v t  f t ( x ) − f t ( D t ) f_t(x)-f_t(D^t) f t  ( x ) − f t  ( D t ) 条件3 中要求 f t ( x ) − v t f_t(x)-v_t f t  ( x ) − v t  α \alpha α D t D^t D t Q \mathcal{Q} Q x x x 
定义5.4 数据库更新算法  令 U : D × Q × R → D U:\mathcal{D}\times\mathcal{Q}\times\mathbb{R}\to \mathcal{D} U : D × Q × R → D T : R → R T:\mathbb{R}\to\mathbb{R} T : R → R x ∈ N ∣ X ∣ x\in \mathbb{N}^{|\mathcal{X}|} x ∈ N ∣ X ∣ ( U , x , Q , α , T ) (U,x,\mathcal{Q},\alpha,T) ( U , x , Q , α , T ) L ≤ T ( α ) L\leq T(\alpha) L ≤ T ( α ) U U U Q \mathcal{Q} Q T ( α ) T(\alpha) T ( α ) 
T ( α ) T(\alpha) T ( α ) U U U T ( α ) T(\alpha) T ( α ) ( U , x , Q , α , U ) (U,x,\mathcal{Q},\alpha,U) ( U , x , Q , α , U ) D L D^L D L max  f ∈ Q ∣ f ( x ) − f ( D L ) ∣ ≤ α \max_{f\in\mathcal{Q}}|f(x)-f(D^L)|\leq \alpha max f ∈ Q  ∣ f ( x ) − f ( D L ) ∣ ≤ α ( U , x , Q , α , L + 1 ) (U,x,\mathcal{Q},\alpha,L+1) ( U , x , Q , α , L + 1 ) T ( α ) T(\alpha) T ( α ) f ∈ Q f\in\mathcal{Q} f ∈ Q 
既然我们已经定义了数据库更新算法,那么在 定理4.10 T ( α ) = 4 log  ∣ X ∣ / α 2 T(\alpha)=4\log|\mathcal{X}|/\alpha^2 T ( α ) = 4 log  ∣ X ∣/ α 2 T ( α ) T(\alpha) T ( α ) 
到此让我们为数据库更新算法建立一些直观概念。 T ( α ) T(\alpha) T ( α ) x x x D 1 D^1 D 1 D 1 D^1 D 1 x x x f ∈ Q f\in \mathcal{Q} f ∈ Q α \alpha α f ( x ) f(x) f ( x ) f ( D 1 ) f(D^1) f ( D 1 ) α \alpha α D t − 1 D^{t-1} D t − 1 D t D^t D t Q \mathcal{Q} Q T ( α ) T(\alpha) T ( α ) T ( α ) T(\alpha) T ( α ) Q \mathcal{Q} Q D t D^t D t D t D^t D t x x x α \alpha α   [ 1 ] \ ^{[1]}   [ 1 ] T ( α ) T(\alpha) T ( α ) 
(原书注[1]:假设数据库更新算法企图从整个数据集中抽出一块来构建x x x D 1 D^1 D 1 α \alpha α 
数据库更新算法和在线学习算法 :我们注意到数据库更新算法本质上是在线学习算法中的错误边界模型(the mistake bound model)。在在线学习的设置中,未标记的示例以任意顺序到达,学习算法必须尝试标记它们。
**学习理论的背景. **在错误边界模型中,被标记的样本( x i , y i ) ∈ X × { 0 , 1 } (x_i,y_i)\in \mathcal{X}\times\{0,1\} ( x i  , y i  ) ∈ X × { 0 , 1 } i i i A A A x i x_i x i  x i x_i x i  y i ^ \hat{y_i} y i  ^  y i y_i y i  y i ≠ y i ^ y_i\neq\hat{y_i} y i   = y i  ^  A A A C C C f ∈ C f\in C f ∈ C ( x 1 , f ( x 1 ) ) , . . . , ( x i , f ( x i ) ) , . . . (x_1,f(x_1)),...,(x_i,f(x_i)),... ( x 1  , f ( x 1  )) , ... , ( x i  , f ( x i  )) , ... A A A M M M A A A M M M f ^ : X → { 0 , 1 } \hat{f}:X\to\{0,1\} f ^  : X → { 0 , 1 } 
不难看出,对于有限类的函数C来说,错误受限的在线学习算法总是存在的,例如,考虑减半算法(the halving algorithm)。减半算法最初维护一个与它迄今所见的样例集相一致的C C C S S S S = C S=C S = C ∣ f ∈ S : f ( x i ) = 1 ∣ ≥ ∣ S ∣ / 2 |f\in S:f(x_i)=1|\geq|S|/2 ∣ f ∈ S : f ( x i  ) = 1∣ ≥ ∣ S ∣/2 x i x_i x i  S S S S ← f ∈ S : f ( x i ) = y i S\leftarrow{f\in S:f(x_i)=y_i} S ← f ∈ S : f ( x i  ) = y i  S S S f ∈ C f\in C f ∈ C f ∈ C f\in C f ∈ C S S S log  ∣ C ∣ \log|C| log  ∣ C ∣ 
除了布尔标签,我们还可以将数据库更新算法视为错误边界模型中的在线学习算法:
这里的例子是查询(可能以敌对顺序出现)。标签是在数据库上评估(个人理解:查询)时查询的近似值。如∣ f ( D t ) − f ( x ) ∣ ≥ α |f(D_t)-f(x)|\geq\alpha ∣ f ( D t  ) − f ( x ) ∣ ≥ α D t D_t D t  f f f f f f v t v_t v t  U U U T ( α ) − T(\alpha)- T ( α ) − T ( α ) T(\alpha) T ( α ) T ( α ) − T(\alpha)- T ( α ) − 
一类Q的数据库更新算法将与相应的区分器一起发挥作用,区分器的工作是输出一个在真实数据库x x x D t D_t D t  
定义 5.5( ( F ( ε ) , γ ) (F(\varepsilon),\gamma) ( F ( ε ) , γ ) -私有区分器  令Q Q Q γ ≥ 0 \gamma\geq0 γ ≥ 0 F ( ε ) : R → R F(\varepsilon):\mathcal{R}\to\mathcal{R} F ( ε ) : R → R   ε \ _{\varepsilon}   ε  N ∣ X ∣ × D → Q \mathbb{N}^{|\mathcal{X}|}\times\mathcal{D}\to\mathcal{Q} N ∣ X ∣ × D → Q Q Q Q ( F ( ε ) , γ ) (F(\varepsilon),\gamma) ( F ( ε ) , γ ) ε \varepsilon ε x ∈ N ∣ X ∣ x\in\mathbb{N}^{|X|} x ∈ N ∣ X ∣ D ∈ D D\in\mathcal{D} D ∈ D x x x ( ε , 0 ) (\varepsilon,0) ( ε , 0 ) f ∗ ∈ Q f^*\in\mathcal{Q} f ∗ ∈ Q ∣ f ∗ ( x ) − f ∗ ( D ) ∣ ≥ max  f ∈ Q ∣ f ( x ) − f ( D ) ∣ − F ( ε ) |f^{*}(x)-f^{*}(D)|\geq\max_{f\in\mathcal{Q}}|f(x)-f(D)|-F(\varepsilon) ∣ f ∗ ( x ) − f ∗ ( D ) ∣ ≥ max f ∈ Q  ∣ f ( x ) − f ( D ) ∣ − F ( ε ) 1 − γ 1-\gamma 1 − γ 
备注 5.1  在机器学习中,目标是从一类函数Q Q Q f : X → 0 , 1 f : \mathcal{X} \to{0,1} f : X → 0 , 1 ( x 1 , y 1 ) , . . . , ( x m , y m ) ∈ X × { 0 , 1 } (x_1,y_1),...,(x_m,y_m)\in\mathcal{X} \times \{0,1\} ( x 1  , y 1  ) , ... , ( x m  , y m  ) ∈ X × { 0 , 1 } ( x , 0 ) (x,0) ( x , 0 ) ( x , 1 ) (x,1) ( x , 1 ) x i x_i x i  y i y_i y i  f f f x i x_i x i  f ( x i ) = y i f(x_i)=y_i f ( x i  ) = y i  Q \mathcal{Q} Q Q \mathcal{Q} Q Q \mathcal{Q} Q Q \mathcal{Q} Q x x x y y y x x x y y y Q \mathcal{Q} Q f f f f ( x ) − f ( y ) = f ( x − y ) f(x)-f(y)=f(x-y) f ( x ) − f ( y ) = f ( x − y ) a r g   max  f ∈ Q ∣ f ( x − y ) ∣ arg\space\max_{f\in\mathcal{Q}}|f(x-y)| a r g   max f ∈ Q  ∣ f ( x − y ) ∣ 
请注意,先验的差分私隐私分器比差分隐私发布算法弱:区分器仅在集合Q \mathcal{Q} Q Q \mathcal{Q} Q 
我们先分析IC算法,然后用一个特定的区分器和数据库更新算法将其实例化。以下是一个正式的分析,但该机制从直观来看是简单的:我们只需要运行迭代数据库构建算法来构建一个相对于查询Q \mathcal{Q} Q x x x Q \mathcal{Q} Q β \beta β T T T ( ε 0 , 0 ) − (\varepsilon_0,0)- ( ε 0  , 0 ) − 2 T 2T 2 T 
对该算法的分析只是涉及检查一个简单直观的技术细节。符合隐私是因为这个算法仅由2 T ( α ) 2T(\alpha) 2 T ( α ) ( ε 0 , 0 ) − (\varepsilon_0,0)- ( ε 0  , 0 ) − 
**定理 5.3 **IC算法对于ε 0 ≤ ε / 2 T ( α / 2 ) \varepsilon_0\leq\varepsilon/2T(\alpha/2) ε 0  ≤ ε /2 T ( α /2 ) ( ε , 0 ) − (\varepsilon,0)- ( ε , 0 ) − ε 0 ≤ ε 4 T ( α / 2 ) l o g ( 1 / δ ) \varepsilon_0\leq\frac{\varepsilon}{4\sqrt{T(\alpha/2)log(1/\delta)}} ε 0  ≤ 4 T ( α /2 ) l o g ( 1/ δ )  ε  ( ε , δ ) − (\varepsilon,\delta)- ( ε , δ ) − 
【证明】该算法最多运行2 T ( α / 2 ) 2T(\alpha/2) 2 T ( α /2 ) ε 0 − \varepsilon_0- ε 0  − 3.20 ε 0 − \varepsilon_0- ε 0  − 2 k − fold 2k-\text{fold} 2 k − fold 2 k ε 0 2k\varepsilon_0 2 k ε 0  ε ′ = 4 k  ln ( 1 / δ ′ ) ε 0 + 2 k ε 0 ( e ε 0 − 1 ) \varepsilon'=\sqrt{4k\space\text{ln}(1/\delta')}\varepsilon_0+2k\varepsilon_0(e^{\varepsilon_0}-1) ε ′ = 4 k   ln ( 1/ δ ′ )  ε 0  + 2 k ε 0  ( e ε 0  − 1 ) ε 0 \varepsilon_0 ε 0  
定理 5.4  给定一个( F ( ε ) , γ ) − (F(\varepsilon),\gamma)- ( F ( ε ) , γ ) − ε 0 \varepsilon_0 ε 0  T ( α ) − T(\alpha)- T ( α ) − 1 − β 1-\beta 1 − β y y y m a x f ∈ Q ∣ f ( x ) − f ( y ) ∣ ≤ α max_{f\in\mathcal{Q}}|f(x)-f(y)|\leq\alpha ma x f ∈ Q  ∣ f ( x ) − f ( y ) ∣ ≤ α α \alpha α 
α ≥ max  [ 8 log ( 2 T ( α / 2 ) / β ) ε 0 ∣ ∣ x ∣ ∣ 1 , 8 F ( ε 0 ) ] \alpha\geq\max\big[\frac{8\text{log}(2T(\alpha/2)/\beta)}{\varepsilon_0||x||_1},8F(\varepsilon_0)\big] α ≥ max [ ε 0  ∣∣ x ∣ ∣ 1  8 log ( 2 T ( α /2 ) / β )  , 8 F ( ε 0  ) ] 只要γ ≤ β / ( 2 T ( α / 2 ) ) \gamma\leq\beta/(2T(\alpha/2)) γ ≤ β / ( 2 T ( α /2 )) 
【证明】分析是直观的。
回顾一下,如果Y i ∼ L a p ( 1 / ε ∣ ∣ x ∣ ∣ 1 ) Y_i\sim Lap(1/\varepsilon||x||_1) Y i  ∼ L a p ( 1/ ε ∣∣ x ∣ ∣ 1  ) Pr [ ∣ Y i ∣ ≥ t / ( ε ∣ ∣ x ∣ ∣ 1 ) ] = exp ( − t ) \text{Pr}[|Y_i|\geq t/(\varepsilon||x||_1)]=\text{exp}(-t) Pr [ ∣ Y i  ∣ ≥ t / ( ε ∣∣ x ∣ ∣ 1  )] = exp ( − t ) Y 1 , . . . , Y k ∼ L a p ( 1 / ε ∣ ∣ x ∣ ∣ 1 ) Y_1,...,Y_k\sim Lap(1/\varepsilon||x||_1) Y 1  , ... , Y k  ∼ L a p ( 1/ ε ∣∣ x ∣ ∣ 1  ) Pr [ m a x i ∣ Y i ∣ ≥ t / ( ε ∣ ∣ x ∣ ∣ 1 ) ] = k  exp ( − t ) \text{Pr}[max_i|Y_i|\geq t/(\varepsilon||x||_1)]=k\space\text{exp}(-t) Pr [ ma x i  ∣ Y i  ∣ ≥ t / ( ε ∣∣ x ∣ ∣ 1  )] = k   exp ( − t ) L a p ( 1 / ε 0 ∣ ∣ x ∣ ∣ 1 ) Lap(1/\varepsilon_0||x||_1) L a p ( 1/ ε 0  ∣∣ x ∣ ∣ 1  ) T ( α / 2 ) T(\alpha/2) T ( α /2 ) T ( α / 2 ) T(\alpha/2) T ( α /2 ) L a p ( 1 / ε 0 ∣ ∣ x ∣ ∣ 1 ) Lap(1/\varepsilon_0||x||_1) L a p ( 1/ ε 0  ∣∣ x ∣ ∣ 1  ) v ^ ( t ) \hat{v}^{(t)} v ^ ( t ) T ( α / 2 ) T(\alpha/2) T ( α /2 ) β / 2 \beta/2 β /2 t t t 
∣ v ^ ( t ) − f ( t ) ( x ) ∣ ≤ 1 ε 0 ∣ ∣ x ∣ ∣ 1 log 2 T ( α / 2 ) β ≤ α 8 |\hat{v}^{(t)}-f^{(t)}(x)|\leq\frac{1}{\varepsilon_0||x||_1}\text{log}\frac{2T(\alpha/2)}{\beta}\leq\frac{\alpha}{8} ∣ v ^ ( t ) − f ( t ) ( x ) ∣ ≤ ε 0  ∣∣ x ∣ ∣ 1  1  log β 2 T ( α /2 )  ≤ 8 α  (个人注:第一个不等式是令t = log 2 T ( α / 2 ) β t=\text{log}\frac{2T(\alpha/2)}{\beta} t = log β 2 T ( α /2 )  β / 2 \beta/2 β /2 ∣ v ^ ( t ) − f ( t ) ( x ) ∣ ≥ α / 8 |\hat{v}^{(t)}-f^{(t)}(x)|\geq\alpha/8 ∣ v ^ ( t ) − f ( t ) ( x ) ∣ ≥ α /8 1 − β / 2 1-\beta/2 1 − β /2 α / 8 \alpha/8 α /8 
请注意,通过假设,γ ≤ β / ( 2 T ( α / 2 ) ) \gamma\leq\beta/(2T(\alpha/2)) γ ≤ β / ( 2 T ( α /2 )) β / 2 \beta/2 β /2 
∣ f ( t ) ( x ) − f ( t ) ( D t − 1 ) ∣ ≥ max  f ∈ Q ∣ f ( x ) − f ( D t − 1 ) ∣ − F ( ε 0 ) ≥ max  f ∈ Q ∣ f ( x ) − f ( D t − 1 ) ∣ − α 8 \begin{aligned} |f^{(t)}(x)-f^{(t)}(D^{t-1})|&\geq\max_{f\in\mathcal{Q}}|f(x)-f(D^{t-1})|-F(\varepsilon_0)\\ &\geq\max_{f\in\mathcal{Q}}|f(x)-f(D^{t-1})|-\frac{\alpha}{8} \end{aligned} ∣ f ( t ) ( x ) − f ( t ) ( D t − 1 ) ∣  ≥ f ∈ Q max  ∣ f ( x ) − f ( D t − 1 ) ∣ − F ( ε 0  ) ≥ f ∈ Q max  ∣ f ( x ) − f ( D t − 1 ) ∣ − 8 α   对于剩下的的讨论,我们将以这两个事件的发生为条件,除了概率β \beta β 
这里有两种情况。一种是数据结构D ′ = D T ( α / 2 ) D'=D^{T(\alpha/2)} D ′ = D T ( α /2 ) t < T ( α / 2 ) t<T(\alpha/2) t < T ( α /2 ) D ′ = D t D'=D^t D ′ = D t D ′ = D T ( α / 2 ) D'=D^{T(\alpha/2)} D ′ = D T ( α /2 ) t < T ( α / 2 ) t<T(\alpha/2) t < T ( α /2 ) ∣ v ^ ( t ) − f ( t ) ( D t − 1 ) ∣ ≥ 3 α / 4 |\hat{v}^{(t)}-f^{(t)}(D^{t-1})|\geq3\alpha/4 ∣ v ^ ( t ) − f ( t ) ( D t − 1 ) ∣ ≥ 3 α /4 ∣ v ^ ( t ) − f ( t ) ( x ) ∣ ≤ α / 8 |\hat{v}^{(t)}-f^{(t)}(x)|\leq\alpha/8 ∣ v ^ ( t ) − f ( t ) ( x ) ∣ ≤ α /8 t t t ∣ f ( t ) ( x ) − f ( t ) ( D t − 1 ) ∣ ≥ α / 2 |f^{(t)}(x)-f^{(t)}(D^{t-1})|\geq\alpha/2 ∣ f ( t ) ( x ) − f ( t ) ( D t − 1 ) ∣ ≥ α /2 ( D t , f ( t ) , v ^ ( t ) ) (D^t,f^{(t)},\hat{v}^{(t)}) ( D t , f ( t ) , v ^ ( t ) ) ( U , x , Q , α / 2 , T ( α / 2 ) ) − (U,x,\mathcal{Q},\alpha/2,T(\alpha/2))- ( U , x , Q , α /2 , T ( α /2 )) − max  f ∈ Q ∣ f ( x ) − f ( x ′ ) ∣ ≤ α / 2 \max_{f\in\mathcal{Q}}|f(x)-f(x')|\leq\alpha/2 max f ∈ Q  ∣ f ( x ) − f ( x ′ ) ∣ ≤ α /2 
接着,假设对于t < T ( α / 2 ) t<T(\alpha/2) t < T ( α /2 ) D ′ = D t − 1 D'=D^{t-1} D ′ = D t − 1 t t t ∣ v ^ ( t ) − f ( t ) ( D t − 1 ) ∣ < 3 α / 4 |\hat{v}^{(t)}-f^{(t)}(D^{t-1})|<3\alpha/4 ∣ v ^ ( t ) − f ( t ) ( D t − 1 ) ∣ < 3 α /4 ∣ f ( t ) ( x ) − f ( t ) ( D t − 1 ) ∣ ≤ 7 α 8 |f^{(t)}(x)-f^{(t)}(D^{t-1})|\leq\frac{7\alpha}{8} ∣ f ( t ) ( x ) − f ( t ) ( D t − 1 ) ∣ ≤ 8 7 α  ( F ( ε 0 ) , γ ) − (F(\varepsilon_0),\gamma)- ( F ( ε 0  ) , γ ) − 
max  f ∈ Q ∣ f ( x ) − f ( D ′ ) ∣ < 7 α 8 + F ( ε 0 ≤ α ) \max_{f\in\mathcal{Q}}|f(x)-f(D')|<\frac{7\alpha}{8}+F(\varepsilon_0\leq\alpha) f ∈ Q max  ∣ f ( x ) − f ( D ′ ) ∣ < 8 7 α  + F ( ε 0  ≤ α ) 也得到满足。
请注意,我们可以使用指数机制作为私有区分器:将域作为Q \mathcal{Q} Q q ( D , f ) = ∣ f ( D ) − f ( D t ) ∣ q(D,f)=|f(D)-f(D^t)| q ( D , f ) = ∣ f ( D ) − f ( D t ) ∣ 1 / ∣ ∣ x ∣ ∣ 1 1/||x||_1 1/∣∣ x ∣ ∣ 1  
定理 5.5  指数机制是一个( F ( ε ) , γ ) − (F(\varepsilon),\gamma)- ( F ( ε ) , γ ) − 
F ( ε ) = 2 ∣ ∣ x ∣ ∣ 1 ε ( log  ∣ Q ∣ γ ) F(\varepsilon)=\frac{2}{||x||_1\varepsilon}\big(\log\frac{|Q|}{\gamma}\big) F ( ε ) = ∣∣ x ∣ ∣ 1  ε 2  ( log  γ ∣ Q ∣  ) 因此,使用指数机制作为区分器,定理5.4给出:
定理 5.6  给定一个T ( α ) − T(\alpha)- T ( α ) − ε 0 \varepsilon_0 ε 0  1 − β 1-\beta 1 − β y y y max  f ∈ Q ∣ f ( x ) − f ( y ) ∣ ≤ α \max_{f\in\mathcal{Q}}|f(x)-f(y)|\leq\alpha max f ∈ Q  ∣ f ( x ) − f ( y ) ∣ ≤ α 
α ≤ max  [ 8 log ( 2 T ( α / 2 ) / β ) ε 0 ∣ ∣ x ∣ ∣ 1 , 16 ∣ ∣ x ∣ ∣ 1 ε 0 ( log  ∣ Q ∣ γ ) ] \alpha\leq\max\big[\frac{8\text{log}(2T(\alpha/2)/\beta)}{\varepsilon_0||x||_1},\frac{16}{||x||_1\varepsilon_0}\big(\log\frac{|\mathcal{Q}|}{\gamma}\big)\big] α ≤ max [ ε 0  ∣∣ x ∣ ∣ 1  8 log ( 2 T ( α /2 ) / β )  , ∣∣ x ∣ ∣ 1  ε 0  16  ( log  γ ∣ Q ∣  ) ] 只要γ ≤ β / ( 2 T ( α / 2 ) ) \gamma\leq\beta/(2T(\alpha/2)) γ ≤ β / ( 2 T ( α /2 )) 
插入我们的ε 0 \varepsilon_0 ε 0  
定理 5.7  给定一个T ( α ) − T(\alpha)- T ( α ) − ε − \varepsilon- ε − 1 − β 1-\beta 1 − β y y y max  f ∈ Q ∣ f ( x ) − f ( y ) ∣ ≤ α \max_{f\in\mathcal{Q}}|f(x)-f(y)|\leq\alpha max f ∈ Q  ∣ f ( x ) − f ( y ) ∣ ≤ α 
α ≤ 8 T ( α / 2 ) ∣ ∣ x ∣ ∣ 1 ε ( log  ∣ Q ∣ γ ) \alpha\leq\frac{8T(\alpha/2)}{||x||_1\varepsilon}\big(\log\frac{|\mathcal{Q}|}{\gamma}\big) α ≤ ∣∣ x ∣ ∣ 1  ε 8 T ( α /2 )  ( log  γ ∣ Q ∣  ) 对于:
α ≤ 16 T ( α / 2 ) log  ( 1 / δ ) ∣ ∣ x ∣ ∣ 1 ε ( log  ∣ Q ∣ γ ) \alpha\leq\frac{16\sqrt{T(\alpha/2)\log(1/\delta)}}{||x||_1\varepsilon}\big(\log\frac{|\mathcal{Q}|}{\gamma}\big) α ≤ ∣∣ x ∣ ∣ 1  ε 16 T ( α /2 ) log  ( 1/ δ )   ( log  γ ∣ Q ∣  ) 是( ε , δ ) − (\varepsilon,\delta)- ( ε , δ ) − γ ≤ β / ( 2 T ( α / 2 ) ) \gamma\leq\beta/(2T(\alpha/2)) γ ≤ β / ( 2 T ( α /2 )) 
请注意,在本节的论述中,我们在定理4.10 T ( α ) = 4 log  ∣ X ∣ α 2 T(\alpha)=\frac{4\log|\mathcal{X}|}{\alpha^2} T ( α ) = α 2 4 l o g ∣ X ∣  T ( α ) − T(\alpha)- T ( α ) −