信息設計學習筆記係列。
The Persuasion Duality
如果 concavification 比较难做的时候怎么办呢? Dworczak, P., & Kolotilin, A. (2024) 这篇文章提供了一个比较 general 的 duality 方法。
預備知識
The Primal and the Dual problem
The primal problem 是给目标函数寻找 concave closure。什么是 concave closure 呢?就是通过在函数图像上的点的凸组合来逼近目标函数,通过取凸组合、即“连线”来把原本不是凹函数的目标函数给抹平,即最原本的 Bayesian Persuasion 问题。在 Dworczak, P., & Kolotilin, A. (2024) 文中,他们称为 inner construction。文中 Figure 1 里为红线。
The dual problem 是给目标函数寻找 concave envelope。什么是 concave envelope 呢?就是用凹函数从上方来逼近目标函数,即对那些逐点大于目标函数的仿射函数取下确界,这些仿射函数具有不同的斜率,从上方逼近目标函数的过程就是把这些仿射函数往下拉,来贴近目标函数。他们称为 outer construction。为蓝线。
两者有什么共同点呢?它们都是在构建 convex hull。即,把目标函数的图变成一个凸集。
Supergradient
参见 一些簡單的凸分析
令 C 为 凸集,f 为定义在 C 上的凹函数。称向量 p 是函数 f 在点 x∈C 处的 supergradient, 如果对于任何向量 y,都有 f(x)+p⋅(y−x)≥f(y)。
这是对于 gradient 的推广。如果 f 本身是可微的,那么不等式就是我们常见的 f(x)+f′(x)⋅(y−x)≥f(y)。
(一个 loosely 的理解方法:如果f 本身是二阶连续可导的单变量函数,那么的对 f(y) 在 x 点做二阶 Taylor expansion,那么 f(y)=f(x)+f′(x)(y−x)+21f′′(x)(y−x)2,而凹函数f′′(x)≤0,所以 f(x)+f′(x)(y−x)≥f(y))
这篇文章表明,最优的 dual variable 就是目标函数的 concave closure (本来是与 Primal 相联系的)在先验信念处的 supergradient。我们前面的定义里 f 需要是 concave 的,但是目标函数却未必是 concave 的(即,目标函数本身不是我们定义里的 f),所以需要取 concave closure,使得我们的新目标函数 f 变成 concave 的。既然新目标函数是通过取 concave closure 得到的,那么就意味着新目标函数逐点不高于原本的目标函数,而先验信念就是此处的 x,对于任何信念 y 来说,这个 optimal dual variable p 使得
weak⋆拓撲
給定嚮量空間X,將定義在X上的所有連續線性泛函(強調連續是因為X可能是無限維空間,此時線性函數並不自動就是連續的,預設採用範數引緻的度量拓撲)f:X→R們記為X⋆,那麼使得所有這些f∈X⋆連續的、最小的(如果不要求最小,那麼它們本來在範數引緻的度量拓撲下就已經是連續的)在X上的拓撲,就是X上的 weak topology,記為σ(X,X⋆);
進而,給定X⋆,同樣將那些使得連續線性泛函g:X⋆→R們g∈X⋆⋆連續的最小拓撲為σ(X⋆,X⋆⋆),這一拓撲是定義在X⋆上的weak topology;
最後,由於X⊂X⋆⋆,將σ(X⋆,X⋆⋆)削弱為σ(X⋆,X),則得到了在X⋆上的weak⋆ topology。
更弱的拓撲具有更少的開集、更多的閉集和緊集、更多的連續函數。
Riesz-Markov-Kakutani representation theorem
任一線性連續(等價於線性有界)泛函H∈Δ(Ω)都可以用某個P∈C(Ω)錶示為H(μ)=∫ΩP(ω)dμ(ω)。
這個隻是夠用的版本,實際的 RMK 錶示定理適用範圍更廣,比如Δ(Ω)可以推廣為任何局部緊的Hausdorff空間、取值可以為複數等等,可見Rudin (1987)。
凸序
對於兩個隨機變數A和B,如果任給凸函數u,都有E[u(A)]≤E[u(B)],則稱A在凸序意義下小於B,記為A≤cxB。
模型
狀態空間Ω為緊度量空間。令Δ(Ω)為Ω上的 Borel 機率測度的集合,並具有weak⋆ topology。先驗信念μ0具有全支撐。目標函數V:Δ(Ω)→R為上半(semi)連續的。
那麼,為什麼我們需要在Δ(Ω)上的weak⋆ topology 呢?後麵我們會看到,因為我們需要使得Δ(Ω)是個緊度量空間、從而保證最優化問題解的存在性。並且,雖然機率測度並不是線性的,但構成我們問題的積分操作是線性的。但這一設定也會帶來一些問題,後麵會詳述。
Primal Problem
(P)
選擇τ∈Δ(Δ(Ω)),來最大化
∫Δ(Ω)V(μ)dτ(μ)s.t.∫Δμdτ(μ)=μ0
Dual Problem
(D)
選擇P∈C(Ω),其中C(Ω)為Ω上連續函數的集合,來最小化
∫ΩP(ω)dμ0(ω)s.t.∫ΩP(ω)dμ(ω)≥V(μ)∀μ∈Δ(Ω)
原問題解的存在性
首先,我們錶明,當Ω為緊度量空間時,Δ(Ω)在weak⋆拓撲下也是緊的,並且是可度量化的。
Lemma 1. 緊Hausdorff空間X是可度量化的,當且僅當C(X)是可分的Banach格。
格範數是一個關於嚮量絕對值單調的範數,賦範Riesz空間是結合了格範數的Riesz空間。如果這個範數還具有完備性,則這個空間就成為了Banach格。
因為Ω為度量空間,根據定義,Ω是可度量化的 Hausdorff 空間。因此,C(X)是一個可分的 Banach 格。
Lemma 2. (Alaoglu’s Thm)一個賦範空間的範數對偶上的閉單位球,是weak⋆緊的。從而,範數對偶的一個子集是weak⋆緊的當且僅當它是weak⋆閉且範數有界的。
Lemma 3. 一個賦範空間是可分的,當且僅當其對偶空間的閉單位求是weak⋆可度量化的。
因此,C(X)中的閉單位球是weak⋆緊且weak⋆可度量化的。作為這個閉單位球的子集,Δ(Ω)是weak⋆緊且weak⋆可度量化的。進而,Δ(Δ(Ω))是weak⋆緊且weak⋆可度量化的。因為τ→∫Δ(Ω)μdτ(μ)是連續函數,滿足約束∫Δ(Ω)μdτ(μ)=μ0的那些分佈τ們是個閉集(單點集μ0是閉集,而連續函數使得閉集的原像閉),而緊空間的閉子集是緊集,因此那些可行的τ們構成一個緊集。
Def. 令Ω為度量空間,並賦予 Borel σ代數Σ。稱(Ω,Σ)上的機率測度序列μn弱⋆收斂於(Ω,Σ)上的機率測度μ,如果對於任何 usc 且上有界的函數f,都有limsupEnf(x)≤Ef(x)。其中En是函數f(x)關於μn的期望,E是關於μ的。
根據假設,V在採用weak⋆拓撲下是上半連續的,由於其定義域Δ(Ω)為緊集,因此其為上有界的,因此函數∫Δ(Ω)V(μ)dτ(μ)也是上半連續的。
從而,根據 Weierstrass 定理,緊集{τ∈Δ(Δ(Ω)):∫Δ(Ω)μdτ(mu)=μ0}上的上半連續函數∫Δ(Ω)V(μ)dτ(μ)可以取到最大值。
對偶
Thm 1. 弱對偶
如果某個τ∈Δ(Δ(Ω))對於問題(P)可行,且某個P∈C(Ω)對於問題(D)可行,則
(G)
∫ΩP(ω)dμ0(ω)≥∫Δ(Ω)V(μ)dτ(μ)
此外,如果(G)以等式成立,即
(0)
∫ΩP(ω)dμ0(ω)=∫Δ(Ω)V(μ)dτ(μ)
則前述τ和P分別為問題(P)和問題(D)的最優解。
Prop 1. 無對偶缺口
Def 1. 正則性
如果V^在先驗信念μ0處是超可微的,則稱勸說問題為正則的。當勸說問題正則時,存在仿射連續函數Vˉ:Δ(Ω)→R使得Vˉ(μ0)=V^(μ0)且對於任何μ∈ΔΩ都有Vˉ(μ)≥V^(μ)。
(即仿射函數Vˉ majorize 了V^,此時這一仿射函數的斜率就是V^在μ0處的超梯度。
回憶超梯度的定義:考慮有限維情況,給定f是凸集C∈Rn上的凹函數,那麼我們稱一個嚮量p∈Rn是f在點x處的超梯度,若嚮量p滿足,對於任何y有如下超梯度不等式:
f(x)+p(y−x)≥f(y)
並且當給定x時,仿射函數f(x)+p(y−x)就是函數f在x點處的超微分。而在有限維情況下,凹函數在每個內點處都是超可微的。由於我們假設全支撐,μ0就是內點。因此V^在先驗信念μ0處必然是超可微的,正則性自然成立。同樣地,也可以將這一仿射函數理解為V^在μ0處的支撐超平麵。
但由於我們當前考慮的是無限維情況,需要對前述p(y−x)的錶述做進一步推廣。這就要用到 Riesz-Markov-Kakutani representation theorem,根據這一定理,任一線性連續(等價於線性有界)泛函H∈Δ(Ω)都可以用某個P∈C(Ω)錶示為H(μ)=∫ΩP(ω)dμ(ω),從而超梯度不等式變為,對於所有μ∈Δ(Ω)
V^(μ0)+∫ΩP(ω)dμ(ω)≥V^(μ)
但在Ω為無窮集的情況時,機率測度的集合在weak⋆拓撲下的相對內部是空集,任何μ0即使是全支撐也是邊界點,此時“支撐超平麵”可能是垂直的,這種情況下其實所謂的支撐超平麵(根據定義,斜率應為有限值,但垂直對應於“斜率”為無窮大)是不存在的。一般地,在無限維空間中,凹性和上半連續不足以保證即使在內點處支撐超平麵的存在。因此需要特別地假設正則性,而非像有限維情況下那般自然成立。
由於可能出問題的情況是“支撐超平麵”具有無窮“斜率”,因此保證正則性的一個自然地條件就是關於函數V^本身在μ0處斜率的限製,如果這個斜率是有限值,那麼其相應的支撐超平麵也具有有限斜率,這種對於斜率的限製可以通過施加 Lipschitz 條件來實現:即,要求V^的 Lipschitz 常數為有限值,或者說,V^是 Lipschitz 連續的。)
Thm 2. 強對偶
Primal問題與Dual問題具有相同的解並滿足強對偶性,當且僅當勸說問題是正則的。
Corollary 1. 互補鬆弛性
Primal 問題的某個可行分佈τ與 Dual 問題的某個可行價格P分別為兩個問題的解,當且僅當
support(τ)⊂{μ∈Δ(Ω):∫ΩP(ω)dμ(ω)=V(μ)}
證明: