信息設計學習筆記係列。

The Persuasion Duality

Dworczak, P., & Kolotilin, A. (2019)

預備知識

weak\text{weak}^{\star}拓撲

給定嚮量空間XX,將定義在XX上的所有連續線性泛函(強調連續是因為XX可能是無限維空間,此時線性函數並不自動就是連續的,預設採用範數引緻的度量拓撲)f:XRf:X\rightarrow\mathbb{R}們記為XX^{\star},那麼使得所有這些fXf\in X^{\star}連續的、最小的(如果不要求最小,那麼它們本來在範數引緻的度量拓撲下就已經是連續的)在XX上的拓撲,就是XX上的 weak topology,記為σ(X,X)\sigma(X,X^{\star})

進而,給定XX^{\star},同樣將那些使得連續線性泛函g:XRg:X^{\star}\rightarrow\mathbb{R}gXg\in X^{\star\star}連續的最小拓撲為σ(X,X)\sigma(X^{\star},X^{\star\star}),這一拓撲是定義在XX^{\star}上的weak topology;

最後,由於XXX\subset X^{\star\star},將σ(X,X)\sigma(X^{\star},X^{\star\star})削弱為σ(X,X)\sigma(X^{\star},X),則得到了在XX^{\star}上的weak\text{weak}^{\star} topology。

更弱的拓撲具有更少的開集、更多的閉集和緊集、更多的連續函數。

Riesz-Markov-Kakutani representation theorem

任一線性連續(等價於線性有界)泛函HΔ(Ω)H\in\Delta(\Omega)都可以用某個PC(Ω)P\in C(\Omega)錶示為H(μ)=ΩP(ω)dμ(ω)H(\mu)=\int_{\Omega}P(\omega)d\mu(\omega)

這個隻是夠用的版本,實際的 RMK 錶示定理適用範圍更廣,比如Δ(Ω)\Delta(\Omega)可以推廣為任何局部緊的Hausdorff空間、取值可以為複數等等,可見Rudin (1987)。

凸序

對於兩個隨機變數AABB,如果任給凸函數uu,都有E[u(A)]E[u(B)]\mathbb{E}[u(A)]\leq\mathbb{E}[u(B)],則稱AA在凸序意義下小於BB,記為AcxBA\leq_{cx}B

模型

狀態空間Ω\Omega為緊度量空間。令Δ(Ω)\Delta(\Omega)Ω\Omega上的 Borel 機率測度的集合,並具有weak\text{weak}^{\star} topology。先驗信念μ0\mu_{0}具有全支撐。目標函數V:Δ(Ω)RV:\Delta(\Omega)\rightarrow\mathbb{R}為上半(semi)連續的。

那麼,為什麼我們需要在Δ(Ω)\Delta(\Omega)上的weak\text{weak}^{\star} topology 呢?後麵我們會看到,因為我們需要使得Δ(Ω)\Delta(\Omega)是個緊度量空間、從而保證最優化問題解的存在性。並且,雖然機率測度並不是線性的,但構成我們問題的積分操作是線性的。但這一設定也會帶來一些問題,後麵會詳述。

Primal Problem

§

選擇τΔ(Δ(Ω))\tau\in\Delta(\Delta(\Omega)),來最大化

Δ(Ω)V(μ)dτ(μ)s.t.Δμdτ(μ)=μ0\begin{align} \int_{\Delta(\Omega)}V(\mu)d\tau(\mu)\\ s.t.\int_{\Delta}\mu d\tau(\mu)=\mu_{0} \end{align}

Dual Problem

(D)

選擇PC(Ω)P\in C(\Omega),其中C(Ω)C(\Omega)Ω\Omega上連續函數的集合,來最小化

ΩP(ω)dμ0(ω)s.t.ΩP(ω)dμ(ω)V(μ)μΔ(Ω)\begin{align} \int_{\Omega}P(\omega)d\mu_{0}(\omega)\\ s.t.\int_{\Omega}P(\omega)d\mu(\omega)\geq V(\mu)\\ \forall\mu\in\Delta(\Omega) \end{align}

原問題解的存在性

首先,我們錶明,當Ω\Omega為緊度量空間時,Δ(Ω)\Delta(\Omega)weak\text{weak}^{\star}拓撲下也是緊的,並且是可度量化的。

Lemma 1. 緊Hausdorff空間X是可度量化的,當且僅當C(X)C(X)是可分的Banach格。

格範數是一個關於嚮量絕對值單調的範數,賦範Riesz空間是結合了格範數的Riesz空間。如果這個範數還具有完備性,則這個空間就成為了Banach格。

因為Ω\Omega為度量空間,根據定義,Ω\Omega是可度量化的 Hausdorff 空間。因此,C(X)C(X)是一個可分的 Banach 格。

Lemma 2. (Alaoglu’s Thm)一個賦範空間的範數對偶上的閉單位球,是weak\text{weak}^{\star}緊的。從而,範數對偶的一個子集是weak\text{weak}^{\star}緊的當且僅當它是weak\text{weak}^{\star}閉且範數有界的。

Lemma 3. 一個賦範空間是可分的,當且僅當其對偶空間的閉單位求是weak\text{weak}^{\star}可度量化的。

因此,C(X)C(X)中的閉單位球是weak\text{weak}^{\star}緊且weak\text{weak}^{\star}可度量化的。作為這個閉單位球的子集,Δ(Ω)\Delta(\Omega)weak\text{weak}^{\star}緊且weak\text{weak}^{\star}可度量化的。進而,Δ(Δ(Ω))\Delta(\Delta(\Omega))weak\text{weak}^{\star}緊且weak\text{weak}^{\star}可度量化的。因為τΔ(Ω)μdτ(μ)\tau\rightarrow\int_{\Delta(\Omega)}\mu d\tau(\mu)是連續函數,滿足約束Δ(Ω)μdτ(μ)=μ0\int_{\Delta(\Omega)}\mu d\tau(\mu)=\mu_{0}的那些分佈τ\tau們是個閉集(單點集μ0\mu_{0}是閉集,而連續函數使得閉集的原像閉),而緊空間的閉子集是緊集,因此那些可行的τ\tau們構成一個緊集。

Def. 令Ω\Omega為度量空間,並賦予 Borel σ\sigma代數Σ\Sigma。稱(Ω,Σ)(\Omega,\Sigma)上的機率測度序列μn\mu_{n}\star收斂於(Ω,Σ)(\Omega,\Sigma)上的機率測度μ\mu,如果對於任何 usc 且上有界的函數ff,都有limsupEnf(x)Ef(x)\lim\sup\mathbb{E}_{n}f(x)\leq \mathbb{E}f(x)。其中En\mathbb{E}_{n}是函數f(x)f(x)關於μn\mu_{n}的期望,E\mathbb{E}是關於μ\mu的。

根據假設,VV在採用weak\text{weak}^{\star}拓撲下是上半連續的,由於其定義域Δ(Ω)\Delta(\Omega)為緊集,因此其為上有界的,因此函數Δ(Ω)V(μ)dτ(μ)\int_{\Delta(\Omega)}V(\mu)d\tau(\mu)也是上半連續的。

從而,根據 Weierstrass 定理,緊集{τΔ(Delta(Ω)):Δ(Ω)μdτ(mu)=μ0}\{\tau\in\Delta(Delta(\Omega)):\int_{\Delta(\Omega)}\mu d\tau(mu)=\mu_{0}\}上的上半連續函數Δ(Ω)V(μ)dτ(μ)\int_{\Delta(\Omega)}V(\mu)d\tau(\mu)可以取到最大值。

對偶

Thm 1. 弱對偶

如果某個τΔ(Δ(Ω))\tau\in\Delta(\Delta(\Omega))對於問題§可行,且某個PC(Ω)P\in C(\Omega)對於問題(D)可行,則

(G)

ΩP(ω)dμ0(ω)Δ(Ω)V(μ)dτ(μ)\int_{\Omega}P(\omega)d\mu_{0}(\omega)\geq\int_{\Delta(\Omega)}V(\mu)d\tau(\mu)

此外,如果(G)以等式成立,即

(0)

ΩP(ω)dμ0(ω)=Δ(Ω)V(μ)dτ(μ)\int_{\Omega}P(\omega)d\mu_{0}(\omega)=\int_{\Delta(\Omega)}V(\mu)d\tau(\mu)

則前述τ\tauPP分別為問題§和問題(D)的最優解。

Prop 1. 無對偶缺口

Def 1. 正則性

如果V^\hat{V}在先驗信念μ0\mu_{0}處是超可微的,則稱勸說問題為正則的。當勸說問題正則時,存在仿射連續函數Vˉ:Δ(Ω)R\bar{V}:\Delta(\Omega)\rightarrow\mathbb{R}使得Vˉ(μ0)=V^(μ0)\bar{V}(\mu_{0})=\hat{V}(\mu_{0})且對於任何μΔΩ\mu\in\Delta{\Omega}都有Vˉ(μ)V^(μ)\bar{V}(\mu)\geq\hat{V}(\mu)

(即仿射函數Vˉ\bar{V} majorize 了V^\hat{V},此時這一仿射函數的斜率就是V^\hat{V}μ0\mu_{0}處的超梯度。

回憶超梯度的定義:考慮有限維情況,給定ff是凸集CRnC\in\mathbb{R}^{n}上的凹函數,那麼我們稱一個嚮量pRnp\in\mathbb{R}^{n}ff在點xx處的超梯度,若嚮量pp滿足,對於任何yy有如下超梯度不等式:

f(x)+p(yx)f(y)f(x)+p(y-x)\geq f(y)

並且當給定xx時,仿射函數f(x)+p(yx)f(x)+p(y-x)就是函數ffxx點處的超微分。而在有限維情況下,凹函數在每個內點處都是超可微的。由於我們假設全支撐,μ0\mu_{0}就是內點。因此V^\hat{V}在先驗信念μ0\mu_{0}處必然是超可微的,正則性自然成立。同樣地,也可以將這一仿射函數理解為V^\hat{V}μ0\mu_{0}處的支撐超平麵。

但由於我們當前考慮的是無限維情況,需要對前述p(yx)p(y-x)的錶述做進一步推廣。這就要用到 Riesz-Markov-Kakutani representation theorem,根據這一定理,任一線性連續(等價於線性有界)泛函HΔ(Ω)H\in\Delta(\Omega)都可以用某個PC(Ω)P\in C(\Omega)錶示為H(μ)=ΩP(ω)dμ(ω)H(\mu)=\int_{\Omega}P(\omega)d\mu(\omega),從而超梯度不等式變為,對於所有μΔ(Ω)\mu\in\Delta(\Omega)

V^(μ0)+ΩP(ω)dμ(ω)V^(μ)\hat{V}(\mu_{0})+\int_{\Omega}P(\omega)d\mu(\omega)\geq\hat{V}(\mu)

但在Ω\Omega為無窮集的情況時,機率測度的集合在weak\text{weak}^{\star}拓撲下的相對內部是空集,任何μ0\mu_{0}即使是全支撐也是邊界點,此時“支撐超平麵”可能是垂直的,這種情況下其實所謂的支撐超平麵(根據定義,斜率應為有限值,但垂直對應於“斜率”為無窮大)是不存在的。一般地,在無限維空間中,凹性和上半連續不足以保證即使在內點處支撐超平麵的存在。因此需要特別地假設正則性,而非像有限維情況下那般自然成立。

由於可能出問題的情況是“支撐超平麵”具有無窮“斜率”,因此保證正則性的一個自然地條件就是關於函數V^\hat{V}本身在μ0\mu_{0}處斜率的限製,如果這個斜率是有限值,那麼其相應的支撐超平麵也具有有限斜率,這種對於斜率的限製可以通過施加 Lipschitz 條件來實現:即,要求V^\hat{V}的 Lipschitz 常數為有限值,或者說,V^\hat{V}是 Lipschitz 連續的。)

Thm 2. 強對偶

Primal問題與Dual問題具有相同的解並滿足強對偶性,當且僅當勸說問題是正則的。

Corollary 1. 互補鬆弛性

Primal 問題的某個可行分佈τ\tau與 Dual 問題的某個可行價格PP分別為兩個問題的解,當且僅當

support(τ){μΔ(Ω):ΩP(ω)dμ(ω)=V(μ)}\text{support}(\tau)\subset\{\mu\in\Delta(\Omega):\int_{\Omega}P(\omega)d\mu(\omega)=V(\mu)\}

證明: