信息設計學習筆記係列。
The Persuasion Duality
Dworczak, P., & Kolotilin, A. (2019)
預備知識
weak⋆拓撲
給定嚮量空間X,將定義在X上的所有連續線性泛函(強調連續是因為X可能是無限維空間,此時線性函數並不自動就是連續的,預設採用範數引緻的度量拓撲)f:X→R們記為X⋆,那麼使得所有這些f∈X⋆連續的、最小的(如果不要求最小,那麼它們本來在範數引緻的度量拓撲下就已經是連續的)在X上的拓撲,就是X上的 weak topology,記為σ(X,X⋆);
進而,給定X⋆,同樣將那些使得連續線性泛函g:X⋆→R們g∈X⋆⋆連續的最小拓撲為σ(X⋆,X⋆⋆),這一拓撲是定義在X⋆上的weak topology;
最後,由於X⊂X⋆⋆,將σ(X⋆,X⋆⋆)削弱為σ(X⋆,X),則得到了在X⋆上的weak⋆ topology。
更弱的拓撲具有更少的開集、更多的閉集和緊集、更多的連續函數。
Riesz-Markov-Kakutani representation theorem
任一線性連續(等價於線性有界)泛函H∈Δ(Ω)都可以用某個P∈C(Ω)錶示為H(μ)=∫ΩP(ω)dμ(ω)。
這個隻是夠用的版本,實際的 RMK 錶示定理適用範圍更廣,比如Δ(Ω)可以推廣為任何局部緊的Hausdorff空間、取值可以為複數等等,可見Rudin (1987)。
凸序
對於兩個隨機變數A和B,如果任給凸函數u,都有E[u(A)]≤E[u(B)],則稱A在凸序意義下小於B,記為A≤cxB。
模型
狀態空間Ω為緊度量空間。令Δ(Ω)為Ω上的 Borel 機率測度的集合,並具有weak⋆ topology。先驗信念μ0具有全支撐。目標函數V:Δ(Ω)→R為上半(semi)連續的。
那麼,為什麼我們需要在Δ(Ω)上的weak⋆ topology 呢?後麵我們會看到,因為我們需要使得Δ(Ω)是個緊度量空間、從而保證最優化問題解的存在性。並且,雖然機率測度並不是線性的,但構成我們問題的積分操作是線性的。但這一設定也會帶來一些問題,後麵會詳述。
Primal Problem
§
選擇τ∈Δ(Δ(Ω)),來最大化
∫Δ(Ω)V(μ)dτ(μ)s.t.∫Δμdτ(μ)=μ0
Dual Problem
(D)
選擇P∈C(Ω),其中C(Ω)為Ω上連續函數的集合,來最小化
∫ΩP(ω)dμ0(ω)s.t.∫ΩP(ω)dμ(ω)≥V(μ)∀μ∈Δ(Ω)
原問題解的存在性
首先,我們錶明,當Ω為緊度量空間時,Δ(Ω)在weak⋆拓撲下也是緊的,並且是可度量化的。
Lemma 1. 緊Hausdorff空間X是可度量化的,當且僅當C(X)是可分的Banach格。
格範數是一個關於嚮量絕對值單調的範數,賦範Riesz空間是結合了格範數的Riesz空間。如果這個範數還具有完備性,則這個空間就成為了Banach格。
因為Ω為度量空間,根據定義,Ω是可度量化的 Hausdorff 空間。因此,C(X)是一個可分的 Banach 格。
Lemma 2. (Alaoglu’s Thm)一個賦範空間的範數對偶上的閉單位球,是weak⋆緊的。從而,範數對偶的一個子集是weak⋆緊的當且僅當它是weak⋆閉且範數有界的。
Lemma 3. 一個賦範空間是可分的,當且僅當其對偶空間的閉單位求是weak⋆可度量化的。
因此,C(X)中的閉單位球是weak⋆緊且weak⋆可度量化的。作為這個閉單位球的子集,Δ(Ω)是weak⋆緊且weak⋆可度量化的。進而,Δ(Δ(Ω))是weak⋆緊且weak⋆可度量化的。因為τ→∫Δ(Ω)μdτ(μ)是連續函數,滿足約束∫Δ(Ω)μdτ(μ)=μ0的那些分佈τ們是個閉集(單點集μ0是閉集,而連續函數使得閉集的原像閉),而緊空間的閉子集是緊集,因此那些可行的τ們構成一個緊集。
Def. 令Ω為度量空間,並賦予 Borel σ代數Σ。稱(Ω,Σ)上的機率測度序列μn弱⋆收斂於(Ω,Σ)上的機率測度μ,如果對於任何 usc 且上有界的函數f,都有limsupEnf(x)≤Ef(x)。其中En是函數f(x)關於μn的期望,E是關於μ的。
根據假設,V在採用weak⋆拓撲下是上半連續的,由於其定義域Δ(Ω)為緊集,因此其為上有界的,因此函數∫Δ(Ω)V(μ)dτ(μ)也是上半連續的。
從而,根據 Weierstrass 定理,緊集{τ∈Δ(Delta(Ω)):∫Δ(Ω)μdτ(mu)=μ0}上的上半連續函數∫Δ(Ω)V(μ)dτ(μ)可以取到最大值。
對偶
Thm 1. 弱對偶
如果某個τ∈Δ(Δ(Ω))對於問題§可行,且某個P∈C(Ω)對於問題(D)可行,則
(G)
∫ΩP(ω)dμ0(ω)≥∫Δ(Ω)V(μ)dτ(μ)
此外,如果(G)以等式成立,即
(0)
∫ΩP(ω)dμ0(ω)=∫Δ(Ω)V(μ)dτ(μ)
則前述τ和P分別為問題§和問題(D)的最優解。
Prop 1. 無對偶缺口
Def 1. 正則性
如果V^在先驗信念μ0處是超可微的,則稱勸說問題為正則的。當勸說問題正則時,存在仿射連續函數Vˉ:Δ(Ω)→R使得Vˉ(μ0)=V^(μ0)且對於任何μ∈ΔΩ都有Vˉ(μ)≥V^(μ)。
(即仿射函數Vˉ majorize 了V^,此時這一仿射函數的斜率就是V^在μ0處的超梯度。
回憶超梯度的定義:考慮有限維情況,給定f是凸集C∈Rn上的凹函數,那麼我們稱一個嚮量p∈Rn是f在點x處的超梯度,若嚮量p滿足,對於任何y有如下超梯度不等式:
f(x)+p(y−x)≥f(y)
並且當給定x時,仿射函數f(x)+p(y−x)就是函數f在x點處的超微分。而在有限維情況下,凹函數在每個內點處都是超可微的。由於我們假設全支撐,μ0就是內點。因此V^在先驗信念μ0處必然是超可微的,正則性自然成立。同樣地,也可以將這一仿射函數理解為V^在μ0處的支撐超平麵。
但由於我們當前考慮的是無限維情況,需要對前述p(y−x)的錶述做進一步推廣。這就要用到 Riesz-Markov-Kakutani representation theorem,根據這一定理,任一線性連續(等價於線性有界)泛函H∈Δ(Ω)都可以用某個P∈C(Ω)錶示為H(μ)=∫ΩP(ω)dμ(ω),從而超梯度不等式變為,對於所有μ∈Δ(Ω)
V^(μ0)+∫ΩP(ω)dμ(ω)≥V^(μ)
但在Ω為無窮集的情況時,機率測度的集合在weak⋆拓撲下的相對內部是空集,任何μ0即使是全支撐也是邊界點,此時“支撐超平麵”可能是垂直的,這種情況下其實所謂的支撐超平麵(根據定義,斜率應為有限值,但垂直對應於“斜率”為無窮大)是不存在的。一般地,在無限維空間中,凹性和上半連續不足以保證即使在內點處支撐超平麵的存在。因此需要特別地假設正則性,而非像有限維情況下那般自然成立。
由於可能出問題的情況是“支撐超平麵”具有無窮“斜率”,因此保證正則性的一個自然地條件就是關於函數V^本身在μ0處斜率的限製,如果這個斜率是有限值,那麼其相應的支撐超平麵也具有有限斜率,這種對於斜率的限製可以通過施加 Lipschitz 條件來實現:即,要求V^的 Lipschitz 常數為有限值,或者說,V^是 Lipschitz 連續的。)
Thm 2. 強對偶
Primal問題與Dual問題具有相同的解並滿足強對偶性,當且僅當勸說問題是正則的。
Corollary 1. 互補鬆弛性
Primal 問題的某個可行分佈τ與 Dual 問題的某個可行價格P分別為兩個問題的解,當且僅當
support(τ)⊂{μ∈Δ(Ω):∫ΩP(ω)dμ(ω)=V(μ)}
證明: