Mathevet, L., Perego, J., & Taneva, I. (2020). On information design in games. Journal of Political Economy, 128(4), 1370-1404.
基本模型
設定
參與人集合 N={1,...,n},有限世界狀態集 Θ ,真實狀態 θ∈Θ 不被參與人知曉。每個參與人 i∈N 的有限行動集 Ai ,效用依賴於所有參與人的行動 a∈A=∏i∈NAi 和未知的真實狀態 θ , ui:A×Θ→R 。關於世界狀態的共同先驗 μ0∈Δ(Θ) ,這個先驗信念是共同知識。基本博弈為 G=(Θ,μ0,N,{Ai},{μi})。
信息設計者可以承諾一個信息結構 (S,π) ,來嚮參與人披露關於世界狀態的信息。其中 S=∏iSi 嚮每個參與人傳遞的信號實現之潛在可能集,而 π:Θ→Δ(S) 為信號。假設存在一個有限的、共同的信號實現潛在可能集 S ,使得對於每個 i 都有 Si∈S 。
在任何的狀態 θ 下,信號組合 s=(si)i 都根據 π(s∣θ) 生成,並被各參與人私下地觀察到。但私下觀察並不排除參與人可以倒推其他人可能觀察到了什麼,甚至在某些特殊的信息結構下各參與人觀察到的信號還可以是共同知識。
信息設計者的效用依然取決於所有參與人的行動和世界狀態, v:A×Θ→R 。
貝葉斯博弈、解概念與均衡選擇規則
基本博弈 G 和信息結構 (S,π) 放在一起就構成了一個貝葉斯博弈 G=(G,(S,π)) 。其中解概念(抽象地定義)為
Σ(G)⊂{σ=(σi)i∣σi:Si→Δ(Ai),∀i}
其中某個解可以引緻一個在參與人行為組合與世界狀態上的聯合分佈γ,並把這個解概念所能引緻的所有聯合分佈記為
OΣ(G)={γ∈Δ(A×Θ):∃σ∈Σ(G),s.t.γ(a,θ)=s∑σ(a∣s)π(s∣θ)μ0,∀(a,θ)}
假設 OΣ 非空且是一個緊值對應。(當基本博弈 G 為有限博弈時,若採取貝葉斯納什均衡的解概念,則這一點自動滿足)
當 OΣ 是一個非平凡對應(既取值為多點)時,可以(抽象地)指定一個均衡選擇規則 g:D⊂Δ(A×Θ)→g(D)∈D 。在前麵介紹過的信息設計文獻中,均衡選擇規則為 max 規則,即選擇其中對發送者/信息設計者最有利的一個;在一些穩健設計(Robust Machenism/Information Design)文獻中,均衡選擇規則為 min 規則。
對於每個緊集 D⊂Δ(A×Θ) (因為這兩種規則需要對每種可能出現的情況指定一個極大或極小值,為保證極值存在,需要緊集假設),兩種規則分別如下
g(D)∈argγ∈Dmaxa,θ∑γ(a,θ)v(a,θ)
和
g(D)∈argγ∈Dmina,θ∑γ(a,θ)v(a,θ)
在給定某個基本博弈 G 的情況下,某個解概念相應的解集的性質會取決於信息結構 (S,π) ,因此對於給定的 G 可以把 OΣ(G) 寫為 OΣ(S,π) ,進而記 g(S,π):=g(OΣ(S,π)) ,從而信息設計者的事前期望效用為
V(S,π):=a,θ∑g(S,π)(a,θ)v(a,θ)
於是信息設計問題可以錶示為
(S,π)supV(S,π)
可以看出,前麵提到的穩健設計與羅爾斯主義的 maxmin 規則可類比,即做跨信息結構的比較,關註每種信息結構下對於設計者來說最差的情況,並選取“矬子裏拔大個兒”的那個信息結構。
信念操控
信念分佈
對於每個參與人 i 來說,其信念等級 ti 是一個無窮序列 (ti1,ti2,...) 。
其中 ti1∈Δ(Θ) 是參與人 i 的一階信念(關於世界狀態的信念); ti2∈Δ(Θ×(Δ(Θ)n−1) 是參與人 i 的二階信念(關於世界狀態,以及關於其他人的信念之組合的信念),依此類推。
並且這些元素需要是連貫的(coherent):
任何元素 tik 的前 l≤k 的部分,都要與同一序列中的 til 相同,即 margsupport(til)tik=til 。
選取一種特別的信念等級,使得連貫性不僅對於單個人 i 成立,也對彼此的高階信念成立:對於每個參與人 i ,這種信念等級 Ti 可以伴隨著一個同胚 βi⋆:Ti→Δ(Θ×T−i) 。這個同胚映射 βi⋆ 在給定參與人 i 的信念序列下,描述了 i 對於 (θ,t−i) 的信念。從而把連貫性可以成為共同知識的這種信念等級組合記為 T:=∏iTi 。
給定先驗信念 μ0 和信息結構 (S,π) ,當每個參與人 i 接收到信號實現 si 後,利用貝葉斯更新,形成關於世界狀態和其他人關於世界狀態的信念之組合的信念 μi(si)∈Δ(Θ×S−i) 。
特別地, μi1:=margΘμi(si) 描述了在給定接收到的信號實現 si 後,參與人 i 對世界狀態的信念,稱之為參與人 i 的一階信念。
對於每個 i 的每個 si ,都可以引緻一個信念等級 hi(si)∈Ti,將信號實現組合 s=(si)i∈N 所引緻的參與人的信念等級組合記為 h(s):=(hi(si))i∈N
定義1. 一個信息結構 (S,π) 引緻一個在信念等級組合上的分佈 τ∈Δ(T) ,如果對於每個可能的 t 都滿足下式,則稱這個分佈為信念(等級)分佈:
τ(t)=θ∑π({s:h(s)=t}∣θ)μ0(θ)
即,某個信念等級組合 t 發生的機率,要等於那些引緻 h(s)=t 的信號實現 s 的條件分佈在先驗信念下的加權平均。這個式子把某個信念等級組合 t 發生的機率與某些特定的信號實現的機率聯係了起來。
定義2. 一個信念分佈 τ 被稱為公共的,如果對於每個可能出現的信念等級 t∈supportτ (假設 ∣supportτ∣≥2 )和任何 i,j∈N 都有 ti1=tj1 ,並且 margT−iβi⋆(⋅∣ti)=δt−i 。其中 δ 為狄拉克測度。如果一個信念分佈不是公共的,則稱其為私人的。
∣supportτ∣≥2 的假設是為了保證問題的非平凡性,否則隻有一種信念等級可能發生。 ti1=tj1 是指任何兩個參與人在這個信念等級中的一階信念都是相同的(對於世界狀態的共同先驗),而 margT−iβi⋆(⋅∣ti)=δt−i 是指,在構建不僅個人連貫而且人際連貫的同胚映射 βi⋆中,βi⋆(tj∣ti) 要麼是0,要麼是1(但並未對 margΘβi⋆(⋅∣ti) 做限製)。
操控
如果對於某個 p∈Δ(Θ×T) 和所有的 θ,t,i ,如下條件得到滿足
p(θ,t)=βi⋆(θ,t−i∣ti)p(ti)
那麼,就稱 p 為共同先驗。其中 p(t−i) 是 p 關於 T 的邊際分佈中除 −i 外的分量。
當 p(t−i)>0 時,上式意味著
βi⋆(θ,t−i∣ti)=p(ti)p(θ,t)
即參與人 i 的信念映射 βi 是根據共同先驗 p 通過貝葉斯更新得到的。
將有限支撐的機率測度集記為 Δf ,並定義
C:={τ∈ΔfT∣∃p∈Δ(Θ×T) is a common prior such that τ=margTp}
為一緻的信念等級分佈空間。在一個一緻的信念分佈下,所有參與人的信念都通過某個共同先驗 p 得到,並且每個信念等級組合 t 産生的機率都與 τ 相同,即 τ=margTp。根據 Mertens and Zamir (1995),這個 p 對於給定的 τ 是唯一的。
一個具有有限支撐的分佈 τ∈ΔfT 若滿足
ti∑margΘβi⋆(⋅∣t−i)τi(ti)=μ0
則稱這個信念等級分佈τ對於這個參與人 i 來說是貝葉斯可行的。即參與人一階信念的期望等於世界狀態的分佈。
命題 1. 有限支撐的信念等級分佈 τ 能被某個信息結構所引緻,當且僅當 τ 一緻、並對某個參與人 i 貝葉斯可行。
這裏隻需要對某個參與人 i 貝葉斯可行就足夠了,因為根據一緻性,隻要對某個參與人貝葉斯可行,就對所有人貝葉斯可行。
命題 1 的證明: 令 τ 為由某個信息結構 (S,π) 所引緻的信念等級分佈, 我們需要錶明其為一緻且對某個參與人來說貝葉斯可行. 而 τ 為由某個信息結構 (S,π) 所引緻意味著對於任何 t∈suppτ
τ(t)=θ∑π({s:h(s)=t}∣θ)μ0(θ)
構建一個在世界狀態和信念等級上的聯合分佈 p∈Δ(Θ⋅T) 為對於任何 θ∈Θ 和 t∈suppτ
p(θ,t)=π({s:h(s)=t}∣θ)μ0(θ)
從而根據構建可得
margTp=θ∑p(θ,t)=τ
以及對於任何參與人 i
margTip=τi
參與人根據 (S,π) 來進行貝葉斯信念更新, 從而對於任何 i,θ 和 t∈suppτ 都有
p(θ,t)=βi⋆(θ,t−i∣ti)margTip(ti)
前述兩條意味著 τ∈C. 又
t∈suppτi∑βi⋆(θ∣ti)τi(ti):=t∈supp∑p(θ,t)=t∑π({s:h(s)=t}∣θ)μ0(θ)=μ0(θ)
這意味著 τ 對於每個參與人 i 都是貝葉斯可行的.
接下來假設 τ∈C 並且滿足貝葉斯可行, 我們來驗證它可以被某個信息結構 (S,π) 所引緻.
定義信號潛在可能集為那些在 τ 下會以正機率出現的信念等級集, 即 S=suppτ, 並定義相應於 τ 的信號生成機率 πτ 為對於任何一個潛在可能出現的信念等級 t∈suppτ
πτ(t∣ ):θ→μ0(θ)1βi⋆(θ,t−i∣ti)τi(ti)
由於 τ∈C, 對於 i 的選取是無所謂的. 並且, 根據 τ 是貝葉斯可行的 (特別地, 對於任選的參與人 i 是貝葉斯可行的) 可知
t∈suppτi∑βi⋆(θ∣ti)τi(ti)=μ0(θ)
代入, 並纍加求和
sumt∈suppτπτ(t∣θ)=t∈suppτ∑πt∣θ=μ0(θ)1t∈suppτ∑βi⋆(θ,t−i∣ti)τi(ti)=μ0(θ)1ti∈suppτi∑t−i∈suppτ−i∑βi⋆(θ,t−i∣ti)τi(ti)=μ0(θ)1ti∈suppτi∑βi⋆(θ∣ti)τi(ti)=μ0(θ)1μ0(θ)=1
從而任給 θ, πτ( ∣θ) 確實是一個機率分佈. 接下來
θ∑πτ(t∣θ)μ0(θ)=θ∑βi⋆(θ,t−i∣ti)τi(ti)=βi⋆(t−i∣ti)τi(ti)=margTip(ti)margTp(ti,t−i)τi(ti)=margTp(t)=τ(t)
這驗證了信念等級分佈 τ 確實可以由信息結構 (suppτ,πτ) 所引緻.
命題 2. 有限支撐的信念等級分佈 τ 一緻且貝葉斯可行,當且僅當存在一個分佈 v:supportτ→Δ(Θ) ,使得對於每個 t,θ,i 都有
t∑τ(t)v(θ∣t)v(θ∣ti,t−i)τ(t−i∣ti)=βi⋆(t−i∣ti)=μ0(θ)=βi⋆(θ∣ti,t−i):=βi⋆(t−i∣ti)βi⋆(θ,t−i∣ti)
信念分佈的結果
對於給定的某個一緻的信念等級分佈 τ,按照某個解概念 ΣB(τ) 得到解集 Λ⊂{σ:supportτ→Δ(A)}。
這個解集描述了在貝葉斯博弈 (G,pτ)(其中 pτ 是使得 margTp=τ 的共同先驗)中參與人的行為。不同的 Λ 捕捉了將不同的信念保持相關性加到 τ 上後所帶來的不同相關性。
某個解集 Λ∈ΣB(τ) 會引緻在參與人行為組合和世界狀態上的聯合分佈的集合,稱為結果集合
OΛ(τ):={γ∈Δ(A×Θ):∃σ∈Λ, such that γ(a,θ)=t∑σ(a∣t)pτ(t,θ)∀(a,θ)}
因此,設計者通過一緻的信念等級分佈 τ 得到的事前期望效用為
w(τ):=Λ∈ΣB(τ)supθ,a∑g(OΛ(τ))(a,θ)v(a,θ)
其中 g 是某個均衡選擇標準:從根據某個解概念所得到的解集所引緻的結果中,選取其中一個。
我們前麵定義的聯合分佈集合 OΣ(G) 是信息結構 (S,π) 的函數,但這裏的結果集合 OΛ(τ) 是一緻信念分佈 τ 的函數。所以隻有當 Λ 能使得 (S,π) 和其所引緻的 τ 令 OΛ(τ)=OΣ(S,π) 時,這個 Λ∈ΣB(τ) 才是有意義的。
最優解的錶示
假設
1.線性選擇
對於所有 D′,D′′⊂Δ(Θ×A) 和 0≤α≤1,都有
g(αD′+(1−α)D′′)=αg(D′)+(1−α)g(D′′)
2.解的不變性
給定三個一緻的有限支撐信念等級分佈 τ 、 τ′ 和 τ′′ ,假設那些滿足 τ(t)>0 的 t 與那些或者使得 τ′(t)>0 、或者使得 τ′′(t)>0 的 t 相同,即 suppτ=suppτ′∪suppτ′′, 同時 suppτ 要是後者的不交並,即 suppτ′∩suppτ′′=∅ 。則某個解集會在 τ 下出現 Λ∈ΣB(τ) 當且僅當存在 Λ′∈ΣB(τ′) 和 Λ′′∈ΣB(τ′′) 使得在 τ 下出現的解集中的解,當分別限製在 τ′ 和 τ′′ 的支撐中的信念等級上時,分別也是 Λ′ 和 Λ′′ 這兩個解集中的解,即 Λ={σ:suppτ→Δ(A):σrestricted in suppτ′∈Λ′ and σrestricted in suppτ′′∈Λ′′} .
錶示
定理1. 錶示定理
信息設計者的最優化問題可以錶示為
S,πsupV(S,π)=λ∈Δf(CM)supe∈suppλ∑w(e)λ(e)subject toe∈suppλ∑margΘpeλ(e)=μ0
證明:
引理 1. 有限支撐一緻信念等級分佈集是凸集。
任取α∈[0,1]以及τ′,τ′′∈C。根據C的定義,存在pτ′和pτ′′使得margTpτ′=τ′和margTpτ′′=τ′′並且
pτ′(θ,t)pτ′′(θ,t)=βi⋆(θ,t−i∣ti)τi′(ti)=βi⋆(θ,t−i∣ti)τi′′(ti)
對於
推論 1. 組內-組間最大化
對於任何關於世界狀態的信念μ∈ΔΘ,記
w⋆(μ):=e∈CM:margΘpe=μsupw(e)
則信息設計者的最大化問題可以被錶示為
S,πsupV(S,π)=λ∈ΔfΔΘsupsuppλ∑w′(μ)λ(μ)subject tosuppλ∑μλ(μ)=μ0
應用:反嚮均衡選擇規則下對投資的促進
(暫略)