信息設計學習筆記係列。
在我們這個係列裏,信息的作用體現為“不確定性的降低”(我們將不採用關於風險與不確定性的Knight區分)。因此,在介紹信息的表示與比較之前,需要先了解不確定性的表示與比較。後者主要依賴於機率分佈的知識,但在此處將預設已經具備。
為了敘述方便,首先再來回顧一下單純形的相關概念,雖然在前麵證明不動點定理的時候已經介紹過了。
二維空間裏的單純形是一個一位的線段,三維空間裏的單純形是一個二維的圖形,依次類推,詳細內容可見前麵證明不動點定理的筆記。如果我們把N維空間裏的N-1維平麵稱為“N-1維單純形”,那麼它就是由N個點生成的,根據Caratheodory定理,這個“N-1維單純形”上的每個點都可以由至多N個頂點的凸組合得到。具體地,單純形的記號Δ就表示三維空間裏單純形的形狀:一個三角形。這個三角形的三個頂點分別是(1,0,0);(0,1,0)和(0,0,1)。這個三角形上的點有如下性質:每個點都可以表示成三個頂點的凸組合,因此賦予每個頂點的權重都是非負的,並且權重之和為1。因此,單純形上的點可以用來代錶機率分佈(同時,單純形上的點也可以表示凸組合的係數)。當賦予每頂個點的權重都嚴格為正時,得到的點是單純形的內點;(在三維空間單純形例子裏)當隻賦予其中兩個頂點權重嚴格為正時,得到的點在連接這兩個頂點的邊上;當隻賦予其中一個頂點權重嚴格為正時,得到的點就是這個頂點。
單純形是最簡單的非空緊凸集,而我們都知道非空、緊、凸這三個性質對於經濟學模型的重要性。
如果信息在當前是給定的,行爲人在做預期效用最大化問題,那麽這屬於不確定性經濟學的範疇;如果信息是可變的,比如行爲人可以主動獲取信息以減少其決策的不確定性,那麽這屬於信息經濟學的範疇。(分類參照 BHR, 2013)
預備知識:風險及其規避的比較
假設存在一個世界狀態空間Ω。
“世界狀態”並不需要真的描述關於整個世界或宇宙的狀態,而隻需要、並且必須要完全刻畫,對於我們將要考慮的決策及其決策者來說,那些與決策相關的世界狀態,其中“隻需要”意味著不必包含更多,“必須要”意味著所有可能出現的與問題相關者都得包含在內。同時,設定何種世界狀態取決於我們將要模型化的決策和決策者。世界狀態是對這些與決策相關信息的完全刻畫:如果我們在決策時,知道實際發生的是哪個世界狀態ω∈Ω,那麼將不存在任何不確定性,而決策時的不確定性就來源於我們不知道實際發生的是哪個世界狀態。
此外,這裏不涉及Aumann模型中關於“自然狀態”與“世界狀態”的區別。如果有必要做出這種區別的地方,我將會特別說明。
對於給定的世界狀態Ω,我們可以定義事件集E⊂P(Ω)=2Ω,以及事件e∈E。
一階隨機佔優
定義1. 一個纍積分佈函數 F:R→R 是一個非遞減、右連續並且滿足
x→−∞limF(x)=0
x→−inftylimF(x)=1
定義2. 給定兩個定義在 R 上的纍積分佈函數 F 和 G,如果滿足下式則稱 F 一階隨機佔優 G,並記為 F≥FOSDG
∫u(x)dF(x)≥∫u(x)dG(x)
對於使得前述兩個積分定義良好的任何非遞減函數 u:R→R 都成立。
定理3. 纍積分佈 F 一階隨機佔優 G 當且僅當對於任何 x∈R 都有 F(x)≤G(x)。
即隨機佔優關係可以通過比較在每個點 x 處的取值 (機率) 大小來確定,但由於 F(x) 代錶的是“根據F( ),ω小於等於x” 的機率,因此實際的佔優關係與纍積分佈取值的大小關係是相反的。
給定一個機率空間 (Ω,F,P) 以及定義在其上的隨機變數 X:Ω→R,則 X 的分佈為
FX(x)=P({ω∈Ω:X(ω)≤x})
對於任何兩個隨機變數 X 和 Y,如果對於一個可能的狀態 ω∈Ω 都有 X(ω)≥Y(ω) 則記 X≥Y
推論4. 假設 X 和 Y 是定義在 (Ω,F,P) 上的兩個隨機變數。如果 X≥Y 則 FX≥FOSDFY
即通過比較兩個隨機變數本身的排序關係,可以確定其相應的纍積分佈函數之間的隨機佔優關係。
證明:如果對於任何 ω∈Ω 都有 X(ω)≥Y(ω),則對於任何 x∈R,都有
{ω∈Ω:X(ω)≤x}⊂{ω∈Ω:Y(ω)≤x}
因此
FX(x)=P({ω∈Ω:X(ω)≤x})≤P({ω∈Ω:Y(ω)≤x})=FY(x)
對於 x∈R 都成立,因此根據定理3 有 FX≥FOSDFY。
但即使並不是對於每個 ω 都有 X(ω)≥Y(ω),即存在某個 ω 使得 X(ω)<Y(ω) 依然有可能滿足 FX≥FOSDFY。不過依然可以構造一個部分的反方嚮命題,即
命題5. 如果 G≥FOSDH 則可以找到一個機率空間 (Ω,F,P) 以及其上的兩個隨機變數 X 和 Y 恰好使得 FX=G
以及 FY=H 並滿足 X≥Y。
單調似然比排序
在這一部分僅考慮連續或離散分佈,而不考慮混合等更一般的分佈。
F 滿足 F(x)=∫−∞xf(t) 則稱 F 是以 f 為密度函數的連續分佈。
F 如果有可數 (有限,或可數無限) 的支撐 {x1,x2,...} 並滿足 F(x)=∑xi<xf(xi) 則稱 F 是以 f 為離散密度函數的離散分佈。
定義1. 給定 R 上的兩個纍積分佈函數 F 和 G,其 (連續或離散) 密度函數分別為 f 和 g。則當滿足下式時,稱 F 依單調似然比排序佔優 G,記為 F≥MLRG 或 f≥MLRg 如果
f(x′)g(x)≥f(x)g(x′)
對於任何 x′>x 都成立。
當 f 和 g 都嚴格為正時,前述條件可以變為
g(x′)f(x′)≥g(x)f(x)
即 g(x)f(x) 關於 x 是非遞減的。
引理2. 單調似然比排序可以推出一階隨機佔優。即若 F≥MLRG 則 F≥FOSDG。
證明 (對於連續情形):選定任何 x,對於任何 t′≥x≥t,F≥MLRG意味著 f(t′)g(t)≥f(t)g(t′)。關於 t∈(−∞,x] 積分,可得
f(t′)G(x)=∫−∞xf(t′)g(t)dt≥∫−∞xf(t)g(t′)dt=F(x)g(t′),∀t′≥x
再關於 t′∈[x,∞) 積分,得到
(1−F(x))G(x)=∫x∞f(t′)G(t)dt′≥∫x∞F(x)g(t′)dt′=(1−G(x))F(x)
但根據
(1−F(x))G(x)G(x)−F(x)G(x)G(x)≥≥≥(1−G(x))F(x)F(x)−F(x)G(x)F(x)
而由於我們是任的選 x,所以滿足了一階隨機佔優一節的定理3,即 F≥FOSDG。
定理3. 假設 F 和 G 分別具有嚴格為正的連續密度函數 f 和 g,則下述命題是等價的:
- F≥MLRG
- 在任何有定義的區間[a,b]上,F 的條件分佈一階隨機佔優 G 的條件分佈。即 ∀a,b with a<b
F(b)−G(a)F(x)−F(a)≤G(b)−G(a)G(x)−G(a)∀x∈[a,b]
證明:
邊際似然比性質
邊際似然比與單調似然比
(待補充)
二階隨機佔優
均值不變的風險變動
定理. 對於 [a,b] 上的任何兩個纍積分佈函數 F 和 G,如下命題是等價的
- 存在定義在某個機率空間 (Ω,F,P) 上的隨機變數 X 和 ϵ,使得 F 是 X 的纍積分佈函數,G 是 X+ϵ 的纍積分佈函數,並且 E[ϵ∣X]=0
- 對於任何 t∈[a,b],都有
∫atF(x)dx≤∫atG(x)dx
以及
∫abF(x)dx=∫abG(x)dx
- 對於任何凹函數 u:[a,b]→R 都有
∫u(x)dF(x)≥∫u(x)dG(x)
定義:均值不變的風險變動。對於滿足如上任何一個條件的 F 和 G,稱 F 以保持均值不變地減少風險而區別於 G,稱 G 以保持均值不變地增加風險而區別於 F。對於增加風險的情況,也可稱 G 是 F 的一個保均展形 (mean preseving spread)。記 F≥MPRRG 及 G≥MPSF。
二階隨機佔優的刻畫
定理. 對於 [a,b] 上的任何兩個纍積分佈函數 F 和 G,如下命題是等價的
- 存在定義在某個機率空間 (Ω,F,P) 上的隨機變數 X 和 ϵ,使得 F 是 X 的纍積分佈函數,G 是 X+ϵ 的纍積分佈函數,並且 E[ϵ∣X]≤0
- 對於任何 t∈[a,b],都有 ∫atF(x)dx≤∫atG(x)dx
- 對於任何非遞減的凹函數 u:[a,b]→R 都有
∫u(x)dF(x)≥∫u(x)dG(x)
定義:二階隨機佔優。如果前述定理中任何一個條件得到滿足,則稱 F 二階隨機佔優 G,記為 F≥SOSDG。
定義:增凹序。
命題. 若 G 是 F 的保均展形,則 F 二階隨機佔優 G。
證明:通過條件可知,均值保持的風險減少是在二階隨機佔優基礎上額外增加了均值不變的限製。因此,均值保持的風險減少是一種特殊的二階隨機佔優,從而 F 是 G 均值不變的風險減少 (即 G 是 F 的保均展形) 可以推出 F 二階隨機佔優 G。
引理. 對於 [a,b] 上的分佈 F 和 G,F 二階隨機佔優 G 當且僅當存在 [a,b] 上的另一個分佈 H 使得
F≥MPRRH≥FOSDG
風險規避的比較
信息的表示與比較
假設世界狀態空間Ω為有限集,及其上的機率測度μ。信號空間S。
當世界狀態空間為有限集時,其機率測度可以用單純形來表示,這將大大地簡化符號表示與分析,預計未來我們將引入關於連續統世界狀態的知識,但目前將預設採用有限狀態空間設定。
信號空間可以事先假設為有限集,也可以在附加“可能行動為有限集”的條件下結合“世界狀態空間為有限集”的情況下根據一個命題得出(即:信號空間的元素個數不必多於“世界狀態空間中元素個數與可能行動集元素個數中最小的那個數”)
確定性信息結構與分割
定義:給定信號空間S,一個【確定性信息結構】是一個映射,σ:Ω→S。s=σ(ω)稱為一個【信號實現】。
給定一個先驗信念μ0和一個信息結構σ,則世界狀態與信號實現的聯合分佈為μσ:Ω→Ω×S
μσ(ω,s)={μ00 if σ(ω)=s if σ(ω)=s
則觀察到某信號實現s的無條件機率為
μσ=ω∈Ω∑μσ(ω,s)=ω:σ(ω)=s∑μ0(ω)
則觀察到某信號實現s後(如果本來就認為這一信號實現是有可能發生的μσ(s)>0),對於世界狀態推測的後驗信念為
μs(ω)=μσ(ω∣s)=μσ(s)μσ(ω,s)={∑ω′:σ(ω′)=sμ0(ω′)μ0(ω)0 if σ(ω)=s if σ(ω)=s
定義:狀態空間Ω的一個【分割】
隨機信息結構
給定一個機率空間(Ω,F,μ0),其中Ω為(有限的)世界狀態集,F為定義在世界狀態集上的σ代數,μ0為定義在世界狀態集上的機率測度,則
μ0(ω∈F)=μ0(F)=∫ω∈Fdμ0(ω),∀F∈F
當Ω為有限集時,積分符號變為連加符號。下同。
此時,兩個F-可測的函數f,g:Ω→R是等價的的,當且僅當
μ0(F∣argω[f(ω)=g(ω)]⊂F)=0,∃F∈F
則,定義在可測空間(Ω,F)上的信息結構(S,π)由信號可能集與條件機率嚮量集組成,其中S是有限的潛在可能信號集,s∈S稱為一個信號實現,π是條件機率嚮量集(這個集合中的元素為一個嚮量π( ∣ω),該嚮量的每個分量為相應的s指定一個條件機率,分量個數為S的基數,若Ωw為有限集,則嚮量個數為Ω的基數),π為F-可測的,π(s∣ω)s∈S:Ω→R滿足
s∈S∑π(s∣ω)=1
因此,對於每個信號實現s∈S,(S,P(S),π(s))為一個機率空間,其中P(S)為S的 power set。
對於給定的可測空間(Ω,F),記所有可能的信息結構集為S(Ω,F)。
後驗信念
通過先驗信念μ0和信息結構中的條件機率π:Ω→Δ(S),可以定義聯合機率
p(s,ω)=π(s∣ω)μ0(ω)
從而p(s,F)=∫s∈Fπ(s∣ω)dμ0(ω)表示世界狀態在F中並且觀察到了信號實現s的聯合機率。記PS=(p(s, ))s∈S為聯合機率嚮量,其每個分量為相應的s(及ω)賦以機率。
則關於世界狀態與信號實現構成的二元組(ω,s)∈Ω×S,以及背後的σ代數F×P(S),可以指定集合G∈F×P(S),以及Gs={ω∣(ω,s)∈G},從而定義F×P(S)上的機率測度ρ
ρ(G)=s∈S∑p(Gy,s)
其中p(Gy,s)表示ω∈Gy並且觀察到s的聯合機率。
從而
s∈S∑p(F,s)====s∈S∑∫ω∈Fπ(s∣ω)dμ0(ω)∫ω∈F[s∈S∑π(s∣ω)]dμ0(ω)∫ω∈Fdμ0(ω)μ0(F)
定義聯合機率p關於信號實現的邊際機率q為
q(s)=π(s∣Ω)
並記QS=(q(s))s∈S,則(S,P(S),q)也是一個機率空間,其中q∈QS。可知q(s)=0與∫ω∈Ωπ(s∣ω)μ0(ω)=0是等價的。
記後驗信念嚮量為ΠS=(μ( ∣s))s∈S,q(s)=0,其中後驗信念μ( ∣s)定義為
μ(ω∣s)=q(s)p(ω,s)
從而,給定信號實現s被觀測到,對於“真實世界狀態s在F中”這一事件的推斷為μ(F,s)。因此,對於每個使得q(s)=0的s∈S,(Ω,F,μ)也是一個機率空間。並且,有下式滿足
s∈S,q(s)=0∑q(s)μ(ω∣s)=s∈S,q(s)=0∑p(ω,s)=μ0(ω)
對於根據如上步驟生成的信息結構來說,前式天然地得到滿足;如果由信息設計者內生決定的信息結構來說,前式是作為一個可行性約束而要求被滿足,作為可行性約束時,上式被稱為“貝葉斯可行” (Kamenica & Gentzkow, 2011)。
可見,先驗信念μ0是由那些滿足q(s)=0的後驗信念們(μ( ∣s))s∈S,q(s)=0的凸組合構成的。也正是由於[(1)凸組合係數(2)混合/行為策略(3)機率測度]這三者“賦每個點以正數,並且求和等於1”的一共同之處,使得信息設計問題有意義,並且使得利用凸分析工具和單純形表示來研究信息設計問題成為可能。
極端信息結構
如果π( ∣ω)對於任何s∈S,都隻會從0或1上取值,則稱(S,π)為極端信息結構。
根據∑s∈Sπ(s∣ω)=1的要求可知對於給定的ω∈Ω,隻會有唯一一個sω⋆∈S使得π(sω⋆∣ω)=1,而所有其他s∈S,s=sω⋆隻能有π(s∣ω)=0。其中sω⋆的下標意味著對於不同的ω來說,這個使得π( ∣ω)=1的s⋆可以是不同的。
根據
μ(ω∣s)=q(s)p(ω,s)=q(s)π(s∣ω)μ0(ω)
可知,對於極端信息結構來說,後驗信念也隻會從0或1中取值。因此,對於極端信息結構來說,信息實現可以完全用來確定真實的世界狀態。
當信息結構是由信息設計者內生決定時,極端信息結構又被稱為“完全披露”的信息結構。
合成信息結構
Garbling
固定某個信號潛在可能集,一個信息結構 π1 被稱為比另一個信息結構 π2 “信息量更大”,如果 π2可以通過對π1內元素的凸組合而的得到。
定義:Garbling。一個隨機信號 σ2:Ω→Δ(S2) 被稱為另一個隨機信號 σ1:Ω→Δ(S1) 的 garbling,如果存在一個隨機函數 γ:S1→Δ(S2) (可以稱之為 the garbling function) 使得 σ2 可以表示為在 σ1 上複合一個 γ 的形式,即
σ2(s2∣ω)=s1∈S1∑γ(s2∣s1)σ1(s1∣ω)
定理:給定兩個隨機信息結構 σ1:Ω→Δ(S1) 和 σ2:Ω→Δ(S2),下屬命題是等價的
-
σ2 是 σ1 的 garbling。
-
對於任何行動集 A,那些能夠在 σ1 下實現的 {λσ1},λσ1∈Λ:Ω→Δ(A) 要至少不比能夠在 σ2 下實現的少。即{λσ1}⊂{λσ2},其中 Λ 是指狀態依賴的、在行動集上的分佈。
-
任何一個貝葉斯理性的行為人 (即主觀期望效用最大化者),無論麵臨哪種決策問題,都更偏好 σ1 勝過 σ2。即對於任何 A,u,P,σ1 能夠帶來比 σ2 更高的事前期望效用。
證明:
定義:Blackwell more informative。對於隨機信號 σ1 和 σ2,如果前述定理中任何一個條件得到滿足,則稱 σ1 比 σ2 更有信息量 (σ1 is Blackwell more informative than σ2)。
信息結構的兩種表示
這一部分來自於 Green and Stokey (1978)。
給定一個有限的世界狀態集 Θ,及其各元素 θi,i=1,...,m 的實現概率 ri,i=1,...,m。
- 給定一個有限集 Y,及其各元素 yi,i=1,...,m 的實現概率 πi,i=1,...,m。記為 (Y,π)
- 給定一個有限集 X,定義在世界狀態和該集合的卡氏積 Θ×X 上的測度 μ (未必是乘積測度),並且測度 μ 關於世界狀態 Θ 的邊際分佈恰好等同於 ri,i=1,...,m,並定義 X 的一個分割 S。
定義 1 的解讀為:Y 中的元素為可觀測變量,當背後不可觀測的真實世界狀態為 θj 時,觀測到元素 yj
的條件概率為 πj。因此,當行爲人觀測到某個 yj 時,他根據貝葉斯更新得到後驗概率
λ(θj∣yj)=∑kπk(yj)rkπj(yj)rj
並選擇行動 a 來最優化
i=1∑mλ(θi∣yj)u(θi,a)
信息結構和後驗信念的單調似然比性質
假設世界狀態 Ω 和信號可能集 S 為有限集,並且其元素都可以表示為實數 (因為我們需要序關係才能闡述單調似然比性質,而高維歐式空間會引入不完備序關係這一使得闡述更為複雜化的問題,所以採用一維的實數軸),即 Ω,s⊂R,此時隨機信號 σ:Ω→Δ(S) 就是一族以世界狀態 {ω} 為指標集的條件機率們 {σ( ∣ω)}ω∈Ω,則可以仿照前文定義單調似然比性質
定義. 稱一個信息結構 (隨機信號,或簡稱信號) σ:Ω→Δ(S) 滿足單調似然比性質,若對於更高的世界狀態 ω′>ω,其發送任何信號的條件機率都不會以單調似然比性質更低 σ( ∣ω′)≥MLRσ( ∣ω)。或,對於任何 ω′>ω 以及 s′>s 意味著
σ(s′∣ω′)σ(s∣ω)≥σ(s∣ω′)σ(s′∣ω)
或,當滿足全支撐假設時
σ(s′∣ω)σ(s′∣ω′)≥σ(s∣ω)σ(s∣ω′)
引理. 給定 Ω,S⊂R 和 σ:Ω→Δ(S),對於在 Ω 上的任何先驗信念 μ0,若信息結構 σ 滿足單調似然比性質,則後驗信念 {μs}s∈S:={μ( ∣s)}s∈S 也滿足單調似然比性質。即 s′>s 和 ∑ω∈Ωμ0σ(s∣ω),∑ω∈Ωμ0(ω)σ(s′∣ω)>0 意味著 μ( ∣s)≥MLRμ(∣s′)。
證明:記Pσ(s,ω):=μ0(ω)σ(s′∣ω),
Pσ(s′,ω′)Pσ(s,ω)≥Pσ(s,ω′)Pσ(s′,ω)
定理 (Milgrom, 1981) 給定 Ω,S⊂R 和 σ:Ω→Δ(S),則如下命題等價
- σ 擁有單調似然比性質
- 對於任何先驗信念 μ0,如果 ∑ω∈Ωμ0σ(s∣ω),∑ω∈Ωμ0(ω)σ(s′∣ω)>0 則 μ( ∣s′)≥FOSDμ( ∣s)
證明:因為單調似然比性質意味著一階隨機佔優,所以由 1 推出 2 是平凡的,隻需證明由 2 推出 1。
舉例:在不確定性下的個人決策
基本結構
θ 為世界狀態
a 為最終行為
u(a,θ) (ex post) 效用
y 信號實現
y 和 θ 有一個聯合分佈 p(y,θ),這個聯合分佈可以來自如下兩個元素
- 一個先驗信念 p(θ)
- 一組信號生成機率 {p(y∣θ)}
從而聯合分佈 p(y,θ) 可以通過 p(θ)p(y∣θ) 來得到。
其中信號生成機率 {p(y∣θ)} 可被稱為一個 Blackwell 實驗。
根據全機率公式,某信號實現會出現的邊際機率為
p(y)=∫θp(y∣θ)p(θ)dθ
根據貝葉斯公式,可以得到後驗信念
p(θ∣y)=∫θp(y∣θ)p(θ)dθp(y∣θ)p(θ)
這一步驟被稱為貝葉斯更新。
貝葉斯勸說的Blackwell方法
信息等級
實在太長了,有些在信息設計領域中會用到的其他預備知識,將會單獨再開貼記錄。比如一些簡單的凸分析。
參考文獻
- AUSTEN-SMITH, David. Strategic transmission of costly information. Econometrica: Journal of the Econometric Society, 1994, 955-963.
- BIKHCHANDANI, Sushil; HIRSHLEIFER, Jack; RILEY, John G. The analytics of uncertainty and information. Cambridge University Press, 2013.
- Brooks, B., Frankel, A. P., & Kamenica, E. (2020). Information hierarchies. Available at SSRN 3448870.
- CHAKRABORTY, Archishman; HARBAUGH, Rick. Persuasion by cheap talk. American Economic Review, 2010, 100.5: 2361-82.
- CRAWFORD, Vincent P.; SOBEL, Joel. Strategic information transmission. Econometrica: Journal of the Econometric Society, 1982, 1431-1451.
- Gentzkow, M., & Kamenica, E. (2016). A Rothschild-Stiglitz approach to Bayesian persuasion. American Economic Review, 106(5), 597-601.
- KAMENICA, Emir; GENTZKOW, Matthew. Bayesian persuasion. American Economic Review, 2011, 101.6: 2590-2615.
- Lipnowski, E., Ravid, D., & Shishkin, D. (2019). Persuasion via weak institutions. Available at SSRN 3168103.
- NGUYEN, Anh; TAN, Teck Yong. Bayesian persuasion with costly messages. Journal of Economic Theory, 2021, 193: 105212.
- Salamanca, A. (2021). The value of mediated communication. Journal of Economic Theory, 192, 105191.