信息設計學習筆記係列。
貝葉斯勸説:Kamenica and Gentzkow (2011)
Cheap Talk 勸説:Lipnowski and Ravid (2020)
這一部分研究了:當一方(接收者)的行為既影響自己的效用、又影響另一方(發送者)的效用時,發送者如何通過改變接收者的信念而影響其行動、從而提高自己的效用。
當發送者在真實世界狀態揭曉之前選擇向接收者傳遞信號的方法 (信息結構) 時,稱發送者具有承諾能力,這對應於貝葉斯勸説的情形;
當發送者觀察到真實世界狀態之後再選擇向接收者傳遞信號,并且沒有撒謊或其他信號成本、且信號内容在事後不可驗證時,稱發送者 (完全) 不具有 (任何承諾能力),這對應於 Cheap Talk 情形。
還可以有其他情形,如:有信號成本的 (signaling or costly signal) 情形;可事後驗證 (Hard Evidence) 情形等。
無論發送者的效用怎樣地依賴於接收者的行爲,只要接收者的行爲只取決於自己的效用,那麽就可以稱爲一階貝葉斯勸説 ,單個接收者的問題天然地屬於一階貝葉斯勸説,如果存在多個接收者,那麽當接收者 i i i 的效用只取決於接收者 i i i 自己的行爲(因此只需要關注一階信念 ,即關於世界狀態的信念)、從而無需關注其他接收者 j ≠ i j\neq i j = i 的行爲及信念(即無需關注高階信念 )時,也屬於一階貝葉斯勸説。“一階貝葉斯勸説”中的“一階”指的是“一階信念”。
模型
基本設定
一個信息發送者(Sender),一個信息接收者(Receiver)。
世界狀態是未知的,狀態空間為有限集 Ω \Omega Ω ,行動空間為緊集 A A A 。
發送者和接收者對於世界的狀態有一個共同的先驗信念 μ 0 \mu_{0} μ 0 ,其支撐集為全集(所有狀態都有可能發生)。 μ 0 ( ω ) \mu_{0}(\omega) μ 0 ( ω ) 指當冇有額外的信息時,發送者和接收者認為真實狀態是 ω \omega ω 的機率。μ 0 \mu_{0} μ 0 支撐集為全集這一假設的限製性並不是很強,我們總可以通過重新定義Ω \Omega Ω 來使這一點得到滿足,即:如果某個ω ′ ∈ Ω \omega^{\prime}\in\Omega ω ′ ∈ Ω 有μ 0 ( ω ′ ) = 0 \mu_{0}(\omega^{\prime})=0 μ 0 ( ω ′ ) = 0 ,那麼無妨重新定義Ω ∗ = Ω ∖ { ω ′ } \Omega^{\ast}=\Omega\setminus\left\lbrace \omega^{\prime}\right\rbrace Ω ∗ = Ω ∖ { ω ′ } ,反正我們也不認為ω ′ \omega^{\prime} ω ′ 會發生(μ 0 ( ω ′ ) = 0 \mu_{0}(\omega^{\prime})=0 μ 0 ( ω ′ ) = 0 的含義)
接收者不能直接觀察到真實的狀態,但在觀察到發送者發送的信號之後,根據先驗信念進行貝葉斯更新,並據此採取行動 a ∈ A a\in A a ∈ A ,其行動既影響自己的效用,又影響發送者的效用。(假設我們在行動空間A A A 中隻包含了那些有實際意義者,即∀ a ∈ A , ∃ μ , such that a ∈ a ∗ ( μ ) \forall a\in A,\exists \mu,\text{ such that }a\in a^*(\mu) ∀ a ∈ A , ∃ μ , such that a ∈ a ∗ ( μ ) ,或者說,如果某個行動,無論接收者持有什麼信念都不會採取,那麼就不把它包含在行動空間裏)
既然接收者採取的行動同時影響二者的效用,那麼發送者便會試圖影響接收者的行為,從而使其更多地符合發送者自己的利益。但在這裏,發送者不能直接規定接收者做什麼(可以做出拓展使其同時具有直接規定行為的能力,但在這篇論文裏,按作者所說,為了集中考慮信息的作用,隔絕了這種直接規定的通路。據說這一點也是與機製設計理論的不同之處,如 Bergemann and Morris, 2019 指出的),而是可以通過信息結構來影響接收者的信念,從而間接地影響接收者的行為。
貝葉斯勸説與 Signaling game 的區別則在於,貝葉斯勸説裏的信號並不具有直接影響效用的作用。在 Signaling game 裏,為了實現 Seperating equilibrium,其通過行為發送信號 的成本 需要有差異(如高能力者獲取高學曆的成本更低,使得低能力者難以模仿)。與 Cheap Talk 的區別在於,這裏發送者是有承諾能力的,發送者承諾信息結構發生在真實狀態揭曉之前並且無法在真實狀態揭曉之後反悔,其信號具有實際含義,因此發送者的 Talk 不 Cheap。
發送者的效用函數 v ( a , ω ) v(a,\omega) v ( a , ω ) ,接收者的效用函數 u ( a , ω ) u(a,\omega) u ( a , ω ) ,二者各自都是關於a a a 和ω \omega ω 的連續函數。
其中發送者的效用函數可以取決於世界狀態ω \omega ω ,也可以不取決於它;但接收者的效用函數必須取決於世界狀態 ,因為在目前的框架內,這種依賴關係是發送者僅有的 可以影響接收者行為的作用點。
信息結構 ( S , q ) (S,q) ( S , q )
S S S
q : Ω → Δ ( S ) q:\Omega\rightarrow\Delta(S) q : Ω → Δ ( S )
信息結構有兩部分,S S S 是發送者想讓接收者所能觀測到的信號的潛在可能集 ,q q q 是一組條件機率,既當真實狀態是 ω ∈ Ω \omega\in\Omega ω ∈ Ω 時,觀測到信號 s ∈ S s\in S s ∈ S 的條件機率。這也就意味著,發送者可以指定信號的潛在可能集 S S S 以及對應關係 q q q ,但是無法控製具體實現哪個 s ∈ S s\in S s ∈ S ,並且隱含假設當某個 s ∈ S s\in S s ∈ S 實現之後,發送者不能反悔。
我們稱 s ∈ S s\in S s ∈ S 為信號實現 (即實際出現的信號)。
發送者能讓信號實現通過信息結構依賴於世界狀態,在這個意義上,發送者比接收者具有信息優勢 ,或者更恰當地說發送者具有考察出關於真實狀態信息的能力優勢 ;但當發送者承諾信息結構時,真實狀態尚未揭曉,那麼在這個意義上發送者與接收者的信息是對稱的 。發送者承諾 一個信息結構,意味著發送者能夠可信地將自己考察真實狀態信息的能力隻發揮在一定範圍內 。因此,“發送者”這一稱呼其實不太合適,與 Cheap Talk 相比,此處**“發送者”在行動時也並不知曉真實狀態是什麼**。如果我們採取“信息獲取”與“信息披露”的區別,那麼當“發送者”在觀察到私人信息後再嚮“接收者”傳遞信息的情形,可以稱為“信息披露”,而這篇文章裏“發送者”可信地承諾採取何種精度的信息獲取機製可以稱為“信息獲取”。發送者本身有私人信息的情形,比如 Myerson (1981) 的 Good News and Bad News, (1983) 的 Mechanism Design by an Informed Principal,或者 Nguyen and Tan (2021) 的 Costly messages,還有 Koessler (2021)等。
發送者說自己不會完全發揮,那麼接收者也會相信發送者隻考察出了部分的真實情況,並且接收者知道發送者無法反悔,接收者知道隻生成了這麼多信息,在這篇文章裏,並不存在發送者撒謊的可能,同時,接收者是貝葉斯理性的,接受者也並冇有被欺騙。發送者選擇信息結構發生在真實狀態揭曉之前,因此發送者選擇了哪種信息結構這一行為並不包含著關於真實狀態的什麼信息。
發送者在真實狀態揭曉之前就已經通過信息結構確定了真實狀態與信號實現之間的對應關係,因此信號實現的含義在事前就被確定了,而不是如 Cheap Talk 般在均衡中確定的。
接收者可以觀察到發送者選擇了什麼信息結構,可以根據觀察到的信號實現來逆推實際狀態可能是什麼,但無法直接觀察到真實狀態。
Timing
發送者承諾一個信息結構 ( S , q ) (S,q) ( S , q ) ;
接收者觀察到信息結構 ( S , q ) (S,q) ( S , q ) ;
真實狀態(根據先驗機率)揭曉,並經過信息結構(即根據條件機率)轉換為信號實現,信號實現為接收者觀測到;
接收者根據先驗信念和信號實現進行貝葉斯更新,根據後驗機率採取行動。
發送者和接收者的效用實現,博弈結束。
可以看到,在發送者承諾信息結構的時候,世界狀態仍未揭曉。因此,盡管發送者確實通過自己的行為使得接收者的信念發生了改變,但這裏不涉及“欺騙”問題:發送者也不知道真實的世界狀態為何,發送者所選擇的信息結構是共同知識,特別地,信息結構中所包含的機率同樣為接收者所知。對於博弈中欺騙與誤導的模型化處理,可見 Sobel (2020) 。
策略
發送者的策略:S S S 和 q q q 。即信息結構。
接收者的策略:行動規則(action rule)。接收者根據觀測到的信號實現(進行貝葉斯更新),採取“信號依賴”的行動。(取決於信號實現的行動,用詞仿照“狀態依賴”)
均衡
解概念:完美貝葉斯均衡。註意:從信息設計的角度來說,這是個靜態問題,並且不是個博弈論問題。因為在信息設計的脈絡下談到解概念 (如:貝葉斯相關均衡,協調均衡等) 時,指的是多個接收方之間的均衡,而這裏隻有一個接收方。但在 Sender-Receiver 脈絡下,這是個動態問題,完美貝葉斯均衡指的是發送者和接收者之間的均衡。並且,由於這裏冇有非均衡路徑問題,所以是完美貝葉斯是均衡而不隻是貝葉斯納什均衡。
一般性地,均衡由三個部分組成 ( μ s , q ( ω ) , a ( s ) ) (\mu_{s},q(\omega),a(s)) ( μ s , q ( ω ) , a ( s )) ,其中
μ ( s ) \mu(s) μ ( s ) 為信念系統,由 μ 0 \mu_{0} μ 0 和 q ( ω ) q(\omega) q ( ω ) 根據貝葉斯更新形成;
q ( θ ) q(\theta) q ( θ ) 滿足發送者的貝葉斯理性;
a ( s ) a(s) a ( s ) 最大化接收者的事中效用函數 (滿足接收者的貝葉斯理性)。
均衡結果 ( τ , s ) ∈ Δ Δ ( Ω ) × R (\tau,s)\in\Delta\Delta(\Omega)\times\mathbb{R} ( τ , s ) ∈ ΔΔ ( Ω ) × R 為均衡 ( μ s , q ( ω ) , a ( s ) ) (\mu_{s},q(\omega),a(s)) ( μ s , q ( ω ) , a ( s )) 所引致的後驗信念分佈和發送者的事前效用。
在貝葉斯勸説情形中,q ( θ ) q(\theta) q ( θ ) 滿足發送者的貝葉斯理性體現爲最大化發送者的事前效用函數;在 Cheap Talk 情形中體現爲最大化發送者的事中效用函數,在事中階段發送者已經擁有了私人信息 (觀察到了世界狀態),所以 Cheap Talk 情形施加了額外的關於發送者的激勵相容約束。爲了突出在貝葉斯勸説情形中信息結構的選擇無需滿足發送者的事中激勵相容約束的這一點,也稱貝葉斯勸説中的均衡為承諾機制、均衡結果為承諾結果。
在均衡中,接收者的行動規則應該是對發送者的信息結構的最優反應。同時發送者的信息結構也應該是對接收者的行動規則的最優反應。
接收者的後驗信念 μ s ( ⋅ ) ∈ Δ ( Ω ) \mu_{s}(\cdot)\in\Delta(\Omega) μ s ( ⋅ ) ∈ Δ ( Ω ) (即給定觀察到信號 s s s 的情況下,真實狀態為某個 ω \omega ω 的條件機率)由貝葉斯法則生成:
μ s ( ω ) = μ 0 ( ω ) ⋅ q ( s ∣ ω ) ∑ ω ′ ∈ Ω μ 0 ( ω ′ ) ⋅ q ( s ∣ ω ′ ) \mu_{s}(\omega)=\frac{\mu_{0}(\omega)\cdot q(s\mid\omega)}{\sum_{\omega^{\prime}\in\Omega}\mu_{0}(\omega^{\prime})\cdot q(s\mid\omega^{\prime})}
μ s ( ω ) = ∑ ω ′ ∈ Ω μ 0 ( ω ′ ) ⋅ q ( s ∣ ω ′ ) μ 0 ( ω ) ⋅ q ( s ∣ ω )
接收者根據這個後驗信念來選擇行動a ( μ s ) a(\mu_{s}) a ( μ s ) 來最大化其期望效用:
E μ s u ( a , ω ) = ∑ ω ∈ Ω μ s ( ω ) u ( a , ω ) \mathbb{E}_{\mu_{s}}u(a,\omega) = \sum_{\omega\in\Omega}\mu_{s}(\omega)u(a,\omega)
E μ s u ( a , ω ) = ω ∈ Ω ∑ μ s ( ω ) u ( a , ω )
當接收者的期望效用最大化問題有多個解( { a ∗ ( μ ) } > 1 \left\lbrace a^{\ast}(\mu)\right\rbrace>1 { a ∗ ( μ ) } > 1 )時,即不同的行動都能帶來那個相同的最大值,那麼選擇其中那個能為發送者帶來最大效用的行動a ^ ( μ ) = arg max a ∈ { a ∗ ( μ ) } ∑ ω v ( a , ω ) μ ( ω ) \hat{a}(\mu)=\arg\max_{a\in\left\lbrace a^{\ast}(\mu)\right\rbrace}\sum_{\omega}v(a,\omega)\mu(\omega) a ^ ( μ ) = arg max a ∈ { a ∗ ( μ ) } ∑ ω v ( a , ω ) μ ( ω ) 。由於發送者和接收者的效用函數不必相同(當然正因為如此才有勸說/說服的必要),因此對於接收者來說帶來相同效用值(此時是最大值)的解,未必也給發送者帶來相同的效用值。
發送者選擇信息結構 ( S , q ) (S,q) ( S , q ) ,(通過影響接收者的行為而間接地)使得期望效用最大化:
E P r ( s ) E μ s v ( a , ω ) = ∑ s ∈ S P r ( s ) ∑ ω ∈ Ω μ s v ( a ( μ s , ω ) ) \mathbb{E}_{Pr(s)}\mathbb{E}_{\mu_{s}}v(a,\omega) = \sum_{s\in S}Pr(s)\sum_{\omega\in\Omega}\mu_{s}v(a(\mu_{s},\omega))
E P r ( s ) E μ s v ( a , ω ) = s ∈ S ∑ P r ( s ) ω ∈ Ω ∑ μ s v ( a ( μ s , ω ))
其中 P r ( s ) Pr(s) P r ( s ) 錶示在給定信息結構的情況下,信號s s s 被接收者所觀察到的邊際(即已對各種可能的世界狀態加總後的)機率,a ( μ s ) a(\mu_{s}) a ( μ s ) 中的μ s \mu_{s} μ s 是接收者的後驗信念,而取期望時候E μ s \mathbb{E}_{\mu_{s}} E μ s 中的μ s \mu_{s} μ s 是發送者的後驗信念,盡管在這篇文章中二者是重合的,但在概念上做出這種區分是有必要的。
P r ( s ) = ∑ ω ∈ Ω q ( s ∣ ω ) μ 0 ( ω ) Pr(s)=\sum_{\omega\in\Omega}q(s\mid\omega)\mu_{0}(\omega)
P r ( s ) = ω ∈ Ω ∑ q ( s ∣ ω ) μ 0 ( ω )
由於我們已經假定接收者在觀察到信號實現後,會根據後驗信念採取最優行動,因此整個問題可以簡化為隻有發送者一個行為主體的問題,其中發送者在決策時是預計到自己的行動會引緻接收者的最優行動的,在發送者的問題中,接收者的行為是“機械的”。
行動建議
根據顯示原理(revelation principle,待補充),可以將問題簡化為隻考慮“直接信息結構”(用詞仿照“直接機製”):S ⊂ A S\subset A S ⊂ A ,並且接收者的均衡行動與信號實現相同。這種由發送者直接建議接收者應該做什麼的信息結構被稱為行動建議式信息結構 。
這意味著:發送者直接根據自己事先宣佈的信息結構中的條件機率機械地告訴接收者該做什麼,(不同於作為條件機率的後驗信念是在接收者那邊)這裏的條件機率還是在發送者這邊(信號實現是由自然 根據發送者選擇的信息結構 生成),發送者告訴接收者的是採取何種“純策略”而不是以多少的機率做哪件事a ( μ ) a(\mu) a ( μ ) ,盡管接收者實際採取的行為與信號實現背後的真實狀態之間的對應關係a ( ω ) a(\omega) a ( ω ) 是隨機的。
在行動建議式信息結構下,信號的潛在可能集已經被固定為A A A (或A A A 的子集)了,這時候q : Ω → Δ ( S ) q:\Omega\rightarrow\Delta(S) q : Ω → Δ ( S ) 與q : Ω → Δ ( Ω × S ) q:\Omega\rightarrow\Delta(\Omega\times S) q : Ω → Δ ( Ω × S ) 在一定條件下是等價的(待補充:Crawford and Sobel, 1982 腳註 )
分析
在某些情況下,發送者尋找最優信息結構的問題可以簡化為發送者尋找在後驗信念上的最優分佈的問題。當然,無論是尋找最優信息結構還是尋找後驗信念上的最優分佈,都是在給定接收者會對後驗信念採取最優反應的前提下,因此接收者的“參與約束”或“激勵相容約束”總是得到滿足的:發送者都是在接收者的最優反應的前提下來影響接收者。(類似於Stackelberg模型)
在前麵敘述關於發送者兩層期望效用式我們提到,在真實狀態揭曉之前,發送者便已事先承諾了信息結構。因此,對於給定的信息結構來說,尚未揭曉的真實狀態會(盡管是依據發送者自己選擇的信息結構)引緻不確定的信號,哪種信號會實際出現會影響接收者的貝葉斯更新過程,從而影響其後驗信念。
給定發送者選擇的信息結構,當時尚未揭曉的真實狀態,會使發送者在決策時對於具體引緻接收者的哪種後驗信念具有不確定性,因此,某個信號實現 s ∈ S s \in S s ∈ S 會由於背後意味著的ω ∈ Ω \omega \in \Omega ω ∈ Ω 而引緻一個後驗信念 ,那麼,一個信息結構 ( S , q ) (S,q) ( S , q ) 就引緻了後驗信念上的一個分佈 (由於接收者是根據後驗信念行動,這也意味著信息結構引緻了接收者行為的一個分佈)。反之,對於後驗信念上的一個分佈,和一個信息結構,當它們之間滿足一定的關係時,我們也可說以那個分佈是由那個信息結構所引緻的。
後驗信念上的某個分佈 τ ∈ Δ ( μ ) = Δ ( Δ ( Ω ) ) \tau\in\Delta(\mu)=\Delta(\Delta(\Omega)) τ ∈ Δ ( μ ) = Δ ( Δ ( Ω )) ,和信息結構 ( S , q ) (S,q) ( S , q ) 之間,若滿足以下關係,則我們說 τ \tau τ 是由 ( S , q ) (S,q) ( S , q ) 引緻的:
1.貝葉斯更新。對於每個狀態 ω ∈ Ω \omega\in\Omega ω ∈ Ω 和任何信號實現 s ∈ S s\in S s ∈ S ,都有
μ s ( ω ) = μ 0 ( ω ) ⋅ q ( s ∣ ω ) ∑ ω ′ ∈ Ω μ 0 ( ω ′ ) ⋅ q ( s ∣ ω ′ ) \mu_{s}(\omega)=\frac{\mu_{0}(\omega)\cdot q(s\mid\omega)}{\sum_{\omega^{\prime}\in\Omega}\mu_{0}(\omega^{\prime})\cdot q(s\mid\omega^{\prime})}
μ s ( ω ) = ∑ ω ′ ∈ Ω μ 0 ( ω ′ ) ⋅ q ( s ∣ ω ′ ) μ 0 ( ω ) ⋅ q ( s ∣ ω )
2.所有可能通過某個可能信號實現s ∈ S s\in S s ∈ S 所生成的後驗信念μ s \mu_{s} μ s ,構成這個後驗信念上的分佈的支撐集。
supp ( τ ) = { μ s } s ∈ S \text{supp}(\tau)=\left\lbrace \mu_{s}\right\rbrace_{s\in S}
supp ( τ ) = { μ s } s ∈ S
3.對於任何可能出現的後驗信念 μ \mu μ ,這個後驗信念出現的機率 τ ( μ ) \tau(\mu) τ ( μ ) ,等於所有那些可以通過某個信號實現而使得接收者生成這個後驗信念的機率的加總。
τ ( μ ) = ∑ s : μ s = μ P r ( s ) = ∑ s : μ s = μ ∑ ω ∈ Ω q ( s ∣ ω ) μ 0 ( ω ) \tau(\mu)=\sum_{s:\mu_{s}=\mu}Pr(s)\\
=\sum_{s:\mu_{s}=\mu}\sum_{\omega\in\Omega}q(s\mid\omega)\mu_{0}(\omega) τ ( μ ) = s : μ s = μ ∑ P r ( s ) = s : μ s = μ ∑ ω ∈ Ω ∑ q ( s ∣ ω ) μ 0 ( ω )
我們稱在後驗機率上的一個分佈 τ ( ⋅ ) \tau(\cdot) τ ( ⋅ ) 是貝葉斯可行 的,若它使得後驗機率的期望等於先驗機率:
∑ s u p p o r t ( τ ) μ ⋅ τ ( μ ) = μ 0 \sum_{support(\tau)}\mu\cdot\tau(\mu)=\mu_{0}
s u pp or t ( τ ) ∑ μ ⋅ τ ( μ ) = μ 0
可見,如果一個分佈τ \tau τ 是由信息結構( S , q ) (S,q) ( S , q ) 所引緻的,則
∑ μ ∈ supp ( τ ) τ ( μ ) μ ( ω ) = ∑ μ ∈ supp ( τ ) ∑ s : μ s = μ ∑ ω ′ ∈ Ω q ( s ∣ ω ′ ) μ 0 ( ω ′ ) μ ( ω ) = ∑ μ ∈ supp ( τ ) ∑ s : μ s = μ q ( s ∣ ω ) μ 0 ( ω ) = [ ∑ μ ∈ supp ( τ ) ∑ s : μ s = μ q ( s ∣ ω ) ] μ 0 ( ω ) = 1 ⋅ μ 0 ( ω ) = μ 0 ( ω ) \begin{aligned}
\sum_{\mu\in\text{supp}(\tau)}\tau(\mu)\mu(\omega)
&=\sum_{\mu\in\text{supp}(\tau)}\sum_{s:\mu_{s}=\mu}\sum_{\omega^{\prime}\in\Omega}q(s|\omega^{\prime})\mu_{0}(\omega^{\prime})\mu(\omega)\\
&=\sum_{\mu\in\text{supp}(\tau)}\sum_{s:\mu_{s}=\mu}q(s|\omega)\mu_{0}(\omega)\\
&=[\sum_{\mu\in\text{supp}(\tau)}\sum_{s:\mu_{s}=\mu}q(s|\omega)]\mu_{0}(\omega)\\
&=1\cdot\mu_{0}(\omega)\\
&=\mu_{0}(\omega)
\end{aligned} μ ∈ supp ( τ ) ∑ τ ( μ ) μ ( ω ) = μ ∈ supp ( τ ) ∑ s : μ s = μ ∑ ω ′ ∈ Ω ∑ q ( s ∣ ω ′ ) μ 0 ( ω ′ ) μ ( ω ) = μ ∈ supp ( τ ) ∑ s : μ s = μ ∑ q ( s ∣ ω ) μ 0 ( ω ) = [ μ ∈ supp ( τ ) ∑ s : μ s = μ ∑ q ( s ∣ ω )] μ 0 ( ω ) = 1 ⋅ μ 0 ( ω ) = μ 0 ( ω )
貝葉斯可行也稱作貝葉斯一緻性,它由迭代期望定律而來,因此,根據迭代期望定律,任何後驗信念上的分佈必須滿足“後驗的期望等於先驗”這一條件。“後驗的期望等於先驗”是可行性的必要條件 ,這個必要條件又稱爲後驗信念的鞅性質 。
當考慮單個接收者的情形時,“後驗的期望等於先驗”這一條件,同時也是可行性的充分條件 。
“後驗的期望等於先驗”是貝葉斯可行在單個接收者情形下的充分且必要條件 ,這被稱爲 Splitting Lemma。
貝葉斯可行是這裏的激勵相容約束:在接收者事前看來,按照發送者給出的信號行動不會比按先驗信念行動差。順便提一句,我們說的期望效用最大化,都是指不確定性消失前 的主觀機率 期望效用最大化,如果有時候看起來是使用了客觀機率,那其實隻意味著這時候主觀機率與客觀機率重合;如果有時候看起來博弈結果並冇有最大化參與人的效用,那隻是意味是事前理性 不等於事後理性 ,而我們隻要求事前理性。
這裏事前與事後的區分是不確定性以及最終效用的實現與否,但從整個博弈來看,某個參與人採取事前計畫的時候,可能已經處於整個博弈的事中了。
比如,在不完備信息博弈的框架中,通常將參與人獲取自己信號/類型前的處境稱為事前,而在獲取自己信號/類型後的處境稱為事中。比如,當發送者已經對接收者傳遞了某個信號後,接收者觀察到了信號,並考慮如何根據形成的後驗信念(條件機率)做最優化決策時,便是這個博弈的事中階段。但由於此時不確定性尚未消失、隻有當接收者實際採取行動後效用才會最終實現,因此當其做最優化考量時其目標函數依然是期望 效用。
按照對博弈時間線而非對不確定性消失與否的區分,還可以定義事前期望效用與事中期望效用,比如
E θ E S u ( a p ( s ′ ) , θ ) \mathbb{E}_{\theta}\mathbb{E}_{S}u(a_{p(s^{\prime})},\theta)
E θ E S u ( a p ( s ′ ) , θ )
就是事前期望效用,而
E θ u ( a ( p s ) , θ ∣ s ) \mathbb{E}_{\theta}u(a(p_{s}),\theta|s)
E θ u ( a ( p s ) , θ ∣ s )
就是事中期望效用。其區別在於是否獲得了除先驗以外的信息,無論這個信息是別人傳遞給自己的關於世界狀態或其他人的信息,還是參與人觀察到的關於自己的比如成本等信息。
從而,每個信息結構都能引緻後驗信念上的一個分佈,由信息結構引緻的後驗信念上的分佈,由於行為人的貝葉斯理性,總是滿足貝葉斯可行性。給定後驗信念上的一個分佈,並且後驗信念的期望等於先驗信念,總是存在可以引緻後驗信念上這個給定分佈的信息。
基於信念的方法:將發送者的策略和均衡信念系統都等同於後驗信念上的事前分佈 τ ∈ Δ Δ Ω \tau\in\Delta\Delta\Omega τ ∈ ΔΔΩ ,如果這個分佈滿足貝葉斯可行性 ∫ μ d τ ( μ ) = μ 0 \int\mu d\tau(\mu)=\mu_{0} ∫ μ d τ ( μ ) = μ 0 ,則稱這個分佈 τ \tau τ 為一個信息政策。
均衡結果:( τ , v ) ∈ Δ Δ × R (\tau,v)\in\Delta\Delta\times\mathbb{R} ( τ , v ) ∈ ΔΔ × R ,由均衡 ( μ s , a ( s ) , q ( ω ) ) (\mu_{s},a(s),q(\omega)) ( μ s , a ( s ) , q ( ω )) 所引致的一對元素,分別爲後驗信念的分佈和發送者的事前效用。
如果一個均衡結果中的 τ \tau τ 并非退化的 (τ = δ ( μ 0 ) \tau=\delta(\mu_{0}) τ = δ ( μ 0 ) ,即 τ ( μ 0 ) = 1 , τ ( μ s ) = 0 , ∀ μ s ≠ μ 0 \tau(\mu_{0})=1,\tau(\mu_{s})=0,\forall\mu_{s}\neq\mu_{0} τ ( μ 0 ) = 1 , τ ( μ s ) = 0 , ∀ μ s = μ 0 ),則稱接收者的後驗信念上的這個分佈 τ \tau τ 是有信息量的。
如果僅關注均衡結果,那麽基於信念的方法與原問題是等價的。
因此,有如下引理
引理一
選擇最優的信息結構和選擇信息政策是等價的,即:
max ( S , q ) E q v ( a ( μ s , ω ) ) \max_{(S,q)}\mathbb{E}_{q}v(a(\mu_{s},\omega))
( S , q ) max E q v ( a ( μ s , ω ))
與
max E τ v ( a ( μ s , ω ) ) s . t . E τ τ ( μ s ) = μ 0 \begin{aligned}
&\max\mathbb{E}_{\tau}v(a(\mu_{s},\omega))\\
&s.t.\\
&\mathbb{E}_{\tau}\tau(\mu_{s})=\mu_{0}
\end{aligned} max E τ v ( a ( μ s , ω )) s . t . E τ τ ( μ s ) = μ 0
是等價的。
將發送者關於接收者後驗信念的值函數記為v ^ ( μ ) = E μ v ( a ^ ( μ ) , ω ) \hat {v}(\mu)=\mathbb {E}_{\mu}v(\hat {a}(\mu),\omega) v ^ ( μ ) = E μ v ( a ^ ( μ ) , ω ) ,其中a ^ ( μ ) \hat {a}(\mu) a ^ ( μ ) 是當接收者擁有後驗信念μ \mu μ 是所採取的均衡(最優)行為。在這裏,μ \mu μ 是接收者的後驗信念,會影響接收者的行動,因此會影響發送者的效用;但是在當前的框架下,μ \mu μ 也是發送者的後驗信念,如果發送者的效用也依賴於實際的世界狀態,接收者的給定行為在不同的世界狀態下會給發送者帶來不同的效用。後驗信念在發送者的值函數中出現了兩次。
則前述問題進一步等價為
max E τ v ^ ( a ( μ s , ω ) ) s . t . E τ τ ( μ s ) = μ 0 \begin{aligned}
&\max\mathbb{E}_{\tau}\hat{v}(a(\mu_{s},\omega))\\
&s.t.\\
&\mathbb{E}_{\tau}\tau(\mu_{s})=\mu_{0}
\end{aligned} max E τ v ^ ( a ( μ s , ω )) s . t . E τ τ ( μ s ) = μ 0
在離散情形下,發送者的問題為
v ∗ = max τ ∑ μ ∈ s u p p ( τ ) v ^ ( a ^ ( μ ) , ω ) τ ( μ ) v^{*}=\max _{\tau} \sum_{\mu \in supp(\tau)} \hat {v}(\hat{a}(\mu),\omega)\tau(\mu)
v ∗ = τ max μ ∈ s u pp ( τ ) ∑ v ^ ( a ^ ( μ ) , ω ) τ ( μ )
s.t.
∑ μ ∈ s u p p ( τ ) μ τ ( μ ) = μ 0 \sum_{\mu \in supp (\tau)} \mu \tau(\mu)=\mu_{0}
μ ∈ s u pp ( τ ) ∑ μτ ( μ ) = μ 0
當給定最優的後驗信念上的分佈τ ∗ \tau^{*} τ ∗ 時,
最優信息結構可以如下生成(給定我們採用的是直接推薦)
q ∗ ( s μ ∣ ω ) = μ ( ω ) τ ∗ ( μ ) μ 0 ( ω ) q^{*} (s_{\mu}|\omega)=\frac {\mu(\omega)\tau^{*}(\mu)} {\mu_{0}(\omega)}
q ∗ ( s μ ∣ ω ) = μ 0 ( ω ) μ ( ω ) τ ∗ ( μ )
命題一
下述三個命題是等價的:
存在使得發送者期望效用最大化(實現v ∗ v^{\ast} v ∗ )的行動建議式信息結構。
存在使得發送者期望效用最大化(實現v ∗ v^{\ast} v ∗ )的信息結構。
存在使得發送者期望效用最大化(實現v ∗ v^{\ast} v ∗ )的貝葉斯可行的後驗信念上的分佈。
證明:
1 → 2 1\rightarrow 2
1 → 2
根據定義,行動建議式信息結構也是一種信息結構。
2 → 1 2\rightarrow 1
2 → 1
給定使得發送者達到最大效用v ∗ v^* v ∗ 的信息結構( S , q ) (S,q) ( S , q ) ,我們把其中引緻接收者採取均衡行為的那些信號實現記為
S a = { s ∣ a ^ ( μ s ) = a } S^{a}=\left\lbrace s|\hat{a}(\mu_{s})=a\right\rbrace
S a = { s ∣ a ^ ( μ s ) = a }
考慮另一個信息結構( s ′ , q ′ ) (s^{\prime},q^{\prime}) ( s ′ , q ′ )
其中信號實現的潛在可能集s ′ = A s^{\prime}=A s ′ = A ,並把那些能引緻接收者採取行動a a a 的各種條件機率加總
q ′ ( a ∣ ω ) = ∑ s ∈ S a q ( s ∣ ω ) q^{\prime}(a|\omega)=\sum_{s\in S^{a}}q(s|\omega)
q ′ ( a ∣ ω ) = s ∈ S a ∑ q ( s ∣ ω )
(即,首先替換潛在可能集為行動建議,然後將引緻同一行為的信息結構多個組成部分“打包”成一個條件機率)
此時,
μ a ′ ( ω ) = μ 0 ( ω ) q ′ ( a ∣ ω ) ∑ ω ′ ∈ Ω μ 0 ( ω ′ ) q ′ ( s ′ ∣ ω ′ ) = μ 0 ( ω ) ∑ s ∈ S a q ( s ∣ ω ) ∑ ω ′ ∈ Ω μ 0 ( ω ′ ) ∑ s ′ ∈ S a q ( s ′ ∣ ω ′ ) \begin{aligned}
\mu^{\prime}_{a}(\omega)&=\frac{\mu_{0}(\omega)q^{\prime}(a|\omega)}{\sum_{\omega^{\prime}\in\Omega}\mu_{0}(\omega^{\prime})q^{\prime}(s^{\prime}|\omega^{\prime})}\\
&=\frac{\mu_{0}(\omega)\sum_{s\in S^{a}}q(s|\omega)}{\sum_{\omega^{\prime}\in\Omega}\mu_{0}(\omega^{\prime})\sum_{s^{\prime}\in S^{a}}q(s^{\prime}|\omega^{\prime})}
\end{aligned} μ a ′ ( ω ) = ∑ ω ′ ∈ Ω μ 0 ( ω ′ ) q ′ ( s ′ ∣ ω ′ ) μ 0 ( ω ) q ′ ( a ∣ ω ) = ∑ ω ′ ∈ Ω μ 0 ( ω ′ ) ∑ s ′ ∈ S a q ( s ′ ∣ ω ′ ) μ 0 ( ω ) ∑ s ∈ S a q ( s ∣ ω )
對於任何一個行動a ∈ A a\in A a ∈ A ,都有
∑ ω ∈ Ω u ( a , ω ) μ a ′ ( ω ) = ∑ ω u ( a , ω ) μ 0 ( ω ) ∑ s ∈ S a q ( s ∣ ω ) ∑ ω ′ ∈ Ω μ 0 ( ω ′ ) ∑ s ′ ∈ S a q ( s ′ ∣ ω ′ ) = ∑ ω u ( a , ω ) μ 0 ( ω ) ∑ s ∈ S a q ( s ∣ ω ) 1 ∑ ω ′ ∈ Ω μ 0 ( ω ′ ) ∑ s ′ ∈ S a q ( s ′ ∣ ω ′ ) = ∑ ω u ( a ^ ( μ s ) , ω ) μ 0 ( ω ) ∑ s ∈ S a q ( s ∣ ω ) 1 ∑ ω ′ ∈ Ω μ 0 ( ω ′ ) ∑ s ′ ∈ S a q ( s ′ ∣ ω ′ ) ≥ ∑ ω u ( a ⋆ , ω ) μ 0 ( ω ) ∑ s ∈ S a q ( s ∣ ω ) 1 ∑ ω ′ ∈ Ω μ 0 ( ω ′ ) ∑ s ′ ∈ S a q ( s ′ ∣ ω ′ ) = ∑ ω u ( a ⋆ , ω ) μ a ′ ( ω ) ∀ a ⋆ ∈ A \begin{aligned}
\sum_{\omega\in\Omega}u(a,\omega)\mu^{\prime}_{a}(\omega)&=\sum_{\omega}u(a,\omega)\frac{\mu_{0}(\omega)\sum_{s\in S^{a}}q(s|\omega)}{\sum_{\omega^{\prime}\in\Omega}\mu_{0}(\omega^{\prime})\sum_{s^{\prime}\in S^{a}}q(s^{\prime}|\omega^{\prime})}\\
&=\sum_{\omega}u(a,\omega)\mu_{0}(\omega)\sum_{s\in S^{a}}q(s|\omega)\frac{1}{\sum_{\omega^{\prime}\in\Omega}\mu_{0}(\omega^{\prime})\sum_{s^{\prime}\in S^{a}}q(s^{\prime}|\omega^{\prime})}\\
&=\sum_{\omega}u(\hat{a}(\mu_{s}),\omega)\mu_{0}(\omega)\sum_{s\in S^{a}}q(s|\omega)\frac{1}{\sum_{\omega^{\prime}\in\Omega}\mu_{0}(\omega^{\prime})\sum_{s^{\prime}\in S^{a}}q(s^{\prime}|\omega^{\prime})}\\
&\geq\sum_{\omega}u(a^{\star},\omega)\mu_{0}(\omega)\sum_{s\in S^{a}}q(s|\omega)\frac{1}{\sum_{\omega^{\prime}\in\Omega}\mu_{0}(\omega^{\prime})\sum_{s^{\prime}\in S^{a}}q(s^{\prime}|\omega^{\prime})}\\
&=\sum_{\omega}u(a^{\star},\omega)\mu^{\prime}_{a}(\omega)\\
\forall a^{\star}\in A
\end{aligned} ω ∈ Ω ∑ u ( a , ω ) μ a ′ ( ω ) ∀ a ⋆ ∈ A = ω ∑ u ( a , ω ) ∑ ω ′ ∈ Ω μ 0 ( ω ′ ) ∑ s ′ ∈ S a q ( s ′ ∣ ω ′ ) μ 0 ( ω ) ∑ s ∈ S a q ( s ∣ ω ) = ω ∑ u ( a , ω ) μ 0 ( ω ) s ∈ S a ∑ q ( s ∣ ω ) ∑ ω ′ ∈ Ω μ 0 ( ω ′ ) ∑ s ′ ∈ S a q ( s ′ ∣ ω ′ ) 1 = ω ∑ u ( a ^ ( μ s ) , ω ) μ 0 ( ω ) s ∈ S a ∑ q ( s ∣ ω ) ∑ ω ′ ∈ Ω μ 0 ( ω ′ ) ∑ s ′ ∈ S a q ( s ′ ∣ ω ′ ) 1 ≥ ω ∑ u ( a ⋆ , ω ) μ 0 ( ω ) s ∈ S a ∑ q ( s ∣ ω ) ∑ ω ′ ∈ Ω μ 0 ( ω ′ ) ∑ s ′ ∈ S a q ( s ′ ∣ ω ′ ) 1 = ω ∑ u ( a ⋆ , ω ) μ a ′ ( ω )
S a S^{a} S a 中的點是根據以下標準挑選出來的,首先,給定先驗信念和原有的信息結構(因此我們需要把信念展開才能比較接收者的行為),接收者在持有後驗信念μ s , ∀ s \mu_{s},\forall s μ s , ∀ s 時採取最優反應{ a ∗ ( μ s ) } \left\lbrace a^{\ast}(\mu_{s})\right\rbrace { a ∗ ( μ s ) } ,從其中挑選出來對發送者最有利的a ^ ( μ ) \hat{a}(\mu) a ^ ( μ ) ,並且將那些使接收者採取相同行為的不同信號實現聚在一起S a = { s ∣ a ^ ( μ s ) = a } S^{a}=\left\lbrace s|\hat{a}(\mu_{s})=a\right\rbrace S a = { s ∣ a ^ ( μ s ) = a } 。因此,根據定義,a a a 是接收者對於s ∈ S a s\in S^{a} s ∈ S a 這些信號的最優反應;當s ′ = A s^{\prime}=A s ′ = A ,並把那些引緻相同行為a ( s ) = a , ∀ s ∈ S a a(s)=a,\forall s\in S^{a} a ( s ) = a , ∀ s ∈ S a 的不同信號實現之條件機率“打包”在一起之後,a a a (接收者的行為)依然是對於根據q ′ ( ⋅ ∣ ω ) q^{\prime}(\cdot|\omega) q ′ ( ⋅ ∣ ω ) 生成的a a a (發送者的推薦)的最優反應。
由此,我們根據任一最優信息結構( S , q ) (S,q) ( S , q ) ,通過重新定義信號實現的潛在可能集、並“打包”引緻接收者相同均衡行為的條件機率,構造出了一個給發送者帶來相同效用值v ∗ v^* v ∗ 的行動建議式信息結構( s ′ , q ′ ) = ( A , q ′ ) (s^{\prime},q^{\prime})=(A,q^{\prime}) ( s ′ , q ′ ) = ( A , q ′ ) 。
1 → 3 1\rightarrow 3
1 → 3
給定一個貝葉斯可行的後驗信念上的分佈τ \tau τ ,記
q ( s ∣ ω ) = μ s ( ω ) τ ( μ s ) μ 0 ( ω ) q(s|\omega)=\frac{\mu_{s}(\omega)\tau(\mu_{s})}{\mu_{0}(\omega)}
q ( s ∣ ω ) = μ 0 ( ω ) μ s ( ω ) τ ( μ s )
由於我們假設先驗信念具有全支撐,因此分母總是為正的,上式具有良好定義。
從而
q ( s ∣ ω ) μ 0 ( ω ) = μ s ( ω ) τ ( μ s ) q(s|\omega)\mu_{0}(\omega)=\mu_{s}(\omega)\tau(\mu_{s})
q ( s ∣ ω ) μ 0 ( ω ) = μ s ( ω ) τ ( μ s )
進而
∑ ω ∈ Ω q ( s ∣ ω ) μ 0 ( ω ) = ∑ ω ∈ Ω μ s ( ω ) τ ( μ s ) \sum_{\omega\in\Omega}q(s|\omega)\mu_{0}(\omega)=\sum_{\omega\in\Omega}\mu_{s}(\omega)\tau(\mu_{s})
ω ∈ Ω ∑ q ( s ∣ ω ) μ 0 ( ω ) = ω ∈ Ω ∑ μ s ( ω ) τ ( μ s )
3 → 2 3\rightarrow 2
3 → 2
根據引理一,每個信息結構( S , q ) (S,q) ( S , q ) 都對應於一個後驗信念上的分佈τ \tau τ 。因此
E τ ∑ ω v ^ ( a ^ ( μ ) , ω ) μ ( ω ) = ∑ μ ∈ supp ( τ ) τ ( μ ) ∑ ω v ^ ( a ^ ( μ ) , ω ) μ ( ω ) = ∑ μ ∈ supp ( τ ) [ ∑ s : μ s = μ ∑ ω ′ q ( s ∣ ω ′ ) μ 0 ( ω ′ ) ] [ ∑ ω v ^ ( a ^ ( μ ) , ω ) μ ( ω ) ] = ∑ μ ∈ supp ( τ ) ∑ ω ∑ s : μ s = μ ∑ ω ′ q ( s ∣ ω ′ ) μ 0 ( ω ) μ s ( ω ) v ^ ( a ^ ( μ ) , ω ) = ∑ μ ∈ supp ( τ ) ∑ ω ∑ s : μ s = μ μ 0 ( ω ) q ( s ∣ ω ) v ^ ( a ^ ( μ ) , ω ) = ∑ s ∑ ω μ 0 ( ω ) q ( s ∣ ω ) v ^ ( a ^ ( μ s , ω ) ) = E ( S , q ) v ^ ( a ^ ( μ s ) , ω ) \begin{aligned}
&\mathbb{E}_{\tau}\sum_{\omega}\hat{v}(\hat{a}(\mu),\omega)\mu(\omega)\\
&=\sum_{\mu\in\text{supp}(\tau)}\tau(\mu)\sum_{\omega}\hat{v}(\hat{a}(\mu),\omega)\mu(\omega)\\
&=\sum_{\mu\in\text{supp}(\tau)}[\sum_{s:\mu_{s}=\mu}\sum_{\omega^{\prime}}q(s|\omega^{\prime})\mu_{0}(\omega^{\prime})][\sum_{\omega}\hat{v}(\hat{a}(\mu),\omega)\mu(\omega)]\\
&=\sum_{\mu\in\text{supp}(\tau)}\sum_{\omega}\sum_{s:\mu_{s}=\mu}\sum_{\omega^{\prime}}q(s|\omega^{\prime})\mu_{0}(\omega)\mu_{s}(\omega)\hat{v}(\hat{a}(\mu),\omega)\\
&=\sum_{\mu\in\text{supp}(\tau)}\sum_{\omega}\sum_{s:\mu_{s}=\mu}\mu_{0}(\omega)q(s|\omega)\hat{v}(\hat{a}(\mu),\omega)\\
&=\sum_{s}\sum_{\omega}\mu_{0}(\omega)q(s|\omega)\hat{v}(\hat{a}(\mu_{s},\omega))\\
&=\mathbb{E}_{(S,q)}\hat{v}(\hat{a}(\mu_{s}),\omega)
\end{aligned} E τ ω ∑ v ^ ( a ^ ( μ ) , ω ) μ ( ω ) = μ ∈ supp ( τ ) ∑ τ ( μ ) ω ∑ v ^ ( a ^ ( μ ) , ω ) μ ( ω ) = μ ∈ supp ( τ ) ∑ [ s : μ s = μ ∑ ω ′ ∑ q ( s ∣ ω ′ ) μ 0 ( ω ′ )] [ ω ∑ v ^ ( a ^ ( μ ) , ω ) μ ( ω )] = μ ∈ supp ( τ ) ∑ ω ∑ s : μ s = μ ∑ ω ′ ∑ q ( s ∣ ω ′ ) μ 0 ( ω ) μ s ( ω ) v ^ ( a ^ ( μ ) , ω ) = μ ∈ supp ( τ ) ∑ ω ∑ s : μ s = μ ∑ μ 0 ( ω ) q ( s ∣ ω ) v ^ ( a ^ ( μ ) , ω ) = s ∑ ω ∑ μ 0 ( ω ) q ( s ∣ ω ) v ^ ( a ^ ( μ s , ω )) = E ( S , q ) v ^ ( a ^ ( μ s ) , ω )
因此,在最優信息結構下
∑ ω u ( a ^ ( μ s ) , ω ) μ s ( ω ) ≥ ∑ ω u ( a ∗ ( μ s ) , ω ) μ s ( ω ) ≥ ∑ ω u ( a ∗ ( μ 0 ) , ω ) μ s ( ω ) \begin{aligned}
&\sum_{\omega}u(\hat{a}(\mu_{s}),\omega)\mu_{s}(\omega)\\
\geq&\sum_{\omega}u(a^{\ast}(\mu_{s}),\omega)\mu_{s}(\omega)\\
\geq&\sum_{\omega}u(a^{\ast}(\mu_{0}),\omega)\mu_{s}(\omega)\\
\end{aligned} ≥ ≥ ω ∑ u ( a ^ ( μ s ) , ω ) μ s ( ω ) ω ∑ u ( a ∗ ( μ s ) , ω ) μ s ( ω ) ω ∑ u ( a ∗ ( μ 0 ) , ω ) μ s ( ω )
即在最優信息結構下,接收者聽從建議不會得到比僅僅按照先驗信息行動更低的期望效用。但這一性質是由於給定的信號實現與背後的真實狀態之間是以機率連接的,按照效用實現來劃分,這是事前性質。當效用實現之後,效用的實現值取決於真實的世界狀態,從事後來看,在效用實現之後,聽從建議的接收者可能會發現實際的效用值低於直接按照先驗信念行動的預設效用。即,盡管期望值不會低於預設效用,但參與取期望的各個組成部分不必高於預設效用。(同時,由於我們的框架是關註發送者的效用,因此,後文中對於發送者來說的∀ μ with τ ( μ ) > 0 , V ( μ ) = v ^ ( μ ) \forall\mu\text{ with }\tau(\mu)>0,V(\mu)=\hat{v}(\mu) ∀ μ with τ ( μ ) > 0 , V ( μ ) = v ^ ( μ ) 這一性質對於接收者來說不成立。)
這個命題回答了如下問題:
為什麼行動建議式的信息結構就足夠了?
為什麼“選擇最優信息結構”等價於“選擇後驗信念上的最優分佈”?
推論一
發送者能夠通過勸說獲利,當且僅當存在一個貝葉斯可行的後驗信念上的分佈τ ∈ Δ Δ ( Ω ) \tau\in\Delta\Delta(\Omega) τ ∈ ΔΔ ( Ω ) 使得
E τ v ^ ( μ ) > v ^ ( μ 0 ) \mathbb{E}_{\tau}\hat{v}(\mu)>\hat{v}(\mu_{0})
E τ v ^ ( μ ) > v ^ ( μ 0 )
其最優值v ∗ v^{\ast} v ∗ 由下式給出
max E τ v ^ ( a ( μ s , ω ) ) s . t . E τ τ ( μ s ) = μ 0 \begin{aligned}
&\max\mathbb{E}_{\tau}\hat{v}(a(\mu_{s},\omega))\\
&s.t.\\
&\mathbb{E}_{\tau}\tau(\mu_{s})=\mu_{0}
\end{aligned} max E τ v ^ ( a ( μ s , ω )) s . t . E τ τ ( μ s ) = μ 0
其中v ^ ( μ ) \hat{v}(\mu) v ^ ( μ ) 為發送者的效用關於接收者的後驗信念μ \mu μ 的值函數。
然而,這隻是錶明,如果存在最優信息結構/勸說/分享信息/後驗信念上的分佈的話,應該怎麼找出來。但它本身並不意味著最優解存在。但而,後麵我們可以看到,偏嚮發送者的“打破僵局”慣例(即,給定接收者持有的後驗信念,如果接收者的最優解是多點集,則選出其中使得發送者效用最高的一個)保證了最優解的存在。
凹化解
將發送者的期望效用錶示為關於接收者的後驗信念的函數,這種後驗信念與效用值的對應關係錶示為一個函數。(假定當接收者有多個最優行動時,選出其中對發送者最有利的那一個,從而這真的是一個單值的函數關係,而不是多值的對應關係)
發送者效用函數的凹化函數,就是那些逐點取值不小於效用函數取值 的凹函數 中,逐點函數值最小 的那一個。
此處“凹化”術語可能稍微有些奇怪。但其實對函數的凹化其實是在給函數的圖像做凸 包。當目標函數變成凹函數之後,最大化問題就可以使用常規的最優化方法來進行求解。(在凸分析中,相關概念可見concave/convex closure, concav(convex-)ify, concav(convex-)ification, concave/convex envelope, conjugate, major(minor-)ization等)
為什麼能夠找到滿足這樣性質的凹函數呢?因為,發送者第二層期望效用是在通過後驗信念的分佈做組合,這種組合使得上麵不凹的地方被磨平了。在當前的假設下,對後驗信念上的分佈再次取期望得到的效用就是這個凹函數。在機率分佈集–單純形這個緊集上對一個上半連續(semi,不是hemi,這是由於“當存在接收者的多個最優行為時選擇對發送者最有利的一個”這個假設,並且,由於雙層期望效用是由第一層期望效用(發送者效用關於接收者後驗信念的值函數)的凸組合得來的,它繼承了上半連續的性質)做最大化,解總是存在的。
定義函數v ^ ( μ ) \hat{v}(\mu) v ^ ( μ ) 的下圖的凸包
V = c o ( { ( v , μ ) ∈ R × Δ ( Ω ) ∣ v ≤ v ^ ( μ ) } ) V=co(\left\lbrace (v,\mu)\in\mathbb{R}\times\Delta(\Omega)|v\leq\hat{v}(\mu)\right\rbrace)
V = co ( { ( v , μ ) ∈ R × Δ ( Ω ) ∣ v ≤ v ^ ( μ ) } )
對於接收者的任意後驗信念μ ∈ Δ ( Ω ) \mu\in\Delta(\Omega) μ ∈ Δ ( Ω ) ,定義發送者效用值函數的凹化函數,
V ( μ ) = sup { v ∈ R ∣ ( v , μ ) ∈ V } V(\mu)=\sup\left\lbrace v\in\mathbb{R}|(v,\mu)\in V\right\rbrace
V ( μ ) = sup { v ∈ R ∣ ( v , μ ) ∈ V }
那些凹化後的函數值嚴格高於值函數的地方,該處對應的信念,就是那些當它們是先驗信念的時候,發送者可以通過操控信念而得利的地方。(但這也意味著,當發送者關於接收者後驗信念的值函數已經為凹函數的時候,凹化函數就等於原來的函數,二者完全重合,此時發送者無法通過擾動信念獲利。)(另有一種採用仿射函數的等價定義方式,可見Aliprantis and Border, 2006)
通過比較在先驗信念處,值函數和凹化函數值,可以得知發送者是否可以通過擾動信念而獲利。當可以獲利的時候,那些使得“值函數的凸組合成為凹化函數值”的點們,就是應該最優信息結構引緻的後驗信念。
其中,貝葉斯可行的要求,使得“發送者可以通過擾動信念而獲得的最大效用”v ∗ v^{*} v ∗ ,與凹化函數在先驗信念處的取值V ( μ 0 ) V(\mu_{0}) V ( μ 0 ) 相同,因此給予了我們通過凹化法來求解最優問題的合理性。
下麵總結了一些信息披露程度與信念在單純形中的位置之間的關係。
完全披露:對應於單純形的一個頂點。
完全無信息:對應於單純形的一個特定內點(先驗信念)。
部分披露:對應於單純形的某個非頂點。
強披露:對應於單純形的邊界。
頂點意味著接收者通過觀察信號實現,能夠確定地倒推出真實的世界狀態是哪個;非頂點意味著某些信息並冇有被發送者傳遞給接收者,其中內點意味著接收者認為每種狀態都有可能,盡管對各種狀態發生機率的判斷或許不同於先驗信念,而某條邊意味著接收者已經倒推出這條邊對麵 的那個點所代錶狀態是不可能的。
推論二
發送者通過擾動後驗信念所能得到的最大效用是V ( μ 0 ) V(\mu_{0}) V ( μ 0 ) ,發送者能夠通過擾動後驗信念得利當且僅當
V ( μ 0 ) > v ^ ( μ 0 ) V(\mu_{0})>\hat{v}(\mu_{0})
V ( μ 0 ) > v ^ ( μ 0 )
我們說發送者願意分享信息,如果存在某個後驗信念μ \mu μ ,使得給定發送者持有這個後驗信念時:發送者通過分享信息,引緻接收者也持有這個後驗信念μ \mu μ 並依此行動帶給發送者的效用,要高於雖然發送者持有這個後驗信念μ \mu μ 但不分享信息使接收者按先驗信念μ 0 \mu_{0} μ 0 並依此行動帶給發送者的效用。
v ^ ( μ ) > ∑ ω v ( a ^ ( μ 0 ) , ω ) μ ( ω ) \hat{v}(\mu)>\sum_{\omega}v(\hat{a}(\mu_{0}),\omega)\mu(\omega)
v ^ ( μ ) > ω ∑ v ( a ^ ( μ 0 ) , ω ) μ ( ω )
其中對ω \omega ω 的加總意味著這是事前的比較,世界狀態尚未揭曉,而發送者對不同後驗信念μ s = μ \mu_{s}=\mu μ s = μ 與μ s = μ 0 \mu_{s}=\mu_{0} μ s = μ 0 的比較是預測性質的。
盡管從錶麵上來,發送者願意分享信息與發送者能夠通過分享信息/勸說/擾動後驗信念來獲利是同一件事,而事實上,發送者是否願意分享信息是取決於是否存在某個滿足要求的後驗信念μ \mu μ ,但當發送者分享信息後,不同的信號實現會引緻不同的後驗信念,比如既有那個滿足要求的後驗信念μ \mu μ 又有另外一個μ ′ \mu^{\prime} μ ′ (除非完全不分享信息,那麼就隻會有一個μ 0 \mu_{0} μ 0 ),這時發送者是否能夠通過分享信息獲利還取決於接收者的行為a ^ ( μ ) \hat{a}(\mu) a ^ ( μ ) 帶來的v ^ ( μ ) \hat{v}(\mu) v ^ ( μ ) 和a ^ ( μ ′ ) \hat{a}(\mu^{\prime}) a ^ ( μ ′ ) 帶來的v ^ ( μ ′ ) \hat{v}(\mu^{\prime}) v ^ ( μ ′ ) 。
我們接下來可以看到:如果發送者能夠通過勸說來獲利,那麼發送者一定願意分享信息;但發送者願意分享信息,並不意味著發送者能夠通過勸說來獲利,額外的條件是接收者的偏好在先驗信念處是離散的。
命題二
(1) 如果發送者不願意分享信息,那意味著發送者不能通過勸說來獲利。
(2) 如果發送者願意分享信息,並且接收者的偏好在先驗信念處是離散的,那麼發送者便可以通過勸說來獲利。
(3) 如果接收者的行動可能集A A A 為有限集,則接收者的偏好在先驗信念μ 0 \mu_{0} μ 0 處通常 是離散的。(“通常”是指 generic property,即不滿足文中性質的情況測度為0,由於冇看過中文的高等機率論/測度論內容,我不太清楚這個詞在中文裏的錶述為何)
我們說接收者的偏好在信念μ \mu μ 處是離散的,如果接收者在持有信念時μ \mu μ 通過最優行動a ^ ( μ ) \hat{a}(\mu) a ^ ( μ ) 所能得到的期望效用,要比接收雖然持有信念μ \mu μ 、但採取任何其他行動∀ a ≠ a ^ ( μ ) \forall a\neq\hat{a}(\mu) ∀ a = a ^ ( μ ) 所得到的期望效用都要高出某個嚴格為正的ϵ > 0 \epsilon>0 ϵ > 0 ,即
∃ ϵ > 0 , such that ∑ u ( a ^ ( μ ) , ω ) μ ( ω ) > ∑ u ( a , ω ) μ ( ω ) + ϵ \exists\epsilon>0,\text{such that}\sum u(\hat{a}(\mu),\omega)\mu(\omega)>\sum u(a,\omega)\mu(\omega)+\epsilon
∃ ϵ > 0 , such that ∑ u ( a ^ ( μ ) , ω ) μ ( ω ) > ∑ u ( a , ω ) μ ( ω ) + ϵ
根據假設∀ μ , ∃ a ^ ( μ ) \forall\mu,\exists \hat{a}(\mu) ∀ μ , ∃ a ^ ( μ ) ,又u u u 是連續函數,從而∑ ω u ( a , ω ) μ ( ω ) \sum_{\omega}u(a,\omega)\mu(\omega) ∑ ω u ( a , ω ) μ ( ω ) 是連續函數,因此如果接收者的偏好在μ \mu μ 處是離散的,則∃ δ > 0 \exists\delta>0 ∃ δ > 0 ,使得∀ μ ′ ∈ N ( μ , δ ) \forall\mu^{\prime}\in N(\mu,\delta) ∀ μ ′ ∈ N ( μ , δ ) ,都有∑ u ( a ^ ( μ ) , ω ) μ ′ ( ω ) > ∑ u ( a , ω ) μ ′ ( ω ) \sum u(\hat{a}(\mu),\omega)\mu^{\prime}(\omega)>\sum u(a,\omega)\mu^{\prime}(\omega) ∑ u ( a ^ ( μ ) , ω ) μ ′ ( ω ) > ∑ u ( a , ω ) μ ′ ( ω ) ,因此a ^ ( μ ′ ) = a ^ ( μ ) \hat{a}(\mu^{\prime})=\hat{a}(\mu) a ^ ( μ ′ ) = a ^ ( μ ) 。
證明:
(1) 如果發送者不願意分享信息,那麼∀ μ , v ^ ( μ ) ≤ ∑ ω v ( a ^ ( μ 0 ) , ω ) μ ( ω ) \forall\mu,\hat{v}(\mu)\leq\sum_{\omega}v(\hat{a}(\mu_{0}),\omega)\mu(\omega) ∀ μ , v ^ ( μ ) ≤ ∑ ω v ( a ^ ( μ 0 ) , ω ) μ ( ω ) 。即不論發送者持有何種後驗信念μ \mu μ ,他都甯願接收者僅根據先驗信念μ 0 \mu_{0} μ 0 採取行動a ^ ( μ 0 ) \hat{a}(\mu_{0}) a ^ ( μ 0 ) 。這時給定一個引緻τ \tau τ 的q q q ,它能為發送者帶來的最大效用為∑ s ∈ S τ s v ^ ( μ s ) ≤ ∑ s ∈ S τ s ∑ ω v ( a ^ ( μ 0 ) , ω ) μ s ( ω ) = v ^ ( μ 0 ) \sum_{s\in S}\tau_{s}\hat{v}(\mu_{s})\leq\sum_{s\in S}\tau_{s}\sum_{\omega}v(\hat{a}(\mu_{0}),\omega)\mu_{s}(\omega)=\hat{v}(\mu_{0}) ∑ s ∈ S τ s v ^ ( μ s ) ≤ ∑ s ∈ S τ s ∑ ω v ( a ^ ( μ 0 ) , ω ) μ s ( ω ) = v ^ ( μ 0 ) ,這意味著發送者通過擾動信念所能得到的最大期望效用都不會高於讓接收者按先驗信念行動能給他帶來的效用高。
(2) 給定接收者採取當信念為μ 0 \mu_{0} μ 0 時的最優行動a ^ ( μ 0 ) \hat{a}(\mu_{0}) a ^ ( μ 0 ) ,其在不同信念下的加總∑ u ( a ^ ( μ 0 ) , ω ) μ ( ω ) \sum u(\hat{a}(\mu_{0}),\omega)\mu(\omega) ∑ u ( a ^ ( μ 0 ) , ω ) μ ( ω ) 關於信念μ \mu μ 是線性的,從而是連續函數。又接收者的偏好在μ 0 \mu_{0} μ 0 處是離散的,因此當其信念離μ 0 \mu_{0} μ 0 不太遠時他仍然願意採用a ^ ( μ 0 ) \hat{a}(\mu_{0}) a ^ ( μ 0 ) ,即∃ δ > 0 \exists \delta>0 ∃ δ > 0 使得∀ μ ∈ N ( μ 0 , δ ) \forall \mu\in N(\mu_{0},\delta) ∀ μ ∈ N ( μ 0 , δ ) ,都有a ^ ( μ ) = a ^ ( μ 0 ) \hat{a}(\mu)=\hat{a}(\mu_{0}) a ^ ( μ ) = a ^ ( μ 0 ) 。既然發送者願意分享信息,那麼存在某個μ h \mu_{h} μ h 使得v ^ ( μ h ) > ∑ ω v ( a ^ ( μ 0 ) , ω ) μ h ( ω ) \hat{v}(\mu_{h})>\sum_{\omega}v(\hat{a}(\mu_{0}),\omega)\mu_{h}(\omega) v ^ ( μ h ) > ∑ ω v ( a ^ ( μ 0 ) , ω ) μ h ( ω ) 。考慮一個從μ h \mu_{h} μ h 出發、通過μ 0 \mu_{0} μ 0 的射線,由於我們假設μ 0 \mu_{0} μ 0 具有全支撐,μ 0 \mu_{0} μ 0 是個內點,那麼存在某個μ l ∈ N ( μ 0 , δ ) \mu_{l}\in N(\mu_{0},\delta) μ l ∈ N ( μ 0 , δ ) 使得μ 0 = γ ⋅ μ l + ( 1 − γ ) μ h \mu_{0}=\gamma\cdot\mu_{l}+(1-\gamma)\mu_{h} μ 0 = γ ⋅ μ l + ( 1 − γ ) μ h 其中γ ∈ ( 0 , 1 ) \gamma\in (0,1) γ ∈ ( 0 , 1 ) 。我們把這個凸組合的係數作為後驗信念μ l \mu_{l} μ l 和μ h \mu_{h} μ h 在後驗信念上的分佈τ \tau τ 中的機率:τ ( μ l ) = γ \tau(\mu_{l})=\gamma τ ( μ l ) = γ 及τ ( μ h ) = 1 − γ \tau(\mu_{h})=1-\gamma τ ( μ h ) = 1 − γ 。由於接收者在先驗信念μ 0 \mu_{0} μ 0 處的偏好是離散的,而μ l ∈ N ( μ 0 , δ ) \mu_{l}\in N(\mu_{0},\delta) μ l ∈ N ( μ 0 , δ ) ,因此a ^ ( μ l ) = a ^ ( μ 0 ) \hat{a}(\mu_{l})=\hat{a}(\mu_{0}) a ^ ( μ l ) = a ^ ( μ 0 ) ,此時v ^ ( μ l ) = ∑ ω v ( a ^ ( μ l ) , ω ) μ l ( ω ) = ∑ ω v ( a ^ ( μ 0 ) , ω ) μ l ( ω ) \hat{v}(\mu_{l})=\sum_{\omega}v(\hat{a}(\mu_{l}),\omega)\mu_{l}(\omega)=\sum_{\omega}v(\hat{a}(\mu_{0}),\omega)\mu_{l}(\omega) v ^ ( μ l ) = ∑ ω v ( a ^ ( μ l ) , ω ) μ l ( ω ) = ∑ ω v ( a ^ ( μ 0 ) , ω ) μ l ( ω ) 。從而
γ v ^ ( μ l ) + ( 1 − γ ) v ^ ( μ h ) = γ ∑ ω v ( a ^ ( μ l ) , ω ) μ l ( ω ) + ( 1 − γ ) ∑ ω v ( a ^ ( μ h ) , ω ) μ h ( ω ) = γ ∑ ω v ( a ^ ( μ 0 ) , ω ) μ l ( ω ) + ( 1 − γ ) ∑ ω v ( a ^ ( μ h ) , ω ) μ h ( ω ) > γ ∑ ω v ( a ^ ( μ 0 ) , ω ) μ l ( ω ) + ( 1 − γ ) ∑ ω v ( a ^ ( μ 0 ) , ω ) μ h ( ω ) = ∑ ω v ( a ^ ( μ 0 ) , ω ) [ γ μ l ( ω ) + ( 1 − γ ) μ h ( ω ) ] = ∑ ω v ( a ^ ( μ 0 ) , ω ) μ 0 ( ω ) = v ^ ( μ 0 ) \begin{aligned}
\gamma\hat{v}(\mu_{l})+(1-\gamma)\hat{v}(\mu_{h})\\
=&\gamma\sum_{\omega}v(\hat{a}(\mu_{l}),\omega)\mu_{l}(\omega)+(1-\gamma)\sum_{\omega}v(\hat{a}(\mu_{h}),\omega)\mu_{h}(\omega)\\
=&\gamma\sum_{\omega}v(\hat{a}(\mu_{0}),\omega)\mu_{l}(\omega)+(1-\gamma)\sum_{\omega}v(\hat{a}(\mu_{h}),\omega)\mu_{h}(\omega)\\
>&\gamma\sum_{\omega}v(\hat{a}(\mu_{0}),\omega)\mu_{l}(\omega)+(1-\gamma)\sum_{\omega}v(\hat{a}(\mu_{0}),\omega)\mu_{h}(\omega)\\
=&\sum_{\omega}v(\hat{a}(\mu_{0}),\omega)[\gamma\mu_{l}(\omega)+(1-\gamma)\mu_{h}(\omega)]\\
=&\sum_{\omega}v(\hat{a}(\mu_{0}),\omega)\mu_{0}(\omega)\\
=&\hat{v}(\mu_{0})
\end{aligned} γ v ^ ( μ l ) + ( 1 − γ ) v ^ ( μ h ) = = > = = = γ ω ∑ v ( a ^ ( μ l ) , ω ) μ l ( ω ) + ( 1 − γ ) ω ∑ v ( a ^ ( μ h ) , ω ) μ h ( ω ) γ ω ∑ v ( a ^ ( μ 0 ) , ω ) μ l ( ω ) + ( 1 − γ ) ω ∑ v ( a ^ ( μ h ) , ω ) μ h ( ω ) γ ω ∑ v ( a ^ ( μ 0 ) , ω ) μ l ( ω ) + ( 1 − γ ) ω ∑ v ( a ^ ( μ 0 ) , ω ) μ h ( ω ) ω ∑ v ( a ^ ( μ 0 ) , ω ) [ γ μ l ( ω ) + ( 1 − γ ) μ h ( ω )] ω ∑ v ( a ^ ( μ 0 ) , ω ) μ 0 ( ω ) v ^ ( μ 0 )
即
γ v ^ ( μ l ) + ( 1 − γ ) v ^ ( μ h ) > v ^ ( μ 0 ) \gamma\hat{v}(\mu_{l})+(1-\gamma)\hat{v}(\mu_{h})>\hat{v}(\mu_{0})
γ v ^ ( μ l ) + ( 1 − γ ) v ^ ( μ h ) > v ^ ( μ 0 )
這就是
E τ v ^ ( μ ) > v ^ ( μ 0 ) \mathbb{E}_{\tau}\hat{v}(\mu)>\hat{v}(\mu_{0})
E τ v ^ ( μ ) > v ^ ( μ 0 )
即發送者能夠通過勸說獲利。
直覺:如果接收者的偏好在先驗處是離散的,那就意味著在先驗附近的那些信念處,接收者將會採取與先驗處相同的行動。那麼,當接收者按先驗採取的預設行動對於發送者來說不利時,那麼有可能通過披露信息獲利。因為披露信息會帶來不確定性、經過自然轉換為不同的信號實現,有時候這一實現對發送者來說有利、有時候不利。但即使不利也無所謂,因為在信念上的凸組合可以包含一個離先驗較近的後驗信念,使得在最優信息結構下最壞的結果本來在不披露信息時也要以機率1發生,但現在這個不好的情況隻是以小於1的機率發生,而且同時還有更好的情況也會發生。
(3) 我們先錶明,當給定A A A 為有限集時,如果接收者者的偏好在某個信念μ \mu μ 處不是離散的,那麼接收者必然在當持有這個信念時對至少兩個行動a ^ ( μ ) \hat{a}(\mu) a ^ ( μ ) 和a ≠ a ^ ( μ ) a\neq\hat{a}(\mu) a = a ^ ( μ ) 無差異∑ ω u ( a ^ ( μ ) , ω ) μ ( ω ) = ∑ ω u ( a , ω ) μ ( ω ) \sum_{\omega}u(\hat{a}(\mu),\omega)\mu(\omega)=\sum_{\omega}u(a,\omega)\mu(\omega) ∑ ω u ( a ^ ( μ ) , ω ) μ ( ω ) = ∑ ω u ( a , ω ) μ ( ω ) 。
使用逆否證法。假設不存在這樣一個a a a (即在信念μ \mu μ 下任何a ′ a^{\prime} a ′ 對於接收者來說都不是與a ^ ( μ ) \hat{a}(\mu) a ^ ( μ ) 無差異的),那麼可以定義ϵ > 0 \epsilon>0 ϵ > 0 為
ϵ = 1 2 min a ′ ≠ a ^ ( μ ) { ∑ ω u ( a ^ ( μ ) , ω ) μ ( ω ) − ∑ ω u ( a ′ , ω ) μ ( ω ) } \epsilon=\frac{1}{2}\min_{a^{\prime}\neq\hat{a}(\mu)}\left\lbrace \sum_{\omega}u(\hat{a}(\mu),\omega)\mu(\omega)-\sum_{\omega}u(a^{\prime},\omega)\mu(\omega)\right\rbrace
ϵ = 2 1 a ′ = a ^ ( μ ) min { ω ∑ u ( a ^ ( μ ) , ω ) μ ( ω ) − ω ∑ u ( a ′ , ω ) μ ( ω ) }
由於在信念μ \mu μ 下任何a ′ a^{\prime} a ′ 對於接收者來說都不是與a ^ ( μ ) \hat{a}(\mu) a ^ ( μ ) 無差異的,並且a ^ ( μ ) \hat{a}(\mu) a ^ ( μ ) 是μ \mu μ 下的最優反應,因此ϵ \epsilon ϵ 是嚴格大於0的,並且已經假設A A A 是有限集,從而最小值總能取到。但這樣的話
∑ ω u ( a ^ ( μ ) , ω ) μ ( ω ) > ∑ ω u ( a ′ , ω ) μ ( ω ) + ϵ , ∀ a ′ ≠ a ^ ( μ ) \sum_{\omega}u(\hat{a}(\mu),\omega)\mu(\omega)>\sum_{\omega}u(a^{\prime},\omega)\mu(\omega)+\epsilon,\forall a^{\prime}\neq\hat{a}(\mu)
ω ∑ u ( a ^ ( μ ) , ω ) μ ( ω ) > ω ∑ u ( a ′ , ω ) μ ( ω ) + ϵ , ∀ a ′ = a ^ ( μ )
這就意味著接收者的偏好在μ \mu μ 處是離散的。逆否證成。
接下來,我們錶明使得接收者在不同行動間無差異的信念集具有零測度(即接收者的偏好隻在具有零測度的信念下是不離散的)。
這樣的信念集為
{ μ ∣ ∃ a ≠ a ^ ( μ ) , such that ∑ ω u ( a , ω ) μ ( ω ) ) = ∑ ω u ( a ^ ( μ ) , ω ) μ ( ω ) } \left\lbrace \mu|\exists a\neq\hat{a}(\mu),\text{ such that }\sum_{\omega}u(a,\omega)\mu(\omega))=\sum_{\omega}u(\hat{a}(\mu),\omega)\mu(\omega)\right\rbrace
{ μ ∣∃ a = a ^ ( μ ) , such that ω ∑ u ( a , ω ) μ ( ω )) = ω ∑ u ( a ^ ( μ ) , ω ) μ ( ω ) }
我們可以進一步錶明,這個信念集的某個超集具有零測度。即,將a ^ ( μ ) \hat{a}(\mu) a ^ ( μ ) 與任意a a a 的比較,放寬為任意a a a 與任意a ′ a^{\prime} a ′ 的比較。由於A A A 是有限集,a a a 與a ′ a^{\prime} a ′ 的組合也隻有有限種可能,而有限個零測集之並仍為零測集,因此我們隻需證明接收者在給定的兩個行動a a a 與a ′ a^{\prime} a ′ 無差異的信念集{ μ } \left\lbrace \mu\right\rbrace { μ } 具有零測度。
這樣的信念集為
{ μ ∣ , ∃ a ≠ a ′ , such that ∑ ω u ( a , ω ) μ ( ω ) ) = ∑ ω u ( a ′ , ω ) μ ( ω ) } \left\lbrace \mu|,\exists a\neq a^{\prime},\text{ such that }\sum_{\omega}u(a,\omega)\mu(\omega))=\sum_{\omega}u(a^{\prime},\omega)\mu(\omega)\right\rbrace
{ μ ∣ , ∃ a = a ′ , such that ω ∑ u ( a , ω ) μ ( ω )) = ω ∑ u ( a ′ , ω ) μ ( ω ) }
由於Ω \Omega Ω 為有限集(註意,Ω \Omega Ω 一直假設為有限集,但A A A 在整體框架中隻假設為緊集,隻是在當前命題的第三部分時,我們錶明如果A A A 也時有限集將會得到那些性質),我們可以將其錶示為Ω = { ω i } i \Omega=\left\lbrace \omega_{i}\right\rbrace_{i} Ω = { ω i } i (並隨意指定∣ Ω ∣ = n |\Omega|=n ∣Ω∣ = n ),進而記β i \beta_{i} β i 為
β i = u ( a , ω i ) − u ( a ′ , ω i ) , i = 1 , . . . , n \beta_{i}=u(a,\omega_{i})-u(a^{\prime},\omega_{i}),i=1,...,n
β i = u ( a , ω i ) − u ( a ′ , ω i ) , i = 1 , ... , n
以及
β = [ β 1 , . . . , β n ] \beta=[\beta_{1},...,\beta_{n}]
β = [ β 1 , ... , β n ]
和
μ = [ μ ( ω 1 ) , . . . , μ ( ω n ) ] \mu=[\mu(\omega_{1}),...,\mu(\omega_{n})]
μ = [ μ ( ω 1 ) , ... , μ ( ω n )]
前麵的信念集可以進一步錶達為
{ μ ∣ β T μ = 0 } \left\lbrace \mu|\beta^{T}\mu=0\right\rbrace
{ μ ∣ β T μ = 0 }
由於我們僅將那些接收者有可能採取的行動包含在了行動空間裏,即∀ a ∈ A , ∃ μ , such that a ∈ a ∗ ( μ ) \forall a\in A,\exists\mu,\text{ such that } a\in a^{\ast}(\mu) ∀ a ∈ A , ∃ μ , such that a ∈ a ∗ ( μ ) ,所以任何a ′ a^{\prime} a ′ 都是某個μ ′ \mu^{\prime} μ ′ 的最優反應。同時,由於我們打破僵局的慣例是“當接收者有多個最優反應時,選取其中對發送者最有利的那一個”,那麼行動空間可以進一步精煉為∀ a ∈ A , ∃ μ , such that { a } = a ∗ ( μ ) \forall a\in A,\exists\mu,\text{ such that }\left\lbrace a\right\rbrace=a^{\ast} (\mu) ∀ a ∈ A , ∃ μ , such that { a } = a ∗ ( μ ) ,因此肯定存在某個ω \omega ω 使得u ( a , ω ) ≠ u ( a ′ , ω ) u(a,\omega)\neq u(a^{\prime},\omega) u ( a , ω ) = u ( a ′ , ω ) (否則,要麼那個a ′ a^{\prime} a ′ 是不會被採取的,要麼那個a ′ a^{\prime} a ′ 是多餘的),因此至少存在一個β i ≠ 0 \beta_{i}\neq 0 β i = 0 。由此,β \beta β 是個秩至少為1的線性變換,但在給定a a a 和a ′ a^{\prime} a ′ 的情況下,β \beta β 作為嚮量其秩至多為1,兩者結合可知β \beta β 的秩恰好為1,那麼根據 Rank-Nullity定理,作為β \beta β 之核的線性空間{ μ ∣ β T μ = 0 } \left\lbrace \mu|\beta^{T}\mu=0\right\rbrace { μ ∣ β T μ = 0 } 的秩為n − 1 n-1 n − 1 ,而n n n 維空間的任何m m m 維(m < n m<n m < n )子空間的測度都為0。
定理一
存在一個最優的信息結構,在最優的信息結構下,發送者所能得到的最大效用為v ∗ = V ( μ 0 ) v^{\ast}=V(\mu_{0}) v ∗ = V ( μ 0 ) 。
證明:由於我們已經錶明了,最優信息結構的存在,與滿足貝葉斯可行的後驗信念上的最優分佈存在,之間是等價的。因此,我們接下來證明,存在滿足貝葉斯可行的後驗信念上的最優分佈。
首先,我們錶示v ^ ( μ ) \hat{v}(\mu) v ^ ( μ ) 關於μ \mu μ 是上半(semi)連續的。
{ ( μ , v ) ∣ v ≤ v ^ ( μ ) } \left\lbrace (\mu,v)|v\leq\hat{v}(\mu)\right\rbrace
{ ( μ , v ) ∣ v ≤ v ^ ( μ ) }
是個閉集。
假設v ^ ( μ ) \hat{v}(\mu) v ^ ( μ ) 在某個μ \mu μ 處不連續,由於v ^ ( μ ) = ∑ ω v ( a ^ ( μ ) , ω ) μ ( ω ) \hat{v}(\mu)=\sum_{\omega}v(\hat{a}(\mu),\omega)\mu(\omega) v ^ ( μ ) = ∑ ω v ( a ^ ( μ ) , ω ) μ ( ω ) ,而v ( a , ω ) v(a,\omega) v ( a , ω ) 關於a a a 和ω \omega ω 是假設為連續的,∑ ω v ( a , ω ) μ ( ω ) \sum_{\omega}v(a,\omega)\mu(\omega) ∑ ω v ( a , ω ) μ ( ω ) 關於μ \mu μ 是線性從而是連續的,因此這個不連續隻可能出現在a ^ ( μ ) \hat{a}(\mu) a ^ ( μ ) 與μ \mu μ 之間的關係上。但根據 Berge’s Maximun Pricinple,當目標函數u ( a , ω ) u(a,\omega) u ( a , ω ) 連續(註意,現在我們轉換到了接收者問題)、約束對應a ( μ ) : Δ ( Ω ) → A a(\mu):\Delta(\Omega)\rightarrow A a ( μ ) : Δ ( Ω ) → A 是緊值的連續對應(註意,其實在本文中我們並冇有施加任何約束)時,值函數u ( μ ) = u ( a ∗ ( μ ) , ω ) u(\mu)=u(a^{\ast}(\mu),\omega) u ( μ ) = u ( a ∗ ( μ ) , ω ) 是連續函數,解對應a ∗ ( μ ) a^{\ast}(\mu) a ∗ ( μ ) 是上半(hemi)連續的。我們前麵看到a ^ ( μ ) \hat{a}(\mu) a ^ ( μ ) 關於μ \mu μ 不是連續的,但a ∗ ( μ ) a^{\ast}(\mu) a ∗ ( μ ) 關於μ \mu μ 又是上半(hemi)連續的,而同時能滿足這兩點的情況就是a ∗ ( μ ) a^{\ast}(\mu) a ∗ ( μ ) 在μ \mu μ 處是一個滿足上半(hemi)連續的非單點集(非單點,因此不是連續的)。
即
{ ( μ , a ) ∣ a ∈ a ∗ ( μ ) } \left\lbrace (\mu,a)|a\in a^{\ast}(\mu)\right\rbrace
{ ( μ , a ) ∣ a ∈ a ∗ ( μ ) }
是個閉集。
非單點集意味著a ^ ( μ ) \hat{a}(\mu) a ^ ( μ ) (我們根據“對發送者最有利”的標準選出來的)是a ∗ ( μ ) a^{\ast}(\mu) a ∗ ( μ ) 的嚴格子集。即
v ^ ( μ ) = max a ∈ a ∗ ( μ ) ∑ ω v ( a , ω ) μ ( ω ) \hat{v}(\mu)=\max_{a\in a^{\ast}(\mu)}\sum_{\omega}v(a,\omega)\mu(\omega)
v ^ ( μ ) = a ∈ a ∗ ( μ ) max ω ∑ v ( a , ω ) μ ( ω )
根據hemi-semi定理,v ^ ( μ ) \hat{v}(\mu) v ^ ( μ ) 是上半(semi)連續的。
補充:hemi-semi定理,僅敘述與此處相關的upper部分。
假設可行性對應a : Δ ( Ω ) → A a:\Delta(\Omega)\rightarrow A a : Δ ( Ω ) → A 是非空、緊值的。如果f : g r ( a ) → R f:gr(a)\rightarrow\mathbb{R} f : g r ( a ) → R 是上半(semi)連續的,那麼如下定義的v ^ \hat{v} v ^ 就能取到最大值。並且,如果a a a 是點μ ′ \mu^{\prime} μ ′ 處是上半(hemi)連續的,那麼v ^ \hat{v} v ^ 在點μ ′ \mu^{\prime} μ ′ 處是上半(semi)連續的。
v ^ ( μ ) = max f ( μ , a ( μ ) ) \hat{v}(\mu)=\max{f(\mu,a(\mu))}
v ^ ( μ ) = max f ( μ , a ( μ ))
將f f f 取為( a ( μ ) , ∑ ω v ( a ( μ ) , ω ) μ ( ω ) ) (a(\mu),\sum_{\omega}v(a(\mu),\omega)\mu(\omega)) ( a ( μ ) , ∑ ω v ( a ( μ ) , ω ) μ ( ω )) 即可。
證明可見KC Border的Notes中"correspondences"一章,或 Aliprantis and Border (2006) Lemma 17.30,P569。
應用在此處即意味著:f f f 是發送者期望效用函數的圖 ( a ( μ ) , ∑ ω v ( a ( μ ) , ω ) μ ( ω ) ) (a(\mu),\sum_{\omega}v(a(\mu),\omega)\mu(\omega)) ( a ( μ ) , ∑ ω v ( a ( μ ) , ω ) μ ( ω )) ,其中 v ( a , ω ) v(a,\omega) v ( a , ω ) 關於 a a a 的連續性是根據假設得到的,而 ∑ ω v ( a , ω ) μ ( ω ) \sum_{\omega}v(a,\omega)\mu(\omega) ∑ ω v ( a , ω ) μ ( ω ) 關於 a a a 的連續性是根據前一點以及它作爲求和函數相結合得到的;這裏的可行性對應 a ⋆ a^{\star} a ⋆ 為對接收者對於給定的後驗信念所得的最大化問題的解集 (根據將 Berge 最大值定理應用與接收者問題,這個對應是上半連續的;這一對應,在接收者問題中是解對應,在當前這個打破平局問題中是約束對應),我們從接收者最大化問題的解集中選取對於發送者最有利的哪一個 (這是我們假設的打破平局的規則) 就意味著在做 max a ∈ a ⋆ ( μ ) ∑ ω v ( a , ω ) μ ( ω ) \max_{a\in a^{\star}(\mu)}\sum_{\omega}v(a,\omega)\mu(\omega) max a ∈ a ⋆ ( μ ) ∑ ω v ( a , ω ) μ ( ω ) ,將其值函數定義爲 v ^ ( μ ) = max a ∈ a ∗ ( μ ) ∑ ω v ( a , ω ) μ ( ω ) \hat{v}(\mu)=\max_{a\in a^{\ast}(\mu)}\sum_{\omega}v(a,\omega)\mu(\omega) v ^ ( μ ) = max a ∈ a ∗ ( μ ) ∑ ω v ( a , ω ) μ ( ω ) 。
根據 hemi-semi 定理,v ^ ( μ ) \hat{v}(\mu) v ^ ( μ ) 就是關於 μ \mu μ 的上半連續函數。
即:當 a ∗ a^{\ast} a ∗ 為對應時是上半連續的,當 a ∗ a^{\ast} a ∗ 為函數時是連續的。但前麵錶明它是多值的,從而 a ∗ a^{\ast} a ∗ 是上半連續的,而這時 v ^ ( μ ) = max f ( μ , a ( μ ) ) \hat{v}(\mu)=\max{f(\mu,a(\mu))} v ^ ( μ ) = max f ( μ , a ( μ )) 也是上半連續的。
將v ^ \hat{v} v ^ 的下圖記為hyp ( v ^ ) \text{hyp}(\hat{v}) hyp ( v ^ )
hyp ( v ^ ) = { ( v , μ ) ∈ R × Δ ( Ω ) ∣ v ≤ v ^ ( μ ) } \text{hyp}(\hat{v})=\left\lbrace (v,\mu)\in\mathbb{R}\times\Delta(\Omega)|v\leq\hat{v}(\mu)\right\rbrace
hyp ( v ^ ) = { ( v , μ ) ∈ R × Δ ( Ω ) ∣ v ≤ v ^ ( μ ) }
其下圖的凸包為
V = c o ( { ( v , μ ) ∈ R × Δ ( Ω ) ∣ v ≤ v ^ ( μ ) } ) V=co(\left\lbrace (v,\mu)\in\mathbb{R}\times\Delta(\Omega)|v\leq\hat{v}(\mu)\right\rbrace)
V = co ( { ( v , μ ) ∈ R × Δ ( Ω ) ∣ v ≤ v ^ ( μ ) } )
根據Krein-Milman定理,下圖的凸包裏的每個點( v ′ , μ ′ ) (v^{\prime},\mu^{\prime}) ( v ′ , μ ′ ) 都可以錶示為其極點的凸組合
( v ′ , μ ′ ) = ∑ j λ j ( v ( μ j ) , μ j ) (v^{\prime},\mu^{\prime})=\sum_{j}\lambda^{j}(v(\mu^{j}),\mu^{j})
( v ′ , μ ′ ) = j ∑ λ j ( v ( μ j ) , μ j )
發送者的凹化函數為
V ( μ ) = sup { v ∈ R ∣ ( v , μ ) ∈ V } V(\mu)=\sup\left\lbrace v\in\mathbb{R}|(v,\mu)\in V\right\rbrace
V ( μ ) = sup { v ∈ R ∣ ( v , μ ) ∈ V }
我們將要錶明,給定任何一個信念μ \mu μ 和hyp ( v ^ ) \text{hyp}(\hat{v}) hyp ( v ^ ) 的一個子集S = { ( μ j , v j ) } j ⊂ hyp ( v ^ ) S=\left\lbrace (\mu^{j},v^{j})\right\rbrace_{j}\subset\text{hyp}(\hat{v}) S = { ( μ j , v j ) } j ⊂ hyp ( v ^ ) ,,如果( μ , V ( μ ) ) (\mu,V(\mu)) ( μ , V ( μ )) 在S S S 的凸包裏,那麼( μ , V ( μ ) ) (\mu,V(\mu)) ( μ , V ( μ )) 也“S S S 與hyp ( v ^ ) \text{hyp}(\hat{v}) hyp ( v ^ ) 的交集”的凸包裏。
假設( μ , V ( μ ) ) = ∑ j γ j ( μ j , v j ) (\mu,V(\mu))=\sum_{j}\gamma^{j}(\mu^{j},v^{j}) ( μ , V ( μ )) = ∑ j γ j ( μ j , v j ) ,其中∑ j γ j = 1 , γ i ∈ [ 0 , 1 ] , ∀ j \sum_{j}\gamma^{j}=1,\gamma^{i}\in[0,1],\forall j ∑ j γ j = 1 , γ i ∈ [ 0 , 1 ] , ∀ j ,上一行中說我們要有v j = v ^ ( μ j ) , ∀ j v^{j}=\hat{v}(\mu^{j}),\forall j v j = v ^ ( μ j ) , ∀ j ,反證,假設∃ γ i > 0 \exists\gamma^{i}>0 ∃ γ i > 0 但v i < v ^ ( μ i ) v^{i}<\hat{v}(\mu^{i}) v i < v ^ ( μ i ) (註意,根據定義,下圖已經排除了反方嚮的不等式,所以這裏的反證其實是假設,構成凸組合的某個點不是極點、而是內點,但Krein-Milman定理隻告訴我們可以由凸組合錶示,並非隻能由凸組合錶示,所以需要來單獨證明),那麼將原先的凸組合中的這個內點( μ i , v i ) (\mu^{i},v^{i}) ( μ i , v i ) 替換為( μ i , v ^ ( μ i ) ) {(\mu^{i},\hat{v}(\mu^{i}))} ( μ i , v ^ ( μ i )) ,則{ ( μ j , v j ) } { j } ∖ i ∪ ( μ i , v ^ ( μ i ) ) ⊂ hyp ( v ^ ) \left\lbrace (\mu^{j},v^{j})\right\rbrace_{\left\lbrace j\right\rbrace\setminus i}\cup{(\mu^{i},\hat{v}(\mu^{i}))}\subset\text{hyp}(\hat{v}) { ( μ j , v j ) } { j } ∖ i ∪ ( μ i , v ^ ( μ i )) ⊂ hyp ( v ^ ) 。但使得( μ i , v i ) (\mu^{i},v^{i}) ( μ i , v i ) 成為內點的是v i < v ^ ( μ i ) v^{i}<\hat{v}(\mu^{i}) v i < v ^ ( μ i ) ,而γ i μ i + ∑ { j } ∖ i γ j μ j = μ \gamma^{i}\mu^{i}+\sum_{\left\lbrace j\right\rbrace\setminus i}\gamma^{j}\mu^{j}=\mu γ i μ i + ∑ { j } ∖ i γ j μ j = μ 依然成立,並且γ i v ^ ( μ i ) + ∑ { j } ∖ i γ j v j > ∑ j γ j v j = V ( μ ) \gamma^{i}\hat{v}(\mu^{i})+\sum_{\left\lbrace j\right\rbrace\setminus i}\gamma^{j}v^{j}>\sum_{j}\gamma^{j}v^{j}=V(\mu) γ i v ^ ( μ i ) + ∑ { j } ∖ i γ j v j > ∑ j γ j v j = V ( μ ) 。然而,根據定義,V ( μ ) = sup { v ∈ R ∣ ( v , μ ) ∈ co ( hyp ( v ^ ) ) } V(\mu)=\text{sup}\left\lbrace v\in\mathbb{R}|(v,\mu)\in\text{co}(\text{hyp}(\hat{v}))\right\rbrace V ( μ ) = sup { v ∈ R ∣ ( v , μ ) ∈ co ( hyp ( v ^ )) } ,於是前式意味著
{ ( μ j , v j ) } { j } ∖ i ∪ ( μ i , v ^ ( μ i ) ) ⊂ hyp ( v ^ ) γ i v ^ ( μ i ) + ∑ { j } ∖ i γ j v j > sup { v ∈ R ∣ ( v , μ ) ∈ co ( hyp ( v ^ ) ) } \begin{aligned}
\left\lbrace (\mu^{j},v^{j})\right\rbrace_{\left\lbrace j\right\rbrace\setminus i}\cup{(\mu^{i},\hat{v}(\mu^{i}))}&\subset\text{hyp}(\hat{v})\\
\gamma^{i}\hat{v}(\mu^{i})+\sum_{\left\lbrace j\right\rbrace\setminus i}\gamma^{j}v^{j}&>\text{sup}\left\lbrace v\in\mathbb{R}|(v,\mu)\in\text{co}(\text{hyp}(\hat{v}))\right\rbrace
\end{aligned} { ( μ j , v j ) } { j } ∖ i ∪ ( μ i , v ^ ( μ i )) γ i v ^ ( μ i ) + { j } ∖ i ∑ γ j v j ⊂ hyp ( v ^ ) > sup { v ∈ R ∣ ( v , μ ) ∈ co ( hyp ( v ^ )) }
矛盾。
接下來我們錶明,任何一個( μ , V ( μ ) ) (\mu,V(\mu)) ( μ , V ( μ )) 都可以由{ ( μ i , v ^ ( μ i ) ) } i \left\lbrace (\mu^{i},\hat{v}(\mu^{i}))\right\rbrace_{i} { ( μ i , v ^ ( μ i )) } i 的凸組合得到。
由於v ^ ( μ ) \hat{v}(\mu) v ^ ( μ ) 關於μ \mu μ 是上半(semi)連續的,它的下圖hyp ( v ^ ) \text{hyp}(\hat{v}) hyp ( v ^ ) 是閉集。記H = { ( μ , v ) ∈ hyp ( v ^ ) ∣ v ≥ inf μ ′ v ^ ( μ ′ ) } H=\left\lbrace (\mu,v)\in\text{hyp}(\hat{v})|v\geq\inf_{\mu^{\prime}}\hat{v}(\mu^{\prime})\right\rbrace H = { ( μ , v ) ∈ hyp ( v ^ ) ∣ v ≥ inf μ ′ v ^ ( μ ′ ) } (即把下圖從下方截斷:去掉那些任何時候都不會在優化問題中取到的點,例如,如果在問題中v ^ ( μ ) \hat{v}(\mu) v ^ ( μ ) 能取到最低的值是0效用,那麼就把三四象限去掉,隻保留那些滿足{ ( μ , v ) ∣ 0 ≤ v ≤ v ^ ( μ ) } \left\lbrace (\mu,v)|0\leq v\leq \hat{v}(\mu)\right\rbrace { ( μ , v ) ∣0 ≤ v ≤ v ^ ( μ ) } ,這是為了使我們想找到錶達的凸集成為緊集,Krein Milman凸集錶示定理的要求),由於v v v 是連續函數,而A A A 為緊集,因此v ^ ( μ ) = v ( a ^ ( μ ) , ω ) \hat{v}(\mu)=v(\hat{a}(\mu),\omega) v ^ ( μ ) = v ( a ^ ( μ ) , ω ) 是有界的,從而inf μ ′ v ^ ( μ ′ ) \inf_{\mu^{\prime}}\hat{v}(\mu^{\prime}) inf μ ′ v ^ ( μ ′ ) 是存在的,而inf μ ′ v ^ ( μ ) \inf_{\mu^{\prime}}\hat{v}(\mu) inf μ ′ v ^ ( μ ) 與( μ , v ) ∈ hyp ( v ^ ) = { ( μ , v ) ∣ v ≤ v ^ ( μ ) } (\mu,v)\in\text{hyp}(\hat{v})=\left\lbrace (\mu,v)|v\leq\hat{v}({\mu})\right\rbrace ( μ , v ) ∈ hyp ( v ^ ) = { ( μ , v ) ∣ v ≤ v ^ ( μ ) } 一起使得H H H 是有界的,但H = hyp ( v ^ ) ∩ { ( μ , v ) ∣ v ≥ inf μ ′ v ^ ( μ ′ ) } H=\text{hyp}(\hat{v})\cap\left\lbrace (\mu,v)|v\geq\inf_{\mu^{\prime}}\hat{v}(\mu^{\prime})\right\rbrace H = hyp ( v ^ ) ∩ { ( μ , v ) ∣ v ≥ inf μ ′ v ^ ( μ ′ ) } ,因此H H H 是閉集,從而H H H 是緊集,而有限維空間裏緊集的凸包仍是緊集,即co ( H ) \text{co}(H) co ( H ) 是緊集,從而co ( hyp ( v ^ ) ) \text{co}(\text{hyp}(\hat{v})) co ( hyp ( v ^ )) 是閉集(但一般地,閉集的凸包不一定是閉集,待補充)。
V ( μ ) = sup τ Δ Δ ( Ω ) ∫ Δ ( Ω ) v ^ ( μ ) τ ( d μ ) s . t . ∫ Δ ( Ω ) μ τ ( d μ ) = μ 0 \begin{aligned}
V(\mu)=\sup_{\tau_{\Delta\Delta(\Omega)}}\int_{\Delta(\Omega)}\hat{v}(\mu)\tau(d\mu)\\
s.t.\\
\int_{\Delta(\Omega)}\mu\tau(d\mu)=\mu_{0}
\end{aligned} V ( μ ) = τ ΔΔ ( Ω ) sup ∫ Δ ( Ω ) v ^ ( μ ) τ ( d μ ) s . t . ∫ Δ ( Ω ) μτ ( d μ ) = μ 0
我們先將發送者最終問題的值函數錶示為W ( μ ) W(\mu) W ( μ ) ,並錶明W ( μ ) = V ( μ ) W(\mu)=V(\mu) W ( μ ) = V ( μ ) 。
考慮發送者問題的對偶問題
D ( λ ) = sup τ ∈ Δ Δ ( Ω ) ∫ Δ ( Ω ) ( v ^ ( μ ) − λ T μ ) τ ( d μ ) D(\lambda)=\sup_{\tau\in\Delta\Delta(\Omega)}\int_{\Delta(\Omega)}(\hat{v}(\mu)-\lambda^{T}\mu)\tau(d\mu)
D ( λ ) = τ ∈ ΔΔ ( Ω ) sup ∫ Δ ( Ω ) ( v ^ ( μ ) − λ T μ ) τ ( d μ )
根據弱對偶定理
D ∗ = inf λ ∈ R ∣ Ω ∣ D ( λ ) ≥ W ( μ 0 ) D^*=\inf_{\lambda\in\mathbb{R}^{|\Omega|}}D(\lambda)\geq W(\mu_{0})
D ∗ = λ ∈ R ∣Ω∣ inf D ( λ ) ≥ W ( μ 0 )
而v ^ \hat{v} v ^ 的下圖的凸包V V V 根據設定就是個內部非空int ( V ) ≠ ∅ \text{int}(V)\neq\emptyset int ( V ) = ∅ 的凸集。
但v ^ \hat{v} v ^ 的上半(semi)連續意味著hyp ( v ^ ) \text{hyp}(\hat{v}) hyp ( v ^ ) 是閉集(upper semi continuous 意味著下圖 是閉集;緊值的 upper hemi continuous 意味著圖 是閉集,註意區別),
並且
V ( μ 0 ) = sup { v ∈ R ∣ ( v , μ 0 ) ∈ V } V(\mu_{0})=\sup\left\lbrace v\in\mathbb{R}|(v,\mu_{0})\in V\right\rbrace
V ( μ 0 ) = sup { v ∈ R ∣ ( v , μ 0 ) ∈ V }
同時,根據V ( μ ) V(\mu) V ( μ ) 的構造,V ( μ 0 ) < v ^ ( μ 0 ) V(\mu_{0})<\hat{v}(\mu_{0}) V ( μ 0 ) < v ^ ( μ 0 ) 不成立,所以( μ 0 , V ( μ 0 ) ) ∈ V ∖ int ( V ) (\mu_{0},V(\mu_{0}))\in V\setminus \text{int}(V) ( μ 0 , V ( μ 0 )) ∈ V ∖ int ( V ) 。
根據支撐超平麵定理,存在一個嚮量(比世界狀態空間的維度高一維)( u , w ) ∈ R × R ∣ Ω ∣ (u,w)\in\mathbb{R}\times\mathbb{R}^{|\Omega|} ( u , w ) ∈ R × R ∣Ω∣ 滿足u > 0 u>0 u > 0 使得
u V ( μ 0 ) + w T μ 0 ≥ u v ^ ( μ ) + w T μ uV(\mu_{0})+w^{T}\mu_{0}\geq u\hat{v}(\mu)+w^{T}\mu
u V ( μ 0 ) + w T μ 0 ≥ u v ^ ( μ ) + w T μ
其中( v , μ ) ∈ V (v,\mu)\in V ( v , μ ) ∈ V 。即使用支撐超平麵定理,錶明( μ 0 , V ( μ 0 ) ) ∈ V ∖ int ( V ) (\mu_{0},V(\mu_{0}))\in V\setminus \text{int}(V) ( μ 0 , V ( μ 0 )) ∈ V ∖ int ( V ) 與int ( V ) \text{int}(V) int ( V ) 在( μ 0 , V ( μ 0 ) ) (\mu_{0},V(\mu_{0})) ( μ 0 , V ( μ 0 )) 處存在支撐超平麵( u , w ) (u,w) ( u , w ) 。
(1) 如果V ( μ 0 ) = v ^ ( μ 0 ) V(\mu_{0})=\hat{v}(\mu_{0}) V ( μ 0 ) = v ^ ( μ 0 ) ,那麼對於任何μ ∈ Δ ( Ω ) \mu\in\Delta(\Omega) μ ∈ Δ ( Ω ) ,代入
u v ^ ( μ 0 ) + w T μ 0 ≥ u v ^ ( μ ) + w T μ u\hat{v}(\mu_{0})+w^{T}\mu_{0}\geq u\hat{v}(\mu)+w^{T}\mu
u v ^ ( μ 0 ) + w T μ 0 ≥ u v ^ ( μ ) + w T μ
得到
v ^ ( μ 0 ) + 1 u w T μ 0 ≥ v ^ ( μ ) + 1 u w T μ \hat{v}(\mu_{0})+\frac{1}{u}w^{T}\mu_{0}\geq \hat{v}(\mu)+\frac{1}{u}w^{T}\mu
v ^ ( μ 0 ) + u 1 w T μ 0 ≥ v ^ ( μ ) + u 1 w T μ
接下來我們錶明τ = δ { μ 0 } \tau=\delta_{\left\lbrace \mu_{0}\right\rbrace} τ = δ { μ 0 } (即不揭露任何信息,唯一地使接收者的後驗信念確定為先驗信念μ 0 \mu_{0} μ 0 )
在這種情況下(V ( μ 0 ) = v ^ ( μ 0 ) V(\mu_{0})=\hat{v}(\mu_{0}) V ( μ 0 ) = v ^ ( μ 0 ) )
對於發送者為唯一最優的
(即W ( μ 0 ) = v ^ ( μ 0 ) = V ( μ 0 ) W(\mu_{0})=\hat{v}(\mu_{0})=V(\mu_{0}) W ( μ 0 ) = v ^ ( μ 0 ) = V ( μ 0 ) )。
根據
D ( λ ) = sup τ ∈ Δ Δ ( Ω ) ∫ Δ ( Ω ) ( v ^ ( μ ) − λ T μ ) τ ( d μ ) D(\lambda)=\sup_{\tau\in\Delta\Delta(\Omega)}\int_{\Delta(\Omega)}(\hat{v}(\mu)-\lambda^{T}\mu)\tau(d\mu)
D ( λ ) = τ ∈ ΔΔ ( Ω ) sup ∫ Δ ( Ω ) ( v ^ ( μ ) − λ T μ ) τ ( d μ )
可知,如果能夠找到某個λ \lambda λ 使得
δ { μ 0 } ∈ arg max τ ∈ Δ Δ ( Ω ) ∫ Δ ( Ω ) ( v ^ ( μ ) − λ T μ ) τ ( d μ ) \delta_{\left\lbrace \mu_{0}\right\rbrace}\in\arg\max_{\tau\in\Delta\Delta(\Omega)}\int_{\Delta(\Omega)}(\hat{v}(\mu)-\lambda^{T}\mu)\tau(d\mu)
δ { μ 0 } ∈ arg τ ∈ ΔΔ ( Ω ) max ∫ Δ ( Ω ) ( v ^ ( μ ) − λ T μ ) τ ( d μ )
就可以了。但這就意味著找到了某個τ \tau τ 使得原問題的目標函數取得了D ( λ ) D(\lambda) D ( λ ) 這個期望效用,那麼原問題目標函數的上確界值函數W ( μ 0 ) W(\mu_{0}) W ( μ 0 ) 就至少為D ( λ ) D(\lambda) D ( λ ) ,即
W ( μ 0 ) ≥ D ( λ ) W(\mu_{0})\geq D(\lambda)
W ( μ 0 ) ≥ D ( λ )
但根據定義有
D ∗ = inf λ ∈ R ∣ Ω ∣ D ( λ ) ≥ W ( μ 0 ) D^*=\inf_{\lambda\in\mathbb{R}^{|\Omega|}}D(\lambda)\geq W(\mu_{0})
D ∗ = λ ∈ R ∣Ω∣ inf D ( λ ) ≥ W ( μ 0 )
因此
W ( μ 0 ) ≥ D ( λ ) ≥ D ∗ ≥ W ( μ 0 ) W(\mu_{0})\geq D(\lambda)\geq D^*\geq W(\mu_{0})
W ( μ 0 ) ≥ D ( λ ) ≥ D ∗ ≥ W ( μ 0 )
即
W ( μ 0 ) = D ( λ ) W(\mu_{0})=D(\lambda)
W ( μ 0 ) = D ( λ )
因此δ { μ 0 } \delta_{\left\lbrace \mu_{0}\right\rbrace} δ { μ 0 } 確實解了原始問題。下麵我們考慮如何找到這個λ \lambda λ
令λ = − 1 u w \lambda=-\frac{1}{u}w λ = − u 1 w
則
v ^ ( μ 0 ) + 1 u w T μ 0 ≥ v ^ ( μ ) + 1 u w T μ \hat{v}(\mu_{0})+\frac{1}{u}w^{T}\mu_{0}\geq \hat{v}(\mu)+\frac{1}{u}w^{T}\mu
v ^ ( μ 0 ) + u 1 w T μ 0 ≥ v ^ ( μ ) + u 1 w T μ
變為
v ^ ( μ 0 ) + λ T μ 0 ≥ v ^ ( μ ) + λ T μ \hat{v}(\mu_{0})+\lambda^{T}\mu_{0}\geq \hat{v}(\mu)+\lambda^{T}\mu
v ^ ( μ 0 ) + λ T μ 0 ≥ v ^ ( μ ) + λ T μ
兩邊同時積分,並代入τ = δ { μ 0 } \tau=\delta_{\left\lbrace \mu_{0}\right\rbrace} τ = δ { μ 0 } ,有
∫ Δ ( Ω ) ( v ^ ( μ 0 ) − λ T μ 0 ) d μ 0 ≥ ∫ Δ ( Ω ) ( v ^ ( μ ) − λ T μ ) τ ′ ( d μ ) \int_{\Delta(\Omega)}(\hat{v}(\mu_{0})-\lambda^{T}\mu_{0})d\mu_{0}\geq\int_{\Delta(\Omega)}(\hat{v}(\mu)-\lambda^{T}\mu)\tau^{\prime}(d\mu)
∫ Δ ( Ω ) ( v ^ ( μ 0 ) − λ T μ 0 ) d μ 0 ≥ ∫ Δ ( Ω ) ( v ^ ( μ ) − λ T μ ) τ ′ ( d μ )
但這就意味著當λ = − 1 u w \lambda=-\frac{1}{u}w λ = − u 1 w 時,τ = δ { μ 0 } \tau=\delta_{\left\lbrace \mu_{0}\right\rbrace} τ = δ { μ 0 } 比任何其他的τ ′ ∈ Δ Δ ( Ω ) \tau^{\prime}\in\Delta\Delta(\Omega) τ ′ ∈ ΔΔ ( Ω ) 對於發送者來說都能帶來更高的效用。因此,當V ( μ 0 ) = v ^ ( μ 0 ) V(\mu_{0})=\hat{v}(\mu_{0}) V ( μ 0 ) = v ^ ( μ 0 ) 時,完全不披露任何信息,使得後驗信念與先驗信念完全重合是發送者的最優策略。
(2) 如果V ( μ 0 ) > v ^ ( μ 0 ) V(\mu_{0})>\hat{v}(\mu_{0}) V ( μ 0 ) > v ^ ( μ 0 ) ,那麼根據Caratheodory定理,存在{ v ^ ( μ j ) , μ j } j = 1 ∣ Ω ∣ + 2 ⊂ { ( v , μ ) ∈ R × Δ ( Ω ) ∣ v ≤ v ^ ( μ ) } \left\lbrace \hat{v}(\mu^{j}),\mu^{j}\right\rbrace_{j=1}^{|\Omega|+2}\subset\left\lbrace (v,\mu)\in\mathbb{R}\times\Delta(\Omega)|v\leq\hat{v}(\mu)\right\rbrace { v ^ ( μ j ) , μ j } j = 1 ∣Ω∣ + 2 ⊂ { ( v , μ ) ∈ R × Δ ( Ω ) ∣ v ≤ v ^ ( μ ) } 和α ∈ Δ ( { 1 , . . . , ∣ Ω ∣ + 2 } ) \alpha\in\Delta(\left\lbrace 1,...,|\Omega|+2\right\rbrace) α ∈ Δ ( { 1 , ... , ∣Ω∣ + 2 } ) 使得
∑ j = 1 ∣ Ω ∣ + 2 α j ( μ j , v ^ ( μ j ) ) = ( μ 0 , V ( μ 0 ) ) \sum_{j=1}^{|\Omega|+2}\alpha_{j}(\mu^{j},\hat{v}(\mu^{j}))=(\mu_{0},V(\mu_{0}))
j = 1 ∑ ∣Ω∣ + 2 α j ( μ j , v ^ ( μ j )) = ( μ 0 , V ( μ 0 ))
結合
u V ( μ 0 ) + w T μ 0 ≥ u v ^ ( μ ) + w T μ uV(\mu_{0})+w^{T}\mu_{0}\geq u\hat{v}(\mu)+w^{T}\mu
u V ( μ 0 ) + w T μ 0 ≥ u v ^ ( μ ) + w T μ
可知
V ( μ 0 ) = v ^ ( μ j ) , ∀ j V(\mu_{0})=\hat{v}(\mu^{j}),\forall j
V ( μ 0 ) = v ^ ( μ j ) , ∀ j
以及
u V ( μ 0 ) + w T μ 0 = u v ^ ( μ j ) + w T μ j , ∀ j uV(\mu_{0})+w^{T}\mu_{0}=u\hat{v}(\mu^{j})+w^{T}\mu^{j},\forall j
u V ( μ 0 ) + w T μ 0 = u v ^ ( μ j ) + w T μ j , ∀ j
從而
u v ^ ( μ j ) + w T μ j ≥ u v ^ ( μ ) + w T μ , ∀ j , ∀ μ ∈ Δ Δ ( Ω ) u\hat{v}(\mu^{j})+w^{T}\mu^{j}\geq u\hat{v}(\mu)+w^{T}\mu,\forall j,\forall \mu\in\Delta\Delta(\Omega)
u v ^ ( μ j ) + w T μ j ≥ u v ^ ( μ ) + w T μ , ∀ j , ∀ μ ∈ ΔΔ ( Ω )
取λ = − 1 u w \lambda=-\frac{1}{u}w λ = − u 1 w ,得
v ^ ( μ j ) − λ T μ j ≥ v ^ ( μ ) − λ T μ , ∀ j , ∀ μ ∈ Δ Δ ( Ω ) \hat{v}(\mu^{j})-\lambda^{T}\mu^{j}\geq \hat{v}(\mu)-\lambda^{T}\mu,\forall j,\forall \mu\in\Delta\Delta(\Omega)
v ^ ( μ j ) − λ T μ j ≥ v ^ ( μ ) − λ T μ , ∀ j , ∀ μ ∈ ΔΔ ( Ω )
由於{ α j } j = 1 ∣ Ω ∣ + 2 \left\lbrace \alpha_{j}\right\rbrace_{j=1}^{|\Omega|+2} { α j } j = 1 ∣Ω∣ + 2 是凸組合的係數,因此可以作為τ \tau τ 分配給μ j \mu^{j} μ j 的權重,即
τ ( μ j ) = α j , ∀ j ∈ { 1 , . . . , ∣ Ω ∣ + 2 } \tau(\mu^{j})=\alpha_{j},\forall j\in\left\lbrace 1,...,|\Omega|+2\right\rbrace
τ ( μ j ) = α j , ∀ j ∈ { 1 , ... , ∣Ω∣ + 2 }
因此
∫ Δ ( Ω ) ( v ^ ( μ j ) − λ T μ j ) τ ( d μ j ) ≥ ∫ Δ ( Ω ) ( v ^ ( μ ) − λ T μ ) τ ′ ( d μ ) , ∀ τ ′ ∈ Δ Δ ( Ω ) \int_{\Delta(\Omega)}(\hat{v}(\mu^{j})-\lambda^{T}\mu^{j})\tau(d\mu^{j})\geq\int_{\Delta(\Omega)}(\hat{v}(\mu)-\lambda^{T}\mu)\tau^{\prime}(d\mu),\forall\tau^{\prime}\in\Delta\Delta(\Omega)
∫ Δ ( Ω ) ( v ^ ( μ j ) − λ T μ j ) τ ( d μ j ) ≥ ∫ Δ ( Ω ) ( v ^ ( μ ) − λ T μ ) τ ′ ( d μ ) , ∀ τ ′ ∈ ΔΔ ( Ω )
從而{ τ ( μ j ) ∣ τ ( μ j ) = α j , such that ∑ j = 1 ∣ Ω ∣ + 2 α j ( μ j , v ^ ( μ j ) ) = ( μ 0 , V ( μ 0 ) ) } j = 1 ∣ Ω ∣ + 2 \left\lbrace \tau(\mu^{j})|\tau(\mu^{j})=\alpha_{j},\text{such that}\sum_{j=1}^{|\Omega|+2}\alpha_{j}(\mu^{j},\hat{v}(\mu^{j}))=(\mu_{0},V(\mu_{0}))\right\rbrace_{j=1}^{|\Omega|+2} { τ ( μ j ) ∣ τ ( μ j ) = α j , such that ∑ j = 1 ∣Ω∣ + 2 α j ( μ j , v ^ ( μ j )) = ( μ 0 , V ( μ 0 )) } j = 1 ∣Ω∣ + 2 確實解了原問題。因此W ( μ 0 ) = V ( μ 0 ) W(\mu_{0})=V(\mu_{0}) W ( μ 0 ) = V ( μ 0 ) 。
這回答了:為什麼發送者通過選擇最優信息結構(根據前麵的引理,這等價於選擇在後驗信念上的最優分佈)所能實現的最大效用,就等於凹化函數在先驗信念處的取值?當V ( μ 0 ) = v ^ ( μ 0 ) V(\mu_{0})=\hat{v}(\mu_{0}) V ( μ 0 ) = v ^ ( μ 0 ) 時,我們找到了最優的τ = δ { μ 0 } \tau=\delta_{\left\lbrace \mu_{0}\right\rbrace} τ = δ { μ 0 } ,即不分享信息;當V ( μ 0 ) > v ^ ( μ 0 ) V(\mu_{0})>\hat{v}(\mu_{0}) V ( μ 0 ) > v ^ ( μ 0 ) 時,我們也找到了需要引緻接收者最優行為的τ \tau τ ,即{ τ ( μ j ) ∣ τ ( μ j ) = α j , such that ∑ j = 1 ∣ Ω ∣ + 2 α j ( μ j , v ^ ( μ j ) ) = ( μ 0 , V ( μ 0 ) ) } j = 1 ∣ Ω ∣ + 2 \left\lbrace \tau(\mu^{j})|\tau(\mu^{j})=\alpha_{j},\text{such that}\sum_{j=1}^{|\Omega|+2}\alpha_{j}(\mu^{j},\hat{v}(\mu^{j}))=(\mu_{0},V(\mu_{0}))\right\rbrace_{j=1}^{|\Omega|+2} { τ ( μ j ) ∣ τ ( μ j ) = α j , such that ∑ j = 1 ∣Ω∣ + 2 α j ( μ j , v ^ ( μ j )) = ( μ 0 , V ( μ 0 )) } j = 1 ∣Ω∣ + 2 。
命題三
若v ^ ( μ ) \hat{v}(\mu) v ^ ( μ ) 關於μ \mu μ (嚴格)凹,則無批露(唯一地)最優;
若v ^ ( μ ) \hat{v}(\mu) v ^ ( μ ) 關於μ \mu μ (嚴格)凸,則完全披露(唯一地)最優;
若v ^ ( μ ) \hat{v}(\mu) v ^ ( μ ) 關於μ \mu μ 凸且不凹,則發送者總可以通過分享信息獲利。
證明:前兩部分很直觀,隻證明第三條。第三條意味著,如果發送者能通過分享信息獲利,那麼發送者的值函數關於接收者的信念不能是線性的。
首先我們錶明,如果某個信念μ ′ \mu^{\prime} μ ′ 為最優信息結構所引緻,那麼V ( μ ′ ) = v ^ ( μ ′ ) V(\mu^{\prime})=\hat{v}(\mu^{\prime}) V ( μ ′ ) = v ^ ( μ ′ ) 。即,最優信息結構所實現的效用E τ v ^ ( μ ) = V ( μ ) \mathbb{E}_{\tau}\hat{v}(\mu)=V(\mu) E τ v ^ ( μ ) = V ( μ ) ,應由對應於值函數v ^ ( μ ) \hat{v}(\mu) v ^ ( μ ) 與凹化函數V ( μ ) V(\mu) V ( μ ) 取值相同的那些信念組成(即,如果這些信念作為先驗信念出現,那麼發送者將無法通過分享信息獲利)
反證。假設某個最優信息結構τ \tau τ (前麵已經錶明信息結構( S , q ) (S,q) ( S , q ) 與後驗信念上分佈τ \tau τ 的等價性,因此不加區別地使用)引緻了某個不使取值重合的後驗信念μ ′ > 0 \mu^{\prime}>0 μ ′ > 0 ,即V ( μ ′ ) > v ^ ( μ ′ ) V(\mu^{\prime})>\hat{v}(\mu^{\prime}) V ( μ ′ ) > v ^ ( μ ′ ) (相反方嚮的不等號已經由V ( μ ) V(\mu) V ( μ ) 的定義排除),然而( μ ′ , V ( μ ′ ) ) ∈ co ( v ^ ) (\mu^{\prime},V(\mu^{\prime}))\in\text{co}(\hat{v}) ( μ ′ , V ( μ ′ )) ∈ co ( v ^ ) ,那麼肯定還存在另一個信息結構τ ′ \tau^{\prime} τ ′ 滿足貝葉斯可行E τ ′ μ = μ ′ \mathbb{E}_{\tau^{\prime}}\mu=\mu^{\prime} E τ ′ μ = μ ′ 並使得E τ ′ v ^ ( μ ) = V ( μ ′ ) \mathbb{E}_{\tau^{\prime}}\hat{v}(\mu)=V(\mu^{\prime}) E τ ′ v ^ ( μ ) = V ( μ ′ ) ,那麼我們可以重新組合權重並構造一個新的信息結構τ ∗ \tau^{\ast} τ ∗ :
τ ∗ ( μ ) = { τ ( μ ′ ) τ ′ ( μ ) if μ ∈ supp ( τ ′ ) ∖ supp ( τ ) τ ( μ ) + τ ( μ ′ ) τ ′ ( μ ) if μ ∈ supp ( τ ′ ) ∩ supp ( τ ) τ ( μ ) if μ ∈ supp ( τ ) ∖ ( supp ( τ ′ ) ∪ { μ ′ } ) \tau^{\ast}(\mu)=
\begin{cases}
\tau(\mu^{\prime})\tau^{\prime}(\mu)&\text{if}\mu\in\text{supp}(\tau^{\prime})\setminus\text{supp}(\tau)\\
\tau(\mu)+\tau(\mu^{\prime})\tau^{\prime}(\mu)&\text{if}\mu\in\text{supp}(\tau^{\prime})\cap\text{supp}(\tau)\\
\tau(\mu)&\text{if}\mu\in\text{supp}(\tau)\setminus(\text{supp}(\tau^{\prime})\cup\left\lbrace \mu^{\prime}\right\rbrace)
\end{cases} τ ∗ ( μ ) = ⎩ ⎨ ⎧ τ ( μ ′ ) τ ′ ( μ ) τ ( μ ) + τ ( μ ′ ) τ ′ ( μ ) τ ( μ ) if μ ∈ supp ( τ ′ ) ∖ supp ( τ ) if μ ∈ supp ( τ ′ ) ∩ supp ( τ ) if μ ∈ supp ( τ ) ∖ ( supp ( τ ′ ) ∪ { μ ′ } )
即在保持貝葉斯可行的條件下,把在τ \tau τ 下放在μ ′ \mu^{\prime} μ ′ (得到較低的v ^ ( μ ′ ) < V ( μ ′ ) \hat{v}(\mu^{\prime})<V(\mu^{\prime}) v ^ ( μ ′ ) < V ( μ ′ ) )上的權重轉移到τ ′ \tau^{\prime} τ ′ 上。
可以驗證τ ∗ \tau^{\ast} τ ∗ 能為發送者帶來更高的效用。因此反證得證。即:如果我們使用了冇有帶來V ( μ ) = v ^ ( μ ) V(\mu)=\hat{v}(\mu) V ( μ ) = v ^ ( μ ) 的μ \mu μ 作為某一信息結構引緻的後驗信念上分佈τ \tau τ 的組成部分(τ ( μ ) > 0 \tau(\mu)>0 τ ( μ ) > 0 ),那麼這樣的信息結構對於發送者來說就不會是最優的。
如果v ^ \hat{v} v ^ 不是凹函數,並且最優信息結構所引緻的分佈τ \tau τ 中有某個內點μ m \mu_{m} μ m 滿足τ ( μ m ) > 0 \tau(\mu_{m})>0 τ ( μ m ) > 0 ,那麼根據上一步,有V ( μ m ) = v ^ ( μ m ) V(\mu_{m})=\hat{v}(\mu_{m}) V ( μ m ) = v ^ ( μ m ) 。
由於v ^ \hat{v} v ^ 不是凹函數,那麼凹化函數至少在某些點上嚴格高於值函數(即發送者可以通過分享信息獲利),即∃ μ l \exists\mu_{l} ∃ μ l (盡管τ ( μ l ) = 0 \tau(\mu_{l})=0 τ ( μ l ) = 0 )使得V ( μ l ) > v ^ ( μ l ) V(\mu_{l})>\hat{v}(\mu_{l}) V ( μ l ) > v ^ ( μ l ) ,而由於μ m \mu_{m} μ m 是內點,一定存在μ r \mu_{r} μ r (盡管我們不知道它是否被最優信息結構所引緻,但依然有V ( μ r ) ≥ v ^ ( μ r ) V(\mu_{r})\geq\hat{v}(\mu_{r}) V ( μ r ) ≥ v ^ ( μ r ) 根據V ( μ ) V(\mu) V ( μ ) 的定義)和γ ∈ ( 0 , 1 ) \gamma\in(0,1) γ ∈ ( 0 , 1 ) 使得μ m = γ μ l + ( 1 − γ ) μ r \mu_{m}=\gamma\mu_{l}+(1-\gamma)\mu_{r} μ m = γ μ l + ( 1 − γ ) μ r ,從而
v ^ ( μ m ) = V ( μ m ) ≥ γ V ( μ l ) + ( 1 − γ ) V ( μ r ) ≥ γ V ( μ l ) + ( 1 − γ ) v ^ ( μ r ) > γ v ^ ( μ l ) + ( 1 − r ) v ^ ( μ r ) \begin{aligned}
\hat{v}(\mu_{m})=V(\mu_{m})\geq&\gamma V(\mu_{l})+(1-\gamma)V(\mu_{r})\\
\geq&\gamma V(\mu_{l})+(1-\gamma)\hat{v}(\mu_{r})\\
>&\gamma\hat{v}(\mu_{l})+(1-r)\hat{v}(\mu_{r})
\end{aligned} v ^ ( μ m ) = V ( μ m ) ≥ ≥ > γV ( μ l ) + ( 1 − γ ) V ( μ r ) γV ( μ l ) + ( 1 − γ ) v ^ ( μ r ) γ v ^ ( μ l ) + ( 1 − r ) v ^ ( μ r )
但這意味著v ^ \hat{v} v ^ 不是凸函數。
命題四
如果一個最優信息結構引緻了後驗信念μ \mu μ ,然而接收者在μ \mu μ 下選擇了某個對於發送者來說最壞的行動,那麼此時接收者確定地認為真實的世界狀態
就應是自己採取這個行動。
首先,接收者的某個行動a ‾ \underline{a} a ,“對於發送者來說最壞”意味著
v ( a ‾ , ω ) < v ( a , ω ) , ∀ ω , a ≠ a ‾ v(\underline{a},\omega)<v(a,\omega),\forall\omega,a\neq\underline{a}
v ( a , ω ) < v ( a , ω ) , ∀ ω , a = a
即無論世界狀態是什麼,a ‾ \underline{a} a 帶給發送者的效用都比任何其他行動a a a 更低。
其次,“接收者確定地認為真實的世界狀態……”意味著,當接收者持有信念μ \mu μ 時
∀ ω , such that { a ^ ( μ ) } ≠ arg max u ( a , ω ) , μ ( ω ) = 0 \forall\omega,\text{ such that }\left\lbrace \hat{a}(\mu)\right\rbrace\neq\arg\max u(a,\omega),\mu(\omega)=0
∀ ω , such that { a ^ ( μ ) } = arg max u ( a , ω ) , μ ( ω ) = 0
即,在這個信念下,接收者認為任何**使自己不採取行動a ^ ( μ ) \hat{a}(\mu) a ^ ( μ ) **的世界狀態發生的機率為0。
接下來,我們證明這個命題。假設接收者採取了對發送者來說最壞的行動a ‾ \underline{a} a ,
v ( a ‾ , ω ) < u ( a , ω ) , ∀ ω , a ≠ a ‾ v(\underline{a},\omega)<u(a,\omega),\forall\omega,a\neq\underline{a}
v ( a , ω ) < u ( a , ω ) , ∀ ω , a = a
並將那些使得接收者採取這個行動的世界狀態記為
Ω ‾ = { ω ∣ a ^ ( μ ω ) = a ‾ } \underline{\Omega}=\left\lbrace \omega|\hat{a}(\mu_{\omega})=\underline{a}\right\rbrace
Ω = { ω ∣ a ^ ( μ ω ) = a }
其中μ ω \mu_{\omega} μ ω 是一族退化的信念使得μ ω ( ω ) = 1 \mu_{\omega}(\omega)=1 μ ω ( ω ) = 1 。
反證,假設最優信息結構應引緻τ \tau τ ,
並且信念μ ′ ∈ supp ( τ ) \mu^{\prime}\in\text{supp}(\tau) μ ′ ∈ supp ( τ ) (即τ ( μ ′ ) > 0 \tau(\mu^{\prime})>0 τ ( μ ′ ) > 0 ),a ^ ( μ ′ ) = a ‾ \hat{a}(\mu^{\prime})=\underline{a} a ^ ( μ ′ ) = a ,但
∃ ∈ Ω ‾ such that μ ′ ( ω ‾ ) > 0 \exists\in\overline{\Omega}\text{ such that }\mu^{\prime}(\overline{\omega})>0
∃ ∈ Ω such that μ ′ ( ω ) > 0
其中
Ω ‾ = Ω ∖ Ω ‾ \overline{\Omega}=\Omega\setminus\underline{\Omega}
Ω = Ω ∖ Ω
(即,接收者認為不會引緻自己採用a ‾ \underline{a} a 的世界狀態發生的機率為正,也就是“並不確定”的意思)。記
μ ‾ ( ω ‾ ) = 1 \overline{\mu}(\overline{\omega})=1
μ ( ω ) = 1
和
μ ‾ ( ω ) = { μ ′ ( ω ) 1 − μ ′ ( ω ‾ ) , 若 ω ≠ ω ‾ 0 , 若 ω = ω ‾ \underline{\mu}(\omega)=
\begin{cases}
\frac{\mu^{\prime}(\omega)}{1-\mu^{\prime}(\overline{\omega})},&\text{若}\omega\neq\overline{\omega}\\
0,&\text{若}\omega=\overline{\omega}
\end{cases} μ ( ω ) = { 1 − μ ′ ( ω ) μ ′ ( ω ) , 0 , 若 ω = ω 若 ω = ω
由於當ω = ω ‾ \omega=\overline{\omega} ω = ω 時,μ ‾ ( ω ‾ ) = 1 \overline{\mu}(\overline{\omega})=1 μ ( ω ) = 1 而μ ‾ ( ω ‾ ) = 0 \underline{\mu}(\overline{\omega})=0 μ ( ω ) = 0 ,可以將μ ′ \mu^{\prime} μ ′ 錶示成二者的凸組合;當ω ≠ ω ‾ \omega\neq\overline{\omega} ω = ω 時,μ ‾ ( ω ) = 0 \overline{\mu}(\omega)=0 μ ( ω ) = 0 而μ ‾ ( ω ) = μ ′ ( ω ) 1 − μ ′ ( ω ‾ ) \underline{\mu}(\omega)=\frac{\mu^{\prime}(\omega)}{1-\mu^{\prime}(\overline{\omega})} μ ( ω ) = 1 − μ ′ ( ω ) μ ′ ( ω ) ,其中μ ′ ( ω ‾ ) \mu^{\prime}(\overline{\omega}) μ ′ ( ω ) 是常數,因此使其係數為1 − μ ′ ( ω ‾ ) 1-\mu^{\prime}(\overline{\omega}) 1 − μ ′ ( ω ) 即可實現凸組合。(註意,信念的凸組合即為信念上的分佈,凸組合的係數即是該信念出現的機率)
然而,當μ ‾ \overline{\mu} μ 時,引緻接收者採取的是不同於a ‾ \underline{a} a 的行為(即接收者確定地知道當前狀態不是使自己採取a ‾ \underline{a} a 的狀態),但根據定義,無論這個行為是什麼,對於發送者來說都嚴格比v ( a ‾ , ω ) v(\underline{a},\omega) v ( a , ω ) 要高;
當μ ‾ \underline{\mu} μ 時,引緻接收者採取的是a ^ ( μ ‾ ) \hat{a}(\underline{\mu}) a ^ ( μ ) ,當μ ′ \mu^{\prime} μ ′ 時接收者採取的是a ^ ( μ ′ ) = a ‾ \hat{a}(\mu^{\prime})=\underline{a} a ^ ( μ ′ ) = a 了。因此,不論a ^ ( μ ‾ ) \hat{a}(\underline{\mu}) a ^ ( μ ) 是什麼,都不會比a ‾ \underline{a} a 差。
考慮如下這個信念的凸組合(信念上的分佈)
τ ∗ ( μ ‾ ) = μ ( ω ‾ ) τ ( μ ′ ) + τ ( μ ‾ ) τ ∗ ( μ ‾ ) = ( 1 − μ ′ ( ω ‾ ) ) τ ( μ ′ ) + τ ( μ ‾ ) τ ∗ ( μ ) = τ ( μ ) , if μ ∉ { μ ′ , μ ‾ , μ ‾ } \begin{aligned}
\tau^{\ast}(\overline{\mu})&=\mu(\overline{\omega})\tau(\mu^{\prime})+\tau(\overline{\mu})\\
\tau^{\ast}(\underline{\mu})&=(1-\mu^{\prime}(\overline{\omega}))\tau(\mu^{\prime})+\tau(\underline{\mu})\\
\tau^{\ast}(\mu)&=\tau(\mu),\text{ if }\mu\notin\left\lbrace \mu^{\prime},\underline{\mu},\overline{\mu}\right\rbrace
\end{aligned} τ ∗ ( μ ) τ ∗ ( μ ) τ ∗ ( μ ) = μ ( ω ) τ ( μ ′ ) + τ ( μ ) = ( 1 − μ ′ ( ω )) τ ( μ ′ ) + τ ( μ ) = τ ( μ ) , if μ ∈ / { μ ′ , μ , μ }
則
∑ μ ( τ ∗ ( μ ‾ ) μ ‾ ( ω ) + τ ∗ ( μ ‾ ) μ ‾ ( ω ) + τ ∗ ( μ ) μ ( ω ) ) = ∑ μ ( μ ′ ( ω ‾ ) τ ( μ ′ ) + τ ( μ ‾ ) ) μ ‾ ( ω ) + [ ( 1 − μ ′ ( ω ‾ ) ) τ ( μ ′ ) + τ ( μ ‾ ) ] μ ‾ ( ω ) + τ ( μ ) μ ( ω ) = μ ′ ( ω ‾ ) τ ( μ ′ ) μ ‾ ( ω ) + τ ( μ ‾ ) μ ‾ ( ω ) + ( 1 − μ ′ ( ω ‾ ) ) τ ( μ ′ ) μ ‾ ( ω ) + τ ( μ ‾ ) μ ‾ ( ω ) + ∑ μ ∉ { μ ′ μ ‾ , μ ‾ } τ ( μ ) μ ( ω ) = { μ ′ ( ω ‾ ) τ ( μ ′ ) + μ ‾ ( ω ‾ ) τ ( μ ‾ ) + τ ( μ ‾ ) μ ‾ ( ω ‾ ) + ∑ μ ∉ { μ ′ μ ‾ , μ ‾ } τ ( μ ) μ ( ω ‾ ) 若 ω = ω ‾ ; μ ′ ( ω ) τ ( μ ′ ) + μ ‾ ( ω ) τ ( μ ‾ ) + τ ( μ ‾ ) μ ‾ ( ω ) + ∑ μ ∉ { μ ′ μ ‾ , μ ‾ } τ ( μ ) μ ( ω ‾ ) 若 ω ≠ ω ‾ \begin{aligned}
&\sum_{\mu}(\tau^{\ast}(\overline{\mu})\overline{\mu}(\omega)+\tau^{\ast}(\underline{\mu})\underline{\mu}(\omega)+\tau^{\ast}(\mu)\mu(\omega))\\
=&\sum_{\mu}(\mu^{\prime}(\overline{\omega})\tau(\mu^{\prime})+\tau(\overline{\mu}))\overline{\mu}(\omega)+[(1-\mu^{\prime}(\overline{\omega}))\tau(\mu^{\prime})+\tau(\underline{\mu})]\underline{\mu}(\omega)+\tau(\mu)\mu(\omega)\\
=&\mu^{\prime}(\overline{\omega})\tau(\mu^{\prime})\overline{\mu}(\omega)+\tau(\overline{\mu})\overline{\mu}(\omega)+(1-\mu^{\prime}(\overline{\omega}))\tau(\mu^{\prime})\underline{\mu}(\omega)+\tau(\underline{\mu})\underline{\mu}(\omega)+\sum_{\mu\notin\left\lbrace \mu^{\prime}\underline{\mu},\overline{\mu}\right\rbrace}\tau(\mu)\mu(\omega)\\
=&\begin{cases}
\mu^{\prime}(\overline{\omega})\tau(\mu^{\prime})+\overline{\mu}(\overline{\omega})\tau(\overline{\mu})+\tau(\underline{\mu})\underline{\mu}(\overline{\omega})+\sum_{\mu\notin\left\lbrace \mu^{\prime}\underline{\mu},\overline{\mu}\right\rbrace}\tau(\mu)\mu(\overline{\omega})\\&\text{若}\omega=\overline{\omega};\\
\mu^{\prime}(\omega)\tau(\mu^{\prime})+\overline{\mu}(\omega)\tau(\overline{\mu})+\tau(\underline{\mu})\underline{\mu}(\omega)+\sum_{\mu\notin\left\lbrace \mu^{\prime}\underline{\mu},\overline{\mu}\right\rbrace}\tau(\mu)\mu(\overline{\omega})&\text{若}\omega\neq\overline{\omega}
\end{cases}
\end{aligned} = = = μ ∑ ( τ ∗ ( μ ) μ ( ω ) + τ ∗ ( μ ) μ ( ω ) + τ ∗ ( μ ) μ ( ω )) μ ∑ ( μ ′ ( ω ) τ ( μ ′ ) + τ ( μ )) μ ( ω ) + [( 1 − μ ′ ( ω )) τ ( μ ′ ) + τ ( μ )] μ ( ω ) + τ ( μ ) μ ( ω ) μ ′ ( ω ) τ ( μ ′ ) μ ( ω ) + τ ( μ ) μ ( ω ) + ( 1 − μ ′ ( ω )) τ ( μ ′ ) μ ( ω ) + τ ( μ ) μ ( ω ) + μ ∈ / { μ ′ μ , μ } ∑ τ ( μ ) μ ( ω ) ⎩ ⎨ ⎧ μ ′ ( ω ) τ ( μ ′ ) + μ ( ω ) τ ( μ ) + τ ( μ ) μ ( ω ) + ∑ μ ∈ / { μ ′ μ , μ } τ ( μ ) μ ( ω ) μ ′ ( ω ) τ ( μ ′ ) + μ ( ω ) τ ( μ ) + τ ( μ ) μ ( ω ) + ∑ μ ∈ / { μ ′ μ , μ } τ ( μ ) μ ( ω ) 若 ω = ω ; 若 ω = ω
而無論哪種情況,都等於
∑ μ τ ( μ ) μ ( ω ) = μ 0 ( ω ) , ∀ ω ∈ Ω \sum_{\mu}\tau(\mu)\mu(\omega)=\mu_{0}(\omega),\forall\omega\in\Omega
μ ∑ τ ( μ ) μ ( ω ) = μ 0 ( ω ) , ∀ ω ∈ Ω
即,隻要τ \tau τ 滿足貝葉斯可行,則τ ∗ \tau^{\ast} τ ∗ 就滿足貝葉斯可行。
同時可以驗證τ ∗ \tau^{\ast} τ ∗ 會為發送者帶來比τ \tau τ 更高的效用。因此,原先的τ \tau τ 便不是引緻最優信息結構的後驗信念上的分佈。矛盾。可知假設“接收者不確定”為假。
命題五
【假設一】不存在任何一個使得如下情況成立的接收者的行動a a a :
(1) 對於任何信念μ \mu μ ,發送者從接收者的行動a a a 上得到的效用不會低於μ \mu μ 下的值函數v ^ ( μ ) = E μ v ( a ^ ( μ ) , ω ) ≤ E μ v ( a , ω ) \hat{v}(\mu)=\mathbb{E}_{\mu}v(\hat{a}({\mu}),\omega)\leq\mathbb{E}_{\mu}v(a,\omega) v ^ ( μ ) = E μ v ( a ^ ( μ ) , ω ) ≤ E μ v ( a , ω ) ;
(2) 存在某個信念μ ′ \mu^{\prime} μ ′ 使得雖然a ≠ a ^ ( μ ′ ) a\neq\hat{a}(\mu^{\prime}) a = a ^ ( μ ′ ) (雖然a a a 不是這種情況下的最優行動)但v ^ ( μ ′ ) = E μ v ( a ^ ( μ ′ ) , ω ) = E μ ′ v ( a , ω ) \hat{v}(\mu^{\prime})=\mathbb{E}_{\mu}v(\hat{a}({\mu^{\prime}}),\omega)=\mathbb{E}_{\mu^{\prime}}v(a,\omega) v ^ ( μ ′ ) = E μ v ( a ^ ( μ ′ ) , ω ) = E μ ′ v ( a , ω ) (然而仍然為發送者實現了μ \mu μ 下的值函數)
命題五:當【假設一】成立時,如果發送者能夠通過勸說獲利,那麼在最優信息結構下,接收者在被引緻的任何內點信念μ \mu μ 上其偏好都不會是離散的。
註意,我們隻說在最優信息結構下的內點後驗信念上,接收者的偏好不是離散的。但對於先驗信念(已被假設為全支撐)來說雖然也是內點信念,但接收者的偏好是離散的。並且,我們隻要求那些內點後驗信念,不要求邊界點後驗信念。
證明:首先我們錶明,
隨後,如果某兩個後驗信念μ l \mu_{l} μ l 和μ r \mu_{r} μ r 是被最優信息結構引緻的,並且任取γ ∈ [ 0 , 1 ] \gamma\in[0,1] γ ∈ [ 0 , 1 ] 組合成μ m = γ μ l + ( 1 − γ ) μ r \mu_{m}=\gamma\mu_{l}+(1-\gamma)\mu_{r} μ m = γ μ l + ( 1 − γ ) μ r ,那麼這個凸組合得到的μ m \mu_{m} μ m 給發送者帶來的值函數取值,不會高於最優信息結構下的μ l \mu_{l} μ l 和μ r \mu_{r} μ r 分別給發送者帶來的值函數取值的凸組合。即
v ^ ( μ m ) ≤ γ v ^ ( μ l ) + ( 1 − γ ) v ^ ( μ r ) \hat{v}(\mu_{m})\leq\gamma\hat{v}(\mu_{l})+(1-\gamma)\hat{v}(\mu_{r})
v ^ ( μ m ) ≤ γ v ^ ( μ l ) + ( 1 − γ ) v ^ ( μ r )
或
v ^ ( E τ μ ) ≤ E τ v ^ ( μ ) \hat{v}(\mathbb{E}_{\tau}\mu)\leq\mathbb{E}_{\tau}\hat{v}(\mu)
v ^ ( E τ μ ) ≤ E τ v ^ ( μ )
(如果v ^ ( μ ) \hat{v}(\mu) v ^ ( μ ) 是凸函數,那麼發送者總是可以通過勸說來獲利,上式根據Jensen’s Inequality總是成立的。但一般情況需要單獨證明)
反證。假設某個最優信息結構下τ \tau τ 使得τ ( μ l ) > 0 , τ ( μ r ) > 0 \tau(\mu_{l})>0,\tau(\mu_{r})>0 τ ( μ l ) > 0 , τ ( μ r ) > 0 ,然而v ^ ( μ m ) ≥ γ v ^ ( μ l ) + ( 1 − γ ) v ^ ( μ r ) \hat{v}(\mu_{m})\geq\gamma\hat{v}(\mu_{l})+(1-\gamma)\hat{v}(\mu_{r}) v ^ ( μ m ) ≥ γ v ^ ( μ l ) + ( 1 − γ ) v ^ ( μ r ) 。那麼我們可以任意選擇一個ϵ ∈ ( 0 , 1 ) \epsilon\in(0,1) ϵ ∈ ( 0 , 1 ) ,並取ϵ ′ = ϵ τ ( μ l ) τ ( μ r ) \epsilon^{\prime}=\epsilon\frac{\tau(\mu_{l})}{\tau(\mu_{r})} ϵ ′ = ϵ τ ( μ r ) τ ( μ l ) ,定義
τ ∗ ( μ l ) = ( 1 − γ ϵ ) τ ( μ l ) τ ∗ ( μ r ) = ( 1 − ( 1 − γ ) ϵ ′ ) τ ( μ r ) τ ∗ ( μ m ) = τ ( μ m ) + ϵ τ ( μ l ) τ ∗ ( μ ) = τ , if μ ∉ { μ l , μ m , μ r } \begin{aligned}
\tau^{\ast}(\mu_{l})=&(1-\gamma\epsilon)\tau(\mu_{l})\\
\tau^{\ast}(\mu_{r})=&(1-(1-\gamma)\epsilon^{\prime})\tau(\mu_{r})\\
\tau^{\ast}(\mu_{m})=&\tau(\mu_{m})+\epsilon\tau(\mu_{l})\\
\tau^{\ast}(\mu)=&\tau,\text{ if }\mu\notin\left\lbrace \mu_{l},\mu_{m},\mu_{r}\right\rbrace
\end{aligned} τ ∗ ( μ l ) = τ ∗ ( μ r ) = τ ∗ ( μ m ) = τ ∗ ( μ ) = ( 1 − γ ϵ ) τ ( μ l ) ( 1 − ( 1 − γ ) ϵ ′ ) τ ( μ r ) τ ( μ m ) + ϵ τ ( μ l ) τ , if μ ∈ / { μ l , μ m , μ r }
則τ ∗ \tau^{\ast} τ ∗ 是滿足貝葉斯可行的、比τ \tau τ 能給發送者帶來更高效用的信息結構(所引緻的後驗信念上的分佈)。矛盾。
【定義】如果對於任何信念μ \mu μ ,都有v ^ ( μ ) = E μ v ( a ^ ( μ ) , ω ) ≤ E μ v ( a , ω ) \hat{v}(\mu)=\mathbb{E}_{\mu}v(\hat{a}(\mu),\omega)\leq\mathbb{E}_{\mu}v(a,\omega) v ^ ( μ ) = E μ v ( a ^ ( μ ) , ω ) ≤ E μ v ( a , ω ) ,那麼我們說a a a 是引緻佔優 的;如果對於任何使得a ≠ a ^ ( μ ) a\neq\hat{a}(\mu) a = a ^ ( μ ) 的信念μ \mu μ ,都有v ^ ( μ ) = E μ v ( a ^ ( μ ) , ω ) < E μ v ( a , ω ) \hat{v}(\mu)=\mathbb{E}_{\mu}v(\hat{a}(\mu),\omega)<\mathbb{E}_{\mu}v(a,\omega) v ^ ( μ ) = E μ v ( a ^ ( μ ) , ω ) < E μ v ( a , ω ) ,則說a a a 是嚴格引緻佔優 的;如果a a a 是引緻佔優的,並且存在某個使得a ≠ a ^ ( μ ) a\neq\hat{a}(\mu) a = a ^ ( μ ) 的μ \mu μ ,有v ^ ( μ ) = E μ v ( a , ω ) \hat{v}(\mu)=\mathbb{E}_{\mu}v(a,\omega) v ^ ( μ ) = E μ v ( a , ω ) ,則說a a a 是弱、但不嚴格引緻佔優 的。
即:如果對於發送者來說,對於任何信念μ \mu μ ,a a a 都不比該信念下的最優行動a ^ ( μ ) \hat{a}(\mu) a ^ ( μ ) 差,則a a a 是引緻佔優的;如果對於任何使得a a a 與最優行動a ^ ( μ ) \hat{a}(\mu) a ^ ( μ ) 不同的μ \mu μ ,都有a a a 比a ^ ( μ ) \hat{a}(\mu) a ^ ( μ ) 對發送者更好,則a a a 是“心嚮往之,但不能至”,即嚴格引緻佔優的。如果有些μ \mu μ 使得a a a 與a ^ ( μ ) \hat{a}(\mu) a ^ ( μ ) 不同,並且a a a 是“心嚮往之,有時能至”,則是弱、但不嚴格引緻佔優的。
那麼,如果發送者願意分享信息,那麼
v ^ ( μ ) > ∑ ω v ( a ^ ( μ 0 ) , ω ) μ ( ω ) \hat{v}(\mu)>\sum_{\omega}v(\hat{a}(\mu_{0}),\omega)\mu(\omega)
v ^ ( μ ) > ω ∑ v ( a ^ ( μ 0 ) , ω ) μ ( ω )
可見,這時a ^ ( μ 0 ) \hat{a}(\mu_{0}) a ^ ( μ 0 ) 必須不能是引緻佔優的。
而【假設一】排除了弱、但不嚴格引緻佔優的情況。
因此,當【假設一】成立,並且發送者願意分享信息的時候,隻有嚴格引緻佔優以及不存在任何佔優這兩種情況是可能的。
接下來,我們錶明,當【假設一】成立時,若μ \mu μ 是被最優信息結構所引緻的內點後驗信念,那麼,要麼(1)接收者的偏好在μ \mu μ 處是非離散的,要麼(2)最優行為a ^ ( μ ) \hat{a}(\mu) a ^ ( μ ) 是嚴格引緻佔優的。
假設接收者的偏好在μ \mu μ 處是離散的,那麼根據命題二,如果μ \mu μ 就是先驗信念,那麼(1)當發送者不願意分享信息,那意味著發送者不能通過分享信息獲利,但這就意味著a ^ ( μ ) \hat{a}(\mu) a ^ ( μ ) 是嚴格引緻佔優的;(2)發送者願意分享信息,那麼意味著發送者可以通過分享信息獲利,此時V ( μ ) = v ^ ( μ ) V(\mu)=\hat{v}(\mu) V ( μ ) = v ^ ( μ ) (),則此時a ^ ( μ ) \hat{a}(\mu) a ^ ( μ ) 是引緻佔優(取等號)的,但【假設一】排除了弱、但不嚴格引緻佔優的情況,因此a ^ ( μ ) \hat{a}(\mu) a ^ ( μ ) 必須是嚴格引緻佔優的。即,我們得到了,“(1)接收者的偏好在μ \mu μ 處是非離散的”與“(2)最優行為a ^ ( μ ) \hat{a}(\mu) a ^ ( μ ) 是嚴格引緻佔優的”在【假設一】成立、μ \mu μ 是被最優信息結構所引緻的內點後驗信念下,是互斥的。
接下來我們錶明,如果發送者能夠通過勸說獲利,並且μ \mu μ 是最優信息結構引緻的後驗信念τ ( μ ) \tau(\mu) τ ( μ ) ,同時a ^ ( μ ) \hat{a}(\mu) a ^ ( μ ) 是嚴格引緻佔優的,那麼接收者的偏好在μ \mu μ 處是非離散的。
如果發送者能夠通過勸說獲利,那麼意味著V ( μ 0 ) > v ^ ( μ 0 ) V(\mu_{0})>\hat{v}(\mu_{0}) V ( μ 0 ) > v ^ ( μ 0 ) ,因此要使得V ( μ 0 ) = ∑ μ v ^ ( μ ) τ ( μ ) V(\mu_{0})=\sum_{\mu}\hat{v}(\mu)\tau(\mu) V ( μ 0 ) = ∑ μ v ^ ( μ ) τ ( μ ) ,至少需要兩個μ 和 μ ′ , 滿足 V ( μ ) = v ^ ( μ ) , V ( μ ′ ) = v ^ ( μ ′ ) 以及 τ ( μ ) μ + τ ( μ ′ ) μ ′ = μ 0 \mu\text{和}\mu^{\prime},\text{滿足}V(\mu)=\hat{v}(\mu),V(\mu^{\prime})=\hat{v}(\mu^{\prime})\text{以及}\tau(\mu)\mu+\tau(\mu^{\prime})\mu^{\prime}=\mu_{0} μ 和 μ ′ , 滿足 V ( μ ) = v ^ ( μ ) , V ( μ ′ ) = v ^ ( μ ′ ) 以及 τ ( μ ) μ + τ ( μ ′ ) μ ′ = μ 0 才能實現,同時,a ^ ( μ ) ≠ a ^ ( μ ′ ) \hat{a}(\mu)\neq\hat{a}(\mu^{\prime}) a ^ ( μ ) = a ^ ( μ ′ ) 。反證,假設接收者的偏好在最優信息結構引緻的某個內點μ \mu μ 是離散的,即
∃ δ > 0 使得 ∀ μ ′ ∈ N ( μ , δ ) 都有 a ^ ( μ ′ ) = a ^ ( μ ) \exists \delta>0\text{使得}\forall \mu^{\prime}\in N(\mu,\delta)\text{都有}\hat{a}(\mu^{\prime})=\hat{a}(\mu)
∃ δ > 0 使得 ∀ μ ′ ∈ N ( μ , δ ) 都有 a ^ ( μ ′ ) = a ^ ( μ )
因此可以選取ϵ > 0 \epsilon>0 ϵ > 0 ,使得μ m = ϵ μ ′ + ( 1 − ϵ ) μ ∈ N ( μ , δ ) \mu_{m}=\epsilon\mu^{\prime}+(1-\epsilon)\mu\in N(\mu,\delta) μ m = ϵ μ ′ + ( 1 − ϵ ) μ ∈ N ( μ , δ ) ,則a ^ ( μ m ) = a ^ ( μ ) \hat{a}(\mu_{m})=\hat{a}(\mu) a ^ ( μ m ) = a ^ ( μ ) ,但由於μ \mu μ 和μ ′ \mu^{\prime} μ ′ 都被最優信息結構所引緻,那麼
v ^ ( μ m ) ≤ ϵ v ^ ( μ ′ ) + ( 1 − ϵ ) v ^ ( μ ) \hat{v}(\mu_{m})\leq\epsilon\hat{v}(\mu^{\prime})+(1-\epsilon)\hat{v}(\mu)
v ^ ( μ m ) ≤ ϵ v ^ ( μ ′ ) + ( 1 − ϵ ) v ^ ( μ )
又
v ^ ( μ m ) = ∑ ω v ( a ^ ( μ m ) , ω ) μ m ( ω ) = ∑ ω v ( a ^ ( μ ) , ω ) μ m ( ω ) = ϵ ∑ ω v ( a ^ ( μ ) , ω ) μ ′ ( ω ) + ( 1 − ϵ ) ∑ ω v ( a ^ ( μ ) , ω ) μ ( ω ) ϵ ∑ ω v ( a ^ ( μ ) , ω ) μ ′ ( ω ) + ( 1 − ϵ ) v ^ ( μ ) \begin{aligned}
\hat{v}(\mu_{m})=&\sum_{\omega}v(\hat{a}(\mu_{m}),\omega)\mu_{m}(\omega)\\
=&\sum_{\omega}v(\hat{a}(\mu),\omega)\mu_{m}(\omega)\\
=&\epsilon\sum_{\omega}v(\hat{a}(\mu),\omega)\mu^{\prime}(\omega)+(1-\epsilon)\sum_{\omega}v(\hat{a}(\mu),\omega)\mu(\omega)\\
&\epsilon\sum_{\omega}v(\hat{a}(\mu),\omega)\mu^{\prime}(\omega)+(1-\epsilon)\hat{v}(\mu)
\end{aligned} v ^ ( μ m ) = = = ω ∑ v ( a ^ ( μ m ) , ω ) μ m ( ω ) ω ∑ v ( a ^ ( μ ) , ω ) μ m ( ω ) ϵ ω ∑ v ( a ^ ( μ ) , ω ) μ ′ ( ω ) + ( 1 − ϵ ) ω ∑ v ( a ^ ( μ ) , ω ) μ ( ω ) ϵ ω ∑ v ( a ^ ( μ ) , ω ) μ ′ ( ω ) + ( 1 − ϵ ) v ^ ( μ )
結合
v ^ ( μ m ) ≤ ϵ v ^ ( μ ′ ) + ( 1 − ϵ ) v ^ ( μ ) \hat{v}(\mu_{m})\leq\epsilon\hat{v}(\mu^{\prime})+(1-\epsilon)\hat{v}(\mu)
v ^ ( μ m ) ≤ ϵ v ^ ( μ ′ ) + ( 1 − ϵ ) v ^ ( μ )
與
v ^ ( μ m ) = ϵ ∑ ω v ( a ^ ( μ ) , ω ) μ ′ ( ω ) + ( 1 − ϵ ) v ^ ( μ ) \hat{v}(\mu_{m})=\epsilon\sum_{\omega}v(\hat{a}(\mu),\omega)\mu^{\prime}(\omega)+(1-\epsilon)\hat{v}(\mu)
v ^ ( μ m ) = ϵ ω ∑ v ( a ^ ( μ ) , ω ) μ ′ ( ω ) + ( 1 − ϵ ) v ^ ( μ )
有
∑ ω v ( a ^ ( μ ) , ω ) μ ′ ( ω ) ≤ v ^ ( μ ′ ) \sum_{\omega}v(\hat{a}(\mu),\omega)\mu^{\prime}(\omega)\leq\hat{v}(\mu^{\prime})
ω ∑ v ( a ^ ( μ ) , ω ) μ ′ ( ω ) ≤ v ^ ( μ ′ )
根據嚴格引緻佔優的定義,可知a ^ ( μ ) \hat{a}(\mu) a ^ ( μ ) 不是引緻佔優的。得證
這就意味著,如果最優信息結構所引緻的後驗信念中包含一個內點信念μ \mu μ ,而接收者的均衡行為a ^ ( μ ) \hat{a}(\mu) a ^ ( μ ) 對於發送者來說是最好的,那麼接收者在做這個選擇的時候必然對於多個選擇是無差異的∣ { a ∗ ( μ ) } ∣ > 1 |\left\lbrace a^{\ast}(\mu)\right\rbrace|>1 ∣ { a ∗ ( μ ) } ∣ > 1 。
—未完成—
例子
公訴人
發送者:公訴人;接收者:法官。
公訴人提供證據,證據能以一定機率錶明嫌疑人(非參與人)是否有罪。選擇採取何種效力的證據,這一行為就是選擇信息結構。
公訴人與法官對於嫌疑人有罪與否有相同的先驗信念μ 0 ( g u i l t y ) = 0.3 \mu_{0}(guilty)=0.3 μ 0 ( gu i lt y ) = 0.3 ,法官通過觀察公訴人提供的證據、進行貝葉斯更新,並決定是否判決嫌疑人有罪。
公訴人當最終法官判決嫌疑人有罪時得到效用1,無罪時得到效用0。無論事實上嫌疑人是否有罪。
法官僅當做出公正判決時得到效用1,即實際有罪時判決有罪、實際無罪時判決無罪。其他時候得到效用0。
可以看到公訴人與法官的效用是部分沖突的:當嫌疑人實際有罪時,二者的利益相同;當嫌疑人實際無罪時,二者的利益是沖突的,公訴人仍然希望法官判其有罪,但法官願意判其無罪。
同時,這個例子裏發送者(公訴人)的效用僅取決於接收者(法官)的行為,而不取決於真實狀態。
對於發送者來說,最優的信息結構應該是什麼樣的?應該是使得:當接收者選擇“判為無罪”時,接收者確定嫌疑人(非參與人)無罪,而當接收者選擇”判為有罪”時,接收者在“判為無罪”和“判為無罪”之間是無差異的。
所以發送者要引緻的後驗信念,應該是由μ ( g u i l t y ) = 0 \mu(guilty)=0 μ ( gu i lt y ) = 0 和μ ( g u i l t y ) = 0.5 \mu(guilty)=0.5 μ ( gu i lt y ) = 0.5 所組成。
但貝葉斯可行這一約束要求0.3 = x 0 + ( 1 − x ) 0.5 0.3=x0+(1-x)0.5 0.3 = x 0 + ( 1 − x ) 0.5 ,所以x = 0.4 x=0.4 x = 0.4 而( 1 − x ) = 0.6 (1-x)=0.6 ( 1 − x ) = 0.6 ,即應使得接收者以0.4的機率持有μ ( g u i l t y ) = 0 \mu(guilty)=0 μ ( gu i lt y ) = 0 這一後驗信念,以0.6的機率持有μ ( g u i l t y ) = 0.5 \mu(guilty)=0.5 μ ( gu i lt y ) = 0.5 這一後驗信念。
將接收者的信念作為橫軸,發送者的效用作為縱軸,可知發送者的效用函數由兩個水準的線段組成,當接收者的信念“嫌疑人有罪”這一機率小於1/2時,發送者的效用恆為0,而當大於1/2時恆為1。
因此這個效用函數的凹化應通過信念為0和1/2處的函數值的某個凸組合得到,否則,例如,如果由0和某個μ > 1 / 2 \mu>1/2 μ > 1/2 組成,那麼組合出的函數值在信念由1/2到μ \mu μ 之間都是小於那條恆為1的水準線的,這不符合凹化函數的構造定義。
當然,這隻是說最優的信息結構應該引緻這樣的後驗信念,如果不是最優信息結構,可以引緻其他的後驗信念。比如,由0和1這兩個後驗信念所構成的是完全退化的後驗分佈,代錶在每種世界狀態下,信號的實現是完全確定的,賦予0的權重,就是接收者被推薦應該判嫌疑人無罪的比例,賦予1的權重,就是接收者被推薦應該判嫌疑人有罪的比例,而貝葉斯可行的要求告訴我們,應該賦予0這個後驗信念以0.7的權重、賦予1這個後驗信念以0.3的權重,即有十分之三的時間應推薦法官判嫌疑人有罪,這對應於完全披露;再如,由0.3這個與先驗信念相同的後驗信念,同時賦予它以1的權重便滿足貝葉斯可行,這種信息結構就代錶著冇有任何信息被傳遞,接收者仍然以先驗信念來行動。
還有一個要求是不論是否在最優信號下,都需要滿足的:如果引緻了一個在先驗左側的後驗,那麼必須要同時引緻另一個在先驗右側的後驗,反之亦然,否則,如果所有後驗都在先驗的同一側,它們的凸組合就不會等於先驗,這樣就違背了貝葉斯可行的要求。
在當前這個例子裏,由於後驗信念可以錶示在一維空間裏(一般地,如果世界狀態空間為有限的N維,那麼信念空間為N-1維),即可以隻考慮“嫌疑人有罪”的機率,便落在一維的0-1區間裏,所以,在行動建議式信息結構的模式下隻需要兩個信號就足夠了,分別為給定世界狀態下推薦“你應判嫌疑人有罪”的條件機率,以及給定世界狀態下推薦“你應判嫌疑人無罪”的條件機率這兩個,這是因為,根據 Caratheodory 定理,不需要用超過兩個後驗機率來組合成一個給定的先驗機率。這對應於機製設計理論中的 Revelation Principle。
根據最優信息結構的構建
q ∗ ( s μ ∣ ω ) = μ ( ω ) τ ∗ ( μ ) μ 0 ( ω ) q^{*} (s_{\mu}|\omega)=\frac {\mu(\omega)\tau^{*}(\mu)} {\mu_{0}(\omega)}
q ∗ ( s μ ∣ ω ) = μ 0 ( ω ) μ ( ω ) τ ∗ ( μ )
可以求得,發送者的信息結構應該使得當真實狀態為“嫌疑人有罪”自然生成“你應該判為有罪”這一信號實現(行為推薦)的機率為
q ( g ∣ g u i l t y ) = ( 0.5 × 0.6 ) / 0.3 = 1 q(g|guilty)=(0.5×0.6)/0.3=1
q ( g ∣ gu i lt y ) = ( 0.5 × 0.6 ) /0.3 = 1
發送者的信息結構應該使得當真實狀態為“嫌疑人有罪”自然生成“你應該判為無罪”這一信號實現(行為推薦)的機率為
q ( i ∣ g u i l t y ) = ( 0 × 0.4 ) / 0.3 = 0 q(i|guilty)=(0×0.4)/0.3=0
q ( i ∣ gu i lt y ) = ( 0 × 0.4 ) /0.3 = 0
發送者的信息結構應該使得當真實狀態為“嫌疑人無罪”自然生成“你應該判為有罪”這一信號實現(行為推薦)的機率為
q ( g ∣ i n n o c e n t ) = [ ( 1 − 0.5 ) × 0.6 ] / ( 1 − 0.3 ) = 3 / 7 q(g|innocent)=[(1-0.5)×0.6]/(1-0.3)=3/7
q ( g ∣ inn oce n t ) = [( 1 − 0.5 ) × 0.6 ] / ( 1 − 0.3 ) = 3/7
發送者的信息結構應該使得當真實狀態為“嫌疑人無罪”自然生成“你應該判為無罪”這一信號實現(行為推薦)的機率為
q ( i ∣ i n n o c e n t ) = [ ( 1 − 0 ) × 0.4 ] / ( 1 − 0.3 ) = 4 / 7 q(i|innocent)=[(1-0)×0.4]/(1-0.3)=4/7
q ( i ∣ inn oce n t ) = [( 1 − 0 ) × 0.4 ] / ( 1 − 0.3 ) = 4/7
參考文獻
Kamenica, E., & Gentzkow, M. (2011). Bayesian persuasion. American Economic Review, 101(6), 2590-2615.
Aliprantis, C. D., Border, K. C. (2006). Infinite Dimensional Analysis: a Hitchhiker’s Guide. Berlin; London: Springer.
Bergemann, D., & Morris, S. (2019). Information design: A unified perspective. Journal of Economic Literature, 57(1), 44-95.
Xiang Sun’s Lecture Notes.
Kai Hao Yang’s Lecture Notes.
Vohra, R. V. (2004). Advanced mathematical economics. Routledge.
KC Border’s Lecture Notes.