不求甚解學經濟-信息設計(二)-多個接收者(1)

信息設計學習筆記係列。

Ina Taneva, 2019, AEJ: Micro

這篇文章裏提到的BNE和BCE指的是除了信息設計者以外的參與人之間的均衡概念，與KG(2011)不同，KG指的是發送者和接收者之間的均衡概念。

在這一篇文章中，依然了採取共同先驗的假設。分析將會極大地簡化。預計後麵我會整理自己閱讀的其他文章的筆記。如 On Information Design in Games，該文對信念的處理較為複雜(並且允許更多的均衡選擇可能)；Bayesian Persuasion with Heterogeneous Priors，關於異質性先驗信念等。

根據海薩尼教條：在共同先驗的假設下，參與人後驗信念的差異隻能來源於其所擁有信息的差異。所以採取共同先驗假設可以更好地分析信息的作用。如果採取異質性先驗假設，那麼為了識別出信息和先驗各自的作用，需要施加額外的約束條件。

當存在多個接收者時，信息設計問題引進了更多的複雜性。比如不同接收者對於世界狀態信念的差異，接收者之間對彼此策略的不確定性，接收者之間的對其他人信念的不確定性，接收者之間的策略互動等。

當考慮多個接收者(以及信息設計者)具有相同的先驗信念時，問題將會被簡化。但依然需要處理接收者之間的策略互動問題。

當模型中存在多個均衡時，信息設計者可以起到均衡選擇的作用。特別地，當考慮混合策略均衡時，信息設計者的協調作用可以避免一種福利較差的情況出現：如果不存在這種協調機製，福利較差的情況可能以正的機率在均衡中出現。

接下來我們回顧一下相關策略的知識，以及其與混合策略的區別等。

預備知識

混合策略與相關策略的區別

當考慮策略型博弈(Normal Form, Strategic Form)時，

給定有限策略集們 $S_{i}$ 對於每個參與人 $i\in\mathscr{P}$ ，其中 $\mathscr{P}$ 為有限的參與人集。則參與人 $i$ 的混合策略為 $\Delta(S_{i})$ 。

從而混合策略的策略組合集為

$\Pi_{i\in\mathscr{P}}\Delta(S_{i})$

而相關策略組合集為

$\Delta(\Pi_{i\in\mathscr{P}}S_{i})$

在相關策略概念的産生之初，需要借用一個虛擬的外部觀察者或隨機推薦機製，比如拋硬幣等，在硬幣的結果揭曉後，參與人根據事先約定的正反麵與相應的某個納什均衡之間的對應關係來行動。在信息設計文獻中，産生貝葉斯相關策略的人可以是實際的信息設計者。

任意的相關策略組合 $\Pi=\Delta(\Pi_{i\in\mathscr{P}}S_{i})$ 由滿足如下條件的那些分佈 $\rho$ 們構成

$\rho(s)\geq 0,\forall s\in S$
$\sum_{s\in S}\rho(s)=1$

而任意的混合策略組合 $\{\prod_{i}\sigma_{i}(s_{i}),\forall i,s_{i}\in S_{i}\}$ 所引緻的分佈 $I$ 由滿足如下條件的那些分佈 $\rho^{\sigma}$ 們構成

$I=\{\rho^{\sigma}\in\Pi:\rho^{\sigma}(s)=\prod_{i\in\mathscr{P}}\sigma_{i}(s_{i}),\forall s\in S\}$

註意這裏使用了一個轉換，混合策略組合是各自獨立的混合策略的笛卡爾乘積，是各個人在各自策略上混合後再組合在一起，但相關策略組合是直接在各人策略組合上的機率，為了比較，需要把混合策略組合也轉換成各人策略組合上的機率，這就是混合策略組合所引緻的分佈。 $I$ 的定義式錶明了它的意義。

舉個例子，如果有兩個參與人 $1$ 、 $2$ ，其策略分別為 $S_{1}=\{L,R\}$ 和 $S_{2}=\{A,B\}$ ：

則混合策略的策略組合集為 $\Delta(L,R)\times\Delta(A,B)$ ，即由兩條線段（兩條線段即分別由頂點 $L,R$ 和頂點 $A,B$ 張成的兩個二維空間裏的單純形）的笛卡爾乘積構成的矩形；

而相關策略的策略組合集為 $\Delta((L,R)\times(A,B))$ ，即由四個頂點 $(L,A)(L,B)(R,A)(R,B)$ 張成的四維空間裏的單純形：一個三維的四麵體。

混合策略的策略組合集所引緻的分佈可以被視為相關策略的策略組合集中的一個低維麵，在這個麵上，各人的策略彼此獨立。即

$I\subset\Pi$

二者的區別相當於乘積分佈(獨立者的聯合分佈等於邊際分佈的乘積)與任意聯合分佈(聯合分佈未必等於邊際分佈的乘積)的區別。所以，當一個相關策略是一個乘積測度時，那麼它也是由某個混合策略組合集所引緻的分佈。

模型

策略型博弈。參與人集合 $N=\{1,...,N\}$ ，每個參與人 $i\in I$ 具有有限行動空間 $A_{i}$ ，行動組合為 $A=A_{1}\times ...\times A_{N}$ 。有限狀態集 $\Theta$ ，元素為 $\theta$ 。每個參與人具有效用函數 $u_{i}:A\times\Theta\rightarrow\mathbb{R}$ 。信息設計者效用函數為 $V:A\times\Theta\rightarrow\mathbb{R}$ 。信息設計者既可以使 $N$ 個參與人之一，也可以是作為中央計畫者的外部者。信息設計者和參與人具有共同的先驗信念 $\phi\in\text{int}(\Delta(\Theta))$ ，並且這一點是共同知識。於是，基本博弈結構為 $G=((A_{i},u_{i})_{i=1}^{N},\phi)$ 。

信息結構為 $S=((T_{i})_{i=1}^{N},\pi)$ ，其中 $T_{i}$ 是信息設計者嚮參與人 $i$ 發送的潛在可能信號集，每個可能信號集都是有限集； $\pi:\Theta\rightarrow\Delta(T)$ 為條件信號分佈，其中 $T=T_{1}\times ...\times T_{N}$ ，其元素為 $t=(t_{1},...,t_{N})$ ，其中 $t_{i}\in T_{i}$ 。

結合在一起 $(G,S)$ 定義了一個不完全信息博弈。參與人 $i$ 的策略為 $\beta_{i}:T_{i}\rightarrow\Delta(A_{i})$ 。

給定基本博弈 $G$ ，信息設計者公開宣佈並承諾一個信息結構 $S$ ，這一點隨之成為共同知識。當狀態根據先驗機率 $\phi$ 生成後，經過條件信號分佈 $\pi$ 轉換為一係列私人的信號實現，並分別單獨揭露給各個參與人。但這隻是一般情形，如果信息結構 $S$ 的設計恰好使得 $T_{i}=T^{\prime}$ 並且經過 $\pi$ 轉換稱相同的信號，那麼單獨揭露的完全可以是相同的信號實現，同時由於信息結構是事先承諾的，因此雖然單獨揭露但事實上生成的相同信號也成為了共同知識。在觀察到信號實現 $t_{i}$ 後，參與人 $i$ 根據先驗信念、信息結構來形成關於狀態和其他參與人的後驗信念，並採取行動 $\beta_{i}(\cdot|t_{i})\in\Delta(A_{i})$ 來最大化個人的期望效用。在各個人最優行動的情況下，引緻了一個以狀態為條件的、關於行動組合的條件分佈，這個條件分佈就是貝葉斯納什均衡。

定義1. 貝葉斯納什均衡

給定博弈 $(G,S)$ ，如果對於任何參與人 $i$ 、可能的信號實現 $t_{i}\in T_{i}$ 以及滿足 $\beta_{i}(a_{i}|t_{i})>0$ 的 $a_{i}\in A_{i}$ 來說，某策略組合 $\beta$ 滿足

$\begin{align}\sum_{a_{-i},t_{-i},\theta}\phi(\theta)\pi(t_{i},t_{-i}|\theta)(\prod_{j\neq i}\beta_{j}(a_{j}|t_{j}))u_{i}((a_{i},a_{-i}),\theta)\\ \geq\sum_{a_{-i},t_{-i},\theta}\phi(\theta)\pi(t_{i},t_{-i}|\theta)(\prod_{j\neq i}\beta_{j}(a_{j}|t_{j}))u_{i}((a^{\prime}_{i},a_{-i}),\theta)\\ \forall a^{\prime}_{i}\in A_{i} \end{align}$

則分佈 $v:\Theta\rightarrow\Delta(A)$

$v(a|\theta)=\sum_{t\in T}\pi(t|\theta)(\prod_{j=1}^{N}\beta_{j}(a_{j}|t_{j}))$

是 $(G,S)$ 的一個貝葉斯納什均衡引緻的在參與人行為組合上的一個分佈。記為 $\text{BNE}(G,S)={v}$ 。

其中 $u_{i}((a_{i},a_{-i}),\theta)$ 錶明參與人實現的效用既依賴於所有參與人的行動，也依賴於世界狀態； $\beta_{j}(a_{j}|t_{j})$ 是當參與人 $j$ 接收到了 $t_{j}$ 這個信號之後，採取行動 $a_{j}$ 的機率，而 $(\prod_{j\neq i}\beta_{j}(a_{j}|t_{j}))$ 意味著行為人之間的策略選擇是獨立的、因此可以做乘積。 $\pi(t_{i},t_{-i}|\theta)$ 是當真實狀態為 $\theta$ 時 $\pi$ 這個信息結構分別給 $i$ 和所有 $j\neq i$ 發出 $t_{i}$ 和 $t_{-i}=\prod_{j\neq i}t_{j}$ 信號的機率； $\phi(\theta)$ 是真實狀態為 $\theta$ 的先驗信念。

每個信息結構 $S$ 都能引緻一個貝葉斯納什均衡的集合 $\text{BNE}(G,S)$ ，信息設計者在多種信息結構之間選擇，選擇標準是其引緻的貝葉斯納什均衡在事前最大化信息設計者的期望效用。這一問題可以分成如下步驟來處理：先刻畫可能的貝葉斯納什均衡集 $\cup_{S}\text{BNE}(G,S)$ ，稱之為約束集；再通過選擇最優的行為-類型分佈 $v^{\star}$ 來實現信息設計者的事前期望效用；最後尋找到能引緻這一分佈 $v^{\star}$ 的信息結構 $S^{\star}$ ，以使得 $v^{\star}$ 是博弈 $(G,S^{\star})$ 下的貝葉斯納什均衡。這就引出了如下這個刻畫貝葉斯納什均衡的方法。

定義2. 貝葉斯相關均衡

一個分佈 $v:\Theta\rightarrow\Delta(A)$ ，如果對於任何參與人 $i$ 和 $a_{i}\in A_{i}$ ，如果滿足下式，則是一個貝葉斯相關均衡。

$\begin{align}\sum_{a_{-i},\theta}\phi(\theta)v(a_{i},a_{-i}|\theta)u_{i}((a_{i},a_{-i}),\theta)\\ \geq\sum_{a_{-i},\theta}\phi(\theta)v(a_{i},a_{-i}|\theta)u_{i}((a^{\prime}_{i},a_{-i}),\theta)\\ \forall a^{\prime}_{i}\in A_{i} \end{align}$

記為 $\text{BCE}(G)$ 。

前麵不等式就是開頭預備知識中提到的Obedience約束，即使得參與人願意遵照建議來行動。由於相關策略組合是直接在各參與人的行動組合上直接指定機率，因此與 $\text{BNE}(G,S)$ 相比，隻需要 $v(a_{i},a_{-i}|\theta)$ 一項而非各參與人彼此獨立的策略相乘。同時，均衡隻要求冇有參與人願意單方麵偏離，所以在比較 $i$ 在 $a_{i}$ (接收到的建議)和 $a^{\prime}_{i}$ 之間的選擇時，給定其他人按照建議 $a_{-i}$ 行動。

在完備信息情形中，參與人對於效用相關的參數冇有什麼不確定性(如果參與人有任何不確定性那也是來源於對其他參與人會採取什麼行為是不確定的)，如果策略組合給定了，那麼效用也給定了，即世界狀態隻有一種。如果引入狀態空間的概念從而引入不確定，也僅僅是為了協調，狀態空間中狀態與參與人的支付/效用無關，因此不能被稱為世界狀態。而在不完備信息情形中，對於給定的策略組合來說，在不同的世界狀態下參與人以及設計者所能得到的效用是不同的，效用除了依賴於策略組合，還依賴於世界狀態。這是貝葉斯相關均衡與相關均衡的區別。

命題1

$\text{BCE}(G)=\cup_{S}\text{BNE}(G,S)$

證明：

(1) $\text{BCE}(G)\subset\cup_{S}\text{BNE}(G,S)$

任取 $v\in\text{BCE}(G)$ ，根據BCE的定義，有對於任何參與人 $i$ 和 $a_{i}\in A_{i}$ ，如果滿足下式，則是一個貝葉斯相關均衡。

$\begin{align}\phi(\theta)v(a_{i},a_{-i}|\theta)u_{i}((a_{i},a_{-i}),\theta)\\ \geq\phi(\theta)v(a_{i},a_{-i}|\theta)u_{i}((a^{\prime}_{i},a_{-i}),\theta)\\ \forall a^{\prime}_{i}\in A_{i} \end{align}$

那麼便可以構造信息結構 $S^{\star}=(A,\pi^{\star})$ 為對於任何 $a\in A$ 和 $\theta\in\Theta$

$\pi^{\star}(a|\theta)=v(a|\theta)$

(這一步就是構造一個直接信息結構，並且使得這個信息結構中的條件機率等於我們所需要的相關性。)

並構造參與人 $i$ 的策略 $\beta^{\star}_{i}$ 為對於任何 $a_{i},a^{\prime}_{i}\in A_{i}$

$\beta^{\star}_{i}(a^{\prime}_{i}|a_{i})= \begin{cases} 1, \text{if}a_{i}=a^{\prime}_{i}\\ 0, \text{if}a_{i}\neq a^{\prime}_{i} \end{cases}$

(由於行動建議是確定的，盡管行動建議的生成過程是隨機的，這樣各個參與人的策略不是0就是1，因此對於那些我們要引緻的1來說，將其連乘並與信息結構中的條件機率相乘，就使得在相關的建議生成機製下各個參與人相互獨立地採取策略的結果完全模仿了貝葉斯相關均衡的分佈。)

那麼，給定其他人遵照 $\beta^{\star}_{-i}$ ，當參與人 $i$ 觀察到信號 $a^{\prime}_{i}$ 而採取行動 $a_{i}$ 時，其期望效用為

$\begin{align} \sum_{a_{-i},a^{\prime}_{-i},\theta}\phi(\theta)\pi^{\star}(a_{i},a^{\prime}_{-i}|\theta)(\prod_{j\neq i}\beta^{\star}_{j}(a_{j}|a^{\prime}_{j}))u_{i}((a^{\prime}_{i},a_{-i}),\theta)\\ =\sum_{a_{-i},\theta}\phi(\theta)v(a_{i},a_{-i}|\theta)u_{i}((a^{\prime}_{i},a_{-i}),\theta) \end{align}$

根據BCE的約束條件

和上式，可知BNE的約束條件得到滿足

$\begin{align} \sum_{a_{-i},a^{\prime}_{-i},\theta}\phi(\theta)\pi^{\star}(a_{i},a^{\prime}_{-i}|\theta)(\prod_{j\neq i}\beta^{\star}_{j}(a_{j}|a^{\prime}_{j}))u_{i}((a_{i},a_{-i}),\theta)\\ \sum_{a_{-i},a^{\prime}_{-i},\theta}\phi(\theta)\pi^{\star}(a_{i},a^{\prime}_{-i}|\theta)(\prod_{j\neq i}\beta^{\star}_{j}(a_{j}|a^{\prime}_{j}))u_{i}((a^{\prime}_{i},a_{-i}),\theta) \end{align}$

因此，由前述定義的 $\beta^{\star}$ 所引緻的分佈

$\sum_{a^{\prime}\in A}\pi^{\star}(a^{\prime}|\theta)(\prod_{j=1}^{N}\beta_{j}(a_{j}|a^{\prime}_{j}))=v(a|\theta)$

就是 $(G,S^{\star})$ 的一個BNE。即 $v\in\text{BNE}(G,S^{\star})$ 。

(2) $\cup_{S}\text{BNE}(G,S^{\star})\subset\text{BCE}(G)$

任選 $\tilde{v}\in\cup_{S}\text{BNE}(G,S)$ ，則存在某個 $\tilde{S}=(\tilde{T},\tilde{\pi})$ 和 $\beta$ 使得

$\tilde{v}(a|\theta)=\sum_{\tilde{t}\in\tilde{T}}\tilde{\pi}(\tilde{t}|\theta)(\prod_{j=1}^{N}\beta_{j}(a_{j}|\tilde{t}_{j}))$

(在貝葉斯納什均衡中，可以採用任何的信息結構。但是我們可以通過合並操作，來使得直接建議能夠模仿任何的信息結構。即，將任意的某個信息結構的潛在信號可能集中的元素，按照其所引緻的參與人的行動來分類；對於某個所引緻的行動，將能夠引緻它的各種信號的機率加總，作為建議這個行動的機率。例如，如果參與人的行為是“不打傘”或“打傘”，而某個信息結構是一組“晴天”、“多雲”、“下雨”及其各自的機率，那麼打包組合而成的新信息結構就是把“晴天”和“多雲”打包成“不打傘”，把“下雨”變成“打傘”，並且把推薦“不打傘”的條件機率作為原先的信息結構中“晴天”和“多雲”的條件機率之和，把推薦“打傘”的條件機率作為原先的信息結構中“下雨”的條件機率。由於我們是按照所引緻的行為來打包，並且對於任一行為來說，引緻它的機率都冇有改變，所以這兩種信息結構從行為、結果或彼此的效用來說都冇有改變。)

對於任何使得 $\beta_{i}(a_{i}|\tilde{t}_{i})>0$ 的 $a_{i}$ 來說，根據BNE的定義，對於任何 $i\in T,\tilde{t}_{i}\in\tilde{T}_{j}$ 和 $a^{\prime}_{i}$
\in A_{i}來說，都有

$\begin{align} \sum_{a_{-i},\tilde{t}^{\prime}_{-i},\theta}\phi(\theta)\tilde{\pi^{\star}}(\tilde{t}_{i},\tilde{t}^{\prime}_{-i}|\theta)(\prod_{j\neq i}\beta^{\star}_{j}(a_{j}|\tilde{t}^{\prime}_{j}))u_{i}((a_{i},a_{-i}),\theta)\\ \sum_{a_{-i},\tilde{t}^{\prime}_{-i},\theta}\phi(\theta)\tilde{\pi^{\star}}(\tilde{t}_{i},\tilde{t}^{\prime}_{-i}|\theta)(\prod_{j\neq i}\beta^{\star}_{j}(a_{j}|\tilde{t}^{\prime}_{j}))u_{i}((a^{\prime}_{i},a_{-i}),\theta) \end{align}$

但將等式兩邊同乘 $\beta_{i}(a_{i}|\tilde{t}_{i})$ 並對 $\tilde{t}_{i}$ 進行加總，由

$\begin{align} \sum_{a_{-i},\tilde{t},\theta}\phi(\theta)\tilde{\pi^{\star}}(\tilde{t}_{i},\tilde{t}^{\prime}_{-i}|\theta)(\prod_{j\neq i}\beta^{\star}_{j}(a_{j}|\tilde{t}^{\prime}_{j}))u_{i}((a_{i},a_{-i}),\theta)\\ \sum_{a_{-i},\tilde{t},\theta}\phi(\theta)\tilde{\pi^{\star}}(\tilde{t}_{i},\tilde{t}^{\prime}_{-i}|\theta)(\prod_{j\neq i}\beta^{\star}_{j}(a_{j}|\tilde{t}^{\prime}_{j}))u_{i}((a^{\prime}_{i},a_{-i}),\theta) \end{align}$

代入

$\tilde{v}(a|\theta)=\sum_{\tilde{t}\in\tilde{T}}\tilde{\pi}(\tilde{t}|\theta)(\prod_{j=1}^{N}\beta_{j}(a_{j}|\tilde{t}_{j}))$

得

$\begin{align}\phi(\theta)\tilde{v}(a_{i},a_{-i}|\theta)u_{i}((a_{i},a_{-i}),\theta)\\ \geq\phi(\theta)\tilde{v}(a_{i},a_{-i}|\theta)u_{i}((a^{\prime}_{i},a_{-i}),\theta)\\ \forall a^{\prime}_{i}\in A_{i} \end{align}$

即 $\tilde{v}\in\text{BCE}(G)$ 。

由此可知，信息設計者跨信息結構(有無窮多個)的優化問題，與在貝葉斯相關均衡中選擇使自己期望效用最大化的問題，是等價的。即，不論採取何種信息結構，所能實現的貝葉斯納什均衡，都可以被某個貝葉斯相關均衡實現。這樣，就無需做跨信息結構的優化，而隻需要在貝葉斯相關均衡中找到那個使得信息設計者事前期望效用最大化的分佈 $v^{\star}$ ，再從中還原出特定的信息結構 $S^{\star}$ 就好了。

但通過開頭給出的混合策略組合與相關策略組合的區別，我們知道混合策略組合隻是相關策略組合一個更低維度的子集：參與人策略之間的某些相關性可被相關策略組合實現，但無法被“各自獨立的混合策略”之組合實現。因此，為了使相關策略組合與跨信息結構的混合策略組合相等同，我們需要一個將相關策略組合中的相關性引入混合策略組合集的方法：這就要通過信息結構，使得信號實現及其與真實狀態之間的關係被引入參與人的策略中去。通過選擇合適的信息結構，可以使得參與人獲取關於世界狀態和其他參與人的信息，從而引緻所需要的、參與人的均衡行為之間的相關性。在證明中，我們構造的 $\pi$ 就實現了這種相關性，從而使得在這種信息結構下，各參與人相獨立的策略選擇能夠實現在所要實施的相關均衡中所要求的相關性。

引理1

$\text{BCE}(G)$ 是 $\Delta(A)^{\Theta}$ 中的一個非空凸多胞形。

證明：由於 $\text{BCE}(G)$ 是一些分佈的集合，這些分佈 $v:\Theta\rightarrow\Delta(A)$ 滿足

$v(a|\theta)\geq 0,\forall a\in A,\theta\in\Theta$ ,
$\sum_{a\in A}v(a|\theta)=1,\forall\theta\in\Theta$ ,
$\sum_{a_{-i},\theta}\phi(\theta)v((a_{i},a_{-i})|\theta)u_{i}((a_{i},a_{-i}),\theta)\geq\sum_{a_{-i},\theta}\phi(\theta)v((a^{\prime}_{i},a_{-i})|\theta)u_{i}((a_{i},a_{-i}),\theta),\forall i\in I,a_{i}\in A_{i}$ 和 $a^{\prime}_{i}\in A_{i}$

其中條件1和2使得 $v$ 確實是一個機率分佈，而條件3即BCE的激勵相同約束。

前兩個條件定義了一個 $\Delta(A)^{\Theta}$ 中的一個單純形，這個單純形中的點都可以作為貝葉斯相關策略組合，但尚不足以作為貝葉斯相關均衡。這些貝葉斯相關策略組合可以視為，在各參與人行為組合上指定任意的聯合分佈。

條件3錶明，按建議行動帶來的期望效用不會比其他行動低。

這三個條件是 Aumann (1987) 相關均衡定義的推廣，加入了世界狀態的元素。具體地，在完備信息情況下，參與人對收益是確定的，而隻對其他人的策略是不確定的，因此收益相關的參數是平凡的，世界狀態根據定義是單點集；參與人類型是對協調者會如何建議的刻畫。而在不完備信息情況下，在不同的世界狀態下參與人的收益是不同的，因此世界狀態是多點集，協調者/信息設計者的建議取決於世界狀態(根據我們對信息結構的設定)。

所有約束對於 $v$ 都是線性的，根據Stinchcombe (2011)，BCE(G)非空。而線性約束的可行集若有界便為凸多胞形。

並且由於BCE(G)是 $\Delta(A)^{\Theta}$ 的閉子集，因此BCE(G)是緊集。有界的凸多胞形可以錶示為有限個極點的凸包，這樣生成的凸包天然是緊凸集。

從而，從無窮多種信息結構裏跨信息結構的最優化，可以利用BCE(G)及其為非空凸多胞形的性質，通過求解線性規劃問題解決，由於命題1，這不會漏解。

關於多胞形一詞，我不太確定使用得是否正確。其原文為polytope。但關於其定義，以及與polyhedron之間的關係，本身就定義繁多並且並不彼此等價。我對這個詞的理解和使用是這樣的：有限多個半空間的交集，稱為polyhedron；如果這個polyhedron還是有界的，那麼便稱為polytope(即我使用的“多胞形”一詞)。

從而，按這種定義方式，才有“線性約束的可行集若有界便為凸多胞形”這一說法。如果按不同的術語，例如並不把有界的條件加在多胞形的定義上，而隻是將多胞形定義為有限多個半空間的交集的話，那麼這句話應為“線性約束的可行集是凸多胞形”。

而當我使用單純形(simplex)一詞時，多指“單位單純形”，即可以用來作為機率分佈集和凸組合係數集的單純形。而單純形就是最簡單(simplest)的polytope之意。

設計者的目標函數

$\max_{v\in\cup_{S}\text{BNE}(G,S)}\mathbb{E}_{v}[V]=\max_{v\in\cup_{S}\text{BNE}(G,S)}\sum_{a,\theta}V(a,\theta)v(a|\theta)\phi(\theta)$

定義3. 給定基本博弈 $G$ ，如果信息結構 $S=(T,\pi)$ 滿足 $T_{i}=A_{i},\forall i\in I$ ，則稱這個信息結構是直接的(即行動建議式的)。

命題2

給定基本博弈 $G$ ，任給一個 $v\in\cup_{S}\text{BNE}(G,S)$ ，都存在一個直接信息結構 $S_{v}=(A,v)$ 使得 $v\in\text{BNE}(G,S_{v})$

證明：給定任一基本博弈 $G$ 和分佈 $v\in\cup_{S}\text{BNE}(G,S)$ ，根據命題1我們知道 $v\in\text{BCE}(G)$ ，從而對於任何參與人 $i$ 和 $a_{i},a^{\prime}_{i}\in A_{i}$ 都有

則考慮信息結構 $S_{v}=(A,\pi_{v})$ ，其中 $\pi_{v}(a|\theta)=v(a|\theta)$ 對於任何 $a\in A$ 和 $\theta\in\Theta$ 。在博弈 $(G,S)$ 中，考慮如下策略

$\beta_{i}(a^{\prime}_{i}|a_{i})= \begin{cases} 1, \text{if}a_{i}=a^{\prime}_{i}\\ 0, \text{if}a_{i}\neq a^{\prime}_{i} \end{cases}$

對於任何 $a_{i},a^{\prime}_{i}\in A_{i}$ ，給定其他人遵照 $\beta_{-i}$ ，當參與人 $i$ 觀察到信號 $a^{\prime}_{i}$ 而採取行動 $a_{i}$ 時，其期望效用為

$\begin{align} \sum_{a_{-i},a^{\prime}_{-i},\theta}\phi(\theta)\pi_{v}(a_{i},a^{\prime}_{-i}|\theta)(\prod_{j\neq i}\beta_{j}(a_{j}|a^{\prime}_{j}))u_{i}((a^{\prime}_{i},a_{-i}),\theta)\\ =\sum_{a_{-i},\theta}\phi(\theta)\pi_{v}(a_{i},a_{-i}|\theta)u_{i}((a^{\prime}_{i},a_{-i}),\theta)\\ =\sum_{a_{-i},\theta}\phi(\theta)v(a_{i},a_{-i}|\theta)u_{i}((a^{\prime}_{i},a_{-i}),\theta) \end{align}$

將上式結合BCE的約束條件

可以得到對於每個參與人 $i$

$\begin{align}\sum_{a_{-i},t_{-i},\theta}\phi(\theta)\pi_{v}(t_{i},t_{-i}|\theta)(\prod_{j\neq i}\beta_{j}(a_{j}|t_{j}))u_{i}((a_{i},a_{-i}),\theta)\\ \geq\sum_{a_{-i},t_{-i},\theta}\phi(\theta)\pi_{v}(t_{i},t_{-i}|\theta)(\prod_{j\neq i}\beta_{j}(a_{j}|t_{j}))u_{i}((a^{\prime}_{i},a_{-i}),\theta)\\ \forall a^{\prime}_{i}\in A_{i} \end{align}$

而這正是使得 $\beta$ 成為 $(G,S_{v})$ 的BNE的約束條件，並且此時

$\sum_{a^{\prime}\in A}\pi_{v}(a^{\prime}|\theta)(\prod_{i=1}^{N}\beta_{i}(a_{i}|a^{\prime}_{i}))=\pi_{v}(a|\theta)=v(a|\theta)$

對於每個 $a\in A$ 和 $\theta\in\Theta$ 都成立，因此 $v\in\text{BNE}(G,S_{v})$ 。

推論. 最優信息結構為 $S^{\star}=(A,\pi^{\star})$ ，其中 $\pi^{\star}(a|\theta)=v^{\star}(a|\theta)$ ，而 $v^{\star}\in\text{arg}\max_{v\in\text{BCE}(G)}\mathbb{E}_{v}[V]$ 。

應用：對稱二元環境

暫略