信息設計學習筆記係列。

Ina Taneva, 2019, AEJ: Micro

這篇文章裏提到的BNE和BCE指的是除了信息設計者以外的參與人之間的均衡概念,與KG(2011)不同,KG指的是發送者和接收者之間的均衡概念。

在這一篇文章中,依然了採取共同先驗的假設。分析將會極大地簡化。預計後麵我會整理自己閱讀的其他文章的筆記。如 On Information Design in Games,該文對信念的處理較為複雜(並且允許更多的均衡選擇可能);Bayesian Persuasion with Heterogeneous Priors,關於異質性先驗信念等。


根據海薩尼教條:在共同先驗的假設下,參與人後驗信念的差異隻能來源於其所擁有信息的差異。所以採取共同先驗假設可以更好地分析信息的作用。如果採取異質性先驗假設,那麼為了識別出信息和先驗各自的作用,需要施加額外的約束條件。


當存在多個接收者時,信息設計問題引進了更多的複雜性。比如不同接收者對於世界狀態信念的差異,接收者之間對彼此策略的不確定性,接收者之間的對其他人信念的不確定性,接收者之間的策略互動等。

當考慮多個接收者(以及信息設計者)具有相同的先驗信念時,問題將會被簡化。但依然需要處理接收者之間的策略互動問題。

當模型中存在多個均衡時,信息設計者可以起到均衡選擇的作用。特別地,當考慮混合策略均衡時,信息設計者的協調作用可以避免一種福利較差的情況出現:如果不存在這種協調機製,福利較差的情況可能以正的機率在均衡中出現。

接下來我們回顧一下相關策略的知識,以及其與混合策略的區別等。

預備知識

混合策略與相關策略的區別

當考慮策略型博弈(Normal Form, Strategic Form)時,

給定有限策略集們SiS_{i}對於每個參與人iPi\in\mathscr{P},其中P\mathscr{P}為有限的參與人集。則參與人ii的混合策略為Δ(Si)\Delta(S_{i})

從而混合策略的策略組合集為

ΠiPΔ(Si)\Pi_{i\in\mathscr{P}}\Delta(S_{i})

而相關策略組合集為

Δ(ΠiPSi)\Delta(\Pi_{i\in\mathscr{P}}S_{i})

在相關策略概念的産生之初,需要借用一個虛擬的外部觀察者或隨機推薦機製,比如拋硬幣等,在硬幣的結果揭曉後,參與人根據事先約定的正反麵與相應的某個納什均衡之間的對應關係來行動。在信息設計文獻中,産生貝葉斯相關策略的人可以是實際的信息設計者。

任意的相關策略組合Π=Δ(ΠiPSi)\Pi=\Delta(\Pi_{i\in\mathscr{P}}S_{i})由滿足如下條件的那些分佈ρ\rho們構成

  1. ρ(s)0,sS\rho(s)\geq 0,\forall s\in S
  2. sSρ(s)=1\sum_{s\in S}\rho(s)=1

而任意的混合策略組合{iσi(si),i,siSi}\{\prod_{i}\sigma_{i}(s_{i}),\forall i,s_{i}\in S_{i}\}所引緻的分佈II由滿足如下條件的那些分佈ρσ\rho^{\sigma}們構成

I={ρσΠ:ρσ(s)=iPσi(si),sS}I=\{\rho^{\sigma}\in\Pi:\rho^{\sigma}(s)=\prod_{i\in\mathscr{P}}\sigma_{i}(s_{i}),\forall s\in S\}

註意這裏使用了一個轉換,混合策略組合是各自獨立的混合策略的笛卡爾乘積,是各個人在各自策略上混合後再組合在一起,但相關策略組合是直接在各人策略組合上的機率,為了比較,需要把混合策略組合也轉換成各人策略組合上的機率,這就是混合策略組合所引緻的分佈。II的定義式錶明了它的意義。


舉個例子,如果有兩個參與人1122,其策略分別為S1={L,R}S_{1}=\{L,R\}S2={A,B}S_{2}=\{A,B\}

則混合策略的策略組合集為Δ(L,R)×Δ(A,B)\Delta(L,R)\times\Delta(A,B),即由兩條線段(兩條線段即分別由頂點L,RL,R和頂點A,BA,B張成的兩個二維空間裏的單純形)的笛卡爾乘積構成的矩形;

而相關策略的策略組合集為Δ((L,R)×(A,B))\Delta((L,R)\times(A,B)),即由四個頂點(L,A)(L,B)(R,A)(R,B)(L,A)(L,B)(R,A)(R,B)張成的四維空間裏的單純形:一個三維的四麵體。


混合策略的策略組合集所引緻的分佈可以被視為相關策略的策略組合集中的一個低維麵,在這個麵上,各人的策略彼此獨立。即

IΠI\subset\Pi

二者的區別相當於乘積分佈(獨立者的聯合分佈等於邊際分佈的乘積)與任意聯合分佈(聯合分佈未必等於邊際分佈的乘積)的區別。所以,當一個相關策略是一個乘積測度時,那麼它也是由某個混合策略組合集所引緻的分佈。

相關均衡

相關策略組合集是相關均衡的選擇集,但並不是其中每一個組合都能夠成為相關均衡。當考慮行動建議式相關策略時,隻有那些使得參與人聽從建議至少不會比不聽從差的相關策略組合才滿足Obedience約束,即能夠使得參與人遵照建議來行動,這樣的相關策略組合才能成為相關均衡。

相關均衡通過引入與偏好無關的不確定(同樣可以錶示為狀態空間和參與人的類型,但這個狀態空間中的狀態與參與人的支付/效用無關,而僅僅是協調機製)來實現對結果的協調,並把所有需要的相關性和隨機性交給這個協調/信號生成機製,從而參與人在觀察到信號之後,仍然可以各自獨立地行動,並僅使用純策略,但依然能實現相關性和隨機性。

Aumann (1987)給出的相關均衡定義如下(可以與後文貝葉斯相關均衡相比較):

  1. ρ(s)0,sS\rho(s)\geq 0,\forall s\in S
  2. sSρ(s)=1\sum_{s\in S}\rho(s)=1
  3. siSiρ(s)[ui(si,si)ui(si,si)]0,i,si,siSi\sum_{s_{-i}\in S_{-i}}\rho(s)[u_{i}(s_{i},s_{-i})-u_{i}(s^{\prime}_{i},s_{-i})]\geq 0,\forall i,s_{i},s^{\prime}_{i}\in S_{i}

第三條就是Obedience約束,這錶明CCΠ\Pi中的元素根據Obedience約束挑選出來的。

納什均衡就是CIC\cap I中的元素,即那些可以由各參與人彼此獨立的策略選擇所引緻的相關均衡就是納什均衡。

一般來說,所有可能的支付嚮量(無論是否構成均衡)集的凸包是最大的;其次是滿足個人理性的支付嚮量(下界是由這樣一個支付嚮量組成:其中每個分量都是相應參與人支付的最小最大化點),其中每一點可以在無窮期重複博弈框架下由無名氏定理實現;納什均衡的支付嚮量集是最小的,代錶所有能觀察到的支付結果(意即均衡結果);納什均衡的支付嚮量的凸包都可以被某個相關均衡實現,並且,某些情況下相關均衡支付嚮量集的凸包比納什均衡的支付嚮量集的凸包更大,即相關均衡可以實現用納什均衡無法實現的帕纍托改進,同時相關均衡支付嚮量集的凸包還是要小於所有滿足個人理性的支付嚮量集的凸包。


實際上,納什均衡都是相關均衡的邊界點:納什均衡或者是相關均衡的極點(但相關均衡可以有其他不是納什均衡的極點),或者是其一個暴露麵(exposed face,可以理解為邊界線、邊界麵或更高維的邊界)。如果CCΠ\Pi的維度低,那麼CC的每個點都是其邊界點(從而納什均衡當然也是CC的邊界點),此時,當額外一些條件滿足的時候,納什均衡也可以是CC(相對於其仿射包的)相對內點。見 Nau et al.(2003)。


當然,作為由頂點(jj的純策略)張成的單純形(jj的混合策略),它也可以是iji\neq jjj行為的估計(conjecture);在這種解讀下,參與人jj的混合策略意涵的是其他參與人對jj會採取何種策略的不確定性,盡管jj本身採取的是純策略,但其他人對jj的不確定性使jj看起來在採取混合策略。盡管這隻是混合策略的衆多解讀方式之一,不過其能更好地與相關策略相對應。在相關策略裏,不確定性存在於外部觀察者或信息設計者所推薦行為的産生方式,但具體産生的推薦以及參與人所採取的策略依然是純策略。即:推薦者通過隨機機製,具體地建議參與人該採取何種純策略。同樣地,在這種解讀下,當我們說ii的策略是對jj策略的最優反應時,其實指的是ii的策略是對ii自己所主觀認為的jj會採取何種策略(即conjecture)的最優反應;若彼此互為最優反應,且主觀的conjecture與對方客觀採取的策略相一緻時,則實現了均衡。(但如果有多於兩個參與人,則某個參與人對於其他人策略的conjecture同樣涉及correlate與否的問題:在某一個人的估計中,其他人的策略之間是否可以達成協調,比如依賴於一個除了作出估計的人以外其他人可以觀測到的信號)。參與人的貝葉斯理性體現在:形成對於其他參與人將會採取策略的估計,並根據估計選擇期望效用最大化的策略。


當考慮展開型博弈(Extensive Form)時,前述區別會相應地發生變化。例如,展開型博弈中的混合策略的形式其實與策略型博弈中相關策略相近;而展開型博弈中的行為策略與策略型博弈中混合策略的形式類似,隻不過相應地,在此處代錶跨人際的笛卡爾乘積變成了同一個人跨信息集的笛卡爾乘積。但此處不再詳述。


當納入類型集/狀態集後,可以相應地定義貝葉斯相關均衡,後麵會詳述。

模型

策略型博弈。參與人集合N={1,...,N}N=\{1,...,N\},每個參與人iIi\in I具有有限行動空間AiA_{i},行動組合為A=A1×...×ANA=A_{1}\times ...\times A_{N}。有限狀態集Θ\Theta,元素為θ\theta。每個參與人具有效用函數ui:A×ΘRu_{i}:A\times\Theta\rightarrow\mathbb{R}。信息設計者效用函數為V:A×ΘRV:A\times\Theta\rightarrow\mathbb{R}。信息設計者既可以使NN個參與人之一,也可以是作為中央計畫者的外部者。信息設計者和參與人具有共同的先驗信念ϕint(Δ(Θ))\phi\in\text{int}(\Delta(\Theta)),並且這一點是共同知識。於是,基本博弈結構為G=((Ai,ui)i=1N,ϕ)G=((A_{i},u_{i})_{i=1}^{N},\phi)

信息結構為S=((Ti)i=1N,π)S=((T_{i})_{i=1}^{N},\pi),其中TiT_{i}是信息設計者嚮參與人ii發送的潛在可能信號集,每個可能信號集都是有限集;π:ΘΔ(T)\pi:\Theta\rightarrow\Delta(T)為條件信號分佈,其中T=T1×...×TNT=T_{1}\times ...\times T_{N},其元素為t=(t1,...,tN)t=(t_{1},...,t_{N}),其中tiTit_{i}\in T_{i}

結合在一起(G,S)(G,S)定義了一個不完全信息博弈。參與人ii的策略為βi:TiΔ(Ai)\beta_{i}:T_{i}\rightarrow\Delta(A_{i})

給定基本博弈GG,信息設計者公開宣佈並承諾一個信息結構SS,這一點隨之成為共同知識。當狀態根據先驗機率ϕ\phi生成後,經過條件信號分佈π\pi轉換為一係列私人的信號實現,並分別單獨揭露給各個參與人。但這隻是一般情形,如果信息結構SS的設計恰好使得Ti=TT_{i}=T^{\prime}並且經過π\pi轉換稱相同的信號,那麼單獨揭露的完全可以是相同的信號實現,同時由於信息結構是事先承諾的,因此雖然單獨揭露但事實上生成的相同信號也成為了共同知識。在觀察到信號實現tit_{i}後,參與人ii根據先驗信念、信息結構來形成關於狀態和其他參與人的後驗信念,並採取行動βi(ti)Δ(Ai)\beta_{i}(\cdot|t_{i})\in\Delta(A_{i})來最大化個人的期望效用。在各個人最優行動的情況下,引緻了一個以狀態為條件的、關於行動組合的條件分佈,這個條件分佈就是貝葉斯納什均衡。

定義1. 貝葉斯納什均衡

給定博弈(G,S)(G,S),如果對於任何參與人ii、可能的信號實現tiTit_{i}\in T_{i}以及滿足βi(aiti)>0\beta_{i}(a_{i}|t_{i})>0aiAia_{i}\in A_{i}來說,某策略組合β\beta滿足

ai,ti,θϕ(θ)π(ti,tiθ)(jiβj(ajtj))ui((ai,ai),θ)ai,ti,θϕ(θ)π(ti,tiθ)(jiβj(ajtj))ui((ai,ai),θ)aiAi\begin{align}\sum_{a_{-i},t_{-i},\theta}\phi(\theta)\pi(t_{i},t_{-i}|\theta)(\prod_{j\neq i}\beta_{j}(a_{j}|t_{j}))u_{i}((a_{i},a_{-i}),\theta)\\ \geq\sum_{a_{-i},t_{-i},\theta}\phi(\theta)\pi(t_{i},t_{-i}|\theta)(\prod_{j\neq i}\beta_{j}(a_{j}|t_{j}))u_{i}((a^{\prime}_{i},a_{-i}),\theta)\\ \forall a^{\prime}_{i}\in A_{i} \end{align}

則分佈v:ΘΔ(A)v:\Theta\rightarrow\Delta(A)

v(aθ)=tTπ(tθ)(j=1Nβj(ajtj))v(a|\theta)=\sum_{t\in T}\pi(t|\theta)(\prod_{j=1}^{N}\beta_{j}(a_{j}|t_{j}))

(G,S)(G,S)的一個貝葉斯納什均衡引緻的在參與人行為組合上的一個分佈。記為BNE(G,S)=v\text{BNE}(G,S)={v}

其中ui((ai,ai),θ)u_{i}((a_{i},a_{-i}),\theta)錶明參與人實現的效用既依賴於所有參與人的行動,也依賴於世界狀態;βj(ajtj)\beta_{j}(a_{j}|t_{j})是當參與人jj接收到了tjt_{j}這個信號之後,採取行動aja_{j}的機率,而(jiβj(ajtj))(\prod_{j\neq i}\beta_{j}(a_{j}|t_{j}))意味著行為人之間的策略選擇是獨立的、因此可以做乘積。π(ti,tiθ)\pi(t_{i},t_{-i}|\theta)是當真實狀態為θ\thetaπ\pi這個信息結構分別給ii和所有jij\neq i發出tit_{i}ti=jitjt_{-i}=\prod_{j\neq i}t_{j}信號的機率;ϕ(θ)\phi(\theta)是真實狀態為θ\theta的先驗信念。

每個信息結構SS都能引緻一個貝葉斯納什均衡的集合BNE(G,S)\text{BNE}(G,S),信息設計者在多種信息結構之間選擇,選擇標準是其引緻的貝葉斯納什均衡在事前最大化信息設計者的期望效用。這一問題可以分成如下步驟來處理:先刻畫可能的貝葉斯納什均衡集SBNE(G,S)\cup_{S}\text{BNE}(G,S),稱之為約束集;再通過選擇最優的行為-類型分佈vv^{\star}來實現信息設計者的事前期望效用;最後尋找到能引緻這一分佈vv^{\star}的信息結構SS^{\star},以使得vv^{\star}是博弈(G,S)(G,S^{\star})下的貝葉斯納什均衡。這就引出了如下這個刻畫貝葉斯納什均衡的方法。

定義2. 貝葉斯相關均衡

一個分佈v:ΘΔ(A)v:\Theta\rightarrow\Delta(A),如果對於任何參與人iiaiAia_{i}\in A_{i},如果滿足下式,則是一個貝葉斯相關均衡。

ai,θϕ(θ)v(ai,aiθ)ui((ai,ai),θ)ai,θϕ(θ)v(ai,aiθ)ui((ai,ai),θ)aiAi\begin{align}\sum_{a_{-i},\theta}\phi(\theta)v(a_{i},a_{-i}|\theta)u_{i}((a_{i},a_{-i}),\theta)\\ \geq\sum_{a_{-i},\theta}\phi(\theta)v(a_{i},a_{-i}|\theta)u_{i}((a^{\prime}_{i},a_{-i}),\theta)\\ \forall a^{\prime}_{i}\in A_{i} \end{align}

記為BCE(G)\text{BCE}(G)

前麵不等式就是開頭預備知識中提到的Obedience約束,即使得參與人願意遵照建議來行動。由於相關策略組合是直接在各參與人的行動組合上直接指定機率,因此與BNE(G,S)\text{BNE}(G,S)相比,隻需要v(ai,aiθ)v(a_{i},a_{-i}|\theta)一項而非各參與人彼此獨立的策略相乘。同時,均衡隻要求冇有參與人願意單方麵偏離,所以在比較iiaia_{i}(接收到的建議)和aia^{\prime}_{i}之間的選擇時,給定其他人按照建議aia_{-i}行動。

在完備信息情形中,參與人對於效用相關的參數冇有什麼不確定性(如果參與人有任何不確定性那也是來源於對其他參與人會採取什麼行為是不確定的),如果策略組合給定了,那麼效用也給定了,即世界狀態隻有一種。如果引入狀態空間的概念從而引入不確定,也僅僅是為了協調,狀態空間中狀態與參與人的支付/效用無關,因此不能被稱為世界狀態。而在不完備信息情形中,對於給定的策略組合來說,在不同的世界狀態下參與人以及設計者所能得到的效用是不同的,效用除了依賴於策略組合,還依賴於世界狀態。這是貝葉斯相關均衡與相關均衡的區別。

命題1

BCE(G)=SBNE(G,S)\text{BCE}(G)=\cup_{S}\text{BNE}(G,S)

證明:

(1) BCE(G)SBNE(G,S)\text{BCE}(G)\subset\cup_{S}\text{BNE}(G,S)

任取vBCE(G)v\in\text{BCE}(G),根據BCE的定義,有對於任何參與人iiaiAia_{i}\in A_{i},如果滿足下式,則是一個貝葉斯相關均衡。

ϕ(θ)v(ai,aiθ)ui((ai,ai),θ)ϕ(θ)v(ai,aiθ)ui((ai,ai),θ)aiAi\begin{align}\phi(\theta)v(a_{i},a_{-i}|\theta)u_{i}((a_{i},a_{-i}),\theta)\\ \geq\phi(\theta)v(a_{i},a_{-i}|\theta)u_{i}((a^{\prime}_{i},a_{-i}),\theta)\\ \forall a^{\prime}_{i}\in A_{i} \end{align}

那麼便可以構造信息結構S=(A,π)S^{\star}=(A,\pi^{\star})為對於任何aAa\in AθΘ\theta\in\Theta

π(aθ)=v(aθ)\pi^{\star}(a|\theta)=v(a|\theta)

(這一步就是構造一個直接信息結構,並且使得這個信息結構中的條件機率等於我們所需要的相關性。)

並構造參與人ii的策略βi\beta^{\star}_{i}為對於任何ai,aiAia_{i},a^{\prime}_{i}\in A_{i}

βi(aiai)={1,ifai=ai0,ifaiai\beta^{\star}_{i}(a^{\prime}_{i}|a_{i})= \begin{cases} 1, \text{if}a_{i}=a^{\prime}_{i}\\ 0, \text{if}a_{i}\neq a^{\prime}_{i} \end{cases}

(由於行動建議是確定的,盡管行動建議的生成過程是隨機的,這樣各個參與人的策略不是0就是1,因此對於那些我們要引緻的1來說,將其連乘並與信息結構中的條件機率相乘,就使得在相關的建議生成機製下各個參與人相互獨立地採取策略的結果完全模仿了貝葉斯相關均衡的分佈。)

那麼,給定其他人遵照βi\beta^{\star}_{-i},當參與人ii觀察到信號aia^{\prime}_{i}而採取行動aia_{i}時,其期望效用為

ai,ai,θϕ(θ)π(ai,aiθ)(jiβj(ajaj))ui((ai,ai),θ)=ai,θϕ(θ)v(ai,aiθ)ui((ai,ai),θ)\begin{align} \sum_{a_{-i},a^{\prime}_{-i},\theta}\phi(\theta)\pi^{\star}(a_{i},a^{\prime}_{-i}|\theta)(\prod_{j\neq i}\beta^{\star}_{j}(a_{j}|a^{\prime}_{j}))u_{i}((a^{\prime}_{i},a_{-i}),\theta)\\ =\sum_{a_{-i},\theta}\phi(\theta)v(a_{i},a_{-i}|\theta)u_{i}((a^{\prime}_{i},a_{-i}),\theta) \end{align}

根據BCE的約束條件

ϕ(θ)v(ai,aiθ)ui((ai,ai),θ)ϕ(θ)v(ai,aiθ)ui((ai,ai),θ)aiAi\begin{align}\phi(\theta)v(a_{i},a_{-i}|\theta)u_{i}((a_{i},a_{-i}),\theta)\\ \geq\phi(\theta)v(a_{i},a_{-i}|\theta)u_{i}((a^{\prime}_{i},a_{-i}),\theta)\\ \forall a^{\prime}_{i}\in A_{i} \end{align}

和上式,可知BNE的約束條件得到滿足

ai,ai,θϕ(θ)π(ai,aiθ)(jiβj(ajaj))ui((ai,ai),θ)ai,ai,θϕ(θ)π(ai,aiθ)(jiβj(ajaj))ui((ai,ai),θ)\begin{align} \sum_{a_{-i},a^{\prime}_{-i},\theta}\phi(\theta)\pi^{\star}(a_{i},a^{\prime}_{-i}|\theta)(\prod_{j\neq i}\beta^{\star}_{j}(a_{j}|a^{\prime}_{j}))u_{i}((a_{i},a_{-i}),\theta)\\ \sum_{a_{-i},a^{\prime}_{-i},\theta}\phi(\theta)\pi^{\star}(a_{i},a^{\prime}_{-i}|\theta)(\prod_{j\neq i}\beta^{\star}_{j}(a_{j}|a^{\prime}_{j}))u_{i}((a^{\prime}_{i},a_{-i}),\theta) \end{align}

因此,由前述定義的β\beta^{\star}所引緻的分佈

aAπ(aθ)(j=1Nβj(ajaj))=v(aθ)\sum_{a^{\prime}\in A}\pi^{\star}(a^{\prime}|\theta)(\prod_{j=1}^{N}\beta_{j}(a_{j}|a^{\prime}_{j}))=v(a|\theta)

就是(G,S)(G,S^{\star})的一個BNE。即vBNE(G,S)v\in\text{BNE}(G,S^{\star})

(2) SBNE(G,S)BCE(G)\cup_{S}\text{BNE}(G,S^{\star})\subset\text{BCE}(G)

任選v~SBNE(G,S)\tilde{v}\in\cup_{S}\text{BNE}(G,S),則存在某個S~=(T~,π~)\tilde{S}=(\tilde{T},\tilde{\pi})β\beta使得

v~(aθ)=t~T~π~(t~θ)(j=1Nβj(ajt~j))\tilde{v}(a|\theta)=\sum_{\tilde{t}\in\tilde{T}}\tilde{\pi}(\tilde{t}|\theta)(\prod_{j=1}^{N}\beta_{j}(a_{j}|\tilde{t}_{j}))

(在貝葉斯納什均衡中,可以採用任何的信息結構。但是我們可以通過合並操作,來使得直接建議能夠模仿任何的信息結構。即,將任意的某個信息結構的潛在信號可能集中的元素,按照其所引緻的參與人的行動來分類;對於某個所引緻的行動,將能夠引緻它的各種信號的機率加總,作為建議這個行動的機率。例如,如果參與人的行為是“不打傘”或“打傘”,而某個信息結構是一組“晴天”、“多雲”、“下雨”及其各自的機率,那麼打包組合而成的新信息結構就是把“晴天”和“多雲”打包成“不打傘”,把“下雨”變成“打傘”,並且把推薦“不打傘”的條件機率作為原先的信息結構中“晴天”和“多雲”的條件機率之和,把推薦“打傘”的條件機率作為原先的信息結構中“下雨”的條件機率。由於我們是按照所引緻的行為來打包,並且對於任一行為來說,引緻它的機率都冇有改變,所以這兩種信息結構從行為、結果或彼此的效用來說都冇有改變。)

對於任何使得βi(ait~i)>0\beta_{i}(a_{i}|\tilde{t}_{i})>0aia_{i}來說,根據BNE的定義,對於任何iT,t~iT~ji\in T,\tilde{t}_{i}\in\tilde{T}_{j}aia^{\prime}_{i}
\in A_{i}來說,都有

ai,t~i,θϕ(θ)π~(t~i,t~iθ)(jiβj(ajt~j))ui((ai,ai),θ)ai,t~i,θϕ(θ)π~(t~i,t~iθ)(jiβj(ajt~j))ui((ai,ai),θ)\begin{align} \sum_{a_{-i},\tilde{t}^{\prime}_{-i},\theta}\phi(\theta)\tilde{\pi^{\star}}(\tilde{t}_{i},\tilde{t}^{\prime}_{-i}|\theta)(\prod_{j\neq i}\beta^{\star}_{j}(a_{j}|\tilde{t}^{\prime}_{j}))u_{i}((a_{i},a_{-i}),\theta)\\ \sum_{a_{-i},\tilde{t}^{\prime}_{-i},\theta}\phi(\theta)\tilde{\pi^{\star}}(\tilde{t}_{i},\tilde{t}^{\prime}_{-i}|\theta)(\prod_{j\neq i}\beta^{\star}_{j}(a_{j}|\tilde{t}^{\prime}_{j}))u_{i}((a^{\prime}_{i},a_{-i}),\theta) \end{align}

但將等式兩邊同乘βi(ait~i)\beta_{i}(a_{i}|\tilde{t}_{i})並對t~i\tilde{t}_{i}進行加總,由

ai,t~,θϕ(θ)π~(t~i,t~iθ)(jiβj(ajt~j))ui((ai,ai),θ)ai,t~,θϕ(θ)π~(t~i,t~iθ)(jiβj(ajt~j))ui((ai,ai),θ)\begin{align} \sum_{a_{-i},\tilde{t},\theta}\phi(\theta)\tilde{\pi^{\star}}(\tilde{t}_{i},\tilde{t}^{\prime}_{-i}|\theta)(\prod_{j\neq i}\beta^{\star}_{j}(a_{j}|\tilde{t}^{\prime}_{j}))u_{i}((a_{i},a_{-i}),\theta)\\ \sum_{a_{-i},\tilde{t},\theta}\phi(\theta)\tilde{\pi^{\star}}(\tilde{t}_{i},\tilde{t}^{\prime}_{-i}|\theta)(\prod_{j\neq i}\beta^{\star}_{j}(a_{j}|\tilde{t}^{\prime}_{j}))u_{i}((a^{\prime}_{i},a_{-i}),\theta) \end{align}

代入

v~(aθ)=t~T~π~(t~θ)(j=1Nβj(ajt~j))\tilde{v}(a|\theta)=\sum_{\tilde{t}\in\tilde{T}}\tilde{\pi}(\tilde{t}|\theta)(\prod_{j=1}^{N}\beta_{j}(a_{j}|\tilde{t}_{j}))

ϕ(θ)v~(ai,aiθ)ui((ai,ai),θ)ϕ(θ)v~(ai,aiθ)ui((ai,ai),θ)aiAi\begin{align}\phi(\theta)\tilde{v}(a_{i},a_{-i}|\theta)u_{i}((a_{i},a_{-i}),\theta)\\ \geq\phi(\theta)\tilde{v}(a_{i},a_{-i}|\theta)u_{i}((a^{\prime}_{i},a_{-i}),\theta)\\ \forall a^{\prime}_{i}\in A_{i} \end{align}

v~BCE(G)\tilde{v}\in\text{BCE}(G)

由此可知,信息設計者跨信息結構(有無窮多個)的優化問題,與在貝葉斯相關均衡中選擇使自己期望效用最大化的問題,是等價的。即,不論採取何種信息結構,所能實現的貝葉斯納什均衡,都可以被某個貝葉斯相關均衡實現。這樣,就無需做跨信息結構的優化,而隻需要在貝葉斯相關均衡中找到那個使得信息設計者事前期望效用最大化的分佈vv^{\star},再從中還原出特定的信息結構SS^{\star}就好了。

但通過開頭給出的混合策略組合與相關策略組合的區別,我們知道混合策略組合隻是相關策略組合一個更低維度的子集:參與人策略之間的某些相關性可被相關策略組合實現,但無法被“各自獨立的混合策略”之組合實現。因此,為了使相關策略組合與跨信息結構的混合策略組合相等同,我們需要一個將相關策略組合中的相關性引入混合策略組合集的方法:這就要通過信息結構,使得信號實現及其與真實狀態之間的關係被引入參與人的策略中去。通過選擇合適的信息結構,可以使得參與人獲取關於世界狀態和其他參與人的信息,從而引緻所需要的、參與人的均衡行為之間的相關性。在證明中,我們構造的π\pi就實現了這種相關性,從而使得在這種信息結構下,各參與人相獨立的策略選擇能夠實現在所要實施的相關均衡中所要求的相關性。

引理1

BCE(G)\text{BCE}(G)Δ(A)Θ\Delta(A)^{\Theta}中的一個非空凸多胞形。

證明:由於BCE(G)\text{BCE}(G)是一些分佈的集合,這些分佈v:ΘΔ(A)v:\Theta\rightarrow\Delta(A)滿足

  1. v(aθ)0,aA,θΘv(a|\theta)\geq 0,\forall a\in A,\theta\in\Theta,
  2. aAv(aθ)=1,θΘ\sum_{a\in A}v(a|\theta)=1,\forall\theta\in\Theta,
  3. ai,θϕ(θ)v((ai,ai)θ)ui((ai,ai),θ)ai,θϕ(θ)v((ai,ai)θ)ui((ai,ai),θ),iI,aiAi\sum_{a_{-i},\theta}\phi(\theta)v((a_{i},a_{-i})|\theta)u_{i}((a_{i},a_{-i}),\theta)\geq\sum_{a_{-i},\theta}\phi(\theta)v((a^{\prime}_{i},a_{-i})|\theta)u_{i}((a_{i},a_{-i}),\theta),\forall i\in I,a_{i}\in A_{i}aiAia^{\prime}_{i}\in A_{i}

其中條件1和2使得vv確實是一個機率分佈,而條件3即BCE的激勵相同約束。

前兩個條件定義了一個Δ(A)Θ\Delta(A)^{\Theta}中的一個單純形,這個單純形中的點都可以作為貝葉斯相關策略組合,但尚不足以作為貝葉斯相關均衡。這些貝葉斯相關策略組合可以視為,在各參與人行為組合上指定任意的聯合分佈。

條件3錶明,按建議行動帶來的期望效用不會比其他行動低。

這三個條件是 Aumann (1987) 相關均衡定義的推廣,加入了世界狀態的元素。具體地,在完備信息情況下,參與人對收益是確定的,而隻對其他人的策略是不確定的,因此收益相關的參數是平凡的,世界狀態根據定義是單點集;參與人類型是對協調者會如何建議的刻畫。而在不完備信息情況下,在不同的世界狀態下參與人的收益是不同的,因此世界狀態是多點集,協調者/信息設計者的建議取決於世界狀態(根據我們對信息結構的設定)。

所有約束對於vv都是線性的,根據Stinchcombe (2011),BCE(G)非空。而線性約束的可行集若有界便為凸多胞形。

並且由於BCE(G)是Δ(A)Θ\Delta(A)^{\Theta}的閉子集,因此BCE(G)是緊集。有界的凸多胞形可以錶示為有限個極點的凸包,這樣生成的凸包天然是緊凸集。

從而,從無窮多種信息結構裏跨信息結構的最優化,可以利用BCE(G)及其為非空凸多胞形的性質,通過求解線性規劃問題解決,由於命題1,這不會漏解。


關於多胞形一詞,我不太確定使用得是否正確。其原文為polytope。但關於其定義,以及與polyhedron之間的關係,本身就定義繁多並且並不彼此等價。我對這個詞的理解和使用是這樣的:有限多個半空間的交集,稱為polyhedron;如果這個polyhedron還是有界的,那麼便稱為polytope(即我使用的“多胞形”一詞)。

從而,按這種定義方式,才有“線性約束的可行集若有界便為凸多胞形”這一說法。如果按不同的術語,例如並不把有界的條件加在多胞形的定義上,而隻是將多胞形定義為有限多個半空間的交集的話,那麼這句話應為“線性約束的可行集是凸多胞形”。

而當我使用單純形(simplex)一詞時,多指“單位單純形”,即可以用來作為機率分佈集和凸組合係數集的單純形。而單純形就是最簡單(simplest)的polytope之意。


設計者的目標函數

maxvSBNE(G,S)Ev[V]=maxvSBNE(G,S)a,θV(a,θ)v(aθ)ϕ(θ)\max_{v\in\cup_{S}\text{BNE}(G,S)}\mathbb{E}_{v}[V]=\max_{v\in\cup_{S}\text{BNE}(G,S)}\sum_{a,\theta}V(a,\theta)v(a|\theta)\phi(\theta)

定義3. 給定基本博弈GG,如果信息結構S=(T,π)S=(T,\pi)滿足Ti=Ai,iIT_{i}=A_{i},\forall i\in I,則稱這個信息結構是直接的(即行動建議式的)。

命題2

給定基本博弈GG,任給一個vSBNE(G,S)v\in\cup_{S}\text{BNE}(G,S),都存在一個直接信息結構Sv=(A,v)S_{v}=(A,v)使得vBNE(G,Sv)v\in\text{BNE}(G,S_{v})

證明:給定任一基本博弈GG和分佈vSBNE(G,S)v\in\cup_{S}\text{BNE}(G,S),根據命題1我們知道vBCE(G)v\in\text{BCE}(G),從而對於任何參與人iiai,aiAia_{i},a^{\prime}_{i}\in A_{i}都有

ϕ(θ)v(ai,aiθ)ui((ai,ai),θ)ϕ(θ)v(ai,aiθ)ui((ai,ai),θ)aiAi\begin{align}\phi(\theta)v(a_{i},a_{-i}|\theta)u_{i}((a_{i},a_{-i}),\theta)\\ \geq\phi(\theta)v(a_{i},a_{-i}|\theta)u_{i}((a^{\prime}_{i},a_{-i}),\theta)\\ \forall a^{\prime}_{i}\in A_{i} \end{align}

則考慮信息結構Sv=(A,πv)S_{v}=(A,\pi_{v}),其中πv(aθ)=v(aθ)\pi_{v}(a|\theta)=v(a|\theta)對於任何aAa\in AθΘ\theta\in\Theta。在博弈(G,S)(G,S)中,考慮如下策略

βi(aiai)={1,ifai=ai0,ifaiai\beta_{i}(a^{\prime}_{i}|a_{i})= \begin{cases} 1, \text{if}a_{i}=a^{\prime}_{i}\\ 0, \text{if}a_{i}\neq a^{\prime}_{i} \end{cases}

對於任何ai,aiAia_{i},a^{\prime}_{i}\in A_{i},給定其他人遵照βi\beta_{-i},當參與人ii觀察到信號aia^{\prime}_{i}而採取行動aia_{i}時,其期望效用為

ai,ai,θϕ(θ)πv(ai,aiθ)(jiβj(ajaj))ui((ai,ai),θ)=ai,θϕ(θ)πv(ai,aiθ)ui((ai,ai),θ)=ai,θϕ(θ)v(ai,aiθ)ui((ai,ai),θ)\begin{align} \sum_{a_{-i},a^{\prime}_{-i},\theta}\phi(\theta)\pi_{v}(a_{i},a^{\prime}_{-i}|\theta)(\prod_{j\neq i}\beta_{j}(a_{j}|a^{\prime}_{j}))u_{i}((a^{\prime}_{i},a_{-i}),\theta)\\ =\sum_{a_{-i},\theta}\phi(\theta)\pi_{v}(a_{i},a_{-i}|\theta)u_{i}((a^{\prime}_{i},a_{-i}),\theta)\\ =\sum_{a_{-i},\theta}\phi(\theta)v(a_{i},a_{-i}|\theta)u_{i}((a^{\prime}_{i},a_{-i}),\theta) \end{align}

將上式結合BCE的約束條件

ϕ(θ)v(ai,aiθ)ui((ai,ai),θ)ϕ(θ)v(ai,aiθ)ui((ai,ai),θ)aiAi\begin{align}\phi(\theta)v(a_{i},a_{-i}|\theta)u_{i}((a_{i},a_{-i}),\theta)\\ \geq\phi(\theta)v(a_{i},a_{-i}|\theta)u_{i}((a^{\prime}_{i},a_{-i}),\theta)\\ \forall a^{\prime}_{i}\in A_{i} \end{align}

可以得到對於每個參與人ii

ai,ti,θϕ(θ)πv(ti,tiθ)(jiβj(ajtj))ui((ai,ai),θ)ai,ti,θϕ(θ)πv(ti,tiθ)(jiβj(ajtj))ui((ai,ai),θ)aiAi\begin{align}\sum_{a_{-i},t_{-i},\theta}\phi(\theta)\pi_{v}(t_{i},t_{-i}|\theta)(\prod_{j\neq i}\beta_{j}(a_{j}|t_{j}))u_{i}((a_{i},a_{-i}),\theta)\\ \geq\sum_{a_{-i},t_{-i},\theta}\phi(\theta)\pi_{v}(t_{i},t_{-i}|\theta)(\prod_{j\neq i}\beta_{j}(a_{j}|t_{j}))u_{i}((a^{\prime}_{i},a_{-i}),\theta)\\ \forall a^{\prime}_{i}\in A_{i} \end{align}

而這正是使得β\beta成為(G,Sv)(G,S_{v})的BNE的約束條件,並且此時

aAπv(aθ)(i=1Nβi(aiai))=πv(aθ)=v(aθ)\sum_{a^{\prime}\in A}\pi_{v}(a^{\prime}|\theta)(\prod_{i=1}^{N}\beta_{i}(a_{i}|a^{\prime}_{i}))=\pi_{v}(a|\theta)=v(a|\theta)

對於每個aAa\in AθΘ\theta\in\Theta都成立,因此vBNE(G,Sv)v\in\text{BNE}(G,S_{v})

推論. 最優信息結構為S=(A,π)S^{\star}=(A,\pi^{\star}),其中π(aθ)=v(aθ)\pi^{\star}(a|\theta)=v^{\star}(a|\theta),而vargmaxvBCE(G)Ev[V]v^{\star}\in\text{arg}\max_{v\in\text{BCE}(G)}\mathbb{E}_{v}[V]

應用:對稱二元環境

暫略