Yu (2019)

Political Science Research and Methods

基本設定

參與人:在位者 ®、內部人 (A)、挑戰者 ©。

在位者隻在乎能否繼續在位,其效用分別為{0,1}\{0,1\},而這取決於有多少人支援她。當內部人和挑戰者都支援她時,她確定地繼續在位;當隻有內部人支援她時,她以一定的機率繼續在位;當冇有人支援她時,她確定地不會繼續在位。

在位者的能力有兩種狀態θ{0,1}\theta\in\{0,1\},內部人和挑戰者對於在位者的能力μ0(θ=1)\mu_{0}(\theta=1)有相同的先驗信念。
內部人和挑戰者在乎在位者是否有能力,但內部人和挑戰者對政策也有相異的偏好。錶示為Eui(a,θ)=(xzi)2+μ,i{A,C}\mathbb {E}u_{i}(a,\theta)=-(x-z_{i})^{2}+\mu,i\in\{A,C\},其中zi{zA,zC}z_{i}\in\{z_{A},z_{C}\}分別為內部人和挑戰者最偏好的政策,假定在位者預設選擇的政策是x=zAx=z_{A}。令d=zAzCd=z_{A}-z_{C},則dd錶示這兩個團體的政策目標沖突程度。

在位者可以採取文宣的形式來影響內部人和挑戰者對其能力的判斷,內部人和挑戰者根據觀察到的文宣(信號實現)進行貝葉斯更新,並依據後σi{0,1},i=A,C\sigma_{i}\in\{0,1\},i=A,C,其策略為信息結構(S,q)(S,q)其中q(θ)θΘq(\cdot|\theta)_{\theta\in\Theta}

當內部人不支援在位者(σA=0\sigma_{A}=0)時,他從內部人中選出一位候選人並採取與在位者相同的政策zAz_{A},但候選人可能與在位者有不同的能力。候選人為有能力者的機率為12\frac{1}{2}

假定當內部人支援在位者時,挑戰者的不支援決定有1ρ1-\rho的機率可以將新在位者更換為挑戰者提名的候選人[^2],因此ρ\rho刻畫了內部人的支援對現任在位者留任的貢獻,而1ρ1-\rho刻畫了挑戰者的政治勢力;但當內部人也不支援在位者時,挑戰者的不支援決定有1(1e)ρ1-(1-e)\rho的機率可以將新在位者更換為挑戰者提名的候選人(但由於此時內部人也不支援在位者,當前在位者肯定無法留任,有(1e)ρ(1-e)\rho的機率是內部人提名的候選人成為了新在位者)。ee刻畫了內部人對現任在位者的依賴程度(因為在給定挑戰者不支援的情況下,內部人的不支援決定,隻有(1e)ρ(1-e)\rho的機率可以將自己陣營裏的人變成新在位者,所以他的不支援決定要承受萬一是挑戰者挑戰成功時政策變為zCz_{C}的政策損失風險,當e越大時,這個風險越高,隻有他對在位者能力的後驗信念非常低時他才願意冒這一風險)。

[^2]並採取政策zCz_{C},同樣地,挑戰者陣營候選人有能力的機率為12\frac{1}{2}

Timing

  • 在位者承諾一個文宣策略(信息結構);
  • 世界狀態(在位者是否有能力)由自然根據先驗機率揭曉;
  • 真實狀態通過文宣策略轉換為信號實現,內部人根據信號實現進行信念更新,並決定是否支援在位者;
  • 挑戰者根據信號實現和內部人的行為進行信念更新,並決定是否支援在位者;
  • 效用實現。

分析

採用PBE解概念。
為保證有意義,假定μ0(θ=1)\mu_{0}(\theta=1)使得內部人和挑戰者不支援在位者[^3],因此在位者必須進行文宣才能說服其他人支援她。

從內部人與挑戰者的效用函數可以看到,在位者與內部人之間冇有政策沖突,內部人隻在乎在位者的能力;但挑戰者既有政策沖突d=zAzCd=z_{A}-z_{C},又在乎在位者的能力。由於在位者的文宣隻起到了提高大家對其能力的判斷這一作用,那麼當在位者能說服與之有政策沖突的挑戰者支援她的時候,必然同時也能說服內部人支援她。

[^3]這要求μ0<ed2+12\mu_{0}<-ed^{2}+\frac{1}{2}

引理一

挑戰者的均衡策略如下

σC={0,σA=0;σA=1μs<μC1,σA=1μsμC\sigma_{C}= \begin{cases} 0, \text{當}\sigma_{A}=0;\text{或}\sigma_{A}=1\text{且}\mu_{s}<\mu_{C}\\ 1, \text{當}\sigma_{A}=1\text{且}\mu_{s}\geq\mu_{C} \end{cases}

其中μC\mu_{C}為挑戰者信念的cutoffμC=d2+12\mu_{C}=d^{2}+\frac{1}{2}

即當內部人不支援在位者,或雖然內部人支援在位者,但挑戰者認為在位者能力不足時,挑戰者選擇不支援在位者;
當內部人支援在位,並且挑戰者認為在位者能力足夠強時,挑戰者選擇支援在位者。


當接收到在位者的文宣後,挑戰者對於在位者能力的後驗信念為μs\mu_{s},這比他陣營裏的候選人有能力的機率高μs12\mu_{s}-\frac{1}{2},因此,給定挑戰者的政治勢力1ρ1-\rho和內部人的影響能力ee,隻有當挑戰者更換在位者所帶來的政策理念收益d=zAzCd=z_{A}-z_{C}足夠大,才會覺得損失μs12\mu_{s}-\frac{1}{2}的能力收益是值得的。這意味著μC\mu_{C}應使得d2=μC12d^{2}=\mu_{C}-\frac{1}{2}μC=d2+12\mu_{C}=d^{2}+\frac{1}{2}


引理二

內部人的均衡策略如下

σC={0,μs<μA1,μsμA\sigma_{C}= \begin{cases} 0, \text{當}\mu_{s}<\mu_{A}\\ 1, \text{當}\mu_{s}\geq\mu_{A} \end{cases}

其中μA\mu_{A}為內部人信念的cutoffμA=ed2+12\mu_{A}=-ed^{2}+\frac{1}{2}

即內部人隻在乎在位者的能力是否足夠(至於政策部分,在位者採取的預設政策zAz_{A}與內部人最偏好者已重合)


1.當μsμC\mu_{s}\geq\mu_{C}時,挑戰者是否支援在位者取決於內部人的行為。當內部人決策時,預期到這一點,他將總是選擇支援在位者。

2.當μs<μC\mu_{s}<\mu_{C}時,挑戰者將提名挑戰者陣營的候選人。

(1)如果內部人選擇在挑戰者之前便提名自己的候選人,那麼他的期望效用將是12+(1(1e)ρ)(d2)\frac{1}{2}+(1-(1-e)\rho)(-d^{2})。其中第一項錶示無論是內部人還是挑戰者的候選人替換掉了當前的在位者,內部人從能力獲取的收益都是12\frac{1}{2},同時如果是自己的候選人上臺,其政策損失部分為0;而第二項錶示,挑戰者有1(1e)ρ1-(1-e)\rho的機率挑戰成功,此時將是挑戰者的候選人上臺,這將帶來d2-d^{2}的政策損失。

(2)如果內部人選擇支援在位者,他將預期到挑戰者隨後將提名自己的候選人。那麼內部人的期望效用將是ρμs+(1ρ)12+(1ρ)(d2)\rho\mu_{s}+(1-\rho)\frac{1}{2}+(1-\rho)(-d^{2})。其中第一項是,當隻有內部人支援在位者時,在位者繼續在位的機率為ρ\rho,此時能力收益為μs\mu_{s},並且政策損失為0;第二項和第三項是,此時在位者被挑戰者所替換的機率為1ρ1-\rho,第二項是能力收益,第三項是政策損失。

因此,內部人的信念cutoff應使得

12+(1(1e)ρ)(d2)=ρμA+(1ρ)12+(1ρ)(d2)\frac{1}{2}+(1-(1-e)\rho)(-d^{2})=\rho\mu_{A}+(1-\rho)\frac{1}{2}+(1-\rho)(-d^{2})

μA=ed2+12\mu_{A}=-ed^{2}+\frac{1}{2}


在位者的最優文宣政策為如下最優化問題的解:

maxαA,αCV(q)=αAρ+αCs.t.αAμA+αCμC=μ0αA0αC0\begin{aligned} &\max_{\alpha_{A},\alpha_{C}} V(q)= \alpha_{A}\rho+\alpha_{C}\\ &s.t. \\ &\alpha_{A}\cdot\mu_{A}+\alpha_{C}\cdot\mu_{C}= \mu_{0}\\ &\alpha_{A}\geq 0\\ &\alpha_{C}\geq 0 \end{aligned}

其中αA\alpha_{A}代錶對內部人文宣,αC\alpha_{C}代錶同時對內部人和挑戰者文宣(但既然能說服挑戰者就必然同時也能說服內部人,所以其實“同時對內部人和挑戰者”和“對挑戰者文宣”文宣是一樣的,因此實際的分類是:(1)不對任何人文宣;(2)僅對內部人文宣;(3)同時對二者文宣)

目標函數是在位者留任的機率,以“價格”αA\alpha_{A}來購買的內部人的每單位支援,可以得到ρ\rho這麼多的留任機率;以“價格”αC\alpha_{C}來購買的挑戰者人(以及內部人)的每單位支援,可以得到1這麼多的留任機率(即確定地留任)。

在位者的“預算約束”是貝葉斯可行要求,“花費”在“僅購買內部人支援”的後驗信念上的部分αAμA\alpha_{A}\cdot\mu_{A}與“花費”在“購買挑戰者支援”的後驗信念上的部分αCμC\alpha_{C}\cdot\mu_{C}不能超過其“稟賦”μ0\mu_{0}

構建拉格朗日函數

αAρ+αC+λ[μ0αAμAαCμC]\alpha_{A}\rho+\alpha_{C}+\lambda[\mu_{0}-\alpha_{A}\cdot\mu_{A}-\alpha_{C}\cdot\mu_{C}]

從而

ρλμA\rho\leq\lambda\mu_{A}

1λμC1\leq\lambda\mu_{C}

αA0\alpha_{A}\geq 0

αC0\alpha_{C}\geq 0

αA(ρλμA)=0\alpha_{A}(\rho-\lambda\mu_{A})=0

αC(1λμC)=0\alpha_{C}(1-\lambda\mu_{C})=0

其中αA>0\alpha_{A}>0意味著ρλμA\rho\leq\lambda\mu_{A}這個約束是緊的,此時1ρμCμA\frac{1}{\rho}\leq\frac{\mu_{C}}{\mu_{A}}αC>0\alpha_{C}>0意味著1λμC1\leq\lambda\mu_{C}這個約束是緊的,此時1ρ>μCμA\frac{1}{\rho}>\frac{\mu_{C}}{\mu_{A}}。接下來分情況討論這兩種角點解情況。

命題

1ρμCμA\frac{1}{\rho}\leq\frac{\mu_{C}}{\mu_{A}}時,最優文宣由ss^{-}s+s^{+}組成,其中ss^{-}使得內部人和挑戰者都不支援她;s+s^{+}使得內部人支援她但挑戰者不支援她。將此時的信息結構寫為qθ+=Pr(s+θ)q_{\theta}^{+}=Pr(s^{+}|\theta),則

qθ+={1,θ=1μ01μ01μAμA,θ=0q_{\theta}^{+}= \begin{cases} 1,\text{當}\theta=1\\ \frac{\mu_{0}}{1-\mu_{0}} \frac{1-\mu_{A}}{\mu_{A}},\text{當}\theta=0 \end{cases}

由於在位者當有能力時總會說自己有能力,但是冇能力時會以一定的機率說自己有能力,因此我們隻需求解當θ=0\theta=0時的文宣策略。

其中μ01μ01μAμA\frac{\mu_{0}}{1-\mu_{0}} \frac{1-\mu_{A}}{\mu_{A}}是使得內部人支援她的條件,其求解過程為:

令內部人在這一信息結構下得到的後驗機率恰好足夠使他支援在位者,即

qθ+μ0qθ+μ0+(1qθ+)(1μ0)=μA\frac{q_{\theta}^{+}\mu_{0}}{q_{\theta}^{+}\mu_{0}+(1-q_{\theta}^{+})(1-\mu_{0})}=\mu_{A}

可得

qθ+μ0μA+(1qθ+)(1μ0)μA=qθ+μ0q_{\theta}^{+}\mu_{0}\mu_{A}+(1-q_{\theta}^{+})(1-\mu_{0})\mu_{A}=q_{\theta}^{+}\mu_{0}

進而

(1qθ+)(1μ0)μA=(1μA)qθ+μ0(1-q_{\theta}^{+})(1-\mu_{0})\mu_{A}=(1-\mu_{A})q_{\theta}^{+}\mu_{0}

從而

qθ+=μ01μ01μAμAq_{\theta}^{+}=\frac{\mu_{0}}{1-\mu_{0}} \frac{1-\mu_{A}}{\mu_{A}}

即,若在位者能力強,便放出自己能力強的信號;但若能力弱,仍以一定的機率放出自己能力的強的信號。但後者的大小取決於目標人群,此處為內部人。

1ρ>μCμA\frac{1}{\rho}>\frac{\mu_{C}}{\mu_{A}}時,最優文宣由ss^{-}s++s^{++}組成,其中ss^{-}使得內部人和挑戰者都不支援她;s++s^{++}使得二者都支援她。將此時的信息結構寫為qθ++=Pr(s++θ)q_{\theta}^{++}=Pr(s^{++}|\theta),則

qθ++={1,θ=1μ01μ01μCμC,θ=0q_{\theta}^{++}= \begin{cases} 1,\text{當}\theta=1\\ \frac{\mu_{0}}{1-\mu_{0}} \frac{1-\mu_{C}}{\mu_{C}},\text{當}\theta=0 \end{cases}

即,若在位者能力強,便放出自己能力強的信號;但若能力弱,仍以一定的機率放出自己能力的強的信號。但後者的大小取決於目標人群,此處為挑戰者。

1ρμCμA\frac{1}{\rho}\leq\frac{\mu_{C}}{\mu_{A}}時,文宣的頻率為μ0μA\frac{\mu_{0}}{\mu_{A}}
1ρ>μCμA\frac{1}{\rho}>\frac{\mu_{C}}{\mu_{A}}時,文宣的頻率為μ0μC\frac{\mu_{0}}{\mu_{C}}

若將在位者的效用錶示為內部人和挑戰者關於在位者能力的後驗信念的函數,可以看到:

  • μs[0,μA)\mu_{s}\in[0,\mu_{A})時,連內部人也不支援在位者,此時在位者確定地不會留任,效用為0;
  • μs[μA,μC)\mu_{s}\in[\mu_{A},\mu_{C})時,隻有內部人支援在位者,此時在位者以ρ\rho的機率留任,效用為ρρ=ρ\rho\cdot\rho=\rho
  • μs[μC,1]\mu_{s}\in[\mu_{C},1]時,內部人和競爭者都支援在位者,此時在位者確定地留任,效用為1。

推論

由於μA=ed2+12\mu_{A}=-ed^{2}+\frac{1}{2}μC=d2+12\mu_{C}=d^{2}+\frac{1}{2},並且分界點由1ρ\frac{1}{\rho}μCμA\frac{\mu_{C}}{\mu_{A}}之間的相對大小決定,因此:

1ρ1-\rho越小時,ρ\rho越大,實際情況將(1)從1ρ>μCμA\frac{1}{\rho}>\frac{\mu_{C}}{\mu_{A}}變為1ρμCμA\frac{1}{\rho}\leq\frac{\mu_{C}}{\mu_{A}},此時文宣的頻率為μ0μA\frac{\mu_{0}}{\mu_{A}},這意味著當挑戰者更弱時,在位者不再需要“購買”挑戰者的支援,從而將會提高αA\alpha_{A}(在滿足貝葉斯可行的要求下);(2)仍在同一側,冇有嚴格變化。

ee越大時,μA\mu_{A}越小,(1)當本來落在1ρμCμA\frac{1}{\rho}\leq\frac{\mu_{C}}{\mu_{A}}一側時,μ0μA\frac{\mu_{0}}{\mu_{A}}越大,這意味著當內部人更依賴於在位者時,在位者將加大對內部人的文宣力度;(2)在另一側(另一側的cutoff為μs\mu_{s},不依賴於ee),冇有嚴格變化;(3)變側,不再同時對內部人和挑戰者文宣,而專心對內部人文宣。

dd增大時,如果本來同時對內部人和挑戰者進行文宣,那麼在位者對於挑戰者的文宣將越來越難以收效(要求更高的後驗信念才能彌補挑戰者的政策偏好zCz_{C}與在位者預設執行的政策zAz_{A}之間的沖突),因此會降低(同時對內部人和挑戰者的)文宣頻率;但當dd增大到一定程度之後,1ρ\frac{1}{\rho}μCμA\frac{\mu_{C}}{\mu_{A}}之間的相對大小改變,在位者專心說服內部人的收效會越來越大,此時又會提高(對內部人的)文宣頻率。

結論

最優的文宣策略不能太頻繁(由於貝葉斯可行要求後驗信念的期望等於先驗信念,所以作為後驗信念之權重的文宣頻率是有限製的)。

原文

YU, Tinghua. Propaganda to persuade. Political Science Research and Methods, 2019, 1-7.