不求甚解學經濟-一些簡單的概率論

(Brandon) Song Li Lv4

信息設計學習筆記係列。

一部分基礎知識可見 不务正业学计量(一)

一個隨機變量序列 YtY_{t} 被稱爲關於信號歷史 ht=(s1,...,st1)h_{t}=(s_{1},...,s_{t-1}) 的鞅,當且僅當下式滿足

E[Yt+1;ht]=Yt\mathbb{E}[Y_{t+1};h_{t}]=Y_{t}

給定直到 t 期的信號歷史,對於第 t+1 期的隨機變量取值的期望就等於當前期的隨機變量取值。

例如,如果我們取逐步更新的信念這個隨機變量序列,那麽對於第 t+1 期信念 (對於 t 期來説,是後驗信念) 的期望就等於第 t 期信念 (對於 t 期來説,是先驗信念),即 E[μt+1;ht]=μt\mathbb{E}[\mu_{t+1};h_{t}]=\mu_{t}

貝葉斯信念為鞅

對於任何一個世界狀態空間 AΘ\mathscr{A}\subset\Theta,取信念 μt=Prob(θA;ht)=E(IA(θ))\mu_{t}=\text{Prob}(\theta\in\mathscr{A};h_{t})=\mathbb{E}(\mathscr{I}_{\mathscr{A}}(\theta)),其中 IA(θ)\mathscr{I}_{\mathscr{A}}(\theta) 是集合 A\mathscr{A} 的指示函數,ht=(s1,...,st1)h_{t}=(s_{1},...,s_{t-1}) 是信號歷史,則 E(μt+1;ht)=μt\mathbb{E}(\mu_{t+1};h_{t})=\mu_{t}

參與人知道,當新信息到來後,自己的信念也許會改變,但無法提前知道將會向哪個方向變化:信念變動的期望為零。如果他能提前獲知信念將會如何變化,他現在就會改變信念,而不會等到新信息到來以後再更新。

注意,一般來説以似然比或對數似然比性質表示的貝葉斯更新不具有鞅性質。

依概率收斂

給定概率空間 (Ω,F,p)(\Omega,\mathscr{F},p) 上的隨機變量 X1,...,Xm,...X_{1},...,X_{m},...,如果下式得到滿足,則稱 XnX_{n} 依概率收斂到隨機變量 XX

ϵ>0p(|(XnX)|0)0 as n\forall\epsilon>0\text{, }p(\text{|}(X_{n}-X)\text{|}\geq 0)\rightarrow 0 \text{ as } n\rightarrow\infty

鞅收斂點定理 (弱版本)

如果 XtX_{t} 序列是個鞅,并且是有界的即,M,t\exists M,\forall t, |Xt|<M<\text{|}X_{t}\text{|}< M<\infty,則存在一個隨機變量 XX,使得 XnX_{n} 依概率收斂到 XX

貝葉斯信念的收斂

貝葉斯信念這個隨機變量序列是個鞅,并且信念作爲條件概率其取值範圍為 [0,1][0,1],因此信念是有界鞅,進而信念是收斂的,儘管我們還不知道它將收斂到哪個極限信念。注意,這裏我們是説的具有 (貝葉斯) 理性的行爲人的信念會收斂,但如果是不具有理性的行爲人,比如依據適應性調整這種固定權重過程來更新信念的行爲人,其信念未必是收斂的。在賽侷理論中,理性通常是指貝葉斯理性,即在給定條件下選擇策略以最大化期望效用。

支撐對應的一些性質

給定可分可度量化空間 XX,將其上配備 weak\text{weak}^{\star} 拓撲以及 Borelσ\text{Borel}-\sigma 代數以及 Borel 概率測度,並將其上的 Borel 概率測度們構成的集合記爲 P(X)\mathscr{P}(X),有時 (特別地,如果 XX 本身是個有限集的話) 也將 XX 上的 Borel 概率測度集記爲 Δ(X)\Delta(X)。對於某個 Borel 概率測度 μP\mu\in\mathscr{P}{xX:μx>0}\lbrace x\in X:\mu{x}>0\rbrace 稱爲 μ\mu 的支撐集,即取到它的概率嚴格為正的那些點的集合,並記爲 supp(μ)\text{supp}(\mu),并將 μ:supp(μ)\mu:\Rightarrow\text{supp}(\mu) 稱爲支撐對應。

支撐對應是下半 (hemi) 連續的

證明:任取開集 UXU\subset X,并取 xUsupp(μ)x\in U\cap\text{supp}(\mu)。待補充。

拆分概率测度

將某個概率測度拆分爲兩個概率測度的複賭。貝葉斯勸説就是在做拆分概率測度的事情,通過將一個 (非極點的) 先驗概率拆分成兩個 (或多個) 後驗概率的凸組合 (凸組合也可以視爲複賭,或後驗概率上的分佈,凸組合係數即爲某個後驗概率實現的概率)。

Polish 空間

給定一個拓撲空間 (X,τ)(X,\tau),如果存在某個度量 dd 使得 (X,d)(X,d) 成爲完備的度量空間,并且度量 dd 所引致的拓撲恰好就是開頭給出的 τ\tau,那麽拓撲空間 (X,τ)(X,\tau) 就被稱爲可完備度量化的。如果某個可分的拓撲空間 (即存在可數稠密子集的拓撲空間) 是可完備度量化的,那麽就稱它是 Polish 空間,使其成爲完備度量空間的度量所引致的拓撲 (恰好就是一開始給出的 τ\tau) 被稱爲 Polish 拓撲。

可測最大值定理 中我們要求的決策空間是可分可度量化空間,而 Polish 空間是要求更高的可分可完備度量化空間,所以可測最大值定理對於以 Polish 空間為決策空間的問題也是成立的��

Blackwell 定理

給定一個概率空間 (Ω,F,P)(\Omega,\mathscr{F},P) ,給定一個具有先驗分佈 pΔ(R)p\in\Delta(\mathbb{R}) 的隨機變量 YY

對於信號 X:ΩRX:\Omega\rightarrow\mathbb{R} ,定義其所引致的後驗概率為 βxX(A)=P(YA:X=x)\beta_{x}^{X}(A)=P(Y\in A:X=x),則對於所有的 AFA\in\mathscr{F} ,都有

βX(ω)X(A)dP(ω)=p(A)\int\beta_{X(\omega)}^{X}(A)dP(\omega)=p(A)

即後驗的期望等於先驗。因此,又稱後驗概率為 disintegrations。

給定信號。對於每個狀態 ω\omega,都有一個與之對應的後驗概率 ωβX(ω)X(A)\omega\rightarrow\beta_{X(\omega)}^{X}(A)。既然世界狀態 ωΩ\omega\in\Omega 們是隨機的,那麽後驗概率的分佈 QXΔ(Δ(R))Q_{X}\in\Delta(\Delta(\mathbb{R})) 也是隨機的,後驗概率的分佈是世界狀態出現的隨機性叠加上所出現的(在當前給定的信號下)世界狀態所引致的後驗概率。并且,前述後驗的期望等於先驗的性質可以等價地表述爲

β(A)dQX(β)=p(A),AF\int\beta(A) dQ_{X}(\beta)=p(A),\forall A\in\mathscr{F}

以信號為基礎的信息結構可以用在後驗信念上的分佈 QXQ_{X} 來刻畫,其實現方式為 regular conditional probabilities。在 Δ(R)\Delta(\mathbb{R}) 上的 σ\sigma 域可以有兩種等價的定義方式:1. 包含集合 {Q:Q(E)r}\lbrace Q:Q(E)\leq r \rbrace 們的最小的 σ\sigma 域,其中 EE 為可測集 ERE\subset\mathbb{R}rRr\in\mathbb{R};2. 由 Prokhorov 開集生成的 σ\sigma 域。

定義

  • 標題: 不求甚解學經濟-一些簡單的概率論
  • 作者: (Brandon) Song Li
  • 撰寫于 : 2021-08-12 00:06:33
  • 更新于 : 2024-12-06 04:29:22
  • 連結: https://brandonsli.com/p/2b871s90.html
  • 版權宣告: 保留所有權利 © (Brandon) Song Li