自从用了Dropbox加自动触发的方法以后,写博客、记笔记变得方便了好多,手机、平板,坐车、路上都可以,姥爷开心。
附上之前记的笔记(为了自己复习查阅方便)。
不务正业学计量(一)
闲谝
自从用了Dropbox加自动触发的方法以后,写博客、记笔记变得方便了好多,手机、平板,坐车、路上都可以,姥爷开心。最近刷了一遍Dougherty,稍微膜了膜蒋岳祥老师,大概有了点印象,这份笔记算是半回忆半整理,应该还需要不停修改,算是为自己复习也方便吧。三年了还没学会计量,这是我最差的一门了,基本是什么都不会,面对这门占125分的科目,不禁为自己感到担忧。
经典线性回归
回归的理由
- 如果条件期望函数是线性的,那么总体回归方程就应该是这个线性函数;
- 给定xi,xiTβ是(在最小化均方误意义上)对yi的最优线性估计量;
- xiTβ是(在最小化均方误意义上)对E(yi∣xi)的最优线性近似。
- E(Y∣X)=argmax(ρY,L(X)),即在所有关于X的函数中,条件期望函数E(Y∣X)拥有与Y$最大的相关系数。
(这一最大的相关系数之平方即为拟合优度。)
经典线性回归假设
线性(总体)
y=E(y∣X)+ϵ=Xβ+ϵ.即条件期望函数为线性形式。
其中Xβ部分来源于经济理论,而ϵ部分来源于统计学。
严格外生性(总体)
E(ϵi∣X)=0,这意味着
- E(ϵi)=E[E(ϵi∣X)]=0
- E(xjkϵi)=E[E(xjkϵi∣xjk)]=E[xjkE(ϵi∣xjk)]=0
- Cov(ϵi,xjk)=E(xjkϵi)−E(xjk)E(ϵi)=E(xjkϵi)=0
无多重共线性(样本)
rank(X)=K,即数据矩阵为列满秩,没有任何一个变量可以表示为其他变量的线性组合。这意味着:
- rank(XTX)=rank(X)=K;
- ∀c为K维非零向量,有cTXTXc>0.因为
(1)q=cTXTXc=(Xc)T(Xc)≥0;
(2)若存在某个K维非零向量c使得Xc=0,而由X列满秩得知Xc=0仅有零解,因此c既非零向量又为零向量,矛盾。
(3)因此第一步中的≥变为>,即XTX正定。
P(λmin(X’X)→∞)→1
即随着样本容量趋于无穷的过程中,总有新的信息出现。
球状扰动项(总体)
E(ϵϵT∣X)=σ2In;或等价地是如下两个假设的结合:
- 同方差:E(ϵi2∣X)=σ2>0;
- 无自相关:E(ϵiϵj∣X)=0.
据说始终假定具有非零有限前四阶矩,但具体咋回事忘记了,查了再补。
条件正态性(总体。为便于统计推断)
ϵ∣X∼N(0,σ2).
随机抽样
如果(yi,xi)是独立同分布的,则称(y,X)为随机样本。
在随机样本情况下,(ϵi,xi)的分布不依赖于i,因此无条件期望E(ϵi2)是常数;而条件期望E(ϵi2∣xi)的函数形式是固定的,但未必是常数,因此球状扰动项的假定仍是重要的。
固定回归元
如果回归元是固定的,则前述假设中条件期望与无条件期望是等价的。但Wooldridge、Hayashi等认为将回归元视为随机变量更合适。
今天先记到这儿吧
脱胎自:
Hayashi: Econometrics;
蒋岳祥:高级计量经济学;
Dougherty: Introduction to Econometrics;
Wooldridge: Introductory Econometrics;
靳云汇:高级计量经济学;
Angrist&Pischke: Mostly Harmless Econometrics.