协整的定义: 如果两个非平稳时间序列的线性组合是平稳的,则称这两个序列是协整的
这句话看起来很“教科书”,但背后的直觉其实并不复杂。我分 形式理解 → 直觉理解 → 一个具体例子 → 常见误解 四步来解释。
一、形式化地理解这句话在说什么
“如果两个非平稳时间序列的线性组合是平稳的,则称这两个序列是协整的。”
拆开来看:
- 两个时间序列
- 记为 (x_t)、(y_t)
- 它们本身是非平稳的
- 比如都有趋势、随机游走(I(1))
- 均值、方差随时间变化
- 存在某个线性组合
[
z_t = y_t - \beta x_t
] - 这个组合是平稳的
- (z_t) 没有趋势
- 围绕一个固定均值波动(I(0))
👉 只要存在这样的 (\beta),就说
[
(x_t,; y_t) \text{ 是协整的}
]
二、直觉理解(这是最重要的部分)
1️⃣ 非平稳 ≠ 完全“乱跑”
单独看:
- (x_t):一路往上漂
- (y_t):也一路往上漂
它们各自不平稳,看起来都在“随时间发散”。
2️⃣ 但它们可能“一起跑”
如果:
- (y_t) 总是大致等于 (2x_t + \text{小噪声})
那么虽然:
- (x_t) 在涨
- (y_t) 在涨
但它们之间的差距是稳定的。
3️⃣ “线性组合平稳”的含义
[
y_t - 2x_t = \text{一个围绕 0 波动的序列}
]
这说明:
- 两个序列 共享同一个长期趋势
- 偏离趋势的部分是短期、可回归的
📌 协整本质:长期关系存在,短期可以偏离,但会回归
三、一个非常经典的例子(经济 / 金融)
房价 vs 收入
- 房价:非平稳(长期上涨)
- 收入:非平稳(长期上涨)
但在长期:
[
\text{房价}_t - \beta \cdot \text{收入}_t
]
是平稳的
含义是:
- 房价不能无限脱离收入
- 否则会回调(泡沫破裂 or 收入追赶)
➡️ 这就是协整关系
四、从“统计语言”翻译成“人话”
协整说的不是“不涨”
而是“一起涨,而且涨得有比例、有约束”
一句话总结为:
单独看它们在漂移,但放在一起看,它们被一根“长期关系的绳子”绑住了。
五、常见误解(非常关键)
❌ 误解 1:相关性 = 协整
不是的。
- 两个序列可以高度相关
- 但线性组合仍然是非平稳 → 不协整
❌ 误解 2:协整要求短期高度相关
也不是。
- 短期可以完全不同步
- 只要长期关系存在即可
❌ 误解 3:协整适用于任意序列
不行。
- 一般要求 同阶单整(通常都是 I(1))
- I(0) 和 I(1) 之间谈不上协整
六、一句“学术级”但好记的总结
协整 = 非平稳序列之间存在一个平稳的长期均衡关系。