价差与残差的关系
这是一个术语层面 + 建模视角的问题,你问得非常关键 👍
简短结论先给出:
“价差”是交易视角的叫法,“残差”是统计建模视角的叫法
在协整建模中,它们数学上是同一个东西。
下面我从逻辑起点 → 数学定义 → 交易含义三层把它讲清楚。
一、为什么在协整里一定会出现“残差”这个词?
因为协整不是直接定义“差”,而是这样定义的:
两个(或多个)非平稳序列
如果存在一个线性组合是平稳的
那么它们是协整的
形式化写法是:
[
\log P^{(alt)}_t = \alpha + \beta \log P^{(base)}_t + u_t
]
这里:
- (\alpha, \beta):通过 OLS 回归估计出来
- (u_t):回归误差项(residual)
👉 协整检验的核心问题只有一个:
这个 (u_t) 是不是平稳?
所以从统计学定义上:
- (u_t) 必须被称为 残差 / 误差项
- 因为它来自一个回归模型
二、那“价差”又是从哪来的?
在交易者眼里,我们根本不关心“误差项”这种叫法,我们关心的是:
两个资产偏离长期均衡关系的程度
于是我们把上面的残差直接拿来用:
spread = log_alt - (alpha + beta * log_base)
你会发现:
- 这就是 OLS 残差
- 但从交易角度看,它表示:
- 当前组合价格
- 相对于“长期均衡线”的偏离
于是交易圈给了它一个更直观的名字:
Spread(价差)
三、为什么“价差 = 残差”在协整里是合理的?
关键在于:这里的价差不是简单的价格相减
❌ 不是这种“价差”:
[
P_A - P_B
]
✅ 而是这种:
[
\log P_A - (\alpha + \beta \log P_B)
]
它的含义是:
实际价格 − 协整关系预测的价格
这在统计学上严格等价于回归残差
四、从三个视角看同一个东西
| 视角 | 名称 | 关注点 |
|---|---|---|
| 计量经济学 | 残差(Residual) | 是否平稳 |
| 协整理论 | 协整误差 | 是否存在均衡回归 |
| 配对交易 | 价差(Spread) | 回归均值、Z-score |
同一个序列,不同语言体系
五、为什么 ADF 一定要对“残差”做?
因为 Engle–Granger 协整检验的理论前提是:
不能对原序列做 ADF
只能对“协整回归的残差”做 ADF
原因是:
- 单个价格:允许是 I(1)
- 残差平稳:说明存在 I(0) 的线性组合
- 这正是 协整的定义
六、一句话总结(你可以直接记住)
在协整建模中:
价差 = 回归残差 = 偏离长期均衡的程度
叫“残差”是因为它来自 OLS
叫“价差”是因为它被拿去做交易