AR(1)( 一阶自回归模型)与系数Phi
在时间序列分析和量化交易中,$AR(1)$ 是最基础也最核心的数学模型,而 $\phi$ (Phi) 则是这个模型的“灵魂系数”。它决定了整个系统的记忆力、稳定性以及回归速度。
1. 数学定义
$AR(1)$ 全称是 一阶自回归模型 (First-order Autoregressive Model)。其数学表达式为:
$$X_t = c + \phi X_{t-1} + \epsilon_t$$
- $X_t$:当前时刻的值(如价差 Spread)。
- $c$:常数项(截距)。
- $\phi$ (Phi):自回归系数,即当前值对前一时刻值的依赖程度。
- $\epsilon_t$:白噪声(随机扰动)。
2. $\phi$ 的物理意义:系统的“性格”
$\phi$ 的取值直接决定了序列的统计特征。在均值回归策略中,我们对 $\phi$ 有着严格的期待:
A. 当 $|\phi| < 1$ 时:平稳系统(均值回归的基石)
这是均值回归策略唯一能运行的情况。
- 物理含义:系统具有“向心力”。无论价格偏离多远,最终都会被拉回到均值 $\frac{c}{1-\phi}$。
- 自相关性:表现为正或负的自相关,但随时间指数级衰减。
- $\phi$ 越接近 0:回归速度越快,系统几乎没有记忆(接近随机游走)。
- $\phi$ 越接近 1:回归速度极慢,系统有强烈的“持久记忆”。
B. 当 $\phi = 1$ 时:单位根(随机游走)
- 物理含义:系统没有固定的均值,今天的价格就是明天价格的最佳预测。
- 交易后果:均值回归策略失效。这就是为什么做 ADF 检验时,我们要拒绝“单位根假设”(即证明 $\phi$ 显著小于 1)。
C. 当 $\phi < 0$ 时:震荡系统
- 物理含义:系统表现出强烈的“负自相关性”。如果上一时刻是正的,这一时刻大概率是负的。
- 表现:价格曲线呈现剧烈的上下锯齿状,这是极短线套利者最喜欢的“高频震荡”特征。
3. $\phi$ 与“半衰期”的直接转换
在之前的讨论中,我们提到了半衰期 (Half-life)。在 $AR(1)$ 模型中,$\phi$ 直接决定了半衰期的长短:
$$Half\text{-}life = -\frac{\ln(2)}{\ln(|\phi|)}$$
- 如果 $\phi = 0.9$,半衰期约为 6.5 个单位时间。
- 如果 $\phi = 0.5$(回归极快),半衰期仅为 1 个单位时间。
4. 为什么 4H 报告中要在意这个?
回到你最初的问题,当样本量只有 100 条时,估计出的 $\phi$ 会存在偏差 (Bias):
- 估计偏大:在小样本下,最小二乘法估计出的 $\phi$ 往往比真实值更接近 1。这会导致你误以为一个平稳的序列是不平稳的(Type II Error)。
- 稳定性差:100 条数据中如果出现一个极端值(Outlier),$\phi$ 的数值会剧烈跳动,导致你的均值回归信号从“强烈推荐”变成“不可交易”。
总结
$\phi$ 就是系统的“弹性系数”。
- 在均值回归中,我们寻找 $\phi$ 显著小于 1 且为正数(如 0.7~0.9)的资产,因为这代表了既有逻辑支撑、又有回归拉力的稳定系统。
- 如果 $\phi$ 变成了 0.99,即使统计上说它平稳,但在交易维度它已等同于随机游走。