时间序列的自相关性
简单来说,自相关性(Autocorrelation) 就是一个序列的**“今天”和它的“昨天”有多像**。
在统计学上,它描述的是一个随机变量在不同时间点上的取值之间的相关程度。如果说普通的相关性(Correlation)是研究“身高和体重的关系”,那么自相关性就是研究“你今天的体重和昨天体重的关系”。
1. 直观理解:记忆力与惯性
我们可以把自相关性看作是系统的**“记忆力”或“惯性”**:
- 正自相关(Positive Autocorrelation): 具有“惯性”。如果刚才在涨,现在大概率还在涨;如果刚才在跌,现在大概率还在跌。
- 例子: 气温。如果下午 2 点很热,下午 3 点通常也很热。
- 负自相关(Negative Autocorrelation): 具有“反转性”。如果刚才在涨,现在大概率要跌。
- 例子: 均值回归的价差(Spread)。当它偏离中心太远时,会产生向相反方向运动的拉力。
- 无自相关(Zero Autocorrelation): 具有“随机性”。过去发生什么对未来毫无影响。
- 例子: 完美的抛硬币结果,或者所谓的“白噪声”。
2. 数学上的定义
自相关性通常用 滞后阶数(Lag) 来衡量。
- Lag 1(一阶自相关): $t$ 时刻与 $t-1$ 时刻的相关性。
- Lag $k$($k$ 阶自相关): $t$ 时刻与 $t-k$ 时刻的相关性。
其计算公式的核心是将时间序列与其自身平移 $k$ 个单位后的序列进行相关系数计算。
3. 在量化交易(尤其是加密货币)中的意义
为什么我们在分析 4H 报告或均值回归时如此在意它?
- 趋势探测: 如果一个币种的收益率在多个 Lag 上表现出显著的正自相关,说明它处于强趋势中,适合动量策略(Momentum)。
- 均值回归的底色: 均值回归策略(Mean Reversion)本质上是利用负自相关性。我们寻找那些在偏离均值后表现出强烈“反转记忆”的资产。
- 模型可靠性检测:
- 在做回归分析时,如果残差存在自相关性,说明你的模型“漏掉了信息”,没有把规律抓干净。
- ADF 检验(你之前关心的)之所以要选滞后阶数 $p$,就是为了消除自相关性的干扰,从而看清序列是否真的平稳。
4. 如何衡量?(ACF 图)
量化分析师通常会看 ACF(自相关函数)图。
- 横轴是滞后阶数(Lag)。
- 纵轴是相关系数(-1 到 1)。
- 如果柱条超出了蓝色阴影区域(置信区间),就说明该阶数上的自相关性是显著的,不是随机误差。
一句话总结:
自相关性告诉我们一个序列是否存在规律性的记忆。有记忆,我们才能建模;记忆的形状(结构),决定了我们用什么样的交易策略。