IMM Kalman β vs OLS β：Z-score 与 AZ 差异分析

SHI XIAOLONG

16 Mar 2026 — 4 min read

IMM Kalman β vs OLS β：Z-score 与 AZ 差异分析

版本：IMM Kalman v5.0（M=5 并行滤波器，Blom & Bar-Shalom 1988）
生效日期：2026-03-16
对应代码：src/utils/analysis/analysis_core.py，src/trading/strategy.py

背景

升级前，价差（spread）使用 OLS 滚动回归估计 β：

spread_ols = log_alt - β_ols × log_base
β_ols      = OLS 回归，100 根 4h K 线等权窗口（≈ 17 天）

升级后（热身完成，n_updates ≥ 20），切换为 IMM Kalman 后验 β：

spread_kalman = log_alt - β_kalman × log_base
β_kalman      = IMM 混合后验估计，递归更新，每 4h 一步

Z-score 和 AZ 均基于 spread 计算：

Z-score = (current_spread - spread_mean) / spread_std   # zscore_window=30
AZ      = (z4h - ema_z4h) / effective_std               # 策略层二次标准化

因此 β 的差异直接传导至 Z-score，再间接影响 AZ。

响应速度对比

指标	OLS β	Kalman β（高 Q 模型）
更新频率	每 4h 一次	每 4h 一次（相同）
β 反映一半偏移所需时间	~50 根 K 线 ≈ 8 天	~5 根 K 线 ≈ 20 小时
β 90% 反映偏移所需时间	~90 根 K 线 ≈ 15 天	~10 根 K 线 ≈ 40 小时
响应速度提升	—	约 5-10 倍

分场景差异分析

场景一：β 稳定期（大多数时候）

两者差异极小。Kalman 收敛后与 OLS β 偏差通常在 ±0.05 以内，Z-score 和 AZ 几乎一致，信号行为无实质变化。

场景二：β 缓慢漂移期（最常见的有意义差异）

OLS β 滞后 8-15 天，spread 均值产生系统性偏移：

OLS spread（滞后）= log_alt - β_ols_旧 × log_base
  → 价差非零漂移 → Z-score 持续偏向某一侧 → 虚假信号增多

Kalman spread（近实时）= log_alt - β_kalman_新 × log_base
  → 价差更接近真实均衡 → Z-score 更居中，幅度更小

实际影响

Kalman Z-score 在幅度上更保守
OLS 因 β 滞后可能产生持续偏向的虚假开仓信号
Kalman 能有效抑制此类噪声

场景三：β 突变期（体制切换）

维度	OLS	Kalman + Gate3
β 突变后 1-5 根 K 线	spread 剧烈偏移，Z-score 冲至极端	高 Q 模型接管，β 快速追踪，Z-score 幅度受控
开仓保护	无	`regime_score > 0.7` → Gate3 拦截
信号性质	极可能为虚假信号	被过滤

Gate3 在 analyze_multi_period 中实现，拦截后返回 failure_reason='gate3'，同时保存最新 Kalman state 供下次继续更新。

场景四：β 大幅偏离（最需关注）

当真实 β 与 OLS β 偏差较大时，Z-score 符号可能相反：

示例：真实 β = 1.5，OLS β（滞后）= 1.0

OLS spread = log_alt - 1.0 × log_base  →  alt 偏贵，Z > 0 → 做空 alt
Kalman spread = log_alt - 1.5 × log_base  →  alt 偏便宜，Z < 0 → 做多 alt

两个方向完全相反。这是本次升级最关键的改变：方向判断更准确。
代价：过渡期（Kalman 热身的前 20 步）β 估计不稳定时，信号方向可能短暂抖动。

场景五：AZ 的过渡期问题

AZ 的 ema 和 std 是对历史 z4h 序列的累积统计（std_window，通常 30-50 步）。

热身前（< 20 步）：历史 z4h 由 OLS β 计算，混入 AZ 的缓冲区
热身后：z4h 切换为 Kalman β 计算

切换后，AZ 的 ema/std 完全过渡到 Kalman β 体系约需 30-50 根 K 线（5-8 天）。
过渡期内 AZ 阈值判断可能偏松或偏紧，但影响是渐进的，不会突变。

差异总览

场景	Z-score 变化	AZ 变化	信号影响
β 稳定	几乎无差异	几乎无差异	无
β 缓慢漂移	幅度偏小、更居中	更稳定	减少虚假信号
β 突变	被 Gate3 过滤	被 Gate3 过滤	过滤假信号
β 大幅偏离	符号可能翻转	跟随翻转	方向更准，过渡期需监控
AZ 过渡期	无	基准混合，渐进偏移	5-8 天内恢复

监控建议

升级上线后，建议在前 30-50 根 4h K 线（5-8 天） 内重点关注以下日志：

# 每步 Kalman β vs OLS β 偏差
[IMM] PURR/.../HYPE/... #  42 | β=0.6523(K) +0.0042vsOLS | ...

# 体制穿越（Gate3 触发前的预警）
[IMM] ...-体制↑ # 104 | regime_score 0.283→0.731 穿越阈值0.7 ...

# ν 适应（尾部分布变化）
[IMM] ...-ν适应 # 103 | ν: 8.30→7.65 ↓厚尾 ...

如果 β(K) vsOLS 偏差持续 > 0.1 或频繁出现体制穿越，说明两个算法对当前配对的 β 认知差异较大，需结合实际 PnL 判断哪个更准确。

相关配置

参数	默认值	说明
`IMM_KALMAN_WARMUP`	20	热身步数，未达到时 Z-score 仍用 OLS β
`IMM_REGIME_GATE_THRESHOLD`	0.7	Gate3 触发阈值
`BETA_WINDOW`	100	OLS β 滚动窗口（K 线数）
`ZSCORE_WINDOW`	30	Z-score 统计窗口（K 线数）
`HEDGE_BETA_MIN`	0.1	Kalman β 用于 hedge ratio 的下界
`HEDGE_BETA_MAX`	5.0	Kalman β 用于 hedge ratio 的上界

AMI的优越性

世界模型（World Models）的具体例子如下，我按类型分类，便于理解。每类都附带实际实现、演示效果和应用场景。 1. Yann LeCun / Meta 的 JEPA 系列（最直接对应“世界模型”概念）这些是 LeCun 主张的非生成式抽象预测世界模型代表。 * I-JEPA（Image JEPA，2023）输入一张图像，模型把不同区域（context 和 target）编码成抽象表示，然后预测 target 的表示（不在像素级别重建）。例子：给定一张遮挡了部分物体的图片，模型能预测“被遮挡物体的大致位置和属性”，构建对物体持久性和空间关系的理解。这是一个“原始世界模型”，能学习物理常识（如物体不会凭空消失）。 * V-JEPA / V-JEPA 2（Video JEPA，

什么是：“世界模型（World Models）”

世界模型（World Models）是人工智能领域的一个核心概念，尤其在 Yann LeCun 等研究者推动的下一代 AI 架构中占据中心位置。它指的是 AI 系统在内部构建的对现实世界的抽象模拟或内部表示，让机器能够像人类或动物一样“理解”物理世界、预测未来、规划行动。简单比喻想象你闭上眼睛也能“看到”房间里的物体会如何移动、碰撞或掉落——这就是你大脑里的世界模型。AI 的世界模型就是类似的“数字孪生”（digital twin）或“内部模拟器”：它不是简单记住数据，而是学习世界的动态、因果关系和物理直觉（如重力、物体持久性、遮挡、因果等）。为什么需要世界模型？当前主流的大型语言模型（LLM）擅长处理文本（统计模式预测），但存在根本局限： * 缺乏对物理世界的真正理解 → 容易“幻觉”、无法可靠规划。 * 样本效率低 → 人类/

K线周期可配置化设计方案

K线周期可配置化设计方案 1. 背景与目标当前 Beta 套利策略的 K 线周期硬编码为 "1h"，分散在多个文件中。需要： 1. 将 K 线周期从 1h 改为 2h 2. 提取为环境变量 BETA_ARB_KLINE_INTERVAL，使其可在 .env 中配置 2. 影响范围分析 2.1 需要修改的文件（共 6 个）文件硬编码位置修改内容 src/trading/config.py BetaArbConfig dataclass 新增 kline_interval 字段，

对于空间环境、“信息/逻辑”（比如代码、结构、表达）秩序追求的心理特征分析

一、为什么是“空间 + 信息”同时强化？因为你当年面对的是“双重失控”： 1️⃣ 外部世界是脏乱 + 失序的 * 空间被污染 * 行为无边界 * 基本生活秩序崩塌 👉 所以你现在会强烈要求： * 桌面干净 * 房间有序 * 物品可控这是在修复：“物理世界必须是可控的” 2️⃣ 人的行为和逻辑也是混乱的 * 没有规则 * 没有底线 * 没有理性 👉 所以你现在会特别在意： * 表达是否清晰 * 逻辑是否自洽 * 结构是否优雅 * 代码是否干净这是在修复：“认知世界必须是合理的” 二、你其实构建了一个“高纯度系统” 你现在的偏好，本质上是： 👉 低噪音 + 高结构 + 强控制感具体表现就是： * 空间：极简、整洁、可预测 * 信息：清晰、压缩、无冗余这类人有一个很明显的优势： 👉 处理复杂问题时，

IMM Kalman β vs OLS β：Z-score 与 AZ 差异分析

背景

响应速度对比

分场景差异分析

场景一：β 稳定期（大多数时候）

场景二：β 缓慢漂移期（最常见的有意义差异）

场景三：β 突变期（体制切换）

场景四：β 大幅偏离（最需关注）

场景五：AZ 的过渡期问题

差异总览

监控建议

相关配置

Read more

AMI的优越性

什么是：“世界模型（World Models）”

K线周期可配置化设计方案

对于空间环境、“信息/逻辑”（比如代码、结构、表达）秩序追求的心理特征分析