IMM Kalman β vs OLS β:Z-score 与 AZ 差异分析

IMM Kalman β vs OLS β:Z-score 与 AZ 差异分析

版本:IMM Kalman v5.0(M=5 并行滤波器,Blom & Bar-Shalom 1988)
生效日期:2026-03-16
对应代码:src/utils/analysis/analysis_core.pysrc/trading/strategy.py


背景

升级前,价差(spread)使用 OLS 滚动回归估计 β:

spread_ols = log_alt - β_ols × log_base
β_ols      = OLS 回归,100 根 4h K 线等权窗口(≈ 17 天)

升级后(热身完成,n_updates ≥ 20),切换为 IMM Kalman 后验 β:

spread_kalman = log_alt - β_kalman × log_base
β_kalman      = IMM 混合后验估计,递归更新,每 4h 一步

Z-score 和 AZ 均基于 spread 计算:

Z-score = (current_spread - spread_mean) / spread_std   # zscore_window=30
AZ      = (z4h - ema_z4h) / effective_std               # 策略层二次标准化

因此 β 的差异直接传导至 Z-score,再间接影响 AZ。


响应速度对比

指标 OLS β Kalman β(高 Q 模型)
更新频率 每 4h 一次 每 4h 一次(相同)
β 反映一半偏移所需时间 ~50 根 K 线 ≈ 8 天 ~5 根 K 线 ≈ 20 小时
β 90% 反映偏移所需时间 ~90 根 K 线 ≈ 15 天 ~10 根 K 线 ≈ 40 小时
响应速度提升 约 5-10 倍

分场景差异分析

场景一:β 稳定期(大多数时候)

两者差异极小。Kalman 收敛后与 OLS β 偏差通常在 ±0.05 以内,Z-score 和 AZ 几乎一致,信号行为无实质变化。


场景二:β 缓慢漂移期(最常见的有意义差异)

OLS β 滞后 8-15 天,spread 均值产生系统性偏移:

OLS spread(滞后)= log_alt - β_ols_旧 × log_base
  → 价差非零漂移 → Z-score 持续偏向某一侧 → 虚假信号增多

Kalman spread(近实时)= log_alt - β_kalman_新 × log_base
  → 价差更接近真实均衡 → Z-score 更居中,幅度更小

实际影响

  • Kalman Z-score 在幅度上更保守
  • OLS 因 β 滞后可能产生持续偏向的虚假开仓信号
  • Kalman 能有效抑制此类噪声

场景三:β 突变期(体制切换)

维度 OLS Kalman + Gate3
β 突变后 1-5 根 K 线 spread 剧烈偏移,Z-score 冲至极端 高 Q 模型接管,β 快速追踪,Z-score 幅度受控
开仓保护 regime_score > 0.7 → Gate3 拦截
信号性质 极可能为虚假信号 被过滤

Gate3 在 analyze_multi_period 中实现,拦截后返回 failure_reason='gate3',同时保存最新 Kalman state 供下次继续更新。


场景四:β 大幅偏离(最需关注)

当真实 β 与 OLS β 偏差较大时,Z-score 符号可能相反

示例:真实 β = 1.5,OLS β(滞后)= 1.0

OLS spread = log_alt - 1.0 × log_base  →  alt 偏贵,Z > 0 → 做空 alt
Kalman spread = log_alt - 1.5 × log_base  →  alt 偏便宜,Z < 0 → 做多 alt

两个方向完全相反。这是本次升级最关键的改变:方向判断更准确
代价:过渡期(Kalman 热身的前 20 步)β 估计不稳定时,信号方向可能短暂抖动。


场景五:AZ 的过渡期问题

AZ 的 ema 和 std 是对历史 z4h 序列的累积统计(std_window,通常 30-50 步)。

  • 热身前(< 20 步):历史 z4h 由 OLS β 计算,混入 AZ 的缓冲区
  • 热身后:z4h 切换为 Kalman β 计算

切换后,AZ 的 ema/std 完全过渡到 Kalman β 体系约需 30-50 根 K 线(5-8 天)
过渡期内 AZ 阈值判断可能偏松或偏紧,但影响是渐进的,不会突变。


差异总览

场景 Z-score 变化 AZ 变化 信号影响
β 稳定 几乎无差异 几乎无差异
β 缓慢漂移 幅度偏小、更居中 更稳定 减少虚假信号
β 突变 被 Gate3 过滤 被 Gate3 过滤 过滤假信号
β 大幅偏离 符号可能翻转 跟随翻转 方向更准,过渡期需监控
AZ 过渡期 基准混合,渐进偏移 5-8 天内恢复

监控建议

升级上线后,建议在前 30-50 根 4h K 线(5-8 天) 内重点关注以下日志:

# 每步 Kalman β vs OLS β 偏差
[IMM] PURR/.../HYPE/... #  42 | β=0.6523(K) +0.0042vsOLS | ...

# 体制穿越(Gate3 触发前的预警)
[IMM] ...-体制↑ # 104 | regime_score 0.283→0.731 穿越阈值0.7 ...

# ν 适应(尾部分布变化)
[IMM] ...-ν适应 # 103 | ν: 8.30→7.65 ↓厚尾 ...

如果 β(K) vsOLS 偏差持续 > 0.1 或频繁出现体制穿越,说明两个算法对当前配对的 β 认知差异较大,需结合实际 PnL 判断哪个更准确。


相关配置

参数 默认值 说明
IMM_KALMAN_WARMUP 20 热身步数,未达到时 Z-score 仍用 OLS β
IMM_REGIME_GATE_THRESHOLD 0.7 Gate3 触发阈值
BETA_WINDOW 100 OLS β 滚动窗口(K 线数)
ZSCORE_WINDOW 30 Z-score 统计窗口(K 线数)
HEDGE_BETA_MIN 0.1 Kalman β 用于 hedge ratio 的下界
HEDGE_BETA_MAX 5.0 Kalman β 用于 hedge ratio 的上界

Read more

AMI的优越性

世界模型(World Models)的具体例子 如下,我按类型分类,便于理解。每类都附带实际实现、演示效果和应用场景。 1. Yann LeCun / Meta 的 JEPA 系列(最直接对应“世界模型”概念) 这些是 LeCun 主张的非生成式抽象预测世界模型代表。 * I-JEPA(Image JEPA,2023) 输入一张图像,模型把不同区域(context 和 target)编码成抽象表示,然后预测 target 的表示(不在像素级别重建)。 例子:给定一张遮挡了部分物体的图片,模型能预测“被遮挡物体的大致位置和属性”,构建对物体持久性和空间关系的理解。 这是一个“原始世界模型”,能学习物理常识(如物体不会凭空消失)。 * V-JEPA / V-JEPA 2(Video JEPA,

By SHI XIAOLONG

什么是:“世界模型(World Models)”

世界模型(World Models) 是人工智能领域的一个核心概念,尤其在 Yann LeCun 等研究者推动的下一代 AI 架构中占据中心位置。它指的是 AI 系统在内部构建的对现实世界的抽象模拟或内部表示,让机器能够像人类或动物一样“理解”物理世界、预测未来、规划行动。 简单比喻 想象你闭上眼睛也能“看到”房间里的物体会如何移动、碰撞或掉落——这就是你大脑里的世界模型。AI 的世界模型就是类似的“数字孪生”(digital twin)或“内部模拟器”:它不是简单记住数据,而是学习世界的动态、因果关系和物理直觉(如重力、物体持久性、遮挡、因果等)。 为什么需要世界模型? 当前主流的大型语言模型(LLM) 擅长处理文本(统计模式预测),但存在根本局限: * 缺乏对物理世界的真正理解 → 容易“幻觉”、无法可靠规划。 * 样本效率低 → 人类/

By SHI XIAOLONG

K线周期可配置化设计方案

K线周期可配置化设计方案 1. 背景与目标 当前 Beta 套利策略的 K 线周期硬编码为 "1h",分散在多个文件中。需要: 1. 将 K 线周期从 1h 改为 2h 2. 提取为环境变量 BETA_ARB_KLINE_INTERVAL,使其可在 .env 中配置 2. 影响范围分析 2.1 需要修改的文件(共 6 个) 文件 硬编码位置 修改内容 src/trading/config.py BetaArbConfig dataclass 新增 kline_interval 字段,

By SHI XIAOLONG

对于空间环境、“信息/逻辑”(比如代码、结构、表达)秩序追求的心理特征分析

一、为什么是“空间 + 信息”同时强化? 因为你当年面对的是“双重失控”: 1️⃣ 外部世界是脏乱 + 失序的 * 空间被污染 * 行为无边界 * 基本生活秩序崩塌 👉 所以你现在会强烈要求: * 桌面干净 * 房间有序 * 物品可控 这是在修复:“物理世界必须是可控的” 2️⃣ 人的行为和逻辑也是混乱的 * 没有规则 * 没有底线 * 没有理性 👉 所以你现在会特别在意: * 表达是否清晰 * 逻辑是否自洽 * 结构是否优雅 * 代码是否干净 这是在修复:“认知世界必须是合理的” 二、你其实构建了一个“高纯度系统” 你现在的偏好,本质上是: 👉 低噪音 + 高结构 + 强控制感 具体表现就是: * 空间:极简、整洁、可预测 * 信息:清晰、压缩、无冗余 这类人有一个很明显的优势: 👉 处理复杂问题时,

By SHI XIAOLONG