量化策略迭代方法论：影子系统 / 并行策略验证

SHI XIAOLONG

10 Mar 2026 — 3 min read

一、为什么必须“双系统并行”

1 新策略可能有逻辑 Bug

这是最基础的一层。

任何新的过滤器，例如：

volatility_filter
liquidity_filter
trend_filter

都可能出现：

边界条件错误
数据异常处理错误
API异常
状态机错误

例如：

ATR = 0

导致：

division by zero

或者：

NaN信号

这种问题只要跑几天：

一定会暴露出来。

2 新过滤器可能“杀死 Alpha”

这是更重要的一层。

量化策略最常见的错误是：

过滤掉盈利机会。

例如：

原系统：

一天 200 个信号
胜率 52%

加入过滤器后：

一天 20 个信号
胜率 60%

看起来更好了，但真实情况可能是：

真实盈利下降

因为：

交易频率下降太多。

真实量化收益公式其实是：

收益 = 胜率 × 盈亏比 × 交易次数

很多人只看：

胜率

这是非常危险的。

3 市场环境适配问题

新的过滤器可能只适合：

震荡行情
趋势行情

但不适合另一种。

例如：

trend_filter

在震荡市场会：

严重降低收益。

二、双系统并行的标准结构

A/B Strategy Testing

结构通常是：

系统A（旧策略）
系统B（新策略）

两套系统：

同样市场
同样数据
同样时间

唯一不同：

策略逻辑

两种常见模式

模式1：信号对比（最常见）

A系统：真实交易
B系统：只记录信号

记录：

signal_A
signal_B

然后统计：

差异交易

例如：

A交易了
B没交易

这就是：

过滤掉的交易

然后观察：

这些交易是盈利还是亏损

模式2：真实双账户（更真实）

A账户：旧策略
B账户：新策略

两套真实交易。

然后比较：

PNL
drawdown
sharpe

但这种成本稍高。

三、为什么测试周期必须是“几天”

市场具有：

状态切换

例如：

亚洲盘
欧美盘

或者：

震荡
趋势

如果只测试：

1天

很容易：

样本偏差

一般来说：

最少：

3–7天

比较合理。

如果是：

低频策略

甚至要：

几周

四、策略收紧其实是一个“信号熵压缩过程”

这是一个比较底层的视角。

原始策略：

信号熵很高
噪音很多

逐步降低：

signal entropy

但问题是：

如果压缩过度：

信息也被压缩掉

这就是：

Alpha Loss

所以正确方式不是：

一次性大幅过滤

而是：

渐进式压缩

你现在做的：

滚动收紧

就是最安全的方式。

五、你现在用的是“滚动优化模型”

整个流程其实是：

宽信号系统
↓
发现问题
↓
增加过滤
↓
并行验证
↓
上线
↓
继续发现问题
↓
继续过滤

这个过程叫：

Rolling Optimization

或者：

Incremental Hardening

很多成熟系统都是这样进化的。

六、为什么这种方法比“回测优化”强

传统量化流程是：

历史数据
↓
回测
↓
参数优化
↓
上线

问题是：

市场是非平稳系统

历史数据并不代表未来。

而你的方法是：

真实市场
↓
真实交易
↓
真实反馈
↓
策略修正

这是：

在线学习系统（Online Learning System）

比传统方法：

鲁棒很多。

七、最终成熟系统会进入“收敛阶段”

当系统跑到一定阶段，会出现一个现象：

可优化空间越来越小

例如：

新过滤器带来的改进：

PNL +10%

慢慢变成：

PNL +1%

最后变成：

PNL +0.1%

这时候系统其实已经：

接近稳定结构。

八、顶级量化团队还有一个额外层

在你的双系统之外，他们还会加：

第三层

研究系统
↓
影子系统
↓
生产系统

结构：

Research Strategy
↓
Shadow Trading
↓
Production Trading

你现在其实已经：

做到了第二层。

跑步的技巧（滚动落地）

“滚动落地（rolling contact / rolling foot strike）”不是一种教条式的“脚法”，而是一种让冲击沿着整只脚、整条后链逐级传递的落地机制。它的核心不是“你先用哪儿着地”，而是：你的脚落地之后，冲击是不是像轮子一样滚过去，而不是像锤子一样砸下去。这就是滚动落地的本质。一、什么叫“滚动落地”？你可以把它理解成两种完全不同的落地方式： 1. 砸地（撞击式）脚像锤子一样拍到地上： * 要么后跟先砸 * 要么前掌先戳 * 冲击集中在一个点 * 一个结构瞬间吃掉大部分载荷结果就是： * 后跟砸 → 膝盖难受 * 前掌戳 → 前脚掌磨烂 * 都不是长跑友好模式这叫撞击式着地（impact strike）。 2. 滚地（滚动式）脚像轮胎一样“滚”过地面： * 不是某一点硬砸 * 而是外侧中足先轻触 * 再向前滚到前掌 * 最后从大脚趾蹬离

AMI的优越性

世界模型（World Models）的具体例子如下，我按类型分类，便于理解。每类都附带实际实现、演示效果和应用场景。 1. Yann LeCun / Meta 的 JEPA 系列（最直接对应“世界模型”概念）这些是 LeCun 主张的非生成式抽象预测世界模型代表。 * I-JEPA（Image JEPA，2023）输入一张图像，模型把不同区域（context 和 target）编码成抽象表示，然后预测 target 的表示（不在像素级别重建）。例子：给定一张遮挡了部分物体的图片，模型能预测“被遮挡物体的大致位置和属性”，构建对物体持久性和空间关系的理解。这是一个“原始世界模型”，能学习物理常识（如物体不会凭空消失）。 * V-JEPA / V-JEPA 2（Video JEPA，

什么是：“世界模型（World Models）”

世界模型（World Models）是人工智能领域的一个核心概念，尤其在 Yann LeCun 等研究者推动的下一代 AI 架构中占据中心位置。它指的是 AI 系统在内部构建的对现实世界的抽象模拟或内部表示，让机器能够像人类或动物一样“理解”物理世界、预测未来、规划行动。简单比喻想象你闭上眼睛也能“看到”房间里的物体会如何移动、碰撞或掉落——这就是你大脑里的世界模型。AI 的世界模型就是类似的“数字孪生”（digital twin）或“内部模拟器”：它不是简单记住数据，而是学习世界的动态、因果关系和物理直觉（如重力、物体持久性、遮挡、因果等）。为什么需要世界模型？当前主流的大型语言模型（LLM）擅长处理文本（统计模式预测），但存在根本局限： * 缺乏对物理世界的真正理解 → 容易“幻觉”、无法可靠规划。 * 样本效率低 → 人类/

K线周期可配置化设计方案

K线周期可配置化设计方案 1. 背景与目标当前 Beta 套利策略的 K 线周期硬编码为 "1h"，分散在多个文件中。需要： 1. 将 K 线周期从 1h 改为 2h 2. 提取为环境变量 BETA_ARB_KLINE_INTERVAL，使其可在 .env 中配置 2. 影响范围分析 2.1 需要修改的文件（共 6 个）文件硬编码位置修改内容 src/trading/config.py BetaArbConfig dataclass 新增 kline_interval 字段，