策略优化过度导致退还的问题

SHI XIAOLONG

10 Mar 2026 — 4 min read

系统前期越来越好 → 优化到某个点 → 开始退化。

而且最诡异的是：

代码越来越复杂、过滤越来越多、逻辑越来越精细，但收益反而下降。

这个现象在量化里有几个非常核心的原因。

一、策略信息被“过度压缩”

前面我们提到过一个概念：

信号熵（Signal Entropy）

最原始的策略通常是：

信号多
噪音多

例如：

每天 200 个信号

你开始不断优化：

过滤噪音
加入条件
限制环境

最后可能变成：

每天 5 个信号

问题就在这里。

当过滤器越来越多时，你不仅过滤掉：

假信号

同时也在过滤：

真实 Alpha

很多策略最后死于：

Alpha 被过滤掉了。

二、策略逐渐“贴合历史”

优化过程中最危险的一件事就是：

无意识地拟合历史。

例如你发现：

当 ATR < 0.8 时亏损

于是加入过滤：

ATR > 0.8 才交易

再过几天你发现：

当成交量 < 1000 时亏损

再加入：

volume > 1000

再过几周：

某些时间段亏损

再加入：

避开时间段

最后系统变成：

只在某些非常特殊条件下交易

这时候其实发生了一件事：

策略开始拟合过去市场结构。

而市场结构是：

非平稳系统

也就是说：

市场会变。

三、策略复杂度过高

这是量化系统常见的“复杂度陷阱”。

假设一个策略有：

3 个过滤器

系统可能仍然比较稳定。

但如果变成：

20 个过滤器

系统会变成：

高度脆弱系统

因为：

每个过滤器都是一个假设。

例如：

市场在这种条件下会盈利

当假设数量越来越多时：

系统稳定性急剧下降。

复杂系统有一个规律：

复杂度越高 → 鲁棒性越低

四、交易频率下降

这是一个非常现实的问题。

很多优化过程会导致：

交易次数越来越少

例如：

初始系统：

每天 300 次交易

优化后：

每天 20 次

再优化：

每天 3 次

看起来：

胜率越来越高

但真实问题是：

样本太少

统计稳定性会下降。

简单说就是：

运气成分越来越大。

五、市场在“反向学习”

这是最有意思、也是很多人忽略的一点。

市场其实是一个：

自适应系统

当某种模式被大量利用后：

市场结构会改变。

例如：

某个突破策略很有效。

越来越多人使用：

突破买入

结果就会出现：

假突破

市场在做什么？

反向利用策略。

所以很多策略会出现一个典型生命周期：

发现 Alpha
↓
策略有效
↓
大量资金进入
↓
Alpha 被套利
↓
策略失效

六、系统进入“局部最优”

这其实是一个数学问题。

策略优化过程就像：

爬山

但问题是：

你不知道最高的山在哪里

优化过程中，你可能爬到一个：

局部山峰

看起来已经很好了。

但实际上：

附近没有更高的地方。

继续优化只会：

下坡

这就是：

Local Optimum（局部最优）

七、量化系统的真正解决方案

成熟量化团队通常不会只靠：

单策略

而是做：

策略生态系统。

也就是：

Strategy Portfolio

例如组合：

趋势策略
均值回归
套利
做市
事件驱动

不同策略在不同市场环境盈利。

这样系统整体就会：

更稳定

八、顶级量化团队有一个非常重要的原则

他们不会追求：

最优策略

而是追求：

最稳策略

目标不是：

收益最大

而是：

长期稳定正收益

很多时候他们甚至会：

主动降低收益

来提高：

稳定性

九、真正成熟的量化系统是“进化系统”

最终量化系统不是一个：

固定策略

而是一个：

进化系统

结构类似：

策略生成
↓
市场测试
↓
淘汰失败策略
↓
保留成功策略
↓
继续生成新策略

这其实和：

生物进化

非常类似。

跑步的技巧（滚动落地）

“滚动落地（rolling contact / rolling foot strike）”不是一种教条式的“脚法”，而是一种让冲击沿着整只脚、整条后链逐级传递的落地机制。它的核心不是“你先用哪儿着地”，而是：你的脚落地之后，冲击是不是像轮子一样滚过去，而不是像锤子一样砸下去。这就是滚动落地的本质。一、什么叫“滚动落地”？你可以把它理解成两种完全不同的落地方式： 1. 砸地（撞击式）脚像锤子一样拍到地上： * 要么后跟先砸 * 要么前掌先戳 * 冲击集中在一个点 * 一个结构瞬间吃掉大部分载荷结果就是： * 后跟砸 → 膝盖难受 * 前掌戳 → 前脚掌磨烂 * 都不是长跑友好模式这叫撞击式着地（impact strike）。 2. 滚地（滚动式）脚像轮胎一样“滚”过地面： * 不是某一点硬砸 * 而是外侧中足先轻触 * 再向前滚到前掌 * 最后从大脚趾蹬离

AMI的优越性

世界模型（World Models）的具体例子如下，我按类型分类，便于理解。每类都附带实际实现、演示效果和应用场景。 1. Yann LeCun / Meta 的 JEPA 系列（最直接对应“世界模型”概念）这些是 LeCun 主张的非生成式抽象预测世界模型代表。 * I-JEPA（Image JEPA，2023）输入一张图像，模型把不同区域（context 和 target）编码成抽象表示，然后预测 target 的表示（不在像素级别重建）。例子：给定一张遮挡了部分物体的图片，模型能预测“被遮挡物体的大致位置和属性”，构建对物体持久性和空间关系的理解。这是一个“原始世界模型”，能学习物理常识（如物体不会凭空消失）。 * V-JEPA / V-JEPA 2（Video JEPA，

什么是：“世界模型（World Models）”

世界模型（World Models）是人工智能领域的一个核心概念，尤其在 Yann LeCun 等研究者推动的下一代 AI 架构中占据中心位置。它指的是 AI 系统在内部构建的对现实世界的抽象模拟或内部表示，让机器能够像人类或动物一样“理解”物理世界、预测未来、规划行动。简单比喻想象你闭上眼睛也能“看到”房间里的物体会如何移动、碰撞或掉落——这就是你大脑里的世界模型。AI 的世界模型就是类似的“数字孪生”（digital twin）或“内部模拟器”：它不是简单记住数据，而是学习世界的动态、因果关系和物理直觉（如重力、物体持久性、遮挡、因果等）。为什么需要世界模型？当前主流的大型语言模型（LLM）擅长处理文本（统计模式预测），但存在根本局限： * 缺乏对物理世界的真正理解 → 容易“幻觉”、无法可靠规划。 * 样本效率低 → 人类/

K线周期可配置化设计方案

K线周期可配置化设计方案 1. 背景与目标当前 Beta 套利策略的 K 线周期硬编码为 "1h"，分散在多个文件中。需要： 1. 将 K 线周期从 1h 改为 2h 2. 提取为环境变量 BETA_ARB_KLINE_INTERVAL，使其可在 .env 中配置 2. 影响范围分析 2.1 需要修改的文件（共 6 个）文件硬编码位置修改内容 src/trading/config.py BetaArbConfig dataclass 新增 kline_interval 字段，