策略优化过度导致退还的问题

系统前期越来越好 → 优化到某个点 → 开始退化。

而且最诡异的是:

代码越来越复杂、过滤越来越多、逻辑越来越精细,但收益反而下降。

这个现象在量化里有几个非常核心的原因。


一、策略信息被“过度压缩”

前面我们提到过一个概念:

信号熵(Signal Entropy)

最原始的策略通常是:

信号多
噪音多

例如:

每天 200 个信号

你开始不断优化:

过滤噪音
加入条件
限制环境

最后可能变成:

每天 5 个信号

问题就在这里。

当过滤器越来越多时,你不仅过滤掉:

假信号

同时也在过滤:

真实 Alpha

很多策略最后死于:

Alpha 被过滤掉了。


二、策略逐渐“贴合历史”

优化过程中最危险的一件事就是:

无意识地拟合历史。

例如你发现:

当 ATR < 0.8 时亏损

于是加入过滤:

ATR > 0.8 才交易

再过几天你发现:

当成交量 < 1000 时亏损

再加入:

volume > 1000

再过几周:

某些时间段亏损

再加入:

避开时间段

最后系统变成:

只在某些非常特殊条件下交易

这时候其实发生了一件事:

策略开始拟合过去市场结构。

而市场结构是:

非平稳系统

也就是说:

市场会变。


三、策略复杂度过高

这是量化系统常见的“复杂度陷阱”。

假设一个策略有:

3 个过滤器

系统可能仍然比较稳定。

但如果变成:

20 个过滤器

系统会变成:

高度脆弱系统

因为:

每个过滤器都是一个假设。

例如:

市场在这种条件下会盈利

当假设数量越来越多时:

系统稳定性急剧下降。

复杂系统有一个规律:

复杂度越高 → 鲁棒性越低


四、交易频率下降

这是一个非常现实的问题。

很多优化过程会导致:

交易次数越来越少

例如:

初始系统:

每天 300 次交易

优化后:

每天 20 次

再优化:

每天 3 次

看起来:

胜率越来越高

但真实问题是:

样本太少

统计稳定性会下降。

简单说就是:

运气成分越来越大。


五、市场在“反向学习”

这是最有意思、也是很多人忽略的一点。

市场其实是一个:

自适应系统

当某种模式被大量利用后:

市场结构会改变。

例如:

某个突破策略很有效。

越来越多人使用:

突破买入

结果就会出现:

假突破

市场在做什么?

反向利用策略。

所以很多策略会出现一个典型生命周期:

发现 Alpha
↓
策略有效
↓
大量资金进入
↓
Alpha 被套利
↓
策略失效

六、系统进入“局部最优”

这其实是一个数学问题。

策略优化过程就像:

爬山

但问题是:

你不知道最高的山在哪里

优化过程中,你可能爬到一个:

局部山峰

看起来已经很好了。

但实际上:

附近没有更高的地方。

继续优化只会:

下坡

这就是:

Local Optimum(局部最优)


七、量化系统的真正解决方案

成熟量化团队通常不会只靠:

单策略

而是做:

策略生态系统。

也就是:

Strategy Portfolio

例如组合:

趋势策略
均值回归
套利
做市
事件驱动

不同策略在不同市场环境盈利。

这样系统整体就会:

更稳定

八、顶级量化团队有一个非常重要的原则

他们不会追求:

最优策略

而是追求:

最稳策略

目标不是:

收益最大

而是:

长期稳定正收益

很多时候他们甚至会:

主动降低收益

来提高:

稳定性

九、真正成熟的量化系统是“进化系统”

最终量化系统不是一个:

固定策略

而是一个:

进化系统

结构类似:

策略生成
↓
市场测试
↓
淘汰失败策略
↓
保留成功策略
↓
继续生成新策略

这其实和:

生物进化

非常类似。

Read more

跑步的技巧(滚动落地)

“滚动落地(rolling contact / rolling foot strike)”不是一种教条式的“脚法”,而是一种 让冲击沿着整只脚、整条后链逐级传递的落地机制。 它的核心不是“你先用哪儿着地”,而是: 你的脚落地之后,冲击是不是像轮子一样滚过去,而不是像锤子一样砸下去。 这就是滚动落地的本质。 一、什么叫“滚动落地”? 你可以把它理解成两种完全不同的落地方式: 1. 砸地(撞击式) 脚像锤子一样拍到地上: * 要么后跟先砸 * 要么前掌先戳 * 冲击集中在一个点 * 一个结构瞬间吃掉大部分载荷 结果就是: * 后跟砸 → 膝盖难受 * 前掌戳 → 前脚掌磨烂 * 都不是长跑友好模式 这叫 撞击式着地(impact strike)。 2. 滚地(滚动式) 脚像轮胎一样“滚”过地面: * 不是某一点硬砸 * 而是外侧中足先轻触 * 再向前滚到前掌 * 最后从大脚趾蹬离

By SHI XIAOLONG

AMI的优越性

世界模型(World Models)的具体例子 如下,我按类型分类,便于理解。每类都附带实际实现、演示效果和应用场景。 1. Yann LeCun / Meta 的 JEPA 系列(最直接对应“世界模型”概念) 这些是 LeCun 主张的非生成式抽象预测世界模型代表。 * I-JEPA(Image JEPA,2023) 输入一张图像,模型把不同区域(context 和 target)编码成抽象表示,然后预测 target 的表示(不在像素级别重建)。 例子:给定一张遮挡了部分物体的图片,模型能预测“被遮挡物体的大致位置和属性”,构建对物体持久性和空间关系的理解。 这是一个“原始世界模型”,能学习物理常识(如物体不会凭空消失)。 * V-JEPA / V-JEPA 2(Video JEPA,

By SHI XIAOLONG

什么是:“世界模型(World Models)”

世界模型(World Models) 是人工智能领域的一个核心概念,尤其在 Yann LeCun 等研究者推动的下一代 AI 架构中占据中心位置。它指的是 AI 系统在内部构建的对现实世界的抽象模拟或内部表示,让机器能够像人类或动物一样“理解”物理世界、预测未来、规划行动。 简单比喻 想象你闭上眼睛也能“看到”房间里的物体会如何移动、碰撞或掉落——这就是你大脑里的世界模型。AI 的世界模型就是类似的“数字孪生”(digital twin)或“内部模拟器”:它不是简单记住数据,而是学习世界的动态、因果关系和物理直觉(如重力、物体持久性、遮挡、因果等)。 为什么需要世界模型? 当前主流的大型语言模型(LLM) 擅长处理文本(统计模式预测),但存在根本局限: * 缺乏对物理世界的真正理解 → 容易“幻觉”、无法可靠规划。 * 样本效率低 → 人类/

By SHI XIAOLONG

K线周期可配置化设计方案

K线周期可配置化设计方案 1. 背景与目标 当前 Beta 套利策略的 K 线周期硬编码为 "1h",分散在多个文件中。需要: 1. 将 K 线周期从 1h 改为 2h 2. 提取为环境变量 BETA_ARB_KLINE_INTERVAL,使其可在 .env 中配置 2. 影响范围分析 2.1 需要修改的文件(共 6 个) 文件 硬编码位置 修改内容 src/trading/config.py BetaArbConfig dataclass 新增 kline_interval 字段,

By SHI XIAOLONG