为什么 BTC 动量在月频最强（数学原因）

SHI XIAOLONG

17 Jan 2026 — 3 min read

结论先行（一句话版）

BTC 的价格过程包含一个缓慢演化的状态变量（波动/情绪/杠杆），该状态在日频上被噪声淹没，在周频开始显现，在月频通过时间聚合最大化信噪比，因此动量统计量在月频最强。

下面分 4 层推导。

一、从一个最小随机过程模型开始

假设 BTC 的对数收益不是纯白噪声，而是：

[
r_t = \mu_t + \sigma_t \varepsilon_t,\quad \varepsilon_t \sim iid(0,1)
]

其中：

μₜ：慢变的“趋势/情绪/杠杆”状态（不可观测）
σₜ：条件波动（强自相关）
εₜ：高频噪声

关键假设（BTC 的本质）：

[
\mu_t = \phi \mu_{t-1} + \eta_t,\quad \phi \lesssim 1
]

👉 μₜ 是一个接近单位根的 AR(1)（极慢均值回复）

二、为什么日频动量弱？（噪声主导）

日收益：

[
r_t = \mu_t + \sigma_t \varepsilon_t
]

信噪比（SNR）近似：

[
\text{SNR}_{\text{daily}} \approx \frac{\text{Var}(\mu_t)}{\text{Var}(\sigma_t \varepsilon_t)}
]

在 BTC 中：

σₜ 很大（高波动）
εₜ 的方差远大于 μₜ 的瞬时变化

所以：

日频动量被噪声淹没，t-stat 很低

这也是为什么你用 daily momentum 往往看不到稳健显著性。

三、时间聚合：月收益在数学上做了什么？

定义 k 日收益：

[
R_t^{(k)} = \sum_{i=0}^{k-1} r_{t-i}
]

代入：

[
R_t^{(k)} = \sum \mu_{t-i} + \sum \sigma_{t-i}\varepsilon_{t-i}
]

1️⃣ 噪声项如何随 k 增长？

如果 εₜ 近似独立：

[
\text{Var}\left(\sum \sigma_{t-i}\varepsilon_{t-i}\right)
\sim O(k)
]

即：

[
\text{Std(noise)} \sim \sqrt{k}
]

2️⃣ 信号项如何随 k 增长？

因为 μₜ 高度自相关（φ≈1）：

[
\sum_{i=0}^{k-1} \mu_{t-i}
\approx k \cdot \mu_t
]

所以：

[
\text{Mean(signal)} \sim O(k)
]

3️⃣ 信噪比的关键结果

[
\text{SNR}(k) \sim \frac{k}{\sqrt{k}} = \sqrt{k}
]

👉 时间聚合本身放大了趋势信号

四、那为什么不是“越长越好”？为什么月频最强？

这是关键。

1️⃣ μₜ 不是永久趋势

μₜ 的 AR(1)：

[
\mu_t = \phi \mu_{t-1} + \eta_t
]

其相关长度约为：

[
\tau \approx \frac{1}{1-\phi}
]

经验上（BTC）：

τ ≈ 20–40 个交易日
正好是 月度尺度

2️⃣ 当 k 超过 τ，会发生什么？

当 k ≫ τ：

μₜ 开始均值回复
正负 μ 在窗口内相互抵消

于是：

[
\sum_{i=0}^{k-1} \mu_{t-i}
\quad\text{不再线性增长}
]

但噪声仍然是 √k 增长。

👉 SNR 开始下降

五、数学上的“最佳聚合尺度”

把 SNR 写成函数：

[
\text{SNR}(k) \propto
\frac{1 - \phi^k}{(1 - \phi)\sqrt{k}}
]

当 φ → 1 时：

SNR 在 中等 k 处达到最大
k ≈ 1/(1−φ)

这就是：

BTC 动量在月频（而不是日、也不是年）最强的数学原因

六、为什么美股没有同样强的现象？

对比：

维度	BTC	美股
μₜ 的 φ	≈ 0.95–0.99	≈ 0.5–0.7
τ	20–40 天	几天
σₜ	极大	中等
市场结构	杠杆正反馈	价值锚 + 做市

于是：

美股的“最佳 k”在 周甚至日
但信号幅度本身就很弱

七、把这一切压缩成一段“论文级表述”

If returns are driven by a slowly evolving latent trend component with near-unit-root persistence, temporal aggregation improves the signal-to-noise ratio of momentum up to the characteristic correlation length of the latent state. In Bitcoin, this correlation length is on the order of one month, causing momentum profitability and statistical significance to peak at the monthly horizon.

八、一个交易者视角的翻译（但仍然严谨）

日频：噪声太大，看不见趋势
周频：开始看到结构
月频：刚好完整捕捉一轮“情绪 + 杠杆”的释放
更长：趋势开始反转或钝化

跑步的技巧（滚动落地）

“滚动落地（rolling contact / rolling foot strike）”不是一种教条式的“脚法”，而是一种让冲击沿着整只脚、整条后链逐级传递的落地机制。它的核心不是“你先用哪儿着地”，而是：你的脚落地之后，冲击是不是像轮子一样滚过去，而不是像锤子一样砸下去。这就是滚动落地的本质。一、什么叫“滚动落地”？你可以把它理解成两种完全不同的落地方式： 1. 砸地（撞击式）脚像锤子一样拍到地上： * 要么后跟先砸 * 要么前掌先戳 * 冲击集中在一个点 * 一个结构瞬间吃掉大部分载荷结果就是： * 后跟砸 → 膝盖难受 * 前掌戳 → 前脚掌磨烂 * 都不是长跑友好模式这叫撞击式着地（impact strike）。 2. 滚地（滚动式）脚像轮胎一样“滚”过地面： * 不是某一点硬砸 * 而是外侧中足先轻触 * 再向前滚到前掌 * 最后从大脚趾蹬离

AMI的优越性

世界模型（World Models）的具体例子如下，我按类型分类，便于理解。每类都附带实际实现、演示效果和应用场景。 1. Yann LeCun / Meta 的 JEPA 系列（最直接对应“世界模型”概念）这些是 LeCun 主张的非生成式抽象预测世界模型代表。 * I-JEPA（Image JEPA，2023）输入一张图像，模型把不同区域（context 和 target）编码成抽象表示，然后预测 target 的表示（不在像素级别重建）。例子：给定一张遮挡了部分物体的图片，模型能预测“被遮挡物体的大致位置和属性”，构建对物体持久性和空间关系的理解。这是一个“原始世界模型”，能学习物理常识（如物体不会凭空消失）。 * V-JEPA / V-JEPA 2（Video JEPA，

什么是：“世界模型（World Models）”

世界模型（World Models）是人工智能领域的一个核心概念，尤其在 Yann LeCun 等研究者推动的下一代 AI 架构中占据中心位置。它指的是 AI 系统在内部构建的对现实世界的抽象模拟或内部表示，让机器能够像人类或动物一样“理解”物理世界、预测未来、规划行动。简单比喻想象你闭上眼睛也能“看到”房间里的物体会如何移动、碰撞或掉落——这就是你大脑里的世界模型。AI 的世界模型就是类似的“数字孪生”（digital twin）或“内部模拟器”：它不是简单记住数据，而是学习世界的动态、因果关系和物理直觉（如重力、物体持久性、遮挡、因果等）。为什么需要世界模型？当前主流的大型语言模型（LLM）擅长处理文本（统计模式预测），但存在根本局限： * 缺乏对物理世界的真正理解 → 容易“幻觉”、无法可靠规划。 * 样本效率低 → 人类/

K线周期可配置化设计方案

K线周期可配置化设计方案 1. 背景与目标当前 Beta 套利策略的 K 线周期硬编码为 "1h"，分散在多个文件中。需要： 1. 将 K 线周期从 1h 改为 2h 2. 提取为环境变量 BETA_ARB_KLINE_INTERVAL，使其可在 .env 中配置 2. 影响范围分析 2.1 需要修改的文件（共 6 个）文件硬编码位置修改内容 src/trading/config.py BetaArbConfig dataclass 新增 kline_interval 字段，