时间序列分析中的自相关结构

在时间序列分析中,自相关结构(Autocorrelation Structure) 指的是数据与其自身过去值之间相互关联的规律性组织方式

简单来说,如果“自相关”是描述今天和昨天有多像,那么“自相关结构”就是描述这种“相像”是如何随着时间回溯而演变的整体模式


1. 直观理解:记忆的形状

自相关结构就像是一个系统的“记忆模式”。不同的系统,记忆的持久度和方式不同:

  • 线性消散结构(AR 模型): 记忆像回声一样逐渐减弱。今天的价格受昨天影响最大,受前天影响小一些,依此类推。
  • 季节性结构(Seasonal): 记忆具有周期性。比如今天(周五)的交通状况可能跟昨天关系不大,但跟上周五极其相似。
  • 白噪声结构(White Noise): 系统没有记忆。每一个数据点都是完全独立的,不存在任何结构。

2. 核心度量工具

要“看到”自相关结构,通常使用以下两个函数:

  • ACF (自相关函数): 测量 $t$ 时刻与 $t-k$ 时刻之间的总相关性。它包含了所有中间时刻传导过来的影响。
  • PACF (偏自相关函数): 剔除了中间时刻的影响,只测量 $t$ 与 $t-k$ 之间的直接相关性。
结构类型ACF 特征PACF 特征物理含义
自回归 (AR)拖尾(指数级衰减)$p$ 阶后截断当前值主要由过去 $p$ 个值直接决定。
移动平均 (MA)$q$ 阶后截断拖尾(衰减)当前值受过去 $q$ 个随机冲击的影响。
趋势性衰减极慢,长年保持高位第一阶非常高数据有明显的上升或下降长趋势。

3. 为什么在 4H 报告中强调它?

在提到“4H 数据自相关结构变简单”时,报告的潜台词是:

  1. 高频数据的自相关结构很“乱”: 5 分钟线下,受订单流、微观博弈影响,ACF 可能在很多阶(比如 Lag 1, 2, 7, 15...)都有显著的尖峰。为了处理这种复杂的结构,ADF 检验必须包含非常多的滞后项(Lag),这会吃掉大量自由度。
  2. 低频(4H)的自相关结构很“纯”: 经过时间聚合,微观噪声抵消了。剩下的通常只是简单的 AR(1)AR(2) 结构。
    • 数学结果: $n$(样本量)虽然变小了,但模型需要的 $p$(滞后阶数)也变小了。
    • 有效自由度 $df \approx n - p$: 只要 $p$ 降得够快,即使 $n=100$,剩下的有效信息依然足以支撑统计结论。

总结

自相关结构就是时间序列的“指纹”。 * 如果指纹很模糊(高频噪声多),你需要很多样本才能看清。

  • 如果指纹很清晰(低频逻辑强),只要几十个点,你就能断定这个序列的演变规律。

Read more

跑步的技巧(滚动落地)

“滚动落地(rolling contact / rolling foot strike)”不是一种教条式的“脚法”,而是一种 让冲击沿着整只脚、整条后链逐级传递的落地机制。 它的核心不是“你先用哪儿着地”,而是: 你的脚落地之后,冲击是不是像轮子一样滚过去,而不是像锤子一样砸下去。 这就是滚动落地的本质。 一、什么叫“滚动落地”? 你可以把它理解成两种完全不同的落地方式: 1. 砸地(撞击式) 脚像锤子一样拍到地上: * 要么后跟先砸 * 要么前掌先戳 * 冲击集中在一个点 * 一个结构瞬间吃掉大部分载荷 结果就是: * 后跟砸 → 膝盖难受 * 前掌戳 → 前脚掌磨烂 * 都不是长跑友好模式 这叫 撞击式着地(impact strike)。 2. 滚地(滚动式) 脚像轮胎一样“滚”过地面: * 不是某一点硬砸 * 而是外侧中足先轻触 * 再向前滚到前掌 * 最后从大脚趾蹬离

By SHI XIAOLONG

AMI的优越性

世界模型(World Models)的具体例子 如下,我按类型分类,便于理解。每类都附带实际实现、演示效果和应用场景。 1. Yann LeCun / Meta 的 JEPA 系列(最直接对应“世界模型”概念) 这些是 LeCun 主张的非生成式抽象预测世界模型代表。 * I-JEPA(Image JEPA,2023) 输入一张图像,模型把不同区域(context 和 target)编码成抽象表示,然后预测 target 的表示(不在像素级别重建)。 例子:给定一张遮挡了部分物体的图片,模型能预测“被遮挡物体的大致位置和属性”,构建对物体持久性和空间关系的理解。 这是一个“原始世界模型”,能学习物理常识(如物体不会凭空消失)。 * V-JEPA / V-JEPA 2(Video JEPA,

By SHI XIAOLONG

什么是:“世界模型(World Models)”

世界模型(World Models) 是人工智能领域的一个核心概念,尤其在 Yann LeCun 等研究者推动的下一代 AI 架构中占据中心位置。它指的是 AI 系统在内部构建的对现实世界的抽象模拟或内部表示,让机器能够像人类或动物一样“理解”物理世界、预测未来、规划行动。 简单比喻 想象你闭上眼睛也能“看到”房间里的物体会如何移动、碰撞或掉落——这就是你大脑里的世界模型。AI 的世界模型就是类似的“数字孪生”(digital twin)或“内部模拟器”:它不是简单记住数据,而是学习世界的动态、因果关系和物理直觉(如重力、物体持久性、遮挡、因果等)。 为什么需要世界模型? 当前主流的大型语言模型(LLM) 擅长处理文本(统计模式预测),但存在根本局限: * 缺乏对物理世界的真正理解 → 容易“幻觉”、无法可靠规划。 * 样本效率低 → 人类/

By SHI XIAOLONG

K线周期可配置化设计方案

K线周期可配置化设计方案 1. 背景与目标 当前 Beta 套利策略的 K 线周期硬编码为 "1h",分散在多个文件中。需要: 1. 将 K 线周期从 1h 改为 2h 2. 提取为环境变量 BETA_ARB_KLINE_INTERVAL,使其可在 .env 中配置 2. 影响范围分析 2.1 需要修改的文件(共 6 个) 文件 硬编码位置 修改内容 src/trading/config.py BetaArbConfig dataclass 新增 kline_interval 字段,

By SHI XIAOLONG