全系统key配对升级 bug13
配对维度Key优化后的系统缺陷分析报告
分析日期:2026-02-20
分析范围:全系统 Key 改为配对维度 (PairKey = (symbol, base_symbol) tuple) 后的残留问题
🔴 高严重性缺陷
缺陷1:orchestrator.py 强制要求非空 base_symbol,单币模式可能完全失效
位置: src/trading/orchestrator.py:296-299 和 L454-457
# process_analysis 入口
base_symbol = multi_period_result.get("base_symbol", "")
if not base_symbol:
logger.error(f"process_analysis: base_symbol 缺失,跳过本次 tick | {symbol}")
return False
# on_entry_signal 入口
base_symbol = multi_period_result.get("base_symbol", "")
if not base_symbol:
logger.error(f"on_entry_signal: base_symbol 缺失,跳过 | {symbol}")
return False
问题:
if not base_symbol:将空字符串""和None同等处理,都会返回 False- 配置默认值
pair_mode: str = "single",在单币模式下base_symbol=""是合法状态 - service 文件(
realtime_kline_service*.py)未在修改列表中,意味着它们可能仍然不在multi_period_result中提供base_symbol - 若 service 没有更新,所有 tick 将被静默丢弃,系统无法开仓
影响:在单币模式下可能导致系统完全无法运行(所有信号被丢弃但不会崩溃)
🟠 中严重性缺陷
缺陷2:risk_manager.py 直接使用 position.base_symbol 未做 None 保护
位置: src/trading/risk_manager.py:235 和 L280
# L235 - check_stop_loss
stop_loss_pct = self._config.get_strategy_params(
position.symbol, position.base_symbol # ❌ 没有 or ""
).stop_loss_pct
# L280 - check_max_hold_duration
max_hold_hours = self._config.get_strategy_params(
position.symbol, position.base_symbol # ❌ 没有 or ""
).max_hold_hours
get_strategy_params 内部执行:
base_asset = base_symbol.split('/')[0] if '/' in base_symbol else base_symbol
若 position.base_symbol 为 None(数据库恢复时可能发生),则 None.split('/') 会抛出 TypeError,导致止损检查和最大持仓时间检查崩溃。
对比其他模块正确做法(position_manager.py:84):
key = (signal.symbol, signal.base_symbol or "") # ✅ 有 or ""
影响:止损线程崩溃,仓位无法得到止损保护
修复方案:
stop_loss_pct = self._config.get_strategy_params(
position.symbol, position.base_symbol or "" # ✅
).stop_loss_pct
缺陷3(关联缺陷2):止损监控整条链路受 None base_symbol 影响
位置: src/trading/orchestrator.py(stop_loss_monitor 线程)
止损监控线程调用链:
stop_loss_monitor()
→ risk_manager.check_stop_loss(position) # TypeError if base_symbol=None
→ risk_manager.check_max_hold_duration(pos) # TypeError if base_symbol=None
→ on_exit_signal(reversion_info) # 传递 None base_symbol 给下游
数据库恢复仓位时 base_symbol 可能为 NULL(数据库层),未做统一的 None→"" 转换。
🟡 低严重性缺陷
缺陷4:孤儿仓位 key 与单币模式 key 语义歧义
位置: src/trading/position_manager.py:669-686
孤儿收纳逻辑:
orphan = PairPosition(
symbol=orphan_symbol, # = original_position.base_symbol, 如 "HYPE/USDC:USDC"
base_symbol="", # 孤儿无 base
...
)
orphan_key = _pair_key(orphan) # → ("HYPE/USDC:USDC", "")
with self._lock:
if orphan_key in self._positions:
logger.info(f"base 腿 {orphan_symbol} 已在管理中,跳过收纳")
return
问题:
- 孤儿仓位 key =
("HYPE/USDC:USDC", "") - 真正的单币模式 HYPE 仓位 key 也是
("HYPE/USDC:USDC", "") - 若先有一个正常单币仓位,孤儿收纳会误判"已在管理中"而跳过
- 两者在字典中无法区分
缺陷5:strategy.py signal_history 清理阈值固定,高频场景存在内存积累
位置: src/trading/strategy.py:534-538
self._signal_history[signal_key] = now + self._signal_cooldown
# 惰性清理:只在条目数超过阈值时扫描一次过期条目
if len(self._signal_history) > 500:
self._signal_history = {
k: v for k, v in self._signal_history.items() if v > now
}
清理阈值固定为 500。在多配对 × 高频信号场景下,列表可能长期维持在 499 而从不触发清理,导致过期条目持续积累。
缺陷6:config.py pair_strategy_overrides 格式说明不完整
位置: src/trading/config.py:114-115
# 按配对策略参数覆盖(key = "ALT|BASE",如 "PURR|HYPE",优先级高于 symbol_strategy_overrides)
pair_strategy_overrides: dict[str, StrategyParams] = field(default_factory=dict)
pair_strategy_overrides 内部使用字符串格式 "PURR|HYPE"(仅 coin 名,无 /USDC:USDC 后缀),而系统其他地方使用元组 ("PURR/USDC:USDC", "HYPE/USDC:USDC")。
虽然 get_strategy_params 方法在查询时会正确截断(L122-127),格式内部一致,但两种表示形式并存会给后续维护带来混淆风险。
✅ 已正确实现的部分(澄清)
以下几点经审查是正确设计,不是缺陷:
signal_history key 已包含 base_symbol
src/trading/strategy.py:527
signal_key = f"{symbol}:{base_symbol}:{entry_signal.direction}:{int(dedup_time.timestamp())}"
✅ 正确,信号去重已按配对维度区分
config.py pair_strategy_overrides 格式自洽
get_strategy_params 在查询时先将完整 symbol 截断为 coin 名:
alt_asset = symbol.split('/')[0] if '/' in symbol else symbol # "PURR/USDC:USDC" → "PURR"
base_asset = base_symbol.split('/')[0] if '/' in base_symbol else base_symbol
result = _casefold_get(self.pair_strategy_overrides, f"{alt_asset}|{base_asset}") # "PURR|HYPE"
✅ 存储与查询格式一致
risk_manager.py pre_trade_check 重复仓位检查有 or "" 保护
sig_base = signal.base_symbol or ""
for pos in open_positions:
if pos.symbol == signal.symbol and (pos.base_symbol or "") == sig_base:
✅ 正确处理了 None 情况
主要状态字典格式统一
strategy._baselines,._positions,._prev_above_threshold等position_manager._positions,._opening_pairs
均使用 (symbol, base_symbol or "") 元组格式,内部一致。
缺陷优先级汇总
| # | 文件 | 行号 | 缺陷描述 | 严重性 | 触发条件 |
|---|---|---|---|---|---|
| 1 | orchestrator.py | 297-299, 455-457 | 强制非空 base_symbol,单币模式全部 tick 被丢弃 | 🔴 高 | single 模式运行时 |
| 2 | risk_manager.py | 235, 280 | base_symbol 无 or "" 保护,止损/超时检查 TypeError |
🟠 中 | DB 恢复仓位 base_symbol=None 时 |
| 3 | orchestrator.py | stop_loss_monitor | None base_symbol 连锁影响止损监控整条链路 | 🟠 中 | 同上 |
| 4 | position_manager.py | 669-686 | 孤儿仓位与单币仓位 key 无法区分 | 🟡 低 | 同时存在孤儿和同币种单币仓位 |
| 5 | strategy.py | 534-538 | signal_history 清理阈值固定,高频场景内存积累 | 🟡 低 | 多配对高频信号场景 |
| 6 | config.py | 114-115 | pair_strategy_overrides 格式文档不清晰 | 🟡 低 | 维护/扩展时 |
验证建议
- 缺陷1验证:检查
src/services/realtime_kline_service*.py中multi_period_result是否总包含非空base_symbol;在 single 模式下跑完整的开仓→平仓生命周期 - 缺陷2/3验证:在数据库中插入一条
base_symbol=NULL的仓位记录,重启系统后触发止损,观察是否崩溃 - 缺陷4验证:模拟配对仓位 Leg B 平仓失败场景,确认孤儿收纳逻辑不误判
- 整体回归:pair 模式下完整运行开仓→持仓→止损/超时/均值回归平仓四条退出路径