次方量化 全球宏观 每月宏观 公众号 股票开户

什么是策略过拟合?

lindercube 2个月前 (10-30) 阅读数 256 #帮助文档

以前用果仁网做一个一个策略,很久没有去看了,发布前非常漂亮,分布以后,基本上一直在下跌。通常的做法是,做了策略在逻辑层面判断没有问题,再跑半年模拟盘,差别不大再做实盘。


image.png


这个问题精准聚焦了量化交易的核心痛点,量化策略过拟合是量化交易中最易踩坑的问题之一。它特指量化策略在历史行情数据回测中表现极佳(如高收益、低回撤),但投入实盘交易后,业绩却大幅下滑甚至亏损,本质是策略 “硬凑” 了历史数据的偶然波动,而非捕捉到可持续的市场规律。

一、核心特征:回测与实盘的 “天差地别”

量化策略过拟合的表现高度集中在 “回测完美,实盘拉胯”,具体有 3 个典型特征:


  1. 回测业绩异常优异:在历史数据中,策略的年化收益、夏普比率等指标远超市场平均水平,最大回撤极小,几乎无亏损周期。

  2. 实盘业绩迅速变脸:实盘运行后,收益骤降,甚至连续亏损,原本回测中的 “盈利机会” 在实盘中几乎不出现。

  3. 参数极度敏感:策略参数(如均线周期、止损比例)只要轻微调整,回测业绩就会大幅波动,无法保持稳定。

二、主要成因:量化策略的 “专属陷阱”

量化策略过拟合的成因与量化交易的操作逻辑强相关,主要源于 3 个环节的偏差:


  • 数据层面:用单一市场、单一时间段的历史数据训练策略,忽略了市场风格切换(如从成长股行情转向价值股行情);或数据存在 “幸存者偏差”,仅用当前存续的股票 / 品种回测,剔除了已退市、已摘牌的标的。

  • 策略设计层面:过度优化参数(即 “曲线拟合”),反复调整策略参数以适配某段历史数据的波动;或策略逻辑过于复杂(如嵌套多层指标、过度依赖小众信号),把历史数据中的偶然噪声当成了必然规律。

  • 回测机制层面:回测时未计入实际交易成本(如手续费、滑点),导致回测收益虚高;或用 “未来数据”(如盘中未确认的收盘价)进行回测,形成 “先知优势”,违背实盘交易逻辑。

三、避免方法:量化策略的 “抗过拟合手段”

解决量化策略过拟合,核心是让策略 “经得住市场变化的考验”,需从 3 个关键环节入手:


  1. 严格拆分数据样本:将历史数据分为 “训练集”(用于设计策略)、“验证集”(用于调整参数)、“样本外测试集”(未参与策略设计的独立数据,模拟实盘环境),仅用样本外数据验证策略有效性。

  2. 弱化参数优化,强化逻辑稳健:减少对参数的 “精调”,优先保证策略核心逻辑(如趋势跟踪、均值回归)符合市场本质规律;通过 “参数遍历测试”,确保参数在一定范围内波动时,策略业绩仍稳定。

  3. 还原实盘交易场景:回测时必须计入真实的交易成本(手续费、印花税、滑点);禁止使用 “未来函数”,确保回测时的信号与实盘下单时的信息完全一致(如用当日收盘价计算信号,次日开盘价下单)。


分享到:
评论列表
  •   lindercube  发布于 2025-11-18 16:34:26  回复该评论
    年限不重要,得看你这个曲线是不是精心调参数调出来的,如果随便改改参数就会导致收益骤减,那你实盘后策略大概率会跪,别说十年,过拟合二十年的收益都不是啥难事,一个稳健的量化策略需要有鲁棒性,剔除几个因子,换换模型,改改参数,策略的pnl都应该大差不差,这种情况下即使只跑个两三年的回测也具备实盘的条件。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

热门
标签列表