我们为什么不预测市场

15-25%.

这是我们的首席程序员 Marcus 在项目启动第一天给出的数字。不是某个策略的胜率，不是模型的置信区间，而是他对”用 AI 直接预测外汇走势准确率上限”的诚实评估。

大多数团队拿到这个数字会做两件事中的一件：放弃，或者假装没看见。我们选了第三条路。

一个设计公司的团队

先交代背景。我们是一家位于多伦多的创意设计与技术公司，主业是品牌设计、网站开发和数字营销。团队架构包括项目管理部、程序开发部、设计部、数据分析部和文案组。没有人来自传统量化基金，没有人有金融 PhD，也没有人在投行坐过 trading desk。

这话说出来，大概已经有一半读者关掉了页面。

留下来的人，请继续。

我们做这件事的起因很简单：项目经理（也就是我）在十几年前读过一位资深经济学家的博客。陶冬，陶博士，曾任职于一家欧洲投资银行，担任亚太区首席经济学家。他从2005年开始在网上发表经济分析文章，写到2024年，将近二十年，上千篇文章，覆盖了2008金融海啸、欧债危机、美联储 QE、COVID冲击、以及最近的全球通胀周期。

他的文章有一个特点：不追热点，只看周期。在所有人恐慌的时候他说”这不是末日，是一个周期的尾声”；在所有人狂欢的时候他说”别急，通胀还没来”。将近二十年间不是次次都对，他自己也公开承认过判断失误。但他的错误率远低于行业平均水平，更重要的是，他有一套可复现的分析框架。

而最让我敬佩的，是他的坚持。将近二十年，几乎每周都在写，从未中断。每一篇都是他在繁忙的工作之余，花时间坐下来认真思考后的产出。这不是随手写的评论，是一位资深经济学家对全球经济长年累月的观察和沉淀。这份慷慨和坚持，做过内容创作的人都知道有多珍贵。

一个朴素的问题在我脑子里盘旋了两个月：

如果有一个系统，能记住这将近二十年里每一次经济周期的模式，然后在下一次类似模式出现时发出信号，这件事可不可以做？

注意，问题不是”能不能预测明天涨还是跌”。是”能不能识别我们现在站在哪个周期的哪个位置”。

这两个问题看起来像，其实完全不同。

15% 意味着什么

回到那个数字。

Marcus 的评估报告写了将近两千字，把项目每一个环节都拆开来打了分。系统架构 90% 可行。自动交易程序编写 85-90% 可行。但到了核心问题，”能不能预测货币走势”，他没有客气：

“外汇市场是弱有效市场，纯技术分析的预测准确率长期来看很难稳定超过 55-60%。专业量化基金用顶级硬件加专门训练的 ML 模型，年化收益也只有 10-30%。”

然后给出了那个数字：15-25%。

但他在报告末尾补了一段话，这段话后来成了整个项目的基石：

“好的交易系统不一定能让你暴富，但能让你避免因为冲动而大亏。关键不在于预测准不准，而在于当预测正确时你能赚多少，当预测错误时你能少亏多少。”

这句话的核心是一个被无数量化从业者验证过的事实：胜率只是等式的一部分，赔率和风控才决定最终结果。

一个胜率 55% 但风险收益比 1:2 的系统，长期跑下来会盈利。一个胜率 70% 但每次亏损吃掉五次盈利的系统，长期跑下来会破产。

所以问题不是”怎么把 15% 提高到 80%”，这条路是死路。问题是：有没有一种方法，能够在 15% 的基础上，通过改变问题本身来获得不对称的优势？

换一个问题

思路的转变发生在一次关于知识管理的讨论中。

当时团队已经收集了陶博士多年来发表在各个平台的经济分析文章。我们的金融分析师伟博提出了一套知识管理架构：把旧文章定期压缩归档，给新知识腾空间。

我听完之后说了一句话。这句话在当时连我自己都没意识到有多重要：

“对于经济分析来说，这样不行。旧知识不能归档。因为经济是循环的。”

十到十二年一个大循环。2008年发生过的事情，在2020年以变体的形式重新出现。1997年亚洲金融风暴的模式，在2022年新兴市场债务危机中隐约可见。

人之所以反复掉进同一个坑，不是因为笨，是因为忘了上一次掉进去时的样子。

而陶博士将近二十年的文章，恰恰是对抗遗忘最好的武器。他帮我们记录了每一次危机的来龙去脉，每一次繁荣的起因和终结。如果我们把这些记录压缩归档了，就等于主动丢掉了他花将近二十年帮所有读者保存的集体记忆。

这个认知直接改变了系统设计。我们不再按时间归档知识，而是按周期模式（Cycle Patterns）归档。具体来说：

不是：”2008年9月，雷曼兄弟倒闭，美股暴跌”归档到”2008年笔记”。

而是：从2008年事件中提炼出”信贷危机模式”。包含触发信号（银行间同业拆借利率飙升、信用违约互换价格异常）、演进路径（流动性枯竭到资产抛售到央行救市到缓慢复苏）、关键指标（TED Spread, VIX, LIBOR-OIS Spread）、历史案例（1997, 2008, 2020）。

这样的模式，我们从陶博士的文章中提炼出了5种可重复识别的类型：

信贷危机（Credit Crisis） 银行间流动性枯竭，信用利差急剧扩大。典型持续时间6-18个月。

通胀周期（Inflation Cycle） CPI 持续上行，央行被迫加息，资产重新定价。典型持续时间12-36个月。

政策转向（Policy Pivot） 央行从紧缩转向宽松或反向操作，市场预期重置。典型持续时间3-6个月。

流动性危机（Liquidity Crunch） 特定市场或货币的流动性突然消失。典型持续时间1-3个月。

地缘冲击（Geopolitical Shock） 战争、制裁、政治黑天鹅导致避险资产异动。典型持续时间数天到数周。

每种模式都有一组对应的”指纹”。当多个指标同时满足某种模式的触发条件时，系统会发出信号：”当前市场环境与某种模式的匹配度为 X%。”

这不是预测。这是定位。

就像 GPS 不告诉你该往哪走，但它告诉你现在站在哪里。当你知道自己站在一个”类2008信贷危机模式”的早期阶段时，你至少知道：不要做多信用资产，不要加杠杆，准备好现金。

数据从哪里来

光有框架不够，还得有数据。

我们的数据体系分成两层：

第一层：知识层（Qualitative）

陶博士发表在各个平台的经济分析文章，时间跨度从2005年到2024年。我们的运营总监 Carol 负责资料收集和整理。

在此基础上，我们还收录了几位资深市场策略师的专栏评论，以及一些公开的机构研究报告，作为日常市场追踪的补充材料。

这些材料经过团队逐篇研读和系统化整理，我们从中提取出周期模式、方法论框架、以及大量的”预判-验证”对。也就是说，陶博士在 X 时间点做出的判断，后来在 Y 时间点被市场证实或证伪。这个过程花了我们将近两个月的时间，但每读完一篇都觉得受益匪浅。陶博士的文章不是那种读一遍就能消化的快餐，而是需要细细品尝的茗茶，每一砌茶都有不同的茶香，需要仔细品味每一次的清润回甘。

第二层：数据层（Quantitative）

MT5 数据：主流货币对和商品的历史日线数据，用于量化验证。

FRED 数据：美联储经济数据库，涵盖数十个宏观指标，部分数据回溯至1970年代。包括联邦基金利率、CPI、失业率、PMI、收益率曲线利差等。

COT 数据：CFTC 每周公布的大型投机者持仓报告，反映机构的真实仓位方向。

两层数据的结合是系统设计的核心：知识层定义”现在是什么环境”，数据层量化”这个环境下哪些信号最有效”。

一个关键决策

在系统开发过程中，有一个决策后来被证明至关重要。

当时我们在讨论知识蒸馏（Knowledge Distillation）的方案。伟博建议用经典的三层架构：核心方法论层、滚动摘要层、档案库。旧知识定期压缩，给新知识腾空间。这在大多数知识管理场景下是标准做法。

我否决了这个方案。

理由很简单：在经济分析领域，旧知识不是过期的知识，它是未来的参照物。

2008年的经验不会”过期”。它会在2020年以不同的面目重新出现。如果你把2008年的细节压缩归档了，当2020年 COVID 引发流动性危机时，你的系统就认不出它。因为它已经忘了上一次见到这种模式时的样子。

所以我们的知识库不按时间归档。每一个历史周期的完整细节都被保留，并且标注了模式标签。系统在做判断时，可以瞬间调取2008年、2011年、2015年、2020年的完整记录进行交叉对比。

这等于给系统装了一个”永不遗忘”的记忆。而这个记忆的基础，很大程度上来自陶博士将近二十年不间断的记录。没有他的文章，我们的系统就没有”记忆”可言。

这也是我们和大多数量化系统最根本的区别：我们不训练模型去拟合历史价格曲线（这条路的天花板就是那个15-25%），而是让系统去理解历史周期的结构。哪些因素触发了它，它怎么演进的，它在什么条件下结束。

用一个不太严谨的比喻：别的系统在背答案，我们的系统在学方法论。

还差一座桥

到此为止，我们有了：

一套经济周期识别框架，包含5种模式，每种有清晰的触发条件和演进路径。

大量知识材料的深度分析。

数十个宏观指标加上主流品种的历史价格数据。

一个”不按时间归档”的知识库设计。

但从”知道自己站在周期的哪个位置”到”做出具体的交易决策”之间，还有一座巨大的桥。

这座桥涉及到几个我们当时还没有答案的问题：

当宏观面说”看涨”但技术面说”看跌”时，听谁的？

系统对周期的判断有多大概率是错的？错了之后怎么控制损失？

从 Python 后端的信号到 MT5 终端的执行，中间有多少延迟？能接受吗？

下一篇讲我们怎么搭这座桥，以及在搭桥过程中，差点被自己的回测数据骗了。

那个故事的关键词叫”未来函数”。如果你做过量化回测，你应该已经脊背发凉了。

如果你没做过，下一篇会让你理解，为什么这三个字是每一个量化团队最害怕的噩梦。

*本文是「量化交易系统研发手记」系列第1篇，共8+篇。下一篇：「一千篇文章的重量：深度学习陶博士（上）」*

读者评价

0.0

0 out of 5 stars (based on 0 reviews)

Excellent0%

Very good0%

Average0%

Poor0%

Terrible0%

There are no reviews yet. Be the first one to write one.