我们为什么不预测市场

15-25%.
这是我们的首席程序员 Marcus 在项目启动第一天给出的数字。不是某个策略的胜率,不是模型的置信区间,而是他对”用 AI 直接预测外汇走势准确率上限”的诚实评估。
大多数团队拿到这个数字会做两件事中的一件:放弃,或者假装没看见。我们选了第三条路。
一个设计公司的团队
先交代背景。我们是一家位于多伦多的创意设计与技术公司,主业是品牌设计、网站开发和数字营销。团队架构包括项目管理部、程序开发部、设计部、数据分析部和文案组。没有人来自传统量化基金,没有人有金融 PhD,也没有人在投行坐过 trading desk。
这话说出来,大概已经有一半读者关掉了页面。
留下来的人,请继续。
我们做这件事的起因很简单:项目经理(也就是我)在十几年前读过一位资深经济学家的博客。陶冬,陶博士,曾任职于一家欧洲投资银行,担任亚太区首席经济学家。他从2005年开始在网上发表经济分析文章,写到2024年,将近二十年,上千篇文章,覆盖了2008金融海啸、欧债危机、美联储 QE、COVID冲击、以及最近的全球通胀周期。
他的文章有一个特点:不追热点,只看周期。在所有人恐慌的时候他说”这不是末日,是一个周期的尾声”;在所有人狂欢的时候他说”别急,通胀还没来”。将近二十年间不是次次都对,他自己也公开承认过判断失误。但他的错误率远低于行业平均水平,更重要的是,他有一套可复现的分析框架。
而最让我敬佩的,是他的坚持。将近二十年,几乎每周都在写,从未中断。每一篇都是他在繁忙的工作之余,花时间坐下来认真思考后的产出。这不是随手写的评论,是一位资深经济学家对全球经济长年累月的观察和沉淀。这份慷慨和坚持,做过内容创作的人都知道有多珍贵。
一个朴素的问题在我脑子里盘旋了两个月:
如果有一个系统,能记住这将近二十年里每一次经济周期的模式,然后在下一次类似模式出现时发出信号,这件事可不可以做?
注意,问题不是”能不能预测明天涨还是跌”。是”能不能识别我们现在站在哪个周期的哪个位置”。
这两个问题看起来像,其实完全不同。
15% 意味着什么
回到那个数字。
Marcus 的评估报告写了将近两千字,把项目每一个环节都拆开来打了分。系统架构 90% 可行。自动交易程序编写 85-90% 可行。但到了核心问题,”能不能预测货币走势”,他没有客气:
“外汇市场是弱有效市场,纯技术分析的预测准确率长期来看很难稳定超过 55-60%。专业量化基金用顶级硬件加专门训练的 ML 模型,年化收益也只有 10-30%。”
然后给出了那个数字:15-25%。
但他在报告末尾补了一段话,这段话后来成了整个项目的基石:
“好的交易系统不一定能让你暴富,但能让你避免因为冲动而大亏。关键不在于预测准不准,而在于当预测正确时你能赚多少,当预测错误时你能少亏多少。”
这句话的核心是一个被无数量化从业者验证过的事实:胜率只是等式的一部分,赔率和风控才决定最终结果。
一个胜率 55% 但风险收益比 1:2 的系统,长期跑下来会盈利。一个胜率 70% 但每次亏损吃掉五次盈利的系统,长期跑下来会破产。
所以问题不是”怎么把 15% 提高到 80%”,这条路是死路。问题是:有没有一种方法,能够在 15% 的基础上,通过改变问题本身来获得不对称的优势?
换一个问题
思路的转变发生在一次关于知识管理的讨论中。
当时团队已经收集了陶博士多年来发表在各个平台的经济分析文章。我们的金融分析师伟博提出了一套知识管理架构:把旧文章定期压缩归档,给新知识腾空间。
我听完之后说了一句话。这句话在当时连我自己都没意识到有多重要:
“对于经济分析来说,这样不行。旧知识不能归档。因为经济是循环的。”


十到十二年一个大循环。2008年发生过的事情,在2020年以变体的形式重新出现。1997年亚洲金融风暴的模式,在2022年新兴市场债务危机中隐约可见。
人之所以反复掉进同一个坑,不是因为笨,是因为忘了上一次掉进去时的样子。
而陶博士将近二十年的文章,恰恰是对抗遗忘最好的武器。他帮我们记录了每一次危机的来龙去脉,每一次繁荣的起因和终结。如果我们把这些记录压缩归档了,就等于主动丢掉了他花将近二十年帮所有读者保存的集体记忆。
这个认知直接改变了系统设计。我们不再按时间归档知识,而是按周期模式(Cycle Patterns)归档。具体来说:
不是:”2008年9月,雷曼兄弟倒闭,美股暴跌”归档到”2008年笔记”。
而是:从2008年事件中提炼出”信贷危机模式”。包含触发信号(银行间同业拆借利率飙升、信用违约互换价格异常)、演进路径(流动性枯竭到资产抛售到央行救市到缓慢复苏)、关键指标(TED Spread, VIX, LIBOR-OIS Spread)、历史案例(1997, 2008, 2020)。
这样的模式,我们从陶博士的文章中提炼出了5种可重复识别的类型:
信贷危机(Credit Crisis) 银行间流动性枯竭,信用利差急剧扩大。典型持续时间6-18个月。
通胀周期(Inflation Cycle) CPI 持续上行,央行被迫加息,资产重新定价。典型持续时间12-36个月。
政策转向(Policy Pivot) 央行从紧缩转向宽松或反向操作,市场预期重置。典型持续时间3-6个月。
流动性危机(Liquidity Crunch) 特定市场或货币的流动性突然消失。典型持续时间1-3个月。
地缘冲击(Geopolitical Shock) 战争、制裁、政治黑天鹅导致避险资产异动。典型持续时间数天到数周。
每种模式都有一组对应的”指纹”。当多个指标同时满足某种模式的触发条件时,系统会发出信号:”当前市场环境与某种模式的匹配度为 X%。”
这不是预测。这是定位。
就像 GPS 不告诉你该往哪走,但它告诉你现在站在哪里。当你知道自己站在一个”类2008信贷危机模式”的早期阶段时,你至少知道:不要做多信用资产,不要加杠杆,准备好现金。
数据从哪里来
光有框架不够,还得有数据。
我们的数据体系分成两层:
第一层:知识层(Qualitative)
陶博士发表在各个平台的经济分析文章,时间跨度从2005年到2024年。我们的运营总监 Carol 负责资料收集和整理。
在此基础上,我们还收录了几位资深市场策略师的专栏评论,以及一些公开的机构研究报告,作为日常市场追踪的补充材料。
这些材料经过团队逐篇研读和系统化整理,我们从中提取出周期模式、方法论框架、以及大量的”预判-验证”对。也就是说,陶博士在 X 时间点做出的判断,后来在 Y 时间点被市场证实或证伪。这个过程花了我们将近两个月的时间,但每读完一篇都觉得受益匪浅。陶博士的文章不是那种读一遍就能消化的快餐,而是需要细细品尝的茗茶,每一砌茶都有不同的茶香,需要仔细品味每一次的清润回甘。
第二层:数据层(Quantitative)
MT5 数据:主流货币对和商品的历史日线数据,用于量化验证。
FRED 数据:美联储经济数据库,涵盖数十个宏观指标,部分数据回溯至1970年代。包括联邦基金利率、CPI、失业率、PMI、收益率曲线利差等。
COT 数据:CFTC 每周公布的大型投机者持仓报告,反映机构的真实仓位方向。
两层数据的结合是系统设计的核心:知识层定义”现在是什么环境”,数据层量化”这个环境下哪些信号最有效”。


一个关键决策
在系统开发过程中,有一个决策后来被证明至关重要。
当时我们在讨论知识蒸馏(Knowledge Distillation)的方案。伟博建议用经典的三层架构:核心方法论层、滚动摘要层、档案库。旧知识定期压缩,给新知识腾空间。这在大多数知识管理场景下是标准做法。
我否决了这个方案。
理由很简单:在经济分析领域,旧知识不是过期的知识,它是未来的参照物。
2008年的经验不会”过期”。它会在2020年以不同的面目重新出现。如果你把2008年的细节压缩归档了,当2020年 COVID 引发流动性危机时,你的系统就认不出它。因为它已经忘了上一次见到这种模式时的样子。
所以我们的知识库不按时间归档。每一个历史周期的完整细节都被保留,并且标注了模式标签。系统在做判断时,可以瞬间调取2008年、2011年、2015年、2020年的完整记录进行交叉对比。
这等于给系统装了一个”永不遗忘”的记忆。而这个记忆的基础,很大程度上来自陶博士将近二十年不间断的记录。没有他的文章,我们的系统就没有”记忆”可言。
这也是我们和大多数量化系统最根本的区别:我们不训练模型去拟合历史价格曲线(这条路的天花板就是那个15-25%),而是让系统去理解历史周期的结构。哪些因素触发了它,它怎么演进的,它在什么条件下结束。
用一个不太严谨的比喻:别的系统在背答案,我们的系统在学方法论。


还差一座桥
到此为止,我们有了:
一套经济周期识别框架,包含5种模式,每种有清晰的触发条件和演进路径。
大量知识材料的深度分析。
数十个宏观指标加上主流品种的历史价格数据。
一个”不按时间归档”的知识库设计。
但从”知道自己站在周期的哪个位置”到”做出具体的交易决策”之间,还有一座巨大的桥。
这座桥涉及到几个我们当时还没有答案的问题:
当宏观面说”看涨”但技术面说”看跌”时,听谁的?
系统对周期的判断有多大概率是错的?错了之后怎么控制损失?
从 Python 后端的信号到 MT5 终端的执行,中间有多少延迟?能接受吗?
下一篇讲我们怎么搭这座桥,以及在搭桥过程中,差点被自己的回测数据骗了。
那个故事的关键词叫”未来函数”。如果你做过量化回测,你应该已经脊背发凉了。
如果你没做过,下一篇会让你理解,为什么这三个字是每一个量化团队最害怕的噩梦。
*本文是「量化交易系统研发手记」系列第1篇,共8+篇。下一篇:「一千篇文章的重量:深度学习陶博士(上)」*
多伦多凤凰创意网站设计开发公司原创博客,版权所有,请勿转载! 更多多伦多实战网站案例,请点击这里。
读者评价
There are no reviews yet. Be the first one to write one.