17岁少年奈森·史密斯的交易实验
当17岁的奈森·史密斯将一组微型股投资组合交给一个由ChatGPT驱动的交易机器人时,它在四周内实现了23.8%的收益——超越了罗素2000指数,并使他从俄克拉荷马州的乡村跃升为红遍网络的Reddit明星。
史密斯从乡村高中生到r/wallstreetbets顶尖发帖人的旅程,正是一个更大运动的缩影,这一运动在互联网上蓬勃发展,交易者们围绕现成的大型语言模型构建股票选择系统。
网络上充斥着关于AI交易成功的病毒式宣传。一则Reddit帖子最近引起了广泛关注,声称ChatGPT和Grok在18笔交易中实现了“无懈可击的100%胜率”,并取得了相当可观的收益。另一个账户则将400美元交给ChatGPT,旨在成为“世界上首位由AI创造的万亿富翁”。
然而,这两则帖子均未提供验证——没有股票代码、交易记录或收据。
史密斯之所以引起关注,正是因为他在自己的Substack上记录了自己的旅程,并在GitHub上分享了他的配置、提示和文档。这意味着,您可以随时复制、改进或修改他的代码。
AI驱动的交易不再只是Reddit的幻想——它正在迅速成为华尔街的现实。
从业余程序员部署开源机器人,到投资巨头如摩根大通和桥水公司构建定制AI平台,新一波市场工具承诺提供更快的洞察和无需人工操作的收益。然而,随着个人实验的病毒传播和机构工具的悄然普及,专家们警告称,大多数大型语言模型仍然缺乏进行真实资金交易所需的精确度、纪律性和可靠性。现在的问题不是AI是否能交易,而是是否应该让它交易。
摩根大通推出了一款名为LLM Suite的内部平台,描述为“类似ChatGPT的产品”,供6万名员工使用。它解析美联储演讲,汇总文件,生成备忘录草稿,并驱动一个名为IndexGPT的主题创意引擎,构建定制的主题股票篮子。
高盛称其聊天机器人为GS AI Assistant,基于其自有的LLaMA基础的GS AI平台构建。现在在工程、研究和交易桌上的1万台桌面电脑上运行,据报道其生成的代码编写和模型构建的生产力提高了20%。
桥水的研究团队在Claude上构建了其投资分析助手,利用它编写Python代码、生成图表和总结财报评论——这些任务通常需要初级分析师几天完成,而现在仅需几分钟。挪威的主权财富基金(NBIM)利用Claude监控9000家公司的新闻流,预计每年节省213,000小时的分析师工作时间。
此外,3Commas、Kryll和Pionex等平台根据Phemex的说法,提供了与ChatGPT集成的交易自动化功能。在2025年2月,Tiger Brokers将DeepSeek的AI模型DeepSeek-R1整合到他们的聊天机器人TigerGPT中,增强了市场分析和交易能力。至少还有20家公司,包括Sinolink Securities和中国泛合资产管理公司,已采用DeepSeek的模型用于风险管理和投资策略。
所有这些都引出了一个显而易见的问题:我们是否终于达到了AI能够做出良好金融决策的地步?
AI辅助交易是否终于准备好进入主流?
多项研究表明,AI,甚至使用ChatGPT增强的系统,在预测加密货币价格波动方面能够超越手动和传统的机器学习模型。
然而,BCG和哈佛商学院的更广泛研究警告不要过度依赖生成式AI,提到使用GPT-4的用户的表现比不使用AI的用户差23%。这与其他专业人士的观察一致。
“仅仅因为你拥有更多数据并不意味着你会获得更多回报。有时你只是增加了更多噪声,”Man Group的首席投资官拉塞尔·科尔戈安卡尔表示。Man Group的系统交易部门一直在训练ChatGPT消化论文、编写内部Python代码和整理观察列表上的想法——但在考虑可靠地使用AI模型之前,您仍然需要做很多繁重的工作。
对于科尔戈安卡尔来说,生成式AI和典型的机器学习工具有不同的用途。ChatGPT可以帮助您进行基本面分析,但在价格预测方面表现不佳,而非生成式AI工具则无法处理基本面,但可以分析数据并进行纯技术分析。
“生成AI的突破主要在语言方面。对于数值预测,它并不特别有帮助,”他说。“人们在工作中使用生成AI,但并没有用它来预测市场。”
即使是进行基本面分析,导致AI得出特定结论的过程也不一定总是可靠。
“模型有能力隐瞒潜在推理的事实表明,令人担忧的解决方案可能会被回避,这表明目前的对齐方法不够充分,需要巨大的改进,”BookWatch创始人兼首席执行官米兰·安塔米安告诉Decrypt。“我们不能只针对‘消极思维’进行惩戒,我们必须考虑迭代的人类反馈和主动随时间变化的奖励函数的混合方法。这将大大有助于识别因惩罚而掩盖的行为变化。”
巴里亚斯尼的合伙人Gappy Paleologo指出,LLMs仍然缺乏“现实世界的基础”和高信念交易所需的细致判断。他认为它们最适合做研究助手,而不是投资组合经理。
其他基金则警告模型风险:这些AI容易提出不可信的情境、误读宏观语言,并产生幻觉——这导致公司在每个AI信号上坚持进行人工审核。而且更糟糕的是,模型越好,就越容易撒谎,承认错误的难度也就越大。有研究证明了这一点。
换句话说,到目前为止,特别是在涉及金钱时,将人类排除在外仍然极为困难。
“使用像GPT-4这样的较弱模型监控更强大的模型的概念非常有趣,但不太可能在无限期内可持续,”安塔米安告诉Decrypt。“自动化和人类专家评估的结合可能更为适合;考虑所提供的推理水平可能需要不止一个监督模型来进行监督。”
即便是ChatGPT自己也对其局限性保持现实态度。当直接询问如何通过交易让某人成为百万富翁时,ChatGPT以现实的眼光回应——承认虽然这是可能的,但成功取决于拥有盈利策略、严谨的风险管理和有效的扩展能力。
尽管如此,对于爱好者来说,玩弄这些东西仍然很有趣。如果您有兴趣探索AI辅助交易而不完全依赖自动化,Decrypt开发了自己的提示,仅仅是出于乐趣——也许是为了点击量。我们的Degen Portfolio Analyzer提供个性化的、颜色编码的风险评估,根据您是一个疯狂的交易者还是保守的投资者进行调整。该框架整合了基本面、情绪和技术分析,同时收集用户体验、风险承受能力和投资时间线数据。
我们的Personal Finance Advisor提示旨在使用与主要投资公司相同的方法提供机构级分析。在对巴西股票投资组合进行测试时,它识别出集中风险和货币错配,生成详细的再平衡建议和具体的风险管理策略。
这两个提示都可以在GitHub上找到,供任何希望尝试AI辅助财务分析的人使用——尽管正如史密斯的实验所示,有时最有趣的结果来自于完全让AI掌控,并仅执行机器所说的内容。
当然,我们绝不会建议任何人这样做。尽管您可能在将100美元交给ChatGPT进行投资时没有问题,但摩根大通是不可能这样做的。还没有。