在棒球中,数字永远无法讲述全部故事。但它们讲述了我们认为足够的部分。
凭借着对AI的偏好以及一堆棒球统计数据,我们创建了一个能够预测世界大赛结果的聊天机器人。
周一,违背了赔率,它预测洛杉矶道奇队将赢得第三场比赛,并最终夺得世界大赛冠军。正如我们昨晚所见,至少聊天机器人预测的第一部分是正确的。
今天,它表示道奇队不仅会赢得世界大赛,而且还会赢得今晚的比赛,并成为自2012年底特律老虎队输给旧金山巨人队以来首个以4-0横扫的队伍。
这个结果与昨天和今天投注市场的预测有所不同。
我们构建的聊天机器人基本上是一个加载了从Baseball Savant和Statmuse抓取的性能数据的GPT。然后,我们加入了一门关于棒球数学基础的速成课程——棒球计量学,以帮助它理解这些数字的含义。
构建模型很直接(我们甚至创建了一个指南
来帮助你在几乎任何事物上构建自己的机器人。)我们不知道哪些统计数据最重要,所以基本上我们用我们找到的所有东西来喂它:涵盖团队表现和球员统计的原始数据直到2024年;包括逐球细节分解的最近比赛数据,以保持模型的当前性;以及许多更奇怪的东西,如出棒速度、投手的武器库、手臂力量以及对左投和右投的击球。
最后,我们为它提供了一个分析框架——一个权衡历史模式与当前概率的“思维链”过程。我们测试了模型并调整了提示,直到我们对结果感到满意。当我们完成并即将点击“保存”按钮时……
它抛出了一个错误。这可能是一个临时的服务器错误,没让我们保存更改。
没关系:我们设法截图了一些引人入胜的回应,在它退出之前。该模型预测道奇队在昨晚的比赛中有60%的胜率,洋基队以1-2分获胜的几率很小。
对于最终结果,我们的机器人关注了一个鲜明的统计数据:在七场四胜制的系列赛中,赢得前两场比赛的球队有80%的概率赢得全部比赛。这看起来相当准确,而且,你可能听昨晚的比赛解说员提过这一点。
我们的AI消化了多年的世界大赛数据以及本赛季的统计数据。对于洋基队与道奇队的对决,道奇队在整体投球统计数据上略占上风,而洋基队的救援投手在整个季后赛中占据了主导地位。
结果与流行的预测市场分歧。例如,Polymarket的投注者给予洋基队赢得第三场比赛56%的可能性,认为连续三场失利是不太可能的。与此同时,我们的聊天机器人专注于更广泛的模式。
比赛最终以道奇队4-2获胜而告终。所以我们的模型是正确的,至少这一次,洛杉矶以比纽约多两分的成绩获胜。DI(degen intelligence)没有击败AI。
那么今晚和整个系列赛呢?
对于洋基队来说,昨天看起来令人沮丧,但今天的情况更加糟糕。我们询问了我们的聊天机器人他们恢复并赢得接下来四场比赛的概率。如果发生这种情况,它将在美国棒球历史上留下印记。
聊天机器人给道奇队今晚获胜并横扫系列赛55%的机会。
“在MLB季后赛历史上,只有一支球队在七场四胜制的系列赛中从0-3的劣势成功逆转:那就是2004年美国联盟冠军系列赛中的波士顿红袜队对纽约洋基队,”我们的聊天机器人说。它给出了在类似条件下连胜四场的统计计算,给洋基队从落后中反击并赢得系列赛的理论概率大约为6%。
如果我们加入影响球队表现的因素,情况会大大降低。
“如果我们假设每场比赛的获胜概率较低(由于道奇队本赛季的实力),概率将相应降低。例如,如果我们认为洋基队每场比赛有40%的胜率,连续四场胜利的概率将是2.56%,”我们的聊天机器人说。根据我们的聊天机器人,道奇队处在一个更好的位置——因此,与其说是50-50的情况,不如说道奇队有60%对40%获胜的可能性更为现实。
Polymarket的家伙们很固执。截至本文撰写时,今晚比赛的赔率为洋基队有58%的优势。这不是我们的聊天机器人所认为的。然而,它提醒我们,有些因素可能对洋基队有利——比如比赛在纽约进行,以及可能影响球员体能的紧迫感。这足以让我们的机器人将洋基队的胜率从40%略微提高到45%。
这还不足以称之为公平的50-50,也与我们最喜欢的预测市场不一致。
90%的世界大赛输球概率很难忽视,但在棒球中,一场失利可以重写叙事,并撤销即便是最严谨的预测。也许我们的聊天机器人需要更多的“心”,但Polymarket的degen们也可以使用一点数据。
编辑:Andrew Hayward