OpenAI的GPU在前所未有的需求下承压
OpenAI的GPU在其新图像生成功能的前所未有的需求下承压,迫使公司实施紧急限制,因为用户创建了数百万幅受动漫启发的插图。就在其最新的GPT-4o模型推出这一功能几天后,该公司的计算基础设施已被推向极限。
这一图像生成器能够将文本提示或现有照片转换为详细的艺术作品,尤其引发了对吉卜力风格转化的热情。在过去几天里,用户在社交媒体上发布了大量粉彩色调的风景和奇幻人物肖像,令人联想到《千与千寻》和《龙猫》等电影。
“请大家稍微冷静一下,别再生成图像了。这太疯狂了,我们的团队需要休息,”OpenAI首席执行官山姆·阿尔特曼今天早些时候在推特上抱怨道。
这条推文是他周四首次抱怨的后续——“我们的GPT正在崩溃”——在新的图像生成能力推出后,有些聪明人发现可以将任何照片转变为可爱的吉卜力风格图像。
在随后的周末,越来越多的人尝试将9/11的照片到阿道夫·希特勒的一切都进行吉卜力化。这个病毒现象不仅传遍了科技爱好者,还蔓延到了白宫,白宫发布了一张吉卜力风格的模因,嘲笑因贩毒被捕的拉丁美洲女性。
最终,OpenAI在一些地区关闭了其图像生成器的访问权限,并对其他地区实施了每小时三次生成的限制。这在用户中引发了不满,他们抱怨这些任意限制,甚至幻想出更多的限制。
周一,情况似乎稍微得到控制,OpenAI宣布,免费用户——他们之前在之前的DALL·E 3图像生成器中拥有更多的生成自由——将被限制为每天仅生成三幅图像,前提是该功能何时向公众开放。
阿尔特曼可能正高兴地走向银行。显然,吉卜力末日事件使超过100万人在周一的一个小时内注册了ChatGPT,尽管其中有多少人订阅了高级服务并没有透露。搜索数据显示,随着新模型上周发布,术语“ChatGPT”在Google Trends中短暂超越了“Google”。
那么,为什么吉卜力末日会“融化”OpenAI的服务器呢?GPT-4o的图像生成与之前的AI艺术工具在根本上有所不同,它使用了更多的计算能力。这是因为大多数图像生成器使用“扩散模型”,从一堆随机像素开始,并对其进行调整,直到形成图像的真实表现。
GPT-4o采用了一种自回归的方法,按顺序逐像素生成图像——预测下一个像素是什么——与其进行基于文本的推理方式相同。对于图像来说,这一技术产生了更准确的细节和更好的文本呈现。但这对OpenAI的GPU来说是一项巨大的挑战。
这有点像创作油画与创作瓷砖马赛克之间的区别。
每个图像请求都会触发跨多个GPU核心并行工作的复杂数学运算,消耗电力并产生热量,如果持续以最大容量运行,会对硬件构成威胁。
目前,OpenAI在财务上正面临挑战,尽管阿尔特曼声称公司“做得很好”,但这家AI独角兽据报道每年亏损数十亿美元,预计到2026年这些亏损可能达到140亿美元。维持图像生成能力的基础设施需求,同时继续开发新AI能力,对公司的资源施加了额外压力。
而处理模因的情况也不太可能成为能使一个数十亿美元的企业盈利的革命性用例,但我们又有什么资格去评判呢?
目前,渴望将照片转变为吉卜力风格艺术作品的用户可能需要等待,因为OpenAI正在努力加强其基础设施。公司尚未说明何时可能恢复完全的容量,仅表示优化工作“希望不会太久”。