在多周的猜测之后,OpenAI揭晓了其旗舰AI模型的下一代产品GPT-5
新模型为全球最受欢迎的AI平台提供了更简化的界面,正值来自Meta、Anthropic和谷歌等竞争对手的压力日益增加之际。
首席执行官萨姆·阿尔特曼表示:“GPT是对GPT-4的重大升级,是通往AGI的重要一步。”他指出,GPT-5能够“从零开始编写软件程序。我们认为这种按需软件的理念将成为GPT-5时代的一个定义特征。”新模型在一个“零样本”示例中,根据提示要求进行伯努利效应模拟,写出了超过400行代码,耗时两分钟。
一个意外的失望是:尽管新模型具有400K令牌的上下文窗口,约为GPT-4的四倍,但与Claude或Gemini相比,它仍显得微不足道,后者能够处理超过100万令牌的上下文。这一点至关重要,因为令牌上下文窗口的大小决定了语言模型在单次交互中能够“记住”和处理多少信息——例如文档、代码库、长对话或研究论文。
Claude 3和Gemini 1.5已经支持超过100万令牌,使OpenAI的新模型显得像是在追赶,而非超越。Claude可以处理整套书籍、密集的研究档案或庞大的代码库,并仍然给出连贯、上下文意识的回应。
GPT-5确实提供了一系列新功能,包括视频选项,可以在聊天时观察用户(或通过摄像头观察其他任何事物)。同样,下周,该公司将开始允许用户整合他们的Gmail和Google日历。
新模型将于今天起向所有GPT用户开放,包括免费用户。公司表示,免费用户将受到使用限制;达到限制后,将自动转为“迷你”模型。
阿尔特曼在周四的直播中把GPT-5定位为AI能力的质的飞跃。他说:“GPT-4就像和一位大学生交谈。现在,GPT-5就像和一位专家交谈。”同时谈到公司希望超越增量改进,朝着根本不同的AI交互发展。以下是今天宣布的一些新功能。
商业集成重点
公司在整个演示过程中强调了企业应用。“这将是企业特别重要的时刻,”阿尔特曼指出,强调了GPT-5增强的推理能力作为企业工作流程和决策过程的潜在变革者。
统一推理架构
OpenAI将推理描述为其人工通用智能战略的核心。“推理是我们AGI计划的核心,”团队解释道。突破消除了在速度和分析深度之间的先前权衡:“到目前为止,用户必须在使用推理的慢速答案和正常令牌预测的快速答案之间做出选择。这个模型消除了这一障碍。”
增强的性能指标
公司在关键指标上宣传了全面的改进。“根据内部测试,GPT-5比其前身更快、更可靠和更准确。”OpenAI还将这个模型定位为“迄今为止最佳的编码模型”,展示了其在软件开发能力上超越以往版本的能力。该模型在公司分享的不同基准测试中也打破了所有分数,特别是在数学和编码方面。
增强的安全性和可靠性
与之前的模型相比,GPT-5在真实性和准确性方面表现出显著改进。“我们发现GPT-5的欺骗性显著低于o3,”OpenAI在演示中报告道。降低的幻觉率解决了大型语言模型部署中最持久的挑战之一,特别是对于需要事实精确的企业应用。
合成数据突破
OpenAI揭示了一种以合成数据生成为中心的新训练方法。“我们正在实验一套新技术,”团队解释道,描述了他们的方法论转变。“我们的突破不是创造更多的数据,而是创造正确的数据集,”公司指出,表明用于预训练的合成数据比传统数据收集方法提供了显著更好的结果。
个性化记忆系统
这更多是ChatGPT的一个特点,而非模型改进,但可能会对人们使用ChatGPT的方式产生重大影响。新模型具有增强的记忆能力,允许用户自定义聊天机器人的行为模式。ChatGPT现在可以根据特定目标或目的进行定制,使互动更加有用,并与个别用户的需求保持一致。这种个性化不仅限于简单的偏好设置,还包括跨对话的行为修改。
自主编码卓越
GPT-5在自主编码任务中表现出色,能够自然地处理实时实施和迭代开发。“GPT-5设定了一个全新的标准。它是自主编码任务中最佳的模型,”团队宣布,联合创始人格雷格·布罗克曼强调:“它在前端非常出色……它在遵循指令方面极其出色。”
该模型消除了在专业编码助手之间切换的需要,用户可以在从规划到调试的所有开发阶段依赖GPT-5。OpenAI展示了三种变体——GPT-5、GPT-5迷你和GPT-5纳米,所有变体都能够无缝处理工具、功能和不同的编程格式。它还经过训练,能够构建更具视觉吸引力和更佳前端理解的应用程序。
GPT-5引入了工具调用解释,允许模型在执行之前描述其预期的行动,使任务执行对开发者更高效和透明。用户可以调整详细程度设置,以控制输出长度并管理令牌成本,同时保持功能性。该模型在SWE-bench上达到顶级性能,确立了GPT-5作为目前可用的最强大软件工程任务模型。
访问结构
OpenAI宣布了新模型的分层推出策略。免费用户将从GPT-5开始,在耗尽使用配额后转为较轻的“GPT-5迷你”版本,而专业订阅用户则可以无限制访问完整模型。公司确认,所有现有的ChatGPT功能将与新系统兼容。
公司正在淘汰其旧模型,并要求GPT-5为它们撰写讣告,一位演讲者指出其反应更自然,像是与智商和情商都更高的人交谈,她说:“它的节奏更好……实际上相当个人化——这正是GPT-5做得更好的事情……回答感觉不再像是AI。”该模型还具备本地多语言能力,使其在多语言任务中更具能力。
人工智能领域的800磅大猩猩
ChatGPT目前拥有每周700万活跃用户,而谷歌Gemini的每周用户为4700万。尽管用户基础庞大,GPT-5仍将与Meta AI竞争,其自身的每周用户基础也达到了7亿,得益于与Instagram和WhatsApp的集成。
根据Tracxn的数据,截至目前,OpenAI在11轮融资中已筹集570亿美元,估值达3000亿美元。根据路透社的报道,如果拟议的股票出售选项通过,该估值预计将上升至5000亿美元。公司在今年前七个月的收入翻了一番,预计到12月31日将达到200亿美元。
阿尔特曼首次公开确认OpenAI于2023年开始开发GPT-5,实际训练阶段于一年后开始。在2025年2月13日,阿尔特曼概述了公司的路线图,并表示预计GPT-5将在“几个月内”推出,旨在统一OpenAI的O系列和GPT模型。
最近,阿尔特曼花费了大量时间对人工通用智能进行评述,助长了人们对OpenAI可能利用今天的事件宣布突破的猜测。然而,在本月初,他警告称,GPT的推出可能会有额外延迟,并请求用户“请耐心等待”。
在本周早些时候的发布前夕,OpenAI在周二发布了两个开放权重模型——gpt-oss-120b和gpt-oss-20b——在开放许可下,旨在帮助希望本地运行模型的开发者。