在创纪录的2024年之后,Nvidia以轰动的方式迎接2025年,发布了一系列产品,这些产品有望巩固其在人工智能开发和游戏领域的主导地位。
首席执行官黄仁勋在拉斯维加斯的CES展上展示了从个人人工智能超级计算机到下一代游戏显卡的新硬件和软件产品。
Nvidia最重要的公告是项目DIGITS,这是一款售价3000美元的个人人工智能超级计算机,可以将一拍内的计算能力装入一个台式机大小的盒子中。
该机器以新的、直到现在为止都是秘密的GB10 Grace Blackwell超级芯片为基础,可以处理具有高达2000亿个参数的人工智能模型,并从标准插座获取电源。
对于更重的工作负载,用户可以连接两个单位来处理高达4050亿个参数的模型。
为了提供背景信息,最大的Llama 3.2型号,即Meta开发的最先进的开源LLM,具有4050亿个参数,无法在消费类硬件上运行。
直到现在,它需要约8个售价约3万美元的Nvidia A100/H100超级芯片,仅在处理硬件上就总计超过24万美元。
两个Nvidia的新型消费级人工智能超级计算机将花费6000美元,并能够运行相同的量化模型。
“Nvidia首席执行官黄仁勋在一篇官方博客文章中说:“人工智能将成为每个行业每个应用的主流。通过项目DIGITS,Grace Blackwell超级芯片将面向数百万开发人员。”“将人工智能超级计算机放在每个数据科学家、人工智能研究人员和学生的桌子上,使他们能够参与并塑造人工智能时代。”
对于喜欢技术细节的人来说,GB10芯片是一个重大的工程成就,是与联发科技合作的产物。
这款片上系统将Nvidia最新的GPU架构与20个功耗效率高的ARM核心通过NVLink-C2C互连连接起来。
每个DIGITS单元都配备了128GB的统一内存和高达4TB的NVMe存储。再次提供背景信息,迄今为止最强大的GPU每个都配备了约24GB的VRAM(运行人工智能模型所需的内存),而H100超级芯片起步价为80GB的VRAM。
Nvidia主导AI代理的计划
公司正急于部署人工智能代理,Nvidia也知道这一点,这可能是为什么它开发了Nemotron,这是一个新的模型系列,分为三个尺寸,并宣布今天扩大了Nemotron家族,推出了两个新型号:用于视频摘要和理解的Nvidia NIIM以及具有视觉能力(即理解视觉指令)的Nvidia Cosmos。
迄今为止,LLM仅限于文本。然而,这些模型在以下指令方面表现出色:聊天、函数调用、编码和数学任务。
这些模型可以通过Hugging Face和Nvidia的网站获得,并且通过该公司的AI Enterprise软件平台可以获得企业访问权限。
提供背景信息,Nvidia的Llama Nemotron 70b在LLM领域中的排名高于Meta开发的原始Llama 405b。它还击败了不同版本的Claude、Gemini Advanced、Grok-2 mini和GPT-4o。
Nvidia的代理推进还涉及基础设施。该公司宣布与LangChain、LlamaIndex和CrewAI等主要代理技术提供商合作,以在Nvidia AI Enterprise上构建蓝图。
这些即用模板针对特定任务,使开发人员更容易构建高度专业化的代理。
一个新的PDF转播客蓝图旨在与Google的NotebookLM竞争,而另一个蓝图则有助于构建视频搜索和摘要代理。开发人员可以通过新的Nvidia Launchables平台测试这些蓝图,该平台支持一键原型设计和部署。
玩家们,欢呼吧!全新的GeForce RTX 5000系列显卡性能强大
Nvidia将游戏公告留到了最后,发布了备受期待的GeForce RTX 5000系列。旗舰型号RTX 5090拥有920亿个晶体管,每秒可以提供3352万亿次人工智能运算,是当前RTX 4090性能的两倍。整个系列都配备了第五代Tensor Cores和第四代RT Cores。
新的显卡引入了DLSS 4技术,可以通过使用人工智能生成多个渲染帧来提高帧率高达8倍。黄仁勋说:“黑韦尔,即人工智能引擎,已经为个人电脑玩家、开发人员和创意人士带来了终极的AI驱动神经渲染和光线追踪。自25年前我们推出可编程着色以来,黑韦尔是计算机图形学方面最重要的创新。”
新的显卡还采用了转换器模型进行超分辨率处理,承诺提供高度逼真的图形和更高的性能,但价格并不便宜,RTX 5070售价为549美元,5070 Ti售价为749美元,5080售价为999美元,5090售价为1999美元。
如果你没有那样的钱,但想玩游戏,别担心。
AMD今天也宣布了Radeon RX 9070系列。这些显卡采用了新的RDNA 4架构,采用4纳米制造工艺,并配备了专用的AI加速器,以与Nvidia的张量核心竞争。
虽然完整的规格仍未公布,但AMD的最新Ryzen AI芯片在峰值性能上已经达到了50 TOPS。
不幸的是,由于其CUDA技术,Nvidia仍然是AI应用的王者,这是Nvidia的专有AI架构。
为了解决这个问题,AMD已与惠普和华硕合作进行系统集成,超过100个企业平台品牌将通过2025年使用AMD Pro技术。
预计Radeon显卡将于2025年第一季度上市,给Nvidia在游戏和AI加速方面带来有趣的竞争。
编辑:Sebastian Sinclair
Related Posts
Add A Comment