喜欢免费科技的人们,欢呼吧!Google和xAI推出了令人感兴趣的AI更新,与OpenAI最近的民主化努力相匹配并扩展。
OpenAI上周发起了一场野心勃勃的“OpenAI 12天”活动,向公众发布了一系列强大的工具,以争取用户的青睐和钱包。活动的亮点包括该公司最先进的文本到视频生成器Sora、先进推理模型“OpenAI o1”和复杂的网络搜索集成SearchGPT。
其中,搜索引擎和推理模型都对免费用户开放。Sora需要ChatGPT Plus订阅。
随后,Google在昨天做出了一系列宣布,以显示它仍有很多可提供的东西。该公司宣布了最新的视频生成AI模型Veo 2,直接与Sora竞争,并且用户已经可以通过Google的AI Test Kitchen尝试该模型。
“Veo可以生成具有逼真动作和高质量输出的视频,最高支持4K。通过广泛的相机控制探索不同的风格,并找到自己的风格,”该公司表示。这些剪辑可以延长到几分钟,超过大多数以1080p分辨率工作且运行时间较短的最佳视频生成器。
通过实验平台Labs,Google还于12月16日发布了Whisk——一款专注于重新设计和使用视觉和图像输入生成视觉输出的实验性图像创建工具。与传统的文本到图像模型不同,Whisk采用了一种新颖的“混合”方法,用户可以通过现有照片库中的视觉参考来创作新的图像,从而最大限度地减少了对详细文本提示的需求。
该公司的图像能力还得到了Imagen 3的发布进一步增强,该模型已经在Google Gemini聊天机器人应用中免费提供。这个新模型在细节渲染、风格多样性和减少幻觉方面有所改进。它还具备文本生成能力,而之前的Google模型则没有。
此外,Gemini 2.0 Flash也是免费提供的,它是一个更新的模型,可以在Google开发者控制台和更精细、用户友好的Gemini平台中使用。Google还发布了一个高级研究助手功能,并使其模型能够免费在开发者控制台上处理最多100万个令牌。
一些用户报告称,还可以尝试Gemini 2.0 Advanced的实验版本。“Advanced”是Gemini系列中最强大的模型,“Flash”是以效率为导向的小模型,“Pro”是中等规模的模型。
xAI的Grok-2面向大众
为了不落后,埃隆·马斯克的xAI也加入了战斗,通过X平台(原名Twitter)努力提供对先进AI功能的民主化访问。
该公司发布了Grok-2模型的增强版本,速度和能力得到了大幅提升。新版本比前一版本运行速度快三倍,同时提供了改进的准确性、指令遵循和多语言能力。
此外,xAI上周开始向所有X平台用户免费推出Grok。这种集成不仅仅局限于基本的聊天功能,还引入了带引用的网络搜索等功能,使用户可以通过平台直接验证信息并探索来源。
“今天,我们很高兴地宣布,我们开始向X平台上的所有用户免费推出这个新版本的Grok-2。与往常一样,高级用户和高级+用户享有更高的使用限制,并将第一个获得未来任何新功能的权限,”xAI在一篇博客文章中表示。
该公司还推出了自己的图像生成模型Aurora,并将其集成到Grok的功能中。该模型的图像质量低于Grok之前与Flux的集成,但足以提供具有较少提示依据但更少审查的逼真图像。
为了进一步支持开发者和企业,xAI宣布大幅降低其API访问费用,将输入令牌的费率降至每百万个2美元,输出令牌的费率降至每百万个10美元。
竞争激发了AI能力的快速发展,每家公司都在推动可能性的边界,同时使这些工具更易获取。这种民主化可能引领AI驱动的创造力和生产力的新时代,因为用户可以访问以前仅供精选开发者或付费客户使用的工具。
然而,还有一个很好的选择,一些用户可能没有考虑:开源AI。有一些足够强大,可以与这些科技巨头竞争的模型,而且它们是免费的,完全可定制,并且透明度更高。
Genmo Mochi 1、Flux、Stable Diffusion和Llama-3都是很好的选择,如果你尝试一下,可能会超出你的预期。而且,它们也是免费使用的。
由Andrew Hayward编辑
Related Posts
Add A Comment