微软上周推出的Copilot模式标志着浏览器战争的转折点
作为这场$3万亿美元巨头的全面加入,微软的实验性功能将Edge转变为公司所称的“AI驱动浏览器”——而它并不是唯一试图在这一新兴领域占据主导地位的公司。
现在,已有半打公司正在竞相将人工智能直接嵌入浏览体验中,各公司在隐私、定价和功能上有着截然不同的方法。胜者的赌注不言而喻:谁赢得这场竞争,谁就可能重塑数十亿人上网的方式。
这一时机绝非偶然。ChatGPT、Claude和Perplexity已经作为独立应用存在,但您无法直接使用它们浏览网页,也无法填写表单、比较购物网站的价格或与网页元素进行交互。AI浏览器完全改变了这一局面。就像驾驶自己的汽车,身边有一组超智能助手随行。
目前,依赖AI浏览器的用户基本上是在测试一种新奇体验。但这一运动指向了未来网上冲浪的新标准。
目前有几个选项可供选择,试图塑造未来的AI浏览体验。以下是对它们所提供功能的比较。
带Copilot模式的Microsoft Edge:免费(目前)竞争者
微软的提案极具吸引力:一个免费的AI助手,可以在任何更新的Edge浏览器上使用。新的Copilot模式立即向用户展示一个统一的输入框,结合了聊天、搜索和导航。用户不再需要点击进入ChatGPT——在打开新标签页时,它就在那儿。
这似乎是新AI驱动互联网的提案。您不再需要进行网页搜索,而是首先与AI代理进行对话,AI会执行您所要求的任何操作——与您聊天、搜索网页、推荐书籍或电影、对某个主题进行全面研究等。
其实施展示了微软多年来在AI投资方面的回报。多标签意识意味着您可以在十几个网站上研究度假租赁并要求Copilot找到距离海滩最近且有完整厨房的房源。视觉分析让您可以指向TradingView图表并请求价格预测,而无需离开该网站。视频摘要仅需一键就能提取冗长内容中的关键要点。
不过也有一些限制。视频分析仅在存在字幕时可用——没有字幕就无法摘要。该新闻功能在没有准确日期参数时表现不佳,有时在请求“最近”更新时返回多年前的文章。而那个“限时免费”的标签则引发了对未来定价的质疑。它甚至在与微软生态系统的集成方面也存在不足,例如,您无法要求它为您撰写电子邮件,即使您的地址是outlook.com。
如果您想了解更多,可以查看我们的一篇文章,分享我们的第一印象。
微软承诺即将推出的功能,如任务旅程,将组织您的浏览历史为基于主题的工作流程。不过,目前,它仍然是AI驱动浏览的一个光鲜但不完美的窗口。
Perplexity Comet:200美元的AI承诺
Comet代表了微软以云为中心的方法的对立面。这个开源浏览器优先考虑将信息本地存储在用户的设备上,确保数据永远不会离开他们的计算机。其架构反映了一种基本的赌注:用户愿意为绝对的隐私控制而交易一些AI的复杂性。
Perplexity主要是一个搜索引擎,但Comet的AI能力超越了简单查询。Comet将AI驱动的搜索和广告拦截直接纳入其核心架构——不是作为附加功能,而是作为浏览体验的核心组成部分。每一行代码都通过其开源特性保持可审计性,允许安全研究人员和隐私倡导者验证其声明。
它还提供了一个功能更强大的助手,支持Gmail集成——将微软Copilot远远抛在了身后。用户还可以访问Comet Assistant,这是Perplexity推出的新AI代理,旨在自动化常规任务。Perplexity表示,该助手可以总结电子邮件和日历事件,管理标签,并代表用户浏览网页。
例如,您可以仅通过要求AI为您点餐,自动在结账时应用促销代码,并解析您的个人数据以查找信息,等等。
唯一的缺点?您需要每月支付200美元才能使用仍处于实验阶段的功能。
Dia:杀死Arc浏览器的AI强者
Dia在微软的第三方依赖与Comet的开源精神之间走了一条中间道路。该浏览器使用完全自主开发的专有AI模型,完全控制技术栈。这种方法使Dia能够专门针对其所声明的使命进行优化:最大化用户生产力和简化信息访问。
通过从头构建AI模型,Dia避免了许可费用和供应商依赖。该公司可以精确塑造其AI的行为,创建第三方模型可能不支持的专业功能。可定制的AI功能适应个别用户的工作流程,承诺提供比一刀切解决方案更个性化的体验。
除了让您输入网站名称和搜索词外,Dia的URL栏还充当其内置AI聊天机器人的接口。该机器人可以为您搜索网页,总结您上传的文件,并自动在聊天和搜索功能之间切换。用户还可以询问有关他们打开的所有标签的问题,机器人甚至可以根据这些标签的内容撰写草稿。
它有一个有趣的GPT驱动助手,通过一系列技能进行工作。最近的功能包括使用推理模型更好地理解任务和为用户提供更多帮助。例如,您可以要求它根据您与不同人聊天的内容发送同样意思但措辞不同的消息。凭借其推理能力,它还可以更好地协助您进行产品猎寻、销售等。
但专有开发需要巨大的资源,您在与模型交互时可以感受到这一点。虽然微软可以利用OpenAI数十亿的研究投资,但Dia必须独立为每项改进提供资金。要与GPT-4等模型保持竞争力,必须持续投资于人才、基础设施和计算资源。
不幸的是,这款仍处于测试版的浏览器仅对拥有美国.edu电子邮件地址的MacOS用户开放。好消息是,它与Comet浏览器不相上下,并且是免费的。
Opera的Aria:可接入的替代方案
Opera采取了另一种方法,通过其Aria聊天机器人。该公司并不想重新发明轮子,而是提供与Edge的Copilot聊天机器人类似的体验——基本上是一个普通浏览器,在需要时可以点击一个AI按钮。
其集成包括自然语言浏览器控制的命令行功能和直接分析所选文本的AI提示。通过Opera的AI代理控制浏览器的标签。分组、关闭、固定、保存等,无需手动操作。用户每天可以免费生成5个AI图像,而拥有免费Opera账户的用户可以生成30个。
Opera的提案之所以与其他不同,不在于底层技术——它使用与微软相同的OpenAI模型,而在于其实施理念。Opera向用户免费提供所有AI功能,消除了可能限制采用的成本障碍。该浏览器还将现有的VPN服务与AI功能集成,创建了一个缺乏标准云实现的隐私层。
但Opera的Aria浏览器AI是唯一一个提供本地大型语言模型(LLMs)实验性支持的浏览器。这对于以隐私为首要考虑的爱好者来说是一个重要点,因为AI公司在能够获取任何类型的数据(私人或公共)以训练其模型时会非常渴望。
未来:Opera Neon和OpenAI的GPT驱动浏览器
这两个浏览器目前尚不可用,但它们承诺将100%专注于代理任务。
Opera Neon用户将能够,例如,要求浏览器制作游戏、报告、代码片段,甚至是网站——它将研究、设计并构建用户所需的任何东西。Opera Neon甚至可以被要求同时制作多个事物,实现真正的代理多任务处理。
除了在operaneon.com上有一个等待名单外,没有已知的临时发布日期。该浏览器承诺提供三种不同模式:“Chat”用于对话,“Do”用于任务自动化,以及“Make”用于创建从游戏到网站的所有内容。
Neon还将拥有一个基于云的虚拟机,显然即使用户离线也会继续工作。这种持久性将使得其他浏览器无法匹敌的复杂、长期任务成为可能。隐私仍然是首要考虑——所有网络交互都在您的设备上本地进行,仅有创造性任务在云中运行。
定价仍然是个谜,尽管Opera已确认它将是一个高级订阅产品。
此外,OpenAI的预期浏览器进入也在整个市场上笼罩。这家公司尚未宣布具体计划,但其AI专业知识和资源使其成为一个强大的潜在竞争者。与微软不同,后者许可OpenAI的技术,OpenAI则可以直接集成其模型,而不需要中间层。
如果发布,该浏览器预计将以非常——我们是说非常——无缝的方式使用人工智能。消息来源透露,该浏览器将集成OpenAI的Operator代理以进行任务自动化,并利用该公司4亿至5亿ChatGPT用户以获得优化的结果。
如果模型创建者也控制界面,那么可能会有哪些新功能出现?OpenAI能否实施目前许可协议阻止的功能?该公司的直接访问模型开发能力可能使其快速迭代和实验超越合作伙伴能实现的范围。
目前,OpenAI能提供的下一个最佳选择是一个统一的代理,使用沙盒浏览器供用户交互并要求模型执行复杂任务,如购物、主题研究、创建演示文稿、发送电子邮件等。
裁决:不同用户不同浏览器
并没有真正的超级浏览器,但根据您的个人档案,实际上可以根据您的优先事项找到“最佳”AI浏览器:
对于主流用户:微软的Copilot模式提供了最佳的功能、可用性和价格平衡(目前免费)。它今天可以在Windows和Mac上使用,无需特殊访问权限,并自然地与数百万用户已经使用的Edge浏览器集成。
对于强大(和富有)的用户:如果金钱不是问题,那么Perplexity Comet每月200美元的费用购买了今天最复杂的AI助手。Gmail集成、强大的自动化和隐私优先的架构为生活在浏览器中的专业人士证明了费用的合理性。
对于隐私警惕者:尽管有价格,Perplexity Comet仍然是首选。本地数据存储、开源代码和内置广告拦截创造了无与伦比的隐私提案。Opera Aria位居第二,提供本地运行AI助手的选项。尽管Neon可能在推出时挑战这一,但目前Comet和Aria是最适合这一用户档案的选择。
对于创意和动手能力强的用户:Dia提供了最精致的体验——如果您能获得访问权限。技能系统和与标签对话的功能感觉确实创新,尽管仅限于Mac和测试状态限制了其吸引力。
对于前瞻性用户:等待Opera Neon或OpenAI的浏览器。Neon的Make模式承诺提供当前浏览器无法匹敌的功能,而OpenAI的直接模型访问可能解锁全新的可能性。