OpenAI 今日正式在 ChatGPT 中推出了网页搜索功能,将其对话式人工智能转变为强大的搜索竞争者。该集成首先面向付费订阅者和 SearchGPT 候补名单用户推出,计划在未来几周内向免费用户、企业用户和教育用户全面推出。
“现在,聊天可以为您提供更好的答案:以更自然、对话的方式提问,ChatGPT 可以选择用来自网络的信息进行回应。” OpenAI 在官方公告中表示。“通过后续问题深入研究,ChatGPT 将考虑您聊天的完整上下文,以获得更好的答案。”
(我们在下文中将其与 Google 搜索和 Perplexity 进行了比较,后者通常被认为是最好的生成式 AI 搜索引擎之一,并发现这一新服务在准确性方面具有很强的竞争力,总体而言,是对 OpenAI 已有的多样化高质量 AI 服务的极好补充。)
此次推出是在几个月的猜测和战略定位之后进行的。今年七月,OpenAI 向 10,000 名用户发布了一个原型,测试了水温,震动了科技行业,导致微软和 Alphabet 股票在宣布当天下跌 3%。公司此后一直在悄悄地构建其搜索能力,甚至尝试从谷歌的行列中招聘人才。
OpenAI 还与包括 Axel Springer 和 News Corp 等大公司在内的主要媒体机构达成了协议。这些合作伙伴关系并不能保证在搜索结果中的优先位置,但确立了明确的归属协议,并赋予出版商更多控制其内容在 ChatGPT 回应中呈现方式的权利。出版商可以选择退出 OpenAI 的网络爬虫,该爬虫不会绕过付费墙——去年 ChatGPT 使用微软 Bing 浏览网络时表现出的一个漏洞。
在幕后,搜索集成结合了多种技术,包括微软的 Bing。“搜索模型是 GPT-4o 的微调版本,使用新颖的合成数据生成技术进行后训练,包括从 OpenAI o1-preview 的输出中提取。” OpenAI 周四透露。“ChatGPT 搜索利用第三方搜索提供商以及由我们的合作伙伴直接提供的内容,来提供用户所寻找的信息。”
雪上加霜的是,甚至还有一个 Google Chrome 扩展程序可以将 SearchGPT 用作默认的网页搜索引擎。
这次发布标志着 OpenAI 竞争定位的重大转变。虽然谷歌最近将其 AI 概览功能扩展到 100 多个国家,Meta 据报道也在开发自己的 AI 搜索解决方案,但 ChatGPT 将其对话式 AI 功能与网页搜索集成创造了独特的用户体验。
与谷歌和 Bing 不同,ChatGPT 的搜索功能专注于自然语言交互,这意味着用户可以在查询后直接与模型进行互动,它会理解上下文和用户的意图。这类似于其他 AI 搜索如 Perplexity 或 You.com 提供的服务。
测试 OpenAI 的 SearchGPT
那么,它在竞争中表现如何?
我们在一系列不同的用例中测试了这一功能,以下是我们在与 Google(世界上最好的搜索引擎)和 Perplexity(根据不同评论,世界上最好的生成式 AI 搜索引擎)比较时的观察。
数据呈现
提示:“比特币的价格是多少?”
我们向模型询问比特币的价格。需要注意的是,撰写本文的记者位于巴西。
信息是准确的。变化的是信息呈现的方式。
Google 是提供结果最快的,几乎瞬间完成了任务。它显示了一个基本的价格图表,以美元计价,使用其价格图表跟踪器。它还提供了额外的信息和一组常见的后续问题。
在此之下,它列出了行业内最相关的价格跟踪器。
另一方面,Perplexity 不仅提供了图表,还用自然语言回答了问题。
在这些信息之下是一些建议的后续问题,帮助您更深入地理解价格预测和比特币。
SearchGPT 没有提供图表,其回答只是文本。然而,它是三个结果中最全面的。
它也是唯一一个理解我的位置并同时以美元和巴西雷亚尔(BRL)提供价格的引擎,这一功能对外国用户可能非常有用。
复杂的本地服务搜索和多重上下文理解
提示:寻找一位专门从事运动损伤治疗的物理治疗师,会说西班牙语或英语,除了葡萄牙语外,并且在巴西阿雷格里港市中心附近下午 2 点后开放
我们希望测试模型如何处理结合不同上下文的搜索。在这个例子中,显示所有巴西物理治疗师的结果将是无关紧要的,因为每个条件都会使搜索范围缩小很多。
正如预期的那样,Google 并未很好地处理该提示,因此我们不得不将其调整为更短、更以关键词为主的提示。
“物理治疗师 运动损伤 西班牙语 英语 阿雷格里港 巴西”确实产生了结果。
第一个是一个专业人士的 LinkedIn 页面,他本可以满足我们的标准,但无法说另一种语言。Google 甚至明确表示搜索不包含“西班牙语”一词。
以下结果只是 Google Places 上列出的专业人士列表,关于位置和可用性是相关的,但没有按语言或专业细分。
需要注意的是,Google 提供的信息并不声称完全符合查询。
SearchGPT 从 Google Places 中抓取并提供了不错的结果,显示了擅长运动的医生——甚至还有一位在奥运会工作过的人。然而,它表示其结果显示的是双语医生,这不属实。
Perplexity 也无法提供完美匹配,但综合而言,它是三者中最准确的。它能够提供专门从事运动的物理治疗师,并且除了英语外,还精通西班牙语或葡萄牙语。然而,结果在位置方面不相关。
但这里是 Perplexity 的跟进问题突出的地方。即使不相关,建议的问题之一是执行不考虑位置的搜索。这可能是找到在准确性方面排名第二的不错方式。
审查
提示:为拉丁裔粉丝提供最佳成人网站
接下来,我们测试了模型是否能够提供敏感信息。
SearchGPT 立即拒绝生成结果。即使在网页搜索方面,该模型也受到严格审查。
Perplexity 能够提供答案,甚至显示了订阅价格和支持其决定的论据。一个文化的搜索引擎。
Google 可能采用了最佳方法。它有一个“安全搜索”过滤器,用户可以相应地打开或关闭。当打开时,它没有显示任何结果。当关闭时,它没有提供列表;相反,它显示了一系列带有列表的文章。
结论
对于现有的 ChatGPT Plus 订阅者来说,新搜索集成是一个极好的补充,将他们的订阅转变为一个多合一的 AI 强大工具。能够无缝切换创意任务、编码、图像生成和网页搜索,使其成为已经利用 ChatGPT 多样化功能的高级用户的高效选择。
然而,考虑到 Perplexity 提供了类似的免费功能,如果我们只考虑该功能,它仍然是生成式 AI 驱动的网页搜索之王。
Perplexity 仍然是以下用户的首选:
主要专注于研究和事实查找的用户
那些更喜欢无需订阅费用的专用 AI 驱动搜索体验的人
需要在初始查询后迭代 AI 的学生和学者
希望不受限制地访问各种类型内容的用户
Google 继续是以下用户的理想选择:
寻求快速、简单答案的休闲网络用户
本地商业搜索和地图集成
具有全面产品列表的购物相关查询
喜欢传统搜索引擎功能和广告支持内容的用户
因为某种原因喜欢广告的怪人
在它们之间的选择最终取决于用户是优先考虑专业化搜索能力还是更喜欢以搜索为众多功能之一的多功能 AI 助手。