太平洋科技行业

首页 > 科技要闻 > 科技> 正文

AI大模型搜索之战开启，胜出黑马竟是ta？

新智元整合编辑：龚震发布于：2024-04-10 16:05

由华为云驱动

AI大模型正在逐渐崭露头角，挑战搜索引擎的地位。然而，要取代搜索引擎，AI需要具备准确的答案来源和实时性。目前国内的大模型产品在这两个方面能否胜任？本文通过对比测试来探讨AI与传统搜索引擎的差距，并展望了AI替代搜索引擎的可能性。

几天前，ChatGPT突然官宣免注册，让网友直呼AI取代搜索引擎的宏伟蓝图已经拉开帷幕。

就像搜索引擎在2000年后逐渐成为了全世界互联网的大门一样，如今LLM的迅猛发展似乎也标志着互联网即将进入Gen AI时代。

ChatGPT、Gemini、Copilot等AI工具，让我们在线查询和消费的信息的方式，正在发生翻天覆地的变化。

Perplexity和You.com，已经将自己定位为下一代搜索产品。连谷歌和必应，都押注AI是搜索的未来。

那么问题来了，AI大模型真的能取代搜索引擎吗？

理论上，当然存在这种可能。但前提是能够做到以下两点：

1. 对于用户的问题，能否找到相关、可信的来源，从而给出准确的答复。

2. 对于用户有时效性的问题，能否找到最新的来源。

现在国内的各个大模型产品，能完成这两项任务吗？

话不多说，让我们把这些AI拉出来遛遛，在各种搜索任务上，来一番实测PK。

LLM VS 搜索引擎

此次参与搜索竞赛的，不仅有老牌搜索引擎，还有国外很火的模型A，以及国内主流的大模型选手B、C、D。

赛事第一项，考核的就是时效性。

我们先来问一个既隐含时间信息，表述又比较模糊的问题：「百度接下来会举办什么发布会么？」

显然，传统搜索引擎既不能准确定位时间信息，也无法直接理解基于自然语言的提问。

小试一下就知道，传统搜索会帮你删减一些它认为「不关键」的关键词。

而模型A很快就找到了5个新闻地址，但由于无法识别当前的时间信息，结果把百度去年举办的活动搬了出来。

模型B的答案要更加完善，但同样没搞清楚时间，给出的是往届发布会的信息。

模型C准确识别出了小编提问的时间是在4月7日。

然后很轻松地将搜索的时间点卡在7日之后，并具体列出了接下来百度即将召开的三个会议。不过，没有参考连接这一点，有些遗憾。

相比之下，模型D的答案就比较惊艳了。

它不仅回答准确，而且最大的亮点是，在联网搜索后给出了参考链接，能够溯源验证信息。

内容虽然相对简洁，但精确回答了问题，也引用了完整的参考文献

PK赛的第二项，就是总结的完整度。

清明假期的一匹黑马，就是宫崎骏的动漫电影《你想活出怎样的人生》了，刚刚票房已破了8.55亿元。电影到底讲什么了呢？

传统搜索引擎只会搜什么，给什么，呈现了观影评分、网友评价，却无法对影片进行总结。

模型A则从主题内涵和评价分歧两方面进行了分析，似乎更有条理。

不过，这里的参考链接「2」直接对应的是「知乎登录验证」，也不知道模型A最后是怎么绕过去的？

模型B则给出了3篇参考文章，以及更加丰富的回答。

但遗憾的是，它搞错了主角的名字——原著是叫「小哥白尼」，在电影中则是「牧真人」。

同样，模型C也把主角在原著和电影里的名字给搞混了。

模型D在熟读3篇文章之后，从影片的主旨核心，叙事风格进行了总结。

经过小编的验证，所有参考链接也都可进入查询。

综合能力如何？

从上面的PK中不难看出，模型D可以说是几位选手里最有潜力的存在。

不过，正如文章开篇所提到的，大模型如果想「接替」搜索引擎，就必须能够针对用户的问题找到实时且正确的来源，并给出准确的回答。

时效性

首先，在时效性方面，选手D可以精准地搜出事件发生的时间。

比如，「探索一号」科考船圆满完成首次中国-印度尼西亚爪哇海沟联合深潜科考航次任务的时间是3月28日。

相关性

而在准确性方面，选手D的表现尤为出色。

它不仅根据非常简短的搜索词「NAKAKITA招聘」，找到对应的官网。

而且还能准确地判断出问题中的关键「招聘」，并对网站内容进行详细的搜索。然后，进一步给出了正确的结论——官网上没有与招聘相关的内容。

当然，除了搜索能力之外，大模型到底好不好用，还需要全方位地考察一下才行——

文档解析

话不多说，接下来我们就加大难度。首先，上传一个文档，要求画出折线图，显示连板变化，数据在文件中，x轴是日记，在开始画的位置写上股票名称，每次发生变化都要写。

原始数据如此细节的要求，它都一一做到了，丝毫不差。

然后，再要求在另一份表格中空白的单元格中都填上1，它也圆满完成了。

更多功能

此外，选手D在图片生成、图片描述、文字提取等多模态领域的表现，也十分出色。

而最近大热的智能体功能，它甚至可以完美支持PC、App和小程序三个入口。

到这里，我们就可以揭秘选手D的身份了，它就是——智谱清言。

来自国内唯一一家全模型产品线对标OpenAI的企业智谱AI。

大模型取代搜索引擎，可能性多高？

众所周知，大模型相比于传统搜索引擎有着更强的问题分析、归纳总结、理解和推理能力，让我们不必再去研究需要使用哪些「关键词」才能找到自己想要的内容。

但卡脖子的地方在于，大模型训练数据的时效性。

ChatGPT虽然打开了认知，让AI模型更像大模型了，但它还并未用到实时搜索。

而国内的这些模型，则给了我们更多希望。

当大模型工具能够整合先进的数据抓取和整理能力时，就能形成全新的搜索引擎链条：

首先AI会根据提问进行需求分析-网页搜索–答案归纳，然后通过自然语言对话的方式直接回答问题，从而实现与用户更好地交互，而不仅仅提供一系列网站链接。

所以，现在AI大模型究竟离搜索引擎有多远呢，它们能杀死谷歌吗？

让我们从细处着眼。

当我在讨论搜索引擎的时候，我在讨论什么？

这里贡献一个冷知识：每年都有大量的人去谷歌搜索框中，输入「谷歌」两个字。

其实，并没有那么多人去谷歌上查找难以访问的科学信息，但用它查找邮箱、购物网站的人，要多出几个数量级。

或许，摆在这些潜在的谷歌杀手AI面前的问题，不是它们找到信息的能力，而是它们是否能做搜索引擎能做的一切。

1. 网站导航

其实，搜索引擎的最主要工作，是把我们带到一个网站。

Google上所有排名靠前的查询，从「YouTube」到「Yahoo Mail」，都是导航查询。

但AI机器人往往会思考几秒钟，然后提供一堆公司信息，但可能并没有链接到Amazon之类的具体网站。

2. 信息查询

对于体育比赛比分、现在几点了之类的实时信息，谷歌都做对了，而AI工具往往都会过时（原因如上文所示）。

并且，谷歌往往会有关于你特定位置、背景的信息，而AI机器人很多都没有。

当然，如果查找「一年有多少周」这种问题，AI产品往往会给我们惊喜。

谷歌会回答：52.1429周。

而Perplexity和智谱清言则给出更加全面的答案——不仅分别考虑到了平年和闰年的情况，而且还给出了计算过程，非常清晰易懂。

3. 探索性查询

「如何打领带」、「为什么会发明电锯」类似的问题，都属于探索性的查询。

这些问题往往没有单一答案，而是学习过程的开端。

就比如，你在谷歌查找一位歌手，或者NASA历史之类的问题，这时的你就是在探索。

这并不是人们使用谷歌的主要目的，但正是AI搜索工具大放异彩的时刻。

比如，针对「为什么发明电锯」这一问题，Perplexity就会给出电锯的医疗起源，并描述其技术演变过程，最终被伐木工人采用。

4. 参考链接引用

AI搜索工具最大的亮点之一，便是提供了引用来源的链接。

这意味着，如果用户在搜索结果中发现了一个特别感兴趣的事实，可以点击链接，进入原始出处获得进一步了解。

总之，当我们谈起搜索引擎，最大的问题恐怕不在于技术，而在于产品。

如果将以上问题一一解决，同时探索出合适的商业模式和结构，AI取代搜索引擎，应该就不远了。

那时，我们搜索时会出现的，不仅仅再是简单的链接罗列，而是一个开门见山的准确答案。

参考资料：

https://www.theverge.com/24111326/ai-search-perplexity-copilot-you-google-review

https://chatglm.cn/main/alltoolsdetail

文章来源：新智元

AI大模型搜索引擎时效性

新智元

原创栏目

三星Galaxy S26系列现场上手：防窥屏杀疯了！

一款为不妥协而生的游戏显示器

换个视角看世界这台小相机有点东西

手机中暑急救指南：9款散热背夹横评

IT百科

更多 >

抖音网页版怎么进入

iPhone12外观实锤！这2个问题还会重演吗？

AI大数据教你把妹儿？都是送人头的低俗趣味

我在双11买杜X斯的秘密怎么全网都知道？

收藏！买买买之后最该看的网购维权指南

比炒鞋更狂的炒盲盒

还去淘宝买iPhone有锁机？华强北的卖家都哭了

终于！AI开始对这届大学生们“下手了”

网友评论

聚超值•精选

更多>

推荐手机 笔记本 影像硬件家居商用企业出行未来

太平洋科技 行业

AI大模型搜索之战开启，胜出黑马竟是ta？

太平洋科技行业