腾讯助手元宝大升级!除了能搜公众号,跟其他国产搜索有什么不同?

5月30日,腾讯的AI助手应用「腾讯元宝」上线。因为可以引用公众号文章,内容生态质量较高,AI搜索赛道虽然卷生卷死,姗姗来迟的元宝仍然被看好。

7月1日,元宝迎来大升级:上线「深度搜索」模式,手机app更新到最新版本即可使用。

所谓的「深度搜索」,其实就是让AI助手更聪明,延伸你的问题,回答得比基础搜索更广泛和深入,还能同步生成内容大纲、思维导图等J人狂喜的格式。

这听起来有点耳熟,国内外的AI搜索都有类似的功能——Perplexity的「Pro」搜索、秘塔的「深入」和「研究」搜索,天工的「增强」和「研究」搜索……

总是略慢半步的元宝,能否真的后来居上?

认真答题还是狂水字数,只有一线之隔首先需要说明,「深度搜索」不是事先可选的模式,元宝先照常回答你的问题,再有几率提供「深度搜索」的一键生成选项。

比如,当我给元宝发个链接,让它总结公众号文章的内容,「深度搜索」就没有出现。

接下来正式开始,先来一个热身题:City不City是什么梗?

这个梗出自外国博主@保保熊,形容一个地方城市化、现代化、洋气,借着最近外国游客到中国旅游的东风,席卷了互联网。

元宝精准地找到了梗的出处,解释了基本和引申含义,以及它如何被更多短视频化用。参考的资料还很新鲜,其中一篇公众号文章,就比我发出问题早了2个小时左右。

不过,这是元宝用基础搜索就可以做到的事情,重头戏是一个金光闪闪的选项——「深度研究该问题」。

点击一下,元宝直接呈上了一份研究报告,不厌其烦地解释了这个梗的流行原因和社会影响,列出了大纲、脑图、相关人物。

但是,元宝的回答太啰嗦了,段落之间不少意思重复的表达,仿佛本科学生论文,挤一挤都是水分。

▲4张截图也截不完!

然后,我拿同样的题目,用秘塔的「深入模式」再搜索了一遍,给出的结果也有大纲、脑图、相关事件和人物等,甚至还能生成PPT,但看着更言简意赅,重点也没有遗漏。

▲图片来自:秘塔

选择秘塔作为对照组,是因为它在国产AI搜索里口碑较好,引用信源丰富,也支持脑图和大纲。拿秘塔的「深入模式」和元宝的「深度搜索」对垒,相对公平。

再来一个进阶题:2024年6月,海内外的AI生成视频工具有哪些重大的进展?

元宝先拒绝回答,说这是「未来」的事情,叫我自己动手。哪怕训练数据没有那么新,但它可以联网搜索啊!当我提醒了元宝,它终于反应过来,列出了可灵、Luma等工具。

然后再进行「深度研究」,元宝乱答一通,可能因为对提示词和上下文的理解混乱,同时回答了我两个问题:哪些AI可以联网搜索,以及AI生成视频工具的发展情况。

理解能力比较松弛,但延伸角度又弥补了这一部分,元宝介绍了其中一些工具的具体使用方法,并且思考了AI生成视频可能存在的风险,又实用,又懂升华。

再用秘塔的深入模式搜索,一次输出的答案就很不错,每个工具的发布都标注了时间,旁边的大纲引申到了更多非六月发布的工具,以及对整个行业的展望,详略得当。

其实在体验过程中,元宝的「已读乱回」不只出现了一次。

当我提问全球首款集成GPT-4o的智能眼镜,在「深入搜索」模式下,除了眼镜本身,元宝还介绍了GPT-4o在其他领域的应用,甚至提到了GPT-4o的竞争对手Gemini。

如果我是阅卷老师,会觉得AI是在堆砌材料,有偏题嫌疑。同学,我们的核心是智能眼镜,要么纵向介绍发展历史,要么横向比较竞品,而不是疯狂拓展支线剧情。

接下来试试元宝的舒适区。腾讯说了,在科研、财经等专业场景下,深度搜索的效果更突出。所以,来一道学术型的题目:近期的多起Manner咖啡员工与顾客冲突事件,可以用哪些社会学理论解释?

这一次,元宝回答得还不错,提到了异化、情绪劳动、资本监控和劳动者困境等理论,并引导我们思考:Manner事件是否反映了更广泛的社会问题?

再把问题交给秘塔的深入模式,搜索范围选择学术,回答得比元宝思路更开阔、更能扯淡,看起来学术含金量更高。

根据以上题目的测试结果,再结合使用感受,小结一下深度搜索的特点:

1.并非每个问题都需要深度搜索,有时反而显得信息冗余、逻辑杂乱、重点不突出。

2.在有限的题目范围内,元宝的深度搜索表现不如秘塔的深入模式。(欢迎大家提出自己的意见)

3.元宝的参考资料是第三方网站以及公众号文章的混搭,在有限的题目范围内,公众号生态没有体现出明显优势,高质量的信源固然重要,但模型能力也重要,对上下文的理解出错,直接拉低输出结果。

4.深度搜索的加载速度慢,字数又多,生成近3000字的完整答案需要1分多钟,等得让人心急,如果想要边看内容、边等待加载完毕,操作也不太方便。

AI搜索,让少数的问题被更多地思考不约而同地,AI搜索产品都在往更纵深的方向卷,腾讯助手元宝大升级!除了能搜公众号,跟其他国产搜索有什么不同?「深度搜索」「研究」「增强」……

这些不明觉厉的前缀,明确了AI搜索的定位。它们不完全取代传统搜索,而是有自己的赛道,更深入理解用户的查询意图,提供更精准完整的搜索结果。

数据显示,当前在大模型相关产品的使用中,超过65%的用户需求集中于提升工作与学习效率,其中「搜索问答」需求占比高达45%。

如果只是在手机上找到某个网站、某条新闻,AI搜索和传统搜索差别不大。

比如,相比通过输入「7月4日生成式AI大事件」、在腾讯元宝了解今天的大新闻,我觉得还是爱范儿和APPSO的早报更有价值。

人类编辑的信息筛选、总结乃至排版审美,更胜满屏都是字的AI一筹。

但找到和某个主题相关的文章、视频、图片、数据,对播客、论文等针对性搜索,生成调查报告、思维导图和PPT,就是AI搜索的强项了。

AI搜索不仅是搜索,也是研究和总结,有些像我们编辑把选题扩展成提纲再写成文章的过程。

基于这个角度,我向元宝提问:介绍几款类似网易有道Echo的海内外AI口语教学app。

提问的是事实本身,我想知道,进行深度搜索后,元宝的延伸角度会是什么,能否抽出一些可用的观点?结果比较常规,还是围绕着某个app的特色功能、收费标准。

我决定进一步追问,把这些app关联起来:这些AI口语教学app有哪些共同的特点?反映用户对口语学习的什么需求?

这次,元宝给我的答案好多了,总结了个性化学习、即时反馈、模拟真实对话场景、学习资源丰富等特点。

延伸角度也有意思,变得更加具体可感,关注到了时效性,以及用户群体:2024年最新的AI口语教学app有哪些新技术应用?哪些AI口语教学app适合初学者使用?

AI搜索查找资料的能力固然强大,但也要我们引导,才能给出有用的「你可能还想知道」「你可能还想问」。在这个过程里,我们也在思考。

AI搜索头把交椅Perplexity的CEO在专访中说过,大多数问题只需互联网搜索就能解决,少数问题要额外思考。

这个观点很适合用来破解2024年的一道高考作文题:随着互联网的普及、人工智能的应用,越来越多的问题能很快得到答案。那么,我们的问题是否会越来越少?

古希腊哲学家芝诺将人的知识比做圆圈,圆圈里面是已知的,圆圈外面是未知的,我们知道的东西越多,圆圈也就越大,外沿也就越长,我们不知道的也就越多。

因为AI,得到答案的过程更快了,同时也有更多问题随之而来。也是因为AI,那些少数的、需要额外思考的问题,我们可以走得更远。

版权声明

本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。

分享:

扫一扫在手机阅读、分享本文

最近发表

浩舟

这家伙太懒。。。

  • 暂无未发布任何投稿。