AI 搜索引擎调研(2024.10)
调研时间:2024 年 10 月
AI搜索引擎调研
一、为什么要有AI搜索
传统搜索引擎的弊端
-
信息检索效率低
-
传统搜索引擎依赖于关键词匹配,用户输入查询后,返回的是一系列相关链接。用户需要逐个点击链接,筛选出想要的信息,经过用户自己的思考与整理后,才能得到最后想要的结果。
-
会返回很多页的结果,但是用户通常不会往后翻很多页,所以很多信息是相关度低的、多余的
-
这个过程,费时费力,效率很低,用户想要的是不动脑子、直接得到明确的具体的答案,而不是根据“参考网页”再二次加工
-
-
有广告干扰
- 传统搜索引擎,会有一些无用的干扰,比如广告、商业推广等,会打断思考流程,所以需要去除掉这些广告,提供清净的环境
-
输入的文字有限,不智能
- 以百度为例,最多支持输入38个汉字,如果是复杂的问题,没办法将背景、需求、前因后果都描述清楚,所以返回的结果也是不精确的,可能需要多次搜索
-
只能输出互联网中已有的内容
- 无论是官方资料、新闻媒体、还是社交平台个人账号发布的内容,总归是需要先存在这个答案,才会被搜索出来。无法创造出没有人发布过的、不曾存在在互联网中的新内容。所以针对那些复杂的、新奇的、需要结合个人具体情况的问题,是没有答案的
-
**传统搜索结果同质化、碎片化、浪费时间,**依旧倾向于以媒介视角堆砌信息,而非围绕用户多样化需求构建的知识获取路径。
直接问大模型的弊端
-
时效性不足
- 比如chatgpt是更新到2023.10月,对于这之后的社会新闻、时事热点、最新的科研成果等,他都不知道了
-
模型幻觉、可解释性差
- 大模型的思考过程不透明,可能胡说八道,尤其是在搜索场景下,用户想要得到的是一个可靠的、准确的结果,但是大模型给出的答案,缺乏信息来源,会不准确,对用户来说可信度不高
-
依赖用户输入的提示词
-
大模型在处理自然语言时非常依赖上下文。如果用户的问题不够清晰或上下文信息不足,模型可能会产生误解或不准确的回答
-
即使是问同一个问题,想要让大模型给出结构化的回答/思维导图等,用户输入的prompt直接影响到大模型输出的质量。但用户对提问方法的掌握水平是不一样的
-
-
通用大模型,缺乏行业理解
- 通用大模型,缺乏对某个行业的理解。对于垂直领域的专业知识掌握不够
AI搜索能解决的问题
弥补了传统搜索引擎和直接问AI大模型各自的弊端:
-
用户可以输入超过38个字的问题描述,更好的阐述需求
-
将AI大模型联网,相当于先用传统搜索引擎获取最新信息,弥补了大模型时效性不足的问题
-
过滤掉多余的参考链接,选取最相关的x条数据,深度提炼总结信息
-
过滤掉广告、商业推广、不相关的热点推送等各种骗流量的链接
-
总结,返回给用户直接的结果,减少用户动脑子的过程
-
标注数据来源:生成的结果有可靠的保障,每句话都有来源可依,最大程度的减少模型幻觉的问题,防止大模型胡说八道、或者大模型引用的数据太老的问题
百度搜索+AI
-
有些问题,会出现【AI智能回答】,分析问题-搜索全网-信息整理,返回答案,并且也带有参考信息来源
-
但不是全部问题都会出现【AI智能回答】
-
可以主动点击搜索框下面的【AI助手】,效果是一样的,但答案相对没那么深入
-
豆包插件,也会生成答案、脑图
二、AI搜索的使用场景
日常
-
衣
-
购物、买衣服、搜同款
-
试衣服、换装
-
-
食
-
计算卡路里、管理饮食
-
菜谱相关的、根据食材制定菜谱
-
搜美食
-
-
住
-
租房、买房、卖房
-
出行订房
-
装修攻略、家居物品
-
-
行
-
搜景点、出行攻略、根据个人情况规划路线
-
订机票/车票
-
规划徒步、骑行路线、制定健身计划
-
-
其他
-
单纯的网上冲浪,看新闻、八卦
-
体检报告解读、健康管理
-
问题:
-
每一类需求都有对应的APP,这类日常问题都在专业的软件里解决了,不太会在搜索引擎里单独问
-
单纯的上网,看新闻,大多是在碎片化的时间,而且文章的风格、排版、评论区,本身都构成了“上网”的一环,看原文比看ai总结的体验更好
学习/工作
-
学生:考试、论文、专业课、比赛……
-
工作:研究报告、汇报材料、专业知识、技术问题、法律文书报告……
需要查阅研究大量的文字材料、需要思考总结后输出自己的文字材料、且更注重结果的真实客观准确,而不是创意和创造性,这种场景更适合用ai搜索引擎
三、专门的AI搜索引擎
thinkany ⭐⭐
问题:没办法登录
时间历程:3.17号发布第一版,5.2号发布第二版
开发者:@艾逗比
开发者分享的文档:AI 搜索引擎在线分享
| 模式 | - Search - Chat - Summarize:摘要模式,丢一个链接进去,生成摘要,提高效率 |
|---|---|
| 模型 | |
| 模态 | - 只能输入文字、链接,不支持图片 |
| 维度 | - 文字答案、参考网页、每句答案标注参考信息、思维导图、生成播客(未解锁)、时间线(? |
| 信息源 | |
| 其他特点 | - 没有收藏 |
Perplexity ⭐⭐⭐⭐⭐
| 模式 | - Search、Chat - Summarize:也可以粘贴个文章的链接,自动总结,而且除了粘贴的这个链接,也会参考其他网页信息 - 但读不了微信公众号的链接 |
|---|---|
| 模型 | 标准Perplexity AI模型;付费版可选Claude 3.5、GPT-4o 、 Sonar;playground v3等 改写时可以切换模型 |
| 模态 | - 文字、word/PDF、链接; - 不支持图片 |
| 维度 | - 文字、参考信息、答案后标注信息来源(网页/视频/帖子,但在学术和写作模式下,没有参考的信息源)、相关问题、追问; - 实时性更强、引用的数据更新 - 可以继续搜索图片、视频;生成图片(付费) - 没有思维导图、大纲 |
| 信息源 | - 可以指定信息源:全网、学术、数学、直接写作、视频、社交媒体 |
| 其他特点 | - 普通版、pro版 - 可以设置偏好,用于获得个性化答案 - 发现页有推荐内容 - space,相当于上传文档、自己的知识库 - 收藏:一次提问及这个问题后面的追问,会形成一篇帖子,收藏整篇帖子 |
| 收费 |
SearchGPT
https://openai.com/index/searchgpt-prototype/
候补名单已关闭
“Sam and the truly talented team at OpenAI innately understand that for AI-powered search to be effective, it must be founded on the highest-quality, most reliable information furnished by trusted sources. For the heavens to be in equilibrium, the relationship between technology and content must be symbiotic and provenance must be protected.”
Robert Thomson, Chief Executive, News Corp
devv ⭐⭐⭐⭐⭐
https://devv.ai/zh 面向开发者
| 模式 | - Chat、Search - 但不能总结链接里的内容 |
|---|---|
| 模型 | 有8个:免费的、付费的、限免的 |
| 模态 | - 能输入文字、上传图片 - 不支持上传文章链接后进行总结 |
| 维度 | - 问一些通用问题:纯文字回答、信息来源及发布时间、每句话标注引用的信息源、相关问题、追问 - 问代码问题:文字说明、直接生成带注释的代码、相关问题、追问 |
| 信息源 | 全网,不会指定信息源;但可以选定GitHub;GitHub里可以指定一个仓库 |
| 其他特点 | - 可以手动选择是否联网 - 可以提前设置自己的偏好,包括身份信息、关注的领域、回答规则等,可以给出更符合用户需求的答案 - 可以收藏问题,但仅收藏 |
| 收费 |
Monica search ⭐⭐⭐
| 模式 | - Search、Chat、普通搜索,在输入问题的时候就可以手动选; - 询问模式就会跳转到对话框里,可以手动选择是否联网 - Summarize:也可以粘贴个文章的链接,自动总结,而且除了粘贴的这个链接,也会参考其他网页信息 - 但读不了微信公众号的链接 |
|---|---|
| 模型 | 免费、付费;GPT-4o mini、Claude 3 Haiku等;搜索下不能切换模型 |
| 模态 | - 只能输入文字,不支持图片 - 支持上传文章链接后进行总结,综合参考其他信息 |
| 维度 | - 文字,参考网页、每句答案标注参考的信息来源、相关问题、追问、继续搜索视频 - 信息来源看不到明显的更新时间 - 没有思维导图、大纲目录、图片等 |
| 信息源 | 全网,不支持指定信息源 |
| 其他特点 | - 普通模式、pro搜索(每天限免3次);但pro的结果并没有特别专业 - 可以在生成答案的基础上,继续搜索视频 - 生成的答案可以复制分享,不可以导出。但可以收藏 |
| 收费 | https://monica.im/pricing?source=vip_toolbar_switch_model\&dialog=hide |
⭕收藏后的备忘功能:
https://monica.im/webapp/memo/detail
Memo 是专属于你的一个 AI 知识库,你可以将任意的网页、AI 聊天记录、图片、PDF 信息收藏到 Memo,并与之聊天获取信息。随着 Memo 存储的内容增多,Monica 能够更好地理解你的任务意图,并基于知识库来提供更加准确和量身定制的答复。
Monica以下功能产生的知识会自动存入 memo:YouTube summary,PDF summary,web summary。可以通过 memo设置改变自动存入的方式。
秘塔 ⭐⭐⭐⭐
| 模式 | - Search、Summarize - 但不能随便聊聊 |
|---|---|
| 模型 | 不允许切换。秘塔AI搜索采用的MetaLLM模型由秘塔科技于2022年全栈自研。该模型于2023年通过《生成式大模型备案》(第二批)、《大模型算法备案》(第二批)。 |
| 模态 | - 支持上传图片进行搜索:https://mp.weixin.qq.com/s/ypQDqCkwFyHCBUraJOeJDQ - 上传食物照片、计算热量 - 上传k线图,分析行情 - 上传PPT图片,生成演讲稿 - 上传题目,做题 - 支持上传文章链接后进行总结(只阅读这个链接,不会参考其他链接了) |
| 维度 | - 大纲、相关事件、相关组织、相关人物、答案标注引用的信息源、参考网页及发布时间,不会图文混排 - 思维导图、生成PPT - 简洁模式下没有追问 |
| 信息源 | 播客 |
| 其他特点 | - 根据参考资料的多少、回复内容的多少,分为三种模式:简洁、深入、研究 - 工作流:选择某一个工作流后,在输入框里直接输入,会严格按照提前设定好的大纲,返回结果,以分析宁德时代的股票为例: - 可以直接定位到参考的数据源pdf,分屏查看 - 附带网盘文件,直接浏览:百度网盘、阿里云盘 - 无偏好设置 - 生成的答案可以直接导出word、PDF、秘塔写作猫,写作猫里有些二次处理的功能 - 无收藏 |
Brain storm ⭐⭐
-
问题:一直在检索思考中,不会输出结果,挂梯子也没用
-
特点:
-
对问题进行意图识别,会选择相关的agent,进行全方位的答疑,多角度的思考问题,从不同人群/不同角色的视角,去回答同一个问题,会给用户不同的思考,可能会导致不一样的理解,更加广阔的见解,使得答案更有启发性。
-
比如同一个问题,会得到产品运营、产品经理、开发工程师分别是怎么想的,综合做出自己的决策。相当于内置了许多agent,有个agent store,去商店里找到,或创建自己的角色。
-
所以用户得到的不仅仅是答案,而是可靠的、即时的、涵盖多个角度的解析。
-
主要侧重在互联网新媒体运营领域,所以搜索来源除了Google之外,也有新媒体运营的社区、论坛
-
360 ⭐⭐⭐⭐
| 模式 | - Search、Summarize - 但不能随便聊聊 |
|---|---|
| 模型 | 允许切换,14个模型 |
| 模态 | - 支持输入文字、语音,不支持图片、文件 - 支持上传文章链接后进行总结(除了粘贴的这个文章链接之外,也会参考其他链接) |
| 维度 | - 文字答案、参考网页、相关问题、答案标注引用的信息源及时间、参考图片**;****思维导图(可扩展)** - 没有大纲、目录; - 有追问,但需要单独点一下追问按钮,在对话框里追问。追问的内容看不出参考信息源了,看起来是大模型直接回答的 |
| 信息源 | 不支持指定信息源,全网 |
| 其他特点 | - 有五种模式:简洁、标准、深入、慢思考、多模型协作 - 思维导图,任意一个分支都可以继续扩展下去 - 保留了传统浏览器的导航栏 - 有些问题会不准,生成的思维导图,与我的输入,完全不相关;不能很准确的识别意图 - 多模型协作回答: 但是生成的答案里,没有标注每句话参考的信息源了 - 慢思考模式:用了多个大模型合作,思考过程很长 - 可以直接对生成的答案进行不同风格的改写 - 可以自定义功能模块 - 无偏好设置 - 结果分享:会生成图片、链接、二维码;导出word、PDF - 有收藏,但仅收藏夹 |
Felo ⭐⭐⭐⭐⭐
| 模式 | - chat、search - Summarize:也可以粘贴个文章的链接,自动总结,而且除了粘贴的这个链接,也会参考其他网页信息 - 也可以总结微信公众号的链接 |
|---|---|
| 模型 | - 在设置里进行切换 |
| 模态 | - 支持输入文字、链接,不支持图片 |
| 维度 | - 文字答案、参考信息、每句答案标注信息来源、思维导图(可选)、相关问题、追问 - 相关图片及链接、相关视频 |
| 信息源 | 信息源最多,甚至有小红书,但是并没有把搜到小红书里的东西,反而是登录后,直接在小红书的页面搜索了 |
| 其他特点 | - 在参考信息这里,鼠标悬浮到网页链接上,会小窗展示这个网页信息,,并把参考的地方高亮展示 - 可以对答案里面任意文本,划词,再搜索 - 可以对答案进行重写,换模型、或者不联网搜索 - 有深度推理模式 - 可以定制个性化信息 - 分享:复制、分享链接;收藏后的主题帖,也可以分享出去 |
| 收费 |
⭕收藏后:
-
收藏:可以把很多问题,收藏在一个主题集里,就可以根据主题集里的帖子和信息源,进行提问
-
很适合工作总结、学习总结;公众号等文章深度阅读
-
这个主题下可以加入新问题,管理起来很方便
-
Genspark ⭐⭐⭐⭐
| 模式 | - Search - Summarize,但不能总结微信公众号的 |
|---|---|
| 模型 | 不允许切换。 |
| 模态 | - 支持输入文字、链接,不支持图片 |
| 维度 | - 文字、答案标注引用的信息源、参考网页、相关问题、追问;会生成统计图表;事实核查 - 没有思维导图、没有大纲目录 |
| 信息源 | 全网 |
| 其他特点 | - 有三个垂类的搜索助手: - 会把答案,生成两个sparkpage,在网页里与AI对话提问 - 网页里是图文混排的、有大纲、目录,就是一个贴吧样子,还可以进行评论;推荐相似知识 - 也可以绕过搜索,直接生成sparkpage - 在答案后可以对答案里的某个细节进行事实核查,会通过大量信息源,交叉核对这些信息 - 适合复杂的研究场景、每一个细节都需要真实准确的场景,确保细节更可靠 - Genspark Autopilot Agent - https://mainfunc.ai/blog/genspark_autopilot_agent - 其实也是个联网搜索的AI助手,但有更多优点: 1. 无需重新措辞查询或交叉检查多个来源——Genspark 会为您处理所有并行研究、推理、交叉检查和总结。 2. 通过完全透明的来源获得更准确的结果。思考过程是透明的,每一个参考信息都可以单独点开 3. 任务异步完成,让您可以专注于其他工作。 4. 可以同时处理多个任务,结束后会把结果发到电子邮箱里 - AI生成的答案不可收藏、分享;但Genspark页面里的答案可以收藏、分享: |
⭕旅游攻略特别好:
-
生成非常完整的旅游攻略,会提供美食、自然风景、文化探索,三类可选
-
可以将AI提供的攻略,复制成自己的,在自己的页面里,可以进行文档编辑修改,非常适合J人出门做规划
-
是图片、文字、YouTube视频混排的,每个图片都带有链接,如果这个图片是在推荐住宿的酒店的话,就可以直接点击图片跳转到酒店预订页面,完全不用思考、不用多个软件之间来回跳转动手查了
- 商品、图片助手就一般
Globe explore 🤔
https://explorer.globe.engineer/
| 模式 | - 只能Search |
|---|---|
| 模型 | 不允许切换。 |
| 模态 | - 支持文字、图片 - 不支持上传文章链接后进行总结 |
| 维度 | - 概括文字、目录、概念可视化 - 没有思维导图;没有直接列出参考网页 |
| 信息源 | 全网 |
| 其他特点 | - 有三种模式可选: - 概念可视化、除了概括的文字之外,全都是图片,每个重点概念都是一个图片,点击目录可以快速定位每个概念、每个图片/概念都可以继续下钻、继续提问 - 下钻、追问 |
| 收费 |
更适合学习的场景,生成一个完整的学习大纲,连贯的、循序渐进的学习
Exa ai search 🤔
*对我来说太专业了,不是给普通用户使用的搜索引擎,The search engine *for AI
Exa AI 的核心定位是服务于AI,而非直接与传统搜索引擎如Google竞争。它旨在填补AI系统与互联网上丰富信息之间的空白,通过提供高质量的数据支持AI模型的训练和应用。
主要面向开发者和研究人员,尤其是那些需要从互联网上获取高质量数据以支持人工智能应用的人群。
| 模式 | |
|---|---|
| 模型 | |
| 模态 | - 只能输入文字,不支持图片; - 输入链接,也不是总计,而是similar results |
| 维度 | - 似乎只会返回搜索的结果,没有总结的答案 - 每个结果后面跟着show more、add to chat、see similar |
| 信息源 | - 信息源: - 全网、公司、新闻、论文、推特、pdf、GitHub、个人网站…… - 筛选时间 - 过滤掉一些关键字 - 自定义结果数量 |
| 其他特点 | - 两种搜索方式:关键字、神经网络;自动优化输入的问题 - 对中文的支持很差 - 会直接搜出twitter上的帖子 |
BeaGo 移动端
-
只可以输入文字
-
首页就是搜索,上滑有个发现页
-
搜索结果的实时性很强,信息源也很新。(试了下perplexity和felo,引用的文章是8月份左右的,我需要重新强调“今天为什么暴跌”,才会重新引用最新的,而360、豆包,就分析不出来)
-
每一段话都会附上参考的信息源
-
答案可以收藏、复制、发送、追问
-
上拉可以推荐别的用户问过的类似问题,直接浏览新闻的感觉
-
在页面里任何地方都可以划词,继续搜索高亮部分
-
相比arc的browser for me,BeaGo看起来要更清爽干净一些,生成的答案内容更丰富、且可以追问
四、联网的大模型
天工
| 模式 | - Chat、Search - 不支持Summarize:不能直接总结网页链接里的内容 |
|---|---|
| 模型 | 不允许切换。天工大模型,由昆仑万维公司开发 |
| 模态 | - 只能输入文字,不支持图片 - 不支持上传文章链接后进行总结 |
| 维度 | - 文字、图文混排,大纲、目录、每句答案标注信息源、参考网页及发布时间 - 没有思维导图等 |
| 信息源 | |
| 其他特点 | - 有简洁、高级,两种,高级后还有个【宝典】 - 首页花里胡哨的,推荐了太多可能感兴趣的东西,很乱 - 搜索的核心是查找,用户主动促发,有较为明确的目标,系统根据用户给出的信息,匹配对应的答案。 - 在【高级】模式下,输出的内容也是一大段话、没有目录大纲,但同时会生成一个【宝典】,进入宝典里面,是非常详细的内容 - 相当于简洁-高级-更高级; - 优势是:宝典里的内容会自动刷新;图文混排,适合写论文等深度研究的场景 - 宝典里不支持追问 - 生成的答案可以直接导出word、PDF,也可以保存在天工的云端**笔记,**在线编辑 - 选择兴趣标签,但可能只是为了推荐感兴趣的内容,不是优化输出结果的 - 无收藏 |
kimi
联网的大模型,不是搜索引擎
| 模式 | - Chat、Search、Summarize - 能判断出来,哪些需要联网搜索,哪些可以直接回答 |
|---|---|
| 模型 | 不允许切换。 |
| 模态 | - 支持上传文章链接后进行总结(只阅读这个链接,不会参考其他链接了) |
| 维度 | - 纯文字答案、参考网页; - 没有大纲、目录;答案里没有标注每句话具体引用的信息源,看不到明显的引用信息时间 |
| 信息源 | 不支持指定信息源,全网 |
| 其他特点 | - 可以手动打开/关闭联网能力 - 无偏好设置 - 生成的结果只能分享,不能导出文件、云笔记 - 无收藏 |
五、总结
原理、定位、形态
-
背后的原理都差不多,RAG
- thinkany与perplexity的原理
-
定位上会有差异
-
比如秘塔是偏学术的,无缝衔接自己的写作平台
-
360是更综合的搜索引擎,所以在对话能力上就比较弱
-
devv是面向开发者的,所以代码能力很强
-
由于定位不同,在交互样式上就各有侧重
-
但共同点都是:👇
-
多模式
-
Search:搜索
-
Chat:对话
-
Summarize:摘要模式,丢一个链接进去,生成摘要,提高效率
多模型
-
有收费模型,也有免费模型
-
模型的智能水平不一样,收费也不一样,可以给用户选择权,切换选择一个表现最好的
-
是重点做的功能,因为独立开发者想要跟商业公司竞争,只能打差异化竞争,会有用户想要尝试不同的大模型,所以源愿意为切换模型这个功能去付费
多模态
-
照片、视频、音频、文档等,现实生活中的所有类型的信息都可以作为输入交给ai,比如:拍照后,让ai帮忙想这张图片的朋友圈文案;把一本书上传,自动生成思维导图之类的
-
链接、图片、视频,目前还有很多AI浏览器没有实现让用户上传图片、视频等进行检索,未来可以做
-
是为了让AI更好的回答问题
多维度
-
通过很多个维度来展现生成的结果
-
直接回答、通过大纲去结构化回答、生成思维导图
-
时间线,创建按时间的学习计划,更清晰
-
深度研究:对问题进行扩写,生成研究报告
-
概念性的解释:展开某些比较专业的概念
-
生成播客
多信息源
-
可以全网,(谷歌信息源)
-
也可以指定信息源:all、Wikipedia、twitter、GitHub、学术论文库、小红书、播客
-
挂载信息源的好处:垂直搜索,为了特定的场景,检索范围更窄,密度更高
AI搜索流程
关键点:快、准、稳:
-
要保证准确度,用户意图识别,rag过滤,准确度60%左右。思路都是先把用户量搞起来,准确度慢慢优化。
-
发掘一些差异化的场景,比如直接从twitter里搜索到用户的留言回复,起到一个舆论监控的效果
-
准确度:取决于选择的大模型。也是用户最关注的点,直接决定了能否留住用户
- 准确度是第一要义——艾逗比的即刻
-
所以最重要的两点:选取的模型、数据的密度
-
但依靠的内容太多,可能会慢,也可能出现幻觉、不准,所以要做一个取舍
-
问题改写、重排、相似度匹配
-
重排后,拿到高优先级的详情页,速度会快一些
-
-
允许用户自己挂载自己的信息源
-
传统搜索引擎会是一个关键的基础设施,用谷歌的api去获取全网的内容,不会被替代掉
AI搜索的问题:
-
人工判断信息是否准确都会出错,AI也会出错
-
商业模式有待验证,国外的是收订阅费。但国内的都是免费的
六、其他app里AI搜索的例子
微博AI智搜
点进某个话题,在话题广场上,用户发言中间,会有一个“微博智搜”,点进去是详情页,有精简版和完整版。能快速的知道某个话题/事件的前因后果,节省看每一条评论/帖子的时间
-
精简版
-
AI总结
-
大众情绪分析
-
相关问题
-
-
完整版
-
AI总结—样本数—查看样本详情
-
大众情绪、讨论词云—样本数—查看样本详情
-
典型观点
-
微信搜索
-
需要问一个“问句”,才会有AI问答。比如搜“arc浏览器停止开发了”,就只有公众号文章。加上“吗”,才会有AI
-
会参考3篇参考资料
小红书
-
搜搜薯,不一定什么问题会出现
-
达芬奇:私聊,对话模型,会推荐一些笔记