Multi-Agent 产品体验报告(2025.8)
体验时间:2025 年 8 月
Atypica.ai
地址:atypica.AI - The AI Research Agent Simulating Consumers
核心理念:为主观世界建模
创始人的想法:
我认为人类发展的过程中,越来越多的事物可以被建模和计算。举个例子,物理学就是用来计算和预测客观世界的:比如一个物体掉下来时,我们能预测它的运动轨迹、速度和时间,以及它会如何反弹。现在,大语言模型帮我们解决了语言交流的问题,进而帮我们理解了思维的问题。这让我们意识到,就像物理学可以对客观世界建模一样,我们也可以用大语言模型对人的主观世界进行建模。我发现访谈这种形式特别有价值。以前我们总是让AI来回答问题,但现在我们可以反过来:让AI提问,由人来回答,然后让AI总结分析。当有了多个AI智能体后,不同AI之间的互动会产生很多新的可能性。这就是为什么我们想让更多模拟真实人物的AI智能体互相交流和互动。
谷歌最近发布了A2A协议,主要是关于多智能体之间的互通。但很多人对此的理解还停留在一个层面:把专注不同领域的智能体串联起来,形成一个工作流。在我们的语境里,其实Agent的定义是更偏向一个虚拟的个体。通过了解他的性格特点,我们就可以推演出他可能会做出什么样的决定、有什么样的判断,甚至能推测出他对某些事情的观点,而不仅仅是了解他掌握的知识。
使用流程
第一步:输入问题、追问、明确问题
工作流程其实非常直观。在网页上你会看到一个对话框,和常见的AI工具一样。你可以在对话框中提出需要分析的商业问题,系统会追问三到五个问题,来明确你的具体目的。比如说,假设我想研究一个产品的用户反馈,系统会问你:"你是以什么角色来研究这个问题?你想了解性能反馈还是用户体验反馈?获得这些反馈后,你打算用于新品研发还是竞品调研?"通过这些追问,系统会更清晰地理解你的需求。
第二步:规划任务
第二步,系统会把前面的问答内容整理成一系列具体的工作任务。
第三步:实时搜索,构建典型用户画像
然后第三个Agent会在社交媒体上进行实时搜索,主要覆盖小红书、抖音和Instagram这些平台。不是直接调用平台的数据接口,而是像真实的研究员一样去搜索内容。搜索后能看到很多帖子,包括原文和评论。基于这些上下文,会模拟发帖用户的典型消费者画像,一般会生成至少5个典型用户画像,有些客户甚至会要求生成100个。
第四步:创建多个智能体
接下来会根据搜集到的所有内容,创建用户智能体:
第五步:分别采访、主管总结
然后接下来会触发下一个Agent进行Interview,就问这些原型的人相应的问题,这些问题都会和你要解决的大问题有关。问完以后把这些问答总结成Summarize成一段话。这段话再生成一个图文并茂的报告,一个可以公开访问的 html 文件
https://atypica.ai/artifacts/report/PvWzubsADqDvNFbJ/share
使用场景:
可以解决的四个主要商业问题:
第一是市场洞察。比如,我们可以分析用户对某个产品的反馈。举个例子,我们最近研究新能源汽车市场时发现,有两个以上孩子的年轻家庭可能会需要MPV(多功能商务车)。
第二是产品共创。我们可以邀请目标用户群体一起参与产品开发。
第三是产品测试。假设你要为健身爱好者开发一款巧克力,你有A、B、C三个配方,我们可以帮你分析哪个配方最受欢迎。
第四是内容规划。比如很多小红书博主会用我们的系统分析自己的账号定位,规划未来的内容方向。除了这些预期的用途,我们也发现用户在开发一些有趣的新用法。比如有人用它来规划留学,分析自己的背景并获取适合的学校建议。
关于幻觉的处理:
创始团队认为:
我觉得幻觉和准确率对于商业研究来说是有两面性的。商业问题既是科学又不科学,这就是为什么我前面会说它既是Science又是Art。
这也是为什么我们要跟一些严肃的媒体谈合作,接入他们的数据源。虽然不是每个报告都需要接入,但对于一些特殊的问题或高阶用户来说,我们需要获取权威性的数据。这些权威数据应该优先于社交媒体上的道听途说,以确保分析的真实性。这是Science的部分。
至于Art的部分,当我们需要开拓思维时,我们需要看到更多元的视角,这时社交媒体的数据就特别有帮助。语言模型直接回答问题时会给出非常结构化的答案,但让它分析社交媒体数据时,就会发现其中存在很多争议和讨论,内容会更加丰富多样。这就是商业问题的特点,也是我们称之为复杂问题的原因。
你既需要基于事实的共识,又要探索共识之外的可能性。有时候你需要看到多种非共识并存的状态,最终由人来做决策。洞察的作用不是帮你做决定,而是帮你看到更多可能性。
所以我认为,这个系统在处理这种非共识的、艺术性的部分特别有优势。某种程度上,Hallucination(幻觉)反而是件好事,因为它能让思维更开放。
所以我们正在开发一个希望能尽快备案的大模型。在推理层面,我们不会重复造轮子,而是使用现有的Deepseek v3。但在上层推理方面,我们想做的是一个发散优先的模型,而不是收敛优先的模型。对于Deep research,你可能希望严谨地找出答案。但我们想做的是发散优先的模型——在得出答案之前,让更多人参与讨论,听取更多的声音。我觉得这样可能更适合处理既有Art又有Science的问题。
多智能体协作框架:
中心化框架,由一个“主管”来控制,每个智能体只跟主管智能体进行沟通,多个智能体之间互相不通信,所有的上下文仅主管智能体可见。最后由主管智能体交付最终结果。
Master Agent
**地址:**https://master-agent.cn/
核心功能:多智能体集群
MasterAgent 通过自研的 Master Builder 和 Agent Group 双引擎架构,重新定义了智能体的开发与协同范式。仅输入一句自然语言,就可以在分钟级内生成具备行为策略、长期记忆、专业知识体系和 API 操作能力的智能体集群,并全自动化进行跨领域自主分工与协同决策,直接交付结果。而这里面的全部流程均由 AI 驱动。 同时,在多智能体集群协作部分,MasterAgent 参考了人类团队的协作机制,能够更大程度上模拟真人的工作逻辑。在多 Agent 产生决策冲突时,引入改进 PBFT 协议,快速达成一致,保障资源的公平高效。在架构模式上支持扁平式、层级式、团队式多种组织结构,便于针对不同的工作场景进行灵活部署。 最重要的是,MasterAgent 基于强化学习和自主调度机制,能根据环境反馈和执行效率,动态优化任务分配策略,大幅提升并行处理能力。其复杂指令遵循率高达 99%,在多个领域首次突破了人类专家的水平。 相较于传统 Agent 工具,MasterAgent 的创新在于,它将 Agentic AI 的自主规划、决策、调整和反思能力深度融合,这让智能体从“被动响应”进化为了“主动推进”。 MasterAgent 更像一个“专业化 Agent 工厂”,能批量生产各行各业的专家进行集团作战。不管你是个人还是公司,只要把指令交给 MasterAgent,在一瞬间就会冒出来一群专业的智能体新成员和你一起并肩作战。
使用流程
第一步:输入问题、追问、明确问题
在您输入提示词后, MasterAgent会对您的需求进行判断,如果问题不明确,MasterAgent会继续追问,您可以在下方手动进行补充说明或者点击“AI补充按钮”,由AI来补充完整您的需求。
第二步:创建4个单智能体
指令发出后MasterAgent会对您的需求进行分析,组建单智能体。每个单智能体具备不同的功能以适配您的需求。
第三步:打包成团队-进群聊
团队组建完成后,点击“立即运行”,生成完成后MasterAgent会将生成的4个智能体组合打包成一个多智能体团队。(所有智能体可以在“我的智能体”中进行修改)
首次进入会将最开始的需求带入到输入框,您可以直接发送,或者修改需求后再发送。
第四步:拆解任务、分配任务
在该部分MasterAgent会按照最上面的流程图开始需求拆解,生成任务依赖并分配给对应的智能体。
等这些任务完成后才会在左侧展示任务清单。
然后所有的任务都会由系统分给每一个智能体一个一个完成。是否需要插件工具均由模型自行判断。每次跑任务都会给出一个报告。用户可以根据点击生成PPT 或者生成网站来根据这份报告生成对应项。
案例:
用户想制作一个像素绘画网页,感受像素风绘画的乐趣。
[MasterAgent像素绘画网页游戏交付结果.mp4]
好像是只能看到最终的交付结果,看不到智能体之间互相协作的流程
实测:
太卡了,使用体验很差,每一步、每一个按钮、每一个点击动作都很卡
[20250805-200622.mp4]
Manus-Wide Research
核心亮点:同时启动多个 Manus 同时工作
2025.08.01 号凌晨,Manus 推出了一项新功能:Manus Wide Research。这项功能的核心亮点在于,用户可以开启多个 Agent 并行工作,最后整合输出结果,轻松处理原本需要耗费数小时、动用数百个数据源的复杂调研任务。它的调度规模更为庞大,Agent 之间的协作也更加紧密,甚至可以并发调用 100 个子 Agent。
[20250802175009_rec_.mp4]
使用流程
第一步:输入问题
用户输入问题后,主 manus 开始工作,规划任务、搜集数据等等,完成一轮数据搜集后,会创建 n 个 manus
第二步:创建n个manus、分配任务
主 manus 会根据任务的复杂程度,创建多个子 manus。比如示例1里要求对比 100 个运动鞋,就会创建 100 个子 manus,每个子 manus 各自研究 1 种运动鞋;示例 2 里要求生成 50 张不同风格的图片,就会创建 50 个子 manus
第三步:汇总、总结
每个子 manus 将自己的任务交给主 manus,主 manus 汇总所有人的报告,总结交付最终的结果
对比
| 对比维度 | Atypica.ai | Master Agent | Manus-Wide Research |
|---|---|---|---|
| 使用场景 | 类似于“田野调查”,适用于需要“人”的视角去发散性的思考问题的场景 | 通用型,适合协作解决问题的场景 | 通用型,从官方的示例看,适合那种大量重复性质的分析工作 |
| 使用流程 | - 用户输入问题→系统追问→补充问题→确认问题→规划任务→联网搜索→构建用户画像→创建10个不同的智能体→分别采访→主管总结→ 输出报告 - 用户只在最开始把需求明确了,后面整个流程都是系统自动执行的 | - 用户输入问题→系统追问→补充问题→确认问题→创建 4 个不同的智能体→打包建群→再次输入任务→拆解任务、分配任务→协作交付 - 团队创建后还需要用户再次输入任务,有点重复 | - 用户输入问题→规划任务→执行一次任务→(根据任务复杂程度判断是否需要启动多 agent)→创建 n 个相同的智能体→拆解任务、分配任务→并行处理→主管总结→输出报告 - 创建的是 100 个一模一样的 agent,每个都具备同样的功能 |
| 交付的产物 | 交付的是一个图文报告: - 可公开访问的 html 网页 - PDF 文件 | 多模态的,“动手”的能力更强,根据官网的例子,交付的产物包括不限于: - 报告、图片、视频、网页游戏、代码程序等等 | |
| 多智能体协作框架 | 中心化的 - 由一个主管智能体,调度整个流程,采访所有创建的智能体,并总结出报告 - 只有主管智能体能看到所有的聊天记录 - 其他智能体之间互相不通信 | 去中心化的 - 每个智能体都有行动、规划、协作的能力 - 智能体之间互相交互、协作完成一个任务 | 中心化的 - 由一个主管智能体,调度整个流程。主 Manus 判断任务复杂度,决定是否开启多 agent。 - 主 manus 去创建子 agent 并分配任务 - 所有的子 agent 单独并行执行,各自的报告汇总给主 manus,主 manus总结输出最终结果 - 只有主 manus能看到所有的记录 - 其他子智能体之间互相不通信 |
| 产品形态 | 👍比较炫酷 可以看到智能体的交互过程,类似 manus,每一步做了什么都是可视化的 | 相当简陋,感觉还处于 demo 的形态 | 看示例挺好的,但是太贵了,用不了 |