前天开始,一款名为 Manus 的泛任务 Agent 在网络上迅速走红,引发了褒贬不一的讨论。赞扬者欣赏其异步可视化的模式,认为它将原本抽象的 AGI 的具像化表现,更有人称这是继deepseek之后的又一大胜利;批评者则认为其技术创新有限,并指出国外早有类似产品。借助 Claude 等具备优秀规划和编程能力的大模型,再结合浏览器自动化(
浏览器自动化工具 browser-use:让 AI 轻松操控网页
)、 代码解释器等工具和环境,便能快速复现类似功能。只是因为信息差,加上一些大V的夸张宣传,才使得 Manus 短时间内迅速出圈。
对于 Manus 产品本身而言,可以将其简单理解为 DeepResearch 的泛化版本,或是 AutoGPT 的可视化呈现。笔者认为其核心在于产品层面的创新,它摆脱了传统 AI 应用常见的 chatbot 形式,强化了异步交互体验,并通过构建虚拟环境,更有利于系统的维护和管理,规避本地环境的复杂性,并为后期的商业化落地奠定基础。如下图所示,笔者个人的一个副项目也采用了类似的设计思路:
随着AI执行的任务不再简单的即时回答问题,而是需要进行思考分解不断迭代执行的长过程时,这种异步化的任务交互模式应该很快会得到流行。
然而,笔者今天想探讨的并非 Manus,也不是异步任务Agent,而是 MCP(Model Context Protocol ),它是由Anthropic 于 2024 年 11 月发布的一款开源协议,旨在充当 AI 的应用与外部服务或数据之间的桥梁。当前许多产品都在围绕如何操作浏览器做文章,但浏览器及其背后的网站,其设计初衷是面向人类用户服务的,这对于 AI 而言天然存在诸多不友好之处。一个简单的验证码就可能让 AI 束手无策,更别谈当下各个网站和 APP 之间的数据孤岛。在现有模式下构建 Agent,以外挂兼容的形式实现,注定只能是概念性居多的产品,犹如在 2G 网络下看视频,或在 IE6 浏览器上开发复杂 Web 应用,注定是一种过渡性的、难以真正普及和发挥巨大价值的“小众自嗨”式产品。
如果我们认同 AI 崛起是不可逆转的趋势,那么浏览器以及浏览器所代表的网站网页生态必将面临变革。CrazyStupidTech 近期发表了一篇题为《
AI 会吞噬浏览器吗?
[1] 》的文章,其中提到:
“对我们大多数人来说,难以想象没有浏览器的生活。但随着 AI 将信息从文本、视频和音乐中解构为独特的、可自由组合的聊天机器人答案流,我认为在未来十年内,浏览器要么主动适应,要么走向衰落。”
浏览器是为人类用户和文档而构建的,互联网正是在这种范式下蓬勃发展。如今,ChatGPT 及其同类产品的兴起,已成功地将信息的最小单位从“文档”转变为“token”。
这种认知已在 Anthropic、OpenAI 等 AI 领军企业中成为共识。尽管如此,它们选择了不同的发展路径。OpenAI 倾向于通过插件机制构建自己的ChatGPT生态,而 Anthropic 则推出了 MCP。前者更偏向封闭和中心化的平台帝国,后者则更为开放和去中心化的松散联邦。搭
建 MCP server就像是搭建AI时代的网站,
能够为各种 AI 应
用提供服务或数据。从这个角度来看,MCP 有潜力实现真正的普惠,让每个人在
掌握数据与应用的自主权的同时
贡献价值并从中获益变现。正因如此,MCP 为未来的互联网发展描绘了一幅全新的蓝图,一个对 AI 友好、也让人类受益的新图景。
正如笔者在《搜索、推荐之后,下一个打破信息差促进信息流动的历史性机会是什么?》 一文中所述,未来的互联网将
从对人友好向对AI友好转变
,而支撑其形态的浏览 器、交互协议、网站、APP 也将迎来新的进化。
那么,进化成什么形态呢?目前难有定论,
但笔者认为,从 MCP 的理念和利益分配机制来看,它具备形成巨大生态的潜力。因此,对于长期从业者而言,将目光从对现有模式的修补和兼容,转向对新生态的探索 ,无疑是更具前瞻性的 选择。
参考资料
[1]
AI 会吞噬浏览器吗?: https://crazystupidtech.com/archive/will-ai-eat-the-browser/
专栏新书推荐:
公众号回复“进群”入群讨论。