有关manus的思考：传统浏览器的回光返照！AGI应用到底将以什么形式出现？ - 文章 - 开发者社区

前天开始，一款名为 Manus 的泛任务 Agent 在网络上迅速走红，引发了褒贬不一的讨论。赞扬者欣赏其异步可视化的模式，认为它将原本抽象的 AGI 的具像化表现，更有人称这是继deepseek之后的又一大胜利；批评者则认为其技术创新有限，并指出国外早有类似产品。借助 Claude 等具备优秀规划和编程能力的大模型，再结合浏览器自动化（

浏览器自动化工具 browser-use：让 AI 轻松操控网页

）、代码解释器等工具和环境，便能快速复现类似功能。只是因为信息差，加上一些大V的夸张宣传，才使得 Manus 短时间内迅速出圈。

picture.image

对于 Manus 产品本身而言，可以将其简单理解为 DeepResearch 的泛化版本，或是 AutoGPT 的可视化呈现。笔者认为其核心在于产品层面的创新，它摆脱了传统 AI 应用常见的 chatbot 形式，强化了异步交互体验，并通过构建虚拟环境，更有利于系统的维护和管理，规避本地环境的复杂性，并为后期的商业化落地奠定基础。如下图所示，笔者个人的一个副项目也采用了类似的设计思路：

picture.image

随着AI执行的任务不再简单的即时回答问题，而是需要进行思考分解不断迭代执行的长过程时，这种异步化的任务交互模式应该很快会得到流行。

然而，笔者今天想探讨的并非 Manus，也不是异步任务Agent，而是 MCP（Model Context Protocol ），它是由Anthropic 于 2024 年 11 月发布的一款开源协议，旨在充当 AI 的应用与外部服务或数据之间的桥梁。当前许多产品都在围绕如何操作浏览器做文章，但浏览器及其背后的网站，其设计初衷是面向人类用户服务的，这对于 AI 而言天然存在诸多不友好之处。一个简单的验证码就可能让 AI 束手无策，更别谈当下各个网站和 APP 之间的数据孤岛。在现有模式下构建 Agent，以外挂兼容的形式实现，注定只能是概念性居多的产品，犹如在 2G 网络下看视频，或在 IE6 浏览器上开发复杂 Web 应用，注定是一种过渡性的、难以真正普及和发挥巨大价值的“小众自嗨”式产品。

如果我们认同 AI 崛起是不可逆转的趋势，那么浏览器以及浏览器所代表的网站网页生态必将面临变革。CrazyStupidTech 近期发表了一篇题为《

AI 会吞噬浏览器吗?

[1] 》的文章，其中提到：

“对我们大多数人来说，难以想象没有浏览器的生活。但随着 AI 将信息从文本、视频和音乐中解构为独特的、可自由组合的聊天机器人答案流，我认为在未来十年内，浏览器要么主动适应，要么走向衰落。”

浏览器是为人类用户和文档而构建的，互联网正是在这种范式下蓬勃发展。如今，ChatGPT 及其同类产品的兴起，已成功地将信息的最小单位从“文档”转变为“token”。

这种认知已在 Anthropic、OpenAI 等 AI 领军企业中成为共识。尽管如此，它们选择了不同的发展路径。OpenAI 倾向于通过插件机制构建自己的ChatGPT生态，而 Anthropic 则推出了 MCP。前者更偏向封闭和中心化的平台帝国，后者则更为开放和去中心化的松散联邦。搭

建 MCP server就像是搭建AI时代的网站，

能够为各种 AI 应

用提供服务或数据。从这个角度来看，MCP 有潜力实现真正的普惠，让每个人在

掌握数据与应用的自主权的同时

贡献价值并从中获益变现。正因如此，MCP 为未来的互联网发展描绘了一幅全新的蓝图，一个对 AI 友好、也让人类受益的新图景。

正如笔者在《搜索、推荐之后，下一个打破信息差促进信息流动的历史性机会是什么？》一文中所述，未来的互联网将

从对人友好向对AI友好转变

，而支撑其形态的浏览器、交互协议、网站、APP 也将迎来新的进化。

那么，进化成什么形态呢？目前难有定论，

但笔者认为，从 MCP 的理念和利益分配机制来看，它具备形成巨大生态的潜力。因此，对于长期从业者而言，将目光从对现有模式的修补和兼容，转向对新生态的探索，无疑是更具前瞻性的选择。

参考资料

[1]

AI 会吞噬浏览器吗?: https://crazystupidtech.com/archive/will-ai-eat-the-browser/

专栏新书推荐：

公众号回复“进群”入群讨论。