上周参加了火山引擎的 Force 大会,门口人潮汹涌,我晚到五分钟,差点没挤进去。现在关注字节 AI 的人是真的多。豆包大模型虽然入局不算早,但如今显然已经稳稳杀进第一梯队,身边用豆包模型的开发者越来越多,讨论也越来越深。
大会上发布的豆包大模型 1.6,很多能力让我眼前一亮。最让我惊喜的是深度思考能力。模型可以查一点、想一点、再查一点,不是一次性输出,而是像人一样迭代式地探索问题、构建推理链。这其实就是多轮搜索推理,最近 OpenAI o3 模型也已经升级到这种模式。从推理表现来看,豆包大模型 1.6 已经具备全球一流模型的水准。
除了推理,多模态和 GUI 操作能力也有了显著提升。对我们这种做应用产品的创业团队来说,是利好中的利好。因为模型能力越强,我们越能打造出超预期的用户体验。
语音播客模型也非常惊艳。火山引擎展示的 Demo,不仅语气自然流畅,连吞咽口水的小细节都能还原得惟妙惟肖。我们正计划将这个能力接入到自己的产品中,让产品还原下孔子和弟子的对谈。
去年火山引擎把大模型推理成本降低了90%以上,这一次大会,他们又推出了一种新的计价模式:按输入长度区间定价。传统的做法是“思考模型”和“普通模型”分别定价,而火山引擎这次用新的模式,同样降价不少。综合成本比豆包 1.5 深度思考模型、DeepSeek R1 降低 63%。
除了模型之外,火山引擎还发布了很多开发者工具。今年是 Agent 落地的元年,从年初到现在,DeepResearch、Manus、扣子空间、Skywork、Lovart 等等 Agent 产品让我们感受到了 AI 自主干活的潜能。
毫无疑问,Agent 会是 AI 时代的应用范式。
那什么是 Agent?网上的定义很多,我觉得一句话就够了:Agent 是更智能的应用。
回顾过去二三十年,应用形态的演进,一方面是从 Web 到移动的载体变化,另一方面就是“智能化”的持续深入。比如抖音,已经不是人找内容,而是内容找人,背后是全局的推荐系统;再比如拼多多,用户不是按类目去逛,而是系统根据兴趣、行为主动推荐商品。
随着大模型技术的成熟,智能化得以更进一步。从内容推荐逐步渗透到所有的场景中。比如前面提到的扣子空间,我直接给他个任务,它就能够给我交付结果。中间的思考、规划(拆解任务)和行动,不需要人的干预。
也正因如此,Agent 时代,开发范式彻底变了。
过去的云原生架构,主要想解决的问题是应用的快速交付和弹性扩展。其实它聚焦的更多是应用开发出来后的部署和运维问题。而 Agent 的开发流程,和我用Java 写一个小程序电商应用,已经完全不一样。
Agent 需要的是强化学习、Prompt 优化、MCP Hub、知识库、运行沙盒等开发平台,以及具备推理能力和多模态的模型基座。如果你原来是个后端程序员的话,看到这些技术名词,肯定会觉得陌生。这就是时代的变化。如火山引擎总裁谭待所说:
技术主体在发生变化,PC 时代的主体是 Web,移动时代是 APP,AI 时代是 Agent。
在这次发布会上,火山引擎正式推出了面向 Agent 的全新开发范式。这套开发范式包括强大的基础模型,以及一整套 Agent 开发工具链,比如火山方舟、PromptPilot、MCP 服务、TRAE、FaaS 等。
这些工具从代码开发、模型调用、提示词优化到应用部署,几乎覆盖了大模型应用的全生命周期。也就是说,我们目前完全可以基于火山引擎提供的能力,低门槛的构建一个 Agent。
作为一个创业者,无比激动。
今天,我不想过多废话,写公众号还是给大家更多的实操,让大家看到这种新的范式下带来的新可能。这样,也许你也能够做一个自己的 Agent 产品出来。
我用 TRAE、豆包 1.6 模型,还有火山引擎上的工具链组合,给大家做一个 TRAE 中的 Agent 吧。不算复杂,但来自于我的真实场景,以及真实的创业应用(这是我们内部调研技术可行性的一个案例)。
写公众号嘛,需要简单一点。我就把 Agent 的载体放到 TRAE 中。尽量少代码,让大家看到其实这个时代,开发产品越来越简单。
最近因为快到期末考试了,我们家孩子和他妈每天都能上演鸡飞狗跳的大戏。看着他们俩斗智斗勇,我一拍脑袋,决定用 AI 做点小工具,来帮孩子巩固知识。同时,我想把这个能力,也作为我们未来产品的一部分功能(搜索:试卷擦除小程序可以找到)。
我反对孩子刷题。所以,我的思路是让豆包 1.6 按照对应的知识点,给我出套测试题。然后我要打印出来,所以,它得通过 MCP 的方式给我存到飞书文档中。
孩子做完题之后,我希望能够通过一个网页的方式,把题目做成 PPT,我来给他继续讲下。豆包 1.6 的前端网页能力很强,到时候,我们看看它的效果。
打开 TRAE,先创建一个 Agent,我把它命名为“期末专项复习小助手”。
提示词是:
你是一名北京海淀区的小学数学老师,精通各年级数学的知识点。你的任务是根据用户提供的年级信息以及知识点生成一套适合该年级学生的专项练习题。比如,用户可能会说:帮我出一套二年级数学减法专项测试题。
练习题要求如下:
- 练习题总数为20道,其中包括8 道填空题、8 道选择题和 4 道应用题。
- 题目需紧密围绕该年级的数学知识点进行设计。
- 难度适中,不出奇奇怪怪难以理解的题目。
你可以先理解用户的背景信息,然后学习对应的试题,最后再根据自己的理解出题。
最后,请将这份这份题目转为 HTML 文档。HTML 文档需要像试卷一样,黑白两色即可,最上方有填写日期、姓名的地方,每道应用题下方要留出可答题的留白。文档我会打印为几张 A4 纸。
答案单独给我生成一个文件。
我这个提示词挺长的。但效果怎么样,未知。对于大部分的 AI 应用而言,提示词会决定大模型的输出。用什么样的提示词来约束和激发模型的表现,至关重要。我们团队过去的经验是准备20个不同的提示词,然后逐个测试。其实这是个笨方法。
火山引擎这次推出来一个可以帮助开发者快速构建高质量提示词的交互式工具,叫 Prompt Pilot。我们只要用自然语言描述自己的想法,工具就可以帮我们基于提示词的相关知识,完成结构化,比如定义角色、思考逻辑。
真实的 Agent 开发环节,提示词不是写完就完事了。初版很好写,难的是后面的调试和打磨。Prompt Pilot 提供了可视化界面,可以直接测试不同版本提示词的效果,还能一键批量生成模型回答。更厉害的是,如果我们准备了几十条评测数据,它还能自动优化提示词。
利用 Prompt Pilot 优化完提示词后,我更新下 Agent 的配置就可以了。TRAE 现在可以选择最新的 Doubao-Seed-1.6 模型。一定要选这个。
如刚才所说,Doubao-Seed-1.6 系列模型是字节跳动最新推出的多模态深度思考大模型。不仅价格更便宜,而且深度思考能力也更强大。它原生支持 256K 的上下文,在编程方面也有不少提升。
我的 Agent 需要生成试题,以及 HTML,它对模型的思考能力,还有编程能力都有比较高的要求。我刚刚测试了下豆包 1.5 和 DeepSeek,它效果就没 1.6 好。这也说明了强大的基座模型对于 Agent 产品的重要性。
下面我们看下它的工作过程。从 Gif 图中你会发现,豆包 1.6的模式已经是边做边思考了。这是行业最先进的深度思考模式。推荐大家体验。
下面这份试卷是我用 Agent 生成的,内容结构清晰,格式也已经按 A4 尺寸排版好,直接打印出来就能用,不用再手动调整。特别方便。孩子妈妈看的心服口服。
而且,我还要求 Agent 给我附录了答案。
生成测试题不算难。如果我们产品只有这一步,那肯定是不够的。我的构想中,测试题是为孩子们掌握对应的知识服务的。题目是手段,掌握知识才是目的。所以,我希望在题目的基础上,Agent 能够对应生成一份课件,这份课件包括对核心知识的讲解,以及重点题目的分析。
家长可以基于这份课件,和孩子一起巩固知识。同时,我知道,孩子们要喜欢漂亮,有动画的课件。下面是模型生成的效果,很惊艳。你也能感受到豆包 1.6 在前端方面的突破。这完全是一个基于 HTML 的 PPT。
到这里,网页的生成告一段落。我需要将这些网页发布为一个线上的地址。因为我使用的 IDE 是 TRAE,它支持 MCP 的调用。所以,在这里,我们配置一个火山引擎的MCP。火山引擎发布了 MCP Hub,那里可以方便的查找和我们开发相关的一些 MCP Server。
并且,这个 MCP Hub 已经和 TRAE 打通,我们一键就能安装到 TRAE 中。同时,火山还把很多云服务组件也做成了 MCP Server。我们在 TRAE 中通过 MCP 就能够控制火山引擎的云服务。比如,我们现在装一个 veFaaS 的MCP Server。
紧接着,把 veFaaS MCP 配置到 TRAE 中,并关联到智能体,让它帮我把这个课件发布到 veFaaS,给我返回可以访问的地址。
以上,就是整个案例的完整流程。真的不难。为了尽量降低门槛,我一行代码都没写。其实你也看到了,很多 Agent 的开发就是这么简单——关键不是技术壁垒,而是你能不能理解用户需求,能不能用对工具。
有人可能会说,那我不想把 Agent 和 TRAE 绑得那么死怎么办?没问题,这套流程其实是可以灵活迁移的,比如在其它 IDE 开发环境,也能跑得通。
我真正想演示的,是整个 AI 云原生的开发流程是怎样跑通的:
- MCP 接入外部能力,实现通过自然语言对云资源的调度;
- TRAE 负责提示词调试、代码生成、应用部署;
- 豆包大模型 用来生成试题、网页等内容;
- Prompt Copilot 则做提示词的可视化优化。
这些工具组合在一起,就构成了一整套完整、闭环的智能体开发范式。你会发现,过去觉得遥不可及的事情,现在其实也就几步搞定。要是没有大模型,生成试题得定义多少规则和流程才能搞定?我刚刚的案例中,还没有涉及到多模态,比如,我可以为讲解配上一个豆包大模型生成的短视频......
我觉得 AI 云原生时代又是一个新的机会。
就像当年移动互联网刚兴起那会儿,谁先适应了新范式,谁就能快人一步。现在也是一样的道理。以前我们讲“软件定义世界”,现在可以说“提示词+模型+工具链”,正在重新定义开发的方式、产品的形态,甚至工作本身的边界。
对个人来说,这是转型的好时机;对团队来说,这是重构产品能力的窗口;对企业来说,这是重塑效率结构的底层机会。