SOLO 正式版:The Responsive Coding Agent

开发与运维大模型企业应用

picture.image

11 月 12 日,TRAE SOLO 正式版发布会带大家回顾了 TRAE 和 SOLO(Beta) 的发展历程,并正式介绍和实测演示了全新升级、全面开放的 SOLO 正式版:The Responsive Coding Agent。

TRAE 产品经理在《全新升级:The Responsive Coding Agent》的环节,展示了 SOLO 正式版的核心能力:实时有感知/Responsive Review、随时可掌控/Responsive Context、多任务并行/Responsive Multi-Tasking ;同时也分享了为什么 TRAE 要做 SOLO,以及 SOLO 在专业开发场景的应用。

以下是演讲全文:

picture.image

很开心今天和大家介绍,SOLO 正式版本——The Responsive Coding Agent。

大家可以看到 SOLO 正式版的产品界面,相比于 Beta 版本我们又做了一次大升级。在介绍具体的产品功能之前,我们先和大家分享 SOLO 的一些设计思路。

picture.image

The Responsive Coding Agent

开发者朋友都知道,Responsive 代表着响应式,从静态代码到动态响应,从单一设备到多端的支持。在 SOLO 中,我们将 Responsive 的体验融入到了 AI Coding 的产品设计中。具体来讲,分别是下面这三个方面:Review 、Context、Multi-Tasking。

  • 首先是Review 的响应式: 不只是单一维度的审查,而是多个维度审查,从每一轮会话任务、到每一次工具调用、到每一行代码变更,用户都实时有感知。

  • 再是 Context 的响应式: 不只是静态的固化的 Context,而是动态的,根据用户不同的任务来获取 Context,呈现给用户,用户随时可掌控。

  • 最后是任务的响应式: 不只是单一任务执行,是多个任务并行,从而最大化释放 AI 的潜力。

picture.image

下面我们就来具体介绍,在 SOLO 的正式版本中,具体的产品功能是怎样的。

实时有感知

首先是针对 Chat 的 Review 。SOLO 的设计方向是让 AI 去使用各类工具和 Context,Chat 就是最主要的交互入口。类比于在计算机里 Terminal 作为人和操作系统的交互入口,在 SOLO 中,Chat is the next generation terminal。

我们也观察到,随着 AI 能力的提升,AI 能处理的任务复杂度越来越高,过程日志也越来越冗长。随之而来的,是用户每次去审阅的成本也越来越高。

在 SOLO 中,我们对于长任务提供了清晰的过程展示。将关键的步骤进行总结,让用户快速掌握核心开发过程。如果需要进一步了解细节,再去深入查看具体的执行过程。

第二个重要的 Review 工作,体现在工具调用和 Context 管理 上。大多数 AI Coding 产品,工具和 Context 都是面向 AI 设计的,而忽视对于用户的体验。AI 可以很清楚知道有哪些入参出参,但是对于用户来说,就很难搞清楚 AI 具体是怎么使用工具的。

在 SOLO 中,我们为用户和 AI 提供了一个协作空间,将工具调用可视化,让用户可以知道 AI 在使用哪些工具,进行哪些操作。目前我们集成了软件开发中常见的一些工具,例如 Doc 来写文档,IDE 来写代码,Terminal 来运行命令,浏览器来预览和测试,DiffView 来查看代码变更,Integration 来做服务集成。

未来我们还会与合作伙伴共同建设 SOLO 的工具生态,去支持更多的开发场景。

随时可掌控

在专业的开发场景中,Context 是非常重要的部分,对于 Context 的处理很大程度上 AI 的表现。对于复杂开发任务来说,当前模型的上下文窗口严重不足,可能在几轮对话后,上下文的窗口就已经被打满,导致生成的效果不好。

针对这个问题,我们在这次 SOLO 的版本中,做了两个更新。

  • 一是在 SOLO 中,启用 Max 模型,支持最大的上下文窗口,尽可能极限利用好模型的每一个 Token 的上下文,以达到最好的效果。

  • 二是在 SOLO 中,我们支持了智能的上下文压缩策略。当上下文窗口被打满后,SOLO 会智能压缩总结上下文,来释放上下文空间,让用户可以继续对话,尽可能保障在连续对话中,也能保障好的生成效果。

接下来我们介绍,我们认为非常重要的 Context 类型。

首先介绍 Plan ,作为开发计划的 Context。在之前的开发流程中,通常我们都是和 AI 的一问一答。我们给出一个任务,AI 直接给出回复。这样的问题在于,如果任务比较复杂,AI 在执行过程中就容易混乱,影响最终生成效果。

Plan 的作用就在这里,当 AI 拿到用户的任务后,并不是直接开始执行,而是先去进行分析和任务规划,将任务规划本身作为一种 Context,用于后续的任务执行。

用户自己也可以看到 Plan 的内容,如果 Plan 不符合预期,用户也可以用自然语言更新,或者在 SOLO 提供的文档工具中进行编辑,确保 Plan 最终是准确的。

通过 Plan,SOLO 在复杂任务的处理上,也能有更好的表现效果。

其次是 TODO List

随着 AI 执行的任务越来越长,中间的步骤也越来越多,过程中会进行多次 Context 获取、工具调用、模型请求,不断根据每一步的结果,来校准下一步行动。

在之前的开发流程中,我们虽然可以看到 AI 的执行动作,但是并不知道执行到哪个阶段了,接下来还要多久才能完成。对于 AI 执行的过程,缺乏掌控感。

TODO List 的作用在于,我们可以详细地了解到 AI 目前的进展,以及接下来 AI 要做的事情,从而更好地来审计和调整 AI 接下来的动作。

相比于 Plan 作为一个整体的开发规划,TODO List 是更具体的每一步动作。Plan 和 TODO List 的结合,有点像我们常说的 OKR,既要定好大目标,也要明确关键动作,从而最终可以更好地完成任务。

多任务并行

接下来我们要介绍 Responsive Multi-Tasking ,如何做任务的响应式。

我们在之前的产品中,主要就是单任务的模式。用户提出问题,等待 AI 回答,这个过程中可能几分钟到十几分钟。然后用户再提问,再次等待 AI 回答,不断重复这个过程。等待的这个过程是比较低效的,用户的时间和注意力被限制在了等待 AI 回复中。

但实际上,AI 的资源是非常充足的,一问一答的方式,有点像是在一台 GPU 服务器中,只跑了一个记事本程序,并没有把资源充分利用起来。相比于等待 AI 回复,更高效的做法是,我们同时可以分配多个任务给 AI。

所以在 SOLO 的正式版本中,我们支持了多任务,让用户可以在 SOLO 创建和管理多个任务,实现并行开发。比如说,用户可以让前后端分离开发,或者同时开发不同的模块,来提升开发的效率。

除了 Task 的并发,我们还在考虑一个问题是,Agent 的并发。

在之前的开发中,我们每次将一个任务分派给一个 Agent,然后等待这个 Agent 的回复。实际上 Agent 和人也类似,每个 Agent 都有自己的定位,有自己能够获取到的 Context,有自己可以使用的工具,有自己擅长的任务。

在开发中有不同的场景,比如说仓库理解、方案设计、代码开发、测试调试等。对于复杂的开发任务,相比于让一个 Agent 来做所有的事情,我们将任务拆解分发给不同的 Agent 来做,得到的效果可能更好。

在正式版 SOLO 中,我们新增了 Sub Agent 的支持。用户可以自定义 Sub Agent,建设一个自己的 Agent 开发团队,SOLO Coder 会根据用户的任务,在必要的时候,智能调度不同的 Sub Agent 来完成专门的任务。

以上就是 SOLO 正式版本里,核心功能的介绍。

picture.image

SOLO:我们理想中 AI 时代 IDE 最佳的样子

在我们正式发布之前,我们也在世界各地,邀请了早期用户做了一些产品内测。很多内测的用户问,你们为什么做成 SOLO 的产品形态,而不是做 CLI。

在正式发布的时机,我们也想分享一下这里的思考。我们认为 CLI 是一种非常专业的产品形态,但不是产品体验最佳的形态。有点像是,早期开发者使用 VIM 来编程,VIM 非常专业且能力强大。但最终,类似 VSCode/JetBrains 这类的 IDE 产品,因为更好的产品体验,受到了更多开发者的青睐。

Coding CLI 也会是我们一个重要的产品形态,但 SOLO 更像是我们理想中的,AI 时代的 IDE 的样子。在 SOLO 中,AI 会使用丰富的 Context 和各类开发工具,来和用户一起,完成软件开发的工作。

picture.image

从 SOLO Builder 到 SOLO Coder

我们在 7 月份发布了 SOLO Beta 版本,推出了 SOLO Builder 的 Agent,帮助用户快速搭建 0-1 的前后端项目。

在过去的 4 个月,我们收到了非常多用户的反馈,我们看到 SOLO Builder 帮助了很多开发者,将自己的创意很快的落地。但更进一步,我们在考虑当开发者完成 0-1 之后,接下来还需要面对 1-10,10-100 的产品迭代,这里的工作难度更高,那么 SOLO 可以做些什么。

于是在正式版本,我们在 SOLO 中支持了SOLO Coder 。SOLO Coder 专门为专业的开发场景而设计,在项目的理解、需求的开发、Bug 修复、代码重构上,都有着更好的效果表现。我们期望 SOLO Coder 可以在专业的项目中,成为开发者朋友的搭档。

实际上,在这一版本的 SOLO 的开发中,也已经有一部分的代码是由 SOLO Coder 贡献。我们自己的团队,也在更多地践行,来用 SOLO 来开发 SOLO。

十分感谢大家对 TRAE 的支持,以及对 SOLO 的坚持和等待,我们在直播中也向大家送出了 3 项福利:

  1. TRAE 国际版 SOLO 正式版全面开放,不再需要 SOLO Code。

  2. 伴随本次 SOLO 全面开放,我们为 TRAE 的全量用户,提供为期 3 天的免费体验(活动截至 11 月 15 日 23:59)。

  3. 对于之前加入了 SOLO Beta 版本 waitlist 的朋友,我们将送给大家 100 次 Fast Request。

再次感谢大家对 TRAE SOLO 正式版的关注,直播回顾视频已于各平台官方账号发布,欢迎查看~

picture.image

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
字节跳动 XR 技术的探索与实践
火山引擎开发者社区技术大讲堂第二期邀请到了火山引擎 XR 技术负责人和火山引擎创作 CV 技术负责人,为大家分享字节跳动积累的前沿视觉技术及内外部的应用实践,揭秘现代炫酷的视觉效果背后的技术实现。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论