TRAE cue 背后的挑战与思考 - 文章 - 开发者社区

picture.image

本文作者：江波，TRAE 技术专家

picture.image

概述

cue 是 TRAE 开发的最新且最复杂的 AI 开发工具功能之一。它将代码补全能力扩展到光标之外，覆盖整个工作空间。该功能能够理解开发者的意图，并在后台工作，提供有助于更快、更全面地完成任务的编辑建议。

picture.image

核心挑战

构建 cue 面临三个主要的研究挑战：

理解用户意图 - 确定用户试图完成什么任务

挑战：

Non-linear Editing Histories： 开发者的编码工作流通常是非线性且复杂的。他们可能复制代码块、粘贴到其他地方并立即大幅修改。他们还可能连续快速编辑，频繁在文件或函数间切换，或在实验不同实现时撤销和重做更改。这些非线性工作流会创建混乱的更改轨迹，可能误导试图推断开发者真实意图的模型。
Unintended Biases： 通过在给定任务中拆分差异块来简单采样训练数据，可能会在模型中引入意外偏见。例如，模型可能学会避免触及代码库中已包含最近更改的部分，但这些区域可能正是需要进一步编辑的地方。
Intention Hallucination： 模型可能会产生意图幻觉，建议与用户最近编辑不直接相关的更改。这发生在模型试图过于主动时，旨在覆盖所有可能的相关编辑（高召回率），这可能导致嘈杂和破坏性的建议。相反，如果模型过于保守——只关注高度确信的建议（高精度）——它可能变得被动，错过协助开发者的机会。

解决方案：

Simulating Common Editing Scenarios/模拟常见编辑场景： 通过分析提交消息、初始提交状态和最终提交状态，开发相关算法来模拟反映常见开发者行为的现实编辑场景。
Optimizing Diff Granularity/优化差异粒度： 教会模型读取细粒度编辑事件，同时仔细优化提示中呈现的差异粒度。如果模型看到过于细粒度的差异，可能会被用户编辑历史中的噪音分散注意力。如果看到过于粗粒度的差异，则难以区分新更改和旧更改。
Avoiding Undoing User's Recent Changes/避免撤销用户最近的更改： 发现模型有时强烈倾向于撤销用户的最近更改，这可能导致令人沮丧的体验。通过仔细策划训练数据来阻止这种行为。

确定更改位置 - 决定在哪里进行更改

挑战：

解决方案：

Fast Localization with a Trained Retriever： 通过将检索基础设施与专门设计用于识别可能需要更新的代码位置的检索器模型相结合，实现了速度和准确性的平衡。
Efficiency and Scalability： 这种方法高度可扩展，可以在包含数万个文件的大型单一代码库上运行，而不会显著降低性能。
Editing Surrounding Code： 用户光标周围的代码总是被添加到候选位置列表中并首先处理，确保即时且上下文相关的建议。

确定如何编辑 - 准确高效地执行更改

挑战：

解决方案：

新颖的 Diff 格式（WIP）： 教会模型一种专门的 diff 格式，既紧凑又能明确应用于原始代码。这种格式允许模型简洁地表示复杂编辑，最小化生成的 token 数量，并实现大文件的高效处理。这将延迟从几秒钟减少到几百毫秒。
代码库感知建议： 利用强大的检索增强生成（RAG）基础设施，为 cue 添加代码库特定的上下文。通过检索代码库的相关部分，模型可以提出与项目特定编码标准一致且正确与自定义 API 交互的建议。

picture.image