Zed IDE官宣了一个AI新玩具:Claude 越来越慢了!

推荐阅读

Zed IDE官宣新功能:比 VS Code 优雅多了!

Zed IDE 发布全新新特性:确实比 VS Code 猛啊!

VS Code 王座动摇?Zed IDE 背靠 亚马逊 正在悄悄"偷家"

最新我用AI开发了自己的第一个博客网站:https://golangai.site ,可前往阅读公众号的文章。

📊 我偷偷看了200万次AI对话数据,发现Claude越来越"慢"了?

今天刷到 Zed 发了一篇硬核博文:公开自家编辑器里 AI Agent 的使用数据。我第一反应:这操作有点勇啊🤔

毕竟谁家会把"用户怎么用自家产品"这种数据摊开给人看?但转念一想,敢于透明,本身就是一种底气


🔍 先说结论:这数据能看啥?

Zed 新上线的 Agent Metrics 面板 每周更新,你能看到:

  • 各 Agent 的会话数、交互轮次(turns)
  • 响应时间分布(p10/p50/p90)
  • Zed 原生 Agent 内部各模型的使用趋势

picture.image

▲ 数据来自自愿开启遥测的匿名用户,你的代码和提示词不会被收集

💡 个人解读:这就像给开发者装了个"行业透视镜",不用猜,直接看谁在用、怎么用、卡不卡。

同时也可以看大目前最流行的agent

picture.image

zed自家的agent排在了第一,不知道是不是自吹自擂了。


🐢 第一个暴击:Claude Sonnet 的 p90 延迟,三周涨了44%

数据不会骗人。在 Zed 原生 Agent 里,claude-sonnet-4-6 的尾部延迟(p90)从 294s 一路爬到 425s:

周次Sonnet p50Sonnet p90Opus p90
3.847.4s294s362s
3.1550.0s335s338s
3.2252.1s391s393s
3.2954.5s425s435s

44% 的涨幅,连续四周同向变化。作为天天用 Sonnet 写代码的人,我最近确实感觉"转圈圈"变多了🙃

反观 gpt-5-4,p50 稳定在 30 秒出头。这差距,肉眼可见。

✨ 个人看法:延迟上涨可能是负载、上下文长度、模型策略调整等多因素叠加。但趋势本身,就值得警惕。


📈 Zed Agent 会话最多,但 Claude Agent 用户更"上头"

90 天内,200 万次会话、1540 万轮交互,平台平均每次会话 7.6 轮。

Agent会话数每会话轮次
Zed Agent939K5.5
Claude Agent703K10.6

发现没?会话数代表"打开频率",轮次深度才代表"粘性"

Claude Agent 用户一旦开始用,平均聊将近 11 轮才停;而 Zed 原生 Agent 用户,5.5 轮就撤了。这差距,有点扎心啊😅

💡 我的猜测:可能因为 Claude 更擅长多轮推理,用户愿意"多聊几句";而 Zed Agent 更偏向"快问快答",任务完成就撤。


🌀 GPT-5 的"分身术":一周冒出10个变体

最让我笑出声的是这段:当前活跃的 GPT-5 变体有 10 个👇

gpt-5 / gpt-5-mini / gpt-5-1 / gpt-5-2 / gpt-5-3-codex / gpt-5-4 / gpt-5-codex / gpt-5-1-codex / gpt-5-1-codex-max / gpt-5-2-codex 光看命名就知道:至少两条线并行——通用线 + 编码专线,而且迭代飞快。gpt-5-4 一周内从 6300 轮冲到 26800 轮,这增速,坐火箭了吧🚀

✨ 个人建议:如果你在评估 GPT-5 系列,默认目标靶心在移动,选模型时得多留个心眼。


🎯 最后说句大实话:数据≠答案

Zed 很清醒:这些指标能告诉你"怎么用",但告诉不了你"好不好用"

  • 会话短 ≠ 效果差(可能三句话搞定一个 bug)
  • 响应快 ≠ 质量高(可能快但答非所问)
  • 轮次多 ≠ 用户满意(也可能是在反复纠错)

💡 我的总结:看数据是为了找线索,不是找标准答案。真正的好 Agent,得你自己用代码去验。


0
0
0
0
评论
未登录
暂无评论