推荐阅读
Zed IDE 发布全新新特性:确实比 VS Code 猛啊!
VS Code 王座动摇?Zed IDE 背靠 亚马逊 正在悄悄"偷家"
最新我用AI开发了自己的第一个博客网站:https://golangai.site ,可前往阅读公众号的文章。
今天刷到 Zed 发了一篇硬核博文:公开自家编辑器里 AI Agent 的使用数据。我第一反应:这操作有点勇啊🤔
毕竟谁家会把"用户怎么用自家产品"这种数据摊开给人看?但转念一想,敢于透明,本身就是一种底气。
🔍 先说结论:这数据能看啥?
Zed 新上线的 Agent Metrics 面板 每周更新,你能看到:
- 各 Agent 的会话数、交互轮次(turns)
- 响应时间分布(p10/p50/p90)
- Zed 原生 Agent 内部各模型的使用趋势
▲ 数据来自自愿开启遥测的匿名用户,你的代码和提示词不会被收集
💡 个人解读:这就像给开发者装了个"行业透视镜",不用猜,直接看谁在用、怎么用、卡不卡。
同时也可以看大目前最流行的agent
zed自家的agent排在了第一,不知道是不是自吹自擂了。
🐢 第一个暴击:Claude Sonnet 的 p90 延迟,三周涨了44%
数据不会骗人。在 Zed 原生 Agent 里,claude-sonnet-4-6 的尾部延迟(p90)从 294s 一路爬到 425s:
| 周次 | Sonnet p50 | Sonnet p90 | Opus p90 |
|---|---|---|---|
| 3.8 | 47.4s | 294s | 362s |
| 3.15 | 50.0s | 335s | 338s |
| 3.22 | 52.1s | 391s | 393s |
| 3.29 | 54.5s | 425s | 435s |
44% 的涨幅,连续四周同向变化。作为天天用 Sonnet 写代码的人,我最近确实感觉"转圈圈"变多了🙃
反观 gpt-5-4,p50 稳定在 30 秒出头。这差距,肉眼可见。
✨ 个人看法:延迟上涨可能是负载、上下文长度、模型策略调整等多因素叠加。但趋势本身,就值得警惕。
📈 Zed Agent 会话最多,但 Claude Agent 用户更"上头"
90 天内,200 万次会话、1540 万轮交互,平台平均每次会话 7.6 轮。
| Agent | 会话数 | 每会话轮次 |
|---|---|---|
| Zed Agent | 939K | 5.5 |
| Claude Agent | 703K | 10.6 |
发现没?会话数代表"打开频率",轮次深度才代表"粘性"。
Claude Agent 用户一旦开始用,平均聊将近 11 轮才停;而 Zed 原生 Agent 用户,5.5 轮就撤了。这差距,有点扎心啊😅
💡 我的猜测:可能因为 Claude 更擅长多轮推理,用户愿意"多聊几句";而 Zed Agent 更偏向"快问快答",任务完成就撤。
🌀 GPT-5 的"分身术":一周冒出10个变体
最让我笑出声的是这段:当前活跃的 GPT-5 变体有 10 个👇
gpt-5 / gpt-5-mini / gpt-5-1 / gpt-5-2 / gpt-5-3-codex / gpt-5-4 / gpt-5-codex / gpt-5-1-codex / gpt-5-1-codex-max / gpt-5-2-codex
光看命名就知道:至少两条线并行——通用线 + 编码专线,而且迭代飞快。gpt-5-4 一周内从 6300 轮冲到 26800 轮,这增速,坐火箭了吧🚀
✨ 个人建议:如果你在评估 GPT-5 系列,默认目标靶心在移动,选模型时得多留个心眼。
🎯 最后说句大实话:数据≠答案
Zed 很清醒:这些指标能告诉你"怎么用",但告诉不了你"好不好用"。
- 会话短 ≠ 效果差(可能三句话搞定一个 bug)
- 响应快 ≠ 质量高(可能快但答非所问)
- 轮次多 ≠ 用户满意(也可能是在反复纠错)
💡 我的总结:看数据是为了找线索,不是找标准答案。真正的好 Agent,得你自己用代码去验。
