刚刚,Anthropic 又出新货:Claude Opus 4.1 发布,代码、推理能力再升级

大模型向量数据库数据库

Anthropic 又发新东西了。

Claude Opus 4.1,算是对 Opus 4 的一次小升级。
主要提升了三个方面:智能体任务、真实世界代码处理和推理能力。

官方还提了一嘴:
未来几周,还会有“更大幅度”的升级。

现在,付费的 Claude 用户和 Claude Code 里已经能用上了。
API、亚马逊 Bedrock 和谷歌云 Vertex AI 也都同步了。

价格没变,和 Opus 4 一样。

那这次升级,具体强在哪?

最直观的,是在 SWE-bench Verified 这个编程评测上,性能干到了74.5%

picture.image

另外,在深度研究和数据分析,特别是细节追踪这块,也更强了。

听听用过的人怎么说:

  • GitHub

那边反馈,多文件代码重构的进步最明显。

  • 乐天 (Rakuten)

的团队说,这玩意儿在大代码库里改 bug 特别准,不会乱动代码,也不会引入新问题,日常 debug 很省心。

  • Windsurf

的报告更直接:性能比 Opus 4 提升了一个标准差。这进步幅度,跟上次从 Sonnet 3.7 升级到 Sonnet 4 差不多。

picture.image

Anthropic 建议,所有用 Opus 4 的场景,都直接升级到 Opus 4.1。

如果你是开发者,直接在 API 里用 claude-opus-4-1-20250805 就行。想了解更多,可以去看他们的系统卡、模型页、定价页和文档。

系统卡
https://assets.anthropic.com/m/4c024b86c698d3d4/original/Claude-4-1-System-Card.pdf

模型页
https://www.anthropic.com/claude/opus

定价页
https://www.anthropic.com/pricing#api

picture.image

文档
https://docs.anthropic.com/en/docs/about-claude/models/overview

顺便,

网友Test:用玻璃态化制作俄罗斯方块玻璃,用背景模糊制作色彩缤纷,打造'时尚俄罗斯方块'。

参考链接:https://www.anthropic.com/news/claude-opus-4-1

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
火山引擎大规模机器学习平台架构设计与应用实践
围绕数据加速、模型分布式训练框架建设、大规模异构集群调度、模型开发过程标准化等AI工程化实践,全面分享如何以开发者的极致体验为核心,进行机器学习平台的设计与实现。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论