Anthropic 公司北京时间25日凌晨发布了 Claude 3.7 Sonnet,一款具备混合推理能力的大型语言模型,以及 Claude Code,一个面向开发者的智能编码助手。
Claude 3.7 Sonnet
Anthropic 公司时隔四个月终于推出了自家的新模型Claude 3.7 Sonnet,这款模型最大的创新在于其“混合推理”能力,具体特性如下:
- 混合推理能力:
- 这是该模型最显著的特点,它允许模型在“即时响应”和“深度思考”之间切换。
- “深度思考”模式下,模型会进行逐步推理,并将思考过程展示给用户,提升透明度和可理解性。
- 编码能力大幅提升:
- 在编码和前端网页开发方面,Claude 3.7 Sonnet 表现出强大的性能。
- 它能更好地处理复杂的代码库,并能更精确地执行高级工具的使用。
- 灵活的思考控制:
- 通过 API,用户可以精细控制模型的思考时间,即“思考预算”。
- 这允许用户根据需要,在速度和答案质量之间进行权衡。
- 实际应用导向:
- Anthropic 强调该模型在实际商业应用中的表现,而非仅在学术基准测试中的成绩。
- 性能卓越:
- 在SWE-bench Verified 和TAU-bench等测试中,都取得了非常优秀的成绩。
Claude Code
为了进一步提升开发者的编码效率,Anthropic 还推出了 Claude Code,它具备了以下特点:
- 命令行工具:
- Claude Code 是一款命令行工具,旨在简化开发者的编码工作。
- 智能协作:
- 它可以搜索和阅读代码、编辑文件、编写和运行测试、提交代码到 GitHub,以及使用命令行工具。
- 提升开发效率:
- 通过自动化重复性任务,Claude Code 显著减少了开发时间和工作量。
- 能够处理复杂的代码重构,debug等任务。
- 持续改进:
- Anthropic 计划根据用户反馈,不断改进 Claude Code 的功能和性能。
- GitHub集成:
- Claude.ai,现在可以和GitHub进行集成,开发者可以更方便的将代码库和Claude进行连接。
小结
该模型应该就是之前传言的4.0版本,从发布内容来看,虽然是小版本号,但诚意还是满满的,也没有像其他厂商将普通模型和推理模型分开,“混合推理”能力,避免了认知碎片。
Anthropic有自己的一个模型迭代路线图并稳步迭代,从协助个人更好的完成当前工作,到作为专家独立工作扩展用户能力边界,再到突破性的帮助完成原本一个团队以年计的挑战性工作,同时,Anthropic 非常了解自己的长处,以编程作为突破口,此次发布进一步巩固了其在编程领域的优势,它将AI编程又推向一个新高度,等Cursor、Windsurf 集成后,我们一起看看会有什么新的变化。
公众号私信“进群”入群讨论。