就在Claude 4稳坐编程AI王座的这段时间后,OpenAI悄悄放出GPT-5的内测版本,其编程实力直接在对比测试中碾压了Claude Sonnet 4。
面对这一冲击,业内传出消息称Anthropic正在加速Claude 5的开发进程,一场新的编程AI大战即将拉开序幕。
(图源网络,侵删)
GPT-5偷跑内测,碾压Claude
根据一些最新报道显示,OpenAI的GPT-5已经在内部测试阶段展现出了惊人的编程能力。
一位已经体验过GPT-5的测试人员透露,在直接对比测试中,GPT-5在编程任务上明显优于目前被誉为"世界最强编程模型"的Claude Sonnet 4。
从各种渠道泄露的信息显示,GPT-5在多个平台都被发现了踪迹:ChatGPT、MacOS应用、Cursor IDE、微软Copilot**以及OpenAI API平台上,都有网友捕捉到了GPT-5的身影。
这种大范围的"意外泄露",让人不禁怀疑这是OpenAI的有意为之。
GPT-5最大的技术突破在于首次实现了GPT系列和o系列模型的架构统一。
这个被内部代号为"nectarine"的模型,将快速响应能力和深度推理能力合二为一,用户无需再手动切换不同模型,系统会根据任务复杂度自动判断使用模式。
更引人注目的是GPT-5 mini版本(代号"lobster"),这是一个专门针对编程优化的模型。
测试显示,它能够快速生成结构完整的代码,特别擅长处理 "屎山代码"的重构工作,可以自动优化代码结构、清理冗余,并智能管理大型项目的依赖关系。
Claude 4王座不保了
回顾时间线,Anthropic在2025年5月发布Claude 4系列时,确实在编程领域掀起了不小的波澜。
Claude Opus 4在SWE-bench测试中取得72.5%的成绩,被称为"世界最强编程模型",能够连续工作7小时不出现性能下降,这在当时确实是技术上的重大突破。
Claude 4的发布确实让Anthropic在编程AI领域获得了短暂的领先优势。
GitHub宣布将在新版Copilot中集成Claude Sonnet 4,多家开发工具公司也都表达了对Claude 4编程能力的认可。
然而仅仅两个月后,GPT-5的提前泄露就打破了这种平衡。
从目前流出的对比测试来看,GPT-5在编程任务上的表现确实超越了Claude 4,特别是在处理复杂代码重构和多任务编程方面展现出了更强的能力。
Anthropic被迫提速
面对GPT-5的强势挑战,Anthropic也没有选择坐以待毙。
据InfoQ的最新报道,Anthropic联合创始人在最近的一次内部分享中首次提及了Claude 5的开发方向,暗示公司正在针对长期任务执行和记忆能力进行重点研发。
虽然Anthropic并未官方确认Claude 5的具体发布时间,但从内部人士的表态来看,他们显然正在加速下一代模型的开发,以应对来自GPT-5的竞争压力。
当前泄露的GPT-5虽然还未正式发布,但其展现出的编程能力已经让整个行业感受到了压力。
如果Anthropic不能在Claude 5中实现技术突破,很可能会在这场编程AI的王座争夺战中失去主动权。
不过对于广大的开发者来讲,无论谁胜出,编程效率的提升已经是一个不可阻挡的趋势,主要就看哪一家的性价比更高了。