一觉醒来,AI编程的天又变了。
11月25日凌晨,Anthropic发布了其迄今最强大的AI模型Claude Opus 4.5。该公司宣称,新模型在软件工程任务上实现了“最先进性能”,在Anthropic软件工程测试中表现出色,得分超越Gemini 3 Pro、GPT-5.1等一众对手。
学过数据可视化的朋友,一看图就乐了。数据打扮好,汇报工作少不了。也就是这么几个点的差距,搞得好像强了一倍。
01
核心亮点
麦金叔看下来这次的发布,其核心有三点。
第一,不是技术,而是价格。输入token降至每百万5美元,输出token为每百万25美元,较前代产品直接砍了2/3。
第二,除了打榜外,核心基准测试token消耗也大幅降低2/3。这属于微操级别的了,原来就是通过组合不同模型,来节省成本,这下更强了。
第三,产品生态全面升级,深度集成Office与浏览器
。对Excel,PPT,浏览等桌面应用有了更好的支持。下面这位是宾夕法尼亚大学沃顿商学院教授,生成式AI实验室联合主任伊桑·莫利克发的。
02
留给我们的思考
在限时2小时的编程测试中,Opus 4.5的最终得分超越了所有曾参与该测试的人类工程师。
当我们还在犹豫要不要采用AI的时候,AI已经在每6个月可以迭代一次的过程中把人类远远的甩在后面。
那我们还有什么是不可替代的?这是每一个处在当下的人所应该思考的。当很多事情可以借助AI的时候,我们不要再没苦硬吃了。
比方说,没有意义的加班,如果加班就是为了完成简单繁琐的工作,那就应该停下来思考,是否有更好的方法来提高效率。
再比方说,学习这件事,是否还应该照本宣科,按部就班。是否可以按需学习,利用AI进行专门针对性的学习,强化训练。
实际上,麦金叔不是悲观者让大家躺平。而是觉得这是一个全新的机会,一个更新的起点,有了更多可能性,让我们做原来不可能做的事情。当我们行动起来后,一定能让生活变得更美好。
总结
上周Google的Gemini 3.0 Pro,然后OpenA随即反击,今天Anthropic再次加码。以上种种再次说明竞争远没有到终局,鹿死谁手,犹未可知。
国内的大公司,如何在芯片短缺的环境下,做出更好的模型。除了依赖国家的产业政策,还要发扬小米加步枪的精神,走农村包围城市的群众路线。让AI应用蓬勃发展起来,融入到百姓生活的方方面面,才是有根之树,才能永远长青。
而你我普通人是继续观望看戏,还是躬身入局,一切都看自己的选择。
如果你对AI的发展感兴趣,欢迎一键三连。有任何问题可以添加好友(二维码可以找前面文章的末尾),我们共同探讨。
