突发消息！OpenAI 今天发布 2 个新的推理模型：o3-mini 和 o3-mini-high。 - 文章 - 开发者社区

🍹 Insight Daily 🪺

Hi，这里是Aitrainee，欢迎阅读本期新文章。

picture.image

o3-mini和o3-mini （high）今天要发布了。

picture.image

普通用户也获得 o3-mini，plus用户能用上o3-mini （high），o3-mini （high）在Codeforce上比o1高约200分，比o1更快、编码和数学表现更佳，成本却还是o1-mini的水平。

picture.image

plus用户 o3-mini每天能用100次。不过o3-mini （high）的使用次数限制还需要进一步确认。

有网友说，是的，R1这么火，Openai 按不住了：

picture.image

而且前面Qwen团队除夕发qwen2.5-max，春节，大家还是要卷，哈哈哈。。。

picture.image

其实早在圣诞节直播时，Openai就宣布了o3 mini将在2025年年初提供：

picture.image

我们还是要说一下什么是 o3 和 o3-mini？

o3：一种在编码、数学甚至面向 AGI 基准测试中表现出色的尖端推理模型。它为智能和问题解决设定了新的基准。

o3-mini：o3 的性价比版本，以极低的成本和速度提供卓越的性能。

这些模型将推理提升到了全新的水平，使复杂任务中的突破成为可能，这些任务需要深入理解和逻辑。

o3来带来三个重大突破。

编程能力：实际编程准确率71.7%，超过o1整整20%。在Codeforces上达到2727分，已经超越人类水平。

数学水平：美国数学奥赛预选赛准确率近97%。就连最难的Epic AI前沿数学题，也能拿到25%的成绩。

最惊人的是Arc AGI测试：87.5%的成绩，首次在这个难度极高的基准测试上超越人类。

picture.image

为什么 o3-mini 是颠覆性的创新，o3-mini带来两个改变。

自适应思考：可以根据任务难度调整推理深度，选择低、中、高三种模式。让AI更贴近实际使用场景。

性价比突破：比o1-mini成本低，响应更快，效果更好。

不过，网友感叹o3 high每项任务消耗1000美元：

picture.image

此外，确实现在的模型太多了，具体如何切换模型，我们还有待确认：

picture.image

🌟 知音难求，自我修 炼亦艰，抓住前沿技术的机遇，与我们一起成为创新的超级个体（把握AIGC时代的个人力量）。