突发消息!OpenAI 今天发布 2 个新的推理模型:o3-mini 和 o3-mini-high。

大模型向量数据库机器学习

🍹 Insight Daily 🪺

Aitrainee | 公众号:AI进修生

Hi,这里是Aitrainee,欢迎阅读本期新文章。

picture.image

o3-mini和o3-mini (high) 今天要发布了。

picture.image

普通用户也获得 o3-mini,plus用户能用上o3-mini (high),o3-mini (high) 在Codeforce上比o1高约200分,比o1更快、编码和数学表现更佳,成本却还是o1-mini的水平。

picture.image

picture.image

plus用户 o3-mini每天能用100次。不过o3-mini (high)的使用次数限制还需要进一步确认。

有网友说,是的,R1这么火,Openai 按不住了:

picture.image

picture.image

而且前面Qwen团队除夕发qwen2.5-max,春节,大家还是要卷,哈哈哈。。。

picture.image

picture.image

其实早在圣诞节直播时,Openai就宣布了o3 mini将在2025年年初提供:

picture.image

picture.image

我们还是要说一下什么是 o3 和 o3-mini?

o3:一种在编码、数学甚至面向 AGI 基准测试中表现出色的尖端推理模型。它为智能和问题解决设定了新的基准。

o3-mini:o3 的性价比版本,以极低的成本和速度提供卓越的性能。

这些模型将推理提升到了全新的水平,使复杂任务中的突破成为可能,这些任务需要深入理解和逻辑。

o3来带来三个重大突破。

编程能力:实际编程准确率71.7%,超过o1整整20%。在Codeforces上达到2727分,已经超越人类水平。

数学水平:美国数学奥赛预选赛准确率近97%。就连最难的Epic AI前沿 数学题,也能拿到25%的成绩。

最惊人的是Arc AGI测试:87.5%的成绩,首次在这个难度极高的基准测试上超越人类。

picture.image

为什么 o3-mini 是颠覆性的创新,o3-mini带来两个改变。

自适应思考:可以根据任务难度调整推理深度,选择低、中、高三种模式。让AI更贴近实际使用场景。

性价比突破:比o1-mini成本低,响应更快,效果更好。

不过,网友感叹o3 high每项任务消耗1000美元:

picture.image

此外,确实现在的模型太多了,具体如何切换模型,我们还有待确认:

picture.image

🌟 知音难求,自我修 炼亦艰, 抓住前沿技术的机遇,与我们一起成为创新的超级个体 (把握AIGC时代的个人力量)。

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
大规模高性能计算集群优化实践
随着机器学习的发展,数据量和训练模型都有越来越大的趋势,这对基础设施有了更高的要求,包括硬件、网络架构等。本次分享主要介绍火山引擎支撑大规模高性能计算集群的架构和优化实践。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论