推理大模型并非一定要推理。

大模型向量数据库云存储

论文笔记分享, Reasoning Models Can Be Effective Without Thinking。 uc berkeley。

picture.image

目前主流的推理模型在解决问题时,通常会有一个think阶段。这种方式虽然结果会大幅提升,但消耗的计算资源却不少。

所以,这个文章研究的问题是: AI真的需要这么“认真思考”吗?

注:本文写于o3发布之前, o3的思考充分利用工具能力,模型即产品,有一点跳脱o1版推理大模型的范畴了。另外,今天开源的Gemini 2.5 Flash,支持了thinking budget,有一些理念与本论文趋同。

所以他们用了 NoThinking 的方式,就是让AI直接给出答案,跳过所有中间推理步骤。

就类似下图框出来那样,或者直接

picture.image

对比正常的

模式。效果竟然还不错。

  • 省3~4倍资源。
  • 始终优于没有经过RL训练的非推理模型。
  • 很适合多次尝试,允许模型采样多次,看pass@k的效果。
  • 在一些任务中,跟正常思考的模型的结果差不多。

如下图:

picture.image

限定token预算 (在达到指定token之后,强行添加,如 答案是xxx 的内容上去)之后,很多数据集表现比经过think的效果更好。

picture.image

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
大规模高性能计算集群优化实践
随着机器学习的发展,数据量和训练模型都有越来越大的趋势,这对基础设施有了更高的要求,包括硬件、网络架构等。本次分享主要介绍火山引擎支撑大规模高性能计算集群的架构和优化实践。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论