DeepSeek 推理模型预览版上线:独创"深度思考"能力,性能超越openAI o1

大模型向量数据库机器学习

DeepSeek 日前宣布其全新研发的推理模型 DeepSeek-R1-Lite 预览版正式上线,所有用户均可通过官方网站(chat.deepseek.com)体验这一突破性的 AI 模型。

DeepSeek-R1-Lite 在数学、代码等复杂逻辑推理任务上展现出卓越性能,其推理过程包含大量反思和验证,思维链长度可达数万字。该模型在美国数学竞赛(AMC)中最高难度的 AIME 以及全球顶级编程竞赛 codeforces 等权威评测中,均取得了优异成绩,大幅超越 GPT-4 等知名模型。

picture.image

模型的独特之处在于其"深度思考"模式,专门针对复杂推理问题设计。研究表明,模型的准确率与给定的推理长度呈正相关,相比传统的多次采样+投票方法(延伸阅读:OpenAI o1模型推理能力大幅提升的背后:重复采样如何提升AI推理能力),展现出更高的效率。

picture.image

用户可在 DeepSeek 官方网站选择"深度思考"模式,体验模型在处理数学、代码等复杂问题时的全面、清晰和严谨表现。这种长思维链模式为解决复杂问题提供了新的可能性。

picture.image

picture.image

值得注意的是,当前版本仍处于迭代开发阶段,仅支持网页使用,暂不支持 API 调用。 DeepSeek 团队表示,正式版 DeepSeek-R1 模型将在未来完全开源,届时将公开技术报告并部署 API 服务。

这一创新模型的发布标志着 AI 在复杂推理任务方面取得重大突破,为科研、教育和技术开发等领域带来新的机遇和挑战。随着 DeepSeek-R1 系列的持续发展,我们有理由期待更多令人兴奋的应用场景和突破性进展。

来自:https://mp.weixin.qq.com/s/e1YnTxZlzFvjcmrLLTA8fw

后台回复“入群”进群讨论。

0
0
0
0
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论