小版本更新?DeepSeek-R1-0528版本模型权重开源,官网升级,编程效果评测和O3-High相当

大模型向量数据库机器学习

昨天下午 18 点,DeepSeek 官方群里同步 DeepSeek R1 已经完成小版本升级

picture.image

没有说模型权重也会同步开源

我也就以为这样就结束了

但是没想到 DeepSeek 在凌晨开源了最新的模型权重

picture.image

就这还叫小版本更新?

不理解 DeepSeek 的小版本的概念啦,哈哈

下载地址:https://huggingface.co/deepseek-ai/DeepSeek-R1-0528

有人已经做了评测,位居第四

新的 Deepseek R1-0528 在 LiveCodeBench 基准测试中的表现几乎与 o3(high)相当。

picture.image

问了一个之前问过的问题:strawberry 里有几个 r

之前这个问题就是能够回答的,并且回答是正确的

但是思考链路太长,经常自我否定,思路过多

就想看看小版本更新之后的怎么样

picture.image

picture.image

picture.image

picture.image

picture.image

picture.image

这个到还是和之前一样,自我怀疑了 n 次,纠正了 N 次,最后也是对的

所以从这个问题上,说 DeepSeek R1 是小版本更新,好像并不为过

picture.image

也有同样的网友说,思考过程过长的问题

picture.image

9.9 和 9.11 的大小问题也是没问题的,而且思考过程很清晰

picture.image

生成的网页是很赞的,有时间可以多尝试下

picture.image

picture.image

END

大家一直都在期待 R2 的出现对标最新的国外 close 模型

那,这个算吗?

往期推荐

扣子空间生成播客的新功能,体验之后,效果真的很好,生成的音频抑扬顿挫、停顿、语气等等都不错

一个5.2万人都在关注的宝藏 prompt 开源项目,值得收藏学习

Grok 和 Claude 的 prompt 提示词学习

Claude 4震撼发布:AI 编程与推理的新里程碑, Claude Opus 4 被称为全球最强编程模型,能连续编码 7 小时

谷歌更新 Deep Research、画布、以及veo3视频生成模型,AI更进一步~

5月20号,Github Copilot Agent 重磅更新!

OpenAI 的 Codex, 无惊艳,但有个很好的方向

字节开源扣子(coze)可视化工作流构建引擎 FlowGram

就在刚刚,DeepSeek 又开源个 671B 的大模型

PLZ,别再误解大模型联网搜索了

DeepSeek-V3-0324 就这么悄咪咪的更新了?

我是大林,大模型搬砖攻城狮,持续关注 AI。微信(dalinvip2023),备注【公众号 AIGC】,进 AIGC 交流群。

主页:https://www.dalinaip.com/about

如果文章对你有一点点 🤏🏻 帮助,关注公众号并【星标】 ,可以及时收到最新 AI 信息,点赞、在看、转发给更多的朋友,后面我继续分享更多的 AI 内容。

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
大规模高性能计算集群优化实践
随着机器学习的发展,数据量和训练模型都有越来越大的趋势,这对基础设施有了更高的要求,包括硬件、网络架构等。本次分享主要介绍火山引擎支撑大规模高性能计算集群的架构和优化实践。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论