昨天下午 18 点,DeepSeek 官方群里同步 DeepSeek R1 已经完成小版本升级
没有说模型权重也会同步开源
我也就以为这样就结束了
但是没想到 DeepSeek 在凌晨开源了最新的模型权重
就这还叫小版本更新?
不理解 DeepSeek 的小版本的概念啦,哈哈
下载地址:https://huggingface.co/deepseek-ai/DeepSeek-R1-0528
有人已经做了评测,位居第四
新的 Deepseek R1-0528 在 LiveCodeBench 基准测试中的表现几乎与 o3(high)相当。
问了一个之前问过的问题:strawberry 里有几个 r
之前这个问题就是能够回答的,并且回答是正确的
但是思考链路太长,经常自我否定,思路过多
就想看看小版本更新之后的怎么样
这个到还是和之前一样,自我怀疑了 n 次,纠正了 N 次,最后也是对的
所以从这个问题上,说 DeepSeek R1 是小版本更新,好像并不为过
也有同样的网友说,思考过程过长的问题
9.9 和 9.11 的大小问题也是没问题的,而且思考过程很清晰
生成的网页是很赞的,有时间可以多尝试下
大家一直都在期待 R2 的出现对标最新的国外 close 模型
那,这个算吗?
往期推荐
扣子空间生成播客的新功能,体验之后,效果真的很好,生成的音频抑扬顿挫、停顿、语气等等都不错
一个5.2万人都在关注的宝藏 prompt 开源项目,值得收藏学习
Claude 4震撼发布:AI 编程与推理的新里程碑, Claude Opus 4 被称为全球最强编程模型,能连续编码 7 小时
谷歌更新 Deep Research、画布、以及veo3视频生成模型,AI更进一步~
5月20号,Github Copilot Agent 重磅更新!
字节开源扣子(coze)可视化工作流构建引擎 FlowGram
我是大林,大模型搬砖攻城狮,持续关注 AI。微信(dalinvip2023),备注【公众号 AIGC】,进 AIGC 交流群。
主页:https://www.dalinaip.com/about
如果文章对你有一点点 🤏🏻 帮助,关注公众号并【星标】 ,可以及时收到最新 AI 信息,点赞、在看、转发给更多的朋友,后面我继续分享更多的 AI 内容。